Библиотека собеса по Data Science | вопросы с собеседований

Forwarded from Библиотека питониста | Python, Django, Flask

🤖🛠️ ТОП-25 опенсорсных инструментов для вашего ИИ-проекта

В этой статье мы собрали 25 лучших инструментов с открытым кодом, которые помогут вам создать ИИ-проекты, автоматизировать процессы и расширить функциональность ваших приложений.

🔗 Ссылка на статью

779 views11:04

Библиотека собеса по Data Science | вопросы с собеседований

Что такое обучение представлений?

Объекты, с которыми работают алгоритмы машинного обучения, могут быть невероятно разнообразными и часто состоят из множества низкоуровневых компонентов, таких как цвет пикселя, амплитуда звукового сигнала в конкретный момент времени или буква в тексте. Эти компоненты сами по себе несут мало информации, но вместе формируют более сложные структуры, такие как музыка, изображения или текст.

Задача заключается в том, чтобы преобразовать сложные объекты в представления, которые легче анализировать и использовать для решения различных задач. Этот процесс называется обучением представлений, и он позволяет выделить информативные признаки объектов, которые можно применять для решения задач классификации, кластеризации и других.

Один из самых мощных инструментов для обучения представлений — это нейронные сети. Например, в свёрточных нейросетях для изображений первые слои обучаются выделять низкоуровневые признаки, такие как края объектов, тогда как более глубокие слои могут представлять более сложные концепции, такие как формы или даже целые объекты.

#глубокое_обучение

👍5

1K views12:01

Библиотека собеса по Data Science | вопросы с собеседований

Forwarded from Proglib.academy | IT-курсы

📈 Стать аналитиком Big Data: пошаговое руководство 2024

Рассказываем в нашей статье, какие знания, онлайн-курсы, подкасты и книги помогут начать карьеру в сфере Big Data без специального образования.

Ознакомьтесь со статьей, а также забирайте наши курсы для Data Science:

🔵

Базовые модели ML и приложения

🔵

Математика для Data Science

🔗

Статья

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

743 views12:04

Библиотека собеса по Data Science | вопросы с собеседований

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈

938 views06:03

Библиотека собеса по Data Science | вопросы с собеседований

🤔 Как меняется математика в разных индустриях: от мобильных игр к фондовым рынкам

🗓 22 августа в прямом эфире разберем как математика применяется в разных отраслях бизнеса. И какие математические навыки необходимы для успешной работы в каждой из них.

Приглашенный спикер: Павел Запольский – Senior Quantitative Researcher at Exness и Co-founder GrowLytics. Запустивший более 10 проектов по машинному обучению и анализу данных для ведущих компаний.

😮 На вебинаре узнаете:

🔵 Математика в бизнесе: Чем отличаются разные сферы друг от друга. Почему стоит понимать специфику сферы
🔵 ML и продуктовое IT: Чем различается математическая сложность от индустрии к индустрии. Какие к ним необходимы уровни подготовки
🔵 Баевская математика в GameDev. Баевская математика как альтернатива AB тестированию. Как математические методы применяются в разработке игр
🔵 Finance: Что такое количественные финансы и математическое моделирование. Обсудим текущие индустриальные тренды в отрасли
🔵 Backtest: Как знания математики делают ваши активы более надежными
🔵 На практике подробно разберем два математических кейса по GameDev и Backtest.

➡️ Зарегистрироваться: https://proglib.io/w/06b25c4d

Please open Telegram to view this post

VIEW IN TELEGRAM

1.01K views08:26

Библиотека собеса по Data Science | вопросы с собеседований

В линейных моделях часто добавляют смещение (bias) к признакам. Объясните, зачем это делается?

Смещение (bias) — это дополнительный параметр модели, который добавляется к линейной комбинации признаков перед применением функции активации. Например, в нейросетях bias добавляется к сумме взвешенных входов перед передачей на следующий слой. Его роль заключается в сдвиге графика функции активации вправо или влево, что помогает сети охватывать более широкий диапазон данных.

Представьте себе простую линейную функцию y = ax + b. Если мы меняем значение a (это эквивалент веса в линейной модели), мы меняем наклон функции. Однако если мы регулируем b (эквивалент смещения), мы сдвигаем всю функцию по оси X. Это позволяет модели лучше подстраиваться под данные, особенно в ситуациях, когда зависимость между переменными не проходит через начало координат.

Смещение также помогает предотвратить проблем в тех случаях, когда все входные признаки равны нулю. Без смещения модель предскажет 0, даже если это не соответствует реальности. Смещение добавляет модели гибкости и позволяет ей корректно работать даже в таких условиях.

#машинное_обучение

👍9

962 views12:01

Библиотека собеса по Data Science | вопросы с собеседований

Forwarded from Proglib.academy | IT-курсы

🧮🏭 Индустриальная математика: когда ∫f(x)dx равно миллиардам

Индустриальная математика предлагает эффективные решения для самых сложных проблем реального мира. В нашей статье мы рассмотрим сущность индустриальной математики, ее краткую историю и современные тренды, а также обсудим, кому подходит эта профессия.

🔗 Статья

749 views12:00

Библиотека собеса по Data Science | вопросы с собеседований

❗Вакансии «Библиотеки программиста» — ждем вас в команде!

Мы постоянно растем и развиваемся, поэтому создали отдельную страницу, на которой будут размещены наши актуальные вакансии. Сейчас мы ищем:
👉авторов в наше медиа proglib.io
👉контент-менеджеров для ведения телеграм-каналов

Подробности тут

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Ждем ваших откликов 👾

ad.proglib.io

Вакансии в медиа «Библиотека программиста»‎

Количество проектов в редакции постоянно растет, так что нам всегда нужны специалисты

965 views06:00

Библиотека собеса по Data Science | вопросы с собеседований

Что такое JAX?

JAX — это фреймворк для вычислений и исследований в области машинного обучения. Он предоставляет API, совместимое с NumPy, и поддерживает автоматическое дифференцирование, векторизацию, параллелизацию и компиляцию в реальном времени для GPU/TPU. JAX ориентирован на скорость и производительность и подходит для обучения больших моделей, требующих мощных ускорителей.

🔗 Ссылка на документацию JAX

#программирование

👾5👍4

1.03K views13:00

Библиотека собеса по Data Science | вопросы с собеседований

Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧪 Байесовское A/B-тестирование vs частотное: преимущества, недостатки и способ реализации на Python

A/B-тестирование — это метод сравнения двух версий чего-либо для определения, какая из них работает лучше.

В новой статье разберёмся, в каких случаях лучше применять частотный подход, а в каких — байесовский, и напишем продвинутый байесовский тест на Python без использования специальных A/B-библиотек.

👉 Читать статью

👍6👾2

941 views11:04

Библиотека собеса по Data Science | вопросы с собеседований

Для чего нужен Apache Airflow?

Apache Airflow — это инструмент для создания, планирования и управления сложными пайплайнами данных. Он особенно полезен в ситуациях, когда необходимо автоматизировать процессы обработки данных, включающие выполнение большого количества задач в определённой последовательности или параллельно.

Вот задачи, которые решает Apache Airflow:

▪️Позволяет запускать пайплайны по расписанию. Это может быть как простое расписание (например, ежедневное выполнение), так и сложное, например, запуск во второй вторник каждого месяца.

▪️Помогает организовать выполнение задач в правильном порядке. Например, если нужно сначала загрузить данные с нескольких источников, а затем выполнить их обработку, Airflow позволяет настроить последовательное или параллельное выполнение задач.

▪️Предоставляет интерфейс для мониторинга выполнения пайплайнов, где можно видеть историю выполнения задач, анализировать логи и производительность, а также повторно запускать задачи при необходимости.

Кроме того, Apache Airflow поддерживает интеграцию с различными внешними сервисами (например, базами данных).

#данные

👍8👾3🤔1

1.09K views12:01

Библиотека собеса по Data Science | вопросы с собеседований

Forwarded from Библиотека питониста | Python, Django, Flask

🐍📈 Бэктест на Python: оцениваем торговую стратегию

Бэктестинг — это метод, который используется в трейдинге и инвестировании для оценки эффективности торговой стратегии (или инвестиционного подхода) с помощью исторических рыночных данных.

Проще говоря, это процесс проверки того, как стратегия работала бы в прошлом, если бы её применяли к реальным данным.

👉 В новой статье разбираемся, как реализовать бэктестинг на Python

879 views12:00

Библиотека собеса по Data Science | вопросы с собеседований

В чем разница между вероятностью и правдоподобием?

▪️В случае с вероятностью мы оцениваем вероятность наступления определённого события, исходя из фиксированного параметра, который мы считаем известным. Например, если мы предполагаем, что монета честная, мы принимаем вероятность выпадения орла за 0.5.

Таким образом, вероятность позволяет оценить, каковы шансы каждого из возможных исходов при многократных испытаниях.

▪️Правдоподобие — это оценка того, насколько хорошо наблюдаемые данные соответствуют гипотезе или параметрам модели. В этом случае данные зафиксированы, и мы пытаемся определить, при каком значении параметра правдоподобие (вероятность появления таких данных) будет максимальным. Например, если при подбрасывании монеты 10 раз выпало 7 орлов, мы можем вычислить, какая вероятность выпадения орла (не обязательно 0.5) лучше всего объясняет полученные данные.

#теория_вероятностей

👍10👾2

1.02K views12:00

Библиотека собеса по Data Science | вопросы с собеседований

Для каких алгоритмов машинного обучения не нужно масштабирование признаков?

Для некоторых алгоритмов машинного обучения необязательно проводить масштабирование признаков, поскольку они не зависят от расстояний или линейных комбинаций признаков.

К таким алгоритмам относятся:

▪️дерево решений;
▪️случайный лес (так как строится над деревьями решений);
▪️градиентный бустинг над деревьями решений;
▪️наивный байесовский классификатор (так как его основная идея заключается в вычислении условных вероятностей для каждого признака и класса на основе данных).

#машинное_обучение

👍10

1.03K views12:01

Библиотека собеса по Data Science | вопросы с собеседований

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

1.05K views20:03

Библиотека собеса по Data Science | вопросы с собеседований

Как с помощью линейной модели понять, от каких признаков можно сразу избавиться?

Есть несколько способов:

▪️Посмотреть на коэффициенты при признаках
Они показывают, насколько сильно каждый признак влияет на целевую переменную. Если коэффициент признака близок к нулю, это может означать, что данный признак мало влияет на прогноз, и его можно исключить.

▪️Использовать регуляризацию
L1-регуляризация (Lasso) может обнулять коэффициенты некоторых признаков, что прямо указывает на их малую значимость.

▪️Проверить значимости признаков
Методы статистического тестирования (например, t-тест для каждого признака) могут показать, являются ли коэффициенты значимыми. Если какой-то признак незначим, его вклад в предсказание минимален, и его можно исключить из модели.

#машинное_обучение

👍6

1.14K views13:02

Библиотека собеса по Data Science | вопросы с собеседований

Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🤖 6 основных алгоритмов машинного обучения: руководство для начинающих

В новой статье мы расскажем о шести основных алгоритмах машинного обучения и их практическом применении в различных отраслях.

Вот алгоритмы, которые мы рассмотрим:

🔹линейная регрессия;
🔹SVM;
🔹дерево решений;
🔹случайный лес;
🔹наивный байес;
🔹логистическая регрессия.

🔗 Читать статью

🔥6

789 views12:05

About

Blog

Apps

Platform