MLinside - школа ML
3.78K subscribers
234 photos
18 videos
196 links
Предзапись на 4 поток курса "База ML": https://vk.cc/cQ7AkI
Наши курсы: https://taplink.cc/mlinside
Чат коммьюнити: @ml_insidechat
По вопросам: @marinagartm
Download Telegram
Почему на ML собеседовании спрашивают все подряд – от SQL до backend?

На ML-собеседованиях часто спрашивают не только машинное обучение, но и SQL, backend, алгоритмы и системный дизайн. Это вызывает у многих кандидатов недоумение: зачем ML-инженеру весь этот стек?

Ответ на этот вопрос разбирает Андрей Жогов (ML-инженер в Сбере, преподаватель Физтеха) у нас на YouTube, в ВК и ДЗЕН.

Кому будет полезно это видео:
▪️ Начинающим в ML – чтобы понять реальные требования профессии и не фокусироваться только на моделях
▪️ Тем, кто готовится к ML-собеседованию – чтобы закрыть пробелы и понимать, какие темы могут спросить
▪️ Data Scientist’ам – чтобы расширить понимание production-части и инженерных задач
▪️ Разработчикам, переходящим в ML — чтобы увидеть, какие навыки уже релевантны и чего не хватает
▪️ ML-инженерам на уровне junior/middle — чтобы систематизировать знания и подготовиться к следующему уровню
▪️ Тем, кто хочет попасть в Big Tech — чтобы понять ожидания компаний и структуру интервью

Если нашли себя в этом списке, переходите и смотрите видео на удобной для вас платформе:
https://youtu.be/vsHXuJTDi4M
https://vk.com/video-228219607_456239203
https://dzen.ru/video/watch/69da0b28a6a02616d1d2354d
74
Учимся на практике: решаем реальные ML-задачки

Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях.

Одиннадцатая задача

Что нужно сделать: определить по различным признакам, транзакция фродовая или нет

Как можно сделать:
▪️Визуализировать данные чтобы визуально понять можно ли как-то кластеризовать или нет
▪️Посмотреть как-то коррелируют между собой признаки или нет
▪️Обучить модель для случая когда явный дизбаланс классов

Данные можно взять на Kaggle: https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud
Пример ноутбука (с случайными пропусками строк): https://colab.research.google.com/drive/10grgB6zavSk-ZgAm02ixGalRSPPtgHTx?usp=sharing

Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
👍9
SVD в машинном обучении

У нас на YouTube, в ВК и ДЗЕН вышло видео с Андреем Жоговым (ML-инженер в Сбере, преподаватель Физтеха), где он разбирает, как работает SVD, почему он позволяет находить скрытую структуру в данных и где именно используется на практике: от обработки текстов до рекомендательных систем и современных LLM. Андрей объясняет SVD через геометрическую интуицию, показывает, как из большой и зашумлённой матрицы получить компактное представление данных, и разбирает ключевые кейсы: латентно-семантический анализ (LSA), матричную факторизацию и применение SVD в LoRA для дообучения нейросетей. В конце вас ждёт неожиданный пример, как SVD выявляет скрытые закономерности даже в данных голосований.

Кому будет полезно это видео и почему:
▪️ Начинающим в ML и Data Science — чтобы понять одну из ключевых тем линейной алгебры через практику, а не абстрактные формулы
▪️ Студентам и тем, кто изучает математику для ML — чтобы связать теорию (матрицы, разложения) с реальными задачами
▪️ ML-инженерам — чтобы глубже понимать методы снижения размерности, работу с признаками и оптимизацию моделей
▪️ Тем, кто работает с NLP — чтобы понять, как раньше решалась задача поиска смысла в текстах и откуда выросли современные эмбеддинги
▪️ Тем, кто интересуется LLM и fine-tuning — чтобы разобраться, как идеи SVD используются в LoRA и экономии ресурсов

Если нашли себя в этом списке, переходите и смотрите видео на удобной для вас платформе.
14👀4
В следующую среду, 29 апреля выходим в прямой эфир с Виктором Кантором

Вы наверняка знаете Виктора – он автор специализации «Машинное обучение и анализ данных» МФТИ и Яндекса на Coursera, которую с 2016 года прошли более 200 000 человек. За его плечами построение ML-службы в Яндекс.Такси, руководство Big Data в МТС (600+ сотрудников) и звание Forbes «30 до 30».

В эфире Виктор расскажет про новую специализацию «Искусственный интеллект и анализ данных» – переосмысленную версию легендарного курса, которую он выпустил вместе с командой MLinside. Полный путь от основ до нейросетей, LLM и AI-агентов по подписке от 5 000 ₽ в месяц.

Но кроме этого, Виктор ответит на ваши вопросы. Это хорошая возможность спросить напрямую у человека, который сам прошёл путь от Data Scientist до топ-менеджера:
▪️ Как войти в AI/ML с нуля?
▪️ Какой путь выбрать — Data Scientist, ML-инженер, AI Engineer?
▪️ Чем новая специализация отличается от того, что уже есть на рынке?
Или любой другой вопрос, на ваше усмотрение.

Задайте вопрос Виктору заранее – он ответит на него в эфире.

И зарегистрируйтесь на трансляцию, чтобы не пропустить начало: https://t.me/ml_insideBot?start=web290426
👍73🔥3
Python для ML: что нужно знать на старте?

Python – основной язык в машинном обучении, но для старта не нужно знать его целиком. На YouTube, в ВК и Дзен у нас вышло видео с Александром Дубейковским, где он разбирает, какая часть Python действительно используется в ML, какие библиотеки важны и как выглядит реальная работа ML-инженера. Вы поймёте, почему Python, это в первую очередь инструмент для работы с данными и экспериментами, а не язык для сложной разработки.

Видео будет полезно новичкам в ML (чтобы не тратить время на изучение лишнего и сразу сфокусироваться на нужных навыках), разработчикам, переходящим в ML (чтобы понять разницу между Python в backend и Python в машинном обучении), студентам и самоучкам (чтобы выстроить правильную траекторию обучения без перегруза) и тем, кто готовится к ML-собеседованию (чтобы понять, какой уровень Python реально ожидается).

Если нашли себя в этом списке, welcome к нам, на любую из удобных площадок:
https://youtu.be/_yAuLFKZZhk
https://vkvideo.ru/video-228219607_456239206
https://dzen.ru/video/watch/69eb4b55a0b5d51d0ac7700c
14🔥8👀4
Запускаем новую рубрику с математическими задачками

Эта рубрика поможет прокачать прикладное математическое мышление. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса.

Сегодня первая задачка и мы проверим, насколько хорошо вы чувствуете производные. Формат простой: посмотрите на график и ответьте на вопрос:

В какой из точек производная функции y=f(x) принимает наибольшее значение?


#math_MLinside
12👍3🔥2
В какой из точек производная функции y=f(x) принимает наибольшее значение?
Anonymous Quiz
2%
A
15%
B
5%
C
78%
D
3
MLinside - школа ML
В следующую среду, 29 апреля выходим в прямой эфир с Виктором Кантором Вы наверняка знаете Виктора – он автор специализации «Машинное обучение и анализ данных» МФТИ и Яндекса на Coursera, которую с 2016 года прошли более 200 000 человек. За его плечами построение…
Послезавтра, 29 апреля в 19:00 выходим в прямой эфир с Виктором Кантором на YouTube

В эфире можно будет задать вопрос напрямую Виктору и пообщаться с ним на тему ML или AI. Также, Виктор расскажет про курс специализация «Искусственный интеллект и анализ данных».

Задать вопрос Виктору заранее: https://forms.yandex.ru/u/69e884fe6d2d736b9b087371

Зарегистрируйтесь на трансляцию, чтобы не пропустить начало: https://t.me/ml_insideBot?start=web290426
Машинное обучение меняется быстрее, чем кажется

Подходы, которые ещё недавно считались стандартом, сегодня уже теряют актуальность и на эту тему у нас на YouTube, в ВК и Дзен вышло видео, где Александр Дубейковский (ML-Engineer Авито, ex-Yandex, эксперт MLinside) разбирает, какие знания по ML устаревают быстрее всего в 2026 году: от классических алгоритмов и старых NLP-подходов до инструментов и библиотек, которые постепенно уходят из продакшна.

Видео будет полезно:
Новичкам в ML: чтобы не тратить время на устаревшие подходы и сразу учить актуальный стек
Junior ML-инженерам: чтобы понять, какие знания реально востребованы на практике
Тем, кто готовится к собеседованиям: чтобы не фокусироваться на том, что почти не спрашивают и не используют
Data Scientists: чтобы переоценить свой стек и актуализировать навыки
Backend/Data инженерам, переходящим в ML: чтобы быстрее понять, как изменилась индустрия
Практикующим специалистам: чтобы не отставать от трендов и понимать, куда движется рынок

Видео вышло на всех площадках:
https://youtu.be/ML1Df2_e9xA
https://vkvideo.ru/video-228219607_456239208
https://dzen.ru/video/watch/69f34789cda828524c42f444
Всем стоять, работают Code Detectives

Да, это та самая рубрика, где мы публикуем часть кода, а вам нужно сказать, что он выведет. Варианты будут в опросе ниже, а объяснение мы опубликуем позже.

Не забывайте, что если рубрика вам нравится, мы будем благодарны, если поставите реакцию, а другие посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside

Итак, вот сама задачка:

Что выведут следующие 3 примера?
x = 0.1 + 0.2
if x == 0.3:
print(True)
else:
print(False)

x = 0.5 + 0.2
if x == 0.7:
print(True)
else:
print(False)

x = 0.1 + 0.25
if x == 0.35:
print(True)
else:
print(False)

#CodeDetective_MLinside
17🔥21
Что выведут 3 примера из поста выше?
Anonymous Quiz
41%
True, True, True
14%
False, True, True
9%
False, False, True
36%
False, False, False
4🤔4🔥3
MLinside - школа ML
Что выведут 3 примера из поста выше?
Как и обещали, публикуем объяснение верного ответа:

Компьютеры хранят числа с плавающей точкой в двоичной системе (по стандарту IEEE 754), то есть 0.5 = ½, полностью представимо в двоичной системе, а 0.1 точно непредставима в двоичной системе, если немного округлить, то получится 0.100000000000000001. В первом примере получилось так что сумма дала отличное от 0.3 битовое число, во втором и третьем тоже отличные числа, но так совпало что они представлены одним и тем же битовым адресом
🔥10🤔32
Математика по-прежнему остаётся главным стоп-фактором в ML

«Я не понимаю производные»,
«Матрицы – это сложно»,
«Вероятность – вообще мимо меня»


Это если сделать выжимку того, что нам писали в комментариях под математическими видео, говорили на кастдевах и писали менеджерам, когда мы запускали первый поток курса “Математика для ML”

И наш главный вывод после первого потока:
Математику можно объяснить понятно, если давать только то, что реально нужно в ML. Без перегруза и «академической воды», а с упором на применение в реальной работе.


И сейчас мы открываем второй поток курса. Спикер прежний – Сергей Жестков (10+ лет преподавания, курсы для Сбера, Тинькофф, Otus и Skillbox, дважды «Преподаватель года» МФТИ)

Что изменилось во втором потоке:
Мы переработали программу на основе обратной связи с первого запуска:
▪️упростили сложные блоки;
▪️усилили практическую часть;
▪️убрали лишнее и добавили больше примеров из ML.

И у нас получился не совсем “курс по математике” в классическом смысле, а скорее база, которая нужна, чтобы:
▪️понимать, как работают модели
▪️не теряться на собеседованиях
▪️спокойно идти в ML дальше (курс особенно актуален, если вы планируете идти на поток «База ML»)

Посмотреть программу и стоимость можно на сайте.

А предзапись на второй поток уже открыта, заполните форму и менеджер свяжется с вами и расскажет детали: https://forms.yandex.ru/cloud/68ca97e8f47e7311c69c807f/
5👍21🔥1
Почему без формулы Байеса вы не понимаете, как работает ML

Многие заходят в ML через код и модели, обучают, получают метрики и на этом этапе всё кажется понятным. Но, как только нужно пойти чуть глубже – улучшить модель или разобраться в ошибках, обязательено возникает вопрос:

«Почему модель принимает именно такие решения?»

▪️Можно посмотреть на метрики.
▪️Можно попробовать перебрать параметры.
▪️Можно визуализировать данные.

Но ответ на вышеозвученный вопрос это не даст.

Наверняка вы знаете, что внутри модели скрывается вполне конкретная логика работы с вероятностями. Модель постоянно пересчитывает, насколько одно событие вероятно с учётом новых данных и делает это по строгим математическим правилам.

Одно из базовых – формула Байеса.

Но при этом для большинства это остаётся просто формулой из учебника, без понимания, как она реально применяется в ML. Именно поэтому мы решили взять эту тему на вебинар, который проведем 14 мая в 19:00 МСК.

Спикер вебинара Сергей Жестков (10+ лет преподавания, курсы для Сбера, Тинькофф, Otus и Skillbox, дважды «Преподаватель года» МФТИ), он же преподаватель курса «Математика для ML».

На вебинаре мы разберём формулу Байеса на конкретных примерах, чтобы у вас не осталось вопросов, как модель:
▪️оценивает вероятность;
▪️учитывает новые данные;
▪️и меняет своё решение.

Кому будет полезен вебинар:
— тем, кто хочет войти в ML, но откладывает из-за математики;
— тем, кто уже пробовал обучать модели, но не до конца понимает, что происходит внутри;
— тем, кто готовится к собеседованиям.

14 мая в 19:00 МСК
Вебинар бесплатный, с вас только регистрация: https://t.me/ml_insideBot?start=web140526

P.S. А всем, кто придёт на вебинар, мы подарим скидку на курс и чек-лист с самопроверкой вашего уровня математики для ML
9👎5🔥4👨‍💻1
Топ-5 ошибок при изучении математики для ML

Многие начинают изучать машинное обучение через библиотеки вроде sklearn или PyTorch и уверены, что всё понимают, пока модель не начинает вести себя непредсказуемо. В этот момент становится ясно: проблема не в коде, а в математике, которая за ним стоит. И у нас на YouTube, в ВК и Дзен вышло видео, где Александр Дубейковский (ML-Engineer Авито, ex-Yandex, эксперт MLinside) подробно объясняет, какие подходы к изучению математики не работают.

Он разбирает, почему университетский стиль обучения часто не подходит для ML, зачем нужна интуиция вместо заучивания формул, как связать математику с кодом и почему попытка сразу идти в deep learning без базы приводит к поверхностному пониманию. В конце вас ждет практический ориентир: какой уровень математики вам реально нужен и как его достичь.

Кому будет полезно видео и почему:
▪️Новичкам в ML чтобы не тратить месяцы на изучение математики “впустую” и сразу выстроить правильный подход
▪️Тем, кто уже пишет модели, но не чувствует уверенности: чтобы понять, что именно происходит внутри алгоритмов
▪️Тем, кто готовится к ML-собеседованиям: чтобы закрыть пробелы, которые часто проверяют на интервью
▪️Практикующим специалистам: чтобы перестать воспринимать модели как “чёрный ящик” и лучше контролировать их поведение
▪️Тем, кто застрял в обучении: чтобы понять, какие ошибки тормозят прогресс и как их исправить

Если нашли себя в этом списке, обязательно посмотрите видео, оно будет вам полезно:
https://youtu.be/56lmuMYBDyw
https://vk.com/video-228219607_456239220
https://dzen.ru/video/watch/69fc4a5a66544869fb85a1ba

P.S. 14 мая в 19:00 МСК пройдет бесплатный вебинар "Формула Байеса в ML" с Сергеем Жестковым. На вебинаре мы подарим скидку на курс и чек-лист с самопроверкой вашего уровня математики для ML, регистрация по ссылке: https://t.me/ml_insideBot?start=web140526

А 18 мая у нас запускается второй поток курса по Математике для машинного обучения. Посмотреть программу можно на сайте: https://mlinside.ru/math-for-ml/?utm_source=youtube&utm_medium=social&utm_campaign=video_08_05_26

Или заполните форму и менеджер свяжется с вами, ответит на все вопросы и подарит промокод на скидку: https://forms.yandex.ru/cloud/68ca97e8f47e7311c69c807f
🔥3
Продолжаем нашу рубрику с математическими задачками

Если хотите прокачать прикладное математическое мышление, рубрика как раз для вас. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса.

Вторая задачка:
Симметричную монету бросают до первого выпадения орла. С какой вероятностью орел выпадет в попытке с четным номером?

#math_MLinside
4
Вероятность выпадения орла равна:
Anonymous Quiz
52%
1/2
16%
1/3
27%
1/4
5%
2/3
5