Всем привет! Если вы читаете это сообщение, значит вы один из самых первых подписчиков, или вам интересна моя первая публикация.
❔ Кто я
⚡️ ML Team Lead с 5+ лет опыта в big tech индустрии, вырос с джуна до тим лида и готов поделиться своим опытом.
❔ О чем будет этот канал
⚡️ Буду делать публикации о мире IT, технологиях, с уклоном в ML разработку и менеджмент ML проектов.
❔ Кому будет полезно
⚡️ ML/DS/DA/DE - кто вкатывается и кто уже вкатился, но хочет роста и развития.
⚡️ Искателям вдохновения в данных - тем, кто хочет видеть смыслы за цифрами.
❔ Кто я
⚡️ ML Team Lead с 5+ лет опыта в big tech индустрии, вырос с джуна до тим лида и готов поделиться своим опытом.
❔ О чем будет этот канал
⚡️ Буду делать публикации о мире IT, технологиях, с уклоном в ML разработку и менеджмент ML проектов.
❔ Кому будет полезно
⚡️ ML/DS/DA/DE - кто вкатывается и кто уже вкатился, но хочет роста и развития.
⚡️ Искателям вдохновения в данных - тем, кто хочет видеть смыслы за цифрами.
❤2
Собираюсь с мыслями перед началом активностей на канале. Сейчас есть много идей для публикаций на ближайшие ~3 месяца.
Вот примерно о чем будут первые публикации:
🚀 Карьерные вопросы / Мысли о карьерном пути в ML
🪄 Индустриальный опыт написания кода - ML / Python
🐋 Deep Learning в индустрии, как и какие задачи решаем
🖼️ Визуализация и инфографика - как эффективно доносить информацию
📝 Советы новичкам по IT индустрии - на что обращать внимание, что изучать, что уже работает и что будет работать
💀 Мемы
Вот примерно о чем будут первые публикации:
🚀 Карьерные вопросы / Мысли о карьерном пути в ML
🪄 Индустриальный опыт написания кода - ML / Python
🐋 Deep Learning в индустрии, как и какие задачи решаем
🖼️ Визуализация и инфографика - как эффективно доносить информацию
📝 Советы новичкам по IT индустрии - на что обращать внимание, что изучать, что уже работает и что будет работать
💀 Мемы
🔥7
Maxim.ML - канал pinned «Всем привет! Если вы читаете это сообщение, значит вы один из самых первых подписчиков, или вам интересна моя первая публикация. ❔ Кто я ⚡️ ML Team Lead с 5+ лет опыта в big tech индустрии, вырос с джуна до тим лида и готов поделиться своим опытом. ❔ О чем…»
🚀 Всем data привет!
Есть много способов сравнить два набора данных
Подготовил разбор трех подходов, где на пальцах шаг за шагом объяснил алгоритмы расчета
Пользуйтесь!
Есть много способов сравнить два набора данных
Подготовил разбор трех подходов, где на пальцах шаг за шагом объяснил алгоритмы расчета
Пользуйтесь!
Telegraph
Разбор трёх подходов к оценке данных from scratch
🚀 Всем data привет! Вам приходится проверять сходство или различие данных? Возможно вы уже применяете некоторые подходы в работе или учебе. В этой статье я детально разберу следующие подходы к оценке данных: population stability Index (PSI) критерий Колмогорова…
🔥11
🚀 Всем data привет!
Хотите реальную историю из индустрии - как на моей практике случился модельный concept drift и как я его поборол 🥊?
Concept drift на практике случается сильно реже data drift. Он происходит, когда в существующей ML модели меняется целевая переменная, когда она переходит от известного статистического состояния в новое, ранее неизвестное, неучтенное.
Вот небольшая история про data driven подход в решении бизнес проблемы.
Хотите реальную историю из индустрии - как на моей практике случился модельный concept drift и как я его поборол 🥊?
Concept drift на практике случается сильно реже data drift. Он происходит, когда в существующей ML модели меняется целевая переменная, когда она переходит от известного статистического состояния в новое, ранее неизвестное, неучтенное.
Вот небольшая история про data driven подход в решении бизнес проблемы.
Telegraph
Concept drift на практике - как побороть при помощи data mining
Вы слышали про concept drift в моделях машинного обучения? Подготовил для вас разбор кейса из моей практики - как быстро исправить последствия этой проблемы при помощи data driven подхода. Предыстория В среду утром посыпались алерты на ухудшение модельной…
🔥11
Как новички в Data Science решают сложные задачи: результаты моих студентов в ML соревновании 📊
Какие подходы пробуют применять стажеры и джуны в Data Science соревнованиях с табличными данными? Я принёс инфографику моих студентов, которая иллюстрирует их работы в финальном соревновании курса 📈
🔍 Предыстория
В прошлом учебном году я вел блок занятий по Machine Learning на одном из курсов. Чтобы отработать навыки студентов, я запустил inclass соревнование. Студенты решали задачу бинарной классификации — для многих это был первый подобный опыт.
Почти все подходы студентов были связаны с алгоритмами градиентного бустинга. В топ 3 решений попали ансамбли, automl и catboost 🏆
Если вам понравилась визуализация, python код для ее воспроизведения доступен на моем GitHub. Сделать такую же инфографику проще, чем вы думаете! ✨
Какие подходы пробуют применять стажеры и джуны в Data Science соревнованиях с табличными данными? Я принёс инфографику моих студентов, которая иллюстрирует их работы в финальном соревновании курса 📈
🔍 Предыстория
В прошлом учебном году я вел блок занятий по Machine Learning на одном из курсов. Чтобы отработать навыки студентов, я запустил inclass соревнование. Студенты решали задачу бинарной классификации — для многих это был первый подобный опыт.
Почти все подходы студентов были связаны с алгоритмами градиентного бустинга. В топ 3 решений попали ансамбли, automl и catboost 🏆
Если вам понравилась визуализация, python код для ее воспроизведения доступен на моем GitHub. Сделать такую же инфографику проще, чем вы думаете! ✨
🔥13
Как pet-проект может стать ключом к успеху в карьере
🚀 Всем data-привет! Задумывались ли вы, как небольшой проект, сделанный в свободное время, может забустить вашу карьеру? Я расскажу вам историю о том, как один мой pet-проект неожиданно выстрелил и стал незаменимым инструментом для всей моей команды.
Я начал создавать свой первый pet-проект в 2021 году, когда был джуном, стремясь освоить новые навыки. В то время я на полной инициативе написал Telegram-бота 🤖 — голосовой дневник, который сохранял голосовые сообщения пользователя в базу данных в формате текста (транскрибация аудио). Написание бота стало отличной возможностью изучить Docker 🐳 и MongoDB 🍃, а также это был первый опыт работы с API. Подробнее об этом можно прочитать в моей старой статье на habr.
По мере того как я продвигался по карьерной лестнице и получал образование в магистратуре, я решил углубиться в изучение python-библиотек. Мой новый опыт работы DS-ом в одном агрегаторе такси также позволил улучшить pet-проект Telegram-бота. Я научился создавать API-сервисы и поднимать web-приложения, благодаря чему удалось настроить мониторинг и визуализацию сохраненных текстовых данных 📊
На текущем месте работы мне нужно было отслеживать 5–9 различных метрик для каждой из 30 моих ML-моделей. Вместо использования стандартных инструментов, таких как Grafana или Tableau, я решил создать что-то своё, опираясь на уже имеющиеся наработки. И это сработало 🎉! Решение на базе моего pet-проекта оказалось максимально полезным и покрыло на 110% потребности команды в мониторинге бизнес и технических метрик ML-моделей 💪.
Сейчас у проекта есть вот такие ключевые особенности:
1. Простота отрисовки данных: достаточно отправить данные для мониторинга по простому API, и они тут же будут отрисованы на графиках в web-интерфейсе.
2. Гибкость визуализации: страницы с графиками легко кастомизируются, а для данных доступны различные варианты графиков благодаря библиотеке Plotly.
3. Популярный стек: в проекте используются FastAPI, Dash, Plotly и Docker — технологии, которые знакомы каждому Data Science специалисту.
Что делает этот проект особенным? Он автономен и работает без ошибок и остановки вот уже 15 месяцев (чему я даже удивлён, потому что uptime 15 месяцев для pet-проекта — это очень много ⏱️).
Каждый этап создания моего проекта был шагом вперёд: от бота с логированием в базу до сервиса, который собирает данные по API и визуализирует их. Если вы только начинаете, берите и создавайте pet-проекты. Вы никогда не знаете, какие навыки могут пригодиться в будущем. Сила вашего pet-проекта в том, что он может стать вашим карьерным бустом.
Если моя история вдохновила вас начать свой pet-проект, ставьте ⚡️. Если хотите увидеть топ-10 идей для ваших pet-проектов в области ML, ставьте 🔥, и я составлю список, который поможет вам сделать первый шаг. Помните, сила pet-проекта в том, что он может стать вашим ключом к успеху в карьере!
🚀 Всем data-привет! Задумывались ли вы, как небольшой проект, сделанный в свободное время, может забустить вашу карьеру? Я расскажу вам историю о том, как один мой pet-проект неожиданно выстрелил и стал незаменимым инструментом для всей моей команды.
Я начал создавать свой первый pet-проект в 2021 году, когда был джуном, стремясь освоить новые навыки. В то время я на полной инициативе написал Telegram-бота 🤖 — голосовой дневник, который сохранял голосовые сообщения пользователя в базу данных в формате текста (транскрибация аудио). Написание бота стало отличной возможностью изучить Docker 🐳 и MongoDB 🍃, а также это был первый опыт работы с API. Подробнее об этом можно прочитать в моей старой статье на habr.
По мере того как я продвигался по карьерной лестнице и получал образование в магистратуре, я решил углубиться в изучение python-библиотек. Мой новый опыт работы DS-ом в одном агрегаторе такси также позволил улучшить pet-проект Telegram-бота. Я научился создавать API-сервисы и поднимать web-приложения, благодаря чему удалось настроить мониторинг и визуализацию сохраненных текстовых данных 📊
На текущем месте работы мне нужно было отслеживать 5–9 различных метрик для каждой из 30 моих ML-моделей. Вместо использования стандартных инструментов, таких как Grafana или Tableau, я решил создать что-то своё, опираясь на уже имеющиеся наработки. И это сработало 🎉! Решение на базе моего pet-проекта оказалось максимально полезным и покрыло на 110% потребности команды в мониторинге бизнес и технических метрик ML-моделей 💪.
Сейчас у проекта есть вот такие ключевые особенности:
1. Простота отрисовки данных: достаточно отправить данные для мониторинга по простому API, и они тут же будут отрисованы на графиках в web-интерфейсе.
2. Гибкость визуализации: страницы с графиками легко кастомизируются, а для данных доступны различные варианты графиков благодаря библиотеке Plotly.
3. Популярный стек: в проекте используются FastAPI, Dash, Plotly и Docker — технологии, которые знакомы каждому Data Science специалисту.
Что делает этот проект особенным? Он автономен и работает без ошибок и остановки вот уже 15 месяцев (чему я даже удивлён, потому что uptime 15 месяцев для pet-проекта — это очень много ⏱️).
Каждый этап создания моего проекта был шагом вперёд: от бота с логированием в базу до сервиса, который собирает данные по API и визуализирует их. Если вы только начинаете, берите и создавайте pet-проекты. Вы никогда не знаете, какие навыки могут пригодиться в будущем. Сила вашего pet-проекта в том, что он может стать вашим карьерным бустом.
Если моя история вдохновила вас начать свой pet-проект, ставьте ⚡️. Если хотите увидеть топ-10 идей для ваших pet-проектов в области ML, ставьте 🔥, и я составлю список, который поможет вам сделать первый шаг. Помните, сила pet-проекта в том, что он может стать вашим ключом к успеху в карьере!
🔥19⚡6🗿1
