PyMagic
6.31K subscribers
232 photos
4 videos
10 files
251 links
Data Science / ML / Deep Learning
VK group https://vk.com/club211095898
Download Telegram
➡️ Обучение Data Science для начинающих

Уже 10 февраля у нас стартует 8-ой поток курса по Data Science.

Что вы изучите:
Математику для Data Science
Как проводить АБ-тестирование
Классические ML-алгоритмы: от линейных моделей до бустингов
Научитесь разбираться в ML-алгоритмах и грамотно их применять
NLP: от TF-IDF до Transformers
Deep Learning: основные тренды, база по нейросетям
Computer Vision: примеры из области
MLOps: production code, FastAPI, Streamlit, линтеры
Дополнительно: Airflow, MLFlow, многопоточность, мультипроцессинг, временные ряды, Superset и пр.

Также у нас есть расширенная версия курса с обучением почти на 1 год, дополнительно включающая:
➡️NLP: от базовой обработки текста (токенизация, лемматизация, регулярные выражения и пр.) до продвинутых моделей: Word2Vec, LSTM, Attention, Transformer (BERT, GPT). Научитесь дообучать модели с Hugging Face и применять их в задачах анализа тональности, диалогов и обработки кода (GraphCodeBERT, CodeT5)
➡️Рекомендательные системы: коллаборативная, контентная и гибридная фильтрация. Изучите алгоритмы (User/ItemKNN, ALS, NCF, SVD++), метрики валидации (классификационные, регрессионные, ранжирующие, beyond accuracy). Разберете продвинутые методы: двухуровневые модели, ранжирование, нейросетевые подходы, автоэнкодеры и графовые рекомендации. Особое внимание уделено последовательным и контекстно-адаптивным системам.

📎 Вся актуальная информация о кол-ве теоретического и практического материала, преподавателях, статстике трудоустройства выпускников на сайте PyMagic
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥116
🚀💥 WOMEN IN DATA SCIENCE MEETUP: ТО, ЧТО ВЗОРВЁТ ВАШ 2025 ГОД! 💥🚀

Друзья, приготовьтесь: 7 марта в суперсовременном зале Sber на Уральской, 1 пройдёт событие, которое перевернёт ваше представление о Data Science! Это не просто митап — это билет в будущее, где женщины-гении данных диктуют правила игры. Вы точно не хотите это пропустить.

🔥 ПОЧЕМУ ЭТО БОМБА?

Легендарные спикеры:

Полина Федотова (Сбер) раскроет, как ИИ управляет роботами уже сегодня — да, это не фантастика!
Анна Текучева (Wildberries) научит ловить «модные словечки» в поиске так же ловко, как браконьеров-рыболовов 🎣 (да, она это делала!).
Анастасия Функнер, Ольга Павлова, Анна Ефимова (Ozon Банк) покажут, как создать ML-платформу будущего из симбиоза Golang, MLOps и магии.
Алена Феногенова (Sber) припасла сюрприз на стыке AGI и NLP — даже название доклада пока засекречено!

Круглый стол со звездами:

Нонна Шахова, Эмели Драль, Ирина Голощапова и Анастасия Никулина обсудят, как женщины меняют правила в DS — от старта в карьере до управления ML-революцией.

После партии науки — рок-н-ролл!

Ваши мозги перегреются? Отдохнём под «Rock Data Band» — они сыграют кавер-хиты (это нужно слышать!). Плюс активности, нетворкинг и море энергии.

🎯 ВЫ ПОПАДЁТЕ:
— В футуристический зал Sber.
— На доклады, которые даже на конференциях уровня AAA не всегда услышишь.
В сообщество тех, кто уже сегодня решает, куда повернёт AI.

📌 ДЕТАЛИ:

🗓 7 марта | 15:30 сбор гостей, 16:00 старт
📍 Sber Hall (СПб, Уральская 1, лит. Ч)
🎟 Регистрация — места ограничены!

P.S. Спешите: скоро откроем названия ещё двух секретных докладов. Это будет жарко, как GPU при тренировке LLM!

#WiDS #ODS_SPB #WomenInTech #DataScienceIsFemale 💻👩🔬🎸

Вы готовы увидеть, на что способны женщины в Data Science? Тогда жмите на ссылку — пока места не кончились! 🔥
🔥24😐9👍6🍾4👨‍💻1
Полезные книги по машинному обучению 📚

1) Машинное обучение с PyTorch и Scikit-Learn, Себастьян Рашка
2) PyTorch. Освещая глубокое обучение, Лука Антига, Томас Виман, Эли Стивенс
3) Грокаем машинное обучение, Луис Серрано
4) Data Science. Наука о данных с нуля, Джоэл Грас
5)Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев, Никита Сергеев
35👍5
🔖ТОП-5 книг по ML

Мы на канале не раз разбирали книги по машинному обучению. Чтож, я предлагаю не останавливаться на этом и разобрать еще несколько интересных источников информации для вашего серого вещества 🧠

➡️Я оценивала книги по следующим критериям:
- Базовые знания
- Практические задание
- Глубина изложения
- Актуальность

Спойлер, данный перечень подойдет для начинающих, либо для специалистов с базой в мл (классические алгоритмы).

Честно говоря, найти прям крутые книги для опытных специалистов очень и очень тяжело, скорее это симбиоз из выступлений на конференциях, статей.

https://www.youtube.com/watch?v=ABIB9BNyYV0

Выше список из рассмотренных книг из видео ☝️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥1621😁1
В феврале нам удалось встретиться с Марком Паненко (Chief DS Ozon Fintech) в Москве и записать для вас целых две части подкаста Data Breakfast 🥰

В первой части мы обсудили тему личного бренда в Data Science: зачем и для кого он нужен, какие инструменты для этого существуют и многое другое.
За несколько лет на ютубе, большого количества разных экспериментов на разных площадках, анализа других специалистов, собственных успех и неудач, в том числе опыта с продвижением наших DS из WB, мне есть что рассказать!

Краткое саммери:
- Личный бренд, зачем строить, если ты не инфлюенсер?
- YouTube, блог или LinkedIn — где стартовать новичку?
- Как преодолеть страх критики и нехватку времени?
- Главный миф о личном бренде в DS. Spoiler: «Идеальность» — это иллюзия.
- Реальные кейсы из Wildberries: как экспертиза превращается в доверие.

Ссылка на сообщение в группе ODS Piter, где размещен подкаст. Присоединяйтесь и слушайте!

Ставьте ❤️ и мы выпустим 2ую часть подкаста, но уже на другую тему 😉

Инвайт в группу https://t.me/+R7S2T7UvxVoxYTdi
Please open Telegram to view this post
VIEW IN TELEGRAM
25😭3
Forwarded from WB Space
#мнение_эксперта
В конце февраля DeepSeek устроили неделю опенсорса и 5 дней публиковали репозитории с кодом их проектов ⚙️

FlashMLA — механизм декодирования для больших языковых моделей.
DeepEP — коммуникационная библиотека, специально разработанная для MoE и EP.
DeepGEMM — библиотека для эффективных вычислений General Matrix Multiplications.
DualPipe — инновационный алгоритм двунаправленного конвейерного параллелизма.
Fire-Flyer File System (3FS) — высокопроизводительная распределенная файловая система.

Остальные подробности про каждый проект читайте на карточках!

———
Спасибо за разбор Павлу Дмитриеву, Machine Learning Engineer в CoreCV
🌟 @wb_space
📹 @wb_tech
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍2
🚀 Подкаст Data Breakfast с Анастасией Никулиной. Часть вторая — Курсы в Data Science

🎙 О чём спросили?
▫️ Как создать курс, который меняет карьеру?
▫️ Платные vs бесплатные курсы: когда и зачем платить?
▫️ Почему YouTube-лекции — не всегда достаточно?
▫️ Как не стать «инфоцыганом» и заслужить доверие аудитории?
▫️ Pet-проекты: как превратить их в козырь для резюме?
▫️ Университет vs онлайн: что выбрать новичку?

🎧 Слушайте там, где удобно:
▫️ Telegram-плеер
▫️ Яндекс.Музыка
▫️ Страница выпуска

➡️ Первый выпуск можно посмотреть в группе ODS Piter, для этого необходимо добавиться туда и зайти на этот пост 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17
Собираемся на Data Fusion! 🚀

16-17 апреля в Москве в кластере Ломоносов пройдет крупнейшая конференция Data Fusion по BigDate и AI. Программа конференции каждый год достаточно насыщенная, и этот год не исключение: в расписании как бизнес-, так и технические треки. В этом году будут выступления ведущих ученых, разбор кейсов ML в различных отраслях, дебаты «наука vs бизнес», а также узкопрофильные сессии по DataOps, CV, RAG и нейротехнологиям.

В прошлом году я лично была на площадке, мне конференция очень понравилась: организация, интересные доклады, сессии. А ещё была супер возможность поддержать коллегу, который рассказывал о рекомендательных системах в маркетплейсе 🌿

В этом году, к сожалению, не смогу присутствовать лично, поэтому буду следить за трансляцией. Но если у вас есть возможность прийти и послушать доклады вживую — очень рекомендую! Это отличный шанс пообщаться с коллегами, которых давно не видели, и задать спикерам вопросы напрямую.

Кстати, как вам идея выпустить новый ролик на ютубе с разбором докладов и статей из конференции с моими комментариями? В том числе как такие технологии работают на практике) Если ждешь, то ставь 🔥

Ссылка на регистрацию: https://data-fusion.reg.events/guest/?&erid=2VtzqvwUtXT
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥36👍5
➡️Обзор докладов по рекомендательным системам

Недавно завершилась ежегодная конференция Data Fusion. В этом году она особенно порадовала разнообразием секций, однако ключевое внимание было уделено теме данных — важнейшему компоненту любой модели, который, к сожалению, часто остаётся в тени.

Я решила попробовать новый формат и подготовила обзор на часть докладов из секции, посвящённой рекомендательным системам. На самом деле интересных выступлений было гораздо больше, и многие из них заслуживают отдельного внимания.

Что из этого получилось — смотрите в новом ролике! 😉

https://youtu.be/0S3e1iXR9Vs?si=eNxMR40cQ08n3pi9
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍5💅4💋1
➡️Обучение Data Science для начинающих 3.0

Друзья, мы запустили новую версию курса по машинному обучению! Теперь вы можете проходить материалы в удобное для вас время и в собственном темпе — независимо от графика других студентов.

❗️Мы снизили стоимость курса, поскольку формат стал ориентированным на самообучение. Тем не менее, у вас будет доступ к чату студентов, где можно общаться, обмениваться мнениями и задавать вопросы другим студентам!

Что вы изучите:
Математику для Data Science
Как проводить АБ-тестирование
Классические ML-алгоритмы с полным разбором архитектуры и применения алгоритмов на практике: от линейных моделей до бустингов
NLP: от TF-IDF до LLM
Deep Learning: основные тренды, база по нейросетям
Computer Vision: примеры из области
MLOps: production code, FastAPI, Streamlit, линтеры
Дополнительно: Airflow, MLFlow, многопоточность, мультипроцессинг, временные ряды, Superset и пр.

В расширенном тарифе Grandmaster доступно 2 больших продвинутых блока:

➡️NLP — от базовой обработки текста (токенизация, лемматизация, regex и др.) до LLM. Научитесь дообучать модели с Hugging Face и применять их для анализа тональности, диалогов и кода (GraphCodeBERT, CodeT5 и др.)

➡️Рекомендательные системы — коллаборативная, контентная и гибридная фильтрация. Изучите ключевые алгоритмы (User/ItemKNN, ALS, NCF, SVD++), метрики (включая beyond accuracy) и продвинутые методы: нейросети, автоэнкодеры, графовые и контекстно-адаптивные рекомендации.

📎 Всю актуальную информацию можно найти на сайте PyMagic
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍3😭2🤓211🤩1
Рады приветствовать всех новых участников!

Здесь мы обсуждаем машинное обучение: алгоритмы, новинки из мира ML, а также делимся реальным опытом, который редко можно встретить в учебниках. Кроме того, на канале появляются анонсы образовательных курсов, которые уже завершили более 2000 студентов.

➡️Что почитать?

Многорукие бандиты в музыкальных рекомендациях
Почему лосс не падает, и модель не обучается?
Оптимизируем размер памяти DataFrame в 3 раза
В каких случаях использовать деревья решений?
Ключевые научные работы по NLP
Что такое контрастирование обучение?
Полезные книги по ML
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍62