Делаем первый МЛ митап в Белграде
Буду рад вашему фидбеку, просмотрам и лайкам трансляции.
🔹 19:00 — Алексей Березникер, руководитель команды генерации рекламы в Яндексе: расскажет про нейросетевую генерацию ecom-объявлений
🔹 19:40 — Федор Лебедь, разработчик отдела NLP группы YandexGPT Alignment из Яндекс Поиска: расскажет про генеративные модели и методы обучения с подкреплением
🔹 20:40 — Максим Мачула, руководитель службы качества контента в Поиске по Товарам: расскажет, как мы группируем предложения магазинов в карточки товаров и при чём тут HNSW и CatBoost
онлайн тут
Буду рад вашему фидбеку, просмотрам и лайкам трансляции.
🔹 19:00 — Алексей Березникер, руководитель команды генерации рекламы в Яндексе: расскажет про нейросетевую генерацию ecom-объявлений
🔹 19:40 — Федор Лебедь, разработчик отдела NLP группы YandexGPT Alignment из Яндекс Поиска: расскажет про генеративные модели и методы обучения с подкреплением
🔹 20:40 — Максим Мачула, руководитель службы качества контента в Поиске по Товарам: расскажет, как мы группируем предложения магазинов в карточки товаров и при чём тут HNSW и CatBoost
онлайн тут
YouTube
ML Party Белград — 25 октября 2023
Добро пожаловать на вечерний митап для ML-инженеров от Яндекса. В этот раз поговорим про прикладной проект на стыке технологий машинного обучения и ecom-продукта, обсудим этапы задачи матчинга предложений на товары и потери на разных стадиях, а также рассмотрим…
👍11🔥8❤6😁1
#events
Сегодня мы соберемся на митап
Подключайтесь онлайн
Трансляция начнётся в 18:30 вот здесь
- Автогенерация рекламных баннеров на Яндекс Маркете
- Нейросетевое ранжирование для рекомендательных систем
- Направленное шумоподавление в Алисе и как используются несколько микрофонов
- Подмешивания дополнительных элементов в поиске в борьбе за счастье пользователя
подробнее про программу тут
Но можно сразу залетать на трансляцию
see you)
Сегодня мы соберемся на митап
Подключайтесь онлайн
Трансляция начнётся в 18:30 вот здесь
- Автогенерация рекламных баннеров на Яндекс Маркете
- Нейросетевое ранжирование для рекомендательных систем
- Направленное шумоподавление в Алисе и как используются несколько микрофонов
- Подмешивания дополнительных элементов в поиске в борьбе за счастье пользователя
подробнее про программу тут
Но можно сразу залетать на трансляцию
see you)
YouTube
ML Party Москва — 14 марта 2024
Добро пожаловать на вечерний митап для ML-инженеров от Яндекса. Встречаемся сообществом экспертов в области машинного обучения, чтобы обсудить тренды, новые подходы, решения и вызовы индустрии.
Программа
0:00 Начало
7:13 Александр Воронцов, Руководитель…
Программа
0:00 Начало
7:13 Александр Воронцов, Руководитель…
🔥4❤3👀2
#article
За такие статьи все еще можно читать хабр
Оч советую лайкнуть, почитать или добавить в закладки
Введение в современную квантизацию
https://habr.com/ru/companies/yandex/articles/800945/
За такие статьи все еще можно читать хабр
Оч советую лайкнуть, почитать или добавить в закладки
Введение в современную квантизацию
https://habr.com/ru/companies/yandex/articles/800945/
🔥10❤3👍2👏1🎉1
Forwarded from gonzo-обзоры ML статей
Новый AI Index Report 2024 опубликован!
Сайт: https://aiindex.stanford.edu/report/
PDF: https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
Сайт: https://aiindex.stanford.edu/report/
PDF: https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
🔥8🍾1
Бронируйте дату в календаре, и го слушать, общаться, обниматься
https://habr.com/ru/companies/yandex/posts/813905/
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Пост @couatl — Блог компании Яндекс — 13.05 10:55
Привет! 14 сентября мы вновь проведём Practical ML Conf — ежегодную конференцию Яндекса, посвящённую практическим аспектам применения ML-технологий. Сегодня мы открыли приём заявок для тех, кто хотел...
🔥8👻5❤2🎉2👍1
🔥 Друзья, встречайте новый телеграм-канал от нашей NLP команды — @stuffyNLP
Подпишитесь обязательно, но а тут я поделюсь с вами историей создания.
В Яндексе есть давняя традиция внутренних семинаров. Например на NLP-семинаре каждую неделю разбирают интересные статьи по, неожиданно, NLP. Мы решили, что эти знания не должны оставаться внутри компании. Поэтому убрали NDA из этих обзоров и теперь делимся ими в коротких постах.
Почему "Душный NLP"? Ребята не просто пересказывают статьи, а анализируют их с позиции своего опыта, хвалят и ругают.
Обещаем, душноты будет больше. Подписывайтесь и советуйте друзьям @stuffyNLP
Подпишитесь обязательно, но а тут я поделюсь с вами историей создания.
В Яндексе есть давняя традиция внутренних семинаров. Например на NLP-семинаре каждую неделю разбирают интересные статьи по, неожиданно, NLP. Мы решили, что эти знания не должны оставаться внутри компании. Поэтому убрали NDA из этих обзоров и теперь делимся ими в коротких постах.
Почему "Душный NLP"? Ребята не просто пересказывают статьи, а анализируют их с позиции своего опыта, хвалят и ругают.
Обещаем, душноты будет больше. Подписывайтесь и советуйте друзьям @stuffyNLP
👍8🔥6🥴1
Forwarded from Душный NLP
Ускорить обучение LLM 70B на 25%? Легко! YaFSDP
Сегодня мы выĸладываем в опенсорс наш новый инструмент — библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом.
Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения.
Несколько подходов нашего метода:
— выделить два буфера под все собираемые веса, чтобы не отдавать их на отĸуп аллоĸатору памяти torch. Каждый нечётный слой будет использовать первый буфер, ĸаждый чётный — второй. Это уменьшит нагрузку на память и сделает её использование более предсказуемым;
— не делать чеĸпоинт аĸтиваций для ĸаĸ можно большего числа слоёв. Это позволит убрать избыточные вычисления за счёт сэкономленной памяти;
— выделить два стрима: вычислений и ĸоммуниĸаций, а синхронизацию построить таким образом, чтобы forward не начинался до завершения all_gather того же слоя, а all_gather не начинался до освобождения соответствующего буффера на предыдущем слое;
— разово собирать RMSNorm/LayerNorm в начале итерации и тольĸо в ĸонце усреднить градиенты;
— вынести predivide в самый ĸонец backward, таĸ ĸаĸ при reduce_scatter в bf16 или fp32 рисĸа переполнения нет.
Более подробно про проблемы обучения на множестве GPU можно почитать на Хабре. Приходите в репозиторий библиотеки YaFSDP, ставьте лайк и приносите вопросы в Issues. А ещё — делитесь своими впечатлениями здесь в комментариях.
Душный NLP
Сегодня мы выĸладываем в опенсорс наш новый инструмент — библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом.
Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения.
Несколько подходов нашего метода:
— выделить два буфера под все собираемые веса, чтобы не отдавать их на отĸуп аллоĸатору памяти torch. Каждый нечётный слой будет использовать первый буфер, ĸаждый чётный — второй. Это уменьшит нагрузку на память и сделает её использование более предсказуемым;
— не делать чеĸпоинт аĸтиваций для ĸаĸ можно большего числа слоёв. Это позволит убрать избыточные вычисления за счёт сэкономленной памяти;
— выделить два стрима: вычислений и ĸоммуниĸаций, а синхронизацию построить таким образом, чтобы forward не начинался до завершения all_gather того же слоя, а all_gather не начинался до освобождения соответствующего буффера на предыдущем слое;
— разово собирать RMSNorm/LayerNorm в начале итерации и тольĸо в ĸонце усреднить градиенты;
— вынести predivide в самый ĸонец backward, таĸ ĸаĸ при reduce_scatter в bf16 или fp32 рисĸа переполнения нет.
Более подробно про проблемы обучения на множестве GPU можно почитать на Хабре. Приходите в репозиторий библиотеки YaFSDP, ставьте лайк и приносите вопросы в Issues. А ещё — делитесь своими впечатлениями здесь в комментариях.
Душный NLP
🔥9❤5
Редко тут посты, потому в основном создаем новые каналы)
Yandex ML Underhood — канал, где рассказываем подноготную ML в Яндексе.
Про особенности запуска опенсорса YaFSDP, как вентиляторы в суперкомпьютерах превращались в шрапнель, как (имея крутой пайплайн TTS для русского) сделать Алису на казахском и многое другое.
Каждый пост у нас нетленка, так что не только подписывайтесь, но и читайте предыдущие посты.
Yandex ML Underhood — канал, где рассказываем подноготную ML в Яндексе.
Про особенности запуска опенсорса YaFSDP, как вентиляторы в суперкомпьютерах превращались в шрапнель, как (имея крутой пайплайн TTS для русского) сделать Алису на казахском и многое другое.
Каждый пост у нас нетленка, так что не только подписывайтесь, но и читайте предыдущие посты.
👍8❤6🔥4😭1
Дорогой дневник, мне не подобрать слов...
Да, канал превратился в отчетную историю, что было сделано или будет вот-вот)
Я пришел в этот раз позвать вас на конференцию PML Conf - регайтесь
Уже в эту субботу, 14 сентября, Москва и онлайн трансляция
Внегласный лозунг этой конфы -> этого не напишут в научных статьях
Мы действительно постарались отобрать именно такие доклады
Да, канал превратился в отчетную историю, что было сделано или будет вот-вот)
Я пришел в этот раз позвать вас на конференцию PML Conf - регайтесь
Уже в эту субботу, 14 сентября, Москва и онлайн трансляция
Внегласный лозунг этой конфы -> этого не напишут в научных статьях
Мы действительно постарались отобрать именно такие доклады
Practical ML Conf 2025
Конференция про практический ML от Яндекса
🔥5😁3👍2
Начинаем ML Party Белград
Подключайтесь ;)
Через 2 минуты начинаем
🔳 Смотреть трансляцию на YouTube
🔳 Смотреть в VK
⚪️ Илья Ирхин, руководитель подразделения аналитики в Яндекс Еде. Подробно рассмотрит рекламу ресторанов в сервисе: аукцион, ранжирование, ценообразование
⚪️ Дмитрий Солодуха, руководитель группы в Алисе и Умных устройствах Яндекса. Покажет, как мы учим Алису откликаться без имени
⚪️ Антон Клочков, руководитель подгруппы распознавания текста в VLM в Яндекс Поиске. Расскажет о развитии навыков распознавания текста в VLM
⚪️ Пётр Вытовтов, руководитель группы в Яндекс Погоде. Рассмотрит трансформеры сервиса и расскажет, как начать прогнозировать до миллиметра осадков
Подключайтесь ;)
Через 2 минуты начинаем
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5❤🔥1
Когда-то этот канал создавался вокруг МЛ-соревнований.
И вот отличный повод вернуться к этой теме - новые дорожки Yandex ML Cup
2 дорожки:
- Music information retrieval - определение кавер-версии трека по акустическим признакам трека
- Self-Driving Cars - предсказание движения беспилотного автомобиля
Особенно хочу рекомендавать вторую дорожку: кажется замудренее, потому конкуренции мало, а на деле много точек для роста метрики
Всем удачи и до встречи в финале 😉
И вот отличный повод вернуться к этой теме - новые дорожки Yandex ML Cup
2 дорожки:
- Music information retrieval - определение кавер-версии трека по акустическим признакам трека
- Self-Driving Cars - предсказание движения беспилотного автомобиля
Особенно хочу рекомендавать вторую дорожку: кажется замудренее, потому конкуренции мало, а на деле много точек для роста метрики
Всем удачи и до встречи в финале 😉
Yandex Cup — чемпионат по программированию
Машинное обучение — Yandex Cup
Попробуйте свои силы в решении нестандартных задач
🔥9👻3❤🔥1👍1