Forwarded from Душный NLP
Ускорить обучение LLM 70B на 25%? Легко! YaFSDP
Сегодня мы выĸладываем в опенсорс наш новый инструмент — библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом.
Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения.
Несколько подходов нашего метода:
— выделить два буфера под все собираемые веса, чтобы не отдавать их на отĸуп аллоĸатору памяти torch. Каждый нечётный слой будет использовать первый буфер, ĸаждый чётный — второй. Это уменьшит нагрузку на память и сделает её использование более предсказуемым;
— не делать чеĸпоинт аĸтиваций для ĸаĸ можно большего числа слоёв. Это позволит убрать избыточные вычисления за счёт сэкономленной памяти;
— выделить два стрима: вычислений и ĸоммуниĸаций, а синхронизацию построить таким образом, чтобы forward не начинался до завершения all_gather того же слоя, а all_gather не начинался до освобождения соответствующего буффера на предыдущем слое;
— разово собирать RMSNorm/LayerNorm в начале итерации и тольĸо в ĸонце усреднить градиенты;
— вынести predivide в самый ĸонец backward, таĸ ĸаĸ при reduce_scatter в bf16 или fp32 рисĸа переполнения нет.
Более подробно про проблемы обучения на множестве GPU можно почитать на Хабре. Приходите в репозиторий библиотеки YaFSDP, ставьте лайк и приносите вопросы в Issues. А ещё — делитесь своими впечатлениями здесь в комментариях.
Душный NLP
Сегодня мы выĸладываем в опенсорс наш новый инструмент — библиотеку YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом.
Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения.
Несколько подходов нашего метода:
— выделить два буфера под все собираемые веса, чтобы не отдавать их на отĸуп аллоĸатору памяти torch. Каждый нечётный слой будет использовать первый буфер, ĸаждый чётный — второй. Это уменьшит нагрузку на память и сделает её использование более предсказуемым;
— не делать чеĸпоинт аĸтиваций для ĸаĸ можно большего числа слоёв. Это позволит убрать избыточные вычисления за счёт сэкономленной памяти;
— выделить два стрима: вычислений и ĸоммуниĸаций, а синхронизацию построить таким образом, чтобы forward не начинался до завершения all_gather того же слоя, а all_gather не начинался до освобождения соответствующего буффера на предыдущем слое;
— разово собирать RMSNorm/LayerNorm в начале итерации и тольĸо в ĸонце усреднить градиенты;
— вынести predivide в самый ĸонец backward, таĸ ĸаĸ при reduce_scatter в bf16 или fp32 рисĸа переполнения нет.
Более подробно про проблемы обучения на множестве GPU можно почитать на Хабре. Приходите в репозиторий библиотеки YaFSDP, ставьте лайк и приносите вопросы в Issues. А ещё — делитесь своими впечатлениями здесь в комментариях.
Душный NLP
🔥9❤5
Редко тут посты, потому в основном создаем новые каналы)
Yandex ML Underhood — канал, где рассказываем подноготную ML в Яндексе.
Про особенности запуска опенсорса YaFSDP, как вентиляторы в суперкомпьютерах превращались в шрапнель, как (имея крутой пайплайн TTS для русского) сделать Алису на казахском и многое другое.
Каждый пост у нас нетленка, так что не только подписывайтесь, но и читайте предыдущие посты.
Yandex ML Underhood — канал, где рассказываем подноготную ML в Яндексе.
Про особенности запуска опенсорса YaFSDP, как вентиляторы в суперкомпьютерах превращались в шрапнель, как (имея крутой пайплайн TTS для русского) сделать Алису на казахском и многое другое.
Каждый пост у нас нетленка, так что не только подписывайтесь, но и читайте предыдущие посты.
👍8❤6🔥4😭1
Дорогой дневник, мне не подобрать слов...
Да, канал превратился в отчетную историю, что было сделано или будет вот-вот)
Я пришел в этот раз позвать вас на конференцию PML Conf - регайтесь
Уже в эту субботу, 14 сентября, Москва и онлайн трансляция
Внегласный лозунг этой конфы -> этого не напишут в научных статьях
Мы действительно постарались отобрать именно такие доклады
Да, канал превратился в отчетную историю, что было сделано или будет вот-вот)
Я пришел в этот раз позвать вас на конференцию PML Conf - регайтесь
Уже в эту субботу, 14 сентября, Москва и онлайн трансляция
Внегласный лозунг этой конфы -> этого не напишут в научных статьях
Мы действительно постарались отобрать именно такие доклады
Practical ML Conf 2025
Конференция про практический ML от Яндекса
🔥5😁3👍2
Начинаем ML Party Белград
Подключайтесь ;)
Через 2 минуты начинаем
🔳 Смотреть трансляцию на YouTube
🔳 Смотреть в VK
⚪️ Илья Ирхин, руководитель подразделения аналитики в Яндекс Еде. Подробно рассмотрит рекламу ресторанов в сервисе: аукцион, ранжирование, ценообразование
⚪️ Дмитрий Солодуха, руководитель группы в Алисе и Умных устройствах Яндекса. Покажет, как мы учим Алису откликаться без имени
⚪️ Антон Клочков, руководитель подгруппы распознавания текста в VLM в Яндекс Поиске. Расскажет о развитии навыков распознавания текста в VLM
⚪️ Пётр Вытовтов, руководитель группы в Яндекс Погоде. Рассмотрит трансформеры сервиса и расскажет, как начать прогнозировать до миллиметра осадков
Подключайтесь ;)
Через 2 минуты начинаем
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5❤🔥1
Когда-то этот канал создавался вокруг МЛ-соревнований.
И вот отличный повод вернуться к этой теме - новые дорожки Yandex ML Cup
2 дорожки:
- Music information retrieval - определение кавер-версии трека по акустическим признакам трека
- Self-Driving Cars - предсказание движения беспилотного автомобиля
Особенно хочу рекомендавать вторую дорожку: кажется замудренее, потому конкуренции мало, а на деле много точек для роста метрики
Всем удачи и до встречи в финале 😉
И вот отличный повод вернуться к этой теме - новые дорожки Yandex ML Cup
2 дорожки:
- Music information retrieval - определение кавер-версии трека по акустическим признакам трека
- Self-Driving Cars - предсказание движения беспилотного автомобиля
Особенно хочу рекомендавать вторую дорожку: кажется замудренее, потому конкуренции мало, а на деле много точек для роста метрики
Всем удачи и до встречи в финале 😉
Yandex Cup — чемпионат по программированию
Машинное обучение — Yandex Cup
Попробуйте свои силы в решении нестандартных задач
🔥9👻3❤🔥1👍1
LLM-ки уже бенчмаркаются в ML задачах, а ты даже не можешь недельку потренить задачки на литкоде, чтоб найти нормальную работу
https://openai.com/index/mle-bench/
https://arxiv.org/abs/2410.07095v1
https://openai.com/index/mle-bench/
https://arxiv.org/abs/2410.07095v1
Openai
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering
We introduce MLE-bench, a benchmark for measuring how well AI agents perform at machine learning engineering.
🌚13❤🔥1👍1🔥1
Виш-лист на новый год
- 26 TOPS
- support TensorFlow and PyTorch
https://www.raspberrypi.com/news/raspberry-pi-ai-hat/
- 26 TOPS
- support TensorFlow and PyTorch
https://www.raspberrypi.com/news/raspberry-pi-ai-hat/
🔥8🙏2❤🔥1
Вышел ежегодный https://www.stateof.ai/
200+ страниц, чтиво на выходные
200+ страниц, чтиво на выходные
www.stateof.ai
State of AI Report 2025
The State of AI Report analyses the most interesting developments in AI. Read and download here.
👍6🔥2❤🔥1
Скатались в Милан на ECCV'24 и увиденного хватило еще на целый хабр-пост
https://habr.com/ru/companies/yandex/articles/854982/
От личных впечатлений о негрони и ризотто месте конференции, до понравившихся статей.
С вас лайк статье, с нас еще больше интересных и полезных материалов
https://habr.com/ru/companies/yandex/articles/854982/
От личных впечатлений о н
С вас лайк статье, с нас еще больше интересных и полезных материалов
Хабр
ECCV 2024: как это было. Актуальные статьи и главные тренды
Привет! Меня зовут Александр Устюжанин, и я разработчик в команде YandexART . Недавно я побывал в Милане на одной из крупнейших международных конференций по компьютерному...
👍8🍾3❤🔥2
ИИ фишки в Paint-е, как оливье с гребешками
Про ИИ нововедения в самые главные Windows инструменты: Paint и Блокнот:
https://blogs.windows.com/windows-insider/2024/11/06/new-ai-experiences-for-paint-and-notepad-begin-rolling-out-to-windows-insiders/
Про ИИ нововедения в самые главные Windows инструменты: Paint и Блокнот:
https://blogs.windows.com/windows-insider/2024/11/06/new-ai-experiences-for-paint-and-notepad-begin-rolling-out-to-windows-insiders/
🔥3❤🔥2👍2
Коллеги запускают онлайн-интенсив по компьютерному зрению от ШАДа и Яндекс
Поработаем с диффузионными моделями и узнаем про начинку YandexArt
Регистрация до 24 ноября
Отбор с 6 до 29 ноября
https://shad.yandex.ru/cvweek
Поработаем с диффузионными моделями и узнаем про начинку YandexArt
Регистрация до 24 ноября
Отбор с 6 до 29 ноября
https://shad.yandex.ru/cvweek
CV Week | Школы анализа данных
Открытый онлайн-интенсив по компьютерному зрению от ШАДа и Яндекса. Расскажем про генеративные модели, на которых основано большинство визуальных сервисов, и поделимся экспертизой по их созданию
🔥9👍4❤🔥3
Когда уволил почти всех разработчиков, а код сам не пишется...
https://www.forbes.ru/tekhnologii/525235-vk-otkroetsa-miru-kompania-podelitsa-svoimi-razrabotkami-v-formate-open-source
https://www.forbes.ru/tekhnologii/525235-vk-otkroetsa-miru-kompania-podelitsa-svoimi-razrabotkami-v-formate-open-source
Forbes.ru
VK откроется миру: компания поделится своими разработками в формате open-source
VK планирует активизировать работу в направлении софта на базе открытого кода, узнал Forbes. Компания будет выкладывать в публичный доступ свои IT-системы и продукты, инструменты и библиотеки для разработчиков, а также ИИ-модели. Эксперты приветствую
😁27👍3
Привет! В команде редакции, с который мы сотрудничаем в рамках великолепных каналов и некоторых хабр статей открыта позиция Пишущего редактора с техническим бэкграундом
Будет возможность поучаствовать в работе над постами в Душный NLP, ML Underhood, Рекомендательная и CV Time.
А еще ребята делают крутые хабр посты: 1, 2, 3, 4, 5
Если вы или ваши друзья имеете опыт редакторской работы от 3 лет, знание сферы ИТ и, в частности, тематики ML, то обязательно откликайтесь
Будет возможность поучаствовать в работе над постами в Душный NLP, ML Underhood, Рекомендательная и CV Time.
А еще ребята делают крутые хабр посты: 1, 2, 3, 4, 5
Если вы или ваши друзья имеете опыт редакторской работы от 3 лет, знание сферы ИТ и, в частности, тематики ML, то обязательно откликайтесь
yandex.ru
Вакансия «Пишущий редактор с техническим бэкграундом» в Яндексе — работа в компании Яндекс для IT-специалистов
Работа в компании Яндекс для специалиста «Пишущий редактор с техническим бэкграундом» с уровнем квалификации от «Младший» до «Специалист» — Высокая заработная плата и социальные гарантии в IT-компании России
❤3