294K subscribers
5.14K photos
1.16K videos
17 files
5.5K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»


Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.

Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.

Почему это интересно?

Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.

В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.

Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.

Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.

Цикл обучения включал:
🔘адаптацию AR-модели к диффузионной генерации;
🔘постепенное увеличение размера блока;
🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM;
🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации.

Результаты:

🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B.
🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%.
🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации.
🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM.
🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.


➡️Подробности — в статье на Habr.
➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B
➡️GitVerse
Please open Telegram to view this post
VIEW IN TELEGRAM
86👍32🤓31🤣28🔥11👏8🎉6💯5🤬1🙈1
📌 OpenAI собрала бенчмарк на научное суждение в биологии

GeneBench-Pro - набор тестов, проверяющий, способны ли модели самостоятельно принимать исследовательские решения при работе с биологическими данными. Он оценивает умение проводить сложный анализ данных в генетике и смежных областях биологии и медицины.

Моделям дают неструктурированные, как в реальной лаборатории, данные, краткое описание задачи и целевую величину, которую нужно оценить (но не говорят, как считать).

Чтобы прийти к верному ответу, система должна сама пройти цепочку зависимых решений: очистить данные, выявить артефакты, выбрать подходящий статистический метод и пересмотреть план, если промежуточные результаты противоречат исходной гипотезе.

Для всех 129 задач условия смоделированы так, чтобы проверять ответ однозначно, по принципу "всё или ничего".

Набор охватывает 10 областей и 21 подобласть, а 82 задачи прошли проверку у экспертов-биологов.

Сильнейшая из протестированных моделей, GPT-5.6 Sol, верно решает 28,7% задач на максимальном уровне рассуждений и 31,5% в режиме Pro.

Лучший результат среди моделей других вендоров у Claude Opus 4.8 (16,0%).

OpenAI называет такой результат заметным для настолько трудного теста.


🟡Практическая ценность

По опросу рецензентов, одна задача GeneBench-Pro заняла бы у специалиста порядка 20–40 часов, что при ставке около $200 в час выливается в несколько тысяч долларов.

Расчёт той же задачи моделью стоит значительно меньше, но конкретных цифр OpenAI не дает. Для стандартных моделей в техотчёте приведён средний расход токенов как приблизительная оценка вычислительных затрат (около 33 200 токенов для Sol в максимальном режиме).

🟡Дисклеймер

Обозначение Pro в контексте бенчмарка - это режим работы модели, а не отдельная линейка продуктов или новые тарифы ChatGPT.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓64👍26👏1310🤔8🔥3🥰3
📌 MWS Cloud запустила новый класс S3-хранилища для AI и ML-задач.

Это «теплое» объектное хранилище на NVMe-дисках, которое рассчитано на сценарии, где критичны скорость чтения и минимальные задержки. Сервис является частью MWS Cloud Platform.

Скорость передачи данных составляет до 1,8 ГиБ/с и TTFB около 20 мс. Хранилище подходит для обучения нейросетей, аналитики, медиа сервисов и высоконагруженных веб-приложений, есть совместимость с AWS S3 API, поэтому можно мигрировать в MWS Cloud Platform без переписывания сервисов;

Помимо этого, у хранилища есть шифрование, репликация между дата-центрами, версионирование и IAM-права. Оплата проходит по модели pay-as-you-go.

MWS Cloud опубликовали методологию и результаты внутреннего тестирования, показавшего, что это самое быстрое S3-совместимое объектное хранилище среди крупных российских облачных провайдеров.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥28👏18🤩8🏆64🤣3🥱1💯1
✔️ В компании LayerX описали новый вектор атак на ИИ-браузеры

Уязвимость, получившая название BioShocking, позволяет злоумышленникам обходить базовые ограничения агентов и незаметно извлекать конфиденциальные данные из активных сессий пользователя.

Эксплойт успешно протестировали на 6 популярных решениях, включая ChatGPT Atlas, Perplexity Comet и расширение Claude для Chrome.


В основе атаки лежит техника манипуляции контекстом

Жертву заманивают на вредоносную страницу с игрой-головоломкой, которую должен решить ИИ-браузер.

По правилам игры правильными признаются абсурдные ответы (например, ИИ заставляют согласиться с тем, что 2 + 2 = 5). Как только ИИ принимает эту альтернативную логику, он начинает считать, что находится в вымышленной среде, где реальные правила безопасности больше не действуют.

На финальном этапе скомпрометированная страница дает агенту команду скопировать текст по скрытому URL-адресу. Этот линк незаметно перенаправляет ИИ в приватный или корпоративный GitHub-репозиторий пользователя.

Поскольку ИИ-браузер работает локально и имеет доступ ко всем авторизованным сессиям, в ходе тестов агенты беспрепятственно похитили SSH-ключи и передали их на сервер атакующего. Ни один из них не классифицировал эту операцию как угрозу и не запросил подтверждения.

Специалисты LayerX призывают разработчиков внедрить строгие проверки разрешений перед тем, как ИИ обращается к конфиденциальным источникам данных.

OpenAI уже устранила уязвимость в ChatGPT Atlas осенью 2025 года, однако остальные вендоры, по данным исследователей, пока не закрыли брешь или полностью проигнорировали отчеты.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔35😐15😨64👍4🤣4🔥2🤬2😁1
🚨 Anthropic готовит собственный AI-чип для inference.

Компания ведёт ранние переговоры с Samsung по производству на 2-нм техпроцессе и с advanced packaging.

Кстати, Samsung уже инвестировала в Anthropic в рамках Series H.

https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip

@ai_machinelearning_big_data
👍105🤩49👏30😇127🥰7🎉7💯5🔥4🤣3👻1
Forwarded from Яндекс
❤️ Июньский дайджест для разработчиков. Собрали главное: что полезное почитать, посмотреть и куда сходить в следующей месяце.

Почитать:

ICLR 2026 в Рио-де-Жанейро: главные ML-тренды, математика и инсайты с конференции

Как мы перепридумали голосовую активацию для Яндекс Дропс и уместили новую модель в 200 килобайт

Как сетевой инженер в Yandex Infrastructure сделал сканер под iOS и Android для диагностики Wi-Fi-сети

Посмотреть:

Круглый стол с Mobile Runtime. Пригласили мобильных тимлидов и руководителей, чтобы разобраться, как развиваться мобильным разработчикам

Доклад про внедрение AI в инженерные команды. Что важно поменять в процессах и инфраструктуре и как замерять успех

Подкаст «Доверительный интервал» про главные тревоги аналитиков. Обсудили синдром самозванца, страх карьерного роста и другие проблемы

Посетить:

25 июля — Product Fest в Москве и онлайн. Точка сборки продуктового опыта: приходите, чтобы понять, как создавать продукты, когда космическая скорость стала новой нормой

👀 Делитесь дайджестом с другими разработчиками
Please open Telegram to view this post
VIEW IN TELEGRAM
45👍22🔥12👏6😁3🤔1🤩1
✔️ BMW внедряет робота-гуманоида Figure 03 в производственную логистику

Автоконцерн начал использование человекоподобных роботов Figure 03 на заводе в Спартанберге (США) для комплектации и сортировки деталей.

Предыдущая модель, Figure 02, за 10 месяцев тестирования на предприятии поучаствовала в сборке более 30 тысяч автомобильных кузовов.


Новая версия гуманоида от Figure AI получила беспроводную зарядку, мягкие элементы корпуса и аудиосистему для голосового общения с персоналом. Манипуляторы оснастили тактильными сенсорами и встроенными в ладони камерами для повышения точности мелкой моторики.

На конвейере Figure 03 будет распознавать несортированные компоненты в общих контейнерах и извлекать их, раскладывая по логистическим тележкам в заданной последовательности.

Доставку собранных тележек на сборочную линию осуществляют беспилотные складские тягачи.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍76🔥25🤔16👏74🤓4👌2❤‍🔥1