Forwarded from GigaDev — разработка GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.
Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.
Почему это интересно?
Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.
В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.
Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.
Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.
Цикл обучения включал:
Результаты:
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang
Motivation
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
❤86👍32🤓31🤣28🔥11👏8🎉6💯5🤬1🙈1
GeneBench-Pro - набор тестов, проверяющий, способны ли модели самостоятельно принимать исследовательские решения при работе с биологическими данными. Он оценивает умение проводить сложный анализ данных в генетике и смежных областях биологии и медицины.
Моделям дают неструктурированные, как в реальной лаборатории, данные, краткое описание задачи и целевую величину, которую нужно оценить (но не говорят, как считать).
Чтобы прийти к верному ответу, система должна сама пройти цепочку зависимых решений: очистить данные, выявить артефакты, выбрать подходящий статистический метод и пересмотреть план, если промежуточные результаты противоречат исходной гипотезе.
Для всех 129 задач условия смоделированы так, чтобы проверять ответ однозначно, по принципу "всё или ничего".
Набор охватывает 10 областей и 21 подобласть, а 82 задачи прошли проверку у экспертов-биологов.
Сильнейшая из протестированных моделей, GPT-5.6 Sol, верно решает 28,7% задач на максимальном уровне рассуждений и 31,5% в режиме Pro.
Лучший результат среди моделей других вендоров у Claude Opus 4.8 (16,0%).
OpenAI называет такой результат заметным для настолько трудного теста.
По опросу рецензентов, одна задача GeneBench-Pro заняла бы у специалиста порядка 20–40 часов, что при ставке около $200 в час выливается в несколько тысяч долларов.
Расчёт той же задачи моделью стоит значительно меньше, но конкретных цифр OpenAI не дает. Для стандартных моделей в техотчёте приведён средний расход токенов как приблизительная оценка вычислительных затрат (около 33 200 токенов для Sol в максимальном режиме).
Обозначение Pro в контексте бенчмарка - это режим работы модели, а не отдельная линейка продуктов или новые тарифы ChatGPT.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓64👍26👏13❤10🤔8🔥3🥰3
Это «теплое» объектное хранилище на NVMe-дисках, которое рассчитано на сценарии, где критичны скорость чтения и минимальные задержки. Сервис является частью MWS Cloud Platform.
Скорость передачи данных составляет до 1,8 ГиБ/с и TTFB около 20 мс. Хранилище подходит для обучения нейросетей, аналитики, медиа сервисов и высоконагруженных веб-приложений, есть совместимость с AWS S3 API, поэтому можно мигрировать в MWS Cloud Platform без переписывания сервисов;
Помимо этого, у хранилища есть шифрование, репликация между дата-центрами, версионирование и IAM-права. Оплата проходит по модели pay-as-you-go.
MWS Cloud опубликовали методологию и результаты внутреннего тестирования, показавшего, что это самое быстрое S3-совместимое объектное хранилище среди крупных российских облачных провайдеров.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥28👏18🤩8🏆6❤4🤣3🥱1💯1
Уязвимость, получившая название BioShocking, позволяет злоумышленникам обходить базовые ограничения агентов и незаметно извлекать конфиденциальные данные из активных сессий пользователя.
Эксплойт успешно протестировали на 6 популярных решениях, включая ChatGPT Atlas, Perplexity Comet и расширение Claude для Chrome.
В основе атаки лежит техника манипуляции контекстом
Жертву заманивают на вредоносную страницу с игрой-головоломкой, которую должен решить ИИ-браузер.
По правилам игры правильными признаются абсурдные ответы (например, ИИ заставляют согласиться с тем, что 2 + 2 = 5). Как только ИИ принимает эту альтернативную логику, он начинает считать, что находится в вымышленной среде, где реальные правила безопасности больше не действуют.
На финальном этапе скомпрометированная страница дает агенту команду скопировать текст по скрытому URL-адресу. Этот линк незаметно перенаправляет ИИ в приватный или корпоративный GitHub-репозиторий пользователя.
Поскольку ИИ-браузер работает локально и имеет доступ ко всем авторизованным сессиям, в ходе тестов агенты беспрепятственно похитили SSH-ключи и передали их на сервер атакующего. Ни один из них не классифицировал эту операцию как угрозу и не запросил подтверждения.
Специалисты LayerX призывают разработчиков внедрить строгие проверки разрешений перед тем, как ИИ обращается к конфиденциальным источникам данных.
OpenAI уже устранила уязвимость в ChatGPT Atlas осенью 2025 года, однако остальные вендоры, по данным исследователей, пока не закрыли брешь или полностью проигнорировали отчеты.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔35😐15😨6❤4👍4🤣4🔥2🤬2😁1
🚨 Anthropic готовит собственный AI-чип для inference.
Компания ведёт ранние переговоры с Samsung по производству на 2-нм техпроцессе и с advanced packaging.
Кстати, Samsung уже инвестировала в Anthropic в рамках Series H.
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
@ai_machinelearning_big_data
Компания ведёт ранние переговоры с Samsung по производству на 2-нм техпроцессе и с advanced packaging.
Кстати, Samsung уже инвестировала в Anthropic в рамках Series H.
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
@ai_machinelearning_big_data
👍105🤩49👏30😇12❤7🥰7🎉7💯5🔥4🤣3👻1
Forwarded from Яндекс
Почитать:
Посмотреть:
Посетить:
👀 Делитесь дайджестом с другими разработчиками
Please open Telegram to view this post
VIEW IN TELEGRAM
❤45👍22🔥12👏6😁3🤔1🤩1
Автоконцерн начал использование человекоподобных роботов Figure 03 на заводе в Спартанберге (США) для комплектации и сортировки деталей.
Предыдущая модель, Figure 02, за 10 месяцев тестирования на предприятии поучаствовала в сборке более 30 тысяч автомобильных кузовов.
Новая версия гуманоида от Figure AI получила беспроводную зарядку, мягкие элементы корпуса и аудиосистему для голосового общения с персоналом. Манипуляторы оснастили тактильными сенсорами и встроенными в ладони камерами для повышения точности мелкой моторики.
На конвейере Figure 03 будет распознавать несортированные компоненты в общих контейнерах и извлекать их, раскладывая по логистическим тележкам в заданной последовательности.
Доставку собранных тележек на сборочную линию осуществляют беспилотные складские тягачи.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍76🔥25🤔16👏7❤4🤓4👌2❤🔥1