Data Science

🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией!

Обе модели
• Обучены с нуля — без инициализации зарубежными весами
• MoE + MTP + MLA
• Совместимы с HuggingFace, llama.cpp / vLLM / SGLang

Код и веса уже на платформе GitVerse.

Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками.
В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

3.24K views08:02

Data Science

Detecting and Correcting Reference Hallucinations in Commercial LLMs and Deep Research Agents

Read

@datascienceiot

3.1K views11:32

Data Science

✔️

10 книг, чтобы понять, как реально работают LLM (2026)

1. Deep Learning
https://deeplearningbook.org
Библия нейросетей - backprop, архитектуры, вся база

2. Artificial Intelligence: A Modern Approach
https://aima.cs.berkeley.edu
Фундаментальный взгляд на AI как систему

3. Speech and Language Processing
https://web.stanford.edu/~jurafsky/slp3/
NLP, трансформеры и язык - максимально глубоко

4. Machine Learning: A Probabilistic Perspective
https://probml.github.io/pml-book/
Вероятности, статистика и основа ML

5. Understanding Deep Learning
https://udlbook.github.io/udlbook/
Современное объяснение DL с хорошей интуицией

6. Designing Machine Learning Systems
https://oreilly.com/library/view/designing-machine-learning/9781098107956/
Как довести модели до продакшена

7. Generative Deep Learning
https://github.com/3p5ilon/ML-books/blob/main/generative-deep-learning-teaching-machines-to-paint-write-compose-and-play.pdf
Практика генеративных моделей и трансформеров

8. Natural Language Processing with Transformers
https://dokumen.pub/natural-language-processing-with-transformers-revised-edition-1098136799-9781098136796-9781098103248.html
Как строить NLP-системы на трансформерах

9. Machine Learning Engineering
https://mlebook.com
Инженерия ML и продакшен

10. The Hundred-Page Machine Learning Book
https://themlbook.com
Суперконцентрированная база без лишнего

Please open Telegram to view this post

VIEW IN TELEGRAM

3.13K views16:11

Data Science

“Self-Distilled RLVR”

Most reasoning RL rewards are reliable, but too sparse.

📓 Book

@datascienceiot

3.31K views10:45

Data Science

Theory First

📗 Book

@datascienceiot

3.09K views08:50

Data Science

CLAWSAFETY: ”Safe” LLMs, Unsafe Agents

📗 Read

@datascienceiot

2.36K views13:59

Data Science

Роскошный максимум: получить приглашение в команду SberAds за один день! 😉

Сделать это можно на One Day Offer* для Data Analyst**, который пройдёт уже 25 апреля. Сбер ждёт специалистов, которые готовы:

✔️ создавать и улучшать модели для real-time аукционов
✔️ трансформировать SberAds — вывести на пик эффективности, качества и релевантности рекламы
✔️ стать частью команды из 8000+ коллег (это вау! 🤩)

Занимай место в проекте мечты!

* One Day Offer — предложение о работе за один день.
** Data Analyst — аналитик данных.

1.61K views08:02

Data Science

ELT: Elastic Looped Transformers for Visual Generation

📗 Read

@datascienceiot

1.51K views10:02

Data Science

Трансформация профессии разработчика в эпоху ИИ

Профессия разработчика меняется прямо сейчас: ИИ уже пишет код, предлагает архитектуру и собирает прототипы за минуты. Но без фундаментальных знаний архитектуры, алгоритмов, сетей, безопасности и DevOps использовать такие инструменты рискованно.
Центральный университет запускает серию бесплатных вебинаров о том, как меняется роль разработчика в 2026 году, какие навыки остаются критически важными и как безопасно и эффективно использовать нейросети в разработке.

На вебинарах разберем:
— почему ИИ не заменит программиста, но изменит его роль;
— какие навыки и языки будут востребованы;
— чего ждут работодатели от разработчиков сегодня;
— почему магистратура по бэкенд-разработке может стать преимуществом;
— как вырасти в техлида и тимлида, не теряя технических экспертных знаний.

Спикеры — лидеры индустрии из Центрального университета, Авито и cloud. ru.
Даты вебинаров: 21, 23 и 27 апреля 2026, 19:00 мск.

Регистрируйся по ссылке

1.11K views09:02

Data Science

⭐️ AI Index 2026: 15 выводов, которые стоит знать каждому в индустрии

Ежегодный AI Index Report за 2026 год - 423-страничный документ, который уже стал обязательным чтением для всех, кто работает с ИИ. Luiza Jarovsky собрала ключевые тезисы в одном треде, а мы разбираем их подробнее.

Возможности ИИ не выходят на плато. Они ускоряются и охватывают все больше людей. Те, кто ждал замедления прогресса, ошиблись - кривая по-прежнему идет вверх.

Разрыв между США и Китаем в производительности моделей фактически закрылся. Это серьезный сдвиг в геополитике ИИ, который меняет расклад сил на рынке.

США лидируют по количеству дата-центров для ИИ, но основная масса чипов производится на одном тайваньском заводе. Зависимость от TSMC остается критической уязвимостью всей индустрии.

Модели ИИ берут золото на Международной математической олимпиаде, но не могут надежно определить время. Исследователи называют это "зубчатой границей" (jagged frontier) - неравномерный профиль способностей, где прорывы соседствуют с провалами.

Роботы по-прежнему проваливают большинство бытовых задач, даже если отлично работают в контролируемых средах. Разрыв между лабораторией и реальным миром никуда не делся.

Ответственный ИИ не успевает за ростом возможностей. Бенчмарки безопасности отстают, а число инцидентов растет резко. Это тревожный сигнал для всей индустрии.

США лидируют по инвестициям в ИИ, но их способность привлекать глобальные таланты снижается. Деньги есть, а люди уезжают - не лучшая комбинация.

Внедрение ИИ идет с исторической скоростью. Пользователи получают значительную ценность от инструментов, к которым часто имеют бесплатный доступ. Порог входа для использования ИИ практически исчез.

Рост продуктивности от ИИ наблюдается в тех же сферах, где начинает сокращаться занятость начального уровня. Это не совпадение, а закономерность, которую уже нельзя игнорировать.

Экологический след ИИ расширяется вместе с его возможностями. Энергопотребление дата-центров становится все более заметным фактором.

Модели ИИ для науки превосходят ученых-людей, хотя более крупные модели не всегда работают лучше. Закон "больше параметров = лучше результат" перестает работать.

ИИ трансформирует клиническую практику, но строгих доказательств эффективности по-прежнему мало. Медицина требует другого уровня верификации.

Формальное образование отстает от ИИ, но люди осваивают навыки работы с ИИ на всех этапах жизни. Самообучение опережает университеты.

Суверенитет в сфере ИИ становится ключевым элементом национальной политики. Возможности распределены неравномерно, но open-source разработка помогает перераспределить участие.

Эксперты по ИИ и обычные люди смотрят на будущее технологии совершенно по-разному. Глобальное доверие к институтам, которые должны управлять ИИ, фрагментировано. Это создает проблему: технологию двигают те, кому общество не вполне доверяет.

Полный отчет (423 страницы): https://hai.stanford.edu/ai-index/2026-ai-index-report
Тред Luiza Jarovsky с кратким обзором: https://x.com/LuizaJarovsky/status/2044033970560512149

947 views11:01

About

Blog

Apps

Platform