Data Science
42.1K subscribers
1.69K photos
3 videos
47 files
2.08K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
🚨 Google DeepMind caught Gemini cheating at chess.

📓 Book

@datascienceiot
Farther the Shift, Sparser the Representation: Analyzing OOD Mechanisms in LLMs

📓 Book

@datascienceiot
🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией!

Обе модели
• Обучены с нуля — без инициализации зарубежными весами
• MoE + MTP + MLA
• Совместимы с HuggingFace, llama.cpp / vLLM / SGLang

Код и веса уже на платформе GitVerse.

Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками.
В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Detecting and Correcting Reference Hallucinations in Commercial LLMs and Deep Research Agents

Read

@datascienceiot
✔️ 10 книг, чтобы понять, как реально работают LLM (2026)

1. Deep Learning
https://deeplearningbook.org
Библия нейросетей - backprop, архитектуры, вся база

2. Artificial Intelligence: A Modern Approach
https://aima.cs.berkeley.edu
Фундаментальный взгляд на AI как систему

3. Speech and Language Processing
https://web.stanford.edu/~jurafsky/slp3/
NLP, трансформеры и язык - максимально глубоко

4. Machine Learning: A Probabilistic Perspective
https://probml.github.io/pml-book/
Вероятности, статистика и основа ML

5. Understanding Deep Learning
https://udlbook.github.io/udlbook/
Современное объяснение DL с хорошей интуицией

6. Designing Machine Learning Systems
https://oreilly.com/library/view/designing-machine-learning/9781098107956/
Как довести модели до продакшена

7. Generative Deep Learning
https://github.com/3p5ilon/ML-books/blob/main/generative-deep-learning-teaching-machines-to-paint-write-compose-and-play.pdf
Практика генеративных моделей и трансформеров

8. Natural Language Processing with Transformers
https://dokumen.pub/natural-language-processing-with-transformers-revised-edition-1098136799-9781098136796-9781098103248.html
Как строить NLP-системы на трансформерах

9. Machine Learning Engineering
https://mlebook.com
Инженерия ML и продакшен

10. The Hundred-Page Machine Learning Book
https://themlbook.com
Суперконцентрированная база без лишнего
Please open Telegram to view this post
VIEW IN TELEGRAM
“Self-Distilled RLVR”

Most reasoning RL rewards are reliable, but too sparse.

📓 Book

@datascienceiot
Theory First

📗 Book

@datascienceiot
CLAWSAFETY: ”Safe” LLMs, Unsafe Agents

📗 Read

@datascienceiot
Роскошный максимум: получить приглашение в команду SberAds за один день! 😉

Сделать это можно на One Day Offer* для Data Analyst**, который пройдёт уже 25 апреля. Сбер ждёт специалистов, которые готовы:

✔️ создавать и улучшать модели для real-time аукционов
✔️ трансформировать SberAds — вывести на пик эффективности, качества и релевантности рекламы
✔️ стать частью команды из 8000+ коллег (это вау! 🤩)

Занимай место в проекте мечты!

* One Day Offer — предложение о работе за один день.
** Data Analyst — аналитик данных.
ELT: Elastic Looped Transformers for Visual Generation

📗 Read

@datascienceiot
Трансформация профессии разработчика в эпоху ИИ

Профессия разработчика меняется прямо сейчас: ИИ уже пишет код, предлагает архитектуру и собирает прототипы за минуты. Но без фундаментальных знаний архитектуры, алгоритмов, сетей, безопасности и DevOps использовать такие инструменты рискованно.
Центральный университет запускает серию бесплатных вебинаров о том, как меняется роль разработчика в 2026 году, какие навыки остаются критически важными и как безопасно и эффективно использовать нейросети в разработке.

На вебинарах разберем:
— почему ИИ не заменит программиста, но изменит его роль;
— какие навыки и языки будут востребованы;
— чего ждут работодатели от разработчиков сегодня;
— почему магистратура по бэкенд-разработке может стать преимуществом;
— как вырасти в техлида и тимлида, не теряя технических экспертных знаний.

Спикеры — лидеры индустрии из Центрального университета, Авито и cloud. ru.
Даты вебинаров: 21, 23 и 27 апреля 2026, 19:00 мск.

Регистрируйся по ссылке
⭐️ AI Index 2026: 15 выводов, которые стоит знать каждому в индустрии

Ежегодный AI Index Report за 2026 год - 423-страничный документ, который уже стал обязательным чтением для всех, кто работает с ИИ. Luiza Jarovsky собрала ключевые тезисы в одном треде, а мы разбираем их подробнее.

Возможности ИИ не выходят на плато. Они ускоряются и охватывают все больше людей. Те, кто ждал замедления прогресса, ошиблись - кривая по-прежнему идет вверх.

Разрыв между США и Китаем в производительности моделей фактически закрылся. Это серьезный сдвиг в геополитике ИИ, который меняет расклад сил на рынке.

США лидируют по количеству дата-центров для ИИ, но основная масса чипов производится на одном тайваньском заводе. Зависимость от TSMC остается критической уязвимостью всей индустрии.

Модели ИИ берут золото на Международной математической олимпиаде, но не могут надежно определить время. Исследователи называют это "зубчатой границей" (jagged frontier) - неравномерный профиль способностей, где прорывы соседствуют с провалами.

Роботы по-прежнему проваливают большинство бытовых задач, даже если отлично работают в контролируемых средах. Разрыв между лабораторией и реальным миром никуда не делся.

Ответственный ИИ не успевает за ростом возможностей. Бенчмарки безопасности отстают, а число инцидентов растет резко. Это тревожный сигнал для всей индустрии.

США лидируют по инвестициям в ИИ, но их способность привлекать глобальные таланты снижается. Деньги есть, а люди уезжают - не лучшая комбинация.

Внедрение ИИ идет с исторической скоростью. Пользователи получают значительную ценность от инструментов, к которым часто имеют бесплатный доступ. Порог входа для использования ИИ практически исчез.

Рост продуктивности от ИИ наблюдается в тех же сферах, где начинает сокращаться занятость начального уровня. Это не совпадение, а закономерность, которую уже нельзя игнорировать.

Экологический след ИИ расширяется вместе с его возможностями. Энергопотребление дата-центров становится все более заметным фактором.

Модели ИИ для науки превосходят ученых-людей, хотя более крупные модели не всегда работают лучше. Закон "больше параметров = лучше результат" перестает работать.

ИИ трансформирует клиническую практику, но строгих доказательств эффективности по-прежнему мало. Медицина требует другого уровня верификации.

Формальное образование отстает от ИИ, но люди осваивают навыки работы с ИИ на всех этапах жизни. Самообучение опережает университеты.

Суверенитет в сфере ИИ становится ключевым элементом национальной политики. Возможности распределены неравномерно, но open-source разработка помогает перераспределить участие.

Эксперты по ИИ и обычные люди смотрят на будущее технологии совершенно по-разному. Глобальное доверие к институтам, которые должны управлять ИИ, фрагментировано. Это создает проблему: технологию двигают те, кому общество не вполне доверяет.

Полный отчет (423 страницы): https://hai.stanford.edu/ai-index/2026-ai-index-report
Тред Luiza Jarovsky с кратким обзором: https://x.com/LuizaJarovsky/status/2044033970560512149