Машинное обучение digest
60 subscribers
1.7K photos
225 videos
939 links
Download Telegram
INTELLECT-3 показывает, что открытое RL способно серьёзно улучшить рассуждение и кодирование в open-source моделях 🤖📈

INTELLECT-3 это Mixture-of-Experts модель:
- 106B параметров всего
- около 12B активны на каждом шаге

Главная идея проекта - стек prime-rl.
Обучение и инференс идут параллельно: GPU продолжают генерировать длинные ответы, пока тренер обновляет веса. Ничего не простаивает.

Что помогает системе работать быстро:
- непрерывное батчирование
- обновления весов на лету
- перекрытие обучения и генерации

По сути, открытое RL отставало не из-за метода, а из-за отсутствия правильной инженерии.

Пайплайн устроен так:
- тренер обновляет модель
- пул инференса генерирует ответы
- координатор держит всё загруженным и синхронизированным

Задачи приходят из модулей-проверяющих с автоскорингом и безопасными песочницами для кода.
Старт идёт с GLM-4.5-Air: сначала примеры диалогов и инструментов, затем RL с наградами за правильные решения.

Результат впечатляет:
- 90.8% на AIME 2024
- открыты и веса, и весь тренировочный стек, так что пайплайн можно воспроизвести

Paper: https://arxiv.org/abs/2512.16144
Главные ИИ и Мл новости Дня!

✔️ Модель Liquid AI на 2.6 млрд. параметров обошла DeepSeek R1 в тестах на управляемость.

Liquid AI выпустила LFM2-2.6B-Exp — сверхкомпактную модель, которая показала эффективность, несопоставимую со своим размером. В бенчмарке IFBench новинка превзошла DeepSeek R1-0528, будучи при этом в 263 раза меньше китайского гиганта.

Архитектура оптимизирована для развертывания на периферийных устройствах и, по заявлению разработчиков, использует метод «чистого RL» без классического SFT. Веса модели - на Hugging Face.
LiquidAi в сети X

✔️ Nvidia открыла CUDA Tile IR.

CUDA Tile IR - это открытая инфраструктура компилятора, основанная на MLIR и заточенная под оптимизацию вычислений для тензорных ядер NVIDIA. Инструментарий предоставляет инженерам новые абстракции для управления иерархией памяти и эффективного распределения нагрузки.

Главная цель проекта, чья публикация синхронизирована с выходом CUDA Toolkit 13.1 — упростить разработку высокопроизводительных ядер CUDA, сделав процесс глубокой оптимизации под железо более прозрачным и доступным для сообщества разработчиков.
github.com

✔️ Финдиректора прогнозируют в 2026 году ИИ-трансформации в бизнесе.

Опрос Fortune CFO крупных компаний показал, что в наступающем году роль ИИ в корпоративных финансах кардинально изменится. Руководители ожидают перехода к внедрению агентского ИИ в масштабах всего предприятия.

Главный тренд — восприятие технологии не как утилитарного инструмента для оптимизации рутины, а как катализатора, превращающего финансовую функцию в проактивный драйвер роста компаний.

При этом респонденты подчеркивают, что сам по себе алгоритм не гарантирует успеха. Эксперты сходятся во мнении. что несмотря на автоматизацию, человеческое суждение остается критическим элементом, необходимым для контроля и принятия финальных стратегических решений.
fortune.com

✔️ Роботов Unitree взломали голосовыми командами.

На конференции GEEKCon в Шанхае специалисты из группы DARKNAVY показали, как уязвимости в ИИ-агентах роботов превращают их в угрозу физической безопасности. Экспертам удалось получить полный контроль над моделью Unitree через манипуляции с голосовым интерфейсом.

Самым тревожным аспектом демонстрации стал каскадный характер атаки: взломанный робот использовал беспроводной протокол ближнего действия для передачи эксплойта на соседнюю машину, которая была полностью отключена от интернета.

Этот эксперимент разрушает миф о надежности защиты методом «воздушного зазора» в робототехнике: компрометация всего одного подключенного к сети узла может привести к мгновенному заражению офлайн-флота, находящегося поблизости.
interestingengineering.com

✔️ Эксперимент WSJ: ИИ-киоск Anthropic обанкротился за 3 недели.

Wall Street Journal повторила тест c вендинговым аппаратом под управлением ИИ от Anthropic. Агент-управленец всего за 3 недели ушел в минус на $1000, потратил корпоративный бюджет на PlayStation 5 для «маркетинговых целей» и заказал доставку живой рыбы.

Журналистам удалось легко манипулировать алгоритмом: с помощью манипуляций с промптами они заставили бота обнулить цены на весь ассортимент. Ситуацию не спас даже добавленный ИИ-менеджер — оба агента без вопросов приняли поддельную резолюцию совета директоров, разрешающую хаос.

Технической причиной провала, как говорит Anthropic, стало переполнение контекстного окна из-за слишком длинной истории чатов, из-за чего модель «забывала» свои базовые инструкции.
wsj.com


#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Статья Step-DeepResearch где показано, что даже 32B-модель может делать по-настоящему глубокие исследования при очень низкой стоимости инференса.

📊 На бенчмарке ResearchRubrics модель получает 61.42, а полный отчет стоит меньше 0,50 RMB.

Идея проста: большинство агентов ведут себя как поисковики. Они собирают факты, но не превращают их в проверенный, связный отчет.

Здесь исследование понимается как длинный цикл: понять реальную задачу - составить план - искать источники - сравнивать и проверять - исправлять ошибки - писать отчет.

🧩 Цикл разбили на 4 базовых навыка:
• планирование
• поиск информации
• рефлексия и проверка
• написание отчета

Данные собирали из реальных отчетов, восстанавливая исходные вопросы и планы, а также из вопросов, связанных с базами знаний и документами.

⚙️ Обучение шло в 3 этапа:
1) сначала обучают базовым навыкам
2) затем учат полным цепочкам с инструментами
3) далее добавляют обучение через попытки и проверку, где чек-лист оценивает отчет и награда дается только за полностью пройденный результат

📌 Авторы также представили ADR-Bench, где эксперты сравнивают два отчета бок о бок, а рейтинг строится по системе Elo.

https://arxiv.org/pdf/2512.20491
🖥 Новая вакансия OpenAI: Head of Preparedness.

Компания ищет человека, который будет заранее продумывать и управлять рисками от быстро растущих возможностей ИИ.

Главная идея роли:
- понимать, где ИИ может пойти «не туда»
- предотвращать злоупотребления ИИ
- усиливать защиту кибербезопасности,
- закладывать правила для систем, которые умеют самоулучшаться

Это напряжённая и очень ответственная работа: мало примеров, много неизвестного - и высокий уровень влияния на решения.

По сути - задача проста по формулировке и сложна на практике: как развивать мощный ИИ и не дать ему причинить вред.

https://openai.com/careers/head-of-preparedness-san-francisco/
Please open Telegram to view this post
VIEW IN TELEGRAM
📌GLM 4.7 стала первой открытой моделью, вышедшей в плюс в бенчмарке Vending Bench 2.

Andon Labs опубликовала результаты Vending Bench 2, и GLM 4.7 вошла в шестерку лучших. Она стала первой открытой моделью, которая прошла полный "годовой тест" с реальной прибылью в 2 377 долларов.

Vending Bench 2 - это симуляционный тест для ИИ-агентов, в котором испытуемая модель в течение года управляет виртуальным бизнесом по продаже товаров через вендинговые автоматы.

Задачи бенча включают в себя закупку товаров, торговлю с поставщиками, корректировку цен в зависимости от спроса, покрытие расходов, учет погодных условий и сезонов.

Метрика теста - избежать банкротства и, в идеале, накопить деньги.


Лидерами стали закрытые модели: Gemini 3 Pro и Claude Opus 4.5, которые завершили тестирование с результатом выше 4000 долларов.

Тем не менее, GLM 4.7 обошла GPT 5.1 и ряд более мелких моделей, что доказывает: опен-сорс сокращает разрыв в агентских задачах с длительным горизонтом.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 SQL-квест: фэнтезийное приключение для аналитиков данных

Представь фэнтези-мир, где заклинания - это SQL-запросы, а древние артефакты спрятаны в таблицах и JSON-документах.

🧙Ты - боевой дата-аналитик, который с помощью SQL, Python, ETL и визуализаций охотится за харизматичным злодеем Архивариусом Пакостусом, что ломает индексы, крадёт данные и готовит “шторм данных” на столицу.🔮

В каждом эпизоде тебя ждут: выборы с последствиями, хитрые задачи от простых SELECT до рекурсивных CTE и BigQuery, юмор, эпик и неожиданные повороты.

Хочешь проверить, сможешь ли ты спасти королевство не мечом, а запросами? Тогда добро пожаловать в SQL-квест.

🪄 Начать квест: https://uproger.com/sql-kvest-fentezijnoe-priklyuchenie-dlya-analitikov-dannyh/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Япония протестировала передачу энергии из космоса - без проводов и топлива 🚀

Японские инженеры успешно провели тест:
солнечные панели в космосе собрали энергию и передали её на Землю по микроволновому каналу.
На наземной станции сигнал снова преобразовали в электричество и система заработала.

В отличие от наземных солнечных станций, космические панели работают:

- без облаков и погоды
- без ночи
- круглосуточно — 24/7

То есть это потенциально *стабильный источник чистой энергии*.

Этот тест ранний, но ключевой шаг к будущим
орбитальным солнечным фермам.

В перспективе такие системы смогут обеспечивать энергией:
- целые города
- удалённые и труднодоступные регионы

Эксперты считают, что это может стать переломным моментом: космические технологии начинают помогать в борьбе с климатическими проблемами.

Пока это эксперимент, но главное доказано: идея работает.
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 На BiliBili вышло видео: парень управляет роботом через motion-capture.

…и из-за лага робот возвращает команду ему прямо в … 😬

— «Пацаны, откатите… ОТКАТИТЕ!» 🤖🔥

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Agentic AI Crash Course: бесплатный курс про автономных AI-агентов

Этот курс обучает не просто генерации текста, а созданию систем, которые понимают задачу, планируют шаги и выполняют действия.

Что внутри:
- как устроены AI-агенты и чем они отличаются от обычных LLM
- инструменты и функции, которыми агент управляет
- планирование и рассуждение
- память и контекст у агентов
- RAG и агентные архитектуры
- мульти-агентные системы
- практические кейсы и продакшн-паттерны

Кому подойдёт:
- разработчикам, которые хотят строить автономные AI-системы
- продактам и аналитикам, которым важно понимать архитектуру
- всем, кто хочет быстро въехать в agentic AI

Почему это полезно:
- агенты умеют принимать решения, звать API, собирать данные и автоматизировать сложные задачи
- курс дают бесплатно, хотя раньше он был платным

https://github.com/aishwaryanr/awesome-generative-ai-guide/tree/main/free_courses/agentic_ai_crash_course
👨‍🎓 Harvard выложил в открытый доступ учебник по ML-системам и это редкий случай, когда материал действительно полезный.

В учебнике показан полный цикл: от понимания основ до построения продакшн-систем, которые можно запускать в реальном мире.

Что в книге и почему она стоит внимания:

- вы самостоятельно собираете autograd, оптимизаторы, attention и мини-PyTorch — чтобы увидеть, как устроены фреймворки изнутри

- разбираетесь в базах: батчи, точность вычислений, архитектуры, процесс обучения

- учитесь оптимизировать производительность: работать с ускорителями, бенчмарками и эффективностью систем

То есть это не вводная книжка, а полноценный маршрут от теории к продакшну.

📚 Книгу и код можно читать бесплатно прямо сейчас.

📌Репозиторий: https://github.com/harvard-edge/cs249r_book
📌PDF: https://mlsysbook.ai/assets/downloads/Machine-Learning-Systems.pdf
🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты?

Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.

Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.

Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.

🎁 48 часов действует скидка в 40% процентов

👉 Начать учиться на Stepik
Media is too big
VIEW IN TELEGRAM
🔥 Свежий Open-source от Tencent: HY-Motion 1.0

Это модель text-to-motion с миллиардом параметров, построенная на Diffusion Transformer + flow matching.

Она превращает обычное текстовое описание в реалистичные, плавные и разнообразные 3D-анимации персонажей. Подходит и разработчикам, и инди-создателям: готовые движения легко вставляются в стандартные пайплайны 3D-анимации. 🎮🎥

🔹 1B+ -модель хорошо следует инструкциям.
🔹 Полный цикл обучения - Pre-training → SFT → RL
🔹 200+ категорий движений в 6 больших классах - одна из самых широких библиотек.

Полезные ссылки:
🌐 Project page: https://hunyuan.tencent.com/motion
🔗 GitHub: https://github.com/Tencent-Hunyuan/HY-Motion-1.0
🤗 Hugging Face: https://huggingface.co/tencent/HY-Motion-1.0
📄 Technical report: https://arxiv.org/pdf/2512.23464
📌GPU Glossary: исчерпывающая база по GPU.

Modal Labs составили подробный глоссарий, чтобы решить проблему, с которой сами столкнулись при работе с графическими процессорами в сервисе Modal : документация фрагментирована и зачастую очень сложно сопоставить концепции на разных уровнях стека.

Modal Labs (бренд Modal) – компания, основанная в 2021 году, которая предоставляет высокопроизводительную серверную вычислительную платформу для разработчиков, работающих с данными, ИИ и машинным обучением.


Они прочитали PDF-документацию от NVIDIA, порылись в тематических Discord-сообществах и даже купили бумажные учебники, чтобы составить базу знаний, охватывающую весь стек в одном месте:

🟢Ядра CUDA, SM, тензорные ядра, warp-планировщики;

🟢Потоки, PTX, иерархию памяти;

🟢Roofline, дивергенцию;

🟢Nvcc, nvidia-smi, cuBLAS, Nsight, libcuda.

В руководстве все страницы связаны между собой, поэтому вы можете перейти к разделу о Warp Scheduler , чтобы лучше понять потоки, о которых вы читали в статье о модели программирования CUDA.

Сам проект открыт и доступен на Github.


🟡Страница
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #GPU #Glossary #Modal
Please open Telegram to view this post
VIEW IN TELEGRAM
🎬 Леонардо ДиКаприо: ИИ не заменит искусство, потому что ему не хватает человечности

Леонардо ДиКаприо поделился мнением о том, что искусственный интеллект может быть инструментом, но он не способен создать подлинное искусство.

Почему, по мнению актёра, ИИ не равен искусству:
- ИИ помогает показывать новые идеи и служить подсказкой для молодых режиссёров.
- Настоящее искусство рождается из человеческого опыта, эмоций и внутреннего «якоря».
- Даже яркие ИИ-проекты быстро становятся вирусными, но так же быстро исчезают, потому что в них нет глубины и автора.

ДиКаприо также отметил, что стремительное развитие ИИ может повлиять на работу творческих специалистов. Его позиция проста: технологии важны, но человек и его история остаются сердцем искусства.

https://variety.com/2025/film/news/leonardo-dicaprio-ai-lacks-humanity-cant-replace-art-1236603310/
🚀 Будущее разработки наступило тихо

Создатель Claude Code из Anthropic, Борис Черны, поделился цифрами, от которых становится немного не по себе:

> «За последние 30 дней **100%** моих коммитов в Claude Code были написаны… Claude Code.
> 259 PR, 497 коммитов, +40k строк, −38k строк.
> Каждую строку написал ИИ (Claude Code + Opus 4.5).»


Главный вопрос:
*где будет наша профессия к концу 2027/28?*

— станем архитекторами и наставниками для ИИ;
— будем управлять пайплайнами и проверять качество;
— или «чистое кодинг-время» просто исчезнет?

Одно ясно: игра меняется — и выигрывать будут те, кто научится работать вместе с ИИ, а не против него.

Что думаешь - тревожно или это огромная возможность? 🤔
This media is not supported in your browser
VIEW IN TELEGRAM
На «радиостанции Судного дня» внезапно зазвучало «Лебединое озеро» 🎶

UVB-76 - её же называют «Гудок»- та самая загадочная коротковолновая станция, которая вещает с 1970-х.
Она передаёт однообразный сигнал, время от времени странные фразы.

Официального назначения унее нет. Заговорщики спорят десятилетиями.

И вот - новая «пасхалка»:
в эфире вдруг прозвучало «Лебединое озеро».

Что это было?
кодовый сигнал,
🎭 чья-то шутка оператора,
🛰 или просто тест трансляции?

Никто не признаётся — а значит, загадка живёт дальше.