Статья Step-DeepResearch где показано, что даже 32B-модель может делать по-настоящему глубокие исследования при очень низкой стоимости инференса.
📊 На бенчмарке ResearchRubrics модель получает 61.42, а полный отчет стоит меньше 0,50 RMB.
Идея проста: большинство агентов ведут себя как поисковики. Они собирают факты, но не превращают их в проверенный, связный отчет.
Здесь исследование понимается как длинный цикл: понять реальную задачу - составить план - искать источники - сравнивать и проверять - исправлять ошибки - писать отчет.
🧩 Цикл разбили на 4 базовых навыка:
• планирование
• поиск информации
• рефлексия и проверка
• написание отчета
Данные собирали из реальных отчетов, восстанавливая исходные вопросы и планы, а также из вопросов, связанных с базами знаний и документами.
⚙️ Обучение шло в 3 этапа:
1) сначала обучают базовым навыкам
2) затем учат полным цепочкам с инструментами
3) далее добавляют обучение через попытки и проверку, где чек-лист оценивает отчет и награда дается только за полностью пройденный результат
📌 Авторы также представили ADR-Bench, где эксперты сравнивают два отчета бок о бок, а рейтинг строится по системе Elo.
https://arxiv.org/pdf/2512.20491
📊 На бенчмарке ResearchRubrics модель получает 61.42, а полный отчет стоит меньше 0,50 RMB.
Идея проста: большинство агентов ведут себя как поисковики. Они собирают факты, но не превращают их в проверенный, связный отчет.
Здесь исследование понимается как длинный цикл: понять реальную задачу - составить план - искать источники - сравнивать и проверять - исправлять ошибки - писать отчет.
🧩 Цикл разбили на 4 базовых навыка:
• планирование
• поиск информации
• рефлексия и проверка
• написание отчета
Данные собирали из реальных отчетов, восстанавливая исходные вопросы и планы, а также из вопросов, связанных с базами знаний и документами.
⚙️ Обучение шло в 3 этапа:
1) сначала обучают базовым навыкам
2) затем учат полным цепочкам с инструментами
3) далее добавляют обучение через попытки и проверку, где чек-лист оценивает отчет и награда дается только за полностью пройденный результат
📌 Авторы также представили ADR-Bench, где эксперты сравнивают два отчета бок о бок, а рейтинг строится по системе Elo.
https://arxiv.org/pdf/2512.20491
Компания ищет человека, который будет заранее продумывать и управлять рисками от быстро растущих возможностей ИИ.
Главная идея роли:
- понимать, где ИИ может пойти «не туда»
- предотвращать злоупотребления ИИ
- усиливать защиту кибербезопасности,
- закладывать правила для систем, которые умеют самоулучшаться
Это напряжённая и очень ответственная работа: мало примеров, много неизвестного - и высокий уровень влияния на решения.
По сути - задача проста по формулировке и сложна на практике: как развивать мощный ИИ и не дать ему причинить вред.
https://openai.com/careers/head-of-preparedness-san-francisco/
Please open Telegram to view this post
VIEW IN TELEGRAM
Andon Labs опубликовала результаты Vending Bench 2, и GLM 4.7 вошла в шестерку лучших. Она стала первой открытой моделью, которая прошла полный "годовой тест" с реальной прибылью в 2 377 долларов.
Vending Bench 2 - это симуляционный тест для ИИ-агентов, в котором испытуемая модель в течение года управляет виртуальным бизнесом по продаже товаров через вендинговые автоматы.
Задачи бенча включают в себя закупку товаров, торговлю с поставщиками, корректировку цен в зависимости от спроса, покрытие расходов, учет погодных условий и сезонов.
Метрика теста - избежать банкротства и, в идеале, накопить деньги.
Лидерами стали закрытые модели: Gemini 3 Pro и Claude Opus 4.5, которые завершили тестирование с результатом выше 4000 долларов.
Тем не менее, GLM 4.7 обошла GPT 5.1 и ряд более мелких моделей, что доказывает: опен-сорс сокращает разрыв в агентских задачах с длительным горизонтом.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Представь фэнтези-мир, где заклинания - это SQL-запросы, а древние артефакты спрятаны в таблицах и JSON-документах.
🧙Ты - боевой дата-аналитик, который с помощью SQL, Python, ETL и визуализаций охотится за харизматичным злодеем Архивариусом Пакостусом, что ломает индексы, крадёт данные и готовит “шторм данных” на столицу.🔮
В каждом эпизоде тебя ждут: выборы с последствиями, хитрые задачи от простых SELECT до рекурсивных CTE и BigQuery, юмор, эпик и неожиданные повороты.
Хочешь проверить, сможешь ли ты спасти королевство не мечом, а запросами? Тогда добро пожаловать в SQL-квест.
🪄 Начать квест: https://uproger.com/sql-kvest-fentezijnoe-priklyuchenie-dlya-analitikov-dannyh/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Япония протестировала передачу энергии из космоса - без проводов и топлива 🚀⚡
Японские инженеры успешно провели тест:
солнечные панели в космосе собрали энергию и передали её на Землю по микроволновому каналу.
На наземной станции сигнал снова преобразовали в электричество и система заработала.
В отличие от наземных солнечных станций, космические панели работают:
- без облаков и погоды
- без ночи
- круглосуточно — 24/7
То есть это потенциально *стабильный источник чистой энергии*.
Этот тест ранний, но ключевой шаг к будущим
орбитальным солнечным фермам.
В перспективе такие системы смогут обеспечивать энергией:
- целые города
- удалённые и труднодоступные регионы
Эксперты считают, что это может стать переломным моментом: космические технологии начинают помогать в борьбе с климатическими проблемами.
Пока это эксперимент, но главное доказано: идея работает.
Японские инженеры успешно провели тест:
солнечные панели в космосе собрали энергию и передали её на Землю по микроволновому каналу.
На наземной станции сигнал снова преобразовали в электричество и система заработала.
В отличие от наземных солнечных станций, космические панели работают:
- без облаков и погоды
- без ночи
- круглосуточно — 24/7
То есть это потенциально *стабильный источник чистой энергии*.
Этот тест ранний, но ключевой шаг к будущим
орбитальным солнечным фермам.
В перспективе такие системы смогут обеспечивать энергией:
- целые города
- удалённые и труднодоступные регионы
Эксперты считают, что это может стать переломным моментом: космические технологии начинают помогать в борьбе с климатическими проблемами.
Пока это эксперимент, но главное доказано: идея работает.
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 На BiliBili вышло видео: парень управляет роботом через motion-capture.
…и из-за лага робот возвращает команду ему прямо в …😬
— «Пацаны, откатите… ОТКАТИТЕ!» 🤖🔥
@ai_machinelearning_big_data
…и из-за лага робот возвращает команду ему прямо в …
— «Пацаны, откатите… ОТКАТИТЕ!» 🤖🔥
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Agentic AI Crash Course: бесплатный курс про автономных AI-агентов
Этот курс обучает не просто генерации текста, а созданию систем, которые понимают задачу, планируют шаги и выполняют действия.
Что внутри:
- как устроены AI-агенты и чем они отличаются от обычных LLM
- инструменты и функции, которыми агент управляет
- планирование и рассуждение
- память и контекст у агентов
- RAG и агентные архитектуры
- мульти-агентные системы
- практические кейсы и продакшн-паттерны
Кому подойдёт:
- разработчикам, которые хотят строить автономные AI-системы
- продактам и аналитикам, которым важно понимать архитектуру
- всем, кто хочет быстро въехать в agentic AI
Почему это полезно:
- агенты умеют принимать решения, звать API, собирать данные и автоматизировать сложные задачи
- курс дают бесплатно, хотя раньше он был платным
https://github.com/aishwaryanr/awesome-generative-ai-guide/tree/main/free_courses/agentic_ai_crash_course
Этот курс обучает не просто генерации текста, а созданию систем, которые понимают задачу, планируют шаги и выполняют действия.
Что внутри:
- как устроены AI-агенты и чем они отличаются от обычных LLM
- инструменты и функции, которыми агент управляет
- планирование и рассуждение
- память и контекст у агентов
- RAG и агентные архитектуры
- мульти-агентные системы
- практические кейсы и продакшн-паттерны
Кому подойдёт:
- разработчикам, которые хотят строить автономные AI-системы
- продактам и аналитикам, которым важно понимать архитектуру
- всем, кто хочет быстро въехать в agentic AI
Почему это полезно:
- агенты умеют принимать решения, звать API, собирать данные и автоматизировать сложные задачи
- курс дают бесплатно, хотя раньше он был платным
https://github.com/aishwaryanr/awesome-generative-ai-guide/tree/main/free_courses/agentic_ai_crash_course
👨🎓 Harvard выложил в открытый доступ учебник по ML-системам и это редкий случай, когда материал действительно полезный.
В учебнике показан полный цикл: от понимания основ до построения продакшн-систем, которые можно запускать в реальном мире.
Что в книге и почему она стоит внимания:
- вы самостоятельно собираете autograd, оптимизаторы, attention и мини-PyTorch — чтобы увидеть, как устроены фреймворки изнутри
- разбираетесь в базах: батчи, точность вычислений, архитектуры, процесс обучения
- учитесь оптимизировать производительность: работать с ускорителями, бенчмарками и эффективностью систем
То есть это не вводная книжка, а полноценный маршрут от теории к продакшну.
📚 Книгу и код можно читать бесплатно прямо сейчас.
📌Репозиторий: https://github.com/harvard-edge/cs249r_book
📌PDF: https://mlsysbook.ai/assets/downloads/Machine-Learning-Systems.pdf
В учебнике показан полный цикл: от понимания основ до построения продакшн-систем, которые можно запускать в реальном мире.
Что в книге и почему она стоит внимания:
- вы самостоятельно собираете autograd, оптимизаторы, attention и мини-PyTorch — чтобы увидеть, как устроены фреймворки изнутри
- разбираетесь в базах: батчи, точность вычислений, архитектуры, процесс обучения
- учитесь оптимизировать производительность: работать с ускорителями, бенчмарками и эффективностью систем
То есть это не вводная книжка, а полноценный маршрут от теории к продакшну.
📚 Книгу и код можно читать бесплатно прямо сейчас.
📌Репозиторий: https://github.com/harvard-edge/cs249r_book
📌PDF: https://mlsysbook.ai/assets/downloads/Machine-Learning-Systems.pdf
🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты?
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
Media is too big
VIEW IN TELEGRAM
🔥 Свежий Open-source от Tencent: HY-Motion 1.0
Это модель text-to-motion с миллиардом параметров, построенная на Diffusion Transformer + flow matching.
Она превращает обычное текстовое описание в реалистичные, плавные и разнообразные 3D-анимации персонажей. Подходит и разработчикам, и инди-создателям: готовые движения легко вставляются в стандартные пайплайны 3D-анимации. 🎮🎥
🔹 1B+ -модель хорошо следует инструкциям.
🔹 Полный цикл обучения - Pre-training → SFT → RL
🔹 200+ категорий движений в 6 больших классах - одна из самых широких библиотек.
Полезные ссылки:
🌐 Project page: https://hunyuan.tencent.com/motion
🔗 GitHub: https://github.com/Tencent-Hunyuan/HY-Motion-1.0
🤗 Hugging Face: https://huggingface.co/tencent/HY-Motion-1.0
📄 Technical report: https://arxiv.org/pdf/2512.23464
Это модель text-to-motion с миллиардом параметров, построенная на Diffusion Transformer + flow matching.
Она превращает обычное текстовое описание в реалистичные, плавные и разнообразные 3D-анимации персонажей. Подходит и разработчикам, и инди-создателям: готовые движения легко вставляются в стандартные пайплайны 3D-анимации. 🎮🎥
🔹 1B+ -модель хорошо следует инструкциям.
🔹 Полный цикл обучения - Pre-training → SFT → RL
🔹 200+ категорий движений в 6 больших классах - одна из самых широких библиотек.
Полезные ссылки:
🌐 Project page: https://hunyuan.tencent.com/motion
🔗 GitHub: https://github.com/Tencent-Hunyuan/HY-Motion-1.0
🤗 Hugging Face: https://huggingface.co/tencent/HY-Motion-1.0
📄 Technical report: https://arxiv.org/pdf/2512.23464
Modal Labs составили подробный глоссарий, чтобы решить проблему, с которой сами столкнулись при работе с графическими процессорами в сервисе Modal : документация фрагментирована и зачастую очень сложно сопоставить концепции на разных уровнях стека.
Modal Labs (бренд Modal) – компания, основанная в 2021 году, которая предоставляет высокопроизводительную серверную вычислительную платформу для разработчиков, работающих с данными, ИИ и машинным обучением.
Они прочитали PDF-документацию от NVIDIA, порылись в тематических Discord-сообществах и даже купили бумажные учебники, чтобы составить базу знаний, охватывающую весь стек в одном месте:
В руководстве все страницы связаны между собой, поэтому вы можете перейти к разделу о Warp Scheduler , чтобы лучше понять потоки, о которых вы читали в статье о модели программирования CUDA.
Сам проект открыт и доступен на Github.
@ai_machinelearning_big_data
#AI #ML #GPU #Glossary #Modal
Please open Telegram to view this post
VIEW IN TELEGRAM
🎬 Леонардо ДиКаприо: ИИ не заменит искусство, потому что ему не хватает человечности
Леонардо ДиКаприо поделился мнением о том, что искусственный интеллект может быть инструментом, но он не способен создать подлинное искусство.
Почему, по мнению актёра, ИИ не равен искусству:
- ИИ помогает показывать новые идеи и служить подсказкой для молодых режиссёров.
- Настоящее искусство рождается из человеческого опыта, эмоций и внутреннего «якоря».
- Даже яркие ИИ-проекты быстро становятся вирусными, но так же быстро исчезают, потому что в них нет глубины и автора.
ДиКаприо также отметил, что стремительное развитие ИИ может повлиять на работу творческих специалистов. Его позиция проста: технологии важны, но человек и его история остаются сердцем искусства.
https://variety.com/2025/film/news/leonardo-dicaprio-ai-lacks-humanity-cant-replace-art-1236603310/
Леонардо ДиКаприо поделился мнением о том, что искусственный интеллект может быть инструментом, но он не способен создать подлинное искусство.
Почему, по мнению актёра, ИИ не равен искусству:
- ИИ помогает показывать новые идеи и служить подсказкой для молодых режиссёров.
- Настоящее искусство рождается из человеческого опыта, эмоций и внутреннего «якоря».
- Даже яркие ИИ-проекты быстро становятся вирусными, но так же быстро исчезают, потому что в них нет глубины и автора.
ДиКаприо также отметил, что стремительное развитие ИИ может повлиять на работу творческих специалистов. Его позиция проста: технологии важны, но человек и его история остаются сердцем искусства.
https://variety.com/2025/film/news/leonardo-dicaprio-ai-lacks-humanity-cant-replace-art-1236603310/
🚀 Будущее разработки наступило тихо
Создатель Claude Code из Anthropic, Борис Черны, поделился цифрами, от которых становится немного не по себе:
❓ Главный вопрос:
*где будет наша профессия к концу 2027/28?*
— станем архитекторами и наставниками для ИИ;
— будем управлять пайплайнами и проверять качество;
— или «чистое кодинг-время» просто исчезнет?
Одно ясно: игра меняется — и выигрывать будут те, кто научится работать вместе с ИИ, а не против него.
Что думаешь - тревожно или это огромная возможность? 🤔
Создатель Claude Code из Anthropic, Борис Черны, поделился цифрами, от которых становится немного не по себе:
> «За последние 30 дней **100%** моих коммитов в Claude Code были написаны… Claude Code.
> 259 PR, 497 коммитов, +40k строк, −38k строк.
> Каждую строку написал ИИ (Claude Code + Opus 4.5).»
❓ Главный вопрос:
*где будет наша профессия к концу 2027/28?*
— станем архитекторами и наставниками для ИИ;
— будем управлять пайплайнами и проверять качество;
— или «чистое кодинг-время» просто исчезнет?
Одно ясно: игра меняется — и выигрывать будут те, кто научится работать вместе с ИИ, а не против него.
Что думаешь - тревожно или это огромная возможность? 🤔
This media is not supported in your browser
VIEW IN TELEGRAM
На «радиостанции Судного дня» внезапно зазвучало «Лебединое озеро» 🎶
UVB-76 - её же называют «Гудок»- та самая загадочная коротковолновая станция, которая вещает с 1970-х.
Она передаёт однообразный сигнал, время от времени странные фразы.
Официального назначения унее нет. Заговорщики спорят десятилетиями.
И вот - новая «пасхалка»:
в эфире вдруг прозвучало «Лебединое озеро».
Что это было?
⚡ кодовый сигнал,
🎭 чья-то шутка оператора,
🛰 или просто тест трансляции?
Никто не признаётся — а значит, загадка живёт дальше.
UVB-76 - её же называют «Гудок»- та самая загадочная коротковолновая станция, которая вещает с 1970-х.
Она передаёт однообразный сигнал, время от времени странные фразы.
Официального назначения унее нет. Заговорщики спорят десятилетиями.
И вот - новая «пасхалка»:
в эфире вдруг прозвучало «Лебединое озеро».
Что это было?
⚡ кодовый сигнал,
🎭 чья-то шутка оператора,
🛰 или просто тест трансляции?
Никто не признаётся — а значит, загадка живёт дальше.
💰 Forbes назвал самых молодых миллиардеров в мире и это основатели AI-платформы
Трое 22-летних американцев - Adarsh Hiremath, Brendan Foody и Surya Midhi: попали в список Forbes как самые молодые миллиардеры.
Они создали Mercor платформу, где разработчики и компании используют ИИ для автоматизации написания и проверки кода.
Цифры впечатляют:
💵 состояние каждого: $2,2 млрд
🏢 оценка компании частными инвесторами около $10 млрд
AI-рынок не просто растёт, он создаёт новое поколение технологических миллиардеров.
https://www.forbes.com/profile/adarsh-hiremath/
Трое 22-летних американцев - Adarsh Hiremath, Brendan Foody и Surya Midhi: попали в список Forbes как самые молодые миллиардеры.
Они создали Mercor платформу, где разработчики и компании используют ИИ для автоматизации написания и проверки кода.
Цифры впечатляют:
💵 состояние каждого: $2,2 млрд
🏢 оценка компании частными инвесторами около $10 млрд
AI-рынок не просто растёт, он создаёт новое поколение технологических миллиардеров.
https://www.forbes.com/profile/adarsh-hiremath/
Нейросети добрались до палеолита: LLM, которую можно запустить на процессоре из 1976 года 😮
Пока OpenAI оставляют нас без доступных видеокарт и оперативки, энтузиаст доказал, что для этих ваших ИИ достаточно и 4 МГц😂
Он создал языковую модель, которая умудряется работать на легендарном 8-битном чипе Z80 (да-да, том самом, что стоял в ZX Spectrum).
Как это вообще возможно:
— Экстремальное сжатие: веса модели квантованы до 2 бит (значения только -2, -1, 0, +1);
— Никаких чисел c плавающей точкой. Вся математика переписана на целочисленную, понятную старому процессору;
— Весь «мозг» вместе с чат-интерфейсом весит смешные 40 КБ и запускается из-под CP/M.
Работает схема так: тренируете модель с комфортом на Python, экспортируете .COM файл, заливаете на ретро-ПК и наслаждаетесь беседой с зеленым экраном. Тест Тьюринга врядли пройдет, но для вау-эффекта этого более чем достаточно😂
Сдуваем пыль со своих железок😁
Пока OpenAI оставляют нас без доступных видеокарт и оперативки, энтузиаст доказал, что для этих ваших ИИ достаточно и 4 МГц
Он создал языковую модель, которая умудряется работать на легендарном 8-битном чипе Z80 (да-да, том самом, что стоял в ZX Spectrum).
Как это вообще возможно:
— Экстремальное сжатие: веса модели квантованы до 2 бит (значения только -2, -1, 0, +1);
— Никаких чисел c плавающей точкой. Вся математика переписана на целочисленную, понятную старому процессору;
— Весь «мозг» вместе с чат-интерфейсом весит смешные 40 КБ и запускается из-под CP/M.
Работает схема так: тренируете модель с комфортом на Python, экспортируете .COM файл, заливаете на ретро-ПК и наслаждаетесь беседой с зеленым экраном. Тест Тьюринга врядли пройдет, но для вау-эффекта этого более чем достаточно
Сдуваем пыль со своих железок
Please open Telegram to view this post
VIEW IN TELEGRAM