Machinelearning

🌟

Nemotron-Terminal: небольшое семейство для терминальных задач.

NVIDIA обучила семейство моделей Nemotron-Terminal для автономной работы в терминале Linux: устанавливать зависимости, писать и запускать код, отлаживать окружения и выполнять сквозные инженерные задачи без участия человека.

Семейство построено на базе Qwen3 и специально собранном датасете Terminal-Corpus. И фишка не в архитектуре, а в данных.

🟡

NVIDIA собрала пайплайн Terminal-Task-Gen с 2 потоками.

Первый адаптирует готовые датасеты по математике, коду и SWE-задачам под терминальный формат (без участия LLM в процессе адаптации).

Второй генерирует синтетику 2 методами: seed-based (LLM создает новые задачи на основе существующих задач из смежных областей) и skill-based (LLM комбинирует до пяти примитивных навыков из таксономии по 9 доменам: Security, Data Science, System Administration и другим).

🟡

В открытый релиз вошли все три модели на 8B, 14B, 32B параметров и 2 датасета:

Terminal-Corpus: около 366K траекторий выполнения задач, разбитых на два потока: ~226K адаптированных примеров из Math/Code/SWE и ~140K синтетических задач на основе skill-таксономии.

Synthetic-Tasks: задачи в стандартизированном формате: инструкция, Docker-окружение из 9 преднастроенных образов и верификационный набор на pytest.

🟡

Результаты прогонов на бенчах.

На Terminal-Bench 2.0 все 3 модели показали кратный рост относительно базовой Qwen3: 8B - с 2.5% до 13%, 14B - с 4% до 20.2%, 32B - с 3.4% до 27.4%.

Для сравнения: Qwen3-Coder на 480B параметров набирает 23.9%, GPT-5-Mini - 24.0%, Grok 4 - 23.1%. Nemotron-Terminal-32B превосходит или вплотную конкурирует с ними всеми при разнице в размере на порядок.

🟡

Несколько внезапных выводов из абляции.

Фильтрация неудачных траекторий вредит. Модель, обученная на всех траекториях включая ошибочные, набирает 12.4% против 5.06% у варианта только с успешными.

Curriculum learning (сначала простые данные, потом сложные) не дал преимуществ перед простым смешанным обучением.

Увеличение контекстного окна с 32K до 65K токенов также не помогло, длинные траектории оказались шумнее.

📌Лицензирование моделей: NVIDIA Open Model License

📌Лицензирование датасетов : CC-BY-4.0 License.

🟡

Набор моделей

🟡

Arxiv

@ai_machinelearning_big_data

#AI #ML #LLM #NemotronTerminal #NVIDIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

3👍74👨‍💻37❤16🎉8🔥6👏5🤩3🤔1

22.1K views09:10

Machinelearning

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

ByteDance перезапустила DeerFlow.

DeerFlow 2.0 - проект, переписанный с нуля, который не имеет ничего общего с первой версией. Там был фреймворк для глубокого ресерча, а здесь полноценный рантайм для агентов.

🟡

В основе лежит связка LangGraph и LangChain.

Главный агент получает задачу, разбивает ее на подзадачи и порождает суб-агентов на лету. Каждый из них работает в изолированном контексте: не видит данные других агентов и главного процесса.

Суб-агенты запускаются параллельно, когда это возможно, и возвращают структурированные результаты, а главный агент собирает из них финальный вывод.

Сессия живет в изолированном Docker-контейнере с полноценной файловой системой, главный агент и суб-агенты работают в ней совместно.

Агент читает и пишет файлы, выполняет bash-команды, работает с изображениями. Между сессиями нет никакой взаимной путаницы.

🟡

Навыки и инструменты

Возможности агента определяются через Skills. Из коробки есть исследование, генерация отчетов, создание слайдов, веб-страниц, изображений и видео. Навыки загружаются по мере необходимости, только когда задача их требует. Это снижает нагрузку на контекстное окно и позволяет работать с моделями, чувствительными к расходу токенов.

Инструменты - по той же логике: базовый набор (веб-поиск, fetch, работа с файлами, bash), плюс поддержка MCP-серверов и произвольных Python-функций. Все можно заменить или расширить.

🟡

Память и контекст

DeerFlow помнит пользователя между сессиями. Накапливается профиль: стиль письма, технический стек, повторяющиеся сценарии. Данные хранятся локально.

Внутри длинной сессии система сама управляет контекстом: завершенные подзадачи суммируются, промежуточные результаты уходят на диск. Контекстное окно не раздувается.

🟡

Интеграции

Поддерживаются Telegram, Slack и Feishu. Из Claude Code можно взаимодействовать с запущенным инстансом DeerFlow напрямую через специальный skill: отправлять задачи, управлять тредами и выбирать режим выполнения.

🟡

Модели и деплой

Система работает с любой моделью через OpenAI API, включая локальные через Ollama. ByteDance рекомендует использовать модели, которые поддерживают длинный контекст (100k+ токенов), ризонинг, мультимодальность и надежный tool-use.

DeerFlow также встраивается как Python-библиотека без запуска HTTP-сервисов:

from src.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("Analyze this paper", thread_id="my-thread")

📌Лицензирование: MIT License.

🟡

Demo

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #Agents #DeerFlow #ByteDance

Please open Telegram to view this post

VIEW IN TELEGRAM

❤54👏24👍19🔥17🤔8🎉1👌1

21K views15:02

✔️

Сэм Альтман: падение популярности ИИ - главная угроза технологического лидерства США.

Выступая на саммите BlackRock, глава OpenAI отметил резкое снижение доверия к ИИ среди американцев. По данным опросов, больше половины граждан считают, что риски от внедрения ИИ превышают пользу. Основные причины такого негатива: рост цен на электроэнергию из-за дата-центров и массовые сокращения. Ситуацию усугубляют дискуссии о границах влияния бигтеха и государства.

Альтман предупредил, что растущее сопротивление становится фактором в гонке технологий. Хотя США пока опережают Китай, замедление темпов внедрения ИИ может стоить стране статуса лидера. Американскому бизнесу, научному сообществу и правительству необходимо форсировать интеграцию ИИ. Если действовать быстро, уверен Альтман, ИИ даст уникальный шанс для мощного экономического рывка и переосмысления социальных институтов.
businessinsider.com

✔️

В Китае начали разработку стандартов для автономных ИИ-агентов.

Китайская академия информационных технологий начала создание нормативной базы для Claw-агентов. Поводом стал взрывной рост популярности проекта OpenClaw. Регламент должен решить проблемы безопасности и сделать работу автономных систем предсказуемой. В документе будут прописаны жесткие требования к качеству кода, прозрачности выполнения процессов, распределению пользовательских привилегий и минимизации рисков.

Академия уже открыла проект для обсуждения с экспертами отрасли, а к концу марта планирует запустить тестирование продуктов класса Claw на соответствие новым стандартам. Результаты проверок будут публично представлены на профильной конференции.
cls.cn

✔️

Илон Маск представил ИИ-систему, способную эмулировать работу IT-компаний.

Проект Macrohard, также известный как Digital Optimus, объединяет стек технологий Tesla и xAI. В основе архитектуры лежит языковая модель Grok в роли высокоуровневого навигатора. Она работает в тандеме с ИИ-агентом Tesla, который в реальном времени анализирует видео с экрана компьютера и напрямую управляет клавиатурой и мышью.

По задумке Маска, система сможет автоматизировать процессы разработки ПО до такой степени, чтобы полностью имитировать функции IT-корпораций. Само название Macrohard является прямой ироничной отсылкой к Microsoft.

Проект будет использовать проприетарные процессоры Tesla AI4 в связке с мощностями xAI на базе ускорителей Nvidia. Заявка на регистрацию одноименного товарного знака уже находится на рассмотрении в патентном ведомстве США.
reuters.com

✔️

Microsoft анонсировала Copilot Health.

Новый сервис работает как изолированное пространство внутри экосистемы Copilot. Его задача - агрегировать информацию о здоровье пользователя в единый профиль. Copilot Health интегрируется с более чем 50 гаджетами и напрямую подтягивает электронные медкарты из клиник США и результаты лабораторных исследований.

ИИ обрабатывает этот массив данных, чтобы находить скрытые паттерны и выдавать персонализированные рекомендации. Все ответы базируются на клинических базах и сопровождаются ссылками на верифицированные источники.

Copilot Health физически и логически отделен от основного чат-бота, зашифрован. Платформа сертифицирована по стандарту ISO/IEC 42001. На данный момент открыта запись в лист ожидания.
microsoft.ai

✔️

Claude AI теперь генерирует интерактивные визуализации прямо в диалоге.

Anthropic обновила свой чат-бот: теперь Claude умеет создавать кастомные графики, диаграммы и схемы прямо внутри переписки. Он сам анализирует контекст и, если визуализация помогает лучше раскрыть ответ, встраивает ее в ленту сообщений. Запросить нужную таблицу или даграмму можно и напрямую, причем сгенерированные элементы поддерживают интерактивность.

Новой функция отличается Artifacts. Артефакты открываются в отдельной боковой панели и сохраняются там постоянно. Встроенные же визуализации меняются или вовсе исчезают по мере развития диалога, подстраиваясь под текущую задачу. Обновление уже доступно всем пользователям и включено по умолчанию.
support.claude.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤67🤔57👍20👏19😐12😁11🔥8👌6❤‍🔥2

18.7K views05:28

Machinelearning

Соберите Telegram-бота на базе ИИ за 1 час 💻

В России чаще можно пообщаться в чате с ИИ, чем с живым менеджером. Однако не все чат-боты хорошо распознают текст с картинки: клиенту неудобно перенабирать его вручную, поэтому пока он чаще просит позвать живого оператора.

В сервисе MWS GPT можно создать бота для Telegram, который распознает текст с изображений. 17 марта соберём такого бота в прямом эфире — от первого запроса до рабочего прототипа.

🎁 Бонус: все участники получат готовый код бота.

С вебинара вы уйдёте с готовым решением, которое сможете легко внедрить в клиентский сервис.

Кому будет полезно:

⚫️руководителям и владельцам бизнеса,
⚫️менеджерам,
⚫️ИТ-специалистам,
⚫️всем, кто хочет ускорить бизнес-процессы.

Когда: 17 марта, 11:00
Спикер: Павел Бабин, CPO MWS GPT

➡️

Регистрируйтесь по ссылке

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣64🤩41👍20👏14❤7😁7👌7🤗2🥰1🐳1

17K views10:26

Machinelearning

🌟

OpenJarvis: фреймворк все-в-одном для ИИ-агентов

Stanford SAIL замерили, насколько эффективно локальные языковые модели конвертируют электроэнергию в полезные вычисления и назвали этот показатель "intelligence per watt".

Они прогнали больше миллиона реальных запросов через 20+ моделей на 8 разных ускорителях и выяснили: с 2023 по 2025 год эффективность локального инференса выросла в 5,3 раза, а современные небольшие модели уже справляются с 88,7% обычных чат- и ризонинг-запросов. Железо и алгоритмы готовы, но не хватало софта.

Так появился OpenJarvis: открытый фреймворк, который превращает эти выводы в инфраструктуру для персональных ИИ-агентов, работающих на устройстве пользователя.

Авторы проводят параллель с PyTorch: OpenJarvis должен стать для локального ИИ тем, чем PyTorch стал для глубокого обучения - стандартной инфраструктурой, на которой строится все остальное.

Фреймворк структурирован вокруг 5 примитивов:

🟢Intelligence - слой языковых моделей с единым каталогом, где не нужно самому отслеживать релизы и считать память.

🟢Engine - бэкенд инференса: Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models и другие. Openjarvis сам определяет железо и рекомендует конфигурацию.

🟢Agents - слой поведения: роли оркестратора и исполнителя рутинных сценариев, адаптированные под ограниченный контекст и память на устройстве.

🟢Tools & Memory - интеграции через MCP и Google A2A, семантическая индексация локальных документов, подключение к iMessage, Telegram и т.д.

🟢Learning - механизм адаптации: локальные трейсы превращаются в обучающие данные через SFT, LoRA и GRPO. Система сама упаковывает этот процесс в рабочий флоу.

Отдельная фишка - подход к эффективности. OpenJarvis профилирует энергопотребление на NVIDIA, AMD и Apple Silicon с интервалом 50 мс.

Использовать можно через CLI, браузерный дашборд или десктопное приложение для macOS, Linux и Windows.

⚠️ Для полного функционала (безопасность, инструменты, агенты) потребуется Rust.

Помимо самого проекта, команда запустила конкурс-лидерборд экономии денег, энегрии и компьюта, в котором принять участие может любой желающий. В качестве приза самому экономному обещают Mac Mini.

📌Лицензирование: Apache 2.0 License.

🟡

Статья

🟡

Документация

🟡

Сообщество в Discord

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #Framework #OpenJarvis #Stanford

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤49🤓40👍16🎉12👏6🔥4🤣4😍2🤨2🤷‍♂1💘1

19.8K views11:35

✔️

Anthropic расширила контекстное окно до миллион токенов.

Claude Opus 4.6 и Sonnet 4.6 получили поддержку контекстного окна объемом в 1 миллион без наценок за объем. Обработка длинных запросов тарифицируется по стандартной ставке, а лимиты пропускной способности API остаются прежними на всей длине контекста.

Дополнительно лимит файлов в одном запросе увеличен в 6 раз: теперь Claude может за раз проанализировать до 600 изображений или страниц PDF. Обновление доступно в API Claude, а пользователи Claude Code на тарифах Max, Team и Enterprise при вызове Opus 4.6 по умолчанию будут автоматически использовать контекст 1M.
claude.com

✔️

Microsoft начинает масштабную ИИ-экспансию в Африке.

Корпорация запускает инициативу Microsoft Elevate, в рамках которой планирует до конца года бесплатно обучить ИИ-технологиям 3 млн. человек.

Цель программы - сдержать экспансию китайских ИИ-продуктов на самом молодом и быстрорастущем рынке мира. По внутренним оценкам Microsoft, DeepSeek уже занимает от 11% до 14% локального рынка чат-ботов, а в Эфиопии и Зимбабве его доля достигает 20% из-за активных вложений Пекина в цифровую инфраструктуру.

Чтобы вернуть инициативу, Microsoft делает ставку на развитие собственных вычислительных мощностей. До конца 2027 года компания инвестирует $330 млн. в расширение облачной и ИИ-инфраструктуры в ЮАР, а в Кении готовится строительство дата-центра, который будет полностью работать на геотермальной энергии. Ключевыми регионами для технологий и подготовки разработчиков также станут Нигерия и Марокко.
bloomberg.com

✔️

Илон Маск уволил еще 2-х сооснователей xAI.

В xAI прошла новая волна увольнений, вызванная недовольством CEO слабыми результатами. Компанию покинули еще 2 сооснователя: Цзыхан Дай и глава команды Imagine Годун Чжан, которого Маск обвинил в технических недоработках продукта. Таким образом, из 12 учредителей, запускавших xAI, в штате осталось всего 2 человека.

Кадровые чистки серьезно бьют по моральному духу команды. Источники сообщают, что инженеры массово уходят из-за выгорания, спровоцированного экстремально жесткими требованиями Маска к рабочему графику.

Пытаясь спасти проблемное направление и усилить экспертизу в разработке, xAI в конце недели переманила в свой штат Эндрю Милича и Джейсона Гинзберга из Cursor.
ft.com

✔️

Google представила крупнейшее обновление Maps.

Главным визуальным нововведением стал режим «Иммерсивной навигации». ИИ анализирует панорамы Street View и генерирует реалистичный маршрут с детализированными 3D-моделями зданий, точной разметкой полос и отображением светофоров.

Также сервис получил функцию Ask Maps на базе Gemini. Вместо поиска по ключевым словам теперь запросы на естественном языке - ИИ сопоставляет геоданные с личными предпочтениями, формирует персонализированные рекомендации и позволяет бронировать места в один клик.

Апдейт поэтапно развертывается в США. Вскоре новые инструменты появятся на платформах iOS и Android, а также в интерфейсах CarPlay и Android Auto.
blog.google

✔️

Amazon добавила в Alexa+ взрослый режим общения.

Голосовой ассистент получил новую опцию кастомизации - профиль Sassy для взрослой аудитории. Для его активации необходимо пройти дополнительную биометрическую аутентификацию. При работе профиля функция Amazon Kids автоматически блокируется.

В режиме Sassy ассистент выдает саркастичные ответы, жесткие шутки и использует мат, но на этом "взрослость" заканчивается: ИИ по-прежнему отказывается генерировать NSFW-контент, разжигать ненависть, переходить на личности или консультировать по незаконным действиям.

Взрослый режим стал частью крупной переработки Alexa+ (в прошлом месяце вышли стили Brief, Chill и Sweet).
techcrunch.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤92👀35🔥13🎉10🤔9👍6🥰4😁3🗿1

13.6K views07:16

About

Blog

Apps

Platform