В Claude поменяли триггер для динамических workflow. Теперь вместо "
Фраза вроде "
Если нужен гарантированный запуск, просто напишите "
Похоже, это сделали после жалоб пользователей на ложные срабатывания.🏁
workflow" нужно писать "ultracode".Фраза вроде "
use a workflow for this" всё ещё работает, но если Claude поймёт, что речь не про динамический workflow, он не станет запускать его автоматически.Если нужен гарантированный запуск, просто напишите "
ultracode".Похоже, это сделали после жалоб пользователей на ложные срабатывания.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Google выпустила новую Gemma 4 12B с заявкой на производительность уровня моделей класса 26B.
Ребята протестировали обе локально.
Обе модели запускались на одной RTX 4090 и получили одинаковое задание: написать самодостаточную HTML5 Canvas-анимацию с реальной физикой в одном файле, без сторонних библиотек. Сцены:
• доска Гальтона
• столкновение двух блоков с отскоком от стены
• хаотический тройной маятник
Результаты:
Gemma 4 26B-A4B
• 15 ГБ VRAM
• 6.9 тыс. токенов
• 138 токенов/с
Gemma 4 12B
• 9 ГБ VRAM
• 8.9 тыс. токенов
• 80 токенов/с
Несмотря на принадлежность к одному семейству Gemma 4, модель 26B-A4B выиграла во всех трёх сценах и работала примерно в 1.7 раза быстрее, используя всего 4 млрд активных параметров.
При этом 12B отстала совсем ненамного, потребляя почти вдвое меньше видеопамяти. Для ноутбуков с 16 ГБ VRAM это делает её одним из самых интересных вариантов для локального запуска.
GGUF: здесь
Guide: здесь
Ребята протестировали обе локально.
Обе модели запускались на одной RTX 4090 и получили одинаковое задание: написать самодостаточную HTML5 Canvas-анимацию с реальной физикой в одном файле, без сторонних библиотек. Сцены:
• доска Гальтона
• столкновение двух блоков с отскоком от стены
• хаотический тройной маятник
Результаты:
Gemma 4 26B-A4B
• 15 ГБ VRAM
• 6.9 тыс. токенов
• 138 токенов/с
Gemma 4 12B
• 9 ГБ VRAM
• 8.9 тыс. токенов
• 80 токенов/с
Несмотря на принадлежность к одному семейству Gemma 4, модель 26B-A4B выиграла во всех трёх сценах и работала примерно в 1.7 раза быстрее, используя всего 4 млрд активных параметров.
При этом 12B отстала совсем ненамного, потребляя почти вдвое меньше видеопамяти. Для ноутбуков с 16 ГБ VRAM это делает её одним из самых интересных вариантов для локального запуска.
GGUF: здесь
Guide: здесь
4
Microsoft запустила собственную ИИ-модель
Microsoft разработала её самостоятельно. Называется она MAI-Code-1-Flash, и её разворачивают для всех тарифов Copilot. (на бесплатном тоже)
Новая линейка моделей MAI включает:
• MAI-Code-1-Flash — для программирования
• MAI-Thinking-1 — reasoning-модель на 35 млрд параметров
• MAI-Image-2.5 — генерация изображений
• MAI-Transcribe-1.5 — распознавание речи на 43 языках
Что заявляет Microsoft:
• модель обучалась прямо в продакшн-среде Copilot, а не отдельно от продукта
• на сложных задачах использует на 60% меньше токенов по сравнению с сопоставимыми моделями
• набирает 85.8% на внутреннем adversarial coding benchmark Microsoft
• контекстное окно — 256K токенов
Если Copilot уже подключён, можно сразу переходить к выбору модели.
полный анонс😴
Microsoft разработала её самостоятельно. Называется она MAI-Code-1-Flash, и её разворачивают для всех тарифов Copilot. (на бесплатном тоже)
Новая линейка моделей MAI включает:
• MAI-Code-1-Flash — для программирования
• MAI-Thinking-1 — reasoning-модель на 35 млрд параметров
• MAI-Image-2.5 — генерация изображений
• MAI-Transcribe-1.5 — распознавание речи на 43 языках
Что заявляет Microsoft:
• модель обучалась прямо в продакшн-среде Copilot, а не отдельно от продукта
• на сложных задачах использует на 60% меньше токенов по сравнению с сопоставимыми моделями
• набирает 85.8% на внутреннем adversarial coding benchmark Microsoft
• контекстное окно — 256K токенов
Если Copilot уже подключён, можно сразу переходить к выбору модели.
полный анонс
Please open Telegram to view this post
VIEW IN TELEGRAM
Плюсом: Microsoft представила официальный клиент для OpenClaw. 🤙
Теперь агент может управлять системой через отдельное приложение:
✓ встроенные разрешения
✓ полный контроль через системный трей
✓ безопасный запуск по умолчанию в контейнерах
Под капотом используется новая технология Microsoft Execution Containers (MXC), которую Microsoft продвигает как основу для более безопасных AI-агентов на Windows.
открытый исходный код
Теперь агент может управлять системой через отдельное приложение:
✓ встроенные разрешения
✓ полный контроль через системный трей
✓ безопасный запуск по умолчанию в контейнерах
Под капотом используется новая технология Microsoft Execution Containers (MXC), которую Microsoft продвигает как основу для более безопасных AI-агентов на Windows.
открытый исходный код
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё: Microsoft представила Scout. 🫢
Это агент, который работает в фоне и сам двигает задачи вперёд, без постоянных промптов и ручных команд.
Scout стал первым агентом Microsoft с режимом Autopilot.
Он умеет работать между Teams, Outlook, OneDrive и другими сервисами Microsoft, выполняя действия в рамках политик и прав доступа, настроенных вашей организацией.
Это агент, который работает в фоне и сам двигает задачи вперёд, без постоянных промптов и ручных команд.
Scout стал первым агентом Microsoft с режимом Autopilot.
Он умеет работать между Teams, Outlook, OneDrive и другими сервисами Microsoft, выполняя действия в рамках политик и прав доступа, настроенных вашей организацией.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT получил крупное обновление памяти.
Теперь он сам пытается отслеживать важные детали, а не только то, что вы вручную сохранили в память.
Сказали, что едете в отпуск в июле? ChatGPT должен понимать разницу между:
• поездка скоро начнётся
• поездка уже идёт
• поездка давно закончилась
Также появилась сводка памяти, где можно посмотреть, что именно модель о вас помнит, и при желании это подправить.
Если новый подход не нравится, старый режим Saved Memories никуда не делся. Его можно вернуть в настройках.
Бонусом OpenAI удвоила объём памяти.
Пока раскатка идёт только для Plus и Pro в США, но обещают постепенно открыть доступ для остальных стран и тарифов. Обновление приложения на iOS и Android обязательно.🤩
Теперь он сам пытается отслеживать важные детали, а не только то, что вы вручную сохранили в память.
Сказали, что едете в отпуск в июле? ChatGPT должен понимать разницу между:
• поездка скоро начнётся
• поездка уже идёт
• поездка давно закончилась
Также появилась сводка памяти, где можно посмотреть, что именно модель о вас помнит, и при желании это подправить.
Если новый подход не нравится, старый режим Saved Memories никуда не делся. Его можно вернуть в настройках.
Бонусом OpenAI удвоила объём памяти.
Пока раскатка идёт только для Plus и Pro в США, но обещают постепенно открыть доступ для остальных стран и тарифов. Обновление приложения на iOS и Android обязательно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Небольшой трюк для пользователей Codex.
Для работы Codex на телефоне не обязательно запускать полноценное приложение Codex на удалённой машине.
Достаточно выполнить:
После этого компьютер появится в мобильном приложении Codex как удалённое окружение, которым можно управлять прямо со смартфона.
Удобно для случаев, когда нужно быстро проверить задачу, посмотреть прогресс агента или продолжить работу вдали от компьютера, не поднимая полный стек Codex на сервере.
🤔 🤔 🤔
Для работы Codex на телефоне не обязательно запускать полноценное приложение Codex на удалённой машине.
Достаточно выполнить:
codex remote-control
После этого компьютер появится в мобильном приложении Codex как удалённое окружение, которым можно управлять прямо со смартфона.
Удобно для случаев, когда нужно быстро проверить задачу, посмотреть прогресс агента или продолжить работу вдали от компьютера, не поднимая полный стек Codex на сервере.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Инсайд по Anthropic: компания готовится к публичному запуску новой версии Mythos
Вчера один из чекпоинтов модели под кодовым названием Oceanus выдали участникам программы red teaming.
По информации источников, такие тесты обычно стартуют примерно за неделю до более широкого релиза. Если это правило сработает и здесь, анонс может состояться совсем скоро.
Но есть нюанс.
Программу уже приостановили. По данным scaling01, один из участников якобы перепродавал доступ к модели через китайский API-прокси.😐
Пока непонятно, повлияет ли этот инцидент на сроки запуска. Anthropic публично ситуацию не комментировала.
Если информация подтвердится, то появление Oceanus выглядит как первый сигнал того, что следующее поколение Mythos уже находится на финальной стадии проверки перед релизом.🏁
Вчера один из чекпоинтов модели под кодовым названием Oceanus выдали участникам программы red teaming.
По информации источников, такие тесты обычно стартуют примерно за неделю до более широкого релиза. Если это правило сработает и здесь, анонс может состояться совсем скоро.
Но есть нюанс.
Программу уже приостановили. По данным scaling01, один из участников якобы перепродавал доступ к модели через китайский API-прокси.
Пока непонятно, повлияет ли этот инцидент на сроки запуска. Anthropic публично ситуацию не комментировала.
Если информация подтвердится, то появление Oceanus выглядит как первый сигнал того, что следующее поколение Mythos уже находится на финальной стадии проверки перед релизом.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Grok Build стал доступен всем пользователям SuperGrok и X Premium+.
Это агентная среда разработки от xAI с Plan Mode, генерацией изображений и видео через Imagine, а также CLI для создания автоматизаций, агентов и оркестраторов.
Одновременно xAI открыла API-доступ к
Это та же модель, которая лежит в основе Grok Build CLI и заточена под агентное программирование.
Цена:
• $1 за миллион входных токенов
• $2 за миллион выходных токенов
А теперь в Grok Build появилась ещё и новая модель — Composer 2.5.
По словам xAI, она отлично справляется с длительными задачами, сложными инструкциями и многошаговыми рабочими процессами.
Это агентная среда разработки от xAI с Plan Mode, генерацией изображений и видео через Imagine, а также CLI для создания автоматизаций, агентов и оркестраторов.
Одновременно xAI открыла API-доступ к
grok-build-0.1 в публичной бете.Это та же модель, которая лежит в основе Grok Build CLI и заточена под агентное программирование.
Цена:
• $1 за миллион входных токенов
• $2 за миллион выходных токенов
А теперь в Grok Build появилась ещё и новая модель — Composer 2.5.
По словам xAI, она отлично справляется с длительными задачами, сложными инструкциями и многошаговыми рабочими процессами.
This media is not supported in your browser
VIEW IN TELEGRAM
Нашёл расширение NotebookLM Web Importer. 👔
Кликаешь по статье, YouTube-видео, плейлисту или RSS-ленте и оно сразу улетает в NotebookLM.
Ещё имеет массовый импорт нескольких источников сразу.
Есть бесплатный и платный тарифы.
Бесплатный тариф даёт 20 импортов в день, и для большинства этого более чем достаточно.
Кликаешь по статье, YouTube-видео, плейлисту или RSS-ленте и оно сразу улетает в NotebookLM.
Ещё имеет массовый импорт нескольких источников сразу.
Есть бесплатный и платный тарифы.
Бесплатный тариф даёт 20 импортов в день, и для большинства этого более чем достаточно.
Please open Telegram to view this post
VIEW IN TELEGRAM
NVIDIA выкатила Nemotron 3 Ultra.
550B MoE-модель с открытыми весами, заточенная под долгоживущих агентов.
По заявлениям NVIDIA:
• инференс до 5 раз быстрее
• до 30% дешевле на сложных агентных задачах
• сильнее в программировании, deep research и долгосрочном планировании
Главный фокус не на чатах, а на агентных сценариях, где модель часами планирует действия, вызывает инструменты, обрабатывает ошибки и принимает решения по следующим шагам.
Использует гибридную архитектуру Mamba + Transformer MoE, которая позволяет выполнять больше циклов рассуждений за то же время.
Из интересного:
• может работать с большими кодовыми базами
• держит длинные цепочки tool calls
• умеет собирать и синтезировать данные из сотен источников
• дообучалась под OpenClaw, Hermes Agent и LangChain
NVIDIA также открыла не только веса модели, но и синтетические датасеты вместе с рецептами постобучения.
И сразу приятный бонус.
Nous Research присоединилась к коалиции Nemotron и вместе с NVIDIA и Nebius открыла бесплатный доступ к Nemotron 3 Ultra через Nous Portal на две недели.
Для тех, кто хочет запускать модель локально, уже появились GGUF-квантизации от Unsloth
GGUF: тут
Guide: тут
😊 😊 😊
550B MoE-модель с открытыми весами, заточенная под долгоживущих агентов.
По заявлениям NVIDIA:
• инференс до 5 раз быстрее
• до 30% дешевле на сложных агентных задачах
• сильнее в программировании, deep research и долгосрочном планировании
Главный фокус не на чатах, а на агентных сценариях, где модель часами планирует действия, вызывает инструменты, обрабатывает ошибки и принимает решения по следующим шагам.
Использует гибридную архитектуру Mamba + Transformer MoE, которая позволяет выполнять больше циклов рассуждений за то же время.
Из интересного:
• может работать с большими кодовыми базами
• держит длинные цепочки tool calls
• умеет собирать и синтезировать данные из сотен источников
• дообучалась под OpenClaw, Hermes Agent и LangChain
NVIDIA также открыла не только веса модели, но и синтетические датасеты вместе с рецептами постобучения.
И сразу приятный бонус.
Nous Research присоединилась к коалиции Nemotron и вместе с NVIDIA и Nebius открыла бесплатный доступ к Nemotron 3 Ultra через Nous Portal на две недели.
Для тех, кто хочет запускать модель локально, уже появились GGUF-квантизации от Unsloth
GGUF: тут
Guide: тут
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Бесплатный учебник по Agentic AI: скачать
Разбирает основы ИИ-агентов (планирование, память, использование инструментов, принятие решений и выполнение многошаговых задач.)
Подойдёт тем, кто хочет понять, как работают современные агенты и чем они отличаются от обычных LLM.
UPD: версия на русском (спасибо @pavel_pogodin)
Разбирает основы ИИ-агентов (планирование, память, использование инструментов, принятие решений и выполнение многошаговых задач.)
Подойдёт тем, кто хочет понять, как работают современные агенты и чем они отличаются от обычных LLM.
UPD: версия на русском (спасибо @pavel_pogodin)
11
Для Codex вышел официальный плагин MagicPath
Теперь очень просто дать агенту бесконечный многопользовательский канвас, где он может вместе с вами проектировать интерфейсы, создавать их и дорабатывать.
Он может импортировать UI из вашего репозитория в MagicPath, понимать используемые компоненты и дизайн-систему, а затем воссоздавать всё это в виде редактируемого интерактивного интерфейса на канвасе.
Для лучшего рабочего процесса откройте MagicPath в браузере Codex, войдите в аккаунт и откройте свой проект. Codex обнаружит его автоматически, либо вы можете просто указать название проекта.😊
Теперь очень просто дать агенту бесконечный многопользовательский канвас, где он может вместе с вами проектировать интерфейсы, создавать их и дорабатывать.
Он может импортировать UI из вашего репозитория в MagicPath, понимать используемые компоненты и дизайн-систему, а затем воссоздавать всё это в виде редактируемого интерактивного интерфейса на канвасе.
Для лучшего рабочего процесса откройте MagicPath в браузере Codex, войдите в аккаунт и откройте свой проект. Codex обнаружит его автоматически, либо вы можете просто указать название проекта.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем, Cursor завезли visual prompts.
В Design Mode теперь можно просто ткнуть в элемент, обвести нужное место или сказать голосом, что поменять в UI.
Canvas тоже получил обновления. Теперь его можно публиковать и делиться им с командой по ссылке. С помощью Canvas агент умеет создавать дашборды, отчёты и внутренние инструменты.
Ещё одна полезная фича: Cursor теперь показывает использование контекста в виде интерактивного отчёта прямо в Canvas. Context Explorer позволяет увидеть, на что расходуются токены: системный промпт, определения инструментов, правила, скиллы и другие части контекста.☺️
В Design Mode теперь можно просто ткнуть в элемент, обвести нужное место или сказать голосом, что поменять в UI.
Canvas тоже получил обновления. Теперь его можно публиковать и делиться им с командой по ссылке. С помощью Canvas агент умеет создавать дашборды, отчёты и внутренние инструменты.
Ещё одна полезная фича: Cursor теперь показывает использование контекста в виде интерактивного отчёта прямо в Canvas. Context Explorer позволяет увидеть, на что расходуются токены: системный промпт, определения инструментов, правила, скиллы и другие части контекста.
Please open Telegram to view this post
VIEW IN TELEGRAM