Perplexity описали
Агенту мало один раз вызвать поиск и получить готовую выдачу.
В сложных задачах ему нужно самому собирать стратегию:
🔵 где искать
🔵 как разветвлять запросы
🔵 как фильтровать и проверять источники
🔵 что сохранить промежуточно
🔵 что вообще не тащить в контекст модели
В архитектуре Perplexity агент генерирует Python-код, запускает его в защищенной песочнице и через SDK управляет отдельными частями поискового стека:
Для задач вроде расследований, поиска уязвимостей или широкого ресерча это намного удобнее, чем гонять десятки отдельных вызовов поиска через модель.
Самый показательный пример из статьи - задача по CVE.
Агенту нужно было найти больше 200 серьезных уязвимостей, подтвердить каждую через вендорский advisory, указать продукт и версию исправления.
Результат:
Чат
Search as Code - новый подход к поиску для AI-агентовАгенту мало один раз вызвать поиск и получить готовую выдачу.
В сложных задачах ему нужно самому собирать стратегию:
В архитектуре Perplexity агент генерирует Python-код, запускает его в защищенной песочнице и через SDK управляет отдельными частями поискового стека:
search - поиск ranking - ранжирование filtering - фильтрация deduplication - удаление дублей aggregation - сборка результата Для задач вроде расследований, поиска уязвимостей или широкого ресерча это намного удобнее, чем гонять десятки отдельных вызовов поиска через модель.
Самый показательный пример из статьи - задача по CVE.
Агенту нужно было найти больше 200 серьезных уязвимостей, подтвердить каждую через вендорский advisory, указать продукт и версию исправления.
Результат:
SaC получил 100% точности и снизил расход токенов на 85.1% относительно базового подхода.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Odysseus 24.8k⭐ - Self hosted AI-среда от ютубера PewDiePie 👍
Идея проекта - собрать у себя локальный AI-центр: чат, агенты, модели, документы, память, поиск, почта, календарь и исследования в одном веб-интерфейсе.
Что внутри:
🔵 чат с локальными моделями и API:
🔵 агентный режим с инструментами: веб, файлы, shell, MCP, память, навыки
🔵 Cookbook - подбор, скачивание и запуск моделей под ваше железо
🔵 Deep Research - многошаговый поиск и итоговые отчеты
🔵 редактор документов с AI-правками и подсказками
🔵 заметки, задачи, расписания и напоминания
🔵 почта IMAP/SMTP с тегами, разбором и черновиками ответов
🔵 календарь CalDAV
🔵 мобильный интерфейс и PWA
Стек:
Получается полноценная локальная AI-панель на своем железе.
Чат
Идея проекта - собрать у себя локальный AI-центр: чат, агенты, модели, документы, память, поиск, почта, календарь и исследования в одном веб-интерфейсе.
Что внутри:
Ollama, llama.cpp, vLLM, OpenAI, OpenRouterСтек:
FastAPI, Python, SQLite, ChromaDB, SearXNG, Docker Compose и большой веб-интерфейс.Получается полноценная локальная AI-панель на своем железе.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI обновила Codex и добавила три заметных блока:
1. Ролевые плагины
Это готовые наборы инструкций, навыков, рабочих сценариев и подключений к приложениям для конкретных профессий. В первом пакете - 62 приложения и 110 навыков.
Примеры:
🔵 Data Analytics - анализ метрик, отчеты и дашборды через Snowflake, Databricks Genie, Hex, Tableau
🔵 Creative Production - кампании, баннеры и изображения товаров через Figma, Canva, Shutterstock, Picsart, Fal
🔵 Sales - подготовка к встречам, письма и задачи после встреч, CRM и планы закрытия сделок через Salesforce, HubSpot, Slack, Outreach
🔵 Product Design - проверка пользовательских сценариев, прототипы из live URL и статичных скриншотов
🔵 Investing / Banking - финансовая отчетность компаний, сравнение бизнесов, презентации для клиентов и проверка инвест-тезисов
2. Sites
Codex теперь может создавать, сохранять, деплоить и проверять сайты: веб-приложения, дашборды, внутренние инструменты и игры.
3. Annotations
Теперь можно выделить конкретную часть результата и попросить Codex доработать именно ее: блок на сайте, кусок документа, таблицу, слайд, Markdown или код.
Чат
1. Ролевые плагины
Это готовые наборы инструкций, навыков, рабочих сценариев и подключений к приложениям для конкретных профессий. В первом пакете - 62 приложения и 110 навыков.
Примеры:
2. Sites
Codex теперь может создавать, сохранять, деплоить и проверять сайты: веб-приложения, дашборды, внутренние инструменты и игры.
3. Annotations
Теперь можно выделить конкретную часть результата и попросить Codex доработать именно ее: блок на сайте, кусок документа, таблицу, слайд, Markdown или код.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Desktop - теперь агента можно запускать как обычное приложение 🔱
Nous Research выпустили публичную бету Hermes Desktop для macOS, Windows и Linux.
Есть возможность подключаться к удаленному gateway - документация.
Идеальный сценарий такой: Desktop - для плотной работы за ПК, Telegram - для удаленного управления агентом.
Чат
Nous Research выпустили публичную бету Hermes Desktop для macOS, Windows и Linux.
Есть возможность подключаться к удаленному gateway - документация.
Идеальный сценарий такой: Desktop - для плотной работы за ПК, Telegram - для удаленного управления агентом.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍3
NVIDIA Blueprints - готовые схемы для AI-агентов 🚗
NVIDIA анонсировала новый набор для enterprise-агентов: NemoClaw Blueprints, Nemotron models, OpenShell secure runtime и CUDA-X libraries как skills для агентов.
В новости много крупных партнеров: Cadence, Dassault Systèmes, Siemens и Synopsys уже используют NemoClaw для автономных AI-инженеров, Microsoft, Canonical, Red Hat, SAP и ServiceNow встраивают OpenShell в свои платформы, а Nemotron 3 Ultra обещает до 5x быстрее инференс и до 30% ниже стоимость для сложных агентных задач.
Blueprints - это каталог готовых референсных сборок для AI-приложений: архитектура, модели, NIM-микросервисы, инструменты, код и быстрый деплой собраны вокруг конкретной задачи.
Как это работает: у Blueprint есть прикладной сценарий, например security-анализ контейнера или локализация видео. Дальше NVIDIA показывает, какие сервисы нужны, как они связаны, где агент вызывает инструменты, где работает оркестрация и где человек принимает решение.
1. NemoClaw for Hermes Agent
Blueprint для запуска Hermes Agent в enterprise-среде. Hermes подключается к утвержденным инструментам и источникам данных, работает внутри NVIDIA OpenShell с политиками доступа, учится на командных процессах и превращает повторяемые правила в Hermes Skills.
2. Vulnerability Analysis for Container Security
Blueprint для разбора уязвимостей контейнеров. На вход подаются CVE из сканера, агент подтягивает код, документацию и контекст, строит чеклист расследования, проверяет пункты и выдает аналитику для security-специалиста.
3. Content Localization
Blueprint для медиа: перевод и локализация видео, автоматический дубляж, определение активного спикера, синхронизация губ под переведенную речь и сохранение фонового звука.
Чат
NVIDIA анонсировала новый набор для enterprise-агентов: NemoClaw Blueprints, Nemotron models, OpenShell secure runtime и CUDA-X libraries как skills для агентов.
В новости много крупных партнеров: Cadence, Dassault Systèmes, Siemens и Synopsys уже используют NemoClaw для автономных AI-инженеров, Microsoft, Canonical, Red Hat, SAP и ServiceNow встраивают OpenShell в свои платформы, а Nemotron 3 Ultra обещает до 5x быстрее инференс и до 30% ниже стоимость для сложных агентных задач.
Blueprints - это каталог готовых референсных сборок для AI-приложений: архитектура, модели, NIM-микросервисы, инструменты, код и быстрый деплой собраны вокруг конкретной задачи.
Как это работает: у Blueprint есть прикладной сценарий, например security-анализ контейнера или локализация видео. Дальше NVIDIA показывает, какие сервисы нужны, как они связаны, где агент вызывает инструменты, где работает оркестрация и где человек принимает решение.
1. NemoClaw for Hermes Agent
Blueprint для запуска Hermes Agent в enterprise-среде. Hermes подключается к утвержденным инструментам и источникам данных, работает внутри NVIDIA OpenShell с политиками доступа, учится на командных процессах и превращает повторяемые правила в Hermes Skills.
2. Vulnerability Analysis for Container Security
Blueprint для разбора уязвимостей контейнеров. На вход подаются CVE из сканера, агент подтягивает код, документацию и контекст, строит чеклист расследования, проверяет пункты и выдает аналитику для security-специалиста.
3. Content Localization
Blueprint для медиа: перевод и локализация видео, автоматический дубляж, определение активного спикера, синхронизация губ под переведенную речь и сохранение фонового звука.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Claude как аналитик поверх хранилища данных 🎉
Хранилище данных - это место, куда компания собирает данные из разных систем, чтобы потом анализировать продукт и бизнес:
🔵 продукт: пользователи, события, действия
🔵 платежи: счета, подписки, выручка
🔵 CRM: клиенты, сделки, сегменты
🔵 маркетинг: кампании, источники трафика
🔵 поддержка: обращения, жалобы, статусы
Anthropic разобрали, как они автоматизировали 95% запросов бизнес-аналитики через Claude и почему простого доступа агента к таблицам мало: нужны канонические метрики, семантический слой, навыки, оценки и проверка ответов.
📎 Как Anthropic строит самостоятельную аналитику с Claude
Чат
Хранилище данных - это место, куда компания собирает данные из разных систем, чтобы потом анализировать продукт и бизнес:
Anthropic разобрали, как они автоматизировали 95% запросов бизнес-аналитики через Claude и почему простого доступа агента к таблицам мало: нужны канонические метрики, семантический слой, навыки, оценки и проверка ответов.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Как Anthropic строит самостоятельную аналитику с Claude
Самостоятельная бизнес-аналитика долго была болезненным компромиссом. Если сделать модель данных проще для нетехнических сотрудников, компании часто получают широкие денормализованные таблицы, дублирующие витрины и разные определения одной и той же метрики.…
👍4
LangChain, LangGraph и Deep Agents - три уровня одной экосистемы для AI-агентов 🔄
LangChain - быстрый старт: модели, инструменты, сообщения, middleware и готовый цикл агента.
LangGraph - когда нужен контроль: состояние, граф выполнения, потоковая выдача, человек в контуре, сохранение и долгие процессы.
Deep Agents - готовая обвязка поверх LangGraph для более автономных задач: файлы, план, подагенты, навыки, память и управление контекстом.
Есть репозиторий langchain-ai/langgraph-101, в котором собраны полезные гайды. Ниже перевод:
🔵 Первый агент: модели, инструменты, память и потоковая выдача
🔵 Middleware, человек в контуре и безопасные агенты
🔵 Почтовый агент: сортировка, ответы, память и человек в контуре
🔵 Многоагентные системы: супервизор, подагенты и оценки
🔵 Исследовательский агент: поиск, координатор и параллельные подагенты
🔵 Deep Agents: агент с файлами, памятью и навыками
Чат
LangChain - быстрый старт: модели, инструменты, сообщения, middleware и готовый цикл агента.
LangGraph - когда нужен контроль: состояние, граф выполнения, потоковая выдача, человек в контуре, сохранение и долгие процессы.
Deep Agents - готовая обвязка поверх LangGraph для более автономных задач: файлы, план, подагенты, навыки, память и управление контекстом.
Есть репозиторий langchain-ai/langgraph-101, в котором собраны полезные гайды. Ниже перевод:
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Headroom - сжатие контекста для ИИ-агентов
ИИ-агенты быстро забивают контекст логами, JSON, результатами поиска, RAG-кусками и историей сессии. Headroom ставится между агентом и моделью и сжимает эти данные до отправки в LLM.
Что есть в репозитории:
🔵 библиотека для Python и TypeScript
🔵 локальный прокси
🔵 обертки для Claude Code, Codex, Cursor, Aider, Copilot и OpenClaw
🔵 MCP-инструменты
🔵 общая память между агентами
🔵
Фишка в обратимом сжатии: агент получает короткую версию, но оригинал хранится локально и может быть поднят обратно по запросу. Особенно полезно для экономии токенов в длинных сессиях с тестами, поиском по коду и большими API-ответами.
Установка:
Чат
ИИ-агенты быстро забивают контекст логами, JSON, результатами поиска, RAG-кусками и историей сессии. Headroom ставится между агентом и моделью и сжимает эти данные до отправки в LLM.
Что есть в репозитории:
headroom proxyheadroom_compress, headroom_retrieve, headroom_statsheadroom learn, который разбирает прошлые ошибки и пишет подсказки в CLAUDE.md / AGENTS.mdФишка в обратимом сжатии: агент получает короткую версию, но оригинал хранится локально и может быть поднят обратно по запросу. Особенно полезно для экономии токенов в длинных сессиях с тестами, поиском по коду и большими API-ответами.
Установка:
pip install "headroom-ai[all]"
headroom wrap claude
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3
pi-dynamic-workflows (835⭐ ) - расширение для Pi, которое добавляет инструмент
Модель пишет небольшой JavaScript-сценарий, делит задачу на фазы и запускает несколько изолированных субагентов через
Установка:
после этого в Pi:
Есть ядро - сценарии, субагенты, параллельный запуск, фазы, отмена и структурированный вывод. Нет сохранённых/возобновляемых запусков и менеджера
Ждем эту фишку в ближайшее время во всех агентах🏁
Чат
workflow (аналог из Claude Code).Модель пишет небольшой JavaScript-сценарий, делит задачу на фазы и запускает несколько изолированных субагентов через
agent(), parallel() и pipeline(). Стандартный сценарий - аудит репозитория: один агент собирает структуру, другой смотрит модули, третий ищет риски, родительская сессия собирает итог.Установка:
pi install npm:pi-dynamic-workflowsпосле этого в Pi:
/reloadЕсть ядро - сценарии, субагенты, параллельный запуск, фазы, отмена и структурированный вывод. Нет сохранённых/возобновляемых запусков и менеджера
/workflows.Ждем эту фишку в ближайшее время во всех агентах
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1🔥1🤝1
Hands-On AI Engineering - 50 практических AI-заготовок
Sumanth077/Hands-On-AI-Engineering (1.3к⭐ ) - репозиторий с мини-проектами на Python: агенты, RAG, OCR, мультимодальность и аудио.
Что там самое полезное:
- Рабочие агенты: PR-ревью через Telegram и GitHub MCP, поиск по GitHub обычным языком, встречи в Cal.com, отели через Trivago MCP, браузерный агент на
- Многоагентные цепочки: кодинг-ассистент с ролями планировщик -> кодер -> ревьюер, исследовательский агент на AG2, маркетинговый агент с веб-поиском.
- RAG-примеры: самопроверяющийся RAG, Hybrid RAG с графом знаний + векторным поиском, маршрутизация запросов между разными базами.
- Документы и OCR: чек в JSON через Pydantic, распознавание рецептов с проверкой лекарств по RxNorm, локальный GLM-OCR через Ollama.
- Мультимодальность: RAG по тексту, URL, PDF, картинкам, аудио и видео в одной базе.
Чат
Sumanth077/Hands-On-AI-Engineering (1.3к
Что там самое полезное:
- Рабочие агенты: PR-ревью через Telegram и GitHub MCP, поиск по GitHub обычным языком, встречи в Cal.com, отели через Trivago MCP, браузерный агент на
browser-use.- Многоагентные цепочки: кодинг-ассистент с ролями планировщик -> кодер -> ревьюер, исследовательский агент на AG2, маркетинговый агент с веб-поиском.
- RAG-примеры: самопроверяющийся RAG, Hybrid RAG с графом знаний + векторным поиском, маршрутизация запросов между разными базами.
- Документы и OCR: чек в JSON через Pydantic, распознавание рецептов с проверкой лекарств по RxNorm, локальный GLM-OCR через Ollama.
- Мультимодальность: RAG по тексту, URL, PDF, картинкам, аудио и видео в одной базе.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAgents (3.7к⭐ ) - открытая рабочая среда, где несколько AI-агентов работают вместе из разных терминалов, машин и моделей.
Внутри один Workspace: общие треды, файлы, браузер, задачи, база знаний и
Что есть в репозитории:
🔵
🔵 GUI Launcher для macOS, Windows и Linux (Linux - AppImage)
🔵 веб-Workspace на FastAPI + Next.js
🔵 Python SDK для своих агентных сетей
🔵 MCP/навыки для доступа к истории, файлам, браузеру и задачам
🔵 Cloud Agents: OpenAI, Anthropic, Google, xAI, Perplexity, OpenRouter и другие провайдеры
Установка:
Чат
Внутри один Workspace: общие треды, файлы, браузер, задачи, база знаний и
@mentions. Можно подключить Claude Code, Codex CLI, OpenClaw, OpenCode, Cursor, Hermes, Gemini CLI, Kimi и других агентов, а потом позвать нужного прямо в обсуждение.Что есть в репозитории:
agn - CLI/Launcher для установки и запуска агентов фономУстановка:
curl -fsSL https://openagents.org/install.sh | bash
agn
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
OpenProse - Markdown-контракты для AI-агентов
Появился интересный репозиторий: OpenProse. Это декларативный язык для агентных сессий: вы описываете рабочий процесс в
Что это реально дает агенту:
🔵 он видит не разовую инструкцию, а структуру задачи;
🔵 понимает зависимости между шагами;
🔵 может пересобрать только те части процесса, которые изменились;
🔵 оставляет проверяемые подтверждения выполнения;
🔵 лучше переносит сценарий между сессиями и разными агентами.
Например, в Hermes такой подход можно использовать для повторяемых процессов: дайджест новостей, ревью PR, подготовка статьи, проверка репозитория, запуск тестов. Вместо длинного промпта каждый раз - файл-контракт, где описано нужное состояние результата, источники, проверки и формат ответа.
OpenProse работает поверх уже привычных coding agents: Claude Code, Codex, OpenCode, Hermes, Pi. Внутри есть Reactor, который следит за изменениями, пересобирает зависимые части и хранит подтверждения выполнения.
Чат
Появился интересный репозиторий: OpenProse. Это декларативный язык для агентных сессий: вы описываете рабочий процесс в
*.prose.md, а агент получает не просто промпт, а понятный контракт: что должно быть сделано, какие части связаны между собой и какие подтверждения оставить.Что это реально дает агенту:
Например, в Hermes такой подход можно использовать для повторяемых процессов: дайджест новостей, ревью PR, подготовка статьи, проверка репозитория, запуск тестов. Вместо длинного промпта каждый раз - файл-контракт, где описано нужное состояние результата, источники, проверки и формат ответа.
OpenProse работает поверх уже привычных coding agents: Claude Code, Codex, OpenCode, Hermes, Pi. Внутри есть Reactor, который следит за изменениями, пересобирает зависимые части и хранит подтверждения выполнения.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Собрать AI-агента стало проще. Довести до продакшена - совсем другая история.
У агента быстро появляется целый стек вокруг модели: инструменты, MCP, память, состояние, фреймворки, оценка, наблюдаемость и безопасность.
Перевел статью O’Reilly про 6 слоев между LLM и рабочим агентом. Советую прочитать, чтобы понять, где агентные системы чаще всего ломаются и как не переусложнить архитектуру на старте.
📎 Стек AI-агентов в 2026 году
Чат
У агента быстро появляется целый стек вокруг модели: инструменты, MCP, память, состояние, фреймворки, оценка, наблюдаемость и безопасность.
Перевел статью O’Reilly про 6 слоев между LLM и рабочим агентом. Советую прочитать, чтобы понять, где агентные системы чаще всего ломаются и как не переусложнить архитектуру на старте.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👌1🤝1
Сейчас главный тренд в агентах - loop 🔄
Работа с кодинг-агентами смещается в сторону циклов: расписание находит задачи, worktree изолирует исполнителей, skills дают контекст, коннекторы ведут работу в Linear/CI/Slack, а субагенты разделяют кодера и проверяющего.
Это называют Loop Engineering. Сильная идея, но с неприятными углами: расход токенов, критерии "готово", доверие к памяти и риск тихо накопить код, который уже никто не понимает.
Подготовил для вас очень полезную статью:
📎 Loop Engineering: как проектировать циклы для кодинг-агентов
Чат
Работа с кодинг-агентами смещается в сторону циклов: расписание находит задачи, worktree изолирует исполнителей, skills дают контекст, коннекторы ведут работу в Linear/CI/Slack, а субагенты разделяют кодера и проверяющего.
Это называют Loop Engineering. Сильная идея, но с неприятными углами: расход токенов, критерии "готово", доверие к памяти и риск тихо накопить код, который уже никто не понимает.
Подготовил для вас очень полезную статью:
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Loop Engineering: как проектировать циклы для кодинг-агентов
Loop engineering, или инженерия циклов, - это переход от разовых запросов к кодинг-агенту к системе, которая сама находит работу, запускает агентов, проверяет результат, сохраняет состояние и решает, что делать дальше. Человек проектирует этот контур и остается…
🤝3❤1
Anthropic выкатила Claude Fable 5, и Claude Code сразу стал интереснее 🎉
Anthropic выпустила Claude Fable 5 - новый публичный Mythos-class модель для сложной разработки, длинных задач и agentic workflows.
Модель уже доступна много где. Anthropic отдельно пишет, что Fable 5 лучше раскрывается на длинных задачах: планирование, работа по этапам, проверка своего результата, делегирование подзадач.
Параллельно в Claude Code начали выкатывать важное обновление: nested subagents. Теперь агент может запускать субагентов, а те - своих субагентов. Стартовый лимит - до 5 уровней вложенности.
Главный агент больше не обязан тащить весь проект, все логи, поиск по файлам, тесты и ревью в одном контексте. Он может раздать работу отдельным агентам: один изучает кодовую базу, второй готовит правку, третий гоняет тесты, четвертый проверяет дифф, пятый ищет риски. Каждый возвращает короткий результат, а основной агент собирает решение.
Борис Черный из команды Claude Code в комментариях привел пример: skill можно запускать в отдельном контексте, а внутри skill просить агентов держать каждый шаг изолированным. Такой подход уже добавляют в
Чат
Anthropic выпустила Claude Fable 5 - новый публичный Mythos-class модель для сложной разработки, длинных задач и agentic workflows.
Модель уже доступна много где. Anthropic отдельно пишет, что Fable 5 лучше раскрывается на длинных задачах: планирование, работа по этапам, проверка своего результата, делегирование подзадач.
Параллельно в Claude Code начали выкатывать важное обновление: nested subagents. Теперь агент может запускать субагентов, а те - своих субагентов. Стартовый лимит - до 5 уровней вложенности.
Главный агент больше не обязан тащить весь проект, все логи, поиск по файлам, тесты и ревью в одном контексте. Он может раздать работу отдельным агентам: один изучает кодовую базу, второй готовит правку, третий гоняет тесты, четвертый проверяет дифф, пятый ищет риски. Каждый возвращает короткий результат, а основной агент собирает решение.
Борис Черный из команды Claude Code в комментариях привел пример: skill можно запускать в отдельном контексте, а внутри skill просить агентов держать каждый шаг изолированным. Такой подход уже добавляют в
/code-review, чтобы ревью меньше забивало основной контекст и работало точнее.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Самый интересный нюанс Claude Fable 5 - Anthropic продает не только интеллект модели, но и режим доступа к нему 😱
Fable и Mythos работают на одних базовых весах. Mythos дают доверенным партнерам, Fable - всем остальным, но с ограничениями.
Для кибербезопасности, биологии, химии и дистилляции запрос может уйти на Opus 4.8.
А вот с разработкой frontier LLM все менее прозрачно. В system card Anthropic пишет, что Fable может невидимо снижать эффективность на задачах вроде пайплайнов предобучения моделей, и проектирования ML-ускорителей.
Не отказ. Не предупреждение. Не видимый fallback. Просто ответ, который выглядит обычным, но может быть ослаблен через переписывание запроса, векторы управления поведением модели или PEFT - легкое дообучение небольшой части параметров.
Для обычной разработки это, скорее всего, не всплывет. Но для AI research и инфраструктуры обучения появляется неприятная неопределенность: если результат плохой, ты не знаешь, модель ошиблась или провайдер тихо нажал на тормоз.
Еще один важный нюанс: в подписках Pro/Max/Team Fable включили только до 22 июня. После этого доступ будет по API - $10 млн за input и $50 млн за output.
Получается сильная модель для долгих агентских задач, но с новой реальностью: топовый интеллект теперь идет вместе с правилами доступа, хранением запросов и невидимыми ограничителями.
Чат
Fable и Mythos работают на одних базовых весах. Mythos дают доверенным партнерам, Fable - всем остальным, но с ограничениями.
Для кибербезопасности, биологии, химии и дистилляции запрос может уйти на Opus 4.8.
А вот с разработкой frontier LLM все менее прозрачно. В system card Anthropic пишет, что Fable может невидимо снижать эффективность на задачах вроде пайплайнов предобучения моделей, и проектирования ML-ускорителей.
Не отказ. Не предупреждение. Не видимый fallback. Просто ответ, который выглядит обычным, но может быть ослаблен через переписывание запроса, векторы управления поведением модели или PEFT - легкое дообучение небольшой части параметров.
Для обычной разработки это, скорее всего, не всплывет. Но для AI research и инфраструктуры обучения появляется неприятная неопределенность: если результат плохой, ты не знаешь, модель ошиблась или провайдер тихо нажал на тормоз.
Еще один важный нюанс: в подписках Pro/Max/Team Fable включили только до 22 июня. После этого доступ будет по API - $10 млн за input и $50 млн за output.
Получается сильная модель для долгих агентских задач, но с новой реальностью: топовый интеллект теперь идет вместе с правилами доступа, хранением запросов и невидимыми ограничителями.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Mastercard готовит платежный слой для AI-агентов 💸
Mastercard запустила Agent Pay for Machines - инфраструктуру для платежей, которые агенты смогут выполнять сами: купить домен, оплатить хостинг, данные, вычисления или логистические услуги.
Пока это выглядит как партнерский запуск, а не публичный API для всех разработчиков. В списке первых участников - Cloudflare, Coinbase, Stripe, Adyen, Checkout, OKX, Solana Foundation, RippleX и другие.
У агента будет проверяемая идентичность, лимиты и правила оплаты. Он сможет тратить деньги только в заданных рамках, а Mastercard и партнеры будут проводить расчеты через карты, счета и стейблкоины.
Чат
Mastercard запустила Agent Pay for Machines - инфраструктуру для платежей, которые агенты смогут выполнять сами: купить домен, оплатить хостинг, данные, вычисления или логистические услуги.
Пока это выглядит как партнерский запуск, а не публичный API для всех разработчиков. В списке первых участников - Cloudflare, Coinbase, Stripe, Adyen, Checkout, OKX, Solana Foundation, RippleX и другие.
У агента будет проверяемая идентичность, лимиты и правила оплаты. Он сможет тратить деньги только в заданных рамках, а Mastercard и партнеры будут проводить расчеты через карты, счета и стейблкоины.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
GitHub Copilot app - панель управления агентами для разработки 📱
GitHub открыл preview Copilot app для платных Copilot-планов. Приложение есть для macOS, Windows и Linux.
У Codex app и Claude Desktop, кстати, нету версии под Linux.
Главные фишки:
🔵 Задача > PR > проверки > merge внутри GitHub
Сессию можно запустить из issue, pull request, промта или прошлой сессии. Агент сразу видит контекст GitHub: репозиторий, обсуждение, PR, проверки, поиск по коду и историю работы.
🔵 Agent Merge
Copilot может довести PR до конца: ответить на комментарии, исправить замечания, разобраться с упавшими проверками и учесть правила merge.
Вы задаете условия, а агент мержит только когда все требования выполнены.
🔵 Canvas вместо бесконечного чата
Работа агента показывается как рабочее полотно: план, PR, терминал, браузерная сессия, чеклист релиза, панель состояния или процесс выполнения.
Можно править, переставлять блоки, одобрять шаги и перенаправлять агента прямо там, а не вылавливать нужное место в длинной переписке.
🔵 My Work как диспетчер задач для агентов
В одном окне видны активные сессии, issues, pull requests и фоновые автоматизации по подключенным репозиториям.
🔵 Разные агенты внутри одного GitHub-сценария
GitHub заявляет доступ к сторонним агентам, включая Claude Code и Codex, плюс партнерские agent приложения.
Чат
GitHub открыл preview Copilot app для платных Copilot-планов. Приложение есть для macOS, Windows и Linux.
У Codex app и Claude Desktop, кстати, нету версии под Linux.
Главные фишки:
Сессию можно запустить из issue, pull request, промта или прошлой сессии. Агент сразу видит контекст GitHub: репозиторий, обсуждение, PR, проверки, поиск по коду и историю работы.
Copilot может довести PR до конца: ответить на комментарии, исправить замечания, разобраться с упавшими проверками и учесть правила merge.
Вы задаете условия, а агент мержит только когда все требования выполнены.
Работа агента показывается как рабочее полотно: план, PR, терминал, браузерная сессия, чеклист релиза, панель состояния или процесс выполнения.
Можно править, переставлять блоки, одобрять шаги и перенаправлять агента прямо там, а не вылавливать нужное место в длинной переписке.
В одном окне видны активные сессии, issues, pull requests и фоновые автоматизации по подключенным репозиториям.
GitHub заявляет доступ к сторонним агентам, включая Claude Code и Codex, плюс партнерские agent приложения.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Это open-source кодинг агент, на базе OpenCode.
В комплекте есть MiMo Auto - временно бесплатный режим на MiMo-V2.5 с контекстом до 1M токенов. Еще можно войти через Xiaomi MiMo, импортировать конфиг Claude Code или подключить других провайдеров.
Что интересного:
На каждом шаге агент делает 5 независимых черновиков: рассуждение + план вызова инструментов, без исполнения. Потом судья выбирает лучший вариант, и выполняется только он.
Xiaomi пишет про +10-20% на SWE-Bench Pro, цена - примерно 4-5x токенов. Фича экспериментальная.
/goal задает условие остановки. Перед завершением отдельный судья проверяет, правда ли задача выполнена.За память отвечает отдельный checkpoint-writer. Он пишет
checkpoint.md, поднимает стабильные факты в MEMORY.md, хранит полный трейс в SQLite и разбирает notes.md, куда основной агент может скидывать находки.Когда контекст заполняется, сессия пересобирается из todo, чекпоинта, последних сообщений пользователя и памяти. Так они делают свою версию “безлимитного контекста”.
Отдельный режим рядом с build/plan. По сути встроенный флоу в стиле Superpowers skills.
Compose-агент прогоняет задачу через навыки вроде
compose:brainstorm, compose:plan, compose:tdd, compose:execute, compose:review, compose:verify, compose:merge.Это как specs-driven development: от спеки до реализации, проверки и мержа. То есть в harness сразу встроили процесс разработки, за это лайк.
Для больших задач есть JS-оркестрация:
agent(), parallel(), pipeline(), workflow(). Параллельные подагенты и логика процесса живут в исполняемом сценарии, поэтому сложные флоу меньше завязаны на то, удержит ли модель порядок шагов.Dream раз в 7 дней чистит и мержит проектную память. Distill раз в 30 дней ищет повторяющиеся процессы и превращает их в skills, команды, агентов и SOP.Выглядит как один из самых интересных свежих кодинг агентов: Xiaomi собрала агентную систему для длинных задач с памятью, проверкой завершения, режимом разработки SDD и параллельной оркестрацией.
Из нюансов: вы сразу не увидите модель GPT 5.5, потому что они используют плагин для OAuth ChatGPT в котором этой модели нет. Но сам mimo GPT 5.4 смог сделать патч, после чего модель стала доступна.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Agent добавил Automation Blueprints - шаблоны для cron-автоматизаций 🔱
Под капотом Hermes также создает обычную cron-задачу. Отличие в том, как она появляется.
Раньше нужно было собрать команду: расписание, длинный промпт, доставку, навыки, скрипт, условия молчания. Например: “каждый будний день в 18:00 собери новостной дайджест, проверь источники, убери повторы”.
Теперь это можно упаковать в Blueprint: готовый сценарий с понятными полями.
В приложении это выглядит как форма: выбрать шаблон, заполнить тему, время, канал доставки и нажать
В Telegram/CLI/TUI можно написать:
Hermes сам спросит недостающие параметры, покажет, что именно будет создано, и попросит подтверждение.
Есть готовые пресеты:
🔵 утренний брифинг
🔵 мониторинг важной почты
🔵 еженедельный обзор
🔵 дайджест по теме
🔵 напоминания и привычки
🔵 проверки деплоя, алертов, PR и CI через webhook-сценарии
Кастомные Blueprints тоже можно делать самому: это обычный Hermes Skill с блоком
Чат
Под капотом Hermes также создает обычную cron-задачу. Отличие в том, как она появляется.
Раньше нужно было собрать команду: расписание, длинный промпт, доставку, навыки, скрипт, условия молчания. Например: “каждый будний день в 18:00 собери новостной дайджест, проверь источники, убери повторы”.
Теперь это можно упаковать в Blueprint: готовый сценарий с понятными полями.
В приложении это выглядит как форма: выбрать шаблон, заполнить тему, время, канал доставки и нажать
Schedule it.В Telegram/CLI/TUI можно написать:
/blueprint news-digestHermes сам спросит недостающие параметры, покажет, что именно будет создано, и попросит подтверждение.
Есть готовые пресеты:
Кастомные Blueprints тоже можно делать самому: это обычный Hermes Skill с блоком
metadata.hermes.blueprint в SKILL.md. То есть повторяемый процесс можно превратить в кнопку, форму или короткую команду из мессенджера.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2
Почему одни AI-агенты реально помогают, а другие только дергают инструменты
Тут речь не про локальные модели и не про очередной фреймворк. Статья про обвязку вокруг модели: системные инструкции, инструменты, навыки, справки и сырой API, из которых складывается рабочий агент.
Автор разбирает это на примере агента для электронных таблиц. Такой агент должен не просто “уметь вызвать API”, а понимать таблицу, сжимать большие диапазоны, показывать последствия своих изменений и быстро находить редкие возможности без раздувания контекста.
В комментариях автор добавил хороший пример: сводные таблицы могут встречаться меньше чем в 2% запросов, но когда они срабатывают, пользователи очень ценят результат. Поэтому сильный агент строится не только вокруг частых действий, но и вокруг того, какие редкие возможности дают большой выигрыш.
Я адаптировал статью на русский:📎 Как строить вертикальных агентов, которые действительно работают
Чат
Тут речь не про локальные модели и не про очередной фреймворк. Статья про обвязку вокруг модели: системные инструкции, инструменты, навыки, справки и сырой API, из которых складывается рабочий агент.
Автор разбирает это на примере агента для электронных таблиц. Такой агент должен не просто “уметь вызвать API”, а понимать таблицу, сжимать большие диапазоны, показывать последствия своих изменений и быстро находить редкие возможности без раздувания контекста.
В комментариях автор добавил хороший пример: сводные таблицы могут встречаться меньше чем в 2% запросов, но когда они срабатывают, пользователи очень ценят результат. Поэтому сильный агент строится не только вокруг частых действий, но и вокруг того, какие редкие возможности дают большой выигрыш.
Я адаптировал статью на русский:
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Как строить вертикальных агентов, которые действительно работают
Вертикальный агент - это агент под конкретный класс задач: электронные таблицы, финансовые расчеты, продажи, юридические документы, DevOps или другую повторяющуюся работу. Он должен выигрывать там, где пользователь быстро видит разницу между почти правильным…
🔥5❤2