This media is not supported in your browser
VIEW IN TELEGRAM
agentmemory 23к⭐ - память для кодинг-агентов
Обычная память агента часто сводится к
agentmemory делает отдельный слой памяти для рабочих фактов: что уже пробовали, какие решения приняли, где была ошибка, какие файлы трогали, чем закончилась прошлая сессия.
Как это устроено:
🔵 хуки агента ловят события: старт сессии, запрос пользователя, вызовы инструментов, ошибки, compact, stop
🔵 сырые наблюдения чистятся от секретов, сжимаются и превращаются в факты, концепты, связи и краткие самари
🔵 поиск идет не только по ключевым словам, а через BM25 + векторы + граф связей
🔵 перед новой сессией агент может получить только релевантные куски памяти, а не весь архив подряд
Что дают MCP и skills:
Через MCP - Claude Code, Codex, Cursor, OpenCode, Hermes и другие получают инструменты вроде
skills - это инструкция агенту, когда этими MCP пользоваться. Без skills модель может видеть инструменты, но не понимать, в каких ситуациях нужно сохранить решение или поднять прошлый контекст.
Самый быстрый старт:
Работает почти со всеми агентами.
По умолчанию может работать без LLM-провайдера - тогда память работает через BM25 и локальные embeddings. Чтобы она полноценно заработала, нужно подключить обычную модель, советуют использовать не топовые. Например:
Чат
Обычная память агента часто сводится к
CLAUDE.md / AGENTS.md - статичные правила проекта. Хорошо для “как писать код”, плохо для истории работы.agentmemory делает отдельный слой памяти для рабочих фактов: что уже пробовали, какие решения приняли, где была ошибка, какие файлы трогали, чем закончилась прошлая сессия.
Как это устроено:
Что дают MCP и skills:
Через MCP - Claude Code, Codex, Cursor, OpenCode, Hermes и другие получают инструменты вроде
memory_save, memory_smart_search, memory_sessions, memory_timeline.skills - это инструкция агенту, когда этими MCP пользоваться. Без skills модель может видеть инструменты, но не понимать, в каких ситуациях нужно сохранить решение или поднять прошлый контекст.
Самый быстрый старт:
npm install -g @agentmemory/agentmemory
agentmemory
agentmemory connect claude-code
npx skills add rohitg00/agentmemory -y
Работает почти со всеми агентами.
По умолчанию может работать без LLM-провайдера - тогда память работает через BM25 и локальные embeddings. Чтобы она полноценно заработала, нужно подключить обычную модель, советуют использовать не топовые. Например:
deepseek/deepseek-v4-pro и qwen/qwen3-coderЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Factory 2.0 - кодинг-агенты превращаются в фабрику разработки 💃
Factory.ai, команда создавшая агента Droid, показала Factory 2.0.
Если ускорить только написание кода, бутылочные горлышки переедут в разбор задач, тесты, ревью, релизы, деплой и мониторинг. Поэтому Factory предлагает смотреть на весь цикл разработки как на одну агентную систему.
Входом может быть багрепорт, сообщение от клиента, внутренняя хотелка или бизнес-требование. Дальше это проходит через разбор, план, код, тесты, ревью, релиз, наблюдение и снова возвращается в цикл как новые сигналы.
Что внутри их software factory:
🔵 разные модели под разные задачи, с роутером по цене, скорости и качеству
🔵 контроль над контекстом и данными: свои ключи, свой контур данных, отдельный регион или закрытая сеть
🔵 общая память и контекст для ревью, безопасности, QA, документации и инцидентов
🔵 панель управления в Factory Desktop App: очереди, триаж тикетов, PR-проверки, деплои, мониторинг и узкие места
По словам Factory, такие фабрики уже работают у NVIDIA, EY, Adobe, Palo Alto Networks, Adyen, Blackstone, Wipro и Comarch.
Самое интересное тут направление. Кодинг-агент решает кусок работы. Следующий слой - система вокруг него: задачи, права, логи, проверки, память, отчеты и понятная панель по всей цепочке.
Чат
Factory.ai, команда создавшая агента Droid, показала Factory 2.0.
Если ускорить только написание кода, бутылочные горлышки переедут в разбор задач, тесты, ревью, релизы, деплой и мониторинг. Поэтому Factory предлагает смотреть на весь цикл разработки как на одну агентную систему.
Входом может быть багрепорт, сообщение от клиента, внутренняя хотелка или бизнес-требование. Дальше это проходит через разбор, план, код, тесты, ревью, релиз, наблюдение и снова возвращается в цикл как новые сигналы.
Что внутри их software factory:
По словам Factory, такие фабрики уже работают у NVIDIA, EY, Adobe, Palo Alto Networks, Adyen, Blackstone, Wipro и Comarch.
Самое интересное тут направление. Кодинг-агент решает кусок работы. Следующий слой - система вокруг него: задачи, права, логи, проверки, память, отчеты и понятная панель по всей цепочке.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Самое важное:
Также, чтобы вы не скучали, перевел две статьи, первая продвинутая, вторая попроще:
@Computer, @Chrome, @Browser, а когда лучше идти через плагин или MCP.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Uncle Bob (автор книги Clean Code) выкатил свой агентный оркестратор для разработки: локальная связка
tmux, git worktree, Babashka-скриптов и файловой "почты" между агентами.Самое необычное - проект разложен по веткам.
main хранит документацию и общие скрипты, а рабочие флоу лежат отдельно:-
two-pack - быстрый цикл coder -> cleaner -> coder-
four-pack - спецификация, код, рефакторинг, архитектура-
six-pack - полный конвейер specifier -> coder -> cleaner -> architect -> hardender -> QA-
adversaries - отдельный цикл coder <-> reviewer, где ревьюер гоняет кодера до approvalКаждая роль запускается как отдельный агент в своей
tmux-сессии и своем git worktree. В конфиге можно выбрать CLI для роли: codex, claude, copilot, grok. По умолчанию примеры идут на Codex.Интересная часть - handoff-протокол. Агенты не шлют друг другу длинные сообщения в чат. Они кладут маленькие типизированные файлы в outbox:
git_handoff, note, awake. Демон проверяет формат, раскладывает задачи по inbox получателей и будит нужную tmux-сессию.По сути это не "рой агентов, которым дали общий промпт", а инженерный конвейер с ролями, очередями, коммитами, приоритетами и аудитом.
В полном
six-pack чувствуется почерк Дяди Боба: Gherkin-спеки, TDD, acceptance tests, CRAP/DRY, mutation testing, архитектурные границы, финальная QA-проверка через пользовательский интерфейс.Клевая идея рабочих деревьев под роли, а не под задачи. Агент не просто берет тикет, он живет в своей профессиональной зоне ответственности: спецификация, код, чистка, архитектура, харденинг, QA.
Интересно взглянуть на первый коммит в репозитории. Там есть md файлы, которые описывают принципы работы и разработки самого SwarmForge, для понимания, что сувать в контекст агента для кодинга, полезно.
Как образец агентного SDLC с жесткой инженерной дисциплиной - репозиторий очень любопытный.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
SpaceX договорились купить компанию Cursor за $60 млрд. По Reuters, сделка акциями должна закрыться в Q3 2026, а Cursor становится частью большого AI-контура SpaceX/xAI.
На этом фоне Cursor запускает Origin - свой GitHub для эпохи AI-агентов. Это git-платформа, где репозиторий сразу проектируется под работу людей и множества агентов: код, ветки, ревью, фоновые задачи и агентные изменения в одном месте.
Параллельно Vercel показал Eve - open-source фреймворк для production-агентов. Главная идея простая: agent is a directory.
В папке агента лежат:
-
-
-
-
-
-
Агенты быстро обрастают собственной инфраструктурой: им уже нужен хостинг кода, очередь задач, ревью, навыки, расписания и безопасные инструменты вокруг проекта.
Чат
На этом фоне Cursor запускает Origin - свой GitHub для эпохи AI-агентов. Это git-платформа, где репозиторий сразу проектируется под работу людей и множества агентов: код, ветки, ревью, фоновые задачи и агентные изменения в одном месте.
Параллельно Vercel показал Eve - open-source фреймворк для production-агентов. Главная идея простая: agent is a directory.
В папке агента лежат:
-
instructions.md - роль и правила-
tools/ - инструменты на TypeScript-
skills/ - переиспользуемые навыки-
subagents/ - дочерние агенты-
channels/ - Slack, Discord, Teams, web-
schedules/ - запуск по расписаниюАгенты быстро обрастают собственной инфраструктурой: им уже нужен хостинг кода, очередь задач, ревью, навыки, расписания и безопасные инструменты вокруг проекта.
Чат
AGENTS.md - инструкция для AI-агентов в репозиторииСобрал понятный гайд: как писать
AGENTS.md, чтобы его понимали Codex, Claude Code, Hermes, OpenCode, OpenClaw и другие агенты.CLAUDE.mdЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🙏1
Свежие новости по агентам 📰
🔵 Codex Record & Replay - OpenAI добавил запись действий на Mac: пользователь один раз показывает процесс, а Codex превращает его в skill для повторного запуска через Computer Use, браузер и плагины.
🔵 Grok Build быстро развивается: AGENTS.md, skills, hooks, plugins, MCP, subagents, ACP, headless mode и панель сессий.
🔵 CEO-Bench - новый тест от Princeton для долгих агентных задач.
Агенту дают симулированный AI-стартап, $1M стартового баланса и 500 дней управления. Он принимает решения по продукту, рынку, клиентам и росту, видит панели с метриками, базу данных, соцсети, отчеты и историю переговоров, но скрытые параметры ему приходится выводить по косвенным сигналам: спрос, отток пользователей, удовлетворенность клиентов и действия конкурентов.
Это ближе к реальной работе агента-оператора, чем обычные coding evals. Ошибка может проявиться через недели, одно решение влияет на несколько частей системы, а “увидел метрику - внес патч” быстро ломается.
Результат пока жесткий: большинство моделей не заканчивают выше стартового $1M. На лучшем прогоне выше старта вышли Claude Fable 5, Claude Opus 4.8 и GPT-5.5, но стабильно выше старта больше одного раза оказался только Fable 5.
🔵 Основатель Howie написал сильный тред о том, как они довели AI помощника по планированию до 50% автономности.
Категория сложная для агента: если ассистент ошибся в переписке с кандидатом, инвестором или клиентом, пользователь его просто увольняет. Там слишком много редких и неприятных случаев: таймзоны, поездки, переносы, приватность календаря, разные типы встреч, моменты когда лучше спросить человека отдельно, а когда можно отвечать самому.
Команда пошла через людей в контуре проверки: собрала команду, которая ловила ошибки и помогала описывать, как должен действовать сильный личный ассистент руководителя в странных ситуациях. Потом на этом выросла карта нестандартных случаев: синтетический эталонный набор данных, проверки качества, fine-tuning, RL, ACE, DSPy, подагенты и новые версии рабочей обвязки.
Они не начинали с обещания полной автономности. Они сначала построили доверие и контроль качества, а уже потом постепенно отпускали руль. Сейчас Howie, по словам основателя, дошел до тысяч встреч в день и 50% автономности без роста оттока пользователей и жалоб.
Чат
Агенту дают симулированный AI-стартап, $1M стартового баланса и 500 дней управления. Он принимает решения по продукту, рынку, клиентам и росту, видит панели с метриками, базу данных, соцсети, отчеты и историю переговоров, но скрытые параметры ему приходится выводить по косвенным сигналам: спрос, отток пользователей, удовлетворенность клиентов и действия конкурентов.
Это ближе к реальной работе агента-оператора, чем обычные coding evals. Ошибка может проявиться через недели, одно решение влияет на несколько частей системы, а “увидел метрику - внес патч” быстро ломается.
Результат пока жесткий: большинство моделей не заканчивают выше стартового $1M. На лучшем прогоне выше старта вышли Claude Fable 5, Claude Opus 4.8 и GPT-5.5, но стабильно выше старта больше одного раза оказался только Fable 5.
Категория сложная для агента: если ассистент ошибся в переписке с кандидатом, инвестором или клиентом, пользователь его просто увольняет. Там слишком много редких и неприятных случаев: таймзоны, поездки, переносы, приватность календаря, разные типы встреч, моменты когда лучше спросить человека отдельно, а когда можно отвечать самому.
Команда пошла через людей в контуре проверки: собрала команду, которая ловила ошибки и помогала описывать, как должен действовать сильный личный ассистент руководителя в странных ситуациях. Потом на этом выросла карта нестандартных случаев: синтетический эталонный набор данных, проверки качества, fine-tuning, RL, ACE, DSPy, подагенты и новые версии рабочей обвязки.
Они не начинали с обещания полной автономности. Они сначала построили доверие и контроль качества, а уже потом постепенно отпускали руль. Сейчас Howie, по словам основателя, дошел до тысяч встреч в день и 50% автономности без роста оттока пользователей и жалоб.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Media is too big
VIEW IN TELEGRAM
Claude Code получил Artifacts 🏋️♂️ - живые страницы из сессии агента.
Теперь агент может собрать из текущей работы интерактивную страницу: PR, дашборд, чеклист релиза, карту сервиса или заметку для ревью. Страница строится из контекста сессии: код, плагины, скиллы и подключенные инструменты. Если агент продолжает работу, страница обновляется по той же ссылке.
Также перевел две хорошие статьи:
📎 Две дорожки для кодинг-агентов: спецификация и реализация - про процесс "спецификация - реализация", где важнее правильно распределить внимание человека и агента.
📎 GTM-команда на Claude Code, которой управляет один человек - про go-to-market команду из нескольких агентов: prospector, researcher, sequencer, recoverer, reporter, общая память и утренний отчет.
Чат
Теперь агент может собрать из текущей работы интерактивную страницу: PR, дашборд, чеклист релиза, карту сервиса или заметку для ревью. Страница строится из контекста сессии: код, плагины, скиллы и подключенные инструменты. Если агент продолжает работу, страница обновляется по той же ссылке.
Также перевел две хорошие статьи:
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Очень много инфы появляется про лупы. Это топ 4 за последние дни:
📎 Самоулучшающийся Kimi-сворм: 300 агентов, проверка Opus и цикл без ручного аудита
Для тех, кто экспериментирует с multi-agent research, Kimi, дешевыми массовыми прогонами и отдельной verifier-моделью. Внутри: как писать спецификацию для сворма, читать план декомпозиции до запуска, получать файлы вместо ответа в чате, прогонять результат через Opus-проверку и превращать ошибки в постоянные правила для следующих запусков.
📎 Loop Engineer: как строить агентные циклы, которые работают без ручного промптинга
Для фаундеров, growth-команд и разработчиков, которые хотят запускать агентные процессы вокруг бизнеса: support, SEO, product growth, ads. Главная инфа - как устроить общий слой артефактов, контрактов и логов, чтобы разные циклы читали выводы друг друга и накапливали рабочую память компании.
📎 От промптов к loop engineering: как проектировать циклы для кодинг-агентов
Для тех, кто уже пользуется Claude Code, Codex или другими кодинг-агентами и хочет перейти от ручных запросов к повторяемым циклам. Внутри: 6 частей хорошего loop - триггер, изоляция, записанный контекст, доступ к инструментам, независимая проверка и состояние на диске. Плюс примеры PR-babysitter,
📎 Архитектура агентных циклов: loop, skill и устойчивая оркестрация
Для тех, кто думает о production-агентах: фоновые процессы, ретраи, очереди, субагенты, наблюдаемость и восстановление после падений. Аагентный loop должен жить поверх устойчивой оркестрации: каждый шаг сохраняется, ошибки повторяются с нужного места, события не теряются, а dev утром видит все запуски, inputs, outputs и ретраи.
Чат
Для тех, кто экспериментирует с multi-agent research, Kimi, дешевыми массовыми прогонами и отдельной verifier-моделью. Внутри: как писать спецификацию для сворма, читать план декомпозиции до запуска, получать файлы вместо ответа в чате, прогонять результат через Opus-проверку и превращать ошибки в постоянные правила для следующих запусков.
Для фаундеров, growth-команд и разработчиков, которые хотят запускать агентные процессы вокруг бизнеса: support, SEO, product growth, ads. Главная инфа - как устроить общий слой артефактов, контрактов и логов, чтобы разные циклы читали выводы друг друга и накапливали рабочую память компании.
Для тех, кто уже пользуется Claude Code, Codex или другими кодинг-агентами и хочет перейти от ручных запросов к повторяемым циклам. Внутри: 6 частей хорошего loop - триггер, изоляция, записанный контекст, доступ к инструментам, независимая проверка и состояние на диске. Плюс примеры PR-babysitter,
/goal, лимиты, стоимость и случаи, когда loop лучше не запускать.Для тех, кто думает о production-агентах: фоновые процессы, ретраи, очереди, субагенты, наблюдаемость и восстановление после падений. Аагентный loop должен жить поверх устойчивой оркестрации: каждый шаг сохраняется, ошибки повторяются с нужного места, события не теряются, а dev утром видит все запуски, inputs, outputs и ретраи.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1🔥1
Semble (5.3к ⭐ ) - быстрый поиск по коду для AI-агентов.
Агент спрашивает:
Что умеет:
🔵 работает локально на CPU, без API-ключей и внешних сервисов;
🔵 подключается как MCP server, CLI или отдельный подагент;
🔵 подходит для Claude Code, Codex, Cursor, OpenCode и VS Code;
🔵 по бенчмаркам авторов экономит до 98% токенов против
Как установить - тут
Product Manager Skills (5.2к⭐ ) - библиотека продуктовых скиллов для Claude Code, Cowork, Codex и других агентов.
Внутри 50+ скиллов для исследование проблемы, PRD, roadmap, приоритизации, пользовательских сценариев, стратегии, роста и продуктовых метрик.
Самые полезные:
🔵
🔵
🔵
🔵
Готовые сценарии:
🔵
🔵
🔵
Чат
Агент спрашивает:
Как в проекте устроена аутентификация? - и получает нужные фрагменты кода без долгого чтения всего репозитория.Что умеет:
grep + read.Как установить - тут
Product Manager Skills (5.2к
Внутри 50+ скиллов для исследование проблемы, PRD, roadmap, приоритизации, пользовательских сценариев, стратегии, роста и продуктовых метрик.
Самые полезные:
discovery-process - помогает пройти путь от гипотезы до плана проверкиprioritization-advisor - подбирает способ приоритизации под вашу ситуациюprd-development - собирает PRD, который можно отдавать командеroadmap-planning - превращает цели и инициативы в понятный план релизовГотовые сценарии:
/discover - разобраться в проблеме, собрать вопросы и выбрать проверки/write-prd - превратить идею в PRD и первые пользовательские сценарии/strategy - собрать позиционирование, проблему, варианты решений и roadmapЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Bayer показала, как выглядит агентный RAG в проде.
PRINCE помогает исследователям работать с доклиническими данными: уточняет запрос, ищет по PDF-отчетам через RAG, ходит в структурированные данные через Text-to-SQL, проверяет полноту фактов и собирает ответ с цитатами.
📎 Как выглядит надежная агентская ИИ-система
ЧАТ
PRINCE помогает исследователям работать с доклиническими данными: уточняет запрос, ищет по PDF-отчетам через RAG, ходит в структурированные данные через Text-to-SQL, проверяет полноту фактов и собирает ответ с цитатами.
ЧАТ
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Как Bayer строит надежную агентную ИИ-систему для доклинических исследований
Доклиническая разработка лекарств держится на огромном массиве данных: отчеты исследований, таблицы, исторические PDF, регуляторные документы, публикации, метаданные из разных лабораторий и внутренних систем. Для исследователя главная сложность часто звучит…
👍4
Graphify (70к ⭐ ) - карта проекта для AI-агентов
Агентам постоянно приходится заново читать файлы, искать по репозиторию и тратить контекст на куски кода. Graphify решает это через граф знаний: один раз строит карту проекта, а потом агент спрашивает ее вместо бесконечного
После запуска
-
-
-
Что интересно внутри:
🔵 код парсится локально через
🔵 docs, PDF, изображения, видео и Google Workspace можно добавлять в тот же граф
🔵 есть MCP-сервер с инструментами
🔵 поддерживаются Claude Code, Codex, OpenCode, Cursor, Kilo Code, Hermes, OpenClaw, Gemini CLI, Devin CLI и другие агенты
🔵 можно поставить hooks, чтобы после коммитов граф обновлялся сам
Установка:
Для команд это особенно кдобно:
Бонусом статья -📎 Второй мозг в Claude на Obsidian: практический гайд
ЧАТ
Агентам постоянно приходится заново читать файлы, искать по репозиторию и тратить контекст на куски кода. Graphify решает это через граф знаний: один раз строит карту проекта, а потом агент спрашивает ее вместо бесконечного
grep и чтения файлов.После запуска
/graphify . появляются три артефакта:-
graph.html интерактивная карта в браузере-
GRAPH_REPORT.md понятный отчет с главными узлами, связями и вопросами-
graph.json граф, который агент может спрашивать через CLI или MCPЧто интересно внутри:
tree-sitter: классы, функции, импорты, вызовы, SQL-схемы и связиquery_graph, get_node, shortest_path, list_prs, get_pr_impactУстановка:
uv tool install graphifyy graphify install /graphify .Для команд это особенно кдобно:
graphify-out/ можно коммитить в репозиторий, и новые агентные сессии сразу получают готовую память проекта. Агент видит, где авторизация, где база, какие модули связаны, какие PR задевают те же части системы и где может быть конфликт.Бонусом статья -
ЧАТ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2
Продолжаем изучать тему лупов ✍️
🔵 AI loops: что это такое и где они реально работают
База: что такое loop, зачем нужны проверка, состояние и лимиты, где это помогает, а где просто сжигает токены.
Подойдет тем, кто пока использует ИИ через одиночные запросы и хочет понять следующий уровень.
🔵 Loop engineering: как заставить агента кодить ночью и не сжечь бюджет
Практика для разработки:
Подойдет разработчикам и тимлидам, которые хотят запускать кодинг агентов в репозитории безопаснее.
🔵 Один loop, 259 PR в месяц: практическая схема loop engineering
Схема полноценного loop: 6 частей, первые задачи, ограничители, типичные сбои и дешевые альтернативы.
Начинайте с маленького повторяемого процесса, где есть автоматическая проверка, лимит шагов и понятный результат.
чат
База: что такое loop, зачем нужны проверка, состояние и лимиты, где это помогает, а где просто сжигает токены.
Подойдет тем, кто пока использует ИИ через одиночные запросы и хочет понять следующий уровень.
Практика для разработки:
STATUS.md, skills, worktrees, MCP, субагенты, бюджетные стопы и утренний отчет вместо стены логов.Подойдет разработчикам и тимлидам, которые хотят запускать кодинг агентов в репозитории безопаснее.
Схема полноценного loop: 6 частей, первые задачи, ограничители, типичные сбои и дешевые альтернативы.
Начинайте с маленького повторяемого процесса, где есть автоматическая проверка, лимит шагов и понятный результат.
чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
SOUL.md, skills, MCP, sub-agents, cron jobs, профили и отдельные рабочие агенты под разные задачи.Самый интересный момент начинается после cron jobs. Если агент каждый день приносит результат, он должен учиться на обратной связи.
Для этого есть
Сначала доведите Hermes до уровня, где он стабильно делает работу без ручного вмешательства. Потом добавляйте лупы, чтобы они улучшали workflow, а не просто запускал старые задачи по расписанию.
чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥3
Если пользуетесь Codex CLI - проверьте
В Codex нашли неприятный баг с локальными логами: CLI слишком подробно писал
В issue #28224 один сетап экстраполировали до ~640 TB записей в год на SSD. Размер файла при этом может не выглядеть страшно: WAL крутится и перезаписывается, а износ диска всё равно происходит.
Если файлы уже разрослись, закройте Codex и удалите их:
Фикс уже вошёл в обновление 0.142.0
чат
~/.codexВ Codex нашли неприятный баг с локальными логами: CLI слишком подробно писал
TRACE/WebSocket/telemetry события в SQLite:~/.codex/logs_2.sqlite
~/.codex/logs_2.sqlite-wal
~/.codex/logs_2.sqlite-shm
В issue #28224 один сетап экстраполировали до ~640 TB записей в год на SSD. Размер файла при этом может не выглядеть страшно: WAL крутится и перезаписывается, а износ диска всё равно происходит.
Если файлы уже разрослись, закройте Codex и удалите их:
rm -f ~/.codex/logs_2.sqlite*
Фикс уже вошёл в обновление 0.142.0
чат
😱2
Looper (188 ⭐️) - скилл, который помогает спроектировать loop до запуска.
Если плохо описать
Вы запускаете
🔵 цель и контекст
🔵 что считается готовым результатом
🔵 проверки: команда, модель-судья или человек
🔵 отдельный reviewer/судья, например Claude проверяет работу Codex
🔵 лимиты по итерациям, времени, токенам и “нет прогресса”
🔵 файлы состояния:
Loop становится видимым артефактом. Его можно прочитать, поправить, переиспользовать, закоммитить и только потом запускать.
чат
Если плохо описать
/goal или /loop, агент быстро сожжет токены и будет уверенно крутиться вокруг плохой задачи. Looper добавляет шаг - сначала собирает нормальный цикл, потом отдает его Claude Code или другому агенту.Вы запускаете
/looper, а он интервьюирует вас по ключевым частям:state.json, run-log.md, loop.yaml, RUN_IN_SESSION.mdLoop становится видимым артефактом. Его можно прочитать, поправить, переиспользовать, закоммитить и только потом запускать.
чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла новая японская модель Sakana Fugu (arxiv), навела шуму знатно, в X - 25 млн просмотров
Самая интересная часть - оркестрация🔄
Снаружи это один API: вызываешь
Полный пул моделей Sakana не раскрывает. В отчете фигурируют GPT-5.5, Claude Opus 4.8 и Gemini 3.1 Pro, но точные версии, правила маршрутизации и внутренние промпты закрыты.
У обычного Fugu логика ближе к умному роутингу: выбрать подходящую модель под шаг задачи.
У Fugu Ultra - полноценный workflow: несколько агентов, роли, промежуточные ответы, проверка, синтез.
Типичный паттерн из отчета: GPT строит решение, Opus приходит на этап дебага и находит уязвимости, после чего результат дорабатывается. В других задачах Fugu может устраивать дебаты, вызывать специалиста по теме или даже рекурсивно подключать Fugu как еще одного участника команды.
Установщик для Codex:
потом:
Цены на api:
Если контекст больше 272К, то 10$ Input, 45$ Output, 1$ Cache.
И есть подписка 20/100/200$. До конца июля получаете второй месяц бесплатно.
Теперь можно иметь свою фронтир модель, не имея модели💃
чат
Самая интересная часть - оркестрация
Снаружи это один API: вызываешь
fugu или fugu-ultra, как обычную модель. Внутри Fugu решает, кого из агентного пула подключить, кому отдать подзадачу, где нужна проверка, а где достаточно одного сильного worker-а.Полный пул моделей Sakana не раскрывает. В отчете фигурируют GPT-5.5, Claude Opus 4.8 и Gemini 3.1 Pro, но точные версии, правила маршрутизации и внутренние промпты закрыты.
У обычного Fugu логика ближе к умному роутингу: выбрать подходящую модель под шаг задачи.
У Fugu Ultra - полноценный workflow: несколько агентов, роли, промежуточные ответы, проверка, синтез.
Типичный паттерн из отчета: GPT строит решение, Opus приходит на этап дебага и находит уязвимости, после чего результат дорабатывается. В других задачах Fugu может устраивать дебаты, вызывать специалиста по теме или даже рекурсивно подключать Fugu как еще одного участника команды.
Установщик для Codex:
curl -fsSL https://sakana.ai/fugu/install | bashпотом:
codex-fuguЦены на api:
fugu - вы платите только по стандартной ставке для конкретной базовой модели.fugu-ultra - 5$ Input, 30$ Output, 0.5$ Cache. Если контекст больше 272К, то 10$ Input, 45$ Output, 1$ Cache.
И есть подписка 20/100/200$. До конца июля получаете второй месяц бесплатно.
Теперь можно иметь свою фронтир модель, не имея модели
чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Agent получил команду
Hermes сам собирает контекст, пишет файл
Документация /learn
Чтобы команда появилась, обновитесь через👍
чат
/learn, которая превращает документы, репозитории и рабочие процессы в навыки.Hermes сам собирает контекст, пишет файл
SKILL.md по стандарту и сохраняет его для будущих задач.Документация /learn
Чтобы команда появилась, обновитесь через
/update и выполните /restart. У меня он почему-то решил не перезагружаться в этот раз чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
OpenRouter MCP - живой каталог моделей для агентов
Подключаете его к Claude Code, Codex CLI, OpenCode или Cursor - и агент может сам спросить: какая модель сейчас лучше для кода, JSON extraction, длинных документов, дизайна, reranking, speech-to-text или дешевого прогона.
Что внутри:
🔵
🔵
🔵
🔵
🔵
Подключение простое:
или для Codex:
Авторизация идет через OAuth. OpenRouter создает отдельный ключ только для MCP, по умолчанию на 7 дней и с лимитом $10. Почти все инструменты только читают данные. Платным становится
чат
Подключаете его к Claude Code, Codex CLI, OpenCode или Cursor - и агент может сам спросить: какая модель сейчас лучше для кода, JSON extraction, длинных документов, дизайна, reranking, speech-to-text или дешевого прогона.
Что внутри:
models-list, model-get, model-endpoints - живой каталог моделей, цены, контекст, модальности, провайдеры, latency, throughput и data policybenchmarks и rankings-daily - оценки из Artificial Analysis, Design Arena и тренды по использованиюchat-send - можно отправить тестовый запрос в несколько моделей и сравнить ответ, стоимость и провайдераgeneration-get - показывает точную цену, токены и endpoint конкретного прогонаdocs-search, credits-get, providers-list - поиск по документации, баланс и настройки маршрутизацииПодключение простое:
claude mcp add --transport http openrouter https://mcp.openrouter.ai/mcp
claude mcp login openrouter
или для Codex:
codex mcp add openrouter --url https://mcp.openrouter.ai/mcp
codex mcp login openrouter
Авторизация идет через OAuth. OpenRouter создает отдельный ключ только для MCP, по умолчанию на 7 дней и с лимитом $10. Почти все инструменты только читают данные. Платным становится
chat-send, потому что он реально вызывает модели.чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Как AI-агенты учатся после каждого запуска 😘
Обычно все смотрят на модель и веса. Но в продуктах быстрее работают другие слои: harness, проверки, память, навыки и действия пользователей.
Самая сильная часть - агент может учиться на правках человека. Менеджер одобрил возврат, который агент завернул, причина попала в процедурную память, следующий похожий кейс обрабатывается умнее.
Разбор Karpathy AutoResearch, SEAL, AlphaEvolve, Hermes, OpenClaw, Anthropic Skills и AG-UI в одной статье:
📎 Как AI-агенты учатся на практике
чат
Обычно все смотрят на модель и веса. Но в продуктах быстрее работают другие слои: harness, проверки, память, навыки и действия пользователей.
Самая сильная часть - агент может учиться на правках человека. Менеджер одобрил возврат, который агент завернул, причина попала в процедурную память, следующий похожий кейс обрабатывается умнее.
Разбор Karpathy AutoResearch, SEAL, AlphaEvolve, Hermes, OpenClaw, Anthropic Skills и AG-UI в одной статье:
чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3