This media is not supported in your browser
VIEW IN TELEGRAM
GitHub Copilot app - панель управления агентами для разработки 📱
GitHub открыл preview Copilot app для платных Copilot-планов. Приложение есть для macOS, Windows и Linux.
У Codex app и Claude Desktop, кстати, нету версии под Linux.
Главные фишки:
🔵 Задача > PR > проверки > merge внутри GitHub
Сессию можно запустить из issue, pull request, промта или прошлой сессии. Агент сразу видит контекст GitHub: репозиторий, обсуждение, PR, проверки, поиск по коду и историю работы.
🔵 Agent Merge
Copilot может довести PR до конца: ответить на комментарии, исправить замечания, разобраться с упавшими проверками и учесть правила merge.
Вы задаете условия, а агент мержит только когда все требования выполнены.
🔵 Canvas вместо бесконечного чата
Работа агента показывается как рабочее полотно: план, PR, терминал, браузерная сессия, чеклист релиза, панель состояния или процесс выполнения.
Можно править, переставлять блоки, одобрять шаги и перенаправлять агента прямо там, а не вылавливать нужное место в длинной переписке.
🔵 My Work как диспетчер задач для агентов
В одном окне видны активные сессии, issues, pull requests и фоновые автоматизации по подключенным репозиториям.
🔵 Разные агенты внутри одного GitHub-сценария
GitHub заявляет доступ к сторонним агентам, включая Claude Code и Codex, плюс партнерские agent приложения.
Чат
GitHub открыл preview Copilot app для платных Copilot-планов. Приложение есть для macOS, Windows и Linux.
У Codex app и Claude Desktop, кстати, нету версии под Linux.
Главные фишки:
Сессию можно запустить из issue, pull request, промта или прошлой сессии. Агент сразу видит контекст GitHub: репозиторий, обсуждение, PR, проверки, поиск по коду и историю работы.
Copilot может довести PR до конца: ответить на комментарии, исправить замечания, разобраться с упавшими проверками и учесть правила merge.
Вы задаете условия, а агент мержит только когда все требования выполнены.
Работа агента показывается как рабочее полотно: план, PR, терминал, браузерная сессия, чеклист релиза, панель состояния или процесс выполнения.
Можно править, переставлять блоки, одобрять шаги и перенаправлять агента прямо там, а не вылавливать нужное место в длинной переписке.
В одном окне видны активные сессии, issues, pull requests и фоновые автоматизации по подключенным репозиториям.
GitHub заявляет доступ к сторонним агентам, включая Claude Code и Codex, плюс партнерские agent приложения.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Это open-source кодинг агент, на базе OpenCode.
В комплекте есть MiMo Auto - временно бесплатный режим на MiMo-V2.5 с контекстом до 1M токенов. Еще можно войти через Xiaomi MiMo, импортировать конфиг Claude Code или подключить других провайдеров.
Что интересного:
На каждом шаге агент делает 5 независимых черновиков: рассуждение + план вызова инструментов, без исполнения. Потом судья выбирает лучший вариант, и выполняется только он.
Xiaomi пишет про +10-20% на SWE-Bench Pro, цена - примерно 4-5x токенов. Фича экспериментальная.
/goal задает условие остановки. Перед завершением отдельный судья проверяет, правда ли задача выполнена.За память отвечает отдельный checkpoint-writer. Он пишет
checkpoint.md, поднимает стабильные факты в MEMORY.md, хранит полный трейс в SQLite и разбирает notes.md, куда основной агент может скидывать находки.Когда контекст заполняется, сессия пересобирается из todo, чекпоинта, последних сообщений пользователя и памяти. Так они делают свою версию “безлимитного контекста”.
Отдельный режим рядом с build/plan. По сути встроенный флоу в стиле Superpowers skills.
Compose-агент прогоняет задачу через навыки вроде
compose:brainstorm, compose:plan, compose:tdd, compose:execute, compose:review, compose:verify, compose:merge.Это как specs-driven development: от спеки до реализации, проверки и мержа. То есть в harness сразу встроили процесс разработки, за это лайк.
Для больших задач есть JS-оркестрация:
agent(), parallel(), pipeline(), workflow(). Параллельные подагенты и логика процесса живут в исполняемом сценарии, поэтому сложные флоу меньше завязаны на то, удержит ли модель порядок шагов.Dream раз в 7 дней чистит и мержит проектную память. Distill раз в 30 дней ищет повторяющиеся процессы и превращает их в skills, команды, агентов и SOP.Выглядит как один из самых интересных свежих кодинг агентов: Xiaomi собрала агентную систему для длинных задач с памятью, проверкой завершения, режимом разработки SDD и параллельной оркестрацией.
Из нюансов: вы сразу не увидите модель GPT 5.5, потому что они используют плагин для OAuth ChatGPT в котором этой модели нет. Но сам mimo GPT 5.4 смог сделать патч, после чего модель стала доступна.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Agent добавил Automation Blueprints - шаблоны для cron-автоматизаций 🔱
Под капотом Hermes также создает обычную cron-задачу. Отличие в том, как она появляется.
Раньше нужно было собрать команду: расписание, длинный промпт, доставку, навыки, скрипт, условия молчания. Например: “каждый будний день в 18:00 собери новостной дайджест, проверь источники, убери повторы”.
Теперь это можно упаковать в Blueprint: готовый сценарий с понятными полями.
В приложении это выглядит как форма: выбрать шаблон, заполнить тему, время, канал доставки и нажать
В Telegram/CLI/TUI можно написать:
Hermes сам спросит недостающие параметры, покажет, что именно будет создано, и попросит подтверждение.
Есть готовые пресеты:
🔵 утренний брифинг
🔵 мониторинг важной почты
🔵 еженедельный обзор
🔵 дайджест по теме
🔵 напоминания и привычки
🔵 проверки деплоя, алертов, PR и CI через webhook-сценарии
Кастомные Blueprints тоже можно делать самому: это обычный Hermes Skill с блоком
Чат
Под капотом Hermes также создает обычную cron-задачу. Отличие в том, как она появляется.
Раньше нужно было собрать команду: расписание, длинный промпт, доставку, навыки, скрипт, условия молчания. Например: “каждый будний день в 18:00 собери новостной дайджест, проверь источники, убери повторы”.
Теперь это можно упаковать в Blueprint: готовый сценарий с понятными полями.
В приложении это выглядит как форма: выбрать шаблон, заполнить тему, время, канал доставки и нажать
Schedule it.В Telegram/CLI/TUI можно написать:
/blueprint news-digestHermes сам спросит недостающие параметры, покажет, что именно будет создано, и попросит подтверждение.
Есть готовые пресеты:
Кастомные Blueprints тоже можно делать самому: это обычный Hermes Skill с блоком
metadata.hermes.blueprint в SKILL.md. То есть повторяемый процесс можно превратить в кнопку, форму или короткую команду из мессенджера.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2
Почему одни AI-агенты реально помогают, а другие только дергают инструменты
Тут речь не про локальные модели и не про очередной фреймворк. Статья про обвязку вокруг модели: системные инструкции, инструменты, навыки, справки и сырой API, из которых складывается рабочий агент.
Автор разбирает это на примере агента для электронных таблиц. Такой агент должен не просто “уметь вызвать API”, а понимать таблицу, сжимать большие диапазоны, показывать последствия своих изменений и быстро находить редкие возможности без раздувания контекста.
В комментариях автор добавил хороший пример: сводные таблицы могут встречаться меньше чем в 2% запросов, но когда они срабатывают, пользователи очень ценят результат. Поэтому сильный агент строится не только вокруг частых действий, но и вокруг того, какие редкие возможности дают большой выигрыш.
Я адаптировал статью на русский:📎 Как строить вертикальных агентов, которые действительно работают
Чат
Тут речь не про локальные модели и не про очередной фреймворк. Статья про обвязку вокруг модели: системные инструкции, инструменты, навыки, справки и сырой API, из которых складывается рабочий агент.
Автор разбирает это на примере агента для электронных таблиц. Такой агент должен не просто “уметь вызвать API”, а понимать таблицу, сжимать большие диапазоны, показывать последствия своих изменений и быстро находить редкие возможности без раздувания контекста.
В комментариях автор добавил хороший пример: сводные таблицы могут встречаться меньше чем в 2% запросов, но когда они срабатывают, пользователи очень ценят результат. Поэтому сильный агент строится не только вокруг частых действий, но и вокруг того, какие редкие возможности дают большой выигрыш.
Я адаптировал статью на русский:
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Как строить вертикальных агентов, которые действительно работают
Вертикальный агент - это агент под конкретный класс задач: электронные таблицы, финансовые расчеты, продажи, юридические документы, DevOps или другую повторяющуюся работу. Он должен выигрывать там, где пользователь быстро видит разницу между почти правильным…
🔥5❤2
Свежие новости 🗞
🔵 Anthropic успела громко выпустить Fable 5, а потом почти сразу выключила Fable 5 и Mythos 5. Причина - директива правительства США.
🔵 Google показал Open Knowledge Format - стандарт для знаний, которые читают люди и агенты.
По сути это папки с Markdown, YAML и ссылками между файлами. Документацию, процессы, метрики, глоссарии и рабочий контекст можно держать в обычном репозитории. Спека уже на GitHub.
🔵 Lee Robinson из Cursor написал статью про recursive agent systems.
В Cursor тысячи агентов помогают тренировать следующую версию Composer. Главный агент сидит на мощной удаленной машине, подключается к машинам с дочерними агентами, собирает их статусы в общий inbox-файл, перезапускает сломанные процессы и зовет людей в Slack или PagerDuty, когда что-то пошло не так.
Звучит как нормальная инфраструктура для ML-команды будущего: исследователь дает направление, а облачные агенты гоняют эксперименты и сами находят проблемы.
🔵 И практичная находка - pm-skills 17.2к⭐
Это набор скиллов для продуктовой работы: исследование, стратегия, приоритизация, запуск, рост и работа с кодом.
Чат
По сути это папки с Markdown, YAML и ссылками между файлами. Документацию, процессы, метрики, глоссарии и рабочий контекст можно держать в обычном репозитории. Спека уже на GitHub.
В Cursor тысячи агентов помогают тренировать следующую версию Composer. Главный агент сидит на мощной удаленной машине, подключается к машинам с дочерними агентами, собирает их статусы в общий inbox-файл, перезапускает сломанные процессы и зовет людей в Slack или PagerDuty, когда что-то пошло не так.
Звучит как нормальная инфраструктура для ML-команды будущего: исследователь дает направление, а облачные агенты гоняют эксперименты и сами находят проблемы.
Это набор скиллов для продуктовой работы: исследование, стратегия, приоритизация, запуск, рост и работа с кодом.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
SOUL.md в Hermes Agent: как 50 строк задают характер агента
SOUL.md в Hermes Agent задает базовую личность агента: кем он себя считает, как говорит, где спорит, когда действует сам и когда просит подтверждение. Файл стоит в первом слоте системного запроса, поэтому влияет на все последующие слои: инструменты, навыки…
👍7🔥2
Пара интересных репозиториев 💻
🔵 Agent Reach - интернет-доступ для агента
Репозиторий ставит агенту готовые маршруты к YouTube, GitHub, RSS, V2EX, Bilibili, Twitter/X, Reddit, XiaoHongShu, LinkedIn, Xueqiu и другим источникам.
Агент запускает
Для примера, как устроена авторизация:
X/Twitter
- для расширенных сценариев нужны cookies;
- пользователь заходит в X в браузере;
- через Cookie-Editor экспортирует
- агент сохраняет это командой
- локально можно попробовать автоизвлечение из Chrome через
Reddit
- zero-config пути нет: анонимные интерфейсы заблокированы, официальный API требует ручного доступа;
- на десктопе рекомендуют OpenCLI, который использует уже существующую браузерную сессию;
- на сервере или без браузера - rdt-cli + cookies, обычно через
🔵 Ponytail - Заставляет вашего ИИ-агента думать как самый ленивый senior dev в комнате.
Это навык и набор адаптеров для Claude Code, Codex, OpenCode, Pi, Cursor, Windsurf, Cline, Copilot и Kiro.
Перед тем как писать код, агент проходит простую лестницу:
- это вообще нужно делать?
- есть ли готовое в стандартной библиотеке?
- есть ли нативная возможность платформы?
- уже стоит зависимость, которая это умеет?
- можно ли решить одной строкой?
- только потом - минимум кода, который работает.
Есть режимы
Чат
Репозиторий ставит агенту готовые маршруты к YouTube, GitHub, RSS, V2EX, Bilibili, Twitter/X, Reddit, XiaoHongShu, LinkedIn, Xueqiu и другим источникам.
Агент запускает
agent-reach doctor, видит, какой backend сейчас рабочий, и дальше использует нужный CLI или MCP-инструмент.Для примера, как устроена авторизация:
X/Twitter
- для расширенных сценариев нужны cookies;
- пользователь заходит в X в браузере;
- через Cookie-Editor экспортирует
Header String;- агент сохраняет это командой
agent-reach configure twitter-cookies "..."- локально можно попробовать автоизвлечение из Chrome через
agent-reach configure --from-browser chrome.- zero-config пути нет: анонимные интерфейсы заблокированы, официальный API требует ручного доступа;
- на десктопе рекомендуют OpenCLI, который использует уже существующую браузерную сессию;
- на сервере или без браузера - rdt-cli + cookies, обычно через
rdt login.Это навык и набор адаптеров для Claude Code, Codex, OpenCode, Pi, Cursor, Windsurf, Cline, Copilot и Kiro.
Перед тем как писать код, агент проходит простую лестницу:
- это вообще нужно делать?
- есть ли готовое в стандартной библиотеке?
- есть ли нативная возможность платформы?
- уже стоит зависимость, которая это умеет?
- можно ли решить одной строкой?
- только потом - минимум кода, который работает.
Есть режимы
lite/full/ultra и отдельный ponytail-review, который ищет, что удалить из диффа: лишние зависимости, абстракции на будущее, самописные версии стандартной библиотеки и код “на всякий случай”.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
codex-lb 1.9к⭐ - слой управления для Codex и ChatGPT аккаунтов
Самостоятельный прокси для тех, кто запускает Codex CLI, OpenCode, OpenClaw или своих агентов через OpenAI-совместимый API.
Сервис поднимает локальный API на
Что есть внутри:
🔵 OAuth-добавление аккаунтов и автообновление токенов
🔵 API-ключи для клиентов с лимитами по модели, токенам, стоимости и сроку
🔵 закрепление сессий за аккаунтом, переключение при сбоях и прогрев лимитов
🔵 поддержка WebSocket/SSE,
🔵 Docker,
Чат
Самостоятельный прокси для тех, кто запускает Codex CLI, OpenCode, OpenClaw или своих агентов через OpenAI-совместимый API.
Сервис поднимает локальный API на
:2455, принимает /v1 и /backend-api/codex, распределяет запросы по пулу своих ChatGPT аккаунтов и показывает расход в панели управления: токены, стоимость, лимитные окна, здоровье аккаунтов, последние запросы и отчеты.Что есть внутри:
/v1/responses, /v1/chat/completions, файлов, изображений и аудиоuvx codex-lb, Helm, SQLite по умолчанию и PostgreSQL для боевого запускаЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
/goal можно использовать не только вручную Можно попросить вашего агента заспавнить нового агента и назначить ему цель.
Проверил: работает не только в Codex, но и в OpenClaw и Hermes.
Также в комментариях поделились таким шаблоном:
Создай [объект] в [технологии/фреймворке]. Он должен включать [основные функции] с [деталями взаимодействия/анимации/поведения]. Создай [настроение/качество] с помощью [визуальных деталей], [деталей окружения] и [дополнительных эффектов]. Выведи результат в [формате/типе файла].
Для этой задачи напиши себе новую цель и запустите агентов параллельно — столько, сколько потребуется для более эффективного и быстрого выполнения. Раздели работу на независимые части, запускай их одновременно и синтезируй результаты по мере их поступления. Назначь каждому агенту свою собственную цель.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Omnigent 1.8к⭐ - общий слой для Claude Code, Codex, Pi и своих AI-агентов
Свежий репозиторий, создан 11 июня. Идея в том, чтобы запускать разные агентные обвязки через один CLI, сервер и веб-интерфейс. Агент может стартовать в терминале, продолжить в браузере или на телефоне, а сессия сохраняет сообщения, субагентов, терминалы и файлы.
Что внутри:
🔵 CLI
🔵 веб-интерфейс и приложение для macOS
🔵 YAML-спеки для своих агентов: промпт, модель, инструменты, MCP, подагенты, терминалы, доступ к файловой системе
🔵 сервер с сессиями,
🔵 политики для контроля агентов: подтверждение shell/file действий, лимиты инструментов, бюджет, GitHub/Google-доступ, риск-скоринг
🔵 sandbox через
🔵 MCP через stdio, SSE и Streamable HTTP
🔵 деплой через Docker, Render, Railway, Fly, Modal, Hugging Face Spaces
Самое интересное в примерах.
Архитектура тоже здраво разделена: сервер хранит историю, права, UI и координацию, а раннер выполняет агентный цикл на вашей машине или в облачном sandbox.
Чат
Свежий репозиторий, создан 11 июня. Идея в том, чтобы запускать разные агентные обвязки через один CLI, сервер и веб-интерфейс. Агент может стартовать в терминале, продолжить в браузере или на телефоне, а сессия сохраняет сообщения, субагентов, терминалы и файлы.
Что внутри:
omnigent / omnigent claude, omnigent codexfork, attach, шарингом, комментариями, правами и APIbubblewrap на Linux и seatbelt на macOSСамое интересное в примерах.
Polly - агент-техлид для разработки. Он сам код не пишет: раскладывает задачу на подагентов Claude Code, Codex и Pi, запускает их в отдельных git worktree, требует ревью другим поставщиком и отдаёт PR человеку.Debby - двухголовый брейнсторминг. Один ответ идёт от Claude, второй от GPT, потом можно включить debate skill и заставить модели покритиковать друг друга перед финальной сводкой.Архитектура тоже здраво разделена: сервер хранит историю, права, UI и координацию, а раннер выполняет агентный цикл на вашей машине или в облачном sandbox.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
agentmemory 23к⭐ - память для кодинг-агентов
Обычная память агента часто сводится к
agentmemory делает отдельный слой памяти для рабочих фактов: что уже пробовали, какие решения приняли, где была ошибка, какие файлы трогали, чем закончилась прошлая сессия.
Как это устроено:
🔵 хуки агента ловят события: старт сессии, запрос пользователя, вызовы инструментов, ошибки, compact, stop
🔵 сырые наблюдения чистятся от секретов, сжимаются и превращаются в факты, концепты, связи и краткие самари
🔵 поиск идет не только по ключевым словам, а через BM25 + векторы + граф связей
🔵 перед новой сессией агент может получить только релевантные куски памяти, а не весь архив подряд
Что дают MCP и skills:
Через MCP - Claude Code, Codex, Cursor, OpenCode, Hermes и другие получают инструменты вроде
skills - это инструкция агенту, когда этими MCP пользоваться. Без skills модель может видеть инструменты, но не понимать, в каких ситуациях нужно сохранить решение или поднять прошлый контекст.
Самый быстрый старт:
Работает почти со всеми агентами.
По умолчанию может работать без LLM-провайдера - тогда память работает через BM25 и локальные embeddings. Чтобы она полноценно заработала, нужно подключить обычную модель, советуют использовать не топовые. Например:
Чат
Обычная память агента часто сводится к
CLAUDE.md / AGENTS.md - статичные правила проекта. Хорошо для “как писать код”, плохо для истории работы.agentmemory делает отдельный слой памяти для рабочих фактов: что уже пробовали, какие решения приняли, где была ошибка, какие файлы трогали, чем закончилась прошлая сессия.
Как это устроено:
Что дают MCP и skills:
Через MCP - Claude Code, Codex, Cursor, OpenCode, Hermes и другие получают инструменты вроде
memory_save, memory_smart_search, memory_sessions, memory_timeline.skills - это инструкция агенту, когда этими MCP пользоваться. Без skills модель может видеть инструменты, но не понимать, в каких ситуациях нужно сохранить решение или поднять прошлый контекст.
Самый быстрый старт:
npm install -g @agentmemory/agentmemory
agentmemory
agentmemory connect claude-code
npx skills add rohitg00/agentmemory -y
Работает почти со всеми агентами.
По умолчанию может работать без LLM-провайдера - тогда память работает через BM25 и локальные embeddings. Чтобы она полноценно заработала, нужно подключить обычную модель, советуют использовать не топовые. Например:
deepseek/deepseek-v4-pro и qwen/qwen3-coderЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Factory 2.0 - кодинг-агенты превращаются в фабрику разработки 💃
Factory.ai, команда создавшая агента Droid, показала Factory 2.0.
Если ускорить только написание кода, бутылочные горлышки переедут в разбор задач, тесты, ревью, релизы, деплой и мониторинг. Поэтому Factory предлагает смотреть на весь цикл разработки как на одну агентную систему.
Входом может быть багрепорт, сообщение от клиента, внутренняя хотелка или бизнес-требование. Дальше это проходит через разбор, план, код, тесты, ревью, релиз, наблюдение и снова возвращается в цикл как новые сигналы.
Что внутри их software factory:
🔵 разные модели под разные задачи, с роутером по цене, скорости и качеству
🔵 контроль над контекстом и данными: свои ключи, свой контур данных, отдельный регион или закрытая сеть
🔵 общая память и контекст для ревью, безопасности, QA, документации и инцидентов
🔵 панель управления в Factory Desktop App: очереди, триаж тикетов, PR-проверки, деплои, мониторинг и узкие места
По словам Factory, такие фабрики уже работают у NVIDIA, EY, Adobe, Palo Alto Networks, Adyen, Blackstone, Wipro и Comarch.
Самое интересное тут направление. Кодинг-агент решает кусок работы. Следующий слой - система вокруг него: задачи, права, логи, проверки, память, отчеты и понятная панель по всей цепочке.
Чат
Factory.ai, команда создавшая агента Droid, показала Factory 2.0.
Если ускорить только написание кода, бутылочные горлышки переедут в разбор задач, тесты, ревью, релизы, деплой и мониторинг. Поэтому Factory предлагает смотреть на весь цикл разработки как на одну агентную систему.
Входом может быть багрепорт, сообщение от клиента, внутренняя хотелка или бизнес-требование. Дальше это проходит через разбор, план, код, тесты, ревью, релиз, наблюдение и снова возвращается в цикл как новые сигналы.
Что внутри их software factory:
По словам Factory, такие фабрики уже работают у NVIDIA, EY, Adobe, Palo Alto Networks, Adyen, Blackstone, Wipro и Comarch.
Самое интересное тут направление. Кодинг-агент решает кусок работы. Следующий слой - система вокруг него: задачи, права, логи, проверки, память, отчеты и понятная панель по всей цепочке.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Самое важное:
Также, чтобы вы не скучали, перевел две статьи, первая продвинутая, вторая попроще:
@Computer, @Chrome, @Browser, а когда лучше идти через плагин или MCP.Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Uncle Bob (автор книги Clean Code) выкатил свой агентный оркестратор для разработки: локальная связка
tmux, git worktree, Babashka-скриптов и файловой "почты" между агентами.Самое необычное - проект разложен по веткам.
main хранит документацию и общие скрипты, а рабочие флоу лежат отдельно:-
two-pack - быстрый цикл coder -> cleaner -> coder-
four-pack - спецификация, код, рефакторинг, архитектура-
six-pack - полный конвейер specifier -> coder -> cleaner -> architect -> hardender -> QA-
adversaries - отдельный цикл coder <-> reviewer, где ревьюер гоняет кодера до approvalКаждая роль запускается как отдельный агент в своей
tmux-сессии и своем git worktree. В конфиге можно выбрать CLI для роли: codex, claude, copilot, grok. По умолчанию примеры идут на Codex.Интересная часть - handoff-протокол. Агенты не шлют друг другу длинные сообщения в чат. Они кладут маленькие типизированные файлы в outbox:
git_handoff, note, awake. Демон проверяет формат, раскладывает задачи по inbox получателей и будит нужную tmux-сессию.По сути это не "рой агентов, которым дали общий промпт", а инженерный конвейер с ролями, очередями, коммитами, приоритетами и аудитом.
В полном
six-pack чувствуется почерк Дяди Боба: Gherkin-спеки, TDD, acceptance tests, CRAP/DRY, mutation testing, архитектурные границы, финальная QA-проверка через пользовательский интерфейс.Клевая идея рабочих деревьев под роли, а не под задачи. Агент не просто берет тикет, он живет в своей профессиональной зоне ответственности: спецификация, код, чистка, архитектура, харденинг, QA.
Интересно взглянуть на первый коммит в репозитории. Там есть md файлы, которые описывают принципы работы и разработки самого SwarmForge, для понимания, что сувать в контекст агента для кодинга, полезно.
Как образец агентного SDLC с жесткой инженерной дисциплиной - репозиторий очень любопытный.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
SpaceX договорились купить компанию Cursor за $60 млрд. По Reuters, сделка акциями должна закрыться в Q3 2026, а Cursor становится частью большого AI-контура SpaceX/xAI.
На этом фоне Cursor запускает Origin - свой GitHub для эпохи AI-агентов. Это git-платформа, где репозиторий сразу проектируется под работу людей и множества агентов: код, ветки, ревью, фоновые задачи и агентные изменения в одном месте.
Параллельно Vercel показал Eve - open-source фреймворк для production-агентов. Главная идея простая: agent is a directory.
В папке агента лежат:
-
-
-
-
-
-
Агенты быстро обрастают собственной инфраструктурой: им уже нужен хостинг кода, очередь задач, ревью, навыки, расписания и безопасные инструменты вокруг проекта.
Чат
На этом фоне Cursor запускает Origin - свой GitHub для эпохи AI-агентов. Это git-платформа, где репозиторий сразу проектируется под работу людей и множества агентов: код, ветки, ревью, фоновые задачи и агентные изменения в одном месте.
Параллельно Vercel показал Eve - open-source фреймворк для production-агентов. Главная идея простая: agent is a directory.
В папке агента лежат:
-
instructions.md - роль и правила-
tools/ - инструменты на TypeScript-
skills/ - переиспользуемые навыки-
subagents/ - дочерние агенты-
channels/ - Slack, Discord, Teams, web-
schedules/ - запуск по расписаниюАгенты быстро обрастают собственной инфраструктурой: им уже нужен хостинг кода, очередь задач, ревью, навыки, расписания и безопасные инструменты вокруг проекта.
Чат
AGENTS.md - инструкция для AI-агентов в репозиторииСобрал понятный гайд: как писать
AGENTS.md, чтобы его понимали Codex, Claude Code, Hermes, OpenCode, OpenClaw и другие агенты.CLAUDE.mdЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🙏1
Свежие новости по агентам 📰
🔵 Codex Record & Replay - OpenAI добавил запись действий на Mac: пользователь один раз показывает процесс, а Codex превращает его в skill для повторного запуска через Computer Use, браузер и плагины.
🔵 Grok Build быстро развивается: AGENTS.md, skills, hooks, plugins, MCP, subagents, ACP, headless mode и панель сессий.
🔵 CEO-Bench - новый тест от Princeton для долгих агентных задач.
Агенту дают симулированный AI-стартап, $1M стартового баланса и 500 дней управления. Он принимает решения по продукту, рынку, клиентам и росту, видит панели с метриками, базу данных, соцсети, отчеты и историю переговоров, но скрытые параметры ему приходится выводить по косвенным сигналам: спрос, отток пользователей, удовлетворенность клиентов и действия конкурентов.
Это ближе к реальной работе агента-оператора, чем обычные coding evals. Ошибка может проявиться через недели, одно решение влияет на несколько частей системы, а “увидел метрику - внес патч” быстро ломается.
Результат пока жесткий: большинство моделей не заканчивают выше стартового $1M. На лучшем прогоне выше старта вышли Claude Fable 5, Claude Opus 4.8 и GPT-5.5, но стабильно выше старта больше одного раза оказался только Fable 5.
🔵 Основатель Howie написал сильный тред о том, как они довели AI помощника по планированию до 50% автономности.
Категория сложная для агента: если ассистент ошибся в переписке с кандидатом, инвестором или клиентом, пользователь его просто увольняет. Там слишком много редких и неприятных случаев: таймзоны, поездки, переносы, приватность календаря, разные типы встреч, моменты когда лучше спросить человека отдельно, а когда можно отвечать самому.
Команда пошла через людей в контуре проверки: собрала команду, которая ловила ошибки и помогала описывать, как должен действовать сильный личный ассистент руководителя в странных ситуациях. Потом на этом выросла карта нестандартных случаев: синтетический эталонный набор данных, проверки качества, fine-tuning, RL, ACE, DSPy, подагенты и новые версии рабочей обвязки.
Они не начинали с обещания полной автономности. Они сначала построили доверие и контроль качества, а уже потом постепенно отпускали руль. Сейчас Howie, по словам основателя, дошел до тысяч встреч в день и 50% автономности без роста оттока пользователей и жалоб.
Чат
Агенту дают симулированный AI-стартап, $1M стартового баланса и 500 дней управления. Он принимает решения по продукту, рынку, клиентам и росту, видит панели с метриками, базу данных, соцсети, отчеты и историю переговоров, но скрытые параметры ему приходится выводить по косвенным сигналам: спрос, отток пользователей, удовлетворенность клиентов и действия конкурентов.
Это ближе к реальной работе агента-оператора, чем обычные coding evals. Ошибка может проявиться через недели, одно решение влияет на несколько частей системы, а “увидел метрику - внес патч” быстро ломается.
Результат пока жесткий: большинство моделей не заканчивают выше стартового $1M. На лучшем прогоне выше старта вышли Claude Fable 5, Claude Opus 4.8 и GPT-5.5, но стабильно выше старта больше одного раза оказался только Fable 5.
Категория сложная для агента: если ассистент ошибся в переписке с кандидатом, инвестором или клиентом, пользователь его просто увольняет. Там слишком много редких и неприятных случаев: таймзоны, поездки, переносы, приватность календаря, разные типы встреч, моменты когда лучше спросить человека отдельно, а когда можно отвечать самому.
Команда пошла через людей в контуре проверки: собрала команду, которая ловила ошибки и помогала описывать, как должен действовать сильный личный ассистент руководителя в странных ситуациях. Потом на этом выросла карта нестандартных случаев: синтетический эталонный набор данных, проверки качества, fine-tuning, RL, ACE, DSPy, подагенты и новые версии рабочей обвязки.
Они не начинали с обещания полной автономности. Они сначала построили доверие и контроль качества, а уже потом постепенно отпускали руль. Сейчас Howie, по словам основателя, дошел до тысяч встреч в день и 50% автономности без роста оттока пользователей и жалоб.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Media is too big
VIEW IN TELEGRAM
Claude Code получил Artifacts 🏋️♂️ - живые страницы из сессии агента.
Теперь агент может собрать из текущей работы интерактивную страницу: PR, дашборд, чеклист релиза, карту сервиса или заметку для ревью. Страница строится из контекста сессии: код, плагины, скиллы и подключенные инструменты. Если агент продолжает работу, страница обновляется по той же ссылке.
Также перевел две хорошие статьи:
📎 Две дорожки для кодинг-агентов: спецификация и реализация - про процесс "спецификация - реализация", где важнее правильно распределить внимание человека и агента.
📎 GTM-команда на Claude Code, которой управляет один человек - про go-to-market команду из нескольких агентов: prospector, researcher, sequencer, recoverer, reporter, общая память и утренний отчет.
Чат
Теперь агент может собрать из текущей работы интерактивную страницу: PR, дашборд, чеклист релиза, карту сервиса или заметку для ревью. Страница строится из контекста сессии: код, плагины, скиллы и подключенные инструменты. Если агент продолжает работу, страница обновляется по той же ссылке.
Также перевел две хорошие статьи:
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Очень много инфы появляется про лупы. Это топ 4 за последние дни:
📎 Самоулучшающийся Kimi-сворм: 300 агентов, проверка Opus и цикл без ручного аудита
Для тех, кто экспериментирует с multi-agent research, Kimi, дешевыми массовыми прогонами и отдельной verifier-моделью. Внутри: как писать спецификацию для сворма, читать план декомпозиции до запуска, получать файлы вместо ответа в чате, прогонять результат через Opus-проверку и превращать ошибки в постоянные правила для следующих запусков.
📎 Loop Engineer: как строить агентные циклы, которые работают без ручного промптинга
Для фаундеров, growth-команд и разработчиков, которые хотят запускать агентные процессы вокруг бизнеса: support, SEO, product growth, ads. Главная инфа - как устроить общий слой артефактов, контрактов и логов, чтобы разные циклы читали выводы друг друга и накапливали рабочую память компании.
📎 От промптов к loop engineering: как проектировать циклы для кодинг-агентов
Для тех, кто уже пользуется Claude Code, Codex или другими кодинг-агентами и хочет перейти от ручных запросов к повторяемым циклам. Внутри: 6 частей хорошего loop - триггер, изоляция, записанный контекст, доступ к инструментам, независимая проверка и состояние на диске. Плюс примеры PR-babysitter,
📎 Архитектура агентных циклов: loop, skill и устойчивая оркестрация
Для тех, кто думает о production-агентах: фоновые процессы, ретраи, очереди, субагенты, наблюдаемость и восстановление после падений. Аагентный loop должен жить поверх устойчивой оркестрации: каждый шаг сохраняется, ошибки повторяются с нужного места, события не теряются, а dev утром видит все запуски, inputs, outputs и ретраи.
Чат
Для тех, кто экспериментирует с multi-agent research, Kimi, дешевыми массовыми прогонами и отдельной verifier-моделью. Внутри: как писать спецификацию для сворма, читать план декомпозиции до запуска, получать файлы вместо ответа в чате, прогонять результат через Opus-проверку и превращать ошибки в постоянные правила для следующих запусков.
Для фаундеров, growth-команд и разработчиков, которые хотят запускать агентные процессы вокруг бизнеса: support, SEO, product growth, ads. Главная инфа - как устроить общий слой артефактов, контрактов и логов, чтобы разные циклы читали выводы друг друга и накапливали рабочую память компании.
Для тех, кто уже пользуется Claude Code, Codex или другими кодинг-агентами и хочет перейти от ручных запросов к повторяемым циклам. Внутри: 6 частей хорошего loop - триггер, изоляция, записанный контекст, доступ к инструментам, независимая проверка и состояние на диске. Плюс примеры PR-babysitter,
/goal, лимиты, стоимость и случаи, когда loop лучше не запускать.Для тех, кто думает о production-агентах: фоновые процессы, ретраи, очереди, субагенты, наблюдаемость и восстановление после падений. Аагентный loop должен жить поверх устойчивой оркестрации: каждый шаг сохраняется, ошибки повторяются с нужного места, события не теряются, а dev утром видит все запуски, inputs, outputs и ретраи.
Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1🔥1
Semble (5.3к ⭐ ) - быстрый поиск по коду для AI-агентов.
Агент спрашивает:
Что умеет:
🔵 работает локально на CPU, без API-ключей и внешних сервисов;
🔵 подключается как MCP server, CLI или отдельный подагент;
🔵 подходит для Claude Code, Codex, Cursor, OpenCode и VS Code;
🔵 по бенчмаркам авторов экономит до 98% токенов против
Как установить - тут
Product Manager Skills (5.2к⭐ ) - библиотека продуктовых скиллов для Claude Code, Cowork, Codex и других агентов.
Внутри 50+ скиллов для исследование проблемы, PRD, roadmap, приоритизации, пользовательских сценариев, стратегии, роста и продуктовых метрик.
Самые полезные:
🔵
🔵
🔵
🔵
Готовые сценарии:
🔵
🔵
🔵
Чат
Агент спрашивает:
Как в проекте устроена аутентификация? - и получает нужные фрагменты кода без долгого чтения всего репозитория.Что умеет:
grep + read.Как установить - тут
Product Manager Skills (5.2к
Внутри 50+ скиллов для исследование проблемы, PRD, roadmap, приоритизации, пользовательских сценариев, стратегии, роста и продуктовых метрик.
Самые полезные:
discovery-process - помогает пройти путь от гипотезы до плана проверкиprioritization-advisor - подбирает способ приоритизации под вашу ситуациюprd-development - собирает PRD, который можно отдавать командеroadmap-planning - превращает цели и инициативы в понятный план релизовГотовые сценарии:
/discover - разобраться в проблеме, собрать вопросы и выбрать проверки/write-prd - превратить идею в PRD и первые пользовательские сценарии/strategy - собрать позиционирование, проблему, варианты решений и roadmapЧат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Bayer показала, как выглядит агентный RAG в проде.
PRINCE помогает исследователям работать с доклиническими данными: уточняет запрос, ищет по PDF-отчетам через RAG, ходит в структурированные данные через Text-to-SQL, проверяет полноту фактов и собирает ответ с цитатами.
📎 Как выглядит надежная агентская ИИ-система
ЧАТ
PRINCE помогает исследователям работать с доклиническими данными: уточняет запрос, ищет по PDF-отчетам через RAG, ходит в структурированные данные через Text-to-SQL, проверяет полноту фактов и собирает ответ с цитатами.
ЧАТ
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Как Bayer строит надежную агентную ИИ-систему для доклинических исследований
Доклиническая разработка лекарств держится на огромном массиве данных: отчеты исследований, таблицы, исторические PDF, регуляторные документы, публикации, метаданные из разных лабораторий и внутренних систем. Для исследователя главная сложность часто звучит…
👍4