Agents Lab
740 subscribers
39 photos
24 videos
127 links
Обсуждаем AI агентов

Наш чатик https://t.me/agents_lab_community
Download Telegram
OpenProse - Markdown-контракты для AI-агентов

Появился интересный репозиторий: OpenProse. Это декларативный язык для агентных сессий: вы описываете рабочий процесс в *.prose.md, а агент получает не просто промпт, а понятный контракт: что должно быть сделано, какие части связаны между собой и какие подтверждения оставить.

Что это реально дает агенту:
🔵 он видит не разовую инструкцию, а структуру задачи;
🔵 понимает зависимости между шагами;
🔵 может пересобрать только те части процесса, которые изменились;
🔵 оставляет проверяемые подтверждения выполнения;
🔵 лучше переносит сценарий между сессиями и разными агентами.

Например, в Hermes такой подход можно использовать для повторяемых процессов: дайджест новостей, ревью PR, подготовка статьи, проверка репозитория, запуск тестов. Вместо длинного промпта каждый раз - файл-контракт, где описано нужное состояние результата, источники, проверки и формат ответа.

OpenProse работает поверх уже привычных coding agents: Claude Code, Codex, OpenCode, Hermes, Pi. Внутри есть Reactor, который следит за изменениями, пересобирает зависимые части и хранит подтверждения выполнения.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Собрать AI-агента стало проще. Довести до продакшена - совсем другая история.

У агента быстро появляется целый стек вокруг модели: инструменты, MCP, память, состояние, фреймворки, оценка, наблюдаемость и безопасность.

Перевел статью O’Reilly про 6 слоев между LLM и рабочим агентом. Советую прочитать, чтобы понять, где агентные системы чаще всего ломаются и как не переусложнить архитектуру на старте.

📎 Стек AI-агентов в 2026 году

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👌1🤝1
Сейчас главный тренд в агентах - loop 🔄

Работа с кодинг-агентами смещается в сторону циклов: расписание находит задачи, worktree изолирует исполнителей, skills дают контекст, коннекторы ведут работу в Linear/CI/Slack, а субагенты разделяют кодера и проверяющего.

Это называют Loop Engineering. Сильная идея, но с неприятными углами: расход токенов, критерии "готово", доверие к памяти и риск тихо накопить код, который уже никто не понимает.

Подготовил для вас очень полезную статью:
📎 Loop Engineering: как проектировать циклы для кодинг-агентов

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝31
Anthropic выкатила Claude Fable 5, и Claude Code сразу стал интереснее 🎉

Anthropic выпустила Claude Fable 5 - новый публичный Mythos-class модель для сложной разработки, длинных задач и agentic workflows.

Модель уже доступна много где. Anthropic отдельно пишет, что Fable 5 лучше раскрывается на длинных задачах: планирование, работа по этапам, проверка своего результата, делегирование подзадач.

Параллельно в Claude Code начали выкатывать важное обновление: nested subagents. Теперь агент может запускать субагентов, а те - своих субагентов. Стартовый лимит - до 5 уровней вложенности.

Главный агент больше не обязан тащить весь проект, все логи, поиск по файлам, тесты и ревью в одном контексте. Он может раздать работу отдельным агентам: один изучает кодовую базу, второй готовит правку, третий гоняет тесты, четвертый проверяет дифф, пятый ищет риски. Каждый возвращает короткий результат, а основной агент собирает решение.

Борис Черный из команды Claude Code в комментариях привел пример: skill можно запускать в отдельном контексте, а внутри skill просить агентов держать каждый шаг изолированным. Такой подход уже добавляют в /code-review, чтобы ревью меньше забивало основной контекст и работало точнее.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Самый интересный нюанс Claude Fable 5 - Anthropic продает не только интеллект модели, но и режим доступа к нему 😱

Fable и Mythos работают на одних базовых весах. Mythos дают доверенным партнерам, Fable - всем остальным, но с ограничениями.

Для кибербезопасности, биологии, химии и дистилляции запрос может уйти на Opus 4.8.

А вот с разработкой frontier LLM все менее прозрачно. В system card Anthropic пишет, что Fable может невидимо снижать эффективность на задачах вроде пайплайнов предобучения моделей, и проектирования ML-ускорителей.

Не отказ. Не предупреждение. Не видимый fallback. Просто ответ, который выглядит обычным, но может быть ослаблен через переписывание запроса, векторы управления поведением модели или PEFT - легкое дообучение небольшой части параметров.

Для обычной разработки это, скорее всего, не всплывет. Но для AI research и инфраструктуры обучения появляется неприятная неопределенность: если результат плохой, ты не знаешь, модель ошиблась или провайдер тихо нажал на тормоз.

Еще один важный нюанс: в подписках Pro/Max/Team Fable включили только до 22 июня. После этого доступ будет по API - $10 млн за input и $50 млн за output.

Получается сильная модель для долгих агентских задач, но с новой реальностью: топовый интеллект теперь идет вместе с правилами доступа, хранением запросов и невидимыми ограничителями.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Mastercard готовит платежный слой для AI-агентов 💸

Mastercard запустила Agent Pay for Machines - инфраструктуру для платежей, которые агенты смогут выполнять сами: купить домен, оплатить хостинг, данные, вычисления или логистические услуги.

Пока это выглядит как партнерский запуск, а не публичный API для всех разработчиков. В списке первых участников - Cloudflare, Coinbase, Stripe, Adyen, Checkout, OKX, Solana Foundation, RippleX и другие.

У агента будет проверяемая идентичность, лимиты и правила оплаты. Он сможет тратить деньги только в заданных рамках, а Mastercard и партнеры будут проводить расчеты через карты, счета и стейблкоины.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
GitHub Copilot app - панель управления агентами для разработки 📱

GitHub открыл preview Copilot app для платных Copilot-планов. Приложение есть для macOS, Windows и Linux.
У Codex app и Claude Desktop, кстати, нету версии под Linux.

Главные фишки:

🔵 Задача > PR > проверки > merge внутри GitHub

Сессию можно запустить из issue, pull request, промта или прошлой сессии. Агент сразу видит контекст GitHub: репозиторий, обсуждение, PR, проверки, поиск по коду и историю работы.

🔵 Agent Merge

Copilot может довести PR до конца: ответить на комментарии, исправить замечания, разобраться с упавшими проверками и учесть правила merge.

Вы задаете условия, а агент мержит только когда все требования выполнены.

🔵 Canvas вместо бесконечного чата

Работа агента показывается как рабочее полотно: план, PR, терминал, браузерная сессия, чеклист релиза, панель состояния или процесс выполнения.

Можно править, переставлять блоки, одобрять шаги и перенаправлять агента прямо там, а не вылавливать нужное место в длинной переписке.

🔵 My Work как диспетчер задач для агентов

В одном окне видны активные сессии, issues, pull requests и фоновые автоматизации по подключенным репозиториям.

🔵 Разные агенты внутри одного GitHub-сценария

GitHub заявляет доступ к сторонним агентам, включая Claude Code и Codex, плюс партнерские agent приложения.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡 Xiaomi выкатила MiMo Code (4.3к)

Это open-source кодинг агент, на базе OpenCode.

В комплекте есть MiMo Auto - временно бесплатный режим на MiMo-V2.5 с контекстом до 1M токенов. Еще можно войти через Xiaomi MiMo, импортировать конфиг Claude Code или подключить других провайдеров.

Что интересного:

🔵 Max Mode

На каждом шаге агент делает 5 независимых черновиков: рассуждение + план вызова инструментов, без исполнения. Потом судья выбирает лучший вариант, и выполняется только он.

Xiaomi пишет про +10-20% на SWE-Bench Pro, цена - примерно 4-5x токенов. Фича экспериментальная.

🔵 Goal

/goal задает условие остановки. Перед завершением отдельный судья проверяет, правда ли задача выполнена.

🔵 Память

За память отвечает отдельный checkpoint-writer. Он пишет checkpoint.md, поднимает стабильные факты в MEMORY.md, хранит полный трейс в SQLite и разбирает notes.md, куда основной агент может скидывать находки.

Когда контекст заполняется, сессия пересобирается из todo, чекпоинта, последних сообщений пользователя и памяти. Так они делают свою версию “безлимитного контекста”.

🔵 Compose

Отдельный режим рядом с build/plan. По сути встроенный флоу в стиле Superpowers skills.

Compose-агент прогоняет задачу через навыки вроде compose:brainstorm, compose:plan, compose:tdd, compose:execute, compose:review, compose:verify, compose:merge.

Это как specs-driven development: от спеки до реализации, проверки и мержа. То есть в harness сразу встроили процесс разработки, за это лайк.

🔵 Dynamic Workflow

Для больших задач есть JS-оркестрация: agent(), parallel(), pipeline(), workflow(). Параллельные подагенты и логика процесса живут в исполняемом сценарии, поэтому сложные флоу меньше завязаны на то, удержит ли модель порядок шагов.

🔵 Dream / Distill

Dream раз в 7 дней чистит и мержит проектную память.
Distill раз в 30 дней ищет повторяющиеся процессы и превращает их в skills, команды, агентов и SOP.

Выглядит как один из самых интересных свежих кодинг агентов: Xiaomi собрала агентную систему для длинных задач с памятью, проверкой завершения, режимом разработки SDD и параллельной оркестрацией.

Из нюансов: вы сразу не увидите модель GPT 5.5, потому что они используют плагин для OAuth ChatGPT в котором этой модели нет. Но сам mimo GPT 5.4 смог сделать патч, после чего модель стала доступна.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Agent добавил Automation Blueprints - шаблоны для cron-автоматизаций 🔱

Под капотом Hermes также создает обычную cron-задачу. Отличие в том, как она появляется.

Раньше нужно было собрать команду: расписание, длинный промпт, доставку, навыки, скрипт, условия молчания. Например: “каждый будний день в 18:00 собери новостной дайджест, проверь источники, убери повторы”.

Теперь это можно упаковать в Blueprint: готовый сценарий с понятными полями.

В приложении это выглядит как форма: выбрать шаблон, заполнить тему, время, канал доставки и нажать Schedule it.

В Telegram/CLI/TUI можно написать:
/blueprint news-digest

Hermes сам спросит недостающие параметры, покажет, что именно будет создано, и попросит подтверждение.

Есть готовые пресеты:
🔵 утренний брифинг
🔵 мониторинг важной почты
🔵 еженедельный обзор
🔵 дайджест по теме
🔵 напоминания и привычки
🔵 проверки деплоя, алертов, PR и CI через webhook-сценарии

Кастомные Blueprints тоже можно делать самому: это обычный Hermes Skill с блоком metadata.hermes.blueprint в SKILL.md. То есть повторяемый процесс можно превратить в кнопку, форму или короткую команду из мессенджера.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82
Почему одни AI-агенты реально помогают, а другие только дергают инструменты

Тут речь не про локальные модели и не про очередной фреймворк. Статья про обвязку вокруг модели: системные инструкции, инструменты, навыки, справки и сырой API, из которых складывается рабочий агент.

Автор разбирает это на примере агента для электронных таблиц. Такой агент должен не просто “уметь вызвать API”, а понимать таблицу, сжимать большие диапазоны, показывать последствия своих изменений и быстро находить редкие возможности без раздувания контекста.

В комментариях автор добавил хороший пример: сводные таблицы могут встречаться меньше чем в 2% запросов, но когда они срабатывают, пользователи очень ценят результат. Поэтому сильный агент строится не только вокруг частых действий, но и вокруг того, какие редкие возможности дают большой выигрыш.

Я адаптировал статью на русский: 📎Как строить вертикальных агентов, которые действительно работают

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
Свежие новости 🗞

🔵Anthropic успела громко выпустить Fable 5, а потом почти сразу выключила Fable 5 и Mythos 5. Причина - директива правительства США.

🔵Google показал Open Knowledge Format - стандарт для знаний, которые читают люди и агенты.

По сути это папки с Markdown, YAML и ссылками между файлами. Документацию, процессы, метрики, глоссарии и рабочий контекст можно держать в обычном репозитории. Спека уже на GitHub.

🔵Lee Robinson из Cursor написал статью про recursive agent systems.

В Cursor тысячи агентов помогают тренировать следующую версию Composer. Главный агент сидит на мощной удаленной машине, подключается к машинам с дочерними агентами, собирает их статусы в общий inbox-файл, перезапускает сломанные процессы и зовет людей в Slack или PagerDuty, когда что-то пошло не так.

Звучит как нормальная инфраструктура для ML-команды будущего: исследователь дает направление, а облачные агенты гоняют эксперименты и сами находят проблемы.

🔵И практичная находка - pm-skills 17.2к

Это набор скиллов для продуктовой работы: исследование, стратегия, приоритизация, запуск, рост и работа с кодом.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Пара интересных репозиториев 💻

🔵Agent Reach - интернет-доступ для агента

Репозиторий ставит агенту готовые маршруты к YouTube, GitHub, RSS, V2EX, Bilibili, Twitter/X, Reddit, XiaoHongShu, LinkedIn, Xueqiu и другим источникам.

Агент запускает agent-reach doctor, видит, какой backend сейчас рабочий, и дальше использует нужный CLI или MCP-инструмент.

Для примера, как устроена авторизация:

X/Twitter
- для расширенных сценариев нужны cookies;
- пользователь заходит в X в браузере;
- через Cookie-Editor экспортирует Header String;
- агент сохраняет это командой agent-reach configure twitter-cookies "..."
- локально можно попробовать автоизвлечение из Chrome через agent-reach configure --from-browser chrome.

Reddit
- zero-config пути нет: анонимные интерфейсы заблокированы, официальный API требует ручного доступа;
- на десктопе рекомендуют OpenCLI, который использует уже существующую браузерную сессию;
- на сервере или без браузера - rdt-cli + cookies, обычно через rdt login.

🔵Ponytail - Заставляет вашего ИИ-агента думать как самый ленивый senior dev в комнате.

Это навык и набор адаптеров для Claude Code, Codex, OpenCode, Pi, Cursor, Windsurf, Cline, Copilot и Kiro.

Перед тем как писать код, агент проходит простую лестницу:

- это вообще нужно делать?
- есть ли готовое в стандартной библиотеке?
- есть ли нативная возможность платформы?
- уже стоит зависимость, которая это умеет?
- можно ли решить одной строкой?
- только потом - минимум кода, который работает.

Есть режимы lite/full/ultra и отдельный ponytail-review, который ищет, что удалить из диффа: лишние зависимости, абстракции на будущее, самописные версии стандартной библиотеки и код “на всякий случай”.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
3
codex-lb 1.9к - слой управления для Codex и ChatGPT аккаунтов

Самостоятельный прокси для тех, кто запускает Codex CLI, OpenCode, OpenClaw или своих агентов через OpenAI-совместимый API.

Сервис поднимает локальный API на :2455, принимает /v1 и /backend-api/codex, распределяет запросы по пулу своих ChatGPT аккаунтов и показывает расход в панели управления: токены, стоимость, лимитные окна, здоровье аккаунтов, последние запросы и отчеты.

Что есть внутри:
🔵 OAuth-добавление аккаунтов и автообновление токенов
🔵 API-ключи для клиентов с лимитами по модели, токенам, стоимости и сроку
🔵 закрепление сессий за аккаунтом, переключение при сбоях и прогрев лимитов
🔵 поддержка WebSocket/SSE, /v1/responses, /v1/chat/completions, файлов, изображений и аудио
🔵 Docker, uvx codex-lb, Helm, SQLite по умолчанию и PostgreSQL для боевого запуска

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
/goal можно использовать не только вручную

Можно попросить вашего агента заспавнить нового агента и назначить ему цель.

Проверил: работает не только в Codex, но и в OpenClaw и Hermes.

Также в комментариях поделились таким шаблоном:
Создай [объект] в [технологии/фреймворке]. Он должен включать [основные функции] с [деталями взаимодействия/анимации/поведения]. Создай [настроение/качество] с помощью [визуальных деталей], [деталей окружения] и [дополнительных эффектов]. Выведи результат в [формате/типе файла].

Для этой задачи напиши себе новую цель и запустите агентов параллельно — столько, сколько потребуется для более эффективного и быстрого выполнения. Раздели работу на независимые части, запускай их одновременно и синтезируй результаты по мере их поступления. Назначь каждому агенту свою собственную цель.


Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
Omnigent 1.8к - общий слой для Claude Code, Codex, Pi и своих AI-агентов

Свежий репозиторий, создан 11 июня. Идея в том, чтобы запускать разные агентные обвязки через один CLI, сервер и веб-интерфейс. Агент может стартовать в терминале, продолжить в браузере или на телефоне, а сессия сохраняет сообщения, субагентов, терминалы и файлы.

Что внутри:
🔵 CLI omnigent / omnigent claude, omnigent codex
🔵 веб-интерфейс и приложение для macOS
🔵 YAML-спеки для своих агентов: промпт, модель, инструменты, MCP, подагенты, терминалы, доступ к файловой системе
🔵 сервер с сессиями, fork, attach, шарингом, комментариями, правами и API
🔵 политики для контроля агентов: подтверждение shell/file действий, лимиты инструментов, бюджет, GitHub/Google-доступ, риск-скоринг
🔵 sandbox через bubblewrap на Linux и seatbelt на macOS
🔵 MCP через stdio, SSE и Streamable HTTP
🔵 деплой через Docker, Render, Railway, Fly, Modal, Hugging Face Spaces

Самое интересное в примерах.

Polly - агент-техлид для разработки. Он сам код не пишет: раскладывает задачу на подагентов Claude Code, Codex и Pi, запускает их в отдельных git worktree, требует ревью другим поставщиком и отдаёт PR человеку.

Debby - двухголовый брейнсторминг. Один ответ идёт от Claude, второй от GPT, потом можно включить debate skill и заставить модели покритиковать друг друга перед финальной сводкой.

Архитектура тоже здраво разделена: сервер хранит историю, права, UI и координацию, а раннер выполняет агентный цикл на вашей машине или в облачном sandbox.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
agentmemory 23к - память для кодинг-агентов

Обычная память агента часто сводится к CLAUDE.md / AGENTS.md - статичные правила проекта. Хорошо для “как писать код”, плохо для истории работы.

agentmemory делает отдельный слой памяти для рабочих фактов: что уже пробовали, какие решения приняли, где была ошибка, какие файлы трогали, чем закончилась прошлая сессия.

Как это устроено:
🔵 хуки агента ловят события: старт сессии, запрос пользователя, вызовы инструментов, ошибки, compact, stop
🔵 сырые наблюдения чистятся от секретов, сжимаются и превращаются в факты, концепты, связи и краткие самари
🔵 поиск идет не только по ключевым словам, а через BM25 + векторы + граф связей
🔵 перед новой сессией агент может получить только релевантные куски памяти, а не весь архив подряд

Что дают MCP и skills:

Через MCP - Claude Code, Codex, Cursor, OpenCode, Hermes и другие получают инструменты вроде memory_save, memory_smart_search, memory_sessions, memory_timeline.

skills - это инструкция агенту, когда этими MCP пользоваться. Без skills модель может видеть инструменты, но не понимать, в каких ситуациях нужно сохранить решение или поднять прошлый контекст.

Самый быстрый старт:
npm install -g @agentmemory/agentmemory
agentmemory
agentmemory connect claude-code
npx skills add rohitg00/agentmemory -y


Работает почти со всеми агентами.
По умолчанию может работать без LLM-провайдера - тогда память работает через BM25 и локальные embeddings. Чтобы она полноценно заработала, нужно подключить обычную модель, советуют использовать не топовые. Например: deepseek/deepseek-v4-pro и qwen/qwen3-coder

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Factory 2.0 - кодинг-агенты превращаются в фабрику разработки 💃

Factory.ai, команда создавшая агента Droid, показала Factory 2.0.

Если ускорить только написание кода, бутылочные горлышки переедут в разбор задач, тесты, ревью, релизы, деплой и мониторинг. Поэтому Factory предлагает смотреть на весь цикл разработки как на одну агентную систему.

Входом может быть багрепорт, сообщение от клиента, внутренняя хотелка или бизнес-требование. Дальше это проходит через разбор, план, код, тесты, ревью, релиз, наблюдение и снова возвращается в цикл как новые сигналы.

Что внутри их software factory:
🔵 разные модели под разные задачи, с роутером по цене, скорости и качеству
🔵 контроль над контекстом и данными: свои ключи, свой контур данных, отдельный регион или закрытая сеть
🔵 общая память и контекст для ревью, безопасности, QA, документации и инцидентов
🔵 панель управления в Factory Desktop App: очереди, триаж тикетов, PR-проверки, деплои, мониторинг и узкие места

По словам Factory, такие фабрики уже работают у NVIDIA, EY, Adobe, Palo Alto Networks, Adyen, Blackstone, Wipro и Comarch.

Самое интересное тут направление. Кодинг-агент решает кусок работы. Следующий слой - система вокруг него: задачи, права, логи, проверки, память, отчеты и понятная панель по всей цепочке.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
💬 Anthropic разобрали ~400к Claude Code-сессий - и это редкий снимок того, как кодовые агенты работают в реальности.

Самое важное:
🔵 люди принимают ~70% решений о плане, Claude берет ~80% решений об исполнении.
🔵 профессия разработчика стала менее решающей: в кодовых сессиях разные профессии почти догоняют software engineers по успеху.
🔵 экспертиза в предметной области все равно решает - такие пользователи получают больше полезных действий агента на один запрос.
🔵 задачи сдвигаются от дебага к end-to-end работе: деплой, запуск кода, анализ данных, документы. Оценочная стоимость типовой задачи выросла примерно на 25%.

Также, чтобы вы не скучали, перевел две статьи, первая продвинутая, вторая попроще:

📎 Проектирование циклов для AI-агентов - как создавать agent loop, проверки, событийные запуски и цикл улучшения.

📎 Три способа, которыми Codex может пользоваться компьютером - когда выбирать @Computer, @Chrome, @Browser, а когда лучше идти через плагин или MCP.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔄 SwarmForge (900) от Дяди Боба

Uncle Bob (автор книги Clean Code) выкатил свой агентный оркестратор для разработки: локальная связка tmux, git worktree, Babashka-скриптов и файловой "почты" между агентами.

Самое необычное - проект разложен по веткам. main хранит документацию и общие скрипты, а рабочие флоу лежат отдельно:

- two-pack - быстрый цикл coder -> cleaner -> coder
- four-pack - спецификация, код, рефакторинг, архитектура
- six-pack - полный конвейер specifier -> coder -> cleaner -> architect -> hardender -> QA
- adversaries - отдельный цикл coder <-> reviewer, где ревьюер гоняет кодера до approval

Каждая роль запускается как отдельный агент в своей tmux-сессии и своем git worktree. В конфиге можно выбрать CLI для роли: codex, claude, copilot, grok. По умолчанию примеры идут на Codex.

Интересная часть - handoff-протокол. Агенты не шлют друг другу длинные сообщения в чат. Они кладут маленькие типизированные файлы в outbox: git_handoff, note, awake. Демон проверяет формат, раскладывает задачи по inbox получателей и будит нужную tmux-сессию.

По сути это не "рой агентов, которым дали общий промпт", а инженерный конвейер с ролями, очередями, коммитами, приоритетами и аудитом.

В полном six-pack чувствуется почерк Дяди Боба: Gherkin-спеки, TDD, acceptance tests, CRAP/DRY, mutation testing, архитектурные границы, финальная QA-проверка через пользовательский интерфейс.

Клевая идея рабочих деревьев под роли, а не под задачи. Агент не просто берет тикет, он живет в своей профессиональной зоне ответственности: спецификация, код, чистка, архитектура, харденинг, QA.

Интересно взглянуть на первый коммит в репозитории. Там есть md файлы, которые описывают принципы работы и разработки самого SwarmForge, для понимания, что сувать в контекст агента для кодинга, полезно.
📎 Перевод MD файлов из коммита

Как образец агентного SDLC с жесткой инженерной дисциплиной - репозиторий очень любопытный.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
SpaceX договорились купить компанию Cursor за $60 млрд. По Reuters, сделка акциями должна закрыться в Q3 2026, а Cursor становится частью большого AI-контура SpaceX/xAI.

На этом фоне Cursor запускает Origin - свой GitHub для эпохи AI-агентов. Это git-платформа, где репозиторий сразу проектируется под работу людей и множества агентов: код, ветки, ревью, фоновые задачи и агентные изменения в одном месте.

Параллельно Vercel показал Eve - open-source фреймворк для production-агентов. Главная идея простая: agent is a directory.

В папке агента лежат:

- instructions.md - роль и правила
- tools/ - инструменты на TypeScript
- skills/ - переиспользуемые навыки
- subagents/ - дочерние агенты
- channels/ - Slack, Discord, Teams, web
- schedules/ - запуск по расписанию

Агенты быстро обрастают собственной инфраструктурой: им уже нужен хостинг кода, очередь задач, ревью, навыки, расписания и безопасные инструменты вокруг проекта.

Чат