Agents Lab
740 subscribers
40 photos
24 videos
128 links
Обсуждаем AI агентов

Наш чатик https://t.me/agents_lab_community
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
RMUX - мультиплексор терминала на Rust, совместимый с tmux, но явно заточенный под AI-агентов.

Агент работает в живой shell-сессии, а внешний код может отправлять ему ввод, читать экран, ждать нужный текст, снимать structured snapshots и управлять несколькими панелями. В демо Claude через RMUX управляет Codex, Gemini и Grok: рассылает им команды, читает ответы и собирает результат.

Для агентных workflow это полезно там, где обычный терминал быстро разваливается: долгие задачи по SSH, несколько CLI-агентов рядом, проверка состояния TUI, оркестрация "один агент ставит задачи другим".

Главные отличия от tmux:
🔵 typed Rust SDK, а не только CLI-скрипты;
🔵 structured snapshots, события вывода и ожидание текста;
🔵 нативная поддержка Windows через ConPTY и Named Pipes;
🔵 CLI, SDK и ratatui widget работают через один локальный daemon;
🔵 при этом заявлена совместимость с 90 командами tmux

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2👍1
Что такое Harness в агентах на самом деле?

Когда говорят про агентов на языковых моделях, чаще всего обсуждают саму модель. Но в реальных задачах многое решает обвязка вокруг нее: инструменты, состояние, проверки, восстановление после ошибок и правила остановки.

Я перевел свежую статью с arxiv:
📎 Естественный язык в Agent Harnesses (обвязке): почему политику агента стоит выносить в читаемый текст, а точные механизмы оставлять в коде.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Как собрать команду агентов в Claude Code 🤔

Статья о том, как использовать Claude Code не как один чат, а как команду агентов: один отвечает за серверную часть, другой за интерфейс, отдельные агенты занимаются тестами, ревью и безопасностью.

Главное - заранее задать роли, бюджет, ограничения и критерии готовности. Иначе параллельная работа быстро превращается в лишний расход токенов.

📎 Команда агентов в Claude Code

К статье хорошо подходит репозиторий VoltAgent/awesome-claude-code-subagents:

Там собрано 131+ готовых подагентов для Claude Code: разработка, языки и фреймворки, инфраструктура, безопасность, тесты, данные, AI и оркестрация.

Можно взять готовые роли вроде backend-developer, python-pro, code-reviewer, test-automator, agent-organizer и быстро собрать команду под свой репозиторий.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
Полезная подборка для юзеров Claude Code 🎉

Agentic Project Management
(2.3к )
APM превращает работу с агентами в управляемый проектный процесс: сначала Planner собирает требования и пишет Spec/Plan/Rules, потом Manager раздает задачи Workers. Главная идея - хранить состояние проекта в файлах и передавать контекст через Handoff, чтобы длинная разработка не разваливалась в одном огромном чате.

Claude Squad (7.6к )
Claude Squad - терминальная панель для параллельного запуска Claude Code, Codex, Gemini, Aider и других локальных агентов. Внутри используются tmux и git worktrees: у каждой задачи свой изолированный воркспейс, а пользователь может смотреть diff, заходить в сессию, коммитить и пушить изменения из одного TUI.

Claude Code Action (7.7к )
Официальный GitHub Action от Anthropic, который подключает Claude Code к issues и pull request: можно вызвать @claude, назначить issue, повесить label или запустить явную автоматизацию через workflow. Он умеет отвечать на вопросы по коду, делать ревью, вносить простые правки и работать через Anthropic API, AWS Bedrock, Google Vertex AI или Microsoft Foundry.

Claude Code Router (34.4к )
Ставит между Claude Code и моделью свой слой маршрутизации: можно отправлять разные типы задач в OpenRouter, DeepSeek, Ollama, Gemini, Volcengine, SiliconFlow и другие провайдеры.

SuperClaude Framework (23к )
Набор конфигураций для Claude Code, который добавляет команды, специализированных агентов, режимы поведения и интеграции с MCP. Заявлены 30 slash-команд, 20 агентов, 7 режимов и 8 MCP-серверов, то есть проект больше похож на структурированный слой методологии поверх Claude Code.

Ruflo (54.9к )
Описывает себя как платформу оркестрации агентов для Claude Code: swarms, память между сессиями, MCP, федерация между машинами и большое число специализированных агентов.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
mini-SWE-agent (4.5к ) - минимальный coding-агент от команды SWE-agent, Princeton и Stanford.

Агенту не всегда нужен большой фреймворк. Иногда достаточно модели, bash, среды выполнения и понятной истории сообщений.

Внутри всё устроено очень просто: агент получает задачу, предлагает команду, выполняет ее, добавляет вывод в историю и повторяет цикл до финального ответа. Основной инструмент - shell, без сложного tool-calling слоя.

Авторы заявляют больше 74% на SWE-bench Verified с Gemini 3 Pro. Для такого маленького agent harness это хороший сигнал: часть сложности уходит из фреймворков в модели и простую обвязку.
Также это влияет и на расход токенов, минимум лишнего контекста.

В X как раз обсуждали, какой сейчас стандарт для агентов. Общий настрой такой: единого стандарта нет. Многие уходят от тяжелых фреймворков к тонким кастомным циклам: model call, tool permissions, state, evals, logs, retries.

LangGraph всё еще используют для сложных workflow, LangSmith - для трассировки и evals. Но всё чаще советуют прямые SDK, Vercel AI SDK, Google ADK, Pydantic AI, Mastra, Claude SDK или готовые harness вроде Pi/OpenCode.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Uber Engineering написали, как они решают проблему личности у AI агентов.

В начале 2025 года Uber запустила внутреннюю платформу агентов и открыла доступ к тысячам микросервисов через MCP. После этого появилась неприятная проблема: агент может действовать по поручению человека, вызывать других агентов и инструменты, менять план по ходу задачи, но в логах часто видно только сервисную учетную запись.

Пример: инженер просит агента разобраться с алертом. Один агент анализирует инцидент, второй предлагает изменить настройку, третий открывает PR. Без нормальной цепочки личности потом сложно понять, кто запустил действие, какие агенты участвовали и почему им разрешили менять систему.

Uber решает это через короткоживущие токены и явную цепочку участников:

🔵 каждый агент регистрируется и привязывается к конкретному рабочему процессу в Kubernetes
🔵 рабочий процесс получает криптографическую личность через SPIRE
🔵 агент запрашивает JWT у STS только для следующего шага
🔵 в токен попадает цепочка вида: пользователь -> агент -> другой агент -> инструмент
🔵 шлюз MCP проверяет токен, применяет правила доступа и при необходимости включает AI Guard для защиты от утечек и вредных запросов

Токены живут минуты и ограничены конкретным получателем. Украсть такой токен из одного вызова и использовать его для другого сервиса сильно сложнее.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
Hermes Desktop 7.6к - графическая оболочка для Hermes Agent. Доступна на Mac, Windows и Linux.

Она берет то, что обычно живет в терминале, и собирает в одном приложении: установку агента, выбор модели, чат, память, навыки, инструменты, расписания, профили и подключение к мессенджерам.

🔵 можно работать локально, через удаленный API-сервер или по SSH
🔵 есть профили агентов с отдельными конфигами и моделями
🔵 поддерживаются OpenRouter, Anthropic, OpenAI, Gemini, Grok, Qwen, MiniMax, Nous, Hugging Face, Groq и локальные OpenAI-compatible модели
🔵 чат показывает вызовы инструментов, токены, стоимость, вложения и slash-команды
🔵 есть экраны Skills, Memory, Tools, Schedules, Gateway, Kanban и Office
🔵 в коде аккуратно сделана защита Electron: webview ограничены localhost, ключи не отдаются в публичный конфиг

Проект активно развивается: свежий релиз v0.5.1 вышел 25 мая, в репозитории уже больше 7.5k звезд.

Если используете Hermes Agent, репозиторий стоит посмотреть: это уже не просто чат к модели, а рабочая панель для управления агентом, его окружениями и каналами связи.


Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥5🙏1
Pi Agent - терминальный AI-агент для разработки, который работает с реальным проектом: читает файлы, запускает команды, редактирует код, хранит сессии и расширяется через навыки, шаблоны и плагины.

📎 Pi Agent: базовый гайд для новичков

Собрал короткий базовый гайд для новичков: как установить Pi, отправить первый запрос, подключить модель, работать с файлами, настроить AGENTS.md, использовать сессии и не сломать проект на первых экспериментах.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👏2
Robinhood открывает агентам доступ к деньгам
Robinhood запустила Agentic Trading и Agentic Credit Card: теперь пользователь может подключить своего AI-агента к трейдингу и покупкам по карте. Это уже реальный доступ к финансовым операциям, поэтому Robinhood добавила отдельные счета, лимиты, уведомления и быстрый выключатель.

Base MCP: кошелек для AI-агента
Base показала MCP для агентов, который дает агенту кошелек, лимиты расходов и доступ к действиям в DeFi. Агент сможет не только советовать, но и платить за сервисы, управлять портфелем и выполнять ончейн-операции по заданным правилам.

Cua Driver теперь работает с Windows 17.2к
Cua добавила Windows-поддержку для своего драйвера computer-use агентов. Claude Code, Codex, Hermes и другие агенты смогут работать с реальными Windows-приложениями через экран, клики, ввод и дерево доступности, включая старые корпоративные программы без API.

React Doctor ловит ошибки в React-коде, написанном агентом 11.2к
React Doctor - open source инструмент, который проверяет React-код на проблемы в состоянии компонентов, эффектах, производительности, архитектуре, безопасности и доступности. Его можно запускать через npx react-doctor@latest, подключать к агентам и гонять в CI перед мерджем.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code получил Dynamic Workflows

Anthropic выпустили Claude Opus 4.8 и добавили в Claude Code новую функцию Dynamic Workflows.

Теперь Claude может сам писать JavaScript-сценарий, разбивать большую задачу на этапы и запускать десятки subagents параллельно.

Это подходит для задач, которые сложно решить одним агентом:

- аудит всего репозитория
- миграции на сотни файлов
- поиск багов
- security review
- глубокие исследования с проверкой источников

Главное отличие - workflow держит план, циклы и промежуточные результаты в коде, а Claude возвращает один собранный отчет. Одни агенты выполняют работу, другие перепроверяют их выводы.

Запустить можно через слово workflow в задаче, команду /deep-research или режим /effort ultracode, где Claude сам решает, когда нужна такая оркестрация.

Opus 4.8 тоже обновился под длинные агентные задачи: 69,2% на SWE-bench Pro, 74,6% на Terminal-Bench 2.1, контекст до 1M токенов и та же базовая цена, что у Opus 4.7.

Функция пока в research preview и может быстро расходовать токены, но направление важное: coding agents становятся не одиночными помощниками, а управляемыми командами агентов.

Чат
4🔥2
🔵Hermes выкатил большой релиз 2026.5.28

Сделали рефакторинг, прокачали Kanban - добавили полноценный swarm, ускорили холодный старт и внедрили защиту от промт-инъекций.

📎 Прочитать изменения на русском

🔵Mistral прокачивает свою экосистему

Они встроили Vibe CLI в веб-чат.
Внутри есть Work Mode для длинных многошаговых задач и Code Mode для работы с репозиториями: агент может подключаться к GitHub, разбираться в коде, готовить изменения и доводить их до pull request.

Отдельно добавили расширение для VS Code и перенос сессий между терминалом и облаком. То есть задачу можно начать в чате, продолжить в редакторе, а потом отдать агенту проверку и доработку.

Выстраивают систему как у Anthropic, только пока на минималках 🙃

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🔥Anthropic Cybersecurity Skills - библиотека из 754 готовых навыков для AI-агентов в кибербезопасности: расследование взломов, анализ логов, вредоносных файлов, облаков, Kubernetes, фишинга и инцидентов.

Что особенно полезно:
🔵 агент получает пошаговый план, а не просто общие советы
🔵 в каждом навыке указано, какие данные собрать, какие команды запускать и как проверить результат
🔵 можно подключать к Claude Code, Codex CLI, Cursor и другим AI-инструментам
🔵 подходит для SOC, DevSecOps, аудита и обучения

Например, при расследовании зараженного компьютера агент сможет сам пройти по процессам, сетевым подключениям, следам кражи паролей и собрать понятный отчет. То есть репозиторий превращает AI-агента в более практичного помощника для задач безопасности.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔵Codex теперь управляет Windows-приложениями

OpenAI выпустили обновление Codex app: Computer Use теперь работает на Windows. Агент может видеть экран, кликать и печатать в активном окне, а работу на Windows-устройстве можно запускать и проверять удаленно с iOS, Android или Mac.

🔵Kimi Code CLI - новый open-source агент для кода от MoonshotAI

MoonshotAI выложили Kimi Code CLI - AI-агента, который читает и редактирует код, запускает shell-команды, ищет по файлам, ходит в web и поддерживает MCP. У проекта 1.4k звезд на GitHub и отдельная система подагентов для задач вроде coder, explore и plan.

🔵Google показал, как строить долгоживущих AI-агентов на ADK

Сделал русскую адаптацию статьи:
📎 Долгоживущие AI-агенты на ADK: пауза, возобновление и сохранение контекста

Google разобрал архитектуру агента, который может ставить процесс на паузу, ждать внешнее событие несколько дней, переживать рестарты и продолжать с того же места. Пример - HR-онбординг: агент отправляет документы, ждет подпись, передает задачу IT-субагенту, ждет доставку ноутбука и завершает процесс без потери контекста.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
📎WebMCP: как сделать сайт инструментом для AI-агентов

AI-агенты уже ходят по сайтам, но чаще видят только HTML и текст. WebMCP предлагает следующий шаг: сайт сам описывает, какие данные и безопасные действия он может отдать агенту - от поиска по каталогу до чтения документации и проверки статуса заказа.

В статье рассказывается, зачем нужен этот стандарт, почему внедрение пока почти нулевое, как его можно попробовать в SvelteKit/Next.js и какие функции лучше не отдавать агентам.

Если делаете продукт, документацию или сервис, который должен быть удобен не только людям, но и AI-агентам, стоит прочитать.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
Deep Agents: что это за класс AI-агентов

У LangChain есть deepagents 23.6к - открытый репозиторий с готовым каркасом для сложных AI-агентов. Внутри уже собраны вещи, которые обычно приходится склеивать вручную: план задач, файловая среда, запуск команд в песочнице, подагенты с отдельным контекстом, долговременная память, навыки, MCP-инструменты и подтверждение опасных действий человеком.

Такой агент может вести длинную задачу: разбить ее на шаги, делегировать часть работы, читать и менять файлы, запускать проверки, сохранять полезный контекст между сессиями и возвращаться к нему позже. Поэтому к нему уже нельзя относиться как к обычному чату с моделью.

Главный вопрос становится другим: как понять, что агент действительно сделал работу правильно, а не просто красиво ответил?

В статье разбираю практический подход AWS и LangSmith к оценке таких агентов: трассы, вызовы инструментов, аргументы, ошибки по шагам, LLM-as-judge, офлайн-тесты и мониторинг после запуска.

Если вы строите агентов для реальной работы - начните с этого разбора:
📎Как оценивать сложных AI-агентов в продакшне

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
NVIDIA переносит AI-агентов на локальные компьютеры и в физический мир 😎

NVIDIA и Microsoft представили RTX Spark - новый класс Windows-ПК для персональных AI-агентов. Внутри: 1 PFLOP AI-производительности, до 128 ГБ объединенной памяти, запуск больших моделей локально и OpenShell для безопасной работы агентов на основном устройстве.

Параллельно NVIDIA выложила открытый набор навыков для агентов. Репозиторий уже доступен на GitHub: NVIDIA/skills.

Внутри - навыки для робототехники, автономного транспорта, компьютерного зрения и промышленных цифровых двойников. Такие навыки описывают, какие инструменты агент должен вызвать, какой результат получить и как проверить выполнение задачи.

Навыки для агентов постепенно становятся стандартным способом упаковывать экспертные действия. Сначала это было заметно в кодинге, теперь формат идет в локальные компьютеры, роботов, симуляции и промышленные сценарии.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Claude Code сбросили лимиты для Pro/Max 🎉

Причина - баг, из-за которого некоторые сессии Opus 4.8 запускали слишком много параллельных субагентов и быстро сжигали доступный лимит.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3
Perplexity описали Search as Code - новый подход к поиску для AI-агентов

Агенту мало один раз вызвать поиск и получить готовую выдачу.
В сложных задачах ему нужно самому собирать стратегию:

🔵 где искать
🔵 как разветвлять запросы
🔵 как фильтровать и проверять источники
🔵 что сохранить промежуточно
🔵 что вообще не тащить в контекст модели

В архитектуре Perplexity агент генерирует Python-код, запускает его в защищенной песочнице и через SDK управляет отдельными частями поискового стека:

search - поиск
ranking - ранжирование
filtering - фильтрация
deduplication - удаление дублей
aggregation - сборка результата

Для задач вроде расследований, поиска уязвимостей или широкого ресерча это намного удобнее, чем гонять десятки отдельных вызовов поиска через модель.

Самый показательный пример из статьи - задача по CVE.

Агенту нужно было найти больше 200 серьезных уязвимостей, подтвердить каждую через вендорский advisory, указать продукт и версию исправления.

Результат: SaC получил 100% точности и снизил расход токенов на 85.1% относительно базового подхода.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Odysseus 24.8k - Self hosted AI-среда от ютубера PewDiePie 👍

Идея проекта - собрать у себя локальный AI-центр: чат, агенты, модели, документы, память, поиск, почта, календарь и исследования в одном веб-интерфейсе.

Что внутри:
🔵 чат с локальными моделями и API: Ollama, llama.cpp, vLLM, OpenAI, OpenRouter
🔵 агентный режим с инструментами: веб, файлы, shell, MCP, память, навыки
🔵 Cookbook - подбор, скачивание и запуск моделей под ваше железо
🔵 Deep Research - многошаговый поиск и итоговые отчеты
🔵 редактор документов с AI-правками и подсказками
🔵 заметки, задачи, расписания и напоминания
🔵 почта IMAP/SMTP с тегами, разбором и черновиками ответов
🔵 календарь CalDAV
🔵 мобильный интерфейс и PWA

Стек: FastAPI, Python, SQLite, ChromaDB, SearXNG, Docker Compose и большой веб-интерфейс.

Получается полноценная локальная AI-панель на своем железе.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI обновила Codex и добавила три заметных блока:

1. Ролевые плагины

Это готовые наборы инструкций, навыков, рабочих сценариев и подключений к приложениям для конкретных профессий. В первом пакете - 62 приложения и 110 навыков.

Примеры:
🔵 Data Analytics - анализ метрик, отчеты и дашборды через Snowflake, Databricks Genie, Hex, Tableau
🔵 Creative Production - кампании, баннеры и изображения товаров через Figma, Canva, Shutterstock, Picsart, Fal
🔵 Sales - подготовка к встречам, письма и задачи после встреч, CRM и планы закрытия сделок через Salesforce, HubSpot, Slack, Outreach
🔵 Product Design - проверка пользовательских сценариев, прототипы из live URL и статичных скриншотов
🔵 Investing / Banking - финансовая отчетность компаний, сравнение бизнесов, презентации для клиентов и проверка инвест-тезисов

2. Sites

Codex теперь может создавать, сохранять, деплоить и проверять сайты: веб-приложения, дашборды, внутренние инструменты и игры.

3. Annotations

Теперь можно выделить конкретную часть результата и попросить Codex доработать именно ее: блок на сайте, кусок документа, таблицу, слайд, Markdown или код.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Desktop - теперь агента можно запускать как обычное приложение 🔱

Nous Research выпустили публичную бету Hermes Desktop для macOS, Windows и Linux.

Есть возможность подключаться к удаленному gateway - документация.

Идеальный сценарий такой: Desktop - для плотной работы за ПК, Telegram - для удаленного управления агентом.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3