Agents Lab
743 subscribers
40 photos
24 videos
128 links
Обсуждаем AI агентов

Наш чатик https://t.me/agents_lab_community
Download Telegram
Полезная подборка для юзеров Claude Code 🎉

Agentic Project Management
(2.3к )
APM превращает работу с агентами в управляемый проектный процесс: сначала Planner собирает требования и пишет Spec/Plan/Rules, потом Manager раздает задачи Workers. Главная идея - хранить состояние проекта в файлах и передавать контекст через Handoff, чтобы длинная разработка не разваливалась в одном огромном чате.

Claude Squad (7.6к )
Claude Squad - терминальная панель для параллельного запуска Claude Code, Codex, Gemini, Aider и других локальных агентов. Внутри используются tmux и git worktrees: у каждой задачи свой изолированный воркспейс, а пользователь может смотреть diff, заходить в сессию, коммитить и пушить изменения из одного TUI.

Claude Code Action (7.7к )
Официальный GitHub Action от Anthropic, который подключает Claude Code к issues и pull request: можно вызвать @claude, назначить issue, повесить label или запустить явную автоматизацию через workflow. Он умеет отвечать на вопросы по коду, делать ревью, вносить простые правки и работать через Anthropic API, AWS Bedrock, Google Vertex AI или Microsoft Foundry.

Claude Code Router (34.4к )
Ставит между Claude Code и моделью свой слой маршрутизации: можно отправлять разные типы задач в OpenRouter, DeepSeek, Ollama, Gemini, Volcengine, SiliconFlow и другие провайдеры.

SuperClaude Framework (23к )
Набор конфигураций для Claude Code, который добавляет команды, специализированных агентов, режимы поведения и интеграции с MCP. Заявлены 30 slash-команд, 20 агентов, 7 режимов и 8 MCP-серверов, то есть проект больше похож на структурированный слой методологии поверх Claude Code.

Ruflo (54.9к )
Описывает себя как платформу оркестрации агентов для Claude Code: swarms, память между сессиями, MCP, федерация между машинами и большое число специализированных агентов.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
mini-SWE-agent (4.5к ) - минимальный coding-агент от команды SWE-agent, Princeton и Stanford.

Агенту не всегда нужен большой фреймворк. Иногда достаточно модели, bash, среды выполнения и понятной истории сообщений.

Внутри всё устроено очень просто: агент получает задачу, предлагает команду, выполняет ее, добавляет вывод в историю и повторяет цикл до финального ответа. Основной инструмент - shell, без сложного tool-calling слоя.

Авторы заявляют больше 74% на SWE-bench Verified с Gemini 3 Pro. Для такого маленького agent harness это хороший сигнал: часть сложности уходит из фреймворков в модели и простую обвязку.
Также это влияет и на расход токенов, минимум лишнего контекста.

В X как раз обсуждали, какой сейчас стандарт для агентов. Общий настрой такой: единого стандарта нет. Многие уходят от тяжелых фреймворков к тонким кастомным циклам: model call, tool permissions, state, evals, logs, retries.

LangGraph всё еще используют для сложных workflow, LangSmith - для трассировки и evals. Но всё чаще советуют прямые SDK, Vercel AI SDK, Google ADK, Pydantic AI, Mastra, Claude SDK или готовые harness вроде Pi/OpenCode.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Uber Engineering написали, как они решают проблему личности у AI агентов.

В начале 2025 года Uber запустила внутреннюю платформу агентов и открыла доступ к тысячам микросервисов через MCP. После этого появилась неприятная проблема: агент может действовать по поручению человека, вызывать других агентов и инструменты, менять план по ходу задачи, но в логах часто видно только сервисную учетную запись.

Пример: инженер просит агента разобраться с алертом. Один агент анализирует инцидент, второй предлагает изменить настройку, третий открывает PR. Без нормальной цепочки личности потом сложно понять, кто запустил действие, какие агенты участвовали и почему им разрешили менять систему.

Uber решает это через короткоживущие токены и явную цепочку участников:

🔵 каждый агент регистрируется и привязывается к конкретному рабочему процессу в Kubernetes
🔵 рабочий процесс получает криптографическую личность через SPIRE
🔵 агент запрашивает JWT у STS только для следующего шага
🔵 в токен попадает цепочка вида: пользователь -> агент -> другой агент -> инструмент
🔵 шлюз MCP проверяет токен, применяет правила доступа и при необходимости включает AI Guard для защиты от утечек и вредных запросов

Токены живут минуты и ограничены конкретным получателем. Украсть такой токен из одного вызова и использовать его для другого сервиса сильно сложнее.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
Hermes Desktop 7.6к - графическая оболочка для Hermes Agent. Доступна на Mac, Windows и Linux.

Она берет то, что обычно живет в терминале, и собирает в одном приложении: установку агента, выбор модели, чат, память, навыки, инструменты, расписания, профили и подключение к мессенджерам.

🔵 можно работать локально, через удаленный API-сервер или по SSH
🔵 есть профили агентов с отдельными конфигами и моделями
🔵 поддерживаются OpenRouter, Anthropic, OpenAI, Gemini, Grok, Qwen, MiniMax, Nous, Hugging Face, Groq и локальные OpenAI-compatible модели
🔵 чат показывает вызовы инструментов, токены, стоимость, вложения и slash-команды
🔵 есть экраны Skills, Memory, Tools, Schedules, Gateway, Kanban и Office
🔵 в коде аккуратно сделана защита Electron: webview ограничены localhost, ключи не отдаются в публичный конфиг

Проект активно развивается: свежий релиз v0.5.1 вышел 25 мая, в репозитории уже больше 7.5k звезд.

Если используете Hermes Agent, репозиторий стоит посмотреть: это уже не просто чат к модели, а рабочая панель для управления агентом, его окружениями и каналами связи.


Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥5🙏1
Pi Agent - терминальный AI-агент для разработки, который работает с реальным проектом: читает файлы, запускает команды, редактирует код, хранит сессии и расширяется через навыки, шаблоны и плагины.

📎 Pi Agent: базовый гайд для новичков

Собрал короткий базовый гайд для новичков: как установить Pi, отправить первый запрос, подключить модель, работать с файлами, настроить AGENTS.md, использовать сессии и не сломать проект на первых экспериментах.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👏2
Robinhood открывает агентам доступ к деньгам
Robinhood запустила Agentic Trading и Agentic Credit Card: теперь пользователь может подключить своего AI-агента к трейдингу и покупкам по карте. Это уже реальный доступ к финансовым операциям, поэтому Robinhood добавила отдельные счета, лимиты, уведомления и быстрый выключатель.

Base MCP: кошелек для AI-агента
Base показала MCP для агентов, который дает агенту кошелек, лимиты расходов и доступ к действиям в DeFi. Агент сможет не только советовать, но и платить за сервисы, управлять портфелем и выполнять ончейн-операции по заданным правилам.

Cua Driver теперь работает с Windows 17.2к
Cua добавила Windows-поддержку для своего драйвера computer-use агентов. Claude Code, Codex, Hermes и другие агенты смогут работать с реальными Windows-приложениями через экран, клики, ввод и дерево доступности, включая старые корпоративные программы без API.

React Doctor ловит ошибки в React-коде, написанном агентом 11.2к
React Doctor - open source инструмент, который проверяет React-код на проблемы в состоянии компонентов, эффектах, производительности, архитектуре, безопасности и доступности. Его можно запускать через npx react-doctor@latest, подключать к агентам и гонять в CI перед мерджем.

Чат
| CloseRouter
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code получил Dynamic Workflows

Anthropic выпустили Claude Opus 4.8 и добавили в Claude Code новую функцию Dynamic Workflows.

Теперь Claude может сам писать JavaScript-сценарий, разбивать большую задачу на этапы и запускать десятки subagents параллельно.

Это подходит для задач, которые сложно решить одним агентом:

- аудит всего репозитория
- миграции на сотни файлов
- поиск багов
- security review
- глубокие исследования с проверкой источников

Главное отличие - workflow держит план, циклы и промежуточные результаты в коде, а Claude возвращает один собранный отчет. Одни агенты выполняют работу, другие перепроверяют их выводы.

Запустить можно через слово workflow в задаче, команду /deep-research или режим /effort ultracode, где Claude сам решает, когда нужна такая оркестрация.

Opus 4.8 тоже обновился под длинные агентные задачи: 69,2% на SWE-bench Pro, 74,6% на Terminal-Bench 2.1, контекст до 1M токенов и та же базовая цена, что у Opus 4.7.

Функция пока в research preview и может быстро расходовать токены, но направление важное: coding agents становятся не одиночными помощниками, а управляемыми командами агентов.

Чат
4🔥2
🔵Hermes выкатил большой релиз 2026.5.28

Сделали рефакторинг, прокачали Kanban - добавили полноценный swarm, ускорили холодный старт и внедрили защиту от промт-инъекций.

📎 Прочитать изменения на русском

🔵Mistral прокачивает свою экосистему

Они встроили Vibe CLI в веб-чат.
Внутри есть Work Mode для длинных многошаговых задач и Code Mode для работы с репозиториями: агент может подключаться к GitHub, разбираться в коде, готовить изменения и доводить их до pull request.

Отдельно добавили расширение для VS Code и перенос сессий между терминалом и облаком. То есть задачу можно начать в чате, продолжить в редакторе, а потом отдать агенту проверку и доработку.

Выстраивают систему как у Anthropic, только пока на минималках 🙃

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🔥Anthropic Cybersecurity Skills - библиотека из 754 готовых навыков для AI-агентов в кибербезопасности: расследование взломов, анализ логов, вредоносных файлов, облаков, Kubernetes, фишинга и инцидентов.

Что особенно полезно:
🔵 агент получает пошаговый план, а не просто общие советы
🔵 в каждом навыке указано, какие данные собрать, какие команды запускать и как проверить результат
🔵 можно подключать к Claude Code, Codex CLI, Cursor и другим AI-инструментам
🔵 подходит для SOC, DevSecOps, аудита и обучения

Например, при расследовании зараженного компьютера агент сможет сам пройти по процессам, сетевым подключениям, следам кражи паролей и собрать понятный отчет. То есть репозиторий превращает AI-агента в более практичного помощника для задач безопасности.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔵Codex теперь управляет Windows-приложениями

OpenAI выпустили обновление Codex app: Computer Use теперь работает на Windows. Агент может видеть экран, кликать и печатать в активном окне, а работу на Windows-устройстве можно запускать и проверять удаленно с iOS, Android или Mac.

🔵Kimi Code CLI - новый open-source агент для кода от MoonshotAI

MoonshotAI выложили Kimi Code CLI - AI-агента, который читает и редактирует код, запускает shell-команды, ищет по файлам, ходит в web и поддерживает MCP. У проекта 1.4k звезд на GitHub и отдельная система подагентов для задач вроде coder, explore и plan.

🔵Google показал, как строить долгоживущих AI-агентов на ADK

Сделал русскую адаптацию статьи:
📎 Долгоживущие AI-агенты на ADK: пауза, возобновление и сохранение контекста

Google разобрал архитектуру агента, который может ставить процесс на паузу, ждать внешнее событие несколько дней, переживать рестарты и продолжать с того же места. Пример - HR-онбординг: агент отправляет документы, ждет подпись, передает задачу IT-субагенту, ждет доставку ноутбука и завершает процесс без потери контекста.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
📎WebMCP: как сделать сайт инструментом для AI-агентов

AI-агенты уже ходят по сайтам, но чаще видят только HTML и текст. WebMCP предлагает следующий шаг: сайт сам описывает, какие данные и безопасные действия он может отдать агенту - от поиска по каталогу до чтения документации и проверки статуса заказа.

В статье рассказывается, зачем нужен этот стандарт, почему внедрение пока почти нулевое, как его можно попробовать в SvelteKit/Next.js и какие функции лучше не отдавать агентам.

Если делаете продукт, документацию или сервис, который должен быть удобен не только людям, но и AI-агентам, стоит прочитать.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
Deep Agents: что это за класс AI-агентов

У LangChain есть deepagents 23.6к - открытый репозиторий с готовым каркасом для сложных AI-агентов. Внутри уже собраны вещи, которые обычно приходится склеивать вручную: план задач, файловая среда, запуск команд в песочнице, подагенты с отдельным контекстом, долговременная память, навыки, MCP-инструменты и подтверждение опасных действий человеком.

Такой агент может вести длинную задачу: разбить ее на шаги, делегировать часть работы, читать и менять файлы, запускать проверки, сохранять полезный контекст между сессиями и возвращаться к нему позже. Поэтому к нему уже нельзя относиться как к обычному чату с моделью.

Главный вопрос становится другим: как понять, что агент действительно сделал работу правильно, а не просто красиво ответил?

В статье разбираю практический подход AWS и LangSmith к оценке таких агентов: трассы, вызовы инструментов, аргументы, ошибки по шагам, LLM-as-judge, офлайн-тесты и мониторинг после запуска.

Если вы строите агентов для реальной работы - начните с этого разбора:
📎Как оценивать сложных AI-агентов в продакшне

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
NVIDIA переносит AI-агентов на локальные компьютеры и в физический мир 😎

NVIDIA и Microsoft представили RTX Spark - новый класс Windows-ПК для персональных AI-агентов. Внутри: 1 PFLOP AI-производительности, до 128 ГБ объединенной памяти, запуск больших моделей локально и OpenShell для безопасной работы агентов на основном устройстве.

Параллельно NVIDIA выложила открытый набор навыков для агентов. Репозиторий уже доступен на GitHub: NVIDIA/skills.

Внутри - навыки для робототехники, автономного транспорта, компьютерного зрения и промышленных цифровых двойников. Такие навыки описывают, какие инструменты агент должен вызвать, какой результат получить и как проверить выполнение задачи.

Навыки для агентов постепенно становятся стандартным способом упаковывать экспертные действия. Сначала это было заметно в кодинге, теперь формат идет в локальные компьютеры, роботов, симуляции и промышленные сценарии.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Claude Code сбросили лимиты для Pro/Max 🎉

Причина - баг, из-за которого некоторые сессии Opus 4.8 запускали слишком много параллельных субагентов и быстро сжигали доступный лимит.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3
Perplexity описали Search as Code - новый подход к поиску для AI-агентов

Агенту мало один раз вызвать поиск и получить готовую выдачу.
В сложных задачах ему нужно самому собирать стратегию:

🔵 где искать
🔵 как разветвлять запросы
🔵 как фильтровать и проверять источники
🔵 что сохранить промежуточно
🔵 что вообще не тащить в контекст модели

В архитектуре Perplexity агент генерирует Python-код, запускает его в защищенной песочнице и через SDK управляет отдельными частями поискового стека:

search - поиск
ranking - ранжирование
filtering - фильтрация
deduplication - удаление дублей
aggregation - сборка результата

Для задач вроде расследований, поиска уязвимостей или широкого ресерча это намного удобнее, чем гонять десятки отдельных вызовов поиска через модель.

Самый показательный пример из статьи - задача по CVE.

Агенту нужно было найти больше 200 серьезных уязвимостей, подтвердить каждую через вендорский advisory, указать продукт и версию исправления.

Результат: SaC получил 100% точности и снизил расход токенов на 85.1% относительно базового подхода.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Odysseus 24.8k - Self hosted AI-среда от ютубера PewDiePie 👍

Идея проекта - собрать у себя локальный AI-центр: чат, агенты, модели, документы, память, поиск, почта, календарь и исследования в одном веб-интерфейсе.

Что внутри:
🔵 чат с локальными моделями и API: Ollama, llama.cpp, vLLM, OpenAI, OpenRouter
🔵 агентный режим с инструментами: веб, файлы, shell, MCP, память, навыки
🔵 Cookbook - подбор, скачивание и запуск моделей под ваше железо
🔵 Deep Research - многошаговый поиск и итоговые отчеты
🔵 редактор документов с AI-правками и подсказками
🔵 заметки, задачи, расписания и напоминания
🔵 почта IMAP/SMTP с тегами, разбором и черновиками ответов
🔵 календарь CalDAV
🔵 мобильный интерфейс и PWA

Стек: FastAPI, Python, SQLite, ChromaDB, SearXNG, Docker Compose и большой веб-интерфейс.

Получается полноценная локальная AI-панель на своем железе.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI обновила Codex и добавила три заметных блока:

1. Ролевые плагины

Это готовые наборы инструкций, навыков, рабочих сценариев и подключений к приложениям для конкретных профессий. В первом пакете - 62 приложения и 110 навыков.

Примеры:
🔵 Data Analytics - анализ метрик, отчеты и дашборды через Snowflake, Databricks Genie, Hex, Tableau
🔵 Creative Production - кампании, баннеры и изображения товаров через Figma, Canva, Shutterstock, Picsart, Fal
🔵 Sales - подготовка к встречам, письма и задачи после встреч, CRM и планы закрытия сделок через Salesforce, HubSpot, Slack, Outreach
🔵 Product Design - проверка пользовательских сценариев, прототипы из live URL и статичных скриншотов
🔵 Investing / Banking - финансовая отчетность компаний, сравнение бизнесов, презентации для клиентов и проверка инвест-тезисов

2. Sites

Codex теперь может создавать, сохранять, деплоить и проверять сайты: веб-приложения, дашборды, внутренние инструменты и игры.

3. Annotations

Теперь можно выделить конкретную часть результата и попросить Codex доработать именно ее: блок на сайте, кусок документа, таблицу, слайд, Markdown или код.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Desktop - теперь агента можно запускать как обычное приложение 🔱

Nous Research выпустили публичную бету Hermes Desktop для macOS, Windows и Linux.

Есть возможность подключаться к удаленному gateway - документация.

Идеальный сценарий такой: Desktop - для плотной работы за ПК, Telegram - для удаленного управления агентом.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3
NVIDIA Blueprints - готовые схемы для AI-агентов 🚗

NVIDIA анонсировала новый набор для enterprise-агентов: NemoClaw Blueprints, Nemotron models, OpenShell secure runtime и CUDA-X libraries как skills для агентов.

В новости много крупных партнеров: Cadence, Dassault Systèmes, Siemens и Synopsys уже используют NemoClaw для автономных AI-инженеров, Microsoft, Canonical, Red Hat, SAP и ServiceNow встраивают OpenShell в свои платформы, а Nemotron 3 Ultra обещает до 5x быстрее инференс и до 30% ниже стоимость для сложных агентных задач.

Blueprints - это каталог готовых референсных сборок для AI-приложений: архитектура, модели, NIM-микросервисы, инструменты, код и быстрый деплой собраны вокруг конкретной задачи.

Как это работает: у Blueprint есть прикладной сценарий, например security-анализ контейнера или локализация видео. Дальше NVIDIA показывает, какие сервисы нужны, как они связаны, где агент вызывает инструменты, где работает оркестрация и где человек принимает решение.

1. NemoClaw for Hermes Agent

Blueprint для запуска Hermes Agent в enterprise-среде. Hermes подключается к утвержденным инструментам и источникам данных, работает внутри NVIDIA OpenShell с политиками доступа, учится на командных процессах и превращает повторяемые правила в Hermes Skills.

2. Vulnerability Analysis for Container Security

Blueprint для разбора уязвимостей контейнеров. На вход подаются CVE из сканера, агент подтягивает код, документацию и контекст, строит чеклист расследования, проверяет пункты и выдает аналитику для security-специалиста.

3. Content Localization

Blueprint для медиа: перевод и локализация видео, автоматический дубляж, определение активного спикера, синхронизация губ под переведенную речь и сохранение фонового звука.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Claude как аналитик поверх хранилища данных 🎉

Хранилище данных - это место, куда компания собирает данные из разных систем, чтобы потом анализировать продукт и бизнес:
🔵 продукт: пользователи, события, действия
🔵 платежи: счета, подписки, выручка
🔵 CRM: клиенты, сделки, сегменты
🔵 маркетинг: кампании, источники трафика
🔵 поддержка: обращения, жалобы, статусы

Anthropic разобрали, как они автоматизировали 95% запросов бизнес-аналитики через Claude и почему простого доступа агента к таблицам мало: нужны канонические метрики, семантический слой, навыки, оценки и проверка ответов.

📎 Как Anthropic строит самостоятельную аналитику с Claude

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
LangChain, LangGraph и Deep Agents - три уровня одной экосистемы для AI-агентов 🔄

LangChain - быстрый старт: модели, инструменты, сообщения, middleware и готовый цикл агента.

LangGraph - когда нужен контроль: состояние, граф выполнения, потоковая выдача, человек в контуре, сохранение и долгие процессы.

Deep Agents - готовая обвязка поверх LangGraph для более автономных задач: файлы, план, подагенты, навыки, память и управление контекстом.

Есть репозиторий langchain-ai/langgraph-101, в котором собраны полезные гайды. Ниже перевод:

🔵 Первый агент: модели, инструменты, память и потоковая выдача
🔵 Middleware, человек в контуре и безопасные агенты
🔵 Почтовый агент: сортировка, ответы, память и человек в контуре
🔵 Многоагентные системы: супервизор, подагенты и оценки
🔵 Исследовательский агент: поиск, координатор и параллельные подагенты
🔵 Deep Agents: агент с файлами, памятью и навыками

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4