Agents Lab – Telegram

Agents Lab

743 subscribers

40 photos

24 videos

128 links

Обсуждаем AI агентов

Наш чатик https://t.me/agents_lab_community

Download Telegram

About

Blog

Apps

Platform

743 subscribers

This media is not supported in your browser

VIEW IN TELEGRAM

Граф знаний в кодинге - это способ описать объекты и связи между ними. Объекты называются узлами, связи - рёбрами. В коде узлами могут быть файлы, функции, классы и роуты, а рёбрами - вызовы функций, импорты, наследование и ссылки.

CodeGraph (8.9к звёзд) делает такой граф для репозитория.

Он локально индексирует проект: парсит код через tree-sitter, записывает символы и связи в SQLite и отдаёт результат AI-агентам через MCP. Поддерживаются Claude Code, Cursor, Codex CLI и OpenCode.

Зачем это нужно: агенту не приходится каждый раз искать по файлам, чтобы понять проект. Он может быстро спросить, где объявлен символ, кто вызывает функцию, что затронет правка и какие файлы связаны с задачей.

Автор показывает бенчмарки на 6 реальных репозиториях: в среднем 92% меньше вызовов инструментов и 71% быстрее изучение. Всё работает локально, без API-ключей и без отправки кода наружу.

Чат | CloseRouter

👍8❤1🔥1

927 views19:17

📎

Как OpneAI используют Codex

OpenAI рассказала, как ее инженеры ежедневно используют Codex: разбор больших репозиториев, рефакторинг, тесты, оптимизация и задачи в фоне.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

Как OpenAI использует Codex

Главная мысль: Codex дает больше всего пользы в обычной инженерной работе, где нужно быстро разобраться в коде, внести согласованные изменения, написать тесты, ускорить выпуск функции или не потерять контекст между встречами и дежурствами. Codex используют…

🔥2

616 views11:02

This media is not supported in your browser

VIEW IN TELEGRAM

Skill bundles в Hermes Agent

Skill bundles - это наборы skills, которые запускаются одной командой.
Если для задачи всегда нужны одни и те же навыки, их можно объединить:

hermes bundles create backend-dev \
  --skill github-code-review \
  --skill test-driven-development \
  --skill github-pr-workflow

После этого команда:

/backend-dev refactor auth middleware

загрузит сразу все skills из набора и передаст агенту задачу.

Bundles хранятся в: ~/.hermes/skill-bundles/

Их можно смотреть и управлять ими:

hermes bundles list
hermes bundles show backend-dev
hermes bundles delete backend-dev

В чате есть команда: /bundles

Важно: bundle не устанавливает skills, а только объединяет уже доступные. Если часть skills отсутствует, Hermes просто пропустит их.

Это удобно для повторяющихся сценариев: разработка фич, подготовка релиза, разбор инцидента, исследование темы. Вместо нескольких команд - одна короткая команда под конкретный рабочий процесс.

Доступно после /update

Чат | CloseRouter

🔥3❤2👍1

769 views17:29

Letta - агентская платформа от команды MemGPT, где главная фишка - память

Обычный агент хорошо работает внутри одной сессии. Letta пытается сделать агента долгоживущим: у него есть постоянная память, история разговоров, настройки, инструменты и несколько параллельных чатов. Он может помнить ваши привычки, структуру проекта, прошлые ошибки и сам обновлять свои заметки по ходу работы.

Есть несколько способов пользоваться:

- CLI: npm install -g @letta-ai/letta-code, потом команда letta
- Desktop app: GUI для macOS, Windows и Linux
- Web/mobile: через chat.letta.com
- Каналы: Telegram, Slack, Discord
- API: Python/TypeScript SDK и REST API для своих приложений

В Letta Code память хранится в MemFS - git-backed наборе markdown-файлов. Ее можно смотреть, редактировать, версионировать и чинить через команды вроде /memory, /remember, /doctor, /init.

Еще есть ADE, Agent Development Environment. Это GUI для отладки агента: видно, что лежит в контексте, какие memory blocks подключены, какие инструменты доступны, какие вызовы агент сделал и где ошибся.

Еще есть плагин Claude Subconscious - Claude Code, который добавляет ему память через Letta.

Он следит за сессиями Claude Code, отправляет историю работы фоновому агенту Letta, дает ему читать файлы проекта через Read/Grep/Glob и сохранять важный контекст между сессиями.

Перед следующим запросом Claude получает короткие подсказки из этой памяти: что уже обсуждали, какие решения приняли, на что обратить внимание.

Чат | CloseRouter

👏3🔥1

883 views08:32

Если вы уже пользуетесь Gemini CLI, Claude Code или Codex, google/agents-cli добавляет им полезный следующий шаг: из помощника, который пишет код в вашем репозитории, можно собрать агента, который работает как отдельный облачный сервис.

Локальный кодовый агент хорош для задач вроде "напиши функцию", "почини тест", "собери прототип". Облачный агент нужен там, где работа должна продолжаться без открытого терминала: по расписанию, по событию, с доступом к логам, документам, базам, правами, проверками и наблюдением в Google Cloud.

Что можно сделать через agents-cli:

🔵 попросить Claude Code, Codex или Gemini CLI собрать агента на ADK по обычному описанию задачи;
🔵 быстро получить проект с тестами, eval-проверками, шаблонами развёртывания и документацией;
🔵 развернуть агента в Agent Runtime, Cloud Run или GKE;
🔵 сделать агента для ежедневных дайджестов, поддержки, внутреннего поиска по документам, анализа инцидентов или ночной проверки метрик;
🔵 опубликовать агента в Gemini Enterprise, чтобы им могла пользоваться команда или другие агенты.

Ваш привычный кодовый агент получает инструкции и команды, чтобы довести идею до работающего облачного агента, с проверками, логами, правами доступа и нормальным циклом обновлений.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

2.49K views19:49

This media is not supported in your browser

VIEW IN TELEGRAM

RMUX - мультиплексор терминала на Rust, совместимый с tmux, но явно заточенный под AI-агентов.

Агент работает в живой shell-сессии, а внешний код может отправлять ему ввод, читать экран, ждать нужный текст, снимать structured snapshots и управлять несколькими панелями. В демо Claude через RMUX управляет Codex, Gemini и Grok: рассылает им команды, читает ответы и собирает результат.

Для агентных workflow это полезно там, где обычный терминал быстро разваливается: долгие задачи по SSH, несколько CLI-агентов рядом, проверка состояния TUI, оркестрация "один агент ставит задачи другим".

Главные отличия от tmux:
🔵 typed Rust SDK, а не только CLI-скрипты;
🔵 structured snapshots, события вывода и ожидание текста;
🔵 нативная поддержка Windows через ConPTY и Named Pipes;
🔵 CLI, SDK и ratatui widget работают через один локальный daemon;
🔵 при этом заявлена совместимость с 90 командами tmux

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2👍1

929 views10:43

Что такое Harness в агентах на самом деле?

Когда говорят про агентов на языковых моделях, чаще всего обсуждают саму модель. Но в реальных задачах многое решает обвязка вокруг нее: инструменты, состояние, проверки, восстановление после ошибок и правила остановки.

Я перевел свежую статью с arxiv:

📎

Естественный язык в Agent Harnesses (обвязке): почему политику агента стоит выносить в читаемый текст, а точные механизмы оставлять в коде.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

Обвязки AI-агентов: почему модель - это только часть системы

Когда я смотрю на современных AI-агентов, я стараюсь не сводить все к вопросу «какая модель умнее». В реальных задачах результат часто решает не только модель, а вся система вокруг нее: какие инструкции она получает, какие инструменты ей доступны, где хранится…

🔥6

1.01K views19:03

Как собрать команду агентов в Claude Code

🤔

Статья о том, как использовать Claude Code не как один чат, а как команду агентов: один отвечает за серверную часть, другой за интерфейс, отдельные агенты занимаются тестами, ревью и безопасностью.

Главное - заранее задать роли, бюджет, ограничения и критерии готовности. Иначе параллельная работа быстро превращается в лишний расход токенов.

📎

Команда агентов в Claude Code

К статье хорошо подходит репозиторий VoltAgent/awesome-claude-code-subagents:

Там собрано 131+ готовых подагентов для Claude Code: разработка, языки и фреймворки, инфраструктура, безопасность, тесты, данные, AI и оркестрация.

Можно взять готовые роли вроде backend-developer, python-pro, code-reviewer, test-automator, agent-organizer и быстро собрать команду под свой репозиторий.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥1

1.02K views19:23

Полезная подборка для юзеров Claude Code

🎉

Agentic Project Management (2.3к ⭐)
APM превращает работу с агентами в управляемый проектный процесс: сначала Planner собирает требования и пишет Spec/Plan/Rules, потом Manager раздает задачи Workers. Главная идея - хранить состояние проекта в файлах и передавать контекст через Handoff, чтобы длинная разработка не разваливалась в одном огромном чате.

Claude Squad (7.6к ⭐)
Claude Squad - терминальная панель для параллельного запуска Claude Code, Codex, Gemini, Aider и других локальных агентов. Внутри используются tmux и git worktrees: у каждой задачи свой изолированный воркспейс, а пользователь может смотреть diff, заходить в сессию, коммитить и пушить изменения из одного TUI.

Claude Code Action (7.7к ⭐)
Официальный GitHub Action от Anthropic, который подключает Claude Code к issues и pull request: можно вызвать @claude, назначить issue, повесить label или запустить явную автоматизацию через workflow. Он умеет отвечать на вопросы по коду, делать ревью, вносить простые правки и работать через Anthropic API, AWS Bedrock, Google Vertex AI или Microsoft Foundry.

Claude Code Router (34.4к ⭐)
Ставит между Claude Code и моделью свой слой маршрутизации: можно отправлять разные типы задач в OpenRouter, DeepSeek, Ollama, Gemini, Volcengine, SiliconFlow и другие провайдеры.

SuperClaude Framework (23к ⭐)
Набор конфигураций для Claude Code, который добавляет команды, специализированных агентов, режимы поведения и интеграции с MCP. Заявлены 30 slash-команд, 20 агентов, 7 режимов и 8 MCP-серверов, то есть проект больше похож на структурированный слой методологии поверх Claude Code.

Ruflo (54.9к ⭐)
Описывает себя как платформу оркестрации агентов для Claude Code: swarms, память между сессиями, MCP, федерация между машинами и большое число специализированных агентов.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3👍2

2.72K views10:31

This media is not supported in your browser

VIEW IN TELEGRAM

mini-SWE-agent (4.5к ⭐) - минимальный coding-агент от команды SWE-agent, Princeton и Stanford.

Агенту не всегда нужен большой фреймворк. Иногда достаточно модели, bash, среды выполнения и понятной истории сообщений.

Внутри всё устроено очень просто: агент получает задачу, предлагает команду, выполняет ее, добавляет вывод в историю и повторяет цикл до финального ответа. Основной инструмент - shell, без сложного tool-calling слоя.

Авторы заявляют больше 74% на SWE-bench Verified с Gemini 3 Pro. Для такого маленького agent harness это хороший сигнал: часть сложности уходит из фреймворков в модели и простую обвязку.
Также это влияет и на расход токенов, минимум лишнего контекста.

В X как раз обсуждали, какой сейчас стандарт для агентов. Общий настрой такой: единого стандарта нет. Многие уходят от тяжелых фреймворков к тонким кастомным циклам: model call, tool permissions, state, evals, logs, retries.

LangGraph всё еще используют для сложных workflow, LangSmith - для трассировки и evals. Но всё чаще советуют прямые SDK, Vercel AI SDK, Google ADK, Pydantic AI, Mastra, Claude SDK или готовые harness вроде Pi/OpenCode.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

931 views19:15

Uber Engineering написали, как они решают проблему личности у AI агентов.

В начале 2025 года Uber запустила внутреннюю платформу агентов и открыла доступ к тысячам микросервисов через MCP. После этого появилась неприятная проблема: агент может действовать по поручению человека, вызывать других агентов и инструменты, менять план по ходу задачи, но в логах часто видно только сервисную учетную запись.

Пример: инженер просит агента разобраться с алертом. Один агент анализирует инцидент, второй предлагает изменить настройку, третий открывает PR. Без нормальной цепочки личности потом сложно понять, кто запустил действие, какие агенты участвовали и почему им разрешили менять систему.

Uber решает это через короткоживущие токены и явную цепочку участников:

🔵 каждый агент регистрируется и привязывается к конкретному рабочему процессу в Kubernetes
🔵 рабочий процесс получает криптографическую личность через SPIRE
🔵 агент запрашивает JWT у STS только для следующего шага
🔵 в токен попадает цепочка вида: пользователь -> агент -> другой агент -> инструмент
🔵 шлюз MCP проверяет токен, применяет правила доступа и при необходимости включает AI Guard для защиты от утечек и вредных запросов

Токены живут минуты и ограничены конкретным получателем. Украсть такой токен из одного вызова и использовать его для другого сервиса сильно сложнее.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

549 views14:15

Hermes Desktop 7.6к⭐ - графическая оболочка для Hermes Agent. Доступна на Mac, Windows и Linux.

Она берет то, что обычно живет в терминале, и собирает в одном приложении: установку агента, выбор модели, чат, память, навыки, инструменты, расписания, профили и подключение к мессенджерам.

🔵 можно работать локально, через удаленный API-сервер или по SSH
🔵 есть профили агентов с отдельными конфигами и моделями
🔵 поддерживаются OpenRouter, Anthropic, OpenAI, Gemini, Grok, Qwen, MiniMax, Nous, Hugging Face, Groq и локальные OpenAI-compatible модели
🔵 чат показывает вызовы инструментов, токены, стоимость, вложения и slash-команды
🔵 есть экраны Skills, Memory, Tools, Schedules, Gateway, Kanban и Office
🔵 в коде аккуратно сделана защита Electron: webview ограничены localhost, ключи не отдаются в публичный конфиг

Проект активно развивается: свежий релиз v0.5.1 вышел 25 мая, в репозитории уже больше 7.5k звезд.

Если используете Hermes Agent, репозиторий стоит посмотреть: это уже не просто чат к модели, а рабочая панель для управления агентом, его окружениями и каналами связи.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11🔥5🙏1

971 views18:32

Pi Agent - терминальный AI-агент для разработки, который работает с реальным проектом: читает файлы, запускает команды, редактирует код, хранит сессии и расширяется через навыки, шаблоны и плагины.

📎

Pi Agent: базовый гайд для новичков

Собрал короткий базовый гайд для новичков: как установить Pi, отправить первый запрос, подключить модель, работать с файлами, настроить AGENTS.md, использовать сессии и не сломать проект на первых экспериментах.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2👏2

1.04K views13:36

Robinhood открывает агентам доступ к деньгам
Robinhood запустила Agentic Trading и Agentic Credit Card: теперь пользователь может подключить своего AI-агента к трейдингу и покупкам по карте. Это уже реальный доступ к финансовым операциям, поэтому Robinhood добавила отдельные счета, лимиты, уведомления и быстрый выключатель.

Base MCP: кошелек для AI-агента
Base показала MCP для агентов, который дает агенту кошелек, лимиты расходов и доступ к действиям в DeFi. Агент сможет не только советовать, но и платить за сервисы, управлять портфелем и выполнять ончейн-операции по заданным правилам.

Cua Driver теперь работает с Windows 17.2к⭐
Cua добавила Windows-поддержку для своего драйвера computer-use агентов. Claude Code, Codex, Hermes и другие агенты смогут работать с реальными Windows-приложениями через экран, клики, ввод и дерево доступности, включая старые корпоративные программы без API.

React Doctor ловит ошибки в React-коде, написанном агентом 11.2к⭐
React Doctor - open source инструмент, который проверяет React-код на проблемы в состоянии компонентов, эффектах, производительности, архитектуре, безопасности и доступности. Его можно запускать через npx react-doctor@latest, подключать к агентам и гонять в CI перед мерджем.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2

898 views08:12

This media is not supported in your browser

VIEW IN TELEGRAM

Claude Code получил Dynamic Workflows

Anthropic выпустили Claude Opus 4.8 и добавили в Claude Code новую функцию Dynamic Workflows.

Теперь Claude может сам писать JavaScript-сценарий, разбивать большую задачу на этапы и запускать десятки subagents параллельно.

Это подходит для задач, которые сложно решить одним агентом:

- аудит всего репозитория
- миграции на сотни файлов
- поиск багов
- security review
- глубокие исследования с проверкой источников

Главное отличие - workflow держит план, циклы и промежуточные результаты в коде, а Claude возвращает один собранный отчет. Одни агенты выполняют работу, другие перепроверяют их выводы.

Запустить можно через слово workflow в задаче, команду /deep-research или режим /effort ultracode, где Claude сам решает, когда нужна такая оркестрация.

Opus 4.8 тоже обновился под длинные агентные задачи: 69,2% на SWE-bench Pro, 74,6% на Terminal-Bench 2.1, контекст до 1M токенов и та же базовая цена, что у Opus 4.7.

Функция пока в research preview и может быстро расходовать токены, но направление важное: coding agents становятся не одиночными помощниками, а управляемыми командами агентов.

Чат

❤4🔥2

1.02K views17:46

🔵

Hermes выкатил большой релиз 2026.5.28

Сделали рефакторинг, прокачали Kanban - добавили полноценный swarm, ускорили холодный старт и внедрили защиту от промт-инъекций.

📎

Прочитать изменения на русском

🔵Mistral прокачивает свою экосистему

Они встроили Vibe CLI в веб-чат.
Внутри есть Work Mode для длинных многошаговых задач и Code Mode для работы с репозиториями: агент может подключаться к GitHub, разбираться в коде, готовить изменения и доводить их до pull request.

Отдельно добавили расширение для VS Code и перенос сессий между терминалом и облаком. То есть задачу можно начать в чате, продолжить в редакторе, а потом отдать агенту проверку и доработку.

Выстраивают систему как у Anthropic, только пока на минималках 🙃

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

944 views09:40

🔥

Anthropic Cybersecurity Skills - библиотека из 754 готовых навыков для AI-агентов в кибербезопасности: расследование взломов, анализ логов, вредоносных файлов, облаков, Kubernetes, фишинга и инцидентов.

Что особенно полезно:
🔵 агент получает пошаговый план, а не просто общие советы
🔵 в каждом навыке указано, какие данные собрать, какие команды запускать и как проверить результат
🔵 можно подключать к Claude Code, Codex CLI, Cursor и другим AI-инструментам
🔵 подходит для SOC, DevSecOps, аудита и обучения

Например, при расследовании зараженного компьютера агент сможет сам пройти по процессам, сетевым подключениям, следам кражи паролей и собрать понятный отчет. То есть репозиторий превращает AI-агента в более практичного помощника для задач безопасности.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

1.09K views17:35

🔵

Codex теперь управляет Windows-приложениями

OpenAI выпустили обновление Codex app: Computer Use теперь работает на Windows. Агент может видеть экран, кликать и печатать в активном окне, а работу на Windows-устройстве можно запускать и проверять удаленно с iOS, Android или Mac.

🔵

Kimi Code CLI - новый open-source агент для кода от MoonshotAI

MoonshotAI выложили Kimi Code CLI - AI-агента, который читает и редактирует код, запускает shell-команды, ищет по файлам, ходит в web и поддерживает MCP. У проекта 1.4k звезд на GitHub и отдельная система подагентов для задач вроде coder, explore и plan.

🔵

Google показал, как строить долгоживущих AI-агентов на ADK

Сделал русскую адаптацию статьи:
📎 Долгоживущие AI-агенты на ADK: пауза, возобновление и сохранение контекста

Google разобрал архитектуру агента, который может ставить процесс на паузу, ждать внешнее событие несколько дней, переживать рестарты и продолжать с того же места. Пример - HR-онбординг: агент отправляет документы, ждет подпись, передает задачу IT-субагенту, ждет доставку ноутбука и завершает процесс без потери контекста.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2

964 views09:46

📎

WebMCP: как сделать сайт инструментом для AI-агентов

AI-агенты уже ходят по сайтам, но чаще видят только HTML и текст. WebMCP предлагает следующий шаг: сайт сам описывает, какие данные и безопасные действия он может отдать агенту - от поиска по каталогу до чтения документации и проверки статуса заказа.

В статье рассказывается, зачем нужен этот стандарт, почему внедрение пока почти нулевое, как его можно попробовать в SvelteKit/Next.js и какие функции лучше не отдавать агентам.

Если делаете продукт, документацию или сервис, который должен быть удобен не только людям, но и AI-агентам, стоит прочитать.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍1

1K views19:09

Deep Agents: что это за класс AI-агентов

У LangChain есть deepagents 23.6к⭐ - открытый репозиторий с готовым каркасом для сложных AI-агентов. Внутри уже собраны вещи, которые обычно приходится склеивать вручную: план задач, файловая среда, запуск команд в песочнице, подагенты с отдельным контекстом, долговременная память, навыки, MCP-инструменты и подтверждение опасных действий человеком.

Такой агент может вести длинную задачу: разбить ее на шаги, делегировать часть работы, читать и менять файлы, запускать проверки, сохранять полезный контекст между сессиями и возвращаться к нему позже. Поэтому к нему уже нельзя относиться как к обычному чату с моделью.

Главный вопрос становится другим: как понять, что агент действительно сделал работу правильно, а не просто красиво ответил?

В статье разбираю практический подход AWS и LangSmith к оценке таких агентов: трассы, вызовы инструментов, аргументы, ошибки по шагам, LLM-as-judge, офлайн-тесты и мониторинг после запуска.

Если вы строите агентов для реальной работы - начните с этого разбора:

📎

Как оценивать сложных AI-агентов в продакшне

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍3

949 viewsedited 22:03

NVIDIA переносит AI-агентов на локальные компьютеры и в физический мир

😎

NVIDIA и Microsoft представили RTX Spark - новый класс Windows-ПК для персональных AI-агентов. Внутри: 1 PFLOP AI-производительности, до 128 ГБ объединенной памяти, запуск больших моделей локально и OpenShell для безопасной работы агентов на основном устройстве.

Параллельно NVIDIA выложила открытый набор навыков для агентов. Репозиторий уже доступен на GitHub: NVIDIA/skills.

Внутри - навыки для робототехники, автономного транспорта, компьютерного зрения и промышленных цифровых двойников. Такие навыки описывают, какие инструменты агент должен вызвать, какой результат получить и как проверить выполнение задачи.

Навыки для агентов постепенно становятся стандартным способом упаковывать экспертные действия. Сначала это было заметно в кодинге, теперь формат идет в локальные компьютеры, роботов, симуляции и промышленные сценарии.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

619 views14:51