Agents Lab – Telegram

Agents Lab

740 subscribers

40 photos

24 videos

128 links

Обсуждаем AI агентов

Наш чатик https://t.me/agents_lab_community

Download Telegram

About

Blog

Apps

Platform

740 subscribers

This media is not supported in your browser

VIEW IN TELEGRAM

RMUX - мультиплексор терминала на Rust, совместимый с tmux, но явно заточенный под AI-агентов.

Агент работает в живой shell-сессии, а внешний код может отправлять ему ввод, читать экран, ждать нужный текст, снимать structured snapshots и управлять несколькими панелями. В демо Claude через RMUX управляет Codex, Gemini и Grok: рассылает им команды, читает ответы и собирает результат.

Для агентных workflow это полезно там, где обычный терминал быстро разваливается: долгие задачи по SSH, несколько CLI-агентов рядом, проверка состояния TUI, оркестрация "один агент ставит задачи другим".

Главные отличия от tmux:
🔵 typed Rust SDK, а не только CLI-скрипты;
🔵 structured snapshots, события вывода и ожидание текста;
🔵 нативная поддержка Windows через ConPTY и Named Pipes;
🔵 CLI, SDK и ratatui widget работают через один локальный daemon;
🔵 при этом заявлена совместимость с 90 командами tmux

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2👍1

928 views10:43

Что такое Harness в агентах на самом деле?

Когда говорят про агентов на языковых моделях, чаще всего обсуждают саму модель. Но в реальных задачах многое решает обвязка вокруг нее: инструменты, состояние, проверки, восстановление после ошибок и правила остановки.

Я перевел свежую статью с arxiv:

📎

Естественный язык в Agent Harnesses (обвязке): почему политику агента стоит выносить в читаемый текст, а точные механизмы оставлять в коде.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

Обвязки AI-агентов: почему модель - это только часть системы

Когда я смотрю на современных AI-агентов, я стараюсь не сводить все к вопросу «какая модель умнее». В реальных задачах результат часто решает не только модель, а вся система вокруг нее: какие инструкции она получает, какие инструменты ей доступны, где хранится…

🔥6

1.01K views19:03

Как собрать команду агентов в Claude Code

🤔

Статья о том, как использовать Claude Code не как один чат, а как команду агентов: один отвечает за серверную часть, другой за интерфейс, отдельные агенты занимаются тестами, ревью и безопасностью.

Главное - заранее задать роли, бюджет, ограничения и критерии готовности. Иначе параллельная работа быстро превращается в лишний расход токенов.

📎

Команда агентов в Claude Code

К статье хорошо подходит репозиторий VoltAgent/awesome-claude-code-subagents:

Там собрано 131+ готовых подагентов для Claude Code: разработка, языки и фреймворки, инфраструктура, безопасность, тесты, данные, AI и оркестрация.

Можно взять готовые роли вроде backend-developer, python-pro, code-reviewer, test-automator, agent-organizer и быстро собрать команду под свой репозиторий.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥1

1.02K views19:23

Полезная подборка для юзеров Claude Code

🎉

Agentic Project Management (2.3к ⭐)
APM превращает работу с агентами в управляемый проектный процесс: сначала Planner собирает требования и пишет Spec/Plan/Rules, потом Manager раздает задачи Workers. Главная идея - хранить состояние проекта в файлах и передавать контекст через Handoff, чтобы длинная разработка не разваливалась в одном огромном чате.

Claude Squad (7.6к ⭐)
Claude Squad - терминальная панель для параллельного запуска Claude Code, Codex, Gemini, Aider и других локальных агентов. Внутри используются tmux и git worktrees: у каждой задачи свой изолированный воркспейс, а пользователь может смотреть diff, заходить в сессию, коммитить и пушить изменения из одного TUI.

Claude Code Action (7.7к ⭐)
Официальный GitHub Action от Anthropic, который подключает Claude Code к issues и pull request: можно вызвать @claude, назначить issue, повесить label или запустить явную автоматизацию через workflow. Он умеет отвечать на вопросы по коду, делать ревью, вносить простые правки и работать через Anthropic API, AWS Bedrock, Google Vertex AI или Microsoft Foundry.

Claude Code Router (34.4к ⭐)
Ставит между Claude Code и моделью свой слой маршрутизации: можно отправлять разные типы задач в OpenRouter, DeepSeek, Ollama, Gemini, Volcengine, SiliconFlow и другие провайдеры.

SuperClaude Framework (23к ⭐)
Набор конфигураций для Claude Code, который добавляет команды, специализированных агентов, режимы поведения и интеграции с MCP. Заявлены 30 slash-команд, 20 агентов, 7 режимов и 8 MCP-серверов, то есть проект больше похож на структурированный слой методологии поверх Claude Code.

Ruflo (54.9к ⭐)
Описывает себя как платформу оркестрации агентов для Claude Code: swarms, память между сессиями, MCP, федерация между машинами и большое число специализированных агентов.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3👍2

2.72K views10:31

This media is not supported in your browser

VIEW IN TELEGRAM

mini-SWE-agent (4.5к ⭐) - минимальный coding-агент от команды SWE-agent, Princeton и Stanford.

Агенту не всегда нужен большой фреймворк. Иногда достаточно модели, bash, среды выполнения и понятной истории сообщений.

Внутри всё устроено очень просто: агент получает задачу, предлагает команду, выполняет ее, добавляет вывод в историю и повторяет цикл до финального ответа. Основной инструмент - shell, без сложного tool-calling слоя.

Авторы заявляют больше 74% на SWE-bench Verified с Gemini 3 Pro. Для такого маленького agent harness это хороший сигнал: часть сложности уходит из фреймворков в модели и простую обвязку.
Также это влияет и на расход токенов, минимум лишнего контекста.

В X как раз обсуждали, какой сейчас стандарт для агентов. Общий настрой такой: единого стандарта нет. Многие уходят от тяжелых фреймворков к тонким кастомным циклам: model call, tool permissions, state, evals, logs, retries.

LangGraph всё еще используют для сложных workflow, LangSmith - для трассировки и evals. Но всё чаще советуют прямые SDK, Vercel AI SDK, Google ADK, Pydantic AI, Mastra, Claude SDK или готовые harness вроде Pi/OpenCode.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

930 views19:15

Uber Engineering написали, как они решают проблему личности у AI агентов.

В начале 2025 года Uber запустила внутреннюю платформу агентов и открыла доступ к тысячам микросервисов через MCP. После этого появилась неприятная проблема: агент может действовать по поручению человека, вызывать других агентов и инструменты, менять план по ходу задачи, но в логах часто видно только сервисную учетную запись.

Пример: инженер просит агента разобраться с алертом. Один агент анализирует инцидент, второй предлагает изменить настройку, третий открывает PR. Без нормальной цепочки личности потом сложно понять, кто запустил действие, какие агенты участвовали и почему им разрешили менять систему.

Uber решает это через короткоживущие токены и явную цепочку участников:

🔵 каждый агент регистрируется и привязывается к конкретному рабочему процессу в Kubernetes
🔵 рабочий процесс получает криптографическую личность через SPIRE
🔵 агент запрашивает JWT у STS только для следующего шага
🔵 в токен попадает цепочка вида: пользователь -> агент -> другой агент -> инструмент
🔵 шлюз MCP проверяет токен, применяет правила доступа и при необходимости включает AI Guard для защиты от утечек и вредных запросов

Токены живут минуты и ограничены конкретным получателем. Украсть такой токен из одного вызова и использовать его для другого сервиса сильно сложнее.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

549 views14:15

Hermes Desktop 7.6к⭐ - графическая оболочка для Hermes Agent. Доступна на Mac, Windows и Linux.

Она берет то, что обычно живет в терминале, и собирает в одном приложении: установку агента, выбор модели, чат, память, навыки, инструменты, расписания, профили и подключение к мессенджерам.

🔵 можно работать локально, через удаленный API-сервер или по SSH
🔵 есть профили агентов с отдельными конфигами и моделями
🔵 поддерживаются OpenRouter, Anthropic, OpenAI, Gemini, Grok, Qwen, MiniMax, Nous, Hugging Face, Groq и локальные OpenAI-compatible модели
🔵 чат показывает вызовы инструментов, токены, стоимость, вложения и slash-команды
🔵 есть экраны Skills, Memory, Tools, Schedules, Gateway, Kanban и Office
🔵 в коде аккуратно сделана защита Electron: webview ограничены localhost, ключи не отдаются в публичный конфиг

Проект активно развивается: свежий релиз v0.5.1 вышел 25 мая, в репозитории уже больше 7.5k звезд.

Если используете Hermes Agent, репозиторий стоит посмотреть: это уже не просто чат к модели, а рабочая панель для управления агентом, его окружениями и каналами связи.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11🔥5🙏1

971 views18:32

Pi Agent - терминальный AI-агент для разработки, который работает с реальным проектом: читает файлы, запускает команды, редактирует код, хранит сессии и расширяется через навыки, шаблоны и плагины.

📎

Pi Agent: базовый гайд для новичков

Собрал короткий базовый гайд для новичков: как установить Pi, отправить первый запрос, подключить модель, работать с файлами, настроить AGENTS.md, использовать сессии и не сломать проект на первых экспериментах.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2👏2

1.04K views13:36

Robinhood открывает агентам доступ к деньгам
Robinhood запустила Agentic Trading и Agentic Credit Card: теперь пользователь может подключить своего AI-агента к трейдингу и покупкам по карте. Это уже реальный доступ к финансовым операциям, поэтому Robinhood добавила отдельные счета, лимиты, уведомления и быстрый выключатель.

Base MCP: кошелек для AI-агента
Base показала MCP для агентов, который дает агенту кошелек, лимиты расходов и доступ к действиям в DeFi. Агент сможет не только советовать, но и платить за сервисы, управлять портфелем и выполнять ончейн-операции по заданным правилам.

Cua Driver теперь работает с Windows 17.2к⭐
Cua добавила Windows-поддержку для своего драйвера computer-use агентов. Claude Code, Codex, Hermes и другие агенты смогут работать с реальными Windows-приложениями через экран, клики, ввод и дерево доступности, включая старые корпоративные программы без API.

React Doctor ловит ошибки в React-коде, написанном агентом 11.2к⭐
React Doctor - open source инструмент, который проверяет React-код на проблемы в состоянии компонентов, эффектах, производительности, архитектуре, безопасности и доступности. Его можно запускать через npx react-doctor@latest, подключать к агентам и гонять в CI перед мерджем.

Чат | CloseRouter

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2

898 views08:12

This media is not supported in your browser

VIEW IN TELEGRAM

Claude Code получил Dynamic Workflows

Anthropic выпустили Claude Opus 4.8 и добавили в Claude Code новую функцию Dynamic Workflows.

Теперь Claude может сам писать JavaScript-сценарий, разбивать большую задачу на этапы и запускать десятки subagents параллельно.

Это подходит для задач, которые сложно решить одним агентом:

- аудит всего репозитория
- миграции на сотни файлов
- поиск багов
- security review
- глубокие исследования с проверкой источников

Главное отличие - workflow держит план, циклы и промежуточные результаты в коде, а Claude возвращает один собранный отчет. Одни агенты выполняют работу, другие перепроверяют их выводы.

Запустить можно через слово workflow в задаче, команду /deep-research или режим /effort ultracode, где Claude сам решает, когда нужна такая оркестрация.

Opus 4.8 тоже обновился под длинные агентные задачи: 69,2% на SWE-bench Pro, 74,6% на Terminal-Bench 2.1, контекст до 1M токенов и та же базовая цена, что у Opus 4.7.

Функция пока в research preview и может быстро расходовать токены, но направление важное: coding agents становятся не одиночными помощниками, а управляемыми командами агентов.

Чат

❤4🔥2

1.02K views17:46

🔵

Hermes выкатил большой релиз 2026.5.28

Сделали рефакторинг, прокачали Kanban - добавили полноценный swarm, ускорили холодный старт и внедрили защиту от промт-инъекций.

📎

Прочитать изменения на русском

🔵Mistral прокачивает свою экосистему

Они встроили Vibe CLI в веб-чат.
Внутри есть Work Mode для длинных многошаговых задач и Code Mode для работы с репозиториями: агент может подключаться к GitHub, разбираться в коде, готовить изменения и доводить их до pull request.

Отдельно добавили расширение для VS Code и перенос сессий между терминалом и облаком. То есть задачу можно начать в чате, продолжить в редакторе, а потом отдать агенту проверку и доработку.

Выстраивают систему как у Anthropic, только пока на минималках 🙃

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

943 views09:40

🔥

Anthropic Cybersecurity Skills - библиотека из 754 готовых навыков для AI-агентов в кибербезопасности: расследование взломов, анализ логов, вредоносных файлов, облаков, Kubernetes, фишинга и инцидентов.

Что особенно полезно:
🔵 агент получает пошаговый план, а не просто общие советы
🔵 в каждом навыке указано, какие данные собрать, какие команды запускать и как проверить результат
🔵 можно подключать к Claude Code, Codex CLI, Cursor и другим AI-инструментам
🔵 подходит для SOC, DevSecOps, аудита и обучения

Например, при расследовании зараженного компьютера агент сможет сам пройти по процессам, сетевым подключениям, следам кражи паролей и собрать понятный отчет. То есть репозиторий превращает AI-агента в более практичного помощника для задач безопасности.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

1.09K views17:35

🔵

Codex теперь управляет Windows-приложениями

OpenAI выпустили обновление Codex app: Computer Use теперь работает на Windows. Агент может видеть экран, кликать и печатать в активном окне, а работу на Windows-устройстве можно запускать и проверять удаленно с iOS, Android или Mac.

🔵

Kimi Code CLI - новый open-source агент для кода от MoonshotAI

MoonshotAI выложили Kimi Code CLI - AI-агента, который читает и редактирует код, запускает shell-команды, ищет по файлам, ходит в web и поддерживает MCP. У проекта 1.4k звезд на GitHub и отдельная система подагентов для задач вроде coder, explore и plan.

🔵

Google показал, как строить долгоживущих AI-агентов на ADK

Сделал русскую адаптацию статьи:
📎 Долгоживущие AI-агенты на ADK: пауза, возобновление и сохранение контекста

Google разобрал архитектуру агента, который может ставить процесс на паузу, ждать внешнее событие несколько дней, переживать рестарты и продолжать с того же места. Пример - HR-онбординг: агент отправляет документы, ждет подпись, передает задачу IT-субагенту, ждет доставку ноутбука и завершает процесс без потери контекста.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2

964 views09:46

📎

WebMCP: как сделать сайт инструментом для AI-агентов

AI-агенты уже ходят по сайтам, но чаще видят только HTML и текст. WebMCP предлагает следующий шаг: сайт сам описывает, какие данные и безопасные действия он может отдать агенту - от поиска по каталогу до чтения документации и проверки статуса заказа.

В статье рассказывается, зачем нужен этот стандарт, почему внедрение пока почти нулевое, как его можно попробовать в SvelteKit/Next.js и какие функции лучше не отдавать агентам.

Если делаете продукт, документацию или сервис, который должен быть удобен не только людям, но и AI-агентам, стоит прочитать.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍1

999 views19:09

Deep Agents: что это за класс AI-агентов

У LangChain есть deepagents 23.6к⭐ - открытый репозиторий с готовым каркасом для сложных AI-агентов. Внутри уже собраны вещи, которые обычно приходится склеивать вручную: план задач, файловая среда, запуск команд в песочнице, подагенты с отдельным контекстом, долговременная память, навыки, MCP-инструменты и подтверждение опасных действий человеком.

Такой агент может вести длинную задачу: разбить ее на шаги, делегировать часть работы, читать и менять файлы, запускать проверки, сохранять полезный контекст между сессиями и возвращаться к нему позже. Поэтому к нему уже нельзя относиться как к обычному чату с моделью.

Главный вопрос становится другим: как понять, что агент действительно сделал работу правильно, а не просто красиво ответил?

В статье разбираю практический подход AWS и LangSmith к оценке таких агентов: трассы, вызовы инструментов, аргументы, ошибки по шагам, LLM-as-judge, офлайн-тесты и мониторинг после запуска.

Если вы строите агентов для реальной работы - начните с этого разбора:

📎

Как оценивать сложных AI-агентов в продакшне

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍3

949 viewsedited 22:03

NVIDIA переносит AI-агентов на локальные компьютеры и в физический мир

😎

NVIDIA и Microsoft представили RTX Spark - новый класс Windows-ПК для персональных AI-агентов. Внутри: 1 PFLOP AI-производительности, до 128 ГБ объединенной памяти, запуск больших моделей локально и OpenShell для безопасной работы агентов на основном устройстве.

Параллельно NVIDIA выложила открытый набор навыков для агентов. Репозиторий уже доступен на GitHub: NVIDIA/skills.

Внутри - навыки для робототехники, автономного транспорта, компьютерного зрения и промышленных цифровых двойников. Такие навыки описывают, какие инструменты агент должен вызвать, какой результат получить и как проверить выполнение задачи.

Навыки для агентов постепенно становятся стандартным способом упаковывать экспертные действия. Сначала это было заметно в кодинге, теперь формат идет в локальные компьютеры, роботов, симуляции и промышленные сценарии.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

619 views14:51

Claude Code сбросили лимиты для Pro/Max 🎉

Причина - баг, из-за которого некоторые сессии Opus 4.8 запускали слишком много параллельных субагентов и быстро сжигали доступный лимит.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🔥3

916 views20:59

Perplexity описали Search as Code - новый подход к поиску для AI-агентов

Агенту мало один раз вызвать поиск и получить готовую выдачу.
В сложных задачах ему нужно самому собирать стратегию:

🔵 где искать
🔵 как разветвлять запросы
🔵 как фильтровать и проверять источники
🔵 что сохранить промежуточно
🔵 что вообще не тащить в контекст модели

В архитектуре Perplexity агент генерирует Python-код, запускает его в защищенной песочнице и через SDK управляет отдельными частями поискового стека:

search - поиск
ranking - ранжирование
filtering - фильтрация
deduplication - удаление дублей
aggregation - сборка результата

Для задач вроде расследований, поиска уязвимостей или широкого ресерча это намного удобнее, чем гонять десятки отдельных вызовов поиска через модель.

Самый показательный пример из статьи - задача по CVE.

Агенту нужно было найти больше 200 серьезных уязвимостей, подтвердить каждую через вендорский advisory, указать продукт и версию исправления.

Результат: SaC получил 100% точности и снизил расход токенов на 85.1% относительно базового подхода.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

965 viewsedited 10:21

Odysseus 24.8k

⭐

- Self hosted AI-среда от ютубера PewDiePie

👍

Идея проекта - собрать у себя локальный AI-центр: чат, агенты, модели, документы, память, поиск, почта, календарь и исследования в одном веб-интерфейсе.

Что внутри:

🔵

чат с локальными моделями и API: Ollama, llama.cpp, vLLM, OpenAI, OpenRouter

🔵

агентный режим с инструментами: веб, файлы, shell, MCP, память, навыки

🔵

Cookbook - подбор, скачивание и запуск моделей под ваше железо

🔵

Deep Research - многошаговый поиск и итоговые отчеты

🔵

редактор документов с AI-правками и подсказками

🔵

заметки, задачи, расписания и напоминания

🔵

почта IMAP/SMTP с тегами, разбором и черновиками ответов

🔵

календарь CalDAV

🔵

мобильный интерфейс и PWA

Стек: FastAPI, Python, SQLite, ChromaDB, SearXNG, Docker Compose и большой веб-интерфейс.

Получается полноценная локальная AI-панель на своем железе.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥2

2.81K views18:25

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAI обновила Codex и добавила три заметных блока:

1. Ролевые плагины

Это готовые наборы инструкций, навыков, рабочих сценариев и подключений к приложениям для конкретных профессий. В первом пакете - 62 приложения и 110 навыков.

Примеры:

🔵

Data Analytics - анализ метрик, отчеты и дашборды через Snowflake, Databricks Genie, Hex, Tableau

🔵

Creative Production - кампании, баннеры и изображения товаров через Figma, Canva, Shutterstock, Picsart, Fal

🔵

Sales - подготовка к встречам, письма и задачи после встреч, CRM и планы закрытия сделок через Salesforce, HubSpot, Slack, Outreach

🔵

Product Design - проверка пользовательских сценариев, прототипы из live URL и статичных скриншотов

🔵

Investing / Banking - финансовая отчетность компаний, сравнение бизнесов, презентации для клиентов и проверка инвест-тезисов

2. Sites

Codex теперь может создавать, сохранять, деплоить и проверять сайты: веб-приложения, дашборды, внутренние инструменты и игры.

3. Annotations

Теперь можно выделить конкретную часть результата и попросить Codex доработать именно ее: блок на сайте, кусок документа, таблицу, слайд, Markdown или код.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

915 views09:47

This media is not supported in your browser

VIEW IN TELEGRAM

Hermes Desktop - теперь агента можно запускать как обычное приложение

🔱

Nous Research выпустили публичную бету Hermes Desktop для macOS, Windows и Linux.

Есть возможность подключаться к удаленному gateway - документация.

Идеальный сценарий такой: Desktop - для плотной работы за ПК, Telegram - для удаленного управления агентом.

Чат

Please open Telegram to view this post

VIEW IN TELEGRAM

❤12👍3

854 views17:49