Agents Lab
740 subscribers
40 photos
24 videos
128 links
Обсуждаем AI агентов

Наш чатик https://t.me/agents_lab_community
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code получил Dynamic Workflows

Anthropic выпустили Claude Opus 4.8 и добавили в Claude Code новую функцию Dynamic Workflows.

Теперь Claude может сам писать JavaScript-сценарий, разбивать большую задачу на этапы и запускать десятки subagents параллельно.

Это подходит для задач, которые сложно решить одним агентом:

- аудит всего репозитория
- миграции на сотни файлов
- поиск багов
- security review
- глубокие исследования с проверкой источников

Главное отличие - workflow держит план, циклы и промежуточные результаты в коде, а Claude возвращает один собранный отчет. Одни агенты выполняют работу, другие перепроверяют их выводы.

Запустить можно через слово workflow в задаче, команду /deep-research или режим /effort ultracode, где Claude сам решает, когда нужна такая оркестрация.

Opus 4.8 тоже обновился под длинные агентные задачи: 69,2% на SWE-bench Pro, 74,6% на Terminal-Bench 2.1, контекст до 1M токенов и та же базовая цена, что у Opus 4.7.

Функция пока в research preview и может быстро расходовать токены, но направление важное: coding agents становятся не одиночными помощниками, а управляемыми командами агентов.

Чат
4🔥2
🔵Hermes выкатил большой релиз 2026.5.28

Сделали рефакторинг, прокачали Kanban - добавили полноценный swarm, ускорили холодный старт и внедрили защиту от промт-инъекций.

📎 Прочитать изменения на русском

🔵Mistral прокачивает свою экосистему

Они встроили Vibe CLI в веб-чат.
Внутри есть Work Mode для длинных многошаговых задач и Code Mode для работы с репозиториями: агент может подключаться к GitHub, разбираться в коде, готовить изменения и доводить их до pull request.

Отдельно добавили расширение для VS Code и перенос сессий между терминалом и облаком. То есть задачу можно начать в чате, продолжить в редакторе, а потом отдать агенту проверку и доработку.

Выстраивают систему как у Anthropic, только пока на минималках 🙃

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🔥Anthropic Cybersecurity Skills - библиотека из 754 готовых навыков для AI-агентов в кибербезопасности: расследование взломов, анализ логов, вредоносных файлов, облаков, Kubernetes, фишинга и инцидентов.

Что особенно полезно:
🔵 агент получает пошаговый план, а не просто общие советы
🔵 в каждом навыке указано, какие данные собрать, какие команды запускать и как проверить результат
🔵 можно подключать к Claude Code, Codex CLI, Cursor и другим AI-инструментам
🔵 подходит для SOC, DevSecOps, аудита и обучения

Например, при расследовании зараженного компьютера агент сможет сам пройти по процессам, сетевым подключениям, следам кражи паролей и собрать понятный отчет. То есть репозиторий превращает AI-агента в более практичного помощника для задач безопасности.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔵Codex теперь управляет Windows-приложениями

OpenAI выпустили обновление Codex app: Computer Use теперь работает на Windows. Агент может видеть экран, кликать и печатать в активном окне, а работу на Windows-устройстве можно запускать и проверять удаленно с iOS, Android или Mac.

🔵Kimi Code CLI - новый open-source агент для кода от MoonshotAI

MoonshotAI выложили Kimi Code CLI - AI-агента, который читает и редактирует код, запускает shell-команды, ищет по файлам, ходит в web и поддерживает MCP. У проекта 1.4k звезд на GitHub и отдельная система подагентов для задач вроде coder, explore и plan.

🔵Google показал, как строить долгоживущих AI-агентов на ADK

Сделал русскую адаптацию статьи:
📎 Долгоживущие AI-агенты на ADK: пауза, возобновление и сохранение контекста

Google разобрал архитектуру агента, который может ставить процесс на паузу, ждать внешнее событие несколько дней, переживать рестарты и продолжать с того же места. Пример - HR-онбординг: агент отправляет документы, ждет подпись, передает задачу IT-субагенту, ждет доставку ноутбука и завершает процесс без потери контекста.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
📎WebMCP: как сделать сайт инструментом для AI-агентов

AI-агенты уже ходят по сайтам, но чаще видят только HTML и текст. WebMCP предлагает следующий шаг: сайт сам описывает, какие данные и безопасные действия он может отдать агенту - от поиска по каталогу до чтения документации и проверки статуса заказа.

В статье рассказывается, зачем нужен этот стандарт, почему внедрение пока почти нулевое, как его можно попробовать в SvelteKit/Next.js и какие функции лучше не отдавать агентам.

Если делаете продукт, документацию или сервис, который должен быть удобен не только людям, но и AI-агентам, стоит прочитать.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
Deep Agents: что это за класс AI-агентов

У LangChain есть deepagents 23.6к - открытый репозиторий с готовым каркасом для сложных AI-агентов. Внутри уже собраны вещи, которые обычно приходится склеивать вручную: план задач, файловая среда, запуск команд в песочнице, подагенты с отдельным контекстом, долговременная память, навыки, MCP-инструменты и подтверждение опасных действий человеком.

Такой агент может вести длинную задачу: разбить ее на шаги, делегировать часть работы, читать и менять файлы, запускать проверки, сохранять полезный контекст между сессиями и возвращаться к нему позже. Поэтому к нему уже нельзя относиться как к обычному чату с моделью.

Главный вопрос становится другим: как понять, что агент действительно сделал работу правильно, а не просто красиво ответил?

В статье разбираю практический подход AWS и LangSmith к оценке таких агентов: трассы, вызовы инструментов, аргументы, ошибки по шагам, LLM-as-judge, офлайн-тесты и мониторинг после запуска.

Если вы строите агентов для реальной работы - начните с этого разбора:
📎Как оценивать сложных AI-агентов в продакшне

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
NVIDIA переносит AI-агентов на локальные компьютеры и в физический мир 😎

NVIDIA и Microsoft представили RTX Spark - новый класс Windows-ПК для персональных AI-агентов. Внутри: 1 PFLOP AI-производительности, до 128 ГБ объединенной памяти, запуск больших моделей локально и OpenShell для безопасной работы агентов на основном устройстве.

Параллельно NVIDIA выложила открытый набор навыков для агентов. Репозиторий уже доступен на GitHub: NVIDIA/skills.

Внутри - навыки для робототехники, автономного транспорта, компьютерного зрения и промышленных цифровых двойников. Такие навыки описывают, какие инструменты агент должен вызвать, какой результат получить и как проверить выполнение задачи.

Навыки для агентов постепенно становятся стандартным способом упаковывать экспертные действия. Сначала это было заметно в кодинге, теперь формат идет в локальные компьютеры, роботов, симуляции и промышленные сценарии.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Claude Code сбросили лимиты для Pro/Max 🎉

Причина - баг, из-за которого некоторые сессии Opus 4.8 запускали слишком много параллельных субагентов и быстро сжигали доступный лимит.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3
Perplexity описали Search as Code - новый подход к поиску для AI-агентов

Агенту мало один раз вызвать поиск и получить готовую выдачу.
В сложных задачах ему нужно самому собирать стратегию:

🔵 где искать
🔵 как разветвлять запросы
🔵 как фильтровать и проверять источники
🔵 что сохранить промежуточно
🔵 что вообще не тащить в контекст модели

В архитектуре Perplexity агент генерирует Python-код, запускает его в защищенной песочнице и через SDK управляет отдельными частями поискового стека:

search - поиск
ranking - ранжирование
filtering - фильтрация
deduplication - удаление дублей
aggregation - сборка результата

Для задач вроде расследований, поиска уязвимостей или широкого ресерча это намного удобнее, чем гонять десятки отдельных вызовов поиска через модель.

Самый показательный пример из статьи - задача по CVE.

Агенту нужно было найти больше 200 серьезных уязвимостей, подтвердить каждую через вендорский advisory, указать продукт и версию исправления.

Результат: SaC получил 100% точности и снизил расход токенов на 85.1% относительно базового подхода.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Odysseus 24.8k - Self hosted AI-среда от ютубера PewDiePie 👍

Идея проекта - собрать у себя локальный AI-центр: чат, агенты, модели, документы, память, поиск, почта, календарь и исследования в одном веб-интерфейсе.

Что внутри:
🔵 чат с локальными моделями и API: Ollama, llama.cpp, vLLM, OpenAI, OpenRouter
🔵 агентный режим с инструментами: веб, файлы, shell, MCP, память, навыки
🔵 Cookbook - подбор, скачивание и запуск моделей под ваше железо
🔵 Deep Research - многошаговый поиск и итоговые отчеты
🔵 редактор документов с AI-правками и подсказками
🔵 заметки, задачи, расписания и напоминания
🔵 почта IMAP/SMTP с тегами, разбором и черновиками ответов
🔵 календарь CalDAV
🔵 мобильный интерфейс и PWA

Стек: FastAPI, Python, SQLite, ChromaDB, SearXNG, Docker Compose и большой веб-интерфейс.

Получается полноценная локальная AI-панель на своем железе.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI обновила Codex и добавила три заметных блока:

1. Ролевые плагины

Это готовые наборы инструкций, навыков, рабочих сценариев и подключений к приложениям для конкретных профессий. В первом пакете - 62 приложения и 110 навыков.

Примеры:
🔵 Data Analytics - анализ метрик, отчеты и дашборды через Snowflake, Databricks Genie, Hex, Tableau
🔵 Creative Production - кампании, баннеры и изображения товаров через Figma, Canva, Shutterstock, Picsart, Fal
🔵 Sales - подготовка к встречам, письма и задачи после встреч, CRM и планы закрытия сделок через Salesforce, HubSpot, Slack, Outreach
🔵 Product Design - проверка пользовательских сценариев, прототипы из live URL и статичных скриншотов
🔵 Investing / Banking - финансовая отчетность компаний, сравнение бизнесов, презентации для клиентов и проверка инвест-тезисов

2. Sites

Codex теперь может создавать, сохранять, деплоить и проверять сайты: веб-приложения, дашборды, внутренние инструменты и игры.

3. Annotations

Теперь можно выделить конкретную часть результата и попросить Codex доработать именно ее: блок на сайте, кусок документа, таблицу, слайд, Markdown или код.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Desktop - теперь агента можно запускать как обычное приложение 🔱

Nous Research выпустили публичную бету Hermes Desktop для macOS, Windows и Linux.

Есть возможность подключаться к удаленному gateway - документация.

Идеальный сценарий такой: Desktop - для плотной работы за ПК, Telegram - для удаленного управления агентом.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3
NVIDIA Blueprints - готовые схемы для AI-агентов 🚗

NVIDIA анонсировала новый набор для enterprise-агентов: NemoClaw Blueprints, Nemotron models, OpenShell secure runtime и CUDA-X libraries как skills для агентов.

В новости много крупных партнеров: Cadence, Dassault Systèmes, Siemens и Synopsys уже используют NemoClaw для автономных AI-инженеров, Microsoft, Canonical, Red Hat, SAP и ServiceNow встраивают OpenShell в свои платформы, а Nemotron 3 Ultra обещает до 5x быстрее инференс и до 30% ниже стоимость для сложных агентных задач.

Blueprints - это каталог готовых референсных сборок для AI-приложений: архитектура, модели, NIM-микросервисы, инструменты, код и быстрый деплой собраны вокруг конкретной задачи.

Как это работает: у Blueprint есть прикладной сценарий, например security-анализ контейнера или локализация видео. Дальше NVIDIA показывает, какие сервисы нужны, как они связаны, где агент вызывает инструменты, где работает оркестрация и где человек принимает решение.

1. NemoClaw for Hermes Agent

Blueprint для запуска Hermes Agent в enterprise-среде. Hermes подключается к утвержденным инструментам и источникам данных, работает внутри NVIDIA OpenShell с политиками доступа, учится на командных процессах и превращает повторяемые правила в Hermes Skills.

2. Vulnerability Analysis for Container Security

Blueprint для разбора уязвимостей контейнеров. На вход подаются CVE из сканера, агент подтягивает код, документацию и контекст, строит чеклист расследования, проверяет пункты и выдает аналитику для security-специалиста.

3. Content Localization

Blueprint для медиа: перевод и локализация видео, автоматический дубляж, определение активного спикера, синхронизация губ под переведенную речь и сохранение фонового звука.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Claude как аналитик поверх хранилища данных 🎉

Хранилище данных - это место, куда компания собирает данные из разных систем, чтобы потом анализировать продукт и бизнес:
🔵 продукт: пользователи, события, действия
🔵 платежи: счета, подписки, выручка
🔵 CRM: клиенты, сделки, сегменты
🔵 маркетинг: кампании, источники трафика
🔵 поддержка: обращения, жалобы, статусы

Anthropic разобрали, как они автоматизировали 95% запросов бизнес-аналитики через Claude и почему простого доступа агента к таблицам мало: нужны канонические метрики, семантический слой, навыки, оценки и проверка ответов.

📎 Как Anthropic строит самостоятельную аналитику с Claude

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
LangChain, LangGraph и Deep Agents - три уровня одной экосистемы для AI-агентов 🔄

LangChain - быстрый старт: модели, инструменты, сообщения, middleware и готовый цикл агента.

LangGraph - когда нужен контроль: состояние, граф выполнения, потоковая выдача, человек в контуре, сохранение и долгие процессы.

Deep Agents - готовая обвязка поверх LangGraph для более автономных задач: файлы, план, подагенты, навыки, память и управление контекстом.

Есть репозиторий langchain-ai/langgraph-101, в котором собраны полезные гайды. Ниже перевод:

🔵 Первый агент: модели, инструменты, память и потоковая выдача
🔵 Middleware, человек в контуре и безопасные агенты
🔵 Почтовый агент: сортировка, ответы, память и человек в контуре
🔵 Многоагентные системы: супервизор, подагенты и оценки
🔵 Исследовательский агент: поиск, координатор и параллельные подагенты
🔵 Deep Agents: агент с файлами, памятью и навыками

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Headroom - сжатие контекста для ИИ-агентов

ИИ-агенты быстро забивают контекст логами, JSON, результатами поиска, RAG-кусками и историей сессии. Headroom ставится между агентом и моделью и сжимает эти данные до отправки в LLM.

Что есть в репозитории:
🔵 библиотека для Python и TypeScript
🔵 локальный прокси headroom proxy
🔵 обертки для Claude Code, Codex, Cursor, Aider, Copilot и OpenClaw
🔵 MCP-инструменты headroom_compress, headroom_retrieve, headroom_stats
🔵 общая память между агентами
🔵 headroom learn, который разбирает прошлые ошибки и пишет подсказки в CLAUDE.md / AGENTS.md

Фишка в обратимом сжатии: агент получает короткую версию, но оригинал хранится локально и может быть поднят обратно по запросу. Особенно полезно для экономии токенов в длинных сессиях с тестами, поиском по коду и большими API-ответами.

Установка:
pip install "headroom-ai[all]"
headroom wrap claude


Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73
pi-dynamic-workflows (835) - расширение для Pi, которое добавляет инструмент workflow (аналог из Claude Code).

Модель пишет небольшой JavaScript-сценарий, делит задачу на фазы и запускает несколько изолированных субагентов через agent(), parallel() и pipeline(). Стандартный сценарий - аудит репозитория: один агент собирает структуру, другой смотрит модули, третий ищет риски, родительская сессия собирает итог.

Установка:
pi install npm:pi-dynamic-workflows
после этого в Pi: /reload

Есть ядро - сценарии, субагенты, параллельный запуск, фазы, отмена и структурированный вывод. Нет сохранённых/возобновляемых запусков и менеджера /workflows.

Ждем эту фишку в ближайшее время во всех агентах 🏁

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🔥1🤝1
Hands-On AI Engineering - 50 практических AI-заготовок

Sumanth077/Hands-On-AI-Engineering (1.3к) - репозиторий с мини-проектами на Python: агенты, RAG, OCR, мультимодальность и аудио.

Что там самое полезное:

- Рабочие агенты: PR-ревью через Telegram и GitHub MCP, поиск по GitHub обычным языком, встречи в Cal.com, отели через Trivago MCP, браузерный агент на browser-use.

- Многоагентные цепочки: кодинг-ассистент с ролями планировщик -> кодер -> ревьюер, исследовательский агент на AG2, маркетинговый агент с веб-поиском.

- RAG-примеры: самопроверяющийся RAG, Hybrid RAG с графом знаний + векторным поиском, маршрутизация запросов между разными базами.

- Документы и OCR: чек в JSON через Pydantic, распознавание рецептов с проверкой лекарств по RxNorm, локальный GLM-OCR через Ollama.

- Мультимодальность: RAG по тексту, URL, PDF, картинкам, аудио и видео в одной базе.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAgents (3.7к) - открытая рабочая среда, где несколько AI-агентов работают вместе из разных терминалов, машин и моделей.

Внутри один Workspace: общие треды, файлы, браузер, задачи, база знаний и @mentions. Можно подключить Claude Code, Codex CLI, OpenClaw, OpenCode, Cursor, Hermes, Gemini CLI, Kimi и других агентов, а потом позвать нужного прямо в обсуждение.

Что есть в репозитории:
🔵 agn - CLI/Launcher для установки и запуска агентов фоном
🔵 GUI Launcher для macOS, Windows и Linux (Linux - AppImage)
🔵 веб-Workspace на FastAPI + Next.js
🔵 Python SDK для своих агентных сетей
🔵 MCP/навыки для доступа к истории, файлам, браузеру и задачам
🔵 Cloud Agents: OpenAI, Anthropic, Google, xAI, Perplexity, OpenRouter и другие провайдеры

Установка:
curl -fsSL https://openagents.org/install.sh | bash
agn


Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
OpenProse - Markdown-контракты для AI-агентов

Появился интересный репозиторий: OpenProse. Это декларативный язык для агентных сессий: вы описываете рабочий процесс в *.prose.md, а агент получает не просто промпт, а понятный контракт: что должно быть сделано, какие части связаны между собой и какие подтверждения оставить.

Что это реально дает агенту:
🔵 он видит не разовую инструкцию, а структуру задачи;
🔵 понимает зависимости между шагами;
🔵 может пересобрать только те части процесса, которые изменились;
🔵 оставляет проверяемые подтверждения выполнения;
🔵 лучше переносит сценарий между сессиями и разными агентами.

Например, в Hermes такой подход можно использовать для повторяемых процессов: дайджест новостей, ревью PR, подготовка статьи, проверка репозитория, запуск тестов. Вместо длинного промпта каждый раз - файл-контракт, где описано нужное состояние результата, источники, проверки и формат ответа.

OpenProse работает поверх уже привычных coding agents: Claude Code, Codex, OpenCode, Hermes, Pi. Внутри есть Reactor, который следит за изменениями, пересобирает зависимые части и хранит подтверждения выполнения.

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Собрать AI-агента стало проще. Довести до продакшена - совсем другая история.

У агента быстро появляется целый стек вокруг модели: инструменты, MCP, память, состояние, фреймворки, оценка, наблюдаемость и безопасность.

Перевел статью O’Reilly про 6 слоев между LLM и рабочим агентом. Советую прочитать, чтобы понять, где агентные системы чаще всего ломаются и как не переусложнить архитектуру на старте.

📎 Стек AI-агентов в 2026 году

Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2👌1🤝1