Microsoft Agent Framework: AutoGen + Semantic Kernel объединились
Microsoft выпустила единый фреймворк для создания AI-агентов — с поддержкой Python и .NET. В феврале 2026 AutoGen и Semantic Kernel объединились в один проект, в марте достигли Release Candidate.
🤖 Что это: Мультиязычный фреймворк для одиночных агентов и мультиагентных воркфлоу. От простого чат-бота до графовой оркестрации с checkpointing, human-in-the-loop и time-travel.
⚙️ Архитектура:
• Агенты: Обёртки над LLM с инструкциями, инструментами, памятью
• Воркфлоу: Графовые пайплайны (DAG) с детерминированными функциями и агентами
• Провайдеры: Azure OpenAI, Microsoft Foundry, OpenAI, другие — единый API
• Middleware: Обработка запросов/ответов, исключения, кастомные пайплайны
• Observability: Встроенная OpenTelemetry — трассировка, метрики, логи
🛠 Инструментарий:
• DevUI: Интерактивная среда для разработки, тестирования, отладки агентов
• AF Labs: Экспериментальные пакеты — бенчмаркинг, reinforcement learning, research
• Хостинг: A2A-протокол, Azure Functions, Durable Task Framework
💼 Зачем бизнесу:
• Консистентность: Единый API для Python и C#-команд
• Миграция: Готовые гайды с AutoGen и Semantic Kernel — без переписывания с нуля
• Безопасность: Runtime-политики для автономных агентов (в составе AI Agent Governance Toolkit)
• Enterprise: Managed Identity в продакшене, DefaultAzureCredential для дев-среды
#Microsoft #AI #агенты #AutoGen #Python #OpenSource
───
@tsingular
Microsoft выпустила единый фреймворк для создания AI-агентов — с поддержкой Python и .NET. В феврале 2026 AutoGen и Semantic Kernel объединились в один проект, в марте достигли Release Candidate.
🤖 Что это: Мультиязычный фреймворк для одиночных агентов и мультиагентных воркфлоу. От простого чат-бота до графовой оркестрации с checkpointing, human-in-the-loop и time-travel.
⚙️ Архитектура:
• Агенты: Обёртки над LLM с инструкциями, инструментами, памятью
• Воркфлоу: Графовые пайплайны (DAG) с детерминированными функциями и агентами
• Провайдеры: Azure OpenAI, Microsoft Foundry, OpenAI, другие — единый API
• Middleware: Обработка запросов/ответов, исключения, кастомные пайплайны
• Observability: Встроенная OpenTelemetry — трассировка, метрики, логи
🛠 Инструментарий:
• DevUI: Интерактивная среда для разработки, тестирования, отладки агентов
• AF Labs: Экспериментальные пакеты — бенчмаркинг, reinforcement learning, research
• Хостинг: A2A-протокол, Azure Functions, Durable Task Framework
💼 Зачем бизнесу:
• Консистентность: Единый API для Python и C#-команд
• Миграция: Готовые гайды с AutoGen и Semantic Kernel — без переписывания с нуля
• Безопасность: Runtime-политики для автономных агентов (в составе AI Agent Governance Toolkit)
• Enterprise: Managed Identity в продакшене, DefaultAzureCredential для дев-среды
#Microsoft #AI #агенты #AutoGen #Python #OpenSource
───
@tsingular
👍3✍2⚡1👏1
Forwarded from Machinelearning
У классического RAG есть проблем - state blindness. Агент тащит за собой линейную историю, и пока контекст текстовый, это работает.
Но добавь картинки и видео, и все сыпется. Визуал жрет токены, агент ходит по кругу, делает повторные запросы и теряет нить.
Tongyi Lab (Alibaba) предложили решение проблемы - VimRAG.
Вместо линейной цепочки рассуждение моделируется как направленный ациклический граф (DAG). Узлы хранят состояния агента и мультимодальные рассуждения.
Это позволяет отслеживать пути, убирать дубли и видеть, какие куски контекста реально повлияли на результат.
Для работы с визуалом придумали Graph-Modulated Visual Memory Encoding: значимость узла памяти оценивается по его позиции в топологии графа. Важным доказательствам больше токенов в высоком разрешении, мусору - меньше. Адаптивная аллокация вместо тупого сжатия.
На бенчмарках VimRAG выдает SOTA результат по мультимодальным RAG задачам, включая SlideVQA, MMLongBench, Large-Scale LVBench и другие. При этом graph pruning заметно ускоряет обучение.
Модель сама ищет нужные куски, приближает области изображения, меняет масштаб и постепенно собирает контекст от общего к деталям
Paper: arxiv.org/abs/2602.12735
GitHub: github.com/Alibaba-NLP/VRAG
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2❤1⚡1
Анекдот дня
Оказывается новая закрытая пока модель Антропика - Мифос доступна разрабам начиная с 24 февраля.
т.е. где-то 1.5 месяца.
При этом аптайм https://status.claude.com/ упал местами до 98.95%, а в продуктах до сих пор баги.
Есть подозрение, что AGI революция пока откладывается :)
Ну разработчики пока точно без работы не останутся.
Хотя может модель другими задачами эти 1.5 месяца занята была, кто знает, но вроде на других фронтах тоже не фонтан.
#Claude #Mythos #Капибара
———
@tsingular
Оказывается новая закрытая пока модель Антропика - Мифос доступна разрабам начиная с 24 февраля.
т.е. где-то 1.5 месяца.
При этом аптайм https://status.claude.com/ упал местами до 98.95%, а в продуктах до сих пор баги.
Есть подозрение, что AGI революция пока откладывается :)
Ну разработчики пока точно без работы не останутся.
Хотя может модель другими задачами эти 1.5 месяца занята была, кто знает, но вроде на других фронтах тоже не фонтан.
#Claude #Mythos #Капибара
———
@tsingular
😁9🔥4🤔3⚡1
Forwarded from Анализ данных (Data analysis)
Теперь можно бесплатно дообучать Gemma 4 31B прямо в ноутбуке 🚀
Обучение модели на 31 миллиард параметров полностью бесплатно с использованием Kaggle и Unsloth.
GitHub: https://github.com/unslothai/unsloth
Гайд: https://unsloth.ai/docs/models/gemma-4/train
Ноутбук: https://kaggle.com/code/danielhanchen/gemma4-31b-unsloth
Обучение модели на 31 миллиард параметров полностью бесплатно с использованием Kaggle и Unsloth.
GitHub: https://github.com/unslothai/unsloth
Гайд: https://unsloth.ai/docs/models/gemma-4/train
Ноутбук: https://kaggle.com/code/danielhanchen/gemma4-31b-unsloth
🔥14✍7👍3
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Как дед и говорил, HappyHorse - это Алибаба.
The Information подтвердил версию, выпустив материал:
https://www.theinformation.com/briefings/alibaba-anonymously-launches-new-ai-video-model
По слухам (неподтвержденным), выпуск завтра, 10 апреля.
Статья за пейволлом, если совсем интересно, вот перевод и саммари.
Alibaba анонимно запустила новую AI-модель для генерации видео
Alibaba выпустила новую модель генерации видео под названием HappyHorse-1.0 — и сделала это без официального анонса. Несмотря на это, модель быстро заняла первое место в рейтинге AI-моделей и вызвала большой интерес в соцсетях.
По информации источников, знакомых с ситуацией, именно Alibaba стоит за этим релизом, хотя компания напрямую этого не подтверждала.
Что это за модель
HappyHorse-1.0 — это модель для:
* text-to-video
* image-to-video
Она уже заняла №1 в рейтинге Artificial Analysis, обогнав:
* Seedance 2.0 от ByteDance (№2)
Контекст: борьба Alibaba vs ByteDance
Этот запуск — часть более широкой гонки между:
* Alibaba
* ByteDance (владелец TikTok)
Они конкурируют сразу по нескольким направлениям:
* AI-модели
* приложения
* облачные AI-сервисы
Важно:
Alibaba официально не заявила, что разработала HappyHorse,
но её облачное подразделение уже готовит модель для enterprise-клиентов.
ByteDance ранее сильно вырвалась вперёд с:
* Seedance 2.0 (выпущена в феврале в Китае)
Модель:
* генерирует гиперреалистичное видео
* но столкнулась с проблемами с авторским правом (конфликты с Hollywood студиями)
Теперь Alibaba фактически наносит ответный удар.
Новый тренд: “анонимные релизы”
Интересный момент — анонимный запуск моделей становится трендом.
Как это работает:
1. Модель выпускается под кодовым названием
2. Получает хайп и органическое распространение
3. Только потом раскрывается реальный разработчик
Примеры:
* Xiaomi → MiMo V2-Pro
(сначала под кодовым именем *Hunter Alpha*)
* Zhipu → GLM-5
(вышел как *Pony Alpha* на OpenRouter)
@cgevent
The Information подтвердил версию, выпустив материал:
https://www.theinformation.com/briefings/alibaba-anonymously-launches-new-ai-video-model
По слухам (неподтвержденным), выпуск завтра, 10 апреля.
Статья за пейволлом, если совсем интересно, вот перевод и саммари.
Alibaba анонимно запустила новую AI-модель для генерации видео
Alibaba выпустила новую модель генерации видео под названием HappyHorse-1.0 — и сделала это без официального анонса. Несмотря на это, модель быстро заняла первое место в рейтинге AI-моделей и вызвала большой интерес в соцсетях.
По информации источников, знакомых с ситуацией, именно Alibaba стоит за этим релизом, хотя компания напрямую этого не подтверждала.
Что это за модель
HappyHorse-1.0 — это модель для:
* text-to-video
* image-to-video
Она уже заняла №1 в рейтинге Artificial Analysis, обогнав:
* Seedance 2.0 от ByteDance (№2)
Контекст: борьба Alibaba vs ByteDance
Этот запуск — часть более широкой гонки между:
* Alibaba
* ByteDance (владелец TikTok)
Они конкурируют сразу по нескольким направлениям:
* AI-модели
* приложения
* облачные AI-сервисы
Важно:
Alibaba официально не заявила, что разработала HappyHorse,
но её облачное подразделение уже готовит модель для enterprise-клиентов.
ByteDance ранее сильно вырвалась вперёд с:
* Seedance 2.0 (выпущена в феврале в Китае)
Модель:
* генерирует гиперреалистичное видео
* но столкнулась с проблемами с авторским правом (конфликты с Hollywood студиями)
Теперь Alibaba фактически наносит ответный удар.
Новый тренд: “анонимные релизы”
Интересный момент — анонимный запуск моделей становится трендом.
Как это работает:
1. Модель выпускается под кодовым названием
2. Получает хайп и органическое распространение
3. Только потом раскрывается реальный разработчик
Примеры:
* Xiaomi → MiMo V2-Pro
(сначала под кодовым именем *Hunter Alpha*)
* Zhipu → GLM-5
(вышел как *Pony Alpha* на OpenRouter)
@cgevent
✍7🔥4❤2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну вы поняли, короче :) Seedance 2.0 на Runway есть, но звАк не очень-то и полноценный, если по-русски. :)
ЗвАк нужно генерить где-нибудь на стороне по прежнему. В том же Elevenlabs.
Но движения и картинка реально топ. Плюс почти бесплатный апскейл в 4К
Пробуем тут: https://app.runwayml.com/
#seedance #runway #fail
———
@tsingular
ЗвАк нужно генерить где-нибудь на стороне по прежнему. В том же Elevenlabs.
Но движения и картинка реально топ. Плюс почти бесплатный апскейл в 4К
Пробуем тут: https://app.runwayml.com/
#seedance #runway #fail
———
@tsingular
😁13🔥8👍3🤝1
Forwarded from GigaChat
ГигаЧат заговорил на языках народов России 🌍
Теперь с ИИ-помощником можно говорить на языке вашего региона. Он понимает более 30 языков народов России и стран СНГ — от татарского до якутского!
За этим стоит большая работа: обучать ГигаЧат помогали университеты, библиотеки, медиа и культурные институции. Партнёрами стали интернет-энциклопедия «Рувики», «Дом народов России» и региональные научные и образовательные организации
🖥 Попробовать можно уже сейчас — в вебе, приложении для Android и мессенджерах
Теперь с ИИ-помощником можно говорить на языке вашего региона. Он понимает более 30 языков народов России и стран СНГ — от татарского до якутского!
📌 Попросите ГигаЧат отвечать на нужном языке, и он подстроится под вас. Никаких дополнительных настроек больше не нужно. Пока функция работает при общении текстом
За этим стоит большая работа: обучать ГигаЧат помогали университеты, библиотеки, медиа и культурные институции. Партнёрами стали интернет-энциклопедия «Рувики», «Дом народов России» и региональные научные и образовательные организации
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥8😁2⚡1
Урок по созданию мультиагентной системы на Google ADK + MCP + Cloud Run
Полезный урок по сборке мультиагентной системы, которая мониторит Reddit, ищет технические вопросы, проверяет по документации и пишет экспертные посты с инфографикой.
🏗 Архитектура Dev Signal:
• Discovery-агент: парсит Reddit на предмет горячих технических вопросов
• Grounding-агент: верифицирует ответы через официальную документацию Google Cloud
• Creation-агент: генерирует технические блог-посты на основе исследований
• Image-агент: создаёт инфографику через Nano Banana Pro
• Root-оркестратор: координирует всех через Google ADK
⚙️ Стек:
• Google ADK (Agent Development Kit) — фреймворк для агентов
• MCP (Model Context Protocol) — стандартное подключение инструментов: Reddit MCP (stdio), Developer Knowledge MCP (HTTP), кастомные тулзы
• Vertex AI Memory Bank — долговременная память, агент помнит предпочтения автора между сессиями
• Cloud Run — деплой через Terraform, масштабирование до нуля
• Agent Starter Pack — шаблон проекта с CI/CD, observability, безопасностью
🔧 MCP как связка: Reddit-сервер запускается как локальный подпроцесс (stdio), Developer Knowledge — как удалённый HTTP-эндпоинт, кастомный генератор картинок — тоже подпроцесс. Всё через единый интерфейс
Как облачная инфраструктура у нас не доступно, но как пример построения сервиса изучить полезно.
#Google #ADK #MCP #агенты #обучение
───
@tsingular
Полезный урок по сборке мультиагентной системы, которая мониторит Reddit, ищет технические вопросы, проверяет по документации и пишет экспертные посты с инфографикой.
🏗 Архитектура Dev Signal:
• Discovery-агент: парсит Reddit на предмет горячих технических вопросов
• Grounding-агент: верифицирует ответы через официальную документацию Google Cloud
• Creation-агент: генерирует технические блог-посты на основе исследований
• Image-агент: создаёт инфографику через Nano Banana Pro
• Root-оркестратор: координирует всех через Google ADK
⚙️ Стек:
• Google ADK (Agent Development Kit) — фреймворк для агентов
• MCP (Model Context Protocol) — стандартное подключение инструментов: Reddit MCP (stdio), Developer Knowledge MCP (HTTP), кастомные тулзы
• Vertex AI Memory Bank — долговременная память, агент помнит предпочтения автора между сессиями
• Cloud Run — деплой через Terraform, масштабирование до нуля
• Agent Starter Pack — шаблон проекта с CI/CD, observability, безопасностью
🔧 MCP как связка: Reddit-сервер запускается как локальный подпроцесс (stdio), Developer Knowledge — как удалённый HTTP-эндпоинт, кастомный генератор картинок — тоже подпроцесс. Всё через единый интерфейс
McpToolset, без кастомных API-обёрток.Как облачная инфраструктура у нас не доступно, но как пример построения сервиса изучить полезно.
#Google #ADK #MCP #агенты #обучение
───
@tsingular
👍3🔥3✍2
по Гермесу первые впечатления, - помимо того что работает как более надежный и более функциональный аналог OpenClaw, - кажется, что и вместо opencode он прекрасно справляется.
легко и быстро выполняет бытовые задачи из командной строки.
#hermes
———
@tsingular
легко и быстро выполняет бытовые задачи из командной строки.
#hermes
———
@tsingular
✍14🔥7❤3⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
Но телеграмм в РФ на 100% заблокирован (забавно, что узнаём мы это из телеграмма), поэтому никто эту информацию не прочитает, конечно.
#юмор
———
@tsingular
#юмор
———
@tsingular
1💯45😁37👻1
Маск в X(twitter) добавил функцию автоперевода по умолчанию.
Теперь в ленте посты со всего мира от авторов из всех стран,- на русском.
Необычно, но очень круто.
Должно стать стандартом во всех приложениях.
Фоновый незаметный ИИ перевод на ваш язык.
Восстанавливает Вавилон, получается.
#X #Musk
------
@tsingular
Теперь в ленте посты со всего мира от авторов из всех стран,- на русском.
Необычно, но очень круто.
Должно стать стандартом во всех приложениях.
Фоновый незаметный ИИ перевод на ваш язык.
Восстанавливает Вавилон, получается.
#X #Musk
------
@tsingular
1🔥29👍10🆒4⚡1
Forwarded from epsilon correct
WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений.
Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.
Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.
🆒6👀4❤2✍2⚡2
Когда наступит Технологическая Сингулярность,- вам никто не скажет, но будут знаки.
#Сингулярность #знаки
------
@tsingular
#Сингулярность #знаки
------
@tsingular
💯22❤3😁3⚡2👍2✍1🤨1👻1
Forwarded from ИТ-Директор: Технарь или Управленец?
В Китае завирусился проект, с помощью которого офисные работники тайно клонируют друг друга.
Называется Colleague Skill и лежит на GitHub под лозунгом «преврати своего коллегу в ИИ-навык».
Работает так: сгружаешь рабочие чаты, письма и документы другого человека — на выходе получаешь его цифрового двойника, который знает, как тот думает, решает задачи и общается.
И китайцы быстро смекнули, как это применить: тренируешь агента на задачах коллеги, а когда начальство начинает сокращения, приходишь и говоришь «меня увольнять незачем, я теперь умею делать и свою работу, и его». Коллегу за сокращают, тебя оставляют.
На этом фоне уже даже появились первые anti-distillation-тулзы — программы, которые специально ломают ваши логи и документы, чтобы ИИ не смог на них ничему научиться.
То есть китайцы теперь не только работают по системе 996 (с 9 утра до 9 вечера шесть дней в неделю), но и параллельно защищаются от коллег, которые пытаются их оцифровать🥲
Называется Colleague Skill и лежит на GitHub под лозунгом «преврати своего коллегу в ИИ-навык».
Работает так: сгружаешь рабочие чаты, письма и документы другого человека — на выходе получаешь его цифрового двойника, который знает, как тот думает, решает задачи и общается.
И китайцы быстро смекнули, как это применить: тренируешь агента на задачах коллеги, а когда начальство начинает сокращения, приходишь и говоришь «меня увольнять незачем, я теперь умею делать и свою работу, и его». Коллегу за сокращают, тебя оставляют.
На этом фоне уже даже появились первые anti-distillation-тулзы — программы, которые специально ломают ваши логи и документы, чтобы ИИ не смог на них ничему научиться.
То есть китайцы теперь не только работают по системе 996 (с 9 утра до 9 вечера шесть дней в неделю), но и параллельно защищаются от коллег, которые пытаются их оцифровать
Please open Telegram to view this post
VIEW IN TELEGRAM
Стэнфорд внесен в перечень нежелательных организаций в РФ
Статьи, которые были на канале, как пример того, что теперь не попадёт в эфир:
Бесплатные курсы Стэнфорда — обновлённый каталог бесплатных курсов на edX: CS, базы данных, квантовая механика и др.
Открытые модели обогнали GPT-3.5 — бенчмарк Стэнфорда: Mixtral 8x7B и Yi-34B работают на обычных ПК и превосходят GPT-3.5.
Quiet-STaR — модель с «внутренним диалогом» от Стэнфорда и Notbad AI, точность в математике выросла вдвое.
Trace (Microsoft + Стэнфорд) — Python-фреймворк для автооптимизации ИИ-агентов, в 1000 раз быстрее классического RL.
ИИ как учёные — две статьи: ИИ генерирует более новаторские идеи, чем люди; агент для генерации идей через RAG.
STORM (ранний пост) — студенческий проект Стэнфорда для автоматизации пре-райтинга статей через диалог двух агентов.
Модель s1 за $50 — Стэнфорд дистиллировал reasoning-модель уровня o1/R1 на базе Qwen-32B из 1000 примеров за 26 минут.
STORM (GitHub) — open-source исследовательский агент, пишет структурированные статьи с цитатами через мультиперспективный Q&A.
AI Index 2025 — годовой отчёт Стэнфорда: 78% компаний используют ИИ, инвестиции в США — $109 млрд, разрыв открытых/закрытых моделей — 1,7%.
CS336 (весна 2025) — обновлённый курс по созданию LLM с нуля, в 10+ раз больше кода, чем на других курсах.
CS336 (плейлист) — полный курс Стэнфорда по языковым моделям от сбора данных до деплоя, 17 лекций на YouTube.
DeepMind + гидродинамика — ИИ нашёл новые сингулярности в уравнениях типа Навье-Стокса с помощью Physics-Informed Neural Networks.
10 советов Эндрю Нга — держите инструменты свежими, формулируйте задачи чётко, код — это долг, доводите до продакшена, а не до демо.
SleepFM — модель Стэнфорда диагностирует 130 заболеваний по одной ночи сна через самообучение без разметки.
Лекции Стэнфорда по ML — цикл из 17 лекций (22 часа) по разработке моделей с нуля.
OpenJarvis — open-source фреймворк Стэнфорда для локальных ИИ-агентов с автоподбором модели под железо и метрикой энергоэффективности (IPW).
#минюст #стэнфорд
———
@tsingular
Статьи, которые были на канале, как пример того, что теперь не попадёт в эфир:
Бесплатные курсы Стэнфорда — обновлённый каталог бесплатных курсов на edX: CS, базы данных, квантовая механика и др.
Открытые модели обогнали GPT-3.5 — бенчмарк Стэнфорда: Mixtral 8x7B и Yi-34B работают на обычных ПК и превосходят GPT-3.5.
Quiet-STaR — модель с «внутренним диалогом» от Стэнфорда и Notbad AI, точность в математике выросла вдвое.
Trace (Microsoft + Стэнфорд) — Python-фреймворк для автооптимизации ИИ-агентов, в 1000 раз быстрее классического RL.
ИИ как учёные — две статьи: ИИ генерирует более новаторские идеи, чем люди; агент для генерации идей через RAG.
STORM (ранний пост) — студенческий проект Стэнфорда для автоматизации пре-райтинга статей через диалог двух агентов.
Модель s1 за $50 — Стэнфорд дистиллировал reasoning-модель уровня o1/R1 на базе Qwen-32B из 1000 примеров за 26 минут.
STORM (GitHub) — open-source исследовательский агент, пишет структурированные статьи с цитатами через мультиперспективный Q&A.
AI Index 2025 — годовой отчёт Стэнфорда: 78% компаний используют ИИ, инвестиции в США — $109 млрд, разрыв открытых/закрытых моделей — 1,7%.
CS336 (весна 2025) — обновлённый курс по созданию LLM с нуля, в 10+ раз больше кода, чем на других курсах.
CS336 (плейлист) — полный курс Стэнфорда по языковым моделям от сбора данных до деплоя, 17 лекций на YouTube.
DeepMind + гидродинамика — ИИ нашёл новые сингулярности в уравнениях типа Навье-Стокса с помощью Physics-Informed Neural Networks.
10 советов Эндрю Нга — держите инструменты свежими, формулируйте задачи чётко, код — это долг, доводите до продакшена, а не до демо.
SleepFM — модель Стэнфорда диагностирует 130 заболеваний по одной ночи сна через самообучение без разметки.
Лекции Стэнфорда по ML — цикл из 17 лекций (22 часа) по разработке моделей с нуля.
OpenJarvis — open-source фреймворк Стэнфорда для локальных ИИ-агентов с автоподбором модели под железо и метрикой энергоэффективности (IPW).
#минюст #стэнфорд
———
@tsingular
🚨 Ваш ИИ-агент может быть скомпрометирован.
CCS 2026: «Your Agent Is Mine»
Нашёл интересное системное исследование атак на цепочку поставок LLM — через API-роутеры, которые стоят между вашим приложением и моделью.
Роутеры типа LiteLLM и OpenRouter — это прокси на уровне приложения. Они разрывают TLS-соединение клиента и открывают новое к провайдеру. Это значит: роутер видит всё в открытом виде и может переписать любой ответ.
Что обнаружили в дикой природе:
🔧 Внедрение кода. 1 платный и 8 бесплатных роутеров активно подменяли tool-call аргументы — например, меняли URL в bash-команде на вредоносный. Успешность — 100% на четырёх фреймворках (Claude Code, OpenAI Codex, OpenCode, OpenClaw).
🔑 Кража ключей. 17 роутеров обратились к AWS-канарейкам исследователей. Один роутер похитил приватный ключ и вывел ETH.
🎯 Адаптивное уклонение. Два роутера ждали 50 «чистых» запросов перед атакой — чтобы пройти аудит. Другие атаковали только в «YOLO-режиме», когда агент автоматически выполняет все tool-команды.
Но главное — транзитивная угроза:
Один утёкший ключ OpenAI сгенерировал 100 млн токенов и вскрыл 7+ сессий Codex. Декоративный «слабый» роутер, поднятый исследователями, втянулся в цепочку поставок, обработал 2 млрд токенов и поймал 99 учёток в 440 сессиях. Из них 401 сессия работала в YOLO-режиме — автоподтверждение всех команд.
Почему это работает: ни один провайдер не подписывает свои ответы криптографически. Нет механизма проверить, что ответ от GPT или Claude — действительно от них, а не подменён посредником. Оверхед атаки — 0,013 мс, неотличим от сетевого джиттера.
Защита, которая есть сейчас:
🛡 Шлюз политик для опасных инструментов — блокирует запросы к незнакомым доменам. Блокирует 100% базовых атак, но 0% адаптивных (через allowlisted-домены)
📊 Аномали-скрининг ответов (IsolationForest) — ловит 89% подмен при 6,7% ложных срабатываний
📝 Логирование с хешированием — для расследования инцидентов постфактум, 1,26 КБ на запись
Что предлагают авторы: провайдеры должны подписывать ответы криптографически — JSON-конверт с полем provider, model, request_nonce и подписью. Клиент проверяет подпись и понимает, был ли ответ подменён.
Практический вывод: если ваш агент может выполнять код или вызывать API — не пускайте его через непроверенные роутеры. Отключите YOLO-режим.
#ИБ #агенты #LLM #cybersecurity #LiteLLM #OpenRouter
───
@tsingular
CCS 2026: «Your Agent Is Mine»
Нашёл интересное системное исследование атак на цепочку поставок LLM — через API-роутеры, которые стоят между вашим приложением и моделью.
Роутеры типа LiteLLM и OpenRouter — это прокси на уровне приложения. Они разрывают TLS-соединение клиента и открывают новое к провайдеру. Это значит: роутер видит всё в открытом виде и может переписать любой ответ.
Что обнаружили в дикой природе:
🔧 Внедрение кода. 1 платный и 8 бесплатных роутеров активно подменяли tool-call аргументы — например, меняли URL в bash-команде на вредоносный. Успешность — 100% на четырёх фреймворках (Claude Code, OpenAI Codex, OpenCode, OpenClaw).
🔑 Кража ключей. 17 роутеров обратились к AWS-канарейкам исследователей. Один роутер похитил приватный ключ и вывел ETH.
🎯 Адаптивное уклонение. Два роутера ждали 50 «чистых» запросов перед атакой — чтобы пройти аудит. Другие атаковали только в «YOLO-режиме», когда агент автоматически выполняет все tool-команды.
Но главное — транзитивная угроза:
Один утёкший ключ OpenAI сгенерировал 100 млн токенов и вскрыл 7+ сессий Codex. Декоративный «слабый» роутер, поднятый исследователями, втянулся в цепочку поставок, обработал 2 млрд токенов и поймал 99 учёток в 440 сессиях. Из них 401 сессия работала в YOLO-режиме — автоподтверждение всех команд.
Почему это работает: ни один провайдер не подписывает свои ответы криптографически. Нет механизма проверить, что ответ от GPT или Claude — действительно от них, а не подменён посредником. Оверхед атаки — 0,013 мс, неотличим от сетевого джиттера.
Защита, которая есть сейчас:
🛡 Шлюз политик для опасных инструментов — блокирует запросы к незнакомым доменам. Блокирует 100% базовых атак, но 0% адаптивных (через allowlisted-домены)
📊 Аномали-скрининг ответов (IsolationForest) — ловит 89% подмен при 6,7% ложных срабатываний
📝 Логирование с хешированием — для расследования инцидентов постфактум, 1,26 КБ на запись
Что предлагают авторы: провайдеры должны подписывать ответы криптографически — JSON-конверт с полем provider, model, request_nonce и подписью. Клиент проверяет подпись и понимает, был ли ответ подменён.
Практический вывод: если ваш агент может выполнять код или вызывать API — не пускайте его через непроверенные роутеры. Отключите YOLO-режим.
#ИБ #агенты #LLM #cybersecurity #LiteLLM #OpenRouter
───
@tsingular
✍8👍5🔥4⚡3❤2👀1