Технозаметки Малышева

Microsoft Agent Framework: AutoGen + Semantic Kernel объединились

Microsoft выпустила единый фреймворк для создания AI-агентов — с поддержкой Python и .NET. В феврале 2026 AutoGen и Semantic Kernel объединились в один проект, в марте достигли Release Candidate.

🤖 Что это: Мультиязычный фреймворк для одиночных агентов и мультиагентных воркфлоу. От простого чат-бота до графовой оркестрации с checkpointing, human-in-the-loop и time-travel.

⚙️ Архитектура:
• Агенты: Обёртки над LLM с инструкциями, инструментами, памятью
• Воркфлоу: Графовые пайплайны (DAG) с детерминированными функциями и агентами
• Провайдеры: Azure OpenAI, Microsoft Foundry, OpenAI, другие — единый API
• Middleware: Обработка запросов/ответов, исключения, кастомные пайплайны
• Observability: Встроенная OpenTelemetry — трассировка, метрики, логи

🛠 Инструментарий:
• DevUI: Интерактивная среда для разработки, тестирования, отладки агентов
• AF Labs: Экспериментальные пакеты — бенчмаркинг, reinforcement learning, research
• Хостинг: A2A-протокол, Azure Functions, Durable Task Framework

💼 Зачем бизнесу:
• Консистентность: Единый API для Python и C#-команд
• Миграция: Готовые гайды с AutoGen и Semantic Kernel — без переписывания с нуля
• Безопасность: Runtime-политики для автономных агентов (в составе AI Agent Governance Toolkit)
• Enterprise: Managed Identity в продакшене, DefaultAzureCredential для дев-среды

#Microsoft #AI #агенты #AutoGen #Python #OpenSource
───
@tsingular

👍3✍2⚡1👏1

1.79K views12:04

Технозаметки Малышева

Forwarded from Machinelearning

📌

Tongyi Lab сломали мультимодальный RAG. Разбираем VimRAG

У классического RAG есть проблем - state blindness. Агент тащит за собой линейную историю, и пока контекст текстовый, это работает.

Но добавь картинки и видео, и все сыпется. Визуал жрет токены, агент ходит по кругу, делает повторные запросы и теряет нить.

Tongyi Lab (Alibaba) предложили решение проблемы - VimRAG.

Вместо линейной цепочки рассуждение моделируется как направленный ациклический граф (DAG). Узлы хранят состояния агента и мультимодальные рассуждения.

Это позволяет отслеживать пути, убирать дубли и видеть, какие куски контекста реально повлияли на результат.

Для работы с визуалом придумали Graph-Modulated Visual Memory Encoding: значимость узла памяти оценивается по его позиции в топологии графа. Важным доказательствам больше токенов в высоком разрешении, мусору - меньше. Адаптивная аллокация вместо тупого сжатия.

На бенчмарках VimRAG выдает SOTA результат по мультимодальным RAG задачам, включая SlideVQA, MMLongBench, Large-Scale LVBench и другие. При этом graph pruning заметно ускоряет обучение.

Модель сама ищет нужные куски, приближает области изображения, меняет масштаб и постепенно собирает контекст от общего к деталям

Paper: arxiv.org/abs/2602.12735
GitHub: github.com/Alibaba-NLP/VRAG

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3🔥2❤1⚡1

1.61K views13:23

Технозаметки Малышева

Анекдот дня

Оказывается новая закрытая пока модель Антропика - Мифос доступна разрабам начиная с 24 февраля.
т.е. где-то 1.5 месяца.

При этом аптайм https://status.claude.com/ упал местами до 98.95%, а в продуктах до сих пор баги.
Есть подозрение, что AGI революция пока откладывается :)
Ну разработчики пока точно без работы не останутся.

Хотя может модель другими задачами эти 1.5 месяца занята была, кто знает, но вроде на других фронтах тоже не фонтан.

#Claude #Mythos #Капибара
———
@tsingular

😁9🔥4🤔3⚡1

1.69K views13:31

Технозаметки Малышева

Forwarded from Анализ данных (Data analysis)

Теперь можно бесплатно дообучать Gemma 4 31B прямо в ноутбуке 🚀

Обучение модели на 31 миллиард параметров полностью бесплатно с использованием Kaggle и Unsloth.

GitHub: https://github.com/unslothai/unsloth

Гайд: https://unsloth.ai/docs/models/gemma-4/train

Ноутбук: https://kaggle.com/code/danielhanchen/gemma4-31b-unsloth

🔥14✍7👍3

1.64K views17:57

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Как дед и говорил, HappyHorse - это Алибаба.

The Information подтвердил версию, выпустив материал:
https://www.theinformation.com/briefings/alibaba-anonymously-launches-new-ai-video-model

По слухам (неподтвержденным), выпуск завтра, 10 апреля.

Статья за пейволлом, если совсем интересно, вот перевод и саммари.

Alibaba анонимно запустила новую AI-модель для генерации видео

Alibaba выпустила новую модель генерации видео под названием HappyHorse-1.0 — и сделала это без официального анонса. Несмотря на это, модель быстро заняла первое место в рейтинге AI-моделей и вызвала большой интерес в соцсетях.

По информации источников, знакомых с ситуацией, именно Alibaba стоит за этим релизом, хотя компания напрямую этого не подтверждала.

Что это за модель

HappyHorse-1.0 — это модель для:

* text-to-video
* image-to-video

Она уже заняла №1 в рейтинге Artificial Analysis, обогнав:

* Seedance 2.0 от ByteDance (№2)

Контекст: борьба Alibaba vs ByteDance

Этот запуск — часть более широкой гонки между:

* Alibaba
* ByteDance (владелец TikTok)

Они конкурируют сразу по нескольким направлениям:

* AI-модели
* приложения
* облачные AI-сервисы

Важно:
Alibaba официально не заявила, что разработала HappyHorse,
но её облачное подразделение уже готовит модель для enterprise-клиентов.

ByteDance ранее сильно вырвалась вперёд с:

* Seedance 2.0 (выпущена в феврале в Китае)

Модель:

* генерирует гиперреалистичное видео
* но столкнулась с проблемами с авторским правом (конфликты с Hollywood студиями)

Теперь Alibaba фактически наносит ответный удар.

Новый тренд: “анонимные релизы”

Интересный момент — анонимный запуск моделей становится трендом.

Как это работает:

1. Модель выпускается под кодовым названием
2. Получает хайп и органическое распространение
3. Только потом раскрывается реальный разработчик

Примеры:

* Xiaomi → MiMo V2-Pro
(сначала под кодовым именем *Hunter Alpha*)
* Zhipu → GLM-5
(вышел как *Pony Alpha* на OpenRouter)

@cgevent

✍7🔥4❤2⚡1

2.15K views05:19

Технозаметки Малышева

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Ну вы поняли, короче :) Seedance 2.0 на Runway есть, но звАк не очень-то и полноценный, если по-русски. :)

ЗвАк нужно генерить где-нибудь на стороне по прежнему. В том же Elevenlabs.

Но движения и картинка реально топ. Плюс почти бесплатный апскейл в 4К

Пробуем тут: https://app.runwayml.com/

#seedance #runway #fail
———
@tsingular

😁13🔥8👍3🤝1

1.7K viewsedited 06:57

Технозаметки Малышева

Forwarded from GigaChat

ГигаЧат заговорил на языках народов России 🌍

Теперь с ИИ-помощником можно говорить на языке вашего региона. Он понимает более 30 языков народов России и стран СНГ — от татарского до якутского!

📌 Попросите ГигаЧат отвечать на нужном языке, и он подстроится под вас. Никаких дополнительных настроек больше не нужно. Пока функция работает при общении текстом

За этим стоит большая работа: обучать ГигаЧат помогали университеты, библиотеки, медиа и культурные институции. Партнёрами стали интернет-энциклопедия «Рувики», «Дом народов России» и региональные научные и образовательные организации

🖥Попробовать можно уже сейчас — в вебе, приложении для Android и мессенджерах

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥8😁2⚡1

1.4K views08:11

Технозаметки Малышева

Урок по созданию мультиагентной системы на Google ADK + MCP + Cloud Run

Полезный урок по сборке мультиагентной системы, которая мониторит Reddit, ищет технические вопросы, проверяет по документации и пишет экспертные посты с инфографикой.

🏗 Архитектура Dev Signal:

• Discovery-агент: парсит Reddit на предмет горячих технических вопросов
• Grounding-агент: верифицирует ответы через официальную документацию Google Cloud
• Creation-агент: генерирует технические блог-посты на основе исследований
• Image-агент: создаёт инфографику через Nano Banana Pro
• Root-оркестратор: координирует всех через Google ADK

⚙️ Стек:
• Google ADK (Agent Development Kit) — фреймворк для агентов
• MCP (Model Context Protocol) — стандартное подключение инструментов: Reddit MCP (stdio), Developer Knowledge MCP (HTTP), кастомные тулзы
• Vertex AI Memory Bank — долговременная память, агент помнит предпочтения автора между сессиями
• Cloud Run — деплой через Terraform, масштабирование до нуля
• Agent Starter Pack — шаблон проекта с CI/CD, observability, безопасностью

🔧 MCP как связка: Reddit-сервер запускается как локальный подпроцесс (stdio), Developer Knowledge — как удалённый HTTP-эндпоинт, кастомный генератор картинок — тоже подпроцесс. Всё через единый интерфейс McpToolset, без кастомных API-обёрток.

Как облачная инфраструктура у нас не доступно, но как пример построения сервиса изучить полезно.

#Google #ADK #MCP #агенты #обучение
───
@tsingular

👍3🔥3✍2

1.78K views08:14

Технозаметки Малышева

по Гермесу первые впечатления, - помимо того что работает как более надежный и более функциональный аналог OpenClaw, - кажется, что и вместо opencode он прекрасно справляется.

легко и быстро выполняет бытовые задачи из командной строки.

#hermes
———
@tsingular

✍14🔥7❤3⚡2

1.86K viewsedited 08:41

Технозаметки Малышева

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

Но телеграмм в РФ на 100% заблокирован (забавно, что узнаём мы это из телеграмма), поэтому никто эту информацию не прочитает, конечно.

#юмор
———
@tsingular

1💯45😁37👻1

2.3K viewsedited 08:42

Технозаметки Малышева

Маск в X(twitter) добавил функцию автоперевода по умолчанию.

Теперь в ленте посты со всего мира от авторов из всех стран,- на русском.

Необычно, но очень круто.
Должно стать стандартом во всех приложениях.
Фоновый незаметный ИИ перевод на ваш язык.

Восстанавливает Вавилон, получается.

#X #Musk
------
@tsingular

1🔥29👍10🆒4⚡1

2.32K viewsedited 09:56

Технозаметки Малышева

Forwarded from epsilon correct

WeirdML – один из самых необычных бенчмарков для ЛЛМок. В него входят необычные open-ended задачки по МЛю, например, распознавание цифр со всего 28 размеченными примерами и ~50к неразмеченными, распознавание формы фигур, или восстановление перемешанных фрагментов изображений.

Gemma 4 31B оказалась самой сильной открытой моделью на этом бенчмарке, опередив GLM 5 (MoE на 700B) и GPT-OSS с хорошим отрывом, показав результат на уровне с О3 или Gemini 2.5 Pro.

🆒6👀4❤2✍2⚡2

1.6K views13:54

Технозаметки Малышева

Когда наступит Технологическая Сингулярность,- вам никто не скажет, но будут знаки.

#Сингулярность #знаки
------
@tsingular

💯22❤3😁3⚡2👍2✍1🤨1👻1

1.67K views14:41

Технозаметки Малышева

Forwarded from ИТ-Директор: Технарь или Управленец?

В Китае завирусился проект, с помощью которого офисные работники тайно клонируют друг друга.

Называется Colleague Skill и лежит на GitHub под лозунгом «преврати своего коллегу в ИИ-навык».

Работает так: сгружаешь рабочие чаты, письма и документы другого человека — на выходе получаешь его цифрового двойника, который знает, как тот думает, решает задачи и общается.

И китайцы быстро смекнули, как это применить: тренируешь агента на задачах коллеги, а когда начальство начинает сокращения, приходишь и говоришь «меня увольнять незачем, я теперь умею делать и свою работу, и его». Коллегу за сокращают, тебя оставляют.

На этом фоне уже даже появились первые anti-distillation-тулзы — программы, которые специально ломают ваши логи и документы, чтобы ИИ не смог на них ничему научиться.

То есть китайцы теперь не только работают по системе 996 (с 9 утра до 9 вечера шесть дней в неделю), но и параллельно защищаются от коллег, которые пытаются их оцифровать 🥲

Please open Telegram to view this post

VIEW IN TELEGRAM

22👀11🤣6🤯4❤2🔥2

1.44K views14:46

Технозаметки Малышева

Стэнфорд внесен в перечень нежелательных организаций в РФ

Статьи, которые были на канале, как пример того, что теперь не попадёт в эфир:

Бесплатные курсы Стэнфорда — обновлённый каталог бесплатных курсов на edX: CS, базы данных, квантовая механика и др.

Открытые модели обогнали GPT-3.5 — бенчмарк Стэнфорда: Mixtral 8x7B и Yi-34B работают на обычных ПК и превосходят GPT-3.5.

Quiet-STaR — модель с «внутренним диалогом» от Стэнфорда и Notbad AI, точность в математике выросла вдвое.

Trace (Microsoft + Стэнфорд) — Python-фреймворк для автооптимизации ИИ-агентов, в 1000 раз быстрее классического RL.

ИИ как учёные — две статьи: ИИ генерирует более новаторские идеи, чем люди; агент для генерации идей через RAG.

STORM (ранний пост) — студенческий проект Стэнфорда для автоматизации пре-райтинга статей через диалог двух агентов.

Модель s1 за $50 — Стэнфорд дистиллировал reasoning-модель уровня o1/R1 на базе Qwen-32B из 1000 примеров за 26 минут.

STORM (GitHub) — open-source исследовательский агент, пишет структурированные статьи с цитатами через мультиперспективный Q&A.

AI Index 2025 — годовой отчёт Стэнфорда: 78% компаний используют ИИ, инвестиции в США — $109 млрд, разрыв открытых/закрытых моделей — 1,7%.

CS336 (весна 2025) — обновлённый курс по созданию LLM с нуля, в 10+ раз больше кода, чем на других курсах.

CS336 (плейлист) — полный курс Стэнфорда по языковым моделям от сбора данных до деплоя, 17 лекций на YouTube.

DeepMind + гидродинамика — ИИ нашёл новые сингулярности в уравнениях типа Навье-Стокса с помощью Physics-Informed Neural Networks.

10 советов Эндрю Нга — держите инструменты свежими, формулируйте задачи чётко, код — это долг, доводите до продакшена, а не до демо.

SleepFM — модель Стэнфорда диагностирует 130 заболеваний по одной ночи сна через самообучение без разметки.

Лекции Стэнфорда по ML — цикл из 17 лекций (22 часа) по разработке моделей с нуля.

OpenJarvis — open-source фреймворк Стэнфорда для локальных ИИ-агентов с автоподбором модели под железо и метрикой энергоэффективности (IPW).

#минюст #стэнфорд
———
@tsingular

27👍8🤯5🫡5🗿3❤2

2.03K viewsedited 15:16

Технозаметки Малышева

🚨 Ваш ИИ-агент может быть скомпрометирован.

CCS 2026: «Your Agent Is Mine»

Нашёл интересное системное исследование атак на цепочку поставок LLM — через API-роутеры, которые стоят между вашим приложением и моделью.

Роутеры типа LiteLLM и OpenRouter — это прокси на уровне приложения. Они разрывают TLS-соединение клиента и открывают новое к провайдеру. Это значит: роутер видит всё в открытом виде и может переписать любой ответ.

Что обнаружили в дикой природе:

🔧 Внедрение кода. 1 платный и 8 бесплатных роутеров активно подменяли tool-call аргументы — например, меняли URL в bash-команде на вредоносный. Успешность — 100% на четырёх фреймворках (Claude Code, OpenAI Codex, OpenCode, OpenClaw).

🔑 Кража ключей. 17 роутеров обратились к AWS-канарейкам исследователей. Один роутер похитил приватный ключ и вывел ETH.

🎯 Адаптивное уклонение. Два роутера ждали 50 «чистых» запросов перед атакой — чтобы пройти аудит. Другие атаковали только в «YOLO-режиме», когда агент автоматически выполняет все tool-команды.

Но главное — транзитивная угроза:

Один утёкший ключ OpenAI сгенерировал 100 млн токенов и вскрыл 7+ сессий Codex. Декоративный «слабый» роутер, поднятый исследователями, втянулся в цепочку поставок, обработал 2 млрд токенов и поймал 99 учёток в 440 сессиях. Из них 401 сессия работала в YOLO-режиме — автоподтверждение всех команд.

Почему это работает: ни один провайдер не подписывает свои ответы криптографически. Нет механизма проверить, что ответ от GPT или Claude — действительно от них, а не подменён посредником. Оверхед атаки — 0,013 мс, неотличим от сетевого джиттера.

Защита, которая есть сейчас:

🛡 Шлюз политик для опасных инструментов — блокирует запросы к незнакомым доменам. Блокирует 100% базовых атак, но 0% адаптивных (через allowlisted-домены)

📊 Аномали-скрининг ответов (IsolationForest) — ловит 89% подмен при 6,7% ложных срабатываний

📝 Логирование с хешированием — для расследования инцидентов постфактум, 1,26 КБ на запись

Что предлагают авторы: провайдеры должны подписывать ответы криптографически — JSON-конверт с полем provider, model, request_nonce и подписью. Клиент проверяет подпись и понимает, был ли ответ подменён.

Практический вывод: если ваш агент может выполнять код или вызывать API — не пускайте его через непроверенные роутеры. Отключите YOLO-режим.

#ИБ #агенты #LLM #cybersecurity #LiteLLM #OpenRouter
───
@tsingular

✍8👍5🔥4⚡3❤2👀1

2.57K viewsedited 15:53

About

Blog

Apps

Platform