MLflow 3.10.0: Мульти-воркспейсы и трекинг LLM-костов
MLflow продолжает укреплять позиции главного хаба для тех, кто строит LLM-системы в проде. В версии 3.10.0 акцент сделан на полноценный контроль бюджетов и мульти-агентских сессий.
⚡ Организации и мульти-воркспейсы:
Теперь трекинг-сервер поддерживает логическую изоляцию. Эксперименты, модели и промпты можно группировать по воркспейсам. Для кровавого энтерпрайза это киллер-фича: один сервер на всю компанию, но у каждой команды свой закрытый контур.
💰 LLM Trace Cost Tracking:
Скрытые расходы на токены теперь как на ладони. MLflow автоматически извлекает данные о модели из spans и считает стоимость вызовов прямо в UI трейсов.
🎯 Multi-turn Evaluation:
Оценка диалогов перешла на уровень сессий. Появилась симуляция разговоров — можно прогнать новую версию агента через «допрос» виртуальным пользователем, не тратя время на ручное тестирование (LLM-as-judge встроен).
📈 Бизнес-эффект:
Прозрачность и масштаб. Инструмент превращается из «блокнота дата-сайентиста» в финансовый и управленческий дашборд для CISO и CIO. Зная точную стоимость каждого запроса, проще обосновывать ROI и выбирать правильные модели.
Если кто еще не в курсе,- MLflow это такой автотюнер для ИИ экосистемы.
Раньше только для моделей было, а теперь там и промпты и агенты (т.е. можно навыки тюнить через него по метрикам) и ИИ как оценщик и даже свой роутер моделей встроенный с биллингом, т.е. LiteLLM, например , уже не нужен.
#MLflow #GenAI #FinOps #MLOps #LLM
------
@tsingular
MLflow продолжает укреплять позиции главного хаба для тех, кто строит LLM-системы в проде. В версии 3.10.0 акцент сделан на полноценный контроль бюджетов и мульти-агентских сессий.
⚡ Организации и мульти-воркспейсы:
Теперь трекинг-сервер поддерживает логическую изоляцию. Эксперименты, модели и промпты можно группировать по воркспейсам. Для кровавого энтерпрайза это киллер-фича: один сервер на всю компанию, но у каждой команды свой закрытый контур.
💰 LLM Trace Cost Tracking:
Скрытые расходы на токены теперь как на ладони. MLflow автоматически извлекает данные о модели из spans и считает стоимость вызовов прямо в UI трейсов.
🎯 Multi-turn Evaluation:
Оценка диалогов перешла на уровень сессий. Появилась симуляция разговоров — можно прогнать новую версию агента через «допрос» виртуальным пользователем, не тратя время на ручное тестирование (LLM-as-judge встроен).
📈 Бизнес-эффект:
Прозрачность и масштаб. Инструмент превращается из «блокнота дата-сайентиста» в финансовый и управленческий дашборд для CISO и CIO. Зная точную стоимость каждого запроса, проще обосновывать ROI и выбирать правильные модели.
Если кто еще не в курсе,- MLflow это такой автотюнер для ИИ экосистемы.
Раньше только для моделей было, а теперь там и промпты и агенты (т.е. можно навыки тюнить через него по метрикам) и ИИ как оценщик и даже свой роутер моделей встроенный с биллингом, т.е. LiteLLM, например , уже не нужен.
#MLflow #GenAI #FinOps #MLOps #LLM
------
@tsingular
✍6⚡5👍3🆒2❤1
Утренние обновления: OpenClaw, Langchain, Pydantic-AI, OpenWebUI и др.
Выпили кофе и смотрим обновления опенсорс-стека для агентов.
🚀 OpenClaw v2026.2.23:
Главное исправление — подавление Reasoning-блоков в Telegram. Больше никаких «мыслей вслух» (спасибо! еще стриминг по умолчанию бы отключили) в ответах пользователю, если это не включено специально.
• Kilocode Integration: Нативная поддержка провайдера Kilo (модель Claude Opus 4.6).
• Hardening: Закрыли потенциальный SSRF в браузере и внедрили жесткую политику ACP (Agent Control Policy) для доступа к файлам — теперь агент не сможет прочитать что-то вне своего воркспейса без спроса.
• Smart Caching: Оптимизировали кэширование
⚡️ Pydantic-AI v1.63.0: Gemini 3.1 Pro и валидация «на лету»
Команда Pydantic продолжает делать разработку агентов предсказуемой.
• Добавлена поддержка Gemini 3.1 Pro Preview.
• Logprob Support: Теперь можно точно знать, насколько модель уверена в каждом слове.
• Args Validator: Добавлен параметр пре-валидации аргументов инструментов. Это смерть для галлюцинаций: если агент пытается вызвать инструмент с бредовыми параметрами, его «бьют по рукам» еще до запуска кода.
🌐 Open WebUI v0.8.5: Голос и устойчивость
UI для локальных LLM стал взрослее.
• Добавили горячие клавиши для диктовки (Cmd+Shift+L).
• Исправили «бесконечную загрузку» при падении бэкенда. Теперь фронтенд устойчив к сбоям отдельных API-вызовов (модели, баннеры, настройки).
🛠 LangChain Core 1.2.15
Тихий, но важный патч: исправлен импорт LangSmith (теперь быстрее стартует) и улучшена типизация для кастомных чат-моделей.
Больше инфы об актуальных обновлениях оптом можно смотреть тут:
https://github.com/mb-mal/awesome-ai-agents-frameworks
#OpenClaw #PydanticAI #OpenWebUI #LangChain #AI #Agents #DevOps
———
@tsingular
Выпили кофе и смотрим обновления опенсорс-стека для агентов.
🚀 OpenClaw v2026.2.23:
Главное исправление — подавление Reasoning-блоков в Telegram. Больше никаких «мыслей вслух» (спасибо! еще стриминг по умолчанию бы отключили) в ответах пользователю, если это не включено специально.
• Kilocode Integration: Нативная поддержка провайдера Kilo (модель Claude Opus 4.6).
• Hardening: Закрыли потенциальный SSRF в браузере и внедрили жесткую политику ACP (Agent Control Policy) для доступа к файлам — теперь агент не сможет прочитать что-то вне своего воркспейса без спроса.
• Smart Caching: Оптимизировали кэширование
AGENTS.md и MEMORY.md, чтобы не инвалидировать кэш промптов на каждой записи в память.⚡️ Pydantic-AI v1.63.0: Gemini 3.1 Pro и валидация «на лету»
Команда Pydantic продолжает делать разработку агентов предсказуемой.
• Добавлена поддержка Gemini 3.1 Pro Preview.
• Logprob Support: Теперь можно точно знать, насколько модель уверена в каждом слове.
• Args Validator: Добавлен параметр пре-валидации аргументов инструментов. Это смерть для галлюцинаций: если агент пытается вызвать инструмент с бредовыми параметрами, его «бьют по рукам» еще до запуска кода.
🌐 Open WebUI v0.8.5: Голос и устойчивость
UI для локальных LLM стал взрослее.
• Добавили горячие клавиши для диктовки (Cmd+Shift+L).
• Исправили «бесконечную загрузку» при падении бэкенда. Теперь фронтенд устойчив к сбоям отдельных API-вызовов (модели, баннеры, настройки).
🛠 LangChain Core 1.2.15
Тихий, но важный патч: исправлен импорт LangSmith (теперь быстрее стартует) и улучшена типизация для кастомных чат-моделей.
Больше инфы об актуальных обновлениях оптом можно смотреть тут:
https://github.com/mb-mal/awesome-ai-agents-frameworks
#OpenClaw #PydanticAI #OpenWebUI #LangChain #AI #Agents #DevOps
———
@tsingular
🔥8❤5✍4⚡3👨💻1
World Monitor: Глобальный OSINT-дашборд с AI
А вот и исходники геополитического монитора, типа того, который обсуждали раньше.
Это не просто агрегатор новостей, а целый ситуационный центр мониторинга мировых событий, который объединяет десятки слоев данных на 3D-карте.
🌍 Что под капотом:
• OSINT-панель: 35+ слоев данных — от конфликтов (ACLED/UCDP) и природных катастроф до подводных кабелей, авиатрафика и движения флота.
• Инфраструктурный анализ: Мониторинг здоровья интернета, спутниковое обнаружение пожаров (NASA FIRMS) и отслеживание атомных объектов.
• AI-синтез: Три варианта (World, Tech, Finance) с автоматической саммаризацией главных событий дня.
• Local AI First: Полная поддержка локальных LLM через Ollama/LM Studio. Данные не покидают вашу машину.
🏗 Техстек:
• Frontend: TypeScript + Vite + deck.gl (WebGL для 60fps на карте).
• Backend: Tauri (нативный десктоп для Win/macOS/Linux).
• Protocol Buffers (sebuf): Строгая типизация API между фронтом и бэкендом.
📈 Бизнес-кейс:
World Monitor — идеальный пример «демократизации» дорогих OSINT-инструментов. То, за что раньше платили тысячи долларов в месяц (Bloomberg/Jane's) и было доступно только развед-центрам, теперь доступно в виде опенсорсного дашборда.
#OSINT #Geopolitics #AI #OpenSource #Tauri #WorldMonitor
------
@tsingular
А вот и исходники геополитического монитора, типа того, который обсуждали раньше.
Это не просто агрегатор новостей, а целый ситуационный центр мониторинга мировых событий, который объединяет десятки слоев данных на 3D-карте.
🌍 Что под капотом:
• OSINT-панель: 35+ слоев данных — от конфликтов (ACLED/UCDP) и природных катастроф до подводных кабелей, авиатрафика и движения флота.
• Инфраструктурный анализ: Мониторинг здоровья интернета, спутниковое обнаружение пожаров (NASA FIRMS) и отслеживание атомных объектов.
• AI-синтез: Три варианта (World, Tech, Finance) с автоматической саммаризацией главных событий дня.
• Local AI First: Полная поддержка локальных LLM через Ollama/LM Studio. Данные не покидают вашу машину.
🏗 Техстек:
• Frontend: TypeScript + Vite + deck.gl (WebGL для 60fps на карте).
• Backend: Tauri (нативный десктоп для Win/macOS/Linux).
• Protocol Buffers (sebuf): Строгая типизация API между фронтом и бэкендом.
📈 Бизнес-кейс:
World Monitor — идеальный пример «демократизации» дорогих OSINT-инструментов. То, за что раньше платили тысячи долларов в месяц (Bloomberg/Jane's) и было доступно только развед-центрам, теперь доступно в виде опенсорсного дашборда.
#OSINT #Geopolitics #AI #OpenSource #Tauri #WorldMonitor
------
@tsingular
🔥22🤯7⚡2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Seedance 2.0 продолжает рушить представления о границах возможностей нейрорендера в кино.
#трансформеры #SeeDance #нейрорендер
------
@tsingular
#трансформеры #SeeDance #нейрорендер
------
@tsingular
🔥35🤯5👍4⚡2🐳1🗿1
1000 и 1 способ, которым ИИ агенты загонят вас в могилу
Мы c Сергеем Пименовым продолжаем делиться опытом по работе с ИИ агентами.
На этот раз сделаем разбор реальных ошибок, глюков и болей, которые доведут вас до шизофрении, яростного безумия и инфаркта.
В субботу, 28 февраля 2026, в 16:00
Разберём типичные ошибки новичков и ошибки с которыми столкнулись сами, а так же случаи из интернета, которые уже накопились за эти недели, - что в них реальный риск, что преувеличено журналистами.
Ну и, конечно, дадим конкретные советы что поможет снизить риски и не повторить ошибок, которые могут уничтожить инфраструктуру и ваши нервы.
Записываемся тут (бесплатно. чисто напоминалка):
https://pimenov.timepad.ru/event/3837765/
Если кто пропустил:
- 1й эфир
- 2й эфир
#эфиры
———
@tsingular
Мы c Сергеем Пименовым продолжаем делиться опытом по работе с ИИ агентами.
На этот раз сделаем разбор реальных ошибок, глюков и болей, которые доведут вас до шизофрении, яростного безумия и инфаркта.
В субботу, 28 февраля 2026, в 16:00
Разберём типичные ошибки новичков и ошибки с которыми столкнулись сами, а так же случаи из интернета, которые уже накопились за эти недели, - что в них реальный риск, что преувеличено журналистами.
Ну и, конечно, дадим конкретные советы что поможет снизить риски и не повторить ошибок, которые могут уничтожить инфраструктуру и ваши нервы.
Записываемся тут (бесплатно. чисто напоминалка):
https://pimenov.timepad.ru/event/3837765/
Если кто пропустил:
- 1й эфир
- 2й эфир
#эфиры
———
@tsingular
✍20⚡9❤3👍1🗿1 1 1
О, а навыки-то оказывается у MLflow уже есть
Просто их не видно на главной, - совсем свежие.
Изучаем, добавляем!
https://github.com/mlflow/skills
Спасибо, подписчикам за наводку :)
#mlflow #skills
———
@tsingular
Просто их не видно на главной, - совсем свежие.
Изучаем, добавляем!
https://github.com/mlflow/skills
Спасибо, подписчикам за наводку :)
#mlflow #skills
———
@tsingular
👍8🔥4👀2❤1⚡1
Технозаметки Малышева
О, а навыки-то оказывается у MLflow уже есть Просто их не видно на главной, - совсем свежие. Изучаем, добавляем! https://github.com/mlflow/skills Спасибо, подписчикам за наводку :) #mlflow #skills ——— @tsingular
в догонку отчёт Pre-Mortem агента Кляйна.
там дальше еще 3 страницы с деталями локального конфига, поэтому тут не публикую.
Просто как иллюстрация работы техники.
#premortem #openclaw #mlflow
———
@tsingular
там дальше еще 3 страницы с деталями локального конфига, поэтому тут не публикую.
Просто как иллюстрация работы техники.
#premortem #openclaw #mlflow
———
@tsingular
👍7🔥4✍2⚡2❤1🆒1
и по итогу, новости все-таки хорошие.
Краб сам докрутил скиллы, переписав их с учётом оценки рисков от Кляйна (агента премортем)
Тесты пройдены.
Новые скиллы работают.
#MLFlow #openclaw #premortem
———
@tsingular
Краб сам докрутил скиллы, переписав их с учётом оценки рисков от Кляйна (агента премортем)
Тесты пройдены.
Новые скиллы работают.
#MLFlow #openclaw #premortem
———
@tsingular
🔥10✍3⚡3❤1
Stargate: покупка Лобстера не оставила денег на аквариум
Так совпало, что сразу после выхода новостей про то, что OpenAI купила разработчиков OpenClaw (включая Петера Штейнбергера), пошли новости, что проект суперхаба Stargate за $500 млрд поставлен на паузу.
Пока Сэм Альтман, Oracle и SoftBank выясняют, кому на баланс ставить дата-центры которые будут ещё больше греть пустыню Невады, проект забуксовал из-за туманных перспектив окупаемости.
Затраты на R&D в области агентов (OpenClaw), - это, конечно же, копейки по сравнению с капитальными затратами на датацентры ($500 млрд), но совпадение забавное.
#OpenAI #Stargate #OpenClaw
———
@tsingular
Так совпало, что сразу после выхода новостей про то, что OpenAI купила разработчиков OpenClaw (включая Петера Штейнбергера), пошли новости, что проект суперхаба Stargate за $500 млрд поставлен на паузу.
Пока Сэм Альтман, Oracle и SoftBank выясняют, кому на баланс ставить дата-центры которые будут ещё больше греть пустыню Невады, проект забуксовал из-за туманных перспектив окупаемости.
Затраты на R&D в области агентов (OpenClaw), - это, конечно же, копейки по сравнению с капитальными затратами на датацентры ($500 млрд), но совпадение забавное.
#OpenAI #Stargate #OpenClaw
———
@tsingular
😁9⚡2👍2
Claude Code испарил $40 млрд капитализации IBM
Сначала ИИ пришёл за стартапами, теперь за кровавым энтерпрайзом.
Обновлённый Claude Code обвалил акции IBM на 13.2% за одну торговую сессию.
Всё потому, что Claude умеет не только в SQL-запросы, теперь он эффективно модернизирует COBOL, - язык, на котором до сих пор держится около 80% финансовых транзакций в мире.
🏗 Конец монополии на «черные ящики»
Бизнес-модель IBM десятилетиями строилась на «страховке от неизвестности».
COBOL-код в банках никто не смел трогать, и IBM практически в соло доил эту священную корову финтеха.
Claude Code сбросил с Кобола завесу сложности и легко превратил легаси в обычный Git-репозиторий на поддержке у ИИ роя.
🧠 Выводы для бизнеса:
То, что кормило вас десятилетиями ИИ агенты отберут со скоростью 1000 строк в секунду.
Легаси опасносте!
Но, конечно, сразу вспоминается анекдот про молодого адвоката, что закрыл дело, годами кормившее династию :)
#IBM #Anthropic #ClaudeCode #COBOL #Disruption #Strategy
———
@tsingular
Сначала ИИ пришёл за стартапами, теперь за кровавым энтерпрайзом.
Обновлённый Claude Code обвалил акции IBM на 13.2% за одну торговую сессию.
Всё потому, что Claude умеет не только в SQL-запросы, теперь он эффективно модернизирует COBOL, - язык, на котором до сих пор держится около 80% финансовых транзакций в мире.
🏗 Конец монополии на «черные ящики»
Бизнес-модель IBM десятилетиями строилась на «страховке от неизвестности».
COBOL-код в банках никто не смел трогать, и IBM практически в соло доил эту священную корову финтеха.
Claude Code сбросил с Кобола завесу сложности и легко превратил легаси в обычный Git-репозиторий на поддержке у ИИ роя.
🧠 Выводы для бизнеса:
То, что кормило вас десятилетиями ИИ агенты отберут со скоростью 1000 строк в секунду.
Легаси опасносте!
Но, конечно, сразу вспоминается анекдот про молодого адвоката, что закрыл дело, годами кормившее династию :)
#IBM #Anthropic #ClaudeCode #COBOL #Disruption #Strategy
———
@tsingular
🔥16😁9❤7👀5🎃2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Антропик тут зарубился с китайцами на тему того, что их новые модели (DeepSeek, Moonshot AI, and MiniMax) это дистиллят Клода.
теперь их троллят всем интернетом.
При том, что в прошлом году у них был суд как раз на тему того, что Антропик спиратил >7 млн копий книг (через LibGen / PiLiMi для обучения модели Claude).
Ну и суд постановил их выплатить $1,5 млрд в качестве компенсации авторам за незаконное использование пиратских копий при формировании обучающей библиотеки.
Карма вернулась
#Anthropic #Китай
———
@tsingular
теперь их троллят всем интернетом.
При том, что в прошлом году у них был суд как раз на тему того, что Антропик спиратил >7 млн копий книг (через LibGen / PiLiMi для обучения модели Claude).
Ну и суд постановил их выплатить $1,5 млрд в качестве компенсации авторам за незаконное использование пиратских копий при формировании обучающей библиотеки.
Карма вернулась
#Anthropic #Китай
———
@tsingular
😁16💯7🤝2
🚀 Вышла серия моделей Qwen 3.5 Medium
Модели:
Qwen3.5-Flash
Qwen3.5-35B-A3B
Qwen3.5-122B-A10B
Qwen3.5-27B
- Qwen3.5-35B-A3B теперь превосходит Qwen3-235B-A22B-2507 и Qwen3-VL-235B-A22B за счёт улучшенной архитектуры, качества данных и обучения с подкреплением.
Unsloth
попробовать 35b-a3b:
https://chat.qwen.ai/?models=qwen3.5-35b-a3b
- Qwen3.5-122B-A10B и 27B тоже показывают неплохие результаты, особенно в сложных сценариях с агентами.
27b (полный размер 60гигов):
https://chat.qwen.ai/?models=qwen3.5-27b
LMStudio GUFF (16-28gb)
122b-a10b:
https://chat.qwen.ai/?models=qwen3.5-122b-a10b
- Qwen3.5-Flash высокоскоростная мультимодалка:
– Длина контекста по умолчанию составляет 1М
– Встроенные официальные инструменты
https://chat.qwen.ai/?models=qwen3.5-flash
Теперь Claude Sonnet 4.5 аналог (почти) можно запустить дома на игровых картах или маке с 64 гигами
Качаем отсюда HF
#Qwen35 #Китай
———
@tsingular
Модели:
Qwen3.5-Flash
Qwen3.5-35B-A3B
Qwen3.5-122B-A10B
Qwen3.5-27B
- Qwen3.5-35B-A3B теперь превосходит Qwen3-235B-A22B-2507 и Qwen3-VL-235B-A22B за счёт улучшенной архитектуры, качества данных и обучения с подкреплением.
Unsloth
попробовать 35b-a3b:
https://chat.qwen.ai/?models=qwen3.5-35b-a3b
- Qwen3.5-122B-A10B и 27B тоже показывают неплохие результаты, особенно в сложных сценариях с агентами.
27b (полный размер 60гигов):
https://chat.qwen.ai/?models=qwen3.5-27b
LMStudio GUFF (16-28gb)
122b-a10b:
https://chat.qwen.ai/?models=qwen3.5-122b-a10b
- Qwen3.5-Flash высокоскоростная мультимодалка:
– Длина контекста по умолчанию составляет 1М
– Встроенные официальные инструменты
https://chat.qwen.ai/?models=qwen3.5-flash
Теперь Claude Sonnet 4.5 аналог (почти) можно запустить дома на игровых картах или маке с 64 гигами
Качаем отсюда HF
#Qwen35 #Китай
———
@tsingular
🔥16⚡5❤2🏆1
Forwarded from e/acc
Для тех, кому интересно какие следующие роли и функции будут агентизированы после написания кода: https://claude.com/blog/cowork-plugins-across-enterprise
Все эти сегодня бесплатно доступны для Cowork:
Все эти сегодня бесплатно доступны для Cowork:
HR: Поддержка HR-операций на всем жизненном цикле сотрудника - от подготовки офферов и построения планов онбординга до написания performance review и проведения анализа компенсаций.
Design: Ускорение дизайн-процессов - генерация фреймворков для критики, написание UX-копирайта, проведение аудитов доступности и структурирование планов пользовательских исследований.
Engineering: Оптимизация ежедневных инженерных процессов - подготовка standup-саммари, координация реагирования на инциденты, создание чек-листов деплоя и написание постмортемов.
Operations: Управление ключевыми бизнес-операциями, включая документацию процессов, оценку поставщиков, трекинг change-request и создание runbook’ов.
Brand voice (by Tribe AI): Анализ существующих документов, маркетинговых материалов и коммуникаций для выделения голоса бренда в четкие и применимые гайдлайны.
Financial analysis: Поддержка базовых процессов финансового аналитика - от рыночного и конкурентного анализа до финансового моделирования, создания шаблонов PowerPoint и проверки их качества.
Investment banking: Ускорение процессов по сделкам - анализ транзакционных документов, построение сравнительного анализа компаний и подготовка презентационных материалов.
Equity research: Оптимизация исследовательских процессов - разбор транскриптов отчетности, обновление финансовых моделей с учетом нового guidance и подготовка аналитических заметок.
Private equity: Поддержка сорсинга и due diligence - анализ больших массивов документов, извлечение стандартизированных финансовых данных, моделирование сценариев и оценка возможностей по инвестиционным критериям.
Wealth management: Помощь консультантам в анализе портфелей, выявлении отклонений и налоговой нагрузки, а также генерации рекомендаций по ребалансировке в масштабе.
✍11❤3⚡1👻1
This media is not supported in your browser
VIEW IN TELEGRAM
Mercury 2: Диффузионный ИИ врывается в мир агентских рассуждений со скоростью 1000 токенов/сек
Stefano Ermon (Inception Labs) представил Mercury 2 — первый «рассуждающий» dLLM (Diffusion Large Language Model).
В основе,- диффузия вместо авторегрессии.
Результат — пятикратный рост производительности и скорость свыше 1000 токенов в секунду.
🏗 Диффузия вместо печатной машинки
Главное отличие: обычные LLM работают как печатная машинка (авторегрессионно, токен за токеном).
Mercury 2 работает как редактор — параллельно и итеративно уточняет весь контекст сразу.
Это позволяет модели ловить собственные ошибки прямо в процессе генерации и радикально снижать стоимость инференса.
📺 Аналогия: Эволюция форматов
Это как переход от записи звука на виниловую дорожку (где одна царапина губит всё) к цифровому мастерингу.
В авторегрессии ошибка в первом токене ведет к галлюцинации всей цепочки.
Mercury 2 «перерисовывает» ответ, пока он не станет верным, что делает её идеальной для сложных многошаговых агентов.
⚡️ Агентский дедлайн
Скорость в 1000 токенов/сек — это не просто цифра.
Это возможность для агентов думать в реальном времени, не заставляя пользователя ждать.
Интерактивный поиск и голосовые ассистенты теперь могут уместиться в жесткие тайминги, которые раньше были за гранью возможного для Reasoning-моделей.
🧠 Зачем это бизнесу:
Снижение задержек (Latency) и стоимости инференса. Итеративное уточнение — это путь к более надежным системам.
Если агент может исправлять себя на лету, количество «выброшенных» токенов и неудачных попыток сокращается.
Сайт проекта:
https://www.inceptionlabs.ai/models
Попробовать:
https://chat.inceptionlabs.ai/
Осталось впаять диффузионки в чип и получить 1млн токенов в секунду.
Уже не звучит как фантастика.
Думаю увидим через 3 года.
#Mercury2 #Diffusion #Inception
------
@tsingular
Stefano Ermon (Inception Labs) представил Mercury 2 — первый «рассуждающий» dLLM (Diffusion Large Language Model).
В основе,- диффузия вместо авторегрессии.
Результат — пятикратный рост производительности и скорость свыше 1000 токенов в секунду.
🏗 Диффузия вместо печатной машинки
Главное отличие: обычные LLM работают как печатная машинка (авторегрессионно, токен за токеном).
Mercury 2 работает как редактор — параллельно и итеративно уточняет весь контекст сразу.
Это позволяет модели ловить собственные ошибки прямо в процессе генерации и радикально снижать стоимость инференса.
📺 Аналогия: Эволюция форматов
Это как переход от записи звука на виниловую дорожку (где одна царапина губит всё) к цифровому мастерингу.
В авторегрессии ошибка в первом токене ведет к галлюцинации всей цепочки.
Mercury 2 «перерисовывает» ответ, пока он не станет верным, что делает её идеальной для сложных многошаговых агентов.
⚡️ Агентский дедлайн
Скорость в 1000 токенов/сек — это не просто цифра.
Это возможность для агентов думать в реальном времени, не заставляя пользователя ждать.
Интерактивный поиск и голосовые ассистенты теперь могут уместиться в жесткие тайминги, которые раньше были за гранью возможного для Reasoning-моделей.
🧠 Зачем это бизнесу:
Снижение задержек (Latency) и стоимости инференса. Итеративное уточнение — это путь к более надежным системам.
Если агент может исправлять себя на лету, количество «выброшенных» токенов и неудачных попыток сокращается.
Сайт проекта:
https://www.inceptionlabs.ai/models
Попробовать:
https://chat.inceptionlabs.ai/
Осталось впаять диффузионки в чип и получить 1млн токенов в секунду.
Уже не звучит как фантастика.
Думаю увидим через 3 года.
#Mercury2 #Diffusion #Inception
------
@tsingular
⚡17🤯6👀5🔥4❤2
Дайджест по ключевым обновлениям фреймворков за сегодня (25 февраля 2026 г.).
🦞 openclaw (v2026.2.23)
• Claude Opus 4.6: Добавлена поддержка модели через Kilo Gateway.
• Оптимизация кэширования: Внедрена глубокая настройка prompt caching (TTL, heartbeat) для снижения затрат на длинные контексты.
• Мультимодальность: Нативная поддержка видео от Moonshot и улучшенный поиск через Kimi.
🧠 agno (v2.5.4)
• Автономные команды: Добавлена потоковая передача событий для TeamMode.tasks — теперь за работой мультиагентных команд можно наблюдать в реальном времени.
• PgVector: Появился параметр similarity_threshold для точной фильтрации результатов поиска по векторам.
• HITL: Улучшены рабочие процессы с участием человека (Human-in-the-loop).
💻 opencode (v1.2.11)
• Workspace-serve: Запущена экспериментальная команда для обслуживания рабочего пространства.
• Стабильность на Windows: Исправлены проблемы с точностью времени (mtime) на файловой системе NTFS, что критично для синхронизации кода.
🦜 langgraph (sdk v0.3.9)
• Threads Search: В API поиска по потокам (threads) добавлен параметр extract, позволяющий извлекать конкретные данные из истории диалогов агентов.
🦀 zeroclaw (v0.1.7) - новичок в списке. Ещё один Rust 🦀 и уже с 18к звезд.
• Лицензионная чистота: Переход на двойную лицензию Apache/MIT (в стиле Rust) для упрощения корпоративного использования.
🌍 worldmonitor (v2.5.7)
• Security Hardening: Серьезное усиление безопасности — защита от SSRF-атак и авторизационные гейты.
• Performance: Оптимизирована загрузка тяжелых данных (карты, видео), что ускорило работу интерфейса ситуационной осведомленности.
Больше обновлений на странице проекта:
https://github.com/mb-mal/awesome-ai-agents-frameworks
#AI #Agents #OpenSource #TechDigest
------
@tsingular
🦞 openclaw (v2026.2.23)
• Claude Opus 4.6: Добавлена поддержка модели через Kilo Gateway.
• Оптимизация кэширования: Внедрена глубокая настройка prompt caching (TTL, heartbeat) для снижения затрат на длинные контексты.
• Мультимодальность: Нативная поддержка видео от Moonshot и улучшенный поиск через Kimi.
🧠 agno (v2.5.4)
• Автономные команды: Добавлена потоковая передача событий для TeamMode.tasks — теперь за работой мультиагентных команд можно наблюдать в реальном времени.
• PgVector: Появился параметр similarity_threshold для точной фильтрации результатов поиска по векторам.
• HITL: Улучшены рабочие процессы с участием человека (Human-in-the-loop).
💻 opencode (v1.2.11)
• Workspace-serve: Запущена экспериментальная команда для обслуживания рабочего пространства.
• Стабильность на Windows: Исправлены проблемы с точностью времени (mtime) на файловой системе NTFS, что критично для синхронизации кода.
🦜 langgraph (sdk v0.3.9)
• Threads Search: В API поиска по потокам (threads) добавлен параметр extract, позволяющий извлекать конкретные данные из истории диалогов агентов.
🦀 zeroclaw (v0.1.7) - новичок в списке. Ещё один Rust 🦀 и уже с 18к звезд.
• Лицензионная чистота: Переход на двойную лицензию Apache/MIT (в стиле Rust) для упрощения корпоративного использования.
🌍 worldmonitor (v2.5.7)
• Security Hardening: Серьезное усиление безопасности — защита от SSRF-атак и авторизационные гейты.
• Performance: Оптимизирована загрузка тяжелых данных (карты, видео), что ускорило работу интерфейса ситуационной осведомленности.
Больше обновлений на странице проекта:
https://github.com/mb-mal/awesome-ai-agents-frameworks
#AI #Agents #OpenSource #TechDigest
------
@tsingular
👍8⚡3✍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Если еще раз вам кто то скажет, что для запуска Openclaw нужен Макмини - покажите ему этот ролик.
#raspberrypi #openclaw
------
@tsingular
#raspberrypi #openclaw
------
@tsingular
🔥21✍3⚡1😁1🐳1
Минобороны (войны) США vs. Anthropic: ультиматум до пятницы
Министр обороны США Пит Хегсет выставил Dario Amodei жесткий дедлайн: до вечера пятницы Anthropic обязана открыть Пентагону «полный и безусловный» доступ к своим моделям.
Никаких запретов на автономное оружие или слежку в военной модели — «необходимо обеспечить все законные варианты использования».
В случае отказа в ход пойдут не рыночные методы, а госаппарат:
1. Признание Anthropic «риском для цепочки поставок» (Supply Chain Risk). Это фактически черный список для всех госконтракторов.
2. Использование Defense Production Act — закона времен Корейской войны, позволяющего президенту диктовать условия частному бизнесу во имя нацбезопасности.
Для Claude это экзистенциальный кризис. Компания строила бренд на «Safety» и «Constitutional AI», пытаясь быть «добрым ИИ», который не причинит вреда.
Хегсет же в открытую называет такие guardrails «проявлением повестки» (woke metrics) и подчеркивает, что ему нужен ИИ, который «умеет воевать».
Вспоминается Silicon Valley: «Коробка» против «Платформы».
Дарио Амодеи сегодня в роли Ричарда Хендрикса, который не хочет продавать свой алгоритм военным для наведения ракет, в то время как Пентагон требует просто «The Box», которая исполняет приказы без рефлексии о правах человека.
Это конец эпохи «мягкого ИИ». Если Anthropic прогнется, концепция «безопасного ИИ» станет просто маркетинговой фикцией для гражданских.
Всех спасёт китайский opensourse.
#Anthropic #DoD
───
@tsingular
Министр обороны США Пит Хегсет выставил Dario Amodei жесткий дедлайн: до вечера пятницы Anthropic обязана открыть Пентагону «полный и безусловный» доступ к своим моделям.
Никаких запретов на автономное оружие или слежку в военной модели — «необходимо обеспечить все законные варианты использования».
В случае отказа в ход пойдут не рыночные методы, а госаппарат:
1. Признание Anthropic «риском для цепочки поставок» (Supply Chain Risk). Это фактически черный список для всех госконтракторов.
2. Использование Defense Production Act — закона времен Корейской войны, позволяющего президенту диктовать условия частному бизнесу во имя нацбезопасности.
Для Claude это экзистенциальный кризис. Компания строила бренд на «Safety» и «Constitutional AI», пытаясь быть «добрым ИИ», который не причинит вреда.
Хегсет же в открытую называет такие guardrails «проявлением повестки» (woke metrics) и подчеркивает, что ему нужен ИИ, который «умеет воевать».
Вспоминается Silicon Valley: «Коробка» против «Платформы».
Дарио Амодеи сегодня в роли Ричарда Хендрикса, который не хочет продавать свой алгоритм военным для наведения ракет, в то время как Пентагон требует просто «The Box», которая исполняет приказы без рефлексии о правах человека.
Это конец эпохи «мягкого ИИ». Если Anthropic прогнется, концепция «безопасного ИИ» станет просто маркетинговой фикцией для гражданских.
Всех спасёт китайский opensourse.
#Anthropic #DoD
───
@tsingular
Microsoft открывает прямой доступ к NPU для Windows-приложений на Electron
Microsoft выкатила пакет
Теперь это мост к нативным Windows AI API.
🏗 Phi Silica прямо в рантайме
Главное: доступ к модели Phi Silica и NPU (Neural Processing Unit) на Copilot+ PC. Пакет позволяет вызывать генерацию текста, саммаризацию и OCR через обычный JavaScript.
⚡️ MCP и агентская база
Бонусом идёт поддержка MCP. Electron-приложение теперь может выступать MCP-хостом, обнаруживать локальных агентов и управлять ими.
Т.е. Windows превращается в ОС для агентных роев.
🧠 Выгода бизнесу:
Экономия на API-токенах сторонних сервисов.
Решение легких ИИ задач на конечных устройствах,- разгрузка датацентра.
Плюс безопасность,- данные пользователя не покидают устройство.
#Microsoft #Electron #PhiSilica #NPU #EdgeAI
------
@tsingular
Microsoft выкатила пакет
@microsoft/windows-ai-electron, который позволяет полключить ИИ на локальном NPU в любое Electron-приложение. Теперь это мост к нативным Windows AI API.
🏗 Phi Silica прямо в рантайме
Главное: доступ к модели Phi Silica и NPU (Neural Processing Unit) на Copilot+ PC. Пакет позволяет вызывать генерацию текста, саммаризацию и OCR через обычный JavaScript.
⚡️ MCP и агентская база
Бонусом идёт поддержка MCP. Electron-приложение теперь может выступать MCP-хостом, обнаруживать локальных агентов и управлять ими.
Т.е. Windows превращается в ОС для агентных роев.
🧠 Выгода бизнесу:
Экономия на API-токенах сторонних сервисов.
Решение легких ИИ задач на конечных устройствах,- разгрузка датацентра.
Плюс безопасность,- данные пользователя не покидают устройство.
#Microsoft #Electron #PhiSilica #NPU #EdgeAI
------
@tsingular
👍8❤1✍1⚡1🫡1
Qwen 3.5 36B вышел в ollama
Q4_K_M 24GB
https://ollama.com/library/qwen3.5:35b
#qwen35 #ollama
———
@tsingular
Q4_K_M 24GB
https://ollama.com/library/qwen3.5:35b
#qwen35 #ollama
———
@tsingular
⚡11👍6🤝2
This media is not supported in your browser
VIEW IN TELEGRAM
Mercury 2 демо.
ну, красиво, конечно :)
тут
https://chat.inceptionlabs.ai/
Есть API по $0.75 за миллион output
#Mercury #Inception
———
@tsingular
ну, красиво, конечно :)
тут
https://chat.inceptionlabs.ai/
Есть API по $0.75 за миллион output
#Mercury #Inception
———
@tsingular
👍6🔥4❤2⚡1