Технозаметки Малышева

OpenAI показала GPT-5.6 Sol.

Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.

Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.

Появляются два важных режима:

• max — больше времени на глубокое рассуждение
• ultra — работа через субагентов для сложных процессов

Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.

https://openai.com/index/previewing-gpt-5-6-sol/

🤔4❤3👍2

2.08K views19:54

Технозаметки Малышева

Hermes Agent получил Mixture of Agents — виртуального провайдера, собирающего консилиум из моделей

Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
Называется ~~Клуб Что? Где? Когда?~~ Mixture of Agents (MoA),- реализован как полноценный самостоятельный виртуальный провайдер с собственной логикой агрегации результата.

⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через /model, Dashboard или TUI. Hermes запускает reference-модели (например, GPT-5.5 и DeepSeek V4 Pro), они анализируют задачу, а aggregator (скажем, Claude Opus 4.8) пишет финальный ответ и вызывает инструменты. Агентский цикл не ломается: tool calls, follow-up итерации, прерывания, транскрипт — всё работает как с обычной моделью.

🦀 Пресеты настраиваются в config.yaml — можно смешивать провайдеров, задавать отдельно температуру для reference и aggregator, лимитировать токены.

Команда /moa работает как алиас: без аргументов переключает на дефолтный пресет, с именем пресета — на конкретный, с произвольным текстом — выполняет one-shot запрос через MoA и возвращает предыдущую модель.

📦 MoA компонуется с остальной экосистемой автоматически: /goal, gateway-сессии, TUI, Desktop — везде, где выбирается модель. В списке провайдеров появляется отдельная строка Mixture of Agents, а её модели — это ваши пресеты.

Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.

Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.

Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.

Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.

#Hermes #MoA #агенты #OpenRouter
———
@tsingular

🔥20❤5🏆2⚡1👍1🤔1👌1

2.87K viewsedited 03:23

Технозаметки Малышева

55:37

Media is too big

VIEW IN TELEGRAM

Разговоры о будущем с Игорем Никитиным

Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.

Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.

Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.

Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.

Игорь Никитин:
tg: @Nikitinwmt

Rutube | VKVideo | YouTube

Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут

#эфиры #Никитин #WMT
———
@tsingular

🔥20👍10❤3⚡3🤝1🗿1

3.23K viewsedited 10:11

Технозаметки Малышева

Forwarded from Machinelearning

✔️

DeepSeek выложила DSpark - новый метод speculative decoding для V4 Flash и V4 Pro.

Заявленный прирост throughput: от 51% до 400% в зависимости от модели и случаев использования.

Смысл speculative decoding простой: маленькая или более быстрая модель заранее предлагает несколько следующих токенов, а основная модель проверяет их пачкой. Если предсказание совпадает, генерация идёт быстрее, потому что дорогих проходов большой модели становится меньше.

DeepSeek показывает ускорение не только на своих V4 Flash и Pro, но и на других моделях, включая Gemma и Qwen.

Это потенциально довольно полезный inference-подход для разных open-weight моделей.

Для продакшена это важная история.

Если качество ответа остаётся близким, а throughput растёт в разы, можно обслуживать больше запросов на том же железе или снижать стоимость генерации.

GitHub:
https://github.com/deepseek-ai/DeepSpec

Paper:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

HF:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥17❤33⚡1

2.87K views14:47

Технозаметки Малышева

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Если б у меня такая рогатка была бы в детстве, я бы наверное не вырос 😀😃🙂🙃

Не, ну до чего техника дошла.

#юмор #рогатка
------
@tsingular

72🔥68⚡18😁11👍6❤‍🔥5❤3👀3

6.14K viewsedited 18:14

Технозаметки Малышева

А я правильно понял, что про рогатки вам интереснее читать, чем про ИИ? 😀

2💯118😁68👍8❤4🙏1

2.39K views12:08

Технозаметки Малышева

DeepSeek напомнил, что мы используем Preview версию, а полноценный Дипсик мы еще даже не видели, - он выйдет в середине июля и в нем будет еще больше крутых фич и улучшенная производительность.

И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74

#DeepSeek #цены
———
@tsingular

👍31✍8🫡6

2.35K views13:00

Технозаметки Малышева

0:42

Media is too big

VIEW IN TELEGRAM

Обещал вчера вам море показать :)

интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)

а то может пора тревел блог заводить... 🤔

#море
———
@tsingular

1❤82⚡27🔥19🐳12😁4👍3💯1

2.11K viewsedited 13:14

Технозаметки Малышева

Akrites: крупнейшая коалиция в истории для защиты открытого кода

📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.

💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.

Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!

Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.

💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».

📎 Ссылки

https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026

#Akrites #OpenSource #CyberSecurity
———
@tsingular

👍17🔥6⚡3✍2❤1

1.95K views05:11

Технозаметки Малышева

Forwarded from _rnd

⚡️

Как оценивать агентский harness

Одной LLM недостаточно, чтобы понять качество AI-агента. На итоговый результат влияет агентский harness — как он управляет инструментами, памятью, сообщениями, восстановлением после ошибок.

Чтобы разобраться в этой теме, мы провели ряд экспериментов. И выкатили в open source Harness Bench — открытый фреймворк для сравнения связок «модель + harness».

А в новой мощной статье на Хабре рассказали про архитектуру фреймворка, адаптацию классических бенчмарков под системы агентов, поделились инженерными находками и результатами сравнений разных связок.

↗️

Читайте статью

↗️

Тестируйте бенч

Автор и статьи, и бенчмарка, Андрей Иванов — NLP-инженер в R&D red_mad_robot.

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍8✍4⚡2🔥2

1.71K views13:31

Технозаметки Малышева

Forwarded from эйай ньюз

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

Comfy MCP

Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.

Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.

Блогпост

@ai_newz

👍6🔥5❤1⚡1

1.57K views16:00

Технозаметки Малышева

This media is not supported in your browser

This media is not supported in your browser

VIEW IN TELEGRAM

Google DeepMind выкатили Nano Banana 2 Lite и Gemini Omni Flash

📋 Что произошло
30 июня Google DeepMind выпустила две модели, дополняющие друг друга в процессе «изображение → видео» для разработчиков: Nano Banana 2 Lite — сверхбыстрая генерация изображений, и Gemini Omni Flash — генерация и редактирование видео на естественном языке.
Обе доступны через Gemini API и Google AI Studio, а также в потребительских продуктах Google.

💡 Технические детали
Nano Banana 2 Lite (gemini-3.1-flash-lite-image) — прямая замена первого поколения: ~4 секунды на генерацию, $0,034 за изображение в 1К разрешении.
Сохраняет стабильность персонажей и читаемый текст на изображениях при минимальной задержке.
Семейство Nano Banana теперь состоит из четырёх моделей: Lite (скорость), Nano Banana 2 (баланс), Pro (точность для сложных задач), и устаревшая первая версия.

Gemini Omni Flash (gemini-omni-flash-preview) — первый выход видео-модели Google в публичный API.
Генерирует 10-секундные ролики за $0,10/сек, поддерживает итеративное редактирование на естественном языке, мультимодальные ссылки (текст + изображение + видео на вход) и синхронизацию текста с действием в кадре.
Известные ограничения: аудио-референсы и расширение сцен пока не работают, стабильность персонажей при смене ракурса требует доработки.

Google по сути выдал элементы сквозного анимационного пайплайна: быстрая итерация изображений в Nano Banana 2 Lite → передача как референса в Omni Flash → анимация.
Interactions API поддерживает до трёх последовательных правок в одной сессии.
Все выдачи маркируются SynthID.

#Gemini #GoogleDeepMind #AI
———
@tsingular

🔥7🆒3⚡1

1.8K views17:11

Технозаметки Малышева

Forwarded from Machinelearning

Anthropic выкатила Claude Sonnet 5 — самый «агентный» Sonnet в линейке.

Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.

По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.

Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.

Цена для разработчиков до 31 августа 2026:

• $2 за 1 млн input tokens
• $10 за 1 млн output tokens

Потом стандартная цена:

• $3 за input
• $15 за output

Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.

По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.

https://www.anthropic.com/news/claude-sonnet-5

👍11⚡6🔥2❤1👌1

1.68K views18:04

About

Blog

Apps

Platform