Технозаметки Малышева

OpenAI показала GPT-5.6 Sol.

Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.

Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.

Появляются два важных режима:

• max — больше времени на глубокое рассуждение
• ultra — работа через субагентов для сложных процессов

Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.

https://openai.com/index/previewing-gpt-5-6-sol/

🤔4❤3👍2

2.08K views19:54

Технозаметки Малышева

Hermes Agent получил Mixture of Agents — виртуального провайдера, собирающего консилиум из моделей

Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
Называется ~~Клуб Что? Где? Когда?~~ Mixture of Agents (MoA),- реализован как полноценный самостоятельный виртуальный провайдер с собственной логикой агрегации результата.

⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через /model, Dashboard или TUI. Hermes запускает reference-модели (например, GPT-5.5 и DeepSeek V4 Pro), они анализируют задачу, а aggregator (скажем, Claude Opus 4.8) пишет финальный ответ и вызывает инструменты. Агентский цикл не ломается: tool calls, follow-up итерации, прерывания, транскрипт — всё работает как с обычной моделью.

🦀 Пресеты настраиваются в config.yaml — можно смешивать провайдеров, задавать отдельно температуру для reference и aggregator, лимитировать токены.

Команда /moa работает как алиас: без аргументов переключает на дефолтный пресет, с именем пресета — на конкретный, с произвольным текстом — выполняет one-shot запрос через MoA и возвращает предыдущую модель.

📦 MoA компонуется с остальной экосистемой автоматически: /goal, gateway-сессии, TUI, Desktop — везде, где выбирается модель. В списке провайдеров появляется отдельная строка Mixture of Agents, а её модели — это ваши пресеты.

Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.

Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.

Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.

Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.

#Hermes #MoA #агенты #OpenRouter
———
@tsingular

🔥20❤5🏆2⚡1👍1🤔1👌1

2.87K viewsedited 03:23

Технозаметки Малышева

55:37

Media is too big

VIEW IN TELEGRAM

Разговоры о будущем с Игорем Никитиным

Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.

Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.

Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.

Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.

Игорь Никитин:
tg: @Nikitinwmt

Rutube | VKVideo | YouTube

Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут

#эфиры #Никитин #WMT
———
@tsingular

🔥20👍10❤3⚡3🤝1🗿1

3.23K viewsedited 10:11

Технозаметки Малышева

Forwarded from Machinelearning

✔️

DeepSeek выложила DSpark - новый метод speculative decoding для V4 Flash и V4 Pro.

Заявленный прирост throughput: от 51% до 400% в зависимости от модели и случаев использования.

Смысл speculative decoding простой: маленькая или более быстрая модель заранее предлагает несколько следующих токенов, а основная модель проверяет их пачкой. Если предсказание совпадает, генерация идёт быстрее, потому что дорогих проходов большой модели становится меньше.

DeepSeek показывает ускорение не только на своих V4 Flash и Pro, но и на других моделях, включая Gemma и Qwen.

Это потенциально довольно полезный inference-подход для разных open-weight моделей.

Для продакшена это важная история.

Если качество ответа остаётся близким, а throughput растёт в разы, можно обслуживать больше запросов на том же железе или снижать стоимость генерации.

GitHub:
https://github.com/deepseek-ai/DeepSpec

Paper:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

HF:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥17❤33⚡1

2.87K views14:47

Технозаметки Малышева

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Если б у меня такая рогатка была бы в детстве, я бы наверное не вырос 😀😃🙂🙃

Не, ну до чего техника дошла.

#юмор #рогатка
------
@tsingular

72🔥68⚡18😁11👍6❤‍🔥5❤3👀3

6.14K viewsedited 18:14

Технозаметки Малышева

А я правильно понял, что про рогатки вам интереснее читать, чем про ИИ? 😀

2💯118😁68👍8❤4🙏1

2.39K views12:08

Технозаметки Малышева

DeepSeek напомнил, что мы используем Preview версию, а полноценный Дипсик мы еще даже не видели, - он выйдет в середине июля и в нем будет еще больше крутых фич и улучшенная производительность.

И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74

#DeepSeek #цены
———
@tsingular

👍31✍8🫡6

2.35K views13:00

Технозаметки Малышева

0:42

Media is too big

VIEW IN TELEGRAM

Обещал вчера вам море показать :)

интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)

а то может пора тревел блог заводить... 🤔

#море
———
@tsingular

1❤82⚡27🔥19🐳12😁4👍3💯1

2.11K viewsedited 13:14

Технозаметки Малышева

Akrites: крупнейшая коалиция в истории для защиты открытого кода

📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.

💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.

Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!

Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.

💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».

📎 Ссылки

https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026

#Akrites #OpenSource #CyberSecurity
———
@tsingular

👍17🔥6⚡3✍2❤1

1.95K views05:11

Технозаметки Малышева

Forwarded from _rnd

⚡️

Как оценивать агентский harness

Одной LLM недостаточно, чтобы понять качество AI-агента. На итоговый результат влияет агентский harness — как он управляет инструментами, памятью, сообщениями, восстановлением после ошибок.

Чтобы разобраться в этой теме, мы провели ряд экспериментов. И выкатили в open source Harness Bench — открытый фреймворк для сравнения связок «модель + harness».

А в новой мощной статье на Хабре рассказали про архитектуру фреймворка, адаптацию классических бенчмарков под системы агентов, поделились инженерными находками и результатами сравнений разных связок.

↗️

Читайте статью

↗️

Тестируйте бенч

Автор и статьи, и бенчмарка, Андрей Иванов — NLP-инженер в R&D red_mad_robot.

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍8✍4⚡2🔥2

1.71K views13:31

Технозаметки Малышева

Forwarded from эйай ньюз

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

Comfy MCP

Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.

Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.

Блогпост

@ai_newz

👍6🔥5❤1⚡1

1.57K views16:00

Технозаметки Малышева

This media is not supported in your browser

This media is not supported in your browser

VIEW IN TELEGRAM

Google DeepMind выкатили Nano Banana 2 Lite и Gemini Omni Flash

📋 Что произошло
30 июня Google DeepMind выпустила две модели, дополняющие друг друга в процессе «изображение → видео» для разработчиков: Nano Banana 2 Lite — сверхбыстрая генерация изображений, и Gemini Omni Flash — генерация и редактирование видео на естественном языке.
Обе доступны через Gemini API и Google AI Studio, а также в потребительских продуктах Google.

💡 Технические детали
Nano Banana 2 Lite (gemini-3.1-flash-lite-image) — прямая замена первого поколения: ~4 секунды на генерацию, $0,034 за изображение в 1К разрешении.
Сохраняет стабильность персонажей и читаемый текст на изображениях при минимальной задержке.
Семейство Nano Banana теперь состоит из четырёх моделей: Lite (скорость), Nano Banana 2 (баланс), Pro (точность для сложных задач), и устаревшая первая версия.

Gemini Omni Flash (gemini-omni-flash-preview) — первый выход видео-модели Google в публичный API.
Генерирует 10-секундные ролики за $0,10/сек, поддерживает итеративное редактирование на естественном языке, мультимодальные ссылки (текст + изображение + видео на вход) и синхронизацию текста с действием в кадре.
Известные ограничения: аудио-референсы и расширение сцен пока не работают, стабильность персонажей при смене ракурса требует доработки.

Google по сути выдал элементы сквозного анимационного пайплайна: быстрая итерация изображений в Nano Banana 2 Lite → передача как референса в Omni Flash → анимация.
Interactions API поддерживает до трёх последовательных правок в одной сессии.
Все выдачи маркируются SynthID.

#Gemini #GoogleDeepMind #AI
———
@tsingular

🔥7🆒3⚡1

1.8K views17:11

Технозаметки Малышева

Forwarded from Machinelearning

Anthropic выкатила Claude Sonnet 5 — самый «агентный» Sonnet в линейке.

Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.

По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.

Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.

Цена для разработчиков до 31 августа 2026:

• $2 за 1 млн input tokens
• $10 за 1 млн output tokens

Потом стандартная цена:

• $3 за input
• $15 за output

Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.

По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.

https://www.anthropic.com/news/claude-sonnet-5

👍11⚡6🔥2❤1👌1

1.68K views18:04

Технозаметки Малышева

Доброе утро, так сказать.

Fable 5 возвращается для всех.

#Fable #Anthropic
------
@tsingular

🍾22🔥145❤3

1.8K views04:36

Технозаметки Малышева

Palantir и NVIDIA запускают «движок» для развёртывания открытых моделей Nemotron в изолированных средах американских госорганов

🇺🇸 Palantir Technologies и NVIDIA 29 июня анонсировали стратегическое партнёрство: «интеллектуальный движок» (intelligent engine) для запуска открытых моделей NVIDIA Nemotron в суверенных средах — секретных, физически изолированных и прочих контурах, куда модели не пускают по определению.

⚙️ Архитектура объединяет AI-платформу NVIDIA (вычислительные мощности, экосистема, открытые модели) и инфраструктурный стек Palantir: AIP, Ontology, Foundry, Apollo. Три слоя инжиниринга: развёртывание кастомных Nemotron в изолированных средах, оптимизация контекста и промптов под боевые задачи, и самое интересное — самообучение моделей на основе собственных данных, результатов миссий и телеметрии пользователей.

🔄 Самообучение моделей: телеметрия и трейсы пользователей собираются и используются для дообучения и выравнивания модели под конкретные операционные задачи заказчика.
Заказчик получает не статичную модель, а самоулучшающуюся, заточенную непосредственно под свою миссию.

🔐 Ключевые возможности безопасности: явная авторизация данных, архитектурная изоляция под каждого заказчика, переносимость данных, право на удаление, полная аудируемость.
Алекс Карп, CEO Palantir: «Это позволит правительству США использовать всю мощь LLM, убрав риски утечки чувствительных инсайтов в веса закрытых моделей».

📦 Дженсен Хуан, CEO NVIDIA, назвал открытый ИИ «фундаментом национальной безопасности и технологического лидерства США».
Инициатива строится на ранее анонсированной архитектуре Sovereign AI Operating System — совместной разработке Palantir и NVIDIA.

#Palantir #NVIDIA #Nemotron
———
@tsingular

2🤔4⚡3🔥3✍1

1.48K views08:07

Технозаметки Малышева

Forwarded from НИИ ИИ

1:20

This media is not supported in your browser

VIEW IN TELEGRAM

NotebookLM научился делать короткие видео из ваших источников

Google выкатил в NotebookLM новую функцию: Short Video Overviews. Загружаете статью, PDF или свои заметки — и получаете вертикальный ролик на 60 секунд с разбором сути. Формат сделан специально под то, как мы сейчас потребляем контент: скроллим шортсы, но хотим при этом чему-то учиться, а не просто убивать время. Поколению TikTok такая механика точно понравится: привычка к коротким видео наконец приносит пользу, ведь такой формат помогает учиться на ходу.

Пока доступно подписчикам Google AI Ultra и Pro на мобильном и вебе, для бесплатных аккаунтов функцию обещают открыть позже.

Мне нравится сама идея. Если вы уже используете NotebookLM как рабочий инструмент для разбора источников (я уже писал, как вытянуть из него максимум), видео-формат — ещё один способ прогнать материал через голову: сначала аудио-обзор, потом mind map, а теперь и короткое видео. Три формата на один и тот же контент почти бесплатно.

Практическая польза тут не в развлечении, а в скорости. Когда нужно быстро вспомнить содержание длинного отчёта перед встречей или дать команде выжимку без часового чтения, 60 секунд видео решают задачу быстрее, чем текстовое саммари, которое всё равно придётся читать.

Минус — это пока платная фича в пакете Google AI и пока только на английском языке. Но у Google подобные функции обычно доезжают до бесплатных пользователей в течение пары месяцев. Надеюсь, русский язык тоже появится.

pimenov.ai

✍6⚡2👍2

1.26K views08:21

Технозаметки Малышева

Huawei выпустила OpenPangu 2.0 Flash — 92B MoE на чипах Ascend, open source близкий к DeepSeek V4 Flash и Claude Sonnet 5

📋 30 июня Huawei опубликовала OpenPangu 2.0 Flash — 92B MoE (6B активных), полностью обученный на чипах Ascend, с 512K контекста и 34T токенов предобучения.

Huawei выделила openPangu в отдельный open-source-бренд и анонсировала выпуск семи версий до конца года.

При 6B активных параметров и MTP на 3 токена вперёд OpenPangu набирает 93,3% на AIME 2026 (98,1% с Python) — уровень, для которого ещё год назад требовались модели с на порядок большей активной частью.
По кодингу (SWE-bench 63,1%) отставание от DeepSeek V4 Flash (79,0%) и Sonnet-5 пока заметное, но по агентным задачам (TAU2-Bench 88,0%) и следованию инструкциям (IFEval 95,9%) модель вполне конкурентоспособна.

📎 Hugging Face | Репозиторий openPangu

#Huawei #OpenPangu #Ascend
———
@tsingular

⚡6✍3❤3🆒2👍1🔥1

1.46K views09:03

About

Blog

Apps

Platform