Forwarded from Machinelearning
OpenAI показала GPT-5.6 Sol.
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
•
•
Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
•
max — больше времени на глубокое рассуждение •
ultra — работа через субагентов для сложных процессовПока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
🤔4❤3👍2
Hermes Agent получил Mixture of Agents — виртуального провайдера, собирающего консилиум из моделей
Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
НазываетсяКлуб Что? Где? Когда? Mixture of Agents (MoA),- реализован как полноценный самостоятельный виртуальный провайдер с собственной логикой агрегации результата.
⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через
🦀 Пресеты настраиваются в
Команда
📦 MoA компонуется с остальной экосистемой автоматически:
Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.
Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.
Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.
Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.
#Hermes #MoA #агенты #OpenRouter
———
@tsingular
Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
Называется
⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через
/model, Dashboard или TUI. Hermes запускает reference-модели (например, GPT-5.5 и DeepSeek V4 Pro), они анализируют задачу, а aggregator (скажем, Claude Opus 4.8) пишет финальный ответ и вызывает инструменты. Агентский цикл не ломается: tool calls, follow-up итерации, прерывания, транскрипт — всё работает как с обычной моделью.🦀 Пресеты настраиваются в
config.yaml — можно смешивать провайдеров, задавать отдельно температуру для reference и aggregator, лимитировать токены. Команда
/moa работает как алиас: без аргументов переключает на дефолтный пресет, с именем пресета — на конкретный, с произвольным текстом — выполняет one-shot запрос через MoA и возвращает предыдущую модель.📦 MoA компонуется с остальной экосистемой автоматически:
/goal, gateway-сессии, TUI, Desktop — везде, где выбирается модель. В списке провайдеров появляется отдельная строка Mixture of Agents, а её модели — это ваши пресеты.Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.
Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.
Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.
Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.
#Hermes #MoA #агенты #OpenRouter
———
@tsingular
🔥20❤5🏆2⚡1👍1🤔1👌1
Media is too big
VIEW IN TELEGRAM
Разговоры о будущем с Игорем Никитиным
Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.
Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.
Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.
Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.
Игорь Никитин:
tg: @Nikitinwmt
Rutube | VKVideo | YouTube
Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут
#эфиры #Никитин #WMT
———
@tsingular
Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.
Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.
Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.
Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.
Игорь Никитин:
tg: @Nikitinwmt
Rutube | VKVideo | YouTube
Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут
#эфиры #Никитин #WMT
———
@tsingular
🔥20👍10❤3⚡3🤝1🗿1
Forwarded from Machinelearning
Заявленный прирост throughput: от 51% до 400% в зависимости от модели и случаев использования.
Смысл speculative decoding простой: маленькая или более быстрая модель заранее предлагает несколько следующих токенов, а основная модель проверяет их пачкой. Если предсказание совпадает, генерация идёт быстрее, потому что дорогих проходов большой модели становится меньше.
DeepSeek показывает ускорение не только на своих V4 Flash и Pro, но и на других моделях, включая Gemma и Qwen.
Это потенциально довольно полезный inference-подход для разных open-weight моделей.
Для продакшена это важная история.
Если качество ответа остаётся близким, а throughput растёт в разы, можно обслуживать больше запросов на том же железе или снижать стоимость генерации.
GitHub:
https://github.com/deepseek-ai/DeepSpec
Paper:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
HF:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤3 3⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Если б у меня такая рогатка была бы в детстве, я бы наверное не вырос 😀😃🙂🙃
Не, ну до чего техника дошла.
#юмор #рогатка
------
@tsingular
Не, ну до чего техника дошла.
#юмор #рогатка
------
@tsingular
А я правильно понял, что про рогатки вам интереснее читать, чем про ИИ? 😀
2💯118😁68👍8❤4🙏1
DeepSeek напомнил, что мы используем Preview версию, а полноценный Дипсик мы еще даже не видели, - он выйдет в середине июля и в нем будет еще больше крутых фич и улучшенная производительность.
И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74
#DeepSeek #цены
———
@tsingular
И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74
#DeepSeek #цены
———
@tsingular
👍31✍8🫡6
Media is too big
VIEW IN TELEGRAM
Обещал вчера вам море показать :)
интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)
а то может пора тревел блог заводить... 🤔
#море
———
@tsingular
интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)
а то может пора тревел блог заводить... 🤔
#море
———
@tsingular
1❤82⚡27🔥19🐳12😁4👍3💯1
Akrites: крупнейшая коалиция в истории для защиты открытого кода
📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.
💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.
Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!
Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.
💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».
📎 Ссылки
https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026
#Akrites #OpenSource #CyberSecurity
———
@tsingular
📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.
💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.
Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!
Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.
💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».
📎 Ссылки
https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026
#Akrites #OpenSource #CyberSecurity
———
@tsingular
👍17🔥6⚡3✍2❤1
Forwarded from _rnd
Одной LLM недостаточно, чтобы понять качество AI-агента. На итоговый результат влияет агентский harness — как он управляет инструментами, памятью, сообщениями, восстановлением после ошибок.
Чтобы разобраться в этой теме, мы провели ряд экспериментов. И выкатили в open source Harness Bench — открытый фреймворк для сравнения связок «модель + harness».
А в новой мощной статье на Хабре рассказали про архитектуру фреймворка, адаптацию классических бенчмарков под системы агентов, поделились инженерными находками и результатами сравнений разных связок.
Автор и статьи, и бенчмарка, Андрей Иванов — NLP-инженер в R&D red_mad_robot.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍8✍4⚡2🔥2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Comfy MCP
Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.
Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.
Блогпост
@ai_newz
Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.
Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.
Блогпост
@ai_newz
👍6🔥5❤1⚡1
Google DeepMind выкатили Nano Banana 2 Lite и Gemini Omni Flash
📋 Что произошло
30 июня Google DeepMind выпустила две модели, дополняющие друг друга в процессе «изображение → видео» для разработчиков: Nano Banana 2 Lite — сверхбыстрая генерация изображений, и Gemini Omni Flash — генерация и редактирование видео на естественном языке.
Обе доступны через Gemini API и Google AI Studio, а также в потребительских продуктах Google.
💡 Технические детали
Nano Banana 2 Lite (
Сохраняет стабильность персонажей и читаемый текст на изображениях при минимальной задержке.
Семейство Nano Banana теперь состоит из четырёх моделей: Lite (скорость), Nano Banana 2 (баланс), Pro (точность для сложных задач), и устаревшая первая версия.
Gemini Omni Flash (
Генерирует 10-секундные ролики за $0,10/сек, поддерживает итеративное редактирование на естественном языке, мультимодальные ссылки (текст + изображение + видео на вход) и синхронизацию текста с действием в кадре.
Известные ограничения: аудио-референсы и расширение сцен пока не работают, стабильность персонажей при смене ракурса требует доработки.
Google по сути выдал элементы сквозного анимационного пайплайна: быстрая итерация изображений в Nano Banana 2 Lite → передача как референса в Omni Flash → анимация.
Interactions API поддерживает до трёх последовательных правок в одной сессии.
Все выдачи маркируются SynthID.
#Gemini #GoogleDeepMind #AI
———
@tsingular
📋 Что произошло
30 июня Google DeepMind выпустила две модели, дополняющие друг друга в процессе «изображение → видео» для разработчиков: Nano Banana 2 Lite — сверхбыстрая генерация изображений, и Gemini Omni Flash — генерация и редактирование видео на естественном языке.
Обе доступны через Gemini API и Google AI Studio, а также в потребительских продуктах Google.
💡 Технические детали
Nano Banana 2 Lite (
gemini-3.1-flash-lite-image) — прямая замена первого поколения: ~4 секунды на генерацию, $0,034 за изображение в 1К разрешении. Сохраняет стабильность персонажей и читаемый текст на изображениях при минимальной задержке.
Семейство Nano Banana теперь состоит из четырёх моделей: Lite (скорость), Nano Banana 2 (баланс), Pro (точность для сложных задач), и устаревшая первая версия.
Gemini Omni Flash (
gemini-omni-flash-preview) — первый выход видео-модели Google в публичный API. Генерирует 10-секундные ролики за $0,10/сек, поддерживает итеративное редактирование на естественном языке, мультимодальные ссылки (текст + изображение + видео на вход) и синхронизацию текста с действием в кадре.
Известные ограничения: аудио-референсы и расширение сцен пока не работают, стабильность персонажей при смене ракурса требует доработки.
Google по сути выдал элементы сквозного анимационного пайплайна: быстрая итерация изображений в Nano Banana 2 Lite → передача как референса в Omni Flash → анимация.
Interactions API поддерживает до трёх последовательных правок в одной сессии.
Все выдачи маркируются SynthID.
#Gemini #GoogleDeepMind #AI
———
@tsingular
🔥7🆒3⚡1
Forwarded from Machinelearning
Anthropic выкатила Claude Sonnet 5 — самый «агентный» Sonnet в линейке.
Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.
По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.
Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.
Цена для разработчиков до 31 августа 2026:
• $2 за 1 млн input tokens
• $10 за 1 млн output tokens
Потом стандартная цена:
• $3 за input
• $15 за output
Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.
По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.
https://www.anthropic.com/news/claude-sonnet-5
Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.
По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.
Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.
Цена для разработчиков до 31 августа 2026:
• $2 за 1 млн input tokens
• $10 за 1 млн output tokens
Потом стандартная цена:
• $3 за input
• $15 за output
Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.
По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.
https://www.anthropic.com/news/claude-sonnet-5
👍11⚡6🔥2❤1👌1