Forwarded from Machinelearning
OpenAI показала GPT-5.6 Sol.
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
•
•
Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
•
max — больше времени на глубокое рассуждение •
ultra — работа через субагентов для сложных процессовПока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
🤔4❤3👍2
Hermes Agent получил Mixture of Agents — виртуального провайдера, собирающего консилиум из моделей
Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
НазываетсяКлуб Что? Где? Когда? Mixture of Agents (MoA),- реализован как полноценный самостоятельный виртуальный провайдер с собственной логикой агрегации результата.
⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через
🦀 Пресеты настраиваются в
Команда
📦 MoA компонуется с остальной экосистемой автоматически:
Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.
Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.
Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.
Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.
#Hermes #MoA #агенты #OpenRouter
———
@tsingular
Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
Называется
⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через
/model, Dashboard или TUI. Hermes запускает reference-модели (например, GPT-5.5 и DeepSeek V4 Pro), они анализируют задачу, а aggregator (скажем, Claude Opus 4.8) пишет финальный ответ и вызывает инструменты. Агентский цикл не ломается: tool calls, follow-up итерации, прерывания, транскрипт — всё работает как с обычной моделью.🦀 Пресеты настраиваются в
config.yaml — можно смешивать провайдеров, задавать отдельно температуру для reference и aggregator, лимитировать токены. Команда
/moa работает как алиас: без аргументов переключает на дефолтный пресет, с именем пресета — на конкретный, с произвольным текстом — выполняет one-shot запрос через MoA и возвращает предыдущую модель.📦 MoA компонуется с остальной экосистемой автоматически:
/goal, gateway-сессии, TUI, Desktop — везде, где выбирается модель. В списке провайдеров появляется отдельная строка Mixture of Agents, а её модели — это ваши пресеты.Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.
Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.
Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.
Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.
#Hermes #MoA #агенты #OpenRouter
———
@tsingular
🔥20❤5🏆2⚡1👍1🤔1👌1
Media is too big
VIEW IN TELEGRAM
Разговоры о будущем с Игорем Никитиным
Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.
Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.
Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.
Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.
Игорь Никитин:
tg: @Nikitinwmt
Rutube | VKVideo | YouTube
Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут
#эфиры #Никитин #WMT
———
@tsingular
Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.
Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.
Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.
Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.
Игорь Никитин:
tg: @Nikitinwmt
Rutube | VKVideo | YouTube
Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут
#эфиры #Никитин #WMT
———
@tsingular
🔥20👍10❤3⚡3🤝1🗿1
Forwarded from Machinelearning
Заявленный прирост throughput: от 51% до 400% в зависимости от модели и случаев использования.
Смысл speculative decoding простой: маленькая или более быстрая модель заранее предлагает несколько следующих токенов, а основная модель проверяет их пачкой. Если предсказание совпадает, генерация идёт быстрее, потому что дорогих проходов большой модели становится меньше.
DeepSeek показывает ускорение не только на своих V4 Flash и Pro, но и на других моделях, включая Gemma и Qwen.
Это потенциально довольно полезный inference-подход для разных open-weight моделей.
Для продакшена это важная история.
Если качество ответа остаётся близким, а throughput растёт в разы, можно обслуживать больше запросов на том же железе или снижать стоимость генерации.
GitHub:
https://github.com/deepseek-ai/DeepSpec
Paper:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
HF:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥17❤3 3⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Если б у меня такая рогатка была бы в детстве, я бы наверное не вырос 😀😃🙂🙃
Не, ну до чего техника дошла.
#юмор #рогатка
------
@tsingular
Не, ну до чего техника дошла.
#юмор #рогатка
------
@tsingular
А я правильно понял, что про рогатки вам интереснее читать, чем про ИИ? 😀
2💯118😁68👍8❤4🙏1
DeepSeek напомнил, что мы используем Preview версию, а полноценный Дипсик мы еще даже не видели, - он выйдет в середине июля и в нем будет еще больше крутых фич и улучшенная производительность.
И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74
#DeepSeek #цены
———
@tsingular
И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74
#DeepSeek #цены
———
@tsingular
👍31✍8🫡6
Media is too big
VIEW IN TELEGRAM
Обещал вчера вам море показать :)
интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)
а то может пора тревел блог заводить... 🤔
#море
———
@tsingular
интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)
а то может пора тревел блог заводить... 🤔
#море
———
@tsingular
1❤82⚡27🔥19🐳12😁4👍3💯1
Akrites: крупнейшая коалиция в истории для защиты открытого кода
📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.
💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.
Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!
Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.
💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».
📎 Ссылки
https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026
#Akrites #OpenSource #CyberSecurity
———
@tsingular
📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.
💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.
Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!
Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.
💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».
📎 Ссылки
https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026
#Akrites #OpenSource #CyberSecurity
———
@tsingular
👍17🔥6⚡3✍2❤1
Forwarded from _rnd
Одной LLM недостаточно, чтобы понять качество AI-агента. На итоговый результат влияет агентский harness — как он управляет инструментами, памятью, сообщениями, восстановлением после ошибок.
Чтобы разобраться в этой теме, мы провели ряд экспериментов. И выкатили в open source Harness Bench — открытый фреймворк для сравнения связок «модель + harness».
А в новой мощной статье на Хабре рассказали про архитектуру фреймворка, адаптацию классических бенчмарков под системы агентов, поделились инженерными находками и результатами сравнений разных связок.
Автор и статьи, и бенчмарка, Андрей Иванов — NLP-инженер в R&D red_mad_robot.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍8✍4⚡2🔥2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Comfy MCP
Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.
Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.
Блогпост
@ai_newz
Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.
Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.
Блогпост
@ai_newz
👍6🔥5❤1⚡1
Google DeepMind выкатили Nano Banana 2 Lite и Gemini Omni Flash
📋 Что произошло
30 июня Google DeepMind выпустила две модели, дополняющие друг друга в процессе «изображение → видео» для разработчиков: Nano Banana 2 Lite — сверхбыстрая генерация изображений, и Gemini Omni Flash — генерация и редактирование видео на естественном языке.
Обе доступны через Gemini API и Google AI Studio, а также в потребительских продуктах Google.
💡 Технические детали
Nano Banana 2 Lite (
Сохраняет стабильность персонажей и читаемый текст на изображениях при минимальной задержке.
Семейство Nano Banana теперь состоит из четырёх моделей: Lite (скорость), Nano Banana 2 (баланс), Pro (точность для сложных задач), и устаревшая первая версия.
Gemini Omni Flash (
Генерирует 10-секундные ролики за $0,10/сек, поддерживает итеративное редактирование на естественном языке, мультимодальные ссылки (текст + изображение + видео на вход) и синхронизацию текста с действием в кадре.
Известные ограничения: аудио-референсы и расширение сцен пока не работают, стабильность персонажей при смене ракурса требует доработки.
Google по сути выдал элементы сквозного анимационного пайплайна: быстрая итерация изображений в Nano Banana 2 Lite → передача как референса в Omni Flash → анимация.
Interactions API поддерживает до трёх последовательных правок в одной сессии.
Все выдачи маркируются SynthID.
#Gemini #GoogleDeepMind #AI
———
@tsingular
📋 Что произошло
30 июня Google DeepMind выпустила две модели, дополняющие друг друга в процессе «изображение → видео» для разработчиков: Nano Banana 2 Lite — сверхбыстрая генерация изображений, и Gemini Omni Flash — генерация и редактирование видео на естественном языке.
Обе доступны через Gemini API и Google AI Studio, а также в потребительских продуктах Google.
💡 Технические детали
Nano Banana 2 Lite (
gemini-3.1-flash-lite-image) — прямая замена первого поколения: ~4 секунды на генерацию, $0,034 за изображение в 1К разрешении. Сохраняет стабильность персонажей и читаемый текст на изображениях при минимальной задержке.
Семейство Nano Banana теперь состоит из четырёх моделей: Lite (скорость), Nano Banana 2 (баланс), Pro (точность для сложных задач), и устаревшая первая версия.
Gemini Omni Flash (
gemini-omni-flash-preview) — первый выход видео-модели Google в публичный API. Генерирует 10-секундные ролики за $0,10/сек, поддерживает итеративное редактирование на естественном языке, мультимодальные ссылки (текст + изображение + видео на вход) и синхронизацию текста с действием в кадре.
Известные ограничения: аудио-референсы и расширение сцен пока не работают, стабильность персонажей при смене ракурса требует доработки.
Google по сути выдал элементы сквозного анимационного пайплайна: быстрая итерация изображений в Nano Banana 2 Lite → передача как референса в Omni Flash → анимация.
Interactions API поддерживает до трёх последовательных правок в одной сессии.
Все выдачи маркируются SynthID.
#Gemini #GoogleDeepMind #AI
———
@tsingular
🔥7🆒3⚡1
Forwarded from Machinelearning
Anthropic выкатила Claude Sonnet 5 — самый «агентный» Sonnet в линейке.
Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.
По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.
Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.
Цена для разработчиков до 31 августа 2026:
• $2 за 1 млн input tokens
• $10 за 1 млн output tokens
Потом стандартная цена:
• $3 за input
• $15 за output
Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.
По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.
https://www.anthropic.com/news/claude-sonnet-5
Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.
По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.
Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.
Цена для разработчиков до 31 августа 2026:
• $2 за 1 млн input tokens
• $10 за 1 млн output tokens
Потом стандартная цена:
• $3 за input
• $15 за output
Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.
По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.
https://www.anthropic.com/news/claude-sonnet-5
👍11⚡6🔥2❤1👌1
Palantir и NVIDIA запускают «движок» для развёртывания открытых моделей Nemotron в изолированных средах американских госорганов
🇺🇸 Palantir Technologies и NVIDIA 29 июня анонсировали стратегическое партнёрство: «интеллектуальный движок» (intelligent engine) для запуска открытых моделей NVIDIA Nemotron в суверенных средах — секретных, физически изолированных и прочих контурах, куда модели не пускают по определению.
⚙️ Архитектура объединяет AI-платформу NVIDIA (вычислительные мощности, экосистема, открытые модели) и инфраструктурный стек Palantir: AIP, Ontology, Foundry, Apollo. Три слоя инжиниринга: развёртывание кастомных Nemotron в изолированных средах, оптимизация контекста и промптов под боевые задачи, и самое интересное — самообучение моделей на основе собственных данных, результатов миссий и телеметрии пользователей.
🔄 Самообучение моделей: телеметрия и трейсы пользователей собираются и используются для дообучения и выравнивания модели под конкретные операционные задачи заказчика.
Заказчик получает не статичную модель, а самоулучшающуюся, заточенную непосредственно под свою миссию.
🔐 Ключевые возможности безопасности: явная авторизация данных, архитектурная изоляция под каждого заказчика, переносимость данных, право на удаление, полная аудируемость.
Алекс Карп, CEO Palantir: «Это позволит правительству США использовать всю мощь LLM, убрав риски утечки чувствительных инсайтов в веса закрытых моделей».
📦 Дженсен Хуан, CEO NVIDIA, назвал открытый ИИ «фундаментом национальной безопасности и технологического лидерства США».
Инициатива строится на ранее анонсированной архитектуре Sovereign AI Operating System — совместной разработке Palantir и NVIDIA.
#Palantir #NVIDIA #Nemotron
———
@tsingular
🇺🇸 Palantir Technologies и NVIDIA 29 июня анонсировали стратегическое партнёрство: «интеллектуальный движок» (intelligent engine) для запуска открытых моделей NVIDIA Nemotron в суверенных средах — секретных, физически изолированных и прочих контурах, куда модели не пускают по определению.
⚙️ Архитектура объединяет AI-платформу NVIDIA (вычислительные мощности, экосистема, открытые модели) и инфраструктурный стек Palantir: AIP, Ontology, Foundry, Apollo. Три слоя инжиниринга: развёртывание кастомных Nemotron в изолированных средах, оптимизация контекста и промптов под боевые задачи, и самое интересное — самообучение моделей на основе собственных данных, результатов миссий и телеметрии пользователей.
🔄 Самообучение моделей: телеметрия и трейсы пользователей собираются и используются для дообучения и выравнивания модели под конкретные операционные задачи заказчика.
Заказчик получает не статичную модель, а самоулучшающуюся, заточенную непосредственно под свою миссию.
🔐 Ключевые возможности безопасности: явная авторизация данных, архитектурная изоляция под каждого заказчика, переносимость данных, право на удаление, полная аудируемость.
Алекс Карп, CEO Palantir: «Это позволит правительству США использовать всю мощь LLM, убрав риски утечки чувствительных инсайтов в веса закрытых моделей».
📦 Дженсен Хуан, CEO NVIDIA, назвал открытый ИИ «фундаментом национальной безопасности и технологического лидерства США».
Инициатива строится на ранее анонсированной архитектуре Sovereign AI Operating System — совместной разработке Palantir и NVIDIA.
#Palantir #NVIDIA #Nemotron
———
@tsingular
2🤔4⚡3🔥3✍1
Forwarded from НИИ ИИ
This media is not supported in your browser
VIEW IN TELEGRAM
NotebookLM научился делать короткие видео из ваших источников
Google выкатил в NotebookLM новую функцию: Short Video Overviews. Загружаете статью, PDF или свои заметки — и получаете вертикальный ролик на 60 секунд с разбором сути. Формат сделан специально под то, как мы сейчас потребляем контент: скроллим шортсы, но хотим при этом чему-то учиться, а не просто убивать время. Поколению TikTok такая механика точно понравится: привычка к коротким видео наконец приносит пользу, ведь такой формат помогает учиться на ходу.
Пока доступно подписчикам Google AI Ultra и Pro на мобильном и вебе, для бесплатных аккаунтов функцию обещают открыть позже.
Мне нравится сама идея. Если вы уже используете NotebookLM как рабочий инструмент для разбора источников (я уже писал, как вытянуть из него максимум), видео-формат — ещё один способ прогнать материал через голову: сначала аудио-обзор, потом mind map, а теперь и короткое видео. Три формата на один и тот же контент почти бесплатно.
Практическая польза тут не в развлечении, а в скорости. Когда нужно быстро вспомнить содержание длинного отчёта перед встречей или дать команде выжимку без часового чтения, 60 секунд видео решают задачу быстрее, чем текстовое саммари, которое всё равно придётся читать.
Минус — это пока платная фича в пакете Google AI и пока только на английском языке. Но у Google подобные функции обычно доезжают до бесплатных пользователей в течение пары месяцев. Надеюсь, русский язык тоже появится.
pimenov.ai
Google выкатил в NotebookLM новую функцию: Short Video Overviews. Загружаете статью, PDF или свои заметки — и получаете вертикальный ролик на 60 секунд с разбором сути. Формат сделан специально под то, как мы сейчас потребляем контент: скроллим шортсы, но хотим при этом чему-то учиться, а не просто убивать время. Поколению TikTok такая механика точно понравится: привычка к коротким видео наконец приносит пользу, ведь такой формат помогает учиться на ходу.
Пока доступно подписчикам Google AI Ultra и Pro на мобильном и вебе, для бесплатных аккаунтов функцию обещают открыть позже.
Мне нравится сама идея. Если вы уже используете NotebookLM как рабочий инструмент для разбора источников (я уже писал, как вытянуть из него максимум), видео-формат — ещё один способ прогнать материал через голову: сначала аудио-обзор, потом mind map, а теперь и короткое видео. Три формата на один и тот же контент почти бесплатно.
Практическая польза тут не в развлечении, а в скорости. Когда нужно быстро вспомнить содержание длинного отчёта перед встречей или дать команде выжимку без часового чтения, 60 секунд видео решают задачу быстрее, чем текстовое саммари, которое всё равно придётся читать.
Минус — это пока платная фича в пакете Google AI и пока только на английском языке. Но у Google подобные функции обычно доезжают до бесплатных пользователей в течение пары месяцев. Надеюсь, русский язык тоже появится.
pimenov.ai
✍6⚡2👍2
Huawei выпустила OpenPangu 2.0 Flash — 92B MoE на чипах Ascend, open source близкий к DeepSeek V4 Flash и Claude Sonnet 5
📋 30 июня Huawei опубликовала OpenPangu 2.0 Flash — 92B MoE (6B активных), полностью обученный на чипах Ascend, с 512K контекста и 34T токенов предобучения.
Huawei выделила openPangu в отдельный open-source-бренд и анонсировала выпуск семи версий до конца года.
При 6B активных параметров и MTP на 3 токена вперёд OpenPangu набирает 93,3% на AIME 2026 (98,1% с Python) — уровень, для которого ещё год назад требовались модели с на порядок большей активной частью.
По кодингу (SWE-bench 63,1%) отставание от DeepSeek V4 Flash (79,0%) и Sonnet-5 пока заметное, но по агентным задачам (TAU2-Bench 88,0%) и следованию инструкциям (IFEval 95,9%) модель вполне конкурентоспособна.
📎 Hugging Face | Репозиторий openPangu
#Huawei #OpenPangu #Ascend
———
@tsingular
📋 30 июня Huawei опубликовала OpenPangu 2.0 Flash — 92B MoE (6B активных), полностью обученный на чипах Ascend, с 512K контекста и 34T токенов предобучения.
Huawei выделила openPangu в отдельный open-source-бренд и анонсировала выпуск семи версий до конца года.
При 6B активных параметров и MTP на 3 токена вперёд OpenPangu набирает 93,3% на AIME 2026 (98,1% с Python) — уровень, для которого ещё год назад требовались модели с на порядок большей активной частью.
По кодингу (SWE-bench 63,1%) отставание от DeepSeek V4 Flash (79,0%) и Sonnet-5 пока заметное, но по агентным задачам (TAU2-Bench 88,0%) и следованию инструкциям (IFEval 95,9%) модель вполне конкурентоспособна.
📎 Hugging Face | Репозиторий openPangu
#Huawei #OpenPangu #Ascend
———
@tsingular
⚡6✍3❤3🆒2👍1🔥1