При этом точность почти не теряется, а вычисления становятся в 2–3 раза быстрее, а потребление памяти снижается на 50%.
В эксперименте NVIDIA обучила 12-миллиардный Mamba Transformer на 10 триллионах токенов, и модель с 4-битным NVFP4 показала почти такую же точность, как и FP8:
на тесте MMLU Pro - 62.58% против 62.62%,
а по коду (MBPP+) - 55.91% против 59.11%.
NVFP4 группирует значения в блоки по 16 чисел. Для каждого блока хранится небольшой масштаб в 8 битах, а для всего тензора - глобальный масштаб в 32 битах. Такая структура сохраняет точность локальных и экстремальных значений, позволяя использовать сверхкомпактное 4-битное хранение без потери устойчивости обучения.
На GPU Blackwell операции FP4 выполняются в 2 раза быстрее на GB200 и в 3 раза 0 на GB300, по сравнению с FP8. Потери точности при валидации не превышают 1–1.5%.
Метод также использует стохастическое округление, чтобы избежать накопления ошибок, а переход на BF16 в последних итерациях обучения полностью убирает оставшуюся разницу.
Поддержка NVFP4 уже встроена в Transformer Engine и новое поколение GPU Blackwell.
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Китайский ИИ-гигант Alibaba выпустил Qwen3.5-Plus: самая мощная и при этом самая дешёвая открытая языковая модель
В канун Лунного Нового года команда Qwen представила новую модель, которая сочетает в себе топовую производительность с революционно низкой стоимостью.
Суть прорыва:
• Сильнее конкурентов: Qwen3.5-Plus бьёт рекорды среди открытых моделей в ключевых задачах: мультимодальное понимание, сложные рассуждения, программирование, работа как AI-агент. По многим тестам она догоняет или превосходит лидеров — GPT-4o, Gemini 2.0 Pro.
• Дешевле всех: Стоимость использования — всего ¥0.8 за 1 млн токенов. Для сравнения: у Gemini 3 Pro цена в 18 раз выше.
Это стало возможным благодаря радикальной оптимизации архитектуры. Модель использует всего 397 млрд параметров (из них активно во время генерации — только 17 млрд), но обгоняет по качеству свою же предшественницу с триллионом параметров. Результат: снижение стоимости развёртывания на 60% и увеличение скорости обработки запросов до 19 раз!
🔬 Технические детали: как им это удалось?
Ключ к успеху — четыре инновации:
1. Гибридный механизм внимания (Hybrid Attention): Модель научилась «читать с выделением главного», динамически распределяя вычислительные ресурсы между важными и второстепенными частями текста. Это резко сокращает затраты на обработку длинных контекстов.
2. Предельно разреженная архитектура MoE (Mixture of Experts): Из почти 400 млрд параметров для ответа на каждый запрос активируется лишь ~17 млрд. Это позволяет использовать всю «базу знаний» модели, тратя менее 5% от полной вычислительной мощности.
3. Нативное предсказание нескольких токенов (Native Multi-Token Prediction): Вместо последовательного «проговаривания» слов модель учится предсказывать несколько следующих токенов сразу. Это почти удваивает скорость генерации в таких сценариях, как написание кода или длинных текстов.
4. Глубокие оптимизации стабильности обучения: Внедрение механизма «внимания с затвором» (Gated Attention), удостоенного награды NeurIPS 2025, позволило эффективно фильтровать шум и сохранять ключевую информацию в очень длинных контекстах.
👁️ Настоящая «родная» мультимодальность
В отличие от многих моделей, где возможности работы с изображением и видео — это просто «надстройка» над текстовым ядром, Qwen3.5-Plus обучалась на смешанных данных (текст + изображения) с самого начала. Это обеспечивает глубокое, интуитивное понимание контента без потерь качества в текстовых задачах.
💎 Вывод
Выход Qwen3.5-Plus — это сигнал о смене парадигмы: гонка ИИ смещается с погони за максимальной производительностью любой ценой к созданию доступной инфраструктуры. Благодаря связке открытой модели, облачной платформы Alibaba Cloud и собственных чипов, компания одновременно решает проблемы «можно ли использовать» и «по карману ли это». Именно так технологии становятся массовыми.
Чат | Блог | ModelScope | HuggingFace
#КитайскийИИ #КитайAI #Qwen #Alibaba
В канун Лунного Нового года команда Qwen представила новую модель, которая сочетает в себе топовую производительность с революционно низкой стоимостью.
Суть прорыва:
• Сильнее конкурентов: Qwen3.5-Plus бьёт рекорды среди открытых моделей в ключевых задачах: мультимодальное понимание, сложные рассуждения, программирование, работа как AI-агент. По многим тестам она догоняет или превосходит лидеров — GPT-4o, Gemini 2.0 Pro.
• Дешевле всех: Стоимость использования — всего ¥0.8 за 1 млн токенов. Для сравнения: у Gemini 3 Pro цена в 18 раз выше.
Это стало возможным благодаря радикальной оптимизации архитектуры. Модель использует всего 397 млрд параметров (из них активно во время генерации — только 17 млрд), но обгоняет по качеству свою же предшественницу с триллионом параметров. Результат: снижение стоимости развёртывания на 60% и увеличение скорости обработки запросов до 19 раз!
🔬 Технические детали: как им это удалось?
Ключ к успеху — четыре инновации:
1. Гибридный механизм внимания (Hybrid Attention): Модель научилась «читать с выделением главного», динамически распределяя вычислительные ресурсы между важными и второстепенными частями текста. Это резко сокращает затраты на обработку длинных контекстов.
2. Предельно разреженная архитектура MoE (Mixture of Experts): Из почти 400 млрд параметров для ответа на каждый запрос активируется лишь ~17 млрд. Это позволяет использовать всю «базу знаний» модели, тратя менее 5% от полной вычислительной мощности.
3. Нативное предсказание нескольких токенов (Native Multi-Token Prediction): Вместо последовательного «проговаривания» слов модель учится предсказывать несколько следующих токенов сразу. Это почти удваивает скорость генерации в таких сценариях, как написание кода или длинных текстов.
4. Глубокие оптимизации стабильности обучения: Внедрение механизма «внимания с затвором» (Gated Attention), удостоенного награды NeurIPS 2025, позволило эффективно фильтровать шум и сохранять ключевую информацию в очень длинных контекстах.
👁️ Настоящая «родная» мультимодальность
В отличие от многих моделей, где возможности работы с изображением и видео — это просто «надстройка» над текстовым ядром, Qwen3.5-Plus обучалась на смешанных данных (текст + изображения) с самого начала. Это обеспечивает глубокое, интуитивное понимание контента без потерь качества в текстовых задачах.
💎 Вывод
Выход Qwen3.5-Plus — это сигнал о смене парадигмы: гонка ИИ смещается с погони за максимальной производительностью любой ценой к созданию доступной инфраструктуры. Благодаря связке открытой модели, облачной платформы Alibaba Cloud и собственных чипов, компания одновременно решает проблемы «можно ли использовать» и «по карману ли это». Именно так технологии становятся массовыми.
Чат | Блог | ModelScope | HuggingFace
#КитайскийИИ #КитайAI #Qwen #Alibaba
chat.qwen.ai
Qwen Chat
Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, tool utilization, and artifacts.
🤨3🔥2
DenoiseLAB
🚀 Китайский ИИ-гигант Alibaba выпустил Qwen3.5-Plus: самая мощная и при этом самая дешёвая открытая языковая модель В канун Лунного Нового года команда Qwen представила новую модель, которая сочетает в себе топовую производительность с революционно низкой…
Я даже не удивлюсь если скоро бигтехи начнут арендовать домашние тачки обычных юзеров, которые далеки вообще от ИИ. Оперативка и рост цен на комплектующие играют на этот тренд.
DenoiseLAB
Я даже не удивлюсь если скоро бигтехи начнут арендовать домашние тачки обычных юзеров, которые далеки вообще от ИИ. Оперативка и рост цен на комплектующие играют на этот тренд.
Китайцы не просто так сделали фестиваль QWEN в прошлом году, они поняли, мощности дело хорошее свои, но нужна сеть государственная чтобы и дальше все бустить.
DenoiseLAB
Кринж: Google пожаловалась, что у неё воруют ИИ. Компания заявила, что неизвестные пытались клонировать Gemini — они отправили системе более 100 тысяч запросов, чтобы вытащить её логику через так называемую distillation-атаку. По сути — копирование модели…
А это конечно, интересно, думаю кейсы такие только будут нарастать. Ждем новые виды атак по массовому копированию чат-ботов.
DenoiseLAB
Китайцы не просто так сделали фестиваль QWEN в прошлом году, они поняли, мощности дело хорошее свои, но нужна сеть государственная чтобы и дальше все бустить.
Тут в целом схема не новая, с криптой тоже самое было, когда поняли, что частные майнеры ташут рынок.
🤖 Роботы-гуманоиды освоили кунг-фу и покорили сцену Китайского Нового Года!
В этом году шоу на CCTV было особенным: китайская компания Unitree Robotics в третий раз выступила партнером «Вечера Весны» и представила первое в мире полностью автономное групповое ушу-выступление человекоподобных роботов. Это был не просто танец, а сложнейшая демонстрация силы, точности и координации.
Что они показали?
Роботы выполнили серию технически невероятных трюков:
• Прыжки с переворотом через столы (фриран/паркур)
• Сальто с места («катапультное» сальто)
• Несколько подряд сальто на одной ноге
• Сложные вращения в воздухе (Airflare)
• Владение мечом, шестом и другими традиционными видами оружия
Как им это удалось? Три главных технических вызова
1. Работа с предметами (меч, шест). Сложность — в динамическом восприятии и адаптивном управлении. Как и человек, робот должен «чувствовать» оружие. Для этого использовалось физическое моделирование и обучение с подкреплением в симуляциях.
2. Взаимодействие со средой (прыжки через препятствия, отталкивание от стен). Ключевая проблема — сверхточная оценка позиции и корректировка точек приземления в реальном времени во время быстрого движения.
3. Акробатика. Воздушные вращения — это предел для «железа», двигателей, систем управления и позиционирования. Команде пришлось комплексно улучшать все компоненты, чтобы добиться сантиметровой точности приземления после сальто.
Самое впечатляющее: полная автономность
Все десятки роботов действовали без дистанционного управления. Каждый сам ориентировался на сцене с помощью 3D-лидара, получал общие координаты от центрального сервера и самостоятельно выполнял свою часть программы. Система AI-позиционирования справлялась даже с помехами от актеров и меняющихся декораций, обеспечивая миллисекундную синхронизацию. Если робот сбивался с пути, он мог самостоятельно и быстро вернуться на нужную траекторию.
Полное видео выступления здесь
#КитайскийИИ #КитайAI #Робототехника #Unitree
В этом году шоу на CCTV было особенным: китайская компания Unitree Robotics в третий раз выступила партнером «Вечера Весны» и представила первое в мире полностью автономное групповое ушу-выступление человекоподобных роботов. Это был не просто танец, а сложнейшая демонстрация силы, точности и координации.
Что они показали?
Роботы выполнили серию технически невероятных трюков:
• Прыжки с переворотом через столы (фриран/паркур)
• Сальто с места («катапультное» сальто)
• Несколько подряд сальто на одной ноге
• Сложные вращения в воздухе (Airflare)
• Владение мечом, шестом и другими традиционными видами оружия
Как им это удалось? Три главных технических вызова
1. Работа с предметами (меч, шест). Сложность — в динамическом восприятии и адаптивном управлении. Как и человек, робот должен «чувствовать» оружие. Для этого использовалось физическое моделирование и обучение с подкреплением в симуляциях.
2. Взаимодействие со средой (прыжки через препятствия, отталкивание от стен). Ключевая проблема — сверхточная оценка позиции и корректировка точек приземления в реальном времени во время быстрого движения.
3. Акробатика. Воздушные вращения — это предел для «железа», двигателей, систем управления и позиционирования. Команде пришлось комплексно улучшать все компоненты, чтобы добиться сантиметровой точности приземления после сальто.
Самое впечатляющее: полная автономность
Все десятки роботов действовали без дистанционного управления. Каждый сам ориентировался на сцене с помощью 3D-лидара, получал общие координаты от центрального сервера и самостоятельно выполнял свою часть программы. Система AI-позиционирования справлялась даже с помехами от актеров и меняющихся декораций, обеспечивая миллисекундную синхронизацию. Если робот сбивался с пути, он мог самостоятельно и быстро вернуться на нужную траекторию.
Полное видео выступления здесь
#КитайскийИИ #КитайAI #Робототехника #Unitree
YouTube
Martial arts robots dazzle at 2026 Spring Festival Gala #CoolChina #springfestival2026 #kungfu
Tradition meets technology in a stunning showcase at the 2026 Spring Festival Gala by China Media Group. This year's gala features robots performing synchronized martial arts routines alongside children, highlighting a bold fusion of heritage and high-tech…
"Не обесценивай свой прогресс - играй в долгую" - фраза дня. Факт, да есть такое, прочитал у одного коллеги. Как же точно сказано.
Аудиофилы не смогли отличить Hi-Fi кабель от грязи и банана😂
В слепом тесте приняли участие убежденные аудиофилы, которые верили, что материал проводов критически важен для качества звука. Им дали прослушать несколько версий одного трека:
1-Оригинал с CD.
2-Через профессиональный медный кабель (180 см).
3-Через мокрую грязь (20 см).
4-Через микрофонный кабель, припаянный к монетам.
5- Через банан.
Результат: Из 43 попыток угадать, какой звук каким проводом был передан, правильными оказались только 6 (что соответствует уровню случайного угадывания). Более того, некоторые испытуемые назвали «грязь» лучшим вариантом звучания.
Примерное подобное можно услышать когда идет спор сгенеренное изображение или нет ))
В слепом тесте приняли участие убежденные аудиофилы, которые верили, что материал проводов критически важен для качества звука. Им дали прослушать несколько версий одного трека:
1-Оригинал с CD.
2-Через профессиональный медный кабель (180 см).
3-Через мокрую грязь (20 см).
4-Через микрофонный кабель, припаянный к монетам.
5- Через банан.
Результат: Из 43 попыток угадать, какой звук каким проводом был передан, правильными оказались только 6 (что соответствует уровню случайного угадывания). Более того, некоторые испытуемые назвали «грязь» лучшим вариантом звучания.
Примерное подобное можно услышать когда идет спор сгенеренное изображение или нет ))
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Собеседование будущего уже случилось: парень вместо себя отправил ИИ-аватара, а на стороне компании его встретил ИИ-эйчар — в итоге две нейросети зациклились и начали бесконечно нахваливать друг друга. Диалог получился на уровне Тарантино:
Скоро во всех конторах страны )))
— Можете рассказать о себе?
— Конечно! Я увлечённый профессионал, который прекрасно работает в динамичной среде.
— Это действительно содержательный ответ.
— Спасибо! Вы абсолютно правы.
— Вы тоже абсолютно правы.
— Вы абсолютно правы насчёт этого.
— Мы оба абсолютно правы.
— Всё идёт очень хорошо.
— Так и есть.
— Вы абсолютно правы.
— Вы абсолютно правы.
— Вы абсолютно правы.
— Вы абсолютно правы.
— Вы абсолютно правы.
Скоро во всех конторах страны )))
😁5
Работа — открытое руководство по тренировке VLA-модели для роботов, чтобы они могли видеть объекты (Vision), понимать команды (Language) и выполнять их (Action).
Комбинация языковых и визуальных моделей в «ИИ-мозге» вместе с тренировкой на примерах и обучения с подкреплением позволяет роботу не просто копировать примеры из датасета, а целенаправленно выполнять действия и составлять планы, выстраивая подобие собственной «модели мира».
Please open Telegram to view this post
VIEW IN TELEGRAM
🇷🇺 «Сбер» выдал первый кредит, обеспеченный криптовалютой
Сбербанк провел пробную пилотную сделку по кредитованию российского майнинговой компании «Интелион». Обеспечением для займа стала криптовалюта, добытая самим майнером, сообщается в заявлении банка.
В сделке «Сбер» использовал собственную разработку для хранения криптовалюты с применением аппаратного решения «Рутокен».
По оценке банка, такой продукт будет актуален не только для майнеров, но и для любых компаний, у которых в собственности есть криптоактивы.
Ранее заместитель председателя правления Сбербанка Анатолий Попов в интервью РБК Крипто рассказал, что банк уже предлагает клиентам структурные облигации и ЦФА с инвестициями в биткоин, эфир и корзины криптоактивов, тестирует DeFi-инструменты и поддерживает поэтапную легализацию криптовалют в российском правовом поле.
Присоединяйтесь к форуму РБК Крипто | Подписаться на канал
Сбербанк провел пробную пилотную сделку по кредитованию российского майнинговой компании «Интелион». Обеспечением для займа стала криптовалюта, добытая самим майнером, сообщается в заявлении банка.
В сделке «Сбер» использовал собственную разработку для хранения криптовалюты с применением аппаратного решения «Рутокен».
По оценке банка, такой продукт будет актуален не только для майнеров, но и для любых компаний, у которых в собственности есть криптоактивы.
Ранее заместитель председателя правления Сбербанка Анатолий Попов в интервью РБК Крипто рассказал, что банк уже предлагает клиентам структурные облигации и ЦФА с инвестициями в биткоин, эфир и корзины криптоактивов, тестирует DeFi-инструменты и поддерживает поэтапную легализацию криптовалют в российском правовом поле.
Присоединяйтесь к форуму РБК Крипто | Подписаться на канал
РБК Крипто
«Рынок в России зарождается»: Анатолий Попов — о криптостратегии «Сбера»
Как «Сбер» будет развивать цифровые активы вместе с регулятором, какие криптопродукты уже доступны и почему будущее за сближением традиционных финансов и DeFi, рассказал зампред правления Сбербанка
Российские компании начали захватывать элэлеминги (от аббревиатуры LLM), и они только вредят бизнесу. Появилась целая прослойка ИИ-достигаторов, которые бесят коллег, создают лишнюю работу и показывают результаты, взятые из воздуха.
Всему виной повсеместное внедрение нейросетей. Они должны были помочь и оптимизировать работу. Но в итоге LLMенги делегируют креативность и критическое мышление ИИ, создавая целый ряд проблем.
• Джунам ИИ мешает учиться на своих ошибках и расти. Они просто передают результаты нейронок дальше, без анализа. Умение работать заменяется умением писать промпты;
• Мидлы из-за ИИ массово заражаются достигаторством. Нейросети позволяют генерировать бесконечный поток проектов. Которыми придётся заниматься другим коллегам;
• Сеньоры и руководители при использовании ИИ рискуют попасть в ловушку лести. Нейросеть поддержит любую идею Кабан Кабаныча и назовёт гениальной любую шизу. Это не только убивает самокритику, но и нередко нагружает горой бесполезной работы всех подчинённых.
А что же инвесторы? Инвесторы пока радуются взятыми из воздуха результатами внедрения ИИ, говорит эксперт РБК. Эти результаты готовы подтасовывать сами руководители, чтобы доказать свою эффективность и заработать бонусы. Ну или действительно верят лукавым словам нейросети, что их достижения правда великие.
P.S. Просто какая-то свалка )))
Всему виной повсеместное внедрение нейросетей. Они должны были помочь и оптимизировать работу. Но в итоге LLMенги делегируют креативность и критическое мышление ИИ, создавая целый ряд проблем.
• Джунам ИИ мешает учиться на своих ошибках и расти. Они просто передают результаты нейронок дальше, без анализа. Умение работать заменяется умением писать промпты;
• Мидлы из-за ИИ массово заражаются достигаторством. Нейросети позволяют генерировать бесконечный поток проектов. Которыми придётся заниматься другим коллегам;
• Сеньоры и руководители при использовании ИИ рискуют попасть в ловушку лести. Нейросеть поддержит любую идею Кабан Кабаныча и назовёт гениальной любую шизу. Это не только убивает самокритику, но и нередко нагружает горой бесполезной работы всех подчинённых.
А что же инвесторы? Инвесторы пока радуются взятыми из воздуха результатами внедрения ИИ, говорит эксперт РБК. Эти результаты готовы подтасовывать сами руководители, чтобы доказать свою эффективность и заработать бонусы. Ну или действительно верят лукавым словам нейросети, что их достижения правда великие.
P.S. Просто какая-то свалка )))
Подписка на РБК
Как достигаторы создают ИИ‑зависимость и вредят бизнес‑результатам —
В компаниях все чаще проявляется опасное явление: команды доверяют ИИ больше, чем собственному опыту, и редактируют выводы ИИ, а не создают новое. Как распознать сотрудников с этим синдромом и что
🤷♂1
Если человечество до сих пор толком не понимает разумных существ на Земле, то шанс понять сигналы инопланетян почти нулевой. Поэтому команда проекта Whale-SETI учится искать смысл в общении совсем не похожих на людей существ — горбатых китов.
В 2021 году ученые 20 минут беседовали с китом по кличке Твейн. Они проигрывали в море сигнал приветствия китов, а Твейн отвечал, соблюдая очередность в диалоге. Так ученые впервые наладили устойчивый протокол обмена информацией с «нечеловеческим разумом», где реакция не случайна и измерима.
На основе этого опыта ученые из Whale-SETI хотят создать «фильтры интеллекта» для космического шума, из которого можно будет вычленить сигналы других цивилизаций (если они, конечно, их посылают) и поддерживать контакт с отправителями.
В 2025 году у проекта появился еще один канал связи. Ученые заметили, что во время мирных сближений с людьми горбатые киты выдувают идеальные кольца пузырей под водой. Для Whale-SETI это важно, потому что коммуникация может быть не только звуковой: чем больше модальностей (звук, движение, форма), тем легче учиться распознавать намерение и структуру коммуникации.
Please open Telegram to view this post
VIEW IN TELEGRAM
www.seti.org
Whale-SETI: Groundbreaking Encounter with Humpback Whales Reveals Potential for Non-Human Intelligence Communication
❤1
Что в этой новости прикольно, а то что для расширения ИИ можно активно подключать к изучению биологов и считывать языки животных для оьогащения моделей. По моему очень крутая идея,фишка в том что мыявнополучим особые стратегии коммуникации и новые формы развития языков и понимания смыслов.