Machinelearning

⚡️

Unitree выпустила четвероногого робота As2

As2 предлагается в 3 версиях: AIR, PRO и EDU.

Вся линейка построена на одной механической базе: 18 кг, 12 степеней свободы, промышленные крестовые подшипники и моторы PMSM с низкой инерцией. Корпус - алюминиевый сплав с высокопрочным пластиком.

Базовая электроника тоже унифицирована: 8-ядерный CPU, Wi-Fi 6, Bluetooth 5.2, HD-камера, микрофон, динамик.

As2 AIR (бюджетный вариант)
Максимальный крутящий момент суставов 65 Нм, скорость до 3 м/с, грузоподъемность при ходьбе до 10 кг, подъем по склону до 30°. Батарея на 8000 мАч, без быстрой зарядки. Нет GPS, 4G, LiDAR и ISS 3.0. Это минимально рабочая конфигурация.

As2 PRO
Крутящий момент 75 Нм, скорость до 3,7 м/с, нагрузка до 13 кг, подъём 40°. Сюда добавили LiDAR, GPS, 4G, система ISS 3.0 для отслеживания сопровождаемого объекта, защита IP54. Батарея на 15 000 мАч с быстрой зарядкой обеспечивает до 4 часов хода налегке и до 13 км с нагрузкой 13 кг.

As2 EDU (платформа для разработчиков).
Характеристики ходовой части совпадают с PRO, но максимальный момент до 90 Нм, а нагрузка при ходьбе до 15 кг. Главное отличие: поддержка API, станция для автономной зарядки и опциональный вычислительный модуль NVIDIA Jetson Orin NX. Это единственная версия, которую можно программировать под собственные задачи.

Все 3 модели получают OTA-обновления через платформу UniStore и работают при температурах от −20 до +50 °C. Цен в открытых источниках пока нет.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡28👍25🤩18❤10🔥3👏3

17.6K views15:10

✔️

OpenAI купила стартап Astral.

Astral занимается созданием инструментов для Python-разработчиков. Хотя сделка еще не закрыта окончательно, ожидается, что команда стартапа вольется в подразделение, развивающее проект Codex.

Технологии Astral позволят превратить Codex в комплексную платформу для разработки. Аудитория инструмента стремительно расширяется: с начала года число пользователей утроилось и перевалило за 2 млн. человек.

Основатель Astral Чарли Марш подтвердил, что команда продолжит развивать свои open-source решения уже под крылом OpenAI.
openai.com

✔️

Cursor выпустила второе поколение модели Composer.

Composer 2 вступает в прямую конкуренцию с Claude Opus 4.6 и GPT-5.4, предлагая высокую производительность за меньшие деньги. Базовая стоимость использования начинается от 50 центов за млн. входных и 2,5 доллара за млн. выходных токенов. Ускоренная версия, установленная в редакторе по умолчанию, обойдется в 1,5 и 7,5 доллара соответственно.

Создатели говорят, что скачок в качестве стал возможен благодаря усиленному этапу предобучения, который заложил отличную базу для последующего RL. Модель тренировали на комплексных задачах программирования, требующих от ИИ выполнения сотен самостоятельных шагов.

Во внутреннем бенчмарке новинка набрала 61.3 балла, оставив далеко позади версию 1.5 с 44.2 баллами. В Terminal Bench 2.0 и SWE-bench Multilingual, Composer 2 показала результаты на уровне топовых моделей Anthropic и OpenAI. Обновление уже доступно внутри редактора Cursor.
cursor.com

✔️

Microsoft представила генератор изображений MAI-Image-2.

Microsoft Super Intelligence выпустило свой первый продукт - ИИ-модель для генерации картинок по тексту MAI-Image-2. В профильном рейтинге ArenaAi новинка с ходу заняла 3 место, уступая пока лишь GPT-Image-1.5 и Nano Banana 2.

По заявлениям компании, модель делает особый упор на фотореализм: точно передает естественное освещение и оттенки кожи, а также уверенно справляется с детализированными сценами и неплохо рендерит текст, что критично при создании постеров, инфографики и диаграмм.

Сейчас MAI-Image-2 доступна для тестов в сервисе MAI Playground, а вскоре появится в Copilot и Bing Image Creator. Доступ по API пока открыт только узкому кругу корпоративных клиентов. Технические подробности и цены на API Microsoft пока держит в секрете.
microsoft.ai

✔️

В Google AI Studio добавили вайб-кодинг.

Новая возможность позволяет описывать свои идеи естественным языком, а Gemini 3.1 Pro полностью берет на себя написание кода. Приложения собираются прямо в браузере и могут включать сложную логику: обработку платежей, мессенджеры или многопользовательские игры в реальном времени.

Техническая особенность обновления - Antigravity Agent. Он понимает, когда проекту требуется база данных или система авторизации и самостоятельно разворачивает их через Firebase. Агент умеет подключать внешние сервисы по API, а при необходимости сам устанавливает нужные библиотеки компонентов.

Также расширился список поддерживаемых технологий: к React и Angular теперь официально добавился фреймворк Next.js.
blog.google

✔️

Elevenlabs открыл маркетплейс для продажи ИИ-музыки.

Компания запустила платформу, где можно публиковать и монетизировать треки, созданные фирменной моделью ElevenCreative. Авторы получают отчисления, когда их композиции скачивают, ремиксуют или лицензируют другие юзеры.

Предусмотрено 3 уровня лицензий: для соцсетей, платного маркетинга и офлайн-использования. По данным Elevenlabs, нейросеть уже сгенерировала почти 14 млн. песен, а схожий маркетплейс ИИ-голосов принес пользователям более $11 млн.

Правовой статус треков спорный. ИИ-музыка не защищена авторским правом, так как у нее нет создателя-человека, а сама Elevenlabs не гарантирует эксклюзивность: нейросеть может выдать двум разным людям идентичный результат, и заявить права на чужой трек не выйдет. Использование в промптах имен реальных артистов или тексты существующих песен строго запрещено.
elevenlabs.io

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥48🎉41❤16👏14👍11🤗7🤓6💯4🗿1

16.3K views05:40

Machinelearning

⚡️ Agents Week от ШАДа — интенсив для тех, кто хочет разобраться в архитектуре AI-агентов и их инженерии

С 6 по 10 апреля эксперты Яндекса разберут, как устроены современные агентные системы: от работы с инструментами и памятью и базового thought-action-observation цикла до multi-agent архитектур и продакшен-подходов.

Что узнаете из лекций:

✔️ Как устроены современные ИИ-агенты
✔️ С чего начать проектирование и настройку их поведения
✔️ Какие есть практики построения single-agent и multi-agent-систем
✔️ Как доводить агентов до продакшена: оценка качества, мониторинг, масштабирование и эксплуатация

На лекциях можно будет задать вопросы экспертам, а на практике применять полученные знания. Agents Week мастхэв для ML-инженеров, backend-разработчиков, студентов техвузов, которые хотят строить агентные системы.

Подать заявку на интенсив можно до 9 апреля включительно.

⚡73🤔20👏13🤩13👍11😁7🎉6🔥2❤1

16.4K views11:44

Machinelearning

🌟

Mamba3

Mamba2 делала ставку на быстрое обучение. Ради этого механизм рекуррентных обновлений упрощали: матрицу переходов состояний свели к скаляру, умноженному на единичную матрицу.

Обучение ускорилось, но при декодировании GPU большую часть времени не считает, а гоняет данные между уровнями памяти. Архитектура оказалась с нюансом - вычислительные ядра простаивают.

С тех пор ландшафт изменился. RL с верифицируемыми наградами для кода и математики, агентные пайплайны - все это генерирует прорву токенов на инференсе. Команда Mamba3 задалась вопросом: как выглядела бы SSM-архитектура, если сделать ее с приоритетом на инференс, а не на обучение?

Так родились 3 главных изменения в ядре Mamba.

🟡

Новая схема дискретизации.

SSM в базе - это обыкновенное дифференциальное уравнение, которое нужно перевести в дискретную рекуррентную формулу. Mamba1 и Mamba2 использовали комбинацию двух методов (ZOH и Эйлера), подобранную эмпирически.

В Mamba3 реализовали экспоненциально-трапецеидальный метод: вместо одной точки для аппроксимации интеграла берутся обе границы интервала с обучаемым коэффициентом смешивания. В результате рекуррентная формула неявно применяет свёртку к входу скрытого состояния, что делает динамику выразительнее без дополнительных компонентов.

🟡

Комплекснозначная SSM.

Ранние модели семейства S4 работали с комплексными числами, но Mamba1 от них отказалась. Из-за этого модель не справляется даже с простейшими задачами отслеживания состояний (например, определением четности последовательности).

Решение нашли во вращении в двумерном пространстве: вместо комплексных вычислений авторы разложили переход на масштабирование и поворот, а затем применили фишку из RoPE - встроили вращения в матрицы через кумулятивную сумму углов.

Переписывать ядра для поддержки комплексной арифметики не пришлось. Модель решает задачи на чётность и другие бенчмарки, недоступные предыдущим версиям.

🟡

Переход от SISO к MIMO.

В стандартной SSM каждый хэд содержит набор независимых систем (один вход - один выход). При декодировании арифметическая интенсивность составляет около 2,5 операций на байт при пороге вычислительной загруженности на H100 в районе 300.

Mamba3 расширяет матрицы, превращая внешние произведения в матричные умножения. Арифметическая интенсивность растет пропорционально. При этом размер скрытого состояния не увеличивается, а значит, латентность декодирования почти не меняется. Обучение, конечно, дорожает, но это сознательный компромисс.

Еще из архитектуры убрали короткую каузальную свёртку, присутствовавшую с первой Mamba - новая рекуррентная формула и смещения выполняют ту же функцию.

Добавили нормализацию BCNorm по аналогии с QKNorm в трансформерах, перешли на чередование SSM- и MLP-слоев.

Ядра написаны на Triton (prefill SISO), TileLang (prefill MIMO) и CuTe DSL (decode).

🟡

Тесты

Mamba-3 SISO при 1,5B параметров показывает лучшую суммарную латентность prefill + decode на всех длинах последовательностей по сравнению с Mamba2, Gated DeltaNet и Llama-3.2-1B под vLLM на одном H100.

MIMO-вариант сопоставим по скорости с Mamba2, но заметно точнее. При анализе Парето-фронта Mamba-3 показывает тот же уровень качества при вдвое меньшем состоянии.

@ai_machinelearning_big_data

#AI #ML #LLM #Mamba3 #TogetherAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤓84🤷‍♂67🤔37👍28❤20😴20👏10🙈7🦄5🥰2🤣2

15.4K views12:51

Machinelearning

✔️

Архитектурные задачи в переводе

Ещё недавно машинный перевод был набором довольно сложных пайплайнов: модели подбирали наиболее вероятные соответствия словам и фразам и собирали перевод как конструктор.

С приходом нейросетей архитектура упростилась — появилась единая модель, которая обрабатывает текст по предложениям. А с внедрением больших языковых моделей произошёл следующий сдвиг: теперь система генерирует перевод, удерживая контекст на уровне крупных блоков и выбирая формулировки в зависимости от стиля.

От этого меняется и вся логика построения сервиса. Чтобы сохранить баланс скорости и точности, используется гибридная архитектура, где лёгкие модели работают на простых задачах, а тяжёлые большие языковые модели подключаются в сложных случаях.

Такой подход позволяет совмещать качество с эффективностью, и делает перевод ближе к тому, как работает человек, но в промышленном масштабе.

🟡

Статья

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24👨‍💻22🔥6❤5👏5🤔3🤣3😍2

15.2K views13:13

Machinelearning

Forwarded from Анализ данных (Data analysis)

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Runway представила серьёзный прорыв в генерации видео с помощью ИИ на конференции NVIDIA GTC.

Компания показала новую модель, способную генерировать видео в высоком разрешении в настоящем реальном времени.

Ключевая фишка — time-to-first-frame менее 100 мс.
Это значит, что HD-видео начинает генерироваться и воспроизводиться практически мгновенно после команды.

Этот превью-ресёрч был разработан совместно с NVIDIA и работает на их новой архитектуре Vera Rubin.

Такая скорость — важный шаг к созданию General World Model (GWM-1) от Runway.

Технология выходит за рамки обычной генерации видео и движется в сторону живых, интерактивных сред в реальном времени.

https://x.com/runwayml/status/2034284298769985914

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml

⚡115🤩35👏22👍16🔥14❤11🤔2

15K views14:20

Machinelearning

📌

Anthropic опубликовала результаты масштабного опроса пользователей Claude.

В декабре 2025 года Anthropic провела масштабное качественное исследование: специальная версия Claude брала интервью у пользователей сервиса по всему миру.

За одну неделю в нем приняли участие 80 508 человек из 159 стран на 70 языках. По заявлению Anthropic, это крупнейшее и наиболее многоязычное исследование, которое когда-либо проводилось.

Методика отличалась от стандартных опросов. Модель спрашивала о надеждах на ИИ, опыте его использования и страхах, а затем адаптировала follow-up вопросы на основе ответов.

Классифицировать и анализировать результаты тоже помогал Claude: он кластеризовал темы, выбирал репрезентативные цитаты и оценивал преобладающие настроения.

🟡

Что люди хотят от ИИ

Самый распространенный запрос - профессиональная эффективность (19%): людям нужно, чтобы ИИ взял на себя рутину, оставив им стратегические задачи.

На втором месте личностный рост и эмоциональное благополучие (14%), далее - управление бытовыми задачами и когнитивная поддержка (14%).

Примечательно: когда интервьюер спрашивал, что за желанием продуктивности стоит на самом деле, многие раскрывались. Оказывалось, что дело не в работе как таковой, а в том, чтобы успевать к детям, проводить время с родителями или просто жить свою жизнь.

Примерно 81% участников сказали, что ИИ уже в какой-то мере оправдал их ожидания.

Чаще всего называли ускорение рабочих процессов (32%), когнитивное партнерство (17%) и обучение (10%).

Отдельно выделяется категория доступности: люди с нарушениями обучаемости, слуха, речи описывают ИИ как явление, которой у них раньше не было.

🟡

Страхи конкретнее надежд

Главное беспокойство - ненадежность и галлюцинации (27%), следом идут угрозы занятости (22%) и потеря автономии (22%).

Важный паттерн: опасения, связанные с рынком труда, сильнее всего коррелируют с общим негативным отношением к ИИ.

Исследование зафиксировало 5 устойчивых противоречий, которые люди переживают одновременно, не выбирая одну из сторон:

🟢обучение - когнитивная деградация;
🟢качество решений - ненадежность;
🟢эмоциональная поддержка - зависимость;
🟢экономия времени - ускорение темпа жизни;
🟢экономические возможности - вытеснение с рынка труда.

У пользователей, ценящих ИИ за эмоциональную поддержку, втрое выше страхя зависимости от него.

🟡

Региональный разрыв

В Африке, Латинской Америке и Южной Азии смотрят на ИИ заметно оптимистичнее, чем пользователи из Северной Америки и Западной Европы.

В развивающихся регионах ИИ воспринимается прежде всего как инструмент возможностей: для предпринимательства, образования, обхода инфраструктурных ограничений. В богатых странах фокус смещается на управление сложностью уже насыщенной жизни и регуляторные вопросы.

Anthropic обещает вернуться с новыми опросами позже планирует продолжить исследование: следующая волна интервью будет про влияние Claude на благополучие людей в долгосрочной перспективе.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍60🤔53❤16👏11🤩6🔥3😁2🥱1

15.5K views17:03

✔️

OpenAI объединит ChatGPT, Codex и браузер Atlas в суперприложение.

Компания меняет стратегию, отказываясь от выпуска разрозненных продуктов. Поводом для внутренней мобилизации и объявления очередного «красного кода» стал успех Anthropic среди разработчиков и корпоративных клиентов.

Особенностью супер-аппа станут агенты. Система будет работать на компьютере автономно, беря на себя написание кода, анализ данных и другие рутинные процессы. OpenAI планирует расширить функционал Codex за пределы программирования, после чего интегрирует его с ChatGPT и Atlas.

Курировать перестройку продуктовой линейки поручено главе по приложениям Фиджи Симо и президенту компании Грегу Брокману.
wsj.com

✔️

Google начала закрытое тестирование Gemini для macOS.

До сих пор пользователи Mac могли обращаться к Gemini только через веб-интерфейс. Чтобы усилить конкуренцию с OpenAI и Anthropic, Google делает полноценный десктопный клиент под кодовым названием Janus. На этой неделе ранняя сборка стала доступна участникам закрытого бета-тестирования.

Фишкой новинки станет Desktop Intelligence. Эта функция позволит ИИ глубоко интегрироваться с системными приложениями и считывать контекст прямо с экрана.

Gemini сможет видеть активные окна и извлекать из них данные для максимально точных и персонализированных ответов, по аналогии с десктопным клиентом Claude. Сроки публичного релиза пока не известны.
bloomberg.com

✔️ Anthropic выпустила Claude Code Channels.

Новая функция позволяет подключать среду Claude Code напрямую к Telegram и Discord. Взаимодействие с ИИ переходит в асинхронный формат - можно ставить задачи со смартфона и получать уведомления по факту их выполнения. В основе Channels - протокол MCP.

Сообщество уже назвало релиз убийцей OpenClaw. В отличие от этого open-source фреймворка, которому для работы агента нужно выделенное устройство, Anthropic перенесла все процессы в собственную управляемую среду.

Инструмент доступен в статусе превью для версий Claude Code 2.1.80 и выше. Для работы требуется подписка Pro, Max или Enterprise.
Thariq Shihipar в сети Х

✔️

Adobe разрешила дообучать модели на пользовательских данных.

В публичный бета-тест вышло обновление Adobe Firefly. Главное - функция создания кастомных ИИ-моделей: креативные команды могут дообучать модели на собственных исходниках для сохранения единого визуального стиля, внешности персонажей и специфической цветокоррекции. Обученные модели можно переиспользовать и они остаются полностью приватными.

Firefly эволюционировал в ИИ-хаб. В рабочую среду интегрировано более 30 сторонних генеративных решений. Экосистема позволяет сгенерировать черновик в одной нейросети, а детализировать и редактировать результат в другой.

Параллельно Adobe расширяет тестирование Project Moonlight, сквозного агентного интерфейса, который автоматизирует процессы внутри всех приложений компании с помощью текстовых команд.
adobe.com

✔️

Глава Unitree Robotics: роботы побьют мировой рекорд скорости человека уже в этом году.

Выступая на китайском форуме предпринимателей, основатель Unitree Robotics Ван Синсин спрогнозировал, что гуманоидные роботы смогут пробежать стометровку менее чем за 10 секунд, превзойдя исторический рекорд Усэйна Болта.

Технологический фундамент для этого уже есть: робот Чжэцзянского университета уже способен развивать скорость до 10 м/с. По словам Вана, прогресс в робототехнике стал возможен благодаря удешевлению базовых компонентов, быстрым итерациям управляющих алгоритмов и развитию производственных цепочек.

Сверхскорость в данном случае выступает маркером зрелости систем. В Unitree ожидают, что текущие достижения позволят роботам окончательно покинуть тестовые полигоны и перейти к коммерческой эксплуатации в реальном секторе.
interestingengineering.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥64❤23🤩18👍11👏6🤔3👌3

13.9K views05:54

Machinelearning

✔️

В Москве завершилась Национальная технологическая олимпиада по искусственному интеллекту

В конкурсе приняли участие больше 7 тысяч человек, из них отобрали 111 финалистов и 18 победителей, среди которых впервые появилась девушка и 14-летний школьник.

Участники работали над задачами уровня взрослых разработчиков, создавая алгоритм способный восстанавливать утерянную информацию и сохранять персонализацию сервиса при частичной потере данных.

Победители олимпиады получат возможность поступить в профильные вузы без вступительных экзаменов или получат 100 баллов ЕГЭ по профильному предмету. Также первый запред Сбербанка Александр Ведяхин лично пригласил всех победителей на стажировку в Сбер.

🟡

Статья

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🎉41🔥39🏆17🤣14❤13👏13💯6👍2🤩2🤷2

12.4K views11:11

Machinelearning

🌟

NVIDIA Nemotron-Cascade 2: MoE на 30B параметров и золото на математических олимпиадах.

Nemotron-Cascade 2 - вторая в мире открытая языковая модель, получившая золотую медаль сразу на 3 соревнованиях 2025 года: IMO, IOI и финале ICPC.

До нее это удавалось только DeepSeek-V3.2-Speciale, модели с 671B параметров и 37B активных. У Nemotron-Cascade 2 параметров в 20 раз меньше: 30B общих, 3B активных.

🟠На IMO 2025 модель решила 5 задач из 6 и набрала 35 из 42 баллов.
🟠На IOI - 439 из 600, что соответствует золоту.
🟠На ICPC World Finals 10 задач из 12, это 4 место в золотой зоне. При этом 8 задач ICPC были решены менее чем за 100 попыток.

🟡

Архитектура

MoExperts на базе Nemotron-3-Nano-30B-A3B-Base. Отличие от первой версии - расширенный Cascade RL, где обучение с подкреплением проходит последовательно по доменам: сначала следование инструкциям, затем мультидоменное RL, потом дистилляция, RLHF, работа с длинным контекстом, код и, наконец, задачи программной инженерии.

🟡

Multi-Domain On-Policy Distillation (MOPD)

На каждом этапе Cascade RL выбирается лучший промежуточный чекпоинт по конкретному домену и используется как учитель. Поскольку все учителя происходят от одной SFT-инициализации, они делят токенайзер и словарь, что упрощает дистилляцию.

MOPD работает на уровне отдельных токенов, а не последовательностей, и сходится быстрее, чем классический GRPO: на AIME 2025 достигает уровня учителя за 30 шагов оптимизации.

🟡

Тесты

На бенчмарках модель обходит Qwen3.5-35B-A3B и более крупную Nemotron-3-Super-120B-A12B в математике, коде и следованию инструкциям.

🟢LiveCodeBench v6: 88.4 (у Qwen3.5 74.6);
🟢ArenaHard v2: 83.5 против 65.4 у Qwen3.5;
🟢IFBench: 82.9 против 70.2;
🟢На Codeforces модель набрала рейтинг 2345 с TIR (на уровне моделей с 300B+ параметров).

🟡

Слабые места

Задачи, требующие глубоких знаний (MMLU-Pro, GPQA-Diamond) и агентные сценарии (BFCL v4, τ²-Bench, SWE Verified). Тут Qwen3.5 пока впереди.

NVIDIA обещает подтянуть наукоёмкий претрейн и агентный RL в следующих версиях Nemotron-Cascade.

📌Лицензирование: NVIDIA Open Model License.

🟡

Модель

🟡

SFT-датасет

🟡

RL-данные

🟡

Техотчет

@ai_machinelearning_big_data

#AI #ML #LLM #Nemotron #Cascade2 #NVIDIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM