Machinelearning

✔️

Qwen анонсировала модель для управления роботами разных конструкций

Подразделение Alibaba сообщила о выпуске Qwen-VLA - модели, которая способна управлять роботами разных типов без отдельной настройки под каждую платформу.

VLA-модели получают на вход изображение с камеры и текстовую команду, а на выходе выдают конкретные действия для робота.

Новинка построена на VL-основе Qwen3.5-4B и дополнена декодером действий на 1,15 млрд параметров.

Модель объединяет 3 типа задач: манипуляции (захват и перемещение предметов), навигацию и прогнозирование траекторий, а переключение между разными роботами требует лишь изменения текстовой инструкции.

Qwen-VLA не уступает специализированным системам, обученным под каждую отдельную задачу - GR00T (разработка NVIDIA) и π0.5 (Physical Intelligence).

На наборе тестов LIBERO Qwen-VLA показала 97,9%, на RoboTwin-Hard - 87,2%, а в экспериментах с двуруким роботом ALOHA средний процент успешных выполнений в знакомых условиях составил 83,6% и 76,9% в незнакомых.

Пока опубликован технический отчет и создан репозиторий проекта, о доступности самих моделей не сообщается.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍100🔥34👏12❤8🎉7👌3💘1

21.3K views12:02

Machinelearning

✔️

Google подготовил изменения в системе лимитов приложения Gemini

Вице-президент Google Джош Вудворд в ответ на жалобы пользователей на то, что лимит Gemini расходуется слишком быстро и непредсказуемо, рассказал, что команда внедряет 6 мер по оптимизации квот.

По его словам, часть изменений уже действует, остальные находятся в разработке.

Перечень мер выглядит так:

🟢Исправлена ошибка, из-за которой квоту почти полностью расходовали одно-два видео в режиме Omni. Для подписчиков тарифа Ultra число доступных генераций Omni-видео уже удвоено.

🟢Сложные запросы к модели 3.1 Pro, особенно с прикреплёнными большими файлами, тоже быстро исчерпывали лимит. Теперь вводится ограничение на максимальный объём квоты, который может уйти на один запрос.

🟢За неудавшиеся запросы плата взиматься не будет: если запрос завершился ошибкой, квота не списывается и расходуется только на успешно выполненные операции.

🟢Запросы к модели Flash-Lite станут бесплатными и не будут учитываться в лимите.

🟢Для ресурсоёмких задач, например Deep Research, создается более подробная статистика расхода квоты и уведомления, которые должны помочь планировать нагрузку.

🟢Выбранная модель будет сохраняться во всех последующих сессиях. Смена произойдёт только при ручной перенастройке или при достижении лимита, когда система автоматически переключится на более лёгкую модель.

Сроков завершения работ по тем пунктам, которые ещё дорабатываются, Вудворд не назвал.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍103👏25❤17🤔13😁12👌4🔥3

18.9K views14:01

Machinelearning

✔️ Вышла MiniMax M3, которая выглядит как один из самых сильных open-weight релизов этого года.

Одна модель, чтобы работать как агент, держать длинный контекст (1M) с возможностью понимать разные типы модальностей.

Бенчмарки

- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов за счёт MiniMax Sparse Attention
- нативная мультимодальность

Отдельно Китайцы выпустили MiniMax Code - свою среду для работы с кодом на базе новой модели.

По ценам: в первые 7 дней дают скидку 50% на стандартное использование с контекстом до 512K.

MiniMax выпускают в open source модель, которая обходит и Opus, и GPT-5.5 на BrowseComp и SVG Bench.

При этом она ещё и лучше GPT-5.5 на SWE-Bench Pro, KernelBench Hard и BankerToolBench, а Opus обгоняет на OSWorld Verified.

API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io

@ai_machinelearning_big_data

#MiniMax #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍140🔥33❤16👏13😁4🎉4🐳1

21.1K viewsedited 04:14

Machinelearning

🧠VL-DAC — метод обучения визуально-языковых моделей в симуляторах вместо дорогостоящего дообучения на реальных данных

Исследователи доказали, что VLM можно дешевле и быстрее обучать новым навыкам не в реальной среде, а в наборе симуляторов — а затем переносить эти навыки уже на реальные задачи. Результаты исследования представили на международной конференции по автономным агентам и мультиагентным системам уровня А — AAMAS. К таким выводам пришли ребята из лабы фундаментальных исследований ИИ Т-Банка.

VL-DAC учитывает недостатки предыдущих методов дообучения VLM и учит:
•анализировать интерфейсы и изображения
•выполнять действия шаг за шагом
•оценивать, насколько каждое действие приближает к цели

Для обучения использовали несколько симуляторов, каждый из которых отвечает за отдельный навык: навигацию, работу с объектами или веб-интерфейсами. После обучения модель Qwen2-VL-7B стала более чем на 50% лучше выполнять задачи в интерактивной среде, улучшила пространственную ориентацию на 5% и веб-навигацию на 2%.

Подход может применяться в робототехнике, банкинге, гейминге, логистике и других задачах, где ИИ должен не просто понимать изображение или интерфейс, но и выполнять цепочку последовательных действий.

@ai_machinelearning_big_data

#AI #ML #LLM

👍146🤔54❤38👏23🔥7👌6

15.1K views13:10

Machinelearning

Tencent выпустил Hy-Memory — плагин памяти для долгосрочных агентов вроде OpenClaw.

Под капотом: 6-уровневый фреймворк памяти, дуальная система System1/System2 и трёхуровневая цепочка эволюции воспоминаний.

Агент накапливает контекст и уточняет понимание пользователя со временем.

Заявленные цифры: на 70% меньше хранимых воспоминаний при плотности информации выше на 45%, потребление токенов на длинных контекстах снижается на 35%, обновление памяти ускоряется на 20%.

Вместо роста сырого RAG-хранилища система сжимает и переструктурирует знания, что особенно актуально при многодневных сессиях с одним агентом.

Установка: openclaw plugins uninstall openclaw-hy-memory

📷Project & Download:
https://memory.hunyuan.tencent.com
📷 OpenClaw Docs:
https://memory.hunyuan.tencent.com/openclaw/

@ai_machinelearning_big_data

👍43🤔43❤8👏7💯5🔥4👨‍💻3

15.2K views14:26

Machinelearning

✔️

OpenAI отключила Canvas для GPT-5.5 и анонсировала удаление GPT-4.5

Компания скорректировала структуру выдачи GPT-5.5 Instant: модель стала генерировать меньше избыточных длинных списков и ее ответы теперь более читаемы и естественны.

Вместе с этим из GPT-5.5 Instant и GPT-5.5 Thinking убрали функцию Canvas. Теперь эти элементы рендерятся как инлайн-блоки в основном окне чата.

Доступ к классическому Canvas остался у платных пользователей при ручном переключении на старые версии моделей.

Также объявлены сроки удаления устаревших продуктов в веб-интерфейсе ChatGPT:

🟠

GPT-4.5 будет отключена 27 июня (из API модель уже удалена),

🟠

o3 уберут из веб-версии 26 августа 2026 года, через API доступ сохранится.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔39😢19❤9😐6🔥3🥰3🌭1💅1🆒1

14.7K views15:59

Machinelearning

✔️

Китайцы выпустили Qwen3.7-Plus - мультимодальную агентную модель, которая объединяет зрение и язык в единую основу для разных задач.

Что умеет:

- работать как гибридный агент с GUI и CLI
- решать задачи с визуальными и текстовыми данными
- помогать в кодинге и продуктивной работе
- принимать входные данные разных форматов
- анализировать изображения, рассуждать по ним и привязывать ответы к конкретным объектам
- использовать поиск для более точных ответов
- переноситься между разными агентными фреймворками

Qwen3.7-Plus доступна через API в Alibaba Cloud Model Studio.

Blog: https://qwen.ai/blog?id=qwen3.7-plus
Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-plus
API: https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-plus&serviceSite=international

@ai_machinelearning_big_data

#qwen #opensource

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤46👍22🔥8🐳1

9.98K views20:43

About

Blog

Apps

Platform