300K subscribers
5K photos
1.13K videos
17 files
5.36K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Liquid AI выкатили LFM2.5-8B-A1B - MoE на 8B параметров с 1.5B активных, заточенную под запуск на телефонах, ноутбуках и роботах.

Что внутри:

- гибридная MoE-архитектура линейки LFM2.5
- контекст 128K
- 38T токенов претрейна плюс крупномасштабный RL поверх
- LFM2 open-weight лицензия
- дообучение под узкую задачу влезает на одну GPU

По заявлениям команды, модель уверенно работает с tool calling и тягается с моделями в 3-4 раза тяжелее.

Веса уже на HF. Ждём первых замеров на MMLU-Pro, IFEval и BFCL - особенно интересно, как 1.5B активных параметров поведут себя на длинных tool-use цепочках.

Блог: http://liquid.ai/blog/lfm2-5-8b-a1b
Веса: https://huggingface.co/LiquidAI/LFM2.5-8B-A1B
Документация: http://docs.liquid.ai
Потестить: http://playground.liquid.ai

@ai_machinelearning_big_data
1🔥80👍62👏26🤓1211🌚3🎉2🤩1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI открыла доступ к биологической модели GPT-Rosalind

Компания запустила программу Rosalind Biodefense и открыла бесплатный доступ к специализированной модели GPT-Rosalind. OpenAI полностью покроет расходы на использование модели для верифицированных команд.

Подать заявку могут академические, некоммерческие и государственные лаборатории, а также небольшие профильные стартапы.

Представленная в апреле GPT-Rosalind обучена для анализа молекул, белков, генов и механизмов заболеваний. Цель инициативы - ускорить переход от научных гипотез к реальным экспериментам в сфере биозащиты.
openai.com

✔️ Google Cloud запустила систему AI Threat Defense

Новая платформа самостоятельно находит уязвимости в коде, пишет и внедряет патчи.

В основе - технологии стартапа Wiz для картирования IT-среды и приоритизации реальных векторов атак. Мониторинг обеспечивают несколько ИИ-моделей: легковесные ведут непрерывный анализ сети, а ресурсоёмкие активируются только для проверки критических узлов.

За исправление отвечает ИИ-агент Codemender от DeepMind. При обнаружении уязвимости он заменяет проблемный код в среде разработки. Заявлена возможность рефакторинга legacy-архитектур на современные языки программирования. Перед деплоем патча платформа автоматически генерирует тесты для проверки внесённых изменений.
google.com

✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundation

На лицензию OpenMDW-1.1 переходят 4 семейства: Cosmos, Isaac GR00T, Ising и Nemotron.

Стандарт разработан Linux Foundation для ИИ-индустрии и одним документом покрывает все компоненты релиза: исходный код, датасеты, веса, метаданные и документацию. Лицензия позволяет делать дообученные модели и производные продукты проприетарными.

Разработчики получают права на коммерциализацию, модификацию и распространение моделей. Единственное требование - сохранение оригинальных копирайтов при дистрибуции.
NVIDIA в сети Х

✔️ ElevenLabs представила вторую версию модели синхронного перевода

Dubbing v2 предназначена для перевода речи на 90+ языков с клонированием голоса и сохранением эмоций оригинала.

Модель перешла на архитектуру speech-to-speech: аудио обрабатывается напрямую без промежуточной конвертации в текст. Она сохраняет тембр, интонации и темп спикера, автоматически синхронизируя перевод с таймингами и паузами исходного видео. Алгоритм генерирует контекстную адаптацию фраз вместо дословного перевода, не требуя ручной корректировки.

База поддерживаемых языков расширена с 29 до более чем 90. Инструмент доступен в двух форматах: ElevenCreative (платформа для креаторов и маркетологов) и ElevenProductions для киностудий и бродкастеров. Публичный API для готовится к релизу.
elevenlabs.io

✔️ Genesis AI опубликовала открытый симулятор роботов

Genesis World - симулятор для робототехники, который позволяет генерировать 100 дней симуляции за один час вычислений.

В платформу встроены кастомные солверы, объединяющие физику твердых и деформируемых тел и предотвращающие взаимопроникновение мешей. Вычисления обрабатывает кроссплатформенный GPU-компилятор Quadrants, а за генерацию данных для СV отвечает движок Nyx с поддержкой трассировки пути.

В симуляторе есть профили Unitree, Sharpa, Wuji и различных робототехнических захватов. Genesis World рассчитывает сложные физические контакты в режиме, близком к реальному времени, и позволяет тестировать модели для прямого sim-to-real переноса политик на физических роботов.
Genesis AI в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7024🔥13👏8🤩7🤓3🤔2💘1
✔️ Qwen анонсировала модель для управления роботами разных конструкций

Подразделение Alibaba сообщила о выпуске Qwen-VLA - модели, которая способна управлять роботами разных типов без отдельной настройки под каждую платформу.

VLA-модели получают на вход изображение с камеры и текстовую команду, а на выходе выдают конкретные действия для робота.


Новинка построена на VL-основе Qwen3.5-4B и дополнена декодером действий на 1,15 млрд параметров.

Модель объединяет 3 типа задач: манипуляции (захват и перемещение предметов), навигацию и прогнозирование траекторий, а переключение между разными роботами требует лишь изменения текстовой инструкции.

Qwen-VLA не уступает специализированным системам, обученным под каждую отдельную задачу - GR00T (разработка NVIDIA) и π0.5 (Physical Intelligence).

На наборе тестов LIBERO Qwen-VLA показала 97,9%, на RoboTwin-Hard - 87,2%, а в экспериментах с двуруким роботом ALOHA средний процент успешных выполнений в знакомых условиях составил 83,6% и 76,9% в незнакомых.

Пока опубликован технический отчет и создан репозиторий проекта, о доступности самих моделей не сообщается.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍100🔥34👏128🎉7👌3💘1
✔️ Google подготовил изменения в системе лимитов приложения Gemini

Вице-президент Google Джош Вудворд в ответ на жалобы пользователей на то, что лимит Gemini расходуется слишком быстро и непредсказуемо, рассказал, что команда внедряет 6 мер по оптимизации квот.

По его словам, часть изменений уже действует, остальные находятся в разработке.


Перечень мер выглядит так:

🟢Исправлена ошибка, из-за которой квоту почти полностью расходовали одно-два видео в режиме Omni. Для подписчиков тарифа Ultra число доступных генераций Omni-видео уже удвоено.

🟢Сложные запросы к модели 3.1 Pro, особенно с прикреплёнными большими файлами, тоже быстро исчерпывали лимит. Теперь вводится ограничение на максимальный объём квоты, который может уйти на один запрос.

🟢За неудавшиеся запросы плата взиматься не будет: если запрос завершился ошибкой, квота не списывается и расходуется только на успешно выполненные операции.

🟢Запросы к модели Flash-Lite станут бесплатными и не будут учитываться в лимите.

🟢Для ресурсоёмких задач, например Deep Research, создается более подробная статистика расхода квоты и уведомления, которые должны помочь планировать нагрузку.

🟢Выбранная модель будет сохраняться во всех последующих сессиях. Смена произойдёт только при ручной перенастройке или при достижении лимита, когда система автоматически переключится на более лёгкую модель.

Сроков завершения работ по тем пунктам, которые ещё дорабатываются, Вудворд не назвал.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍103👏2517🤔13😁12👌4🔥3
✔️ Вышла MiniMax M3, которая выглядит как один из самых сильных open-weight релизов этого года.

Одна модель, чтобы работать как агент, держать длинный контекст (1M) с возможностью понимать разные типы модальностей.

Бенчмарки

- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов за счёт MiniMax Sparse Attention
- нативная мультимодальность

Отдельно Китайцы выпустили MiniMax Code - свою среду для работы с кодом на базе новой модели.

По ценам: в первые 7 дней дают скидку 50% на стандартное использование с контекстом до 512K.

MiniMax выпускают в open source модель, которая обходит и Opus, и GPT-5.5 на BrowseComp и SVG Bench.

При этом она ещё и лучше GPT-5.5 на SWE-Bench Pro, KernelBench Hard и BankerToolBench, а Opus обгоняет на OSWorld Verified.

API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io

@ai_machinelearning_big_data

#MiniMax #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍139🔥3316👏13😁4🎉4🐳1
🧠VL-DAC — метод обучения визуально-языковых моделей в симуляторах вместо дорогостоящего дообучения на реальных данных

Исследователи доказали, что VLM можно дешевле и быстрее обучать новым навыкам не в реальной среде, а в наборе симуляторов — а затем переносить эти навыки уже на реальные задачи. Результаты исследования представили на международной конференции по автономным агентам и мультиагентным системам уровня А — AAMAS. К таким выводам пришли ребята из лабы фундаментальных исследований ИИ Т-Банка.

VL-DAC учитывает недостатки предыдущих методов дообучения VLM и учит:
•анализировать интерфейсы и изображения
•выполнять действия шаг за шагом
•оценивать, насколько каждое действие приближает к цели

Для обучения использовали несколько симуляторов, каждый из которых отвечает за отдельный навык: навигацию, работу с объектами или веб-интерфейсами. После обучения модель Qwen2-VL-7B стала более чем на 50% лучше выполнять задачи в интерактивной среде, улучшила пространственную ориентацию на 5% и веб-навигацию на 2%.

Подход может применяться в робототехнике, банкинге, гейминге, логистике и других задачах, где ИИ должен не просто понимать изображение или интерфейс, но и выполнять цепочку последовательных действий.

@ai_machinelearning_big_data

#AI #ML #LLM
👍146🤔5137👏21🔥7👌6
Tencent выпустил Hy-Memory — плагин памяти для долгосрочных агентов вроде OpenClaw.

Под капотом: 6-уровневый фреймворк памяти, дуальная система System1/System2 и трёхуровневая цепочка эволюции воспоминаний.

Агент накапливает контекст и уточняет понимание пользователя со временем.

Заявленные цифры: на 70% меньше хранимых воспоминаний при плотности информации выше на 45%, потребление токенов на длинных контекстах снижается на 35%, обновление памяти ускоряется на 20%.

Вместо роста сырого RAG-хранилища система сжимает и переструктурирует знания, что особенно актуально при многодневных сессиях с одним агентом.

Установка: openclaw plugins uninstall openclaw-hy-memory

📷Project & Download:
https://memory.hunyuan.tencent.com
📷 OpenClaw Docs:
https://memory.hunyuan.tencent.com/openclaw/

@ai_machinelearning_big_data
👍43🤔408👏7💯5🔥4👨‍💻3
✔️ OpenAI отключила Canvas для GPT-5.5 и анонсировала удаление GPT-4.5

Компания скорректировала структуру выдачи GPT-5.5 Instant: модель стала генерировать меньше избыточных длинных списков и ее ответы теперь более читаемы и естественны.

Вместе с этим из GPT-5.5 Instant и GPT-5.5 Thinking убрали функцию Canvas. Теперь эти элементы рендерятся как инлайн-блоки в основном окне чата.

Доступ к классическому Canvas остался у платных пользователей при ручном переключении на старые версии моделей.

Также объявлены сроки удаления устаревших продуктов в веб-интерфейсе ChatGPT:

🟠GPT-4.5 будет отключена 27 июня (из API модель уже удалена),

🟠o3 уберут из веб-версии 26 августа 2026 года, через API доступ сохранится.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔37😢189😐6🔥3🥰3🌭1💅1🆒1
✔️ Китайцы выпустили Qwen3.7-Plus - мультимодальную агентную модель, которая объединяет зрение и язык в единую основу для разных задач.

Что умеет:

- работать как гибридный агент с GUI и CLI
- решать задачи с визуальными и текстовыми данными
- помогать в кодинге и продуктивной работе
- принимать входные данные разных форматов
- анализировать изображения, рассуждать по ним и привязывать ответы к конкретным объектам
- использовать поиск для более точных ответов
- переноситься между разными агентными фреймворками

Qwen3.7-Plus доступна через API в Alibaba Cloud Model Studio.

Blog: https://qwen.ai/blog?id=qwen3.7-plus
Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-plus
API: https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-plus&serviceSite=international

@ai_machinelearning_big_data

#qwen #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
37👍19🔥8🐳1