301K subscribers
5.01K photos
1.13K videos
17 files
5.37K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📌 Первые публичные тесты серверного процессора NVIDIA Vera

Издание Phoronix выпустило один из первых публичных обзоров серверного процессора NVIDIA Vera - нового ARM-чипа с 88 ядрами архитектуры Olympus, который компания позиционирует для ИИ-инфраструктуры.

По оценке основателя Phoronix Майкла Ларабела, это первый ARM-процессор, который на серверных нагрузках сопоставим с актуальными Intel Xeon и AMD EPYC.


В среднем по протестированным задачам Vera оказался примерно на 10% быстрее 64-ядерного AMD EPYC 9575F и в 1,55 раза быстрее Intel Xeon 6980P, флагмана линейки Granite Rapids.

По сравнению с предыдущим процессором NVIDIA Grace производительность выросла примерно на 63%.

В тесте сборки ядра Linux со стандартной конфигурацией Vera показал лучший результат среди всех испытуемых - 20 секунд.

Конфигурация Vera включала 88 ядер и 176 потоков, 8 модулей памяти LPDDR5-9600 общим объёмом 768 ГБ и TDP 450 Вт.

С учётом потребления памяти полная нагрузка системы составила около 500 Вт. У топовых EPYC Turin и Xeon Granite Rapids аналогичный показатель относится только к самому процессору, без памяти.

При этом публиковать полные данные об энергопотреблении NVIDIA не разрешила, поэтому реальная энергоэффективность остаётся неизвестной.


🟡Нюансы

Набор бенчмарков был ограничен самой NVIDIA - тестировались сценарии, под которые компания и позиционирует чип: компиляция кода, Python, Java, база данных ClickHouse, сжатие Zstd, кодирование видео SVT-AV1, 7-Zip и ряд других.

Тестов агентного ИИ (ключевого, по заявлениям NVIDIA, сценария применения процессора) в этом раунде не проводилось, их обещают опубликовать позднее.

Цена и сроки массовой доступности вне крупных облачных и ИИ-клиентов также не объявлены. Поставки партнёрам запланированы на вторую половину 2026 года.

🟡Не Верой единой

AMD готовит EPYC Venice на архитектуре Zen 6 с планами по выходу до конца года, Intel Xeon Diamond Rapids ожидается в 2027-м.

По оценке Phoronix, после выхода Venice, AMD может вернуть лидерство за пределами целевых для Vera сценариев, поэтому многое будет зависеть от того, как быстро NVIDIA сможет выпустить рефреш Olympus.



@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔10243🔥35👍23👏8💘2
This media is not supported in your browser
VIEW IN TELEGRAM
🐟 Китай придумал, как выжать из одного водоёма больше пользы.

Сверху - плавучие солнечные панели, которые дают электричество.

Снизу - фермы, где выращивают рыбу, креветок и крабов.

Такую схему называют FPC - fishery-photovoltaic complementary.

Водоём одновременно становится и солнечной электростанцией, и рыбной фермой.

Больше чистой энергии и дополнительный доход от выращивания морепродуктов.

@ai_machinelearning_big_data
👍21331🔥26🤩24🤨5🤔4💔1🗿1
✔️ VK Музыка показала интересный кейс по cold start в рекомендательных системах.

Проблема классическая: алгоритму нужны сигналы (дослушивания, лайки, скипы, сохранения), чтобы понять, кому рекомендовать новый объект. Но у свежего трека статистики еще нет. В итоге рекомендации часто начинают работать слишком поздно. А в музыке, где у релиза буквально несколько дней на разгон, это критично.

Вместо ожидания накопления данных VK Микс по сути делает искусственный контролируемый warm start. Сначала показывает новый трек ядру самых лояльных слушателей артиста. Так модель быстро получает первичную статистику и начинает масштабировать показ дальше.

Дополнительно в системе сделали почасовое обновление счетчиков. В результате новые треки начинают попадать в рекомендации менее чем за 30 минут. По данным VK, это в 24 раза быстрее среднего по рынку.

Интересный пример того, как проблему холодного старта начинают решать не только моделью, но и через продуманную организацию работы всей рекомендательной системы.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101🤣35👏26🗿20🤩19🔥11💯63🤷‍♂1🐳1🙈1
Opus 4.8 появился в выборе моделей Claude Code в десктопном приложении.

Похоже, сегодня день релиза 🚀

https://x.com/Machinelearrn/status/2060014943781412903

@ai_machinelearning_big_data

#claude #opus
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥103🎉6016💯16🤩11👍9👏7🗿1
🌟 OSCAR: открытая система двухбитного сжатия KV-кэша

Together AI выложила метод квантования KV-кэша до 2-х бит - OSCAR (Offline Spectral Covariance-Aware Rotation).

KV-кэш - структура, в которой модель хранит промежуточные представления токенов при генерации.

На длинных контекстах он занимает значительную часть памяти GPU, и его сжатие позволяет либо обслуживать больше запросов одновременно, либо ускорять чтение из памяти.

Прежние попытки сжать кэш до 2-х бит ухудшали качество ответов.


OSCAR обходит это ограничение за счёт того, что поворот активаций перед квантованием рассчитывается исходя из статистики внимания.

Метод предлагает сначала собрать на калибровочном наборе ковариационные матрицы запросов и значений, взвешенных оценками внимания, и из них вывести персональный поворот для ключей и значений каждого слоя.

После этого применяется преобразование Адамара, выравнивающее значимость каналов, и перестановка с побитовым реверсом, чтобы соседние каналы попадали в один диапазон при поквантовом сжатии.

Первые 64 и последние 256 токенов контекста при этом хранятся в полной точности BF16 как опорные, всё остальное - в 2-х битах.

Калибровка выполняется один раз, поворот и пороги отсечения фиксируются, а онлайн-наценка по вычислениям скрывается внутри ядер декодирования.

🟡Тесты

На задачах AIME25, GPQA-Diamond, HumanEval, LiveCodeBench v6, MATH500 метод удерживается близко к точности базового режима BF16.

Разрыв составляет 3,78 пункта на Qwen3-4B-Thinking-2507, 1,42 пункта на Qwen3-8B и около нуля на Qwen3-32B и GLM-4.7-FP8.

🟡Результаты на длинных контекстах

По бенчмарку RULER-NIAH OSCAR работает стабильнее остальных двухбитных методов, но для меньших моделей разрыв с BF16 растёт по мере увеличения контекста: на Qwen3-4B-Thinking-2507 при 128 тыс. токенов точность падает с 81,0 до 39,5 пункта.

Для GLM-4.7-FP8 кривая практически совпадает с BF16.

В замерах на NVIDIA H100 скорость декодирования при контексте в 100 тыс. токенов выросла в 2,8–3,1 раза относительно BF16.

OSCAR совместим с paged attention и встраивается в SGLang без изменений на стороне клиента. Для экспериментов Together AI выложила предвычисленные матрицы для Qwen3-4B-Thinking, Qwen3-8B, Qwen3-32B и GLM-4.7-FP8.


📌Лицензирование: Apache 2.0 License


🟡Страница проекта
🟡Arxiv
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM #Quantization #OSCAR #TogetherAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114👨‍💻40💯25🤔18🔥1411👌11👏4😐4🕊2🎃1
Anthropic только что выпустила Claude Opus 4.8.

Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.

По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.

Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.

claude.com/blog/introducing-dynamic-workflows-in-claude-code
1102👍44🤔32🔥20👏14🤓4😁2💘1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ В Claude Code добавили динамические воркфлоу и профиль ultracode

Обновление позволяет писать JavaScript-скрипты для оркестрации субагентов в рамках одной сессии. Скрипты берут на себя логические ветвления и хранение промежуточных результатов.

Для сложных задач добавлен профиль конфигурации ultracode. В нем модель самостоятельно решает, когда запустить мультиагентный пайплайн для перекрестного код-ревью и автоматического исправления ошибок.

Воркфлоу доступны через CLI и расширения для IDE на тарифах Max и Team. Инструмент кратно увеличивает расход токенов.
claude.com

✔️ Mistral провела ребрендинг LeChat

Французский ИИ-стартап обновил чат-бота Le Chat, переформатировав его в автономного агента Vibe, который интегрируется с Google Workspace, Outlook, Slack, GitHub, SharePoint и Notion.

Агент сканирует почту, парсит таблицы и верстает отчеты, предварительно согласовывая пошаговый план действий. Сценарии можно автоматизировать по расписанию или сохранять как шаблоны.

Появился Code Mode, где агенты работают в изолированных песочницах: пишут код, исправляют баги, создают тесты и доводят задачу до открытия PR. Фоновые сессии выполняются параллельно и не зависят от локального устройства.

Доступна бесплатная версия и тарифы: Pro (15 евро), Team (25 евро) и Enterprise. Точные лимиты не раскрываются - квоты подписок указаны как кратные множители.
mistral.ai

✔️ Google анонсировала одноплатник на базе RISC-V

Google показала одноплатный компьютер Coral Board для локального запуска модели Gemma 3 270M.

В основе платы - открытый нейромодуль Coral NPU на архитектуре RISC-V от Google Research. Вычислительным ядром выступает SoC Synaptics Astra SL2619: двухъядерный процессор с частотой 2 ГГц, 2 ГБ оперативной памяти и производительностью 1 TOPS. Этого объема ресурсов хватает для инференса компактной LLM.

Плата спроектирована для интеграции в AR-очки, умные часы и наушники. На презентации показали работу синхронного переводчика, голосовое управление периферией и генерацию звука в реальном времени - модель YOLOv8 отслеживала движения медуз и конвертировала их в музыку.

Исходный код демо-проектов выложен на GitHub. Поставки стартуют летом, цена пока неизвестна.
Google Gemma в сети Х

✔️ YouTube начнет автоматически помечать ИИ-контент

Алгоритмы видеохостинга будут принудительно добавлять предупреждающую плашку при выявлении генерации, если создатель не указал это сам.

Маркировка станет жестко привязанной и неудаляемой для медиафайлов с метаданными стандарта C2PA, а также для роликов, созданных в Veo и Dream Screen. При ложном срабатывании решение можно оспорить через YouTube Studio.

Визуально метки разместятся под плеером в длинных видео и поверх контента в Shorts. Наличие плашки не влияет на монетизацию и алгоритмы рекомендаций.

Дополнительно YouTube делает общедоступным инструмент Likeness Detection для поиска дипфейков, систему откроют для авторов старше 18 лет.
blog.youtube

✔️ Amazon запустил фонд и платформу для ИИ-видеопродакшена

Amazon MGM Studios и AWS запустили фонд GenAI Creators и платформу Project Nara для ИИ-видеопроизводства. Участники грантовой программы получат финансирование и доступ к новой облачной инфраструктуре.

Project Nara автоматически маршрутизирует задачи и подбирает модель для каждого этапа генерации. Платформа комбинирует сторонние видеомодели и проприетарные решения Amazon, обученные на контенте студии.

Инфраструктура интегрирует ИИ-агентов напрямую с Maya, Blender, Nuke, Unreal Engine и пакетом Adobe. Встроенная система трекинга документирует происхождение всех сгенерированных ассетов для контроля авторских прав.
amazonmgmstudios.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4218🔥8🤔5🎉2🌚1🤣1
🌟 Топовые LLM плохо предсказывают будущие научные открытия

Оксфорд, Стэнфорд, Институт Аллена и Sakana AI выложили работу, в которой ставится вопрос: способен ли ИИ предвидеть ход научного прогресса.

Исследование примыкает к дискуссии об "автономном учёном" на базе ИИ - направлении, которое сейчас волнует индустрию, его развивает в том числе и Sakana AI.

Чтобы отделить реальный прогноз от существующих знаний, авторы построили бенч CUSP.

Языковые модели обычно знают уже состоявшиеся открытия из обучающих данных, поэтому при прямом вопросе об известном результате легко дают верный ответ.


CUSP это блокирует: для события, скажем, 2025 года модели разрешают опираться только на сведения, доступные до этой даты.

Говоря проще, систему возвращают в прошлое и заставляют предсказывать будущее вслепую.


В основу теста легли 4760 научных событий за январь 2024 - март 2026 годов из журналов Nature, Science, Cell и подборок заметных работ по ИИ. На этой базе было сформировано 17 429 заданий.

В прогонах принимали участие GPT-5.4, Claude Sonnet 4.5, DeepSeek R1 и GPT-OSS 20B.

🟡Результаты

Выбрать правдоподобное техническое направление смогли - на вопросах с выбором ответа GPT-5.4 показала точность 81,9%.

Но определить, будет ли конкретное достижение вообще реализовано, модели почти не способны: точность держалась в пределах 45–52%, что близко к подбрасыванию монеты.

Сроки все модели называли с запаздыванием: медианная ошибка GPT-5.4 составила 14 месяцев, Claude Sonnet 4.5 - 17, а вот LLaMA 3.3 оказалась самой точной - 4 месяца.

В задачах на проектирование решения даже лучший результат (5,04 из 10 у GPT-5.4) не попадал в реально применённый позже технический путь.

Рисёрч отмечает деталь: качество прогноза почти не зависело от того, относится событие к периоду до или после среза знаний модели.


Это означает, что дело не только в нехватке данных. Доступ к дополнительной информации повышает результаты, но не закрывает разрыв, причём для самых цитируемых работ он был заметнее.

До кучи - модели систематически переоценивали уверенность в своих ответах.

🟡Вывод

LLM пока выступают скорее ретроспективными толкователями уже известных результатов, чем надёжными предсказателями будущих.


📌Лицензирование: MIT License


🟡Страница проекта
🟡Arxiv
🟡Датасет
🖥Github


@ai_machinelearning_big_data

#AI #ML #LLM #Research #Science #Benchmark
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔55👍3219😐17🤨10🔥5🫡5🥰1
Liquid AI выкатили LFM2.5-8B-A1B - MoE на 8B параметров с 1.5B активных, заточенную под запуск на телефонах, ноутбуках и роботах.

Что внутри:

- гибридная MoE-архитектура линейки LFM2.5
- контекст 128K
- 38T токенов претрейна плюс крупномасштабный RL поверх
- LFM2 open-weight лицензия
- дообучение под узкую задачу влезает на одну GPU

По заявлениям команды, модель уверенно работает с tool calling и тягается с моделями в 3-4 раза тяжелее.

Веса уже на HF. Ждём первых замеров на MMLU-Pro, IFEval и BFCL - особенно интересно, как 1.5B активных параметров поведут себя на длинных tool-use цепочках.

Блог: http://liquid.ai/blog/lfm2-5-8b-a1b
Веса: https://huggingface.co/LiquidAI/LFM2.5-8B-A1B
Документация: http://docs.liquid.ai
Потестить: http://playground.liquid.ai

@ai_machinelearning_big_data
1🔥62👍58👏2511🤓10🌚3🎉2🤩1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI открыла доступ к биологической модели GPT-Rosalind

Компания запустила программу Rosalind Biodefense и открыла бесплатный доступ к специализированной модели GPT-Rosalind. OpenAI полностью покроет расходы на использование модели для верифицированных команд.

Подать заявку могут академические, некоммерческие и государственные лаборатории, а также небольшие профильные стартапы.

Представленная в апреле GPT-Rosalind обучена для анализа молекул, белков, генов и механизмов заболеваний. Цель инициативы - ускорить переход от научных гипотез к реальным экспериментам в сфере биозащиты.
openai.com

✔️ Google Cloud запустила систему AI Threat Defense

Новая платформа самостоятельно находит уязвимости в коде, пишет и внедряет патчи.

В основе - технологии стартапа Wiz для картирования IT-среды и приоритизации реальных векторов атак. Мониторинг обеспечивают несколько ИИ-моделей: легковесные ведут непрерывный анализ сети, а ресурсоёмкие активируются только для проверки критических узлов.

За исправление отвечает ИИ-агент Codemender от DeepMind. При обнаружении уязвимости он заменяет проблемный код в среде разработки. Заявлена возможность рефакторинга legacy-архитектур на современные языки программирования. Перед деплоем патча платформа автоматически генерирует тесты для проверки внесённых изменений.
google.com

✔️ NVIDIA переводит все свои открытые модели на единую лицензию от Linux Foundation

На лицензию OpenMDW-1.1 переходят 4 семейства: Cosmos, Isaac GR00T, Ising и Nemotron.

Стандарт разработан Linux Foundation для ИИ-индустрии и одним документом покрывает все компоненты релиза: исходный код, датасеты, веса, метаданные и документацию. Лицензия позволяет делать дообученные модели и производные продукты проприетарными.

Разработчики получают права на коммерциализацию, модификацию и распространение моделей. Единственное требование - сохранение оригинальных копирайтов при дистрибуции.
NVIDIA в сети Х

✔️ ElevenLabs представила вторую версию модели синхронного перевода

Dubbing v2 предназначена для перевода речи на 90+ языков с клонированием голоса и сохранением эмоций оригинала.

Модель перешла на архитектуру speech-to-speech: аудио обрабатывается напрямую без промежуточной конвертации в текст. Она сохраняет тембр, интонации и темп спикера, автоматически синхронизируя перевод с таймингами и паузами исходного видео. Алгоритм генерирует контекстную адаптацию фраз вместо дословного перевода, не требуя ручной корректировки.

База поддерживаемых языков расширена с 29 до более чем 90. Инструмент доступен в двух форматах: ElevenCreative (платформа для креаторов и маркетологов) и ElevenProductions для киностудий и бродкастеров. Публичный API для готовится к релизу.
elevenlabs.io

✔️ Genesis AI опубликовала открытый симулятор роботов

Genesis World - симулятор для робототехники, который позволяет генерировать 100 дней симуляции за один час вычислений.

В платформу встроены кастомные солверы, объединяющие физику твердых и деформируемых тел и предотвращающие взаимопроникновение мешей. Вычисления обрабатывает кроссплатформенный GPU-компилятор Quadrants, а за генерацию данных для СV отвечает движок Nyx с поддержкой трассировки пути.

В симуляторе есть профили Unitree, Sharpa, Wuji и различных робототехнических захватов. Genesis World рассчитывает сложные физические контакты в режиме, близком к реальному времени, и позволяет тестировать модели для прямого sim-to-real переноса политик на физических роботов.
Genesis AI в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥1211👏5🤩5🤓3🤔2