Machinelearning

📌

Google разработала алгоритм квантования KV-кэша без потери точности.

Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.

TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.

KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.

Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.

🟡TurboQuant - двухэтапный пайплайн.

Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.

На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.

Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".

Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.

При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.

Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.

Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.

🟡

Статья

🟡

Arxiv

@ai_machinelearning_big_data

🎯Полезные Мл-ресурсы 🚀 Max

#AI #ML #LLM #TurboQuant #Google

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤123🔥46🎉38👨‍💻12👍9👏8🤩7🥰2

22.8K views04:49

⚡️

OpenAI закрывает генератор видео Sora.

Спустя всего 6 месяцев после релиза, OpenAI приняла решение закрыть сервис, который стал вирусным почти сразу: после запуска в конце сентября он набрал миллион скачиваний менее чем за 5 дней.

Несмотря на популярность, поддержка проекта оказалась слишком дорогой. Сейчас компания активно урезает издержки, чтобы подготовить финансовую базу для выхода на биржу.

В ближайшее время компания обещает опубликовать точные сроки отключения приложения и API, а также выпустить инструкции, которые помогут безопасно выгрузить и сохранить созданный контент.
SoraOfficialApp в сети Х

✔️

Anthropic научила Claude управлять компьютером.

В Claude Cowork и Claude Code появилась функция прямого контроля десктопа. Теперь Claude может перехватывать управление: перемещать курсор, кликать по интерфейсу, набирать текст и запускать инструменты разработчика напрямую.

Новая возможность раскрывается в связке с свежей функцией Dispatch. Например, можно отправить задачу со смартфона, находясь в пути, а запущенный десктопный клиент Claude на компьютере самостоятельно протестирует код, внесет изменения в IDE и подготовит PR.

Новая функция в стадии Research Preview и доступна подписчикам тарифов Pro и Max. На данный момент поддерживается исключительно macOS.
claude.com

✔️

Google Cloud отправляет ИИ-агентов отбиваться от киберугроз.

На конференции RSA 2026 Google выкатила обновление инструментов кибербезопасности. В платформу Security Operations добавили агентов на базе Gemini: они умеют сами копаться в инцидентах, собирать цифровые улики и выносить вердикт с подробным разбором полетов.

Этих же агентов прикрутили к системе Google Threat Intelligence - теперь они мониторят даркнет. Корпорация заявляет, что алгоритм переваривает миллионы событий ежедневно с точностью 98% и подсвечивает только те риски, которые касаются конкретной компании.

Параллельно Google подтвердила покупку компании Wiz. Ее технологии будут применятся для создания единой системы защиты мультиоблачных инфраструктур.
cloud.google.com

✔️

Ai2 выпустил open-source браузерного агента MolmoWeb.

Инструмент построен на базе моделей Molmo 2 с 4В и 8В параметров. Он смотрит на веб глазами пользователя: анализирует скриншот страницы и сам решает, куда кликнуть, что написать, где проскроллить или открыть новую вкладку.

Создатели не стали приукрашивать реальность: агент может тупить при чтении текста, ломается после случайного клика не туда и теряется от нечетких инструкций. Заодно ради безопасности его специально отрезали от работы с паролями и деньгами.

MolmoWeb установил новый SOTA среди открытых решений в 4 бенчмарках для веб-агентов, обошел визуальных агентов на базе GPT-4o и превзошел OpenAI CUA в 3 тестах из 4.
Проект полностью открыт: веса, код и датасет MolmoWebMix доступны по лицензии Apache 2.0.
allenai.org

✔️

Основатель FigureAI запустил стартап персонального AGI.

Бретт Адкок официально представил свой новый проект - ИИ-лабораторию Hark. Компания находилась в скрытом режиме 8 месяцев, собирая сильную команду инженеров в области программного и аппаратного обеспечения.

Адкок считает, что LLM-чатботы слишком примитивны. По его видению, настоящий AGI должен обладать долговременной памятью, глубокой персонализацией и способностью взаимодействовать с физическим миром. Hark будет создавать именно такой персональный интеллект. Система будет перенимать образ мышления пользователя, чтобы забирать на себя когнитивную нагрузку и действовать на опережение.

Несмотря на амбициозные цели, конкретных продуктов Hark пока не показал. На данный момент опубликован только концептуальный манифест и открыт список ожидания.
Brett Adcock в сети Х

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥46❤30🤔29👍13👏6😢5🤣5🥰2❤‍🔥1

15.4K views09:11

Machinelearning

Yandex B2B Tech запускает гранты на ИИ-разработку

Программа поддерживает компании, разрабатывающие цифровые продукты с ИИ для внешнего рынка. Участники могут получить грант до 1 млн рублей на создание ИИ-агентов и приложений с использованием Yandex AI Studio в течение полугода.

Компании получают экспертную и маркетинговую поддержку, а после завершения программы — скидку до 70% на платформу до 6 месяцев.

Среди первых участников: R77.ai ускоряет проверку документов для банков и страховых с помощью ML-моделей, Noumy.ai внедряет инструменты анализа кандидатов и их поведения на интервью, а GO2AI создает ИИ-агентов для стратегического планирования, сокращая цикл принятия решений с нескольких дней до часа.

Участники также могут получить софинансирование маркетинговых активностей и разместить решения на маркетплейсе Yandex Cloud. В рамках Cloud Boost стартапы уже получили 625 млн рублей на облачную инфраструктуру.

💯74👨‍💻33👍16👏12🤣7❤6🎉6🗿2🔥1

16.6K views10:11

Machinelearning

✔️

Репозиторий, который может настроить Claude

Система оптимизации производительности для AI-агентов. От победителя хакатона Anthropic.

Готовые к продакшену агенты, хуки, скилы, правила и MCP-конфигурации, которые эволюционировали за 10 месяцев ежедневной интенсивной работы над реальными продуктами.

Работает с Claude Code, Codex, Cowork и другими системами для AI-агентов.

🟡

Github: https://github.com/affaan-m/everything-claude-code

🟡

Гайд по работе: https://x.com/affaanmustafa/status/2012378465664745795

🟡

Гайд по безопасности: https://x.com/affaanmustafa/status/2033263813387223421

@ai_machinelearning_big_data

🎯Полезные Мл-ресурсы

#AI #ML #aiagents #Claude

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍84🔥31🎉11🤔6❤5💯5🤣4🥰1

17.7K viewsedited 11:15

Machinelearning

В России запустили сервис для быстрого подключения ИИ-моделей

MWS Cloud представил MWS GPT Model Hub — сервис позволяет компаниям подключать большие языковые модели к своим продуктам за несколько минут без собственной инфраструктуры.

Платформа даёт доступ к 10 открытым LLM от ведущих разработчиков, включая DeepSeek, Google и Alibaba. Модели подключаются через OpenAI-совместимый API и разворачиваются в один клик. По сути, LLM становятся таким же базовым инструментом, как базы данных или облачные хранилища.

Сервис рассчитан на разработчиков и продуктовые команды: можно быстро тестировать гипотезы, запускать AI-функции и не тратить ресурсы на поддержку инфраструктуры.

Сервис создан на базе платформы MWS GPT.

«Мы видим, что LLM становятся базовым строительным блоком цифровых продуктов, но их внедрение часто упирается в инфраструктуру и компетенции. MWS GPT Model Hub создан для того, чтобы разработчики могли использовать большие языковые модели так же просто, как любые другие облачные сервисы», — говорит гендиректор МТС Web Services Павел Воронин.

@ai_machinelearning_big_data

👍68🥱41👏23🤣17🎉13❤8🤓6🎃5🔥4🥰2😐2

17.6K views13:34

Machinelearning

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

POV: вайбкодеры в 2 ночи 🤣

@ai_machinelearning_big_data

😁135🤣65❤14💯10👨‍💻9😴8❤‍🔥4🤔2😨1

18K views14:40

Machinelearning

💰 SpaceX готовится подать заявку на крупнейшее IPO в истории США -
компания может привлечь более $75 млрд уже в ближайшее время.

По данным источников, SpaceX может подать документы регуляторам уже на этой неделе,
официально запустив процесс выхода на биржу в июне.

Это размещение может стать крупнейшим IPO в истории США.

Советники сделки ожидают, что компания привлечёт свыше $75 млрд
(ранее прогнозировали около $50 млрд),
но финальный объём и оценка будут определены ближе к размещению.

https://www.theinformation.com/articles/spacex-aims-file-ipo-soon-week

@ai_machinelearning_big_data

#spacex

Please open Telegram to view this post

VIEW IN TELEGRAM

🎉66🔥35👍21👏5🤩5❤3😁2🤨2❤‍🔥1🥰1🙏1

16.6K views16:31

Machinelearning

Forwarded from Bogatyrev Aleksei

Как я стал дата инженером с ЗП 800к

Без удачи и связей

5 лет назад я работал в техподдержке с графиком 2/2 и жестко бухал

💀

После очередной пьянки я понял, что надо что-то менять. Я решил стать дата инженером

Составил резюме на коленке. Чудом получил свою первую работу с зп 50к в месяц 😎

Отработал 4 месяца и захотел больше. Ну и погнал дальше: собесы, отказы, новые офферы

В прошлом году я пробил 800к рублей за один месяц

Я выгорал, увольнялся, снова загорался и опять шел на собесы

Задумался над своими ошибками...

Как можно избежать их? Снял на эту тему видео, в котором рассказал:

- мой путь из техподдержки до техлида с зп 800к
- какие ошибки я совершил и как их обойти
- как выглядит типичный день ДЕ

Это разбор реального пути: как с нуля дойти до первой работы дата инженером с хорошей зарплатой.

Без булшита по типу "вкатись в ДЕ за месяц" 😏

👉 Смотри видео в закрепе моего канала

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣181🤬63🔥39👏21🥱8🗿8👍4❤‍🔥3🏆3🍓3🦄3

16.6K views17:05

Первая леди встречается с первым роботом.

«Figure F.03 вошёл в историю как первый человекоподобный робот в Белом доме»

@ai_machinelearning_big_data

#ai #robots

🤔53😎22❤‍🔥17🤷13👏8❤6👍4🔥4🌭2🎃2🤗2

17.8K views18:05

Machinelearning

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

🎧 Google выпустила Lyria 3 Pro - обновлённую музыкальную модель,способную генерировать треки длиной до 3 минут.

Модель позволяет задавать интро, куплеты, припевы и бриджии создавать композиции с сложными переходами».

Доступна для всех подписчиков в Gemini.

@ai_machinelearning_big_data

👍59❤28🔥19🗿7😎6🥱2

15.3K views19:21

✔️

Apple дистиллирует Google Gemini.

В рамках партнерства с Google, Apple получила глубокий доступ к архитектуре Gemini. Инженеры используют дистилляцию знаний, чтобы перенести логику в легковесные решения для Apple Intelligence.

Модель Apple анализирует ответы и CoT Gemini, обучаясь выполнять задачи с аналогичной точностью. Главная цель - адаптация ИИ для локальной работы на iPhone без отправки данных на серверы.

Пока Apple готовит обновление Siri к июню, серверная версия Gemini продолжит обрабатывать сложные запросы.
theinformation.com

✔️

Google установила 2029 год дедлайном для перехода на постквантовую криптографию.

Ускорение миграции продиктовано темпами развития квантового оборудования и коррекции ошибок. Появление систем, способных взломать современные стандарты шифрования, произойдет быстрее, чем ожидалось.

Особую тревогу вызывают атаки «сохрани сейчас, расшифруй потом» и грядущая уязвимость традиционных цифровых подписей. Google скорректировала модель угроз, сделав приоритетом защиту сервисов аутентификации до появления криптографически значимых квантовых компьютеров.

Google уже интегрирует постквантовые подписи на базе ML-DSA (одобренного NIST) в Android 17, дополняя механизмы, развернутые в Chrome и Google Cloud.
blog.google

✔️

Arm выпустит собственные процессоры для дата-центров.

Arm отходит от лицензирования архитектуры и начинает прямые продажи чипов. AGI CPU будет производиться у TSMC: до 136 ядер при энергопотреблении 300 Вт. Процессор спроектирован для работы с ИИ-ускорителями уровня Nvidia, он возьмет на себя координацию вычислений и обработку запросов.

Основное преимущество - энергоэффективность по сравнению с x86-решениями от Intel и AMD. Первым крупным заказчиком стал Марк Цукерберг, далее инфраструктуру развернут OpenAI, Cerebras и SK Telecom. Серверные решения от Quanta и SuperMicro уже появляются на рынке, массовые поставки ожидаются во второй половине года.
bloomberg.com

✔️

Релиз бенчмарка ARC-AGI-3.

Третья версия оценивает способности ИИ к обучению на лету в формате видеоигры: более 1000 уровней в 150 средах. Агентам предстоит исследовать незнакомый мир, понимать правила без инструкций и достигать долгосрочных целей.

Новая метрика Action Efficiency оценивает, насколько эффективно ИИ адаптирует стратегию по сравнению с человеком. Топовые модели OpenAI и Google показывают результат ниже 1%.

Вместе с релизом стартовало соревнование на Kaggle с призовым фондом 2 млн. долларов. Доступен SDK для интеграции агентов, протестировать уровни можно в браузере на сайте проекта.
arcprize.org

✔️

OpenAI внедряет визуальный поиск товаров в ChatGPT.

ChatGPT стал инструментом визуального шопинга: загрузка фото для поиска похожих вещей, сравнение цен и характеристик, корректировка выдачи через диалог.

Под капотом Agentic Commerce Protocol, позволяющий ритейлерам транслировать товарные фиды и акции в систему с поддержкой популярных e-commerce платформ. Оформление заказа и платежи остаются на стороне продавца.

Для бизнеса это прямой доступ к аудитории с высокой покупательской способностью и возможность создания приложений внутри ChatGPT. Развертывание новых функций завершится до конца недели.
openai.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤75👨‍💻17🔥7🤩7👍4🤔3🍓2👏1

11.3K views05:19

Machinelearning

Forwarded from AI VK Hub

Рекомендательные системы — один из ключевых механизмов, на которых держатся современные продукты. Они помогают пользователям находить контент, товары и сервисы, а бизнесу — повышать вовлеченность и качество пользовательского опыта. Вместе с Владимиром Байкаловым, ведущим исследователем AI VK, разбираем главные тренды в рекомендациях и последние значимые работы.

🔗

Список статей

Масштабирование
🟣Действия говорят громче слов: последовательные преобразователи с триллионом параметров для генеративных рекомендаций
🟣Масштабирование трансформеров для рекомендательных систем до одного миллиарда параметров
🟣LLaTTE: законы масштабирования для многоэтапного моделирования последовательностей в крупномасштабных рекламных рекомендательных системах

Lifelong Recommendations
🟣TransAct V2: моделирование последовательностей действий пользователя на протяжении всей жизни в рекомендациях Pinterest
🟣TWIN V2: расширение моделирования ультра‑длинных последовательностей поведения пользователя для улучшения CTR‑предсказания в Kuaishou
🟣LONGER: повышение эффективности моделирования длинных последовательностей в промышленных рекомендательных системах
🟣Укрощение ультра-длинных последовательностей пользовательского поведения в генеративных рекомендациях на уровне сессий

Generative Retrieval
🟣Память трансформера как дифференцируемый поисковый индекс
🟣Рекомендательные системы с генеративным поиском
🟣Sparse Meets Dense: унифицированные генеративные рекомендации с каскадными разреженно-плотными представлениями

Semantic IDs
🟣Повышение стабильности эмбеддингов в рекомендательных системах с помощью Semantic ID
🟣ActionPiece: контекстная токенизация последовательностей действий для генеративных рекомендаций
🟣Обучаемая токенизация объектов для генеративных рекомендаций
🟣Semantic ID переменной длины для рекомендательных систем

End to End Рекомендации
🟣OneRec: объединение retrieval и ranking в генеративной рекомендательной модели с итеративным выравниванием предпочтений
🟣OxygenREC: генеративный фреймворк, следующий инструкциям, для рекомендаций в электронной коммерции
🟣EGA: унифицированный end-to-end генеративный фреймворк для промышленных рекламных систем

LLMxRecSys
🟣PLUM: адаптация предварительно обученных языковых моделей для генеративных рекомендаций промышленного масштаба
🟣OneRec‑Think: рассуждение в тексте для генеративной рекомендации
🟣ReaSeq: использование мировых знаний через рассуждение для последовательного моделирования

#aivk #recsys

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤓12👍5👏5❤1🤨1

4.27K views09:55

About

Blog

Apps

Platform