Forwarded from Machinelearning
Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.
TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.
KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.
Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.
Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.
На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.
Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".
Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.
При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.
Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.
Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.
@ai_machinelearning_big_data
🎯Полезные Мл-ресурсы 🚀 Max
#AI #ML #LLM #TurboQuant #Google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10🔥10👍3
🤖 Spacebot: AI для команд и сообществ
Spacebot — это мощный AI-агент, созданный для работы в многопользовательских средах, таких как Discord и Slack. Он обрабатывает множество запросов одновременно, не блокируя пользователей и не теряя контекст. Идеально подходит для активных сообществ и команд, обеспечивая эффективное взаимодействие и выполнение задач.
🚀 Основные моменты:
- Поддержка одновременных разговоров и задач.
- Интеграция с Discord, Slack и Telegram.
- Специализированные процессы для выполнения различных задач.
- Возможность развертывания через один клик или самостийно.
- Многофункциональные инструменты для работы с файлами и кодом.
📌 GitHub: https://github.com/spacedriveapp/spacebot
#rust
Spacebot — это мощный AI-агент, созданный для работы в многопользовательских средах, таких как Discord и Slack. Он обрабатывает множество запросов одновременно, не блокируя пользователей и не теряя контекст. Идеально подходит для активных сообществ и команд, обеспечивая эффективное взаимодействие и выполнение задач.
🚀 Основные моменты:
- Поддержка одновременных разговоров и задач.
- Интеграция с Discord, Slack и Telegram.
- Специализированные процессы для выполнения различных задач.
- Возможность развертывания через один клик или самостийно.
- Многофункциональные инструменты для работы с файлами и кодом.
📌 GitHub: https://github.com/spacedriveapp/spacebot
#rust
🔥4🗿3🖕2🤣1💅1
📘 На Stepik вышел курс — «Rust для профессионалов»
Уже уверенно пишете на Rust и готовы к новым вызовам? Этот курс — именно то, что нужно, чтобы вывести свои навыки на экспертный уровень.
🔍 Что вы получите:
• Глубокое понимание ключевых тем: generics, lifetimes, async, управление памятью
• Решение реальных инженерных задач: параллелизм, системное программирование, архитектура
• 150 интерактивных заданий с автопроверкой — всё в браузере, без установки, в удобное для вас время
🎓 Сертификат по завершении — добавьте его в резюме или профиль LinkedIn
🚀 Прокачайте Rust с пользой и удовольствием. Начните уже сегодня и получите скидку 25%, которая действительна в течение 48 часов
👉 Пройти курс на Stepik
Уже уверенно пишете на Rust и готовы к новым вызовам? Этот курс — именно то, что нужно, чтобы вывести свои навыки на экспертный уровень.
🔍 Что вы получите:
• Глубокое понимание ключевых тем: generics, lifetimes, async, управление памятью
• Решение реальных инженерных задач: параллелизм, системное программирование, архитектура
• 150 интерактивных заданий с автопроверкой — всё в браузере, без установки, в удобное для вас время
🎓 Сертификат по завершении — добавьте его в резюме или профиль LinkedIn
🚀 Прокачайте Rust с пользой и удовольствием. Начните уже сегодня и получите скидку 25%, которая действительна в течение 48 часов
👉 Пройти курс на Stepik
Stepik: online education
Rust для профессионалов
Курс Rust для профессионалов предоставляет все необходимые навыки для уверенного освоения языка.
Вас ждёт более 150 практических задач разного уровня сложности, охватывающих ключевые темы — от базового синтаксиса до работы с памятью, многопоточности и веб…
Вас ждёт более 150 практических задач разного уровня сложности, охватывающих ключевые темы — от базового синтаксиса до работы с памятью, многопоточности и веб…
😡4
🦀 Вышел Rust 1.94.1
Команда Rust выпустила новый патч-релиз - 1.94.1.
- это не новый функциональный релиз
- исправляет 3 ошибки, появившиеся в 1.94.0
Обновиться можно одной командой:
Rust 1.94.0 (предыдущий релиз) принёс реальные изменения:
- новые API и улучшения стандартной библиотеки
- улучшения Cargo и конфигов
- расширение поддержки платформ (включая RISC-V)
- обновления Unicode и lint’ов
👉 А вот 1.94.1 - это чисто «починка после релиза»:
фиксит баги, которые всплыли сразу после выхода 1.94.0
Вывод:
- если ты уже на 1.94.0- обновляться обязательно
- если нет, просто ставь 1.94.1 и не думай
Классический Rust-подход:
сначала выкатывают фичи → потом быстро стабилизируют продакшен
https://blog.rust-lang.org/2026/03/26/1.94.1-release/
Команда Rust выпустила новый патч-релиз - 1.94.1.
- это не новый функциональный релиз
- исправляет 3 ошибки, появившиеся в 1.94.0
Обновиться можно одной командой:
rustup update stableRust 1.94.0 (предыдущий релиз) принёс реальные изменения:
- новые API и улучшения стандартной библиотеки
- улучшения Cargo и конфигов
- расширение поддержки платформ (включая RISC-V)
- обновления Unicode и lint’ов
👉 А вот 1.94.1 - это чисто «починка после релиза»:
фиксит баги, которые всплыли сразу после выхода 1.94.0
Вывод:
- если ты уже на 1.94.0- обновляться обязательно
- если нет, просто ставь 1.94.1 и не думай
Классический Rust-подход:
сначала выкатывают фичи → потом быстро стабилизируют продакшен
https://blog.rust-lang.org/2026/03/26/1.94.1-release/
👍14❤5🖕2😁1😢1👾1