muvera-py
MUVERA-PY — высокоэффективный алгоритм многовекторного поиска на GitHub, позволяющий быстро и точно искать по огромному количеству документов.
Это Python-реализация алгоритма Google FDE, которая с помощью техники фиксированного кодирования по размерности сжимает сотни векторов в один, ускоряя поиск более чем в 8 раз.
Ключевые особенности:
🔸 Полная совместимость с оригинальной реализацией Google на C++ с сохранением точности алгоритма
🔸 Поддержка популярных моделей многовекторного поиска, включая ColBERT
🔸 Два режима генерации FDE: для запросов и документов
🔸 Поддержка методов снижения размерности, таких как AMS Sketch, для повышения производительности
🔸 В комплекте — полный набор бенчмарков и тестов производительности
Проект содержит подробное руководство по алгоритму и тесты производительности — можно сразу использовать для оптимизации поисковых систем в продакшене.
📁 Language: #Python (100.0%)
⭐️ Stars: 177
➡️ Cсылка на GitHub
📱 @git_developer
MUVERA-PY — высокоэффективный алгоритм многовекторного поиска на GitHub, позволяющий быстро и точно искать по огромному количеству документов.
Это Python-реализация алгоритма Google FDE, которая с помощью техники фиксированного кодирования по размерности сжимает сотни векторов в один, ускоряя поиск более чем в 8 раз.
Ключевые особенности:
Проект содержит подробное руководство по алгоритму и тесты производительности — можно сразу использовать для оптимизации поисковых систем в продакшене.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍3