Обещанный пост про векторные индексы
Для таких задач и существует так называемый векторный индекс и очень часто в этом контексте всплывает библиотечка FAISS. Какие же варианты структуры индекса предоставляет эта библиотека и какие еще там есть трюки? Обсудим самые популярные варианты
Позволяет сжать вектора. Метод заключается в том, что каждый вектор разбивается на подвектора, подвектора кластеризуются и формируется новый вектор, состоящий из номеров кластеров.
Метод предлагает разбить векторное пространство на кластеры и к каждому кластеру вычислить его "центроиду". Далее сами кластеры будут храниться на диске, а маппинг центроид с кластерами в ОЗУ. Таким образом, когда вы будете искать ближайший вектор, вы сравните его с векторами центроид и для ближайшей центроиды возьмете ее кластер с векторами.
Можно сказать, SOTA метод приближенного поиска ближайших соседей, основывающийся на жадном обходе графа (по сути, как правило 7 рукопожатий. Как до любого человека можно добраться через 7 рукопожатий, так и до похожего вектора можно добраться через N прыжков по графу, где каждый вектор - это узел)
Рекомендуемые базовые конфигурации:
1млн - 10млн векторов : IVF65535_HNSW32 (Т.е. 65535 центроид и 32 слоя графов)
10млн-100млн векторов : IVF262144_HNSW32
Самостоятельно также советую изучить подходы K-D Tree, LSH и ANNOY
Где это можно применять?
Например, мой коллега Андрей, админ канала @awesome_dl , выпустил свежий пост, где создал бота для Q&A по курсу диффузионных моделей. И чтобы улучшить его планирует добавить механизм памяти, как раз через векторный индекс более чем применим. Очень полезный кейс, обязательно к прочтению. Еще рекомендую два поста про то как разобраться с диффузионными моделями и диффузионными моделями в видеогенерации
#Ботаем
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9🔥4 3
Послушал 3 доклада:
1️⃣ «Как мы делали матчинг в Купере»
Ребята матчат похожие товары, оптимизируют ручное сопоставление. Многослойная архитектура норм, но выбор кандидатной модели и метрик мне остался не совсем понятен
2️⃣ «Uplift Space Oddity, или как запустить ML-космолёт и не упасть»
Ребята оценивают аплифты промо-кампаний. Используют Т-learner (то есть не прогнозируют аплифт напрямую, а обучают 2 катбуста прогнозировать условно продажи с промо и без промо, и разницу этих двух катбустов берут за аплифт). Если честно, подход больше похож на бейзлайн (с учетом того, что, по словам докладчика, MAPE в некоторых категориях товаров достигал 50%), и стоит попробовать, как минимум, S-learner и аплифт-деревья.
3️⃣ «Как делать рекомендации не с нуля»
Доклад, ради которого пришел на митап. Это очень близко к тому, чем сейчас занимаюсь, поэтому было интересно, как делают это в Купере.
Ребята делают рекомендации в ленте пользователя. Многослойная архитектура, норм кандидатные и реранжирующие модели, но есть траблы с разнообразием выдачи, холодным стартом (это когда у пользователя нет истории заказов) и обработкой истории заказов (всего 50 последних покупок).
Кому интересно послушать доклады, вот запись митапа
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥10❤6👎1
Рейс с 7:30 перенесли на 12:00…
Давайте общаться в комментах.
Давайте ваши любимые анекдоты. Анекдот с самым большим числом лайков - получает приз :)
Приз придумаю позже (мб под автора что-то придумаю особенное)
Upd: перенесли на 16:35 😐
Давайте общаться в комментах.
Давайте ваши любимые анекдоты. Анекдот с самым большим числом лайков - получает приз :)
Приз придумаю позже (мб под автора что-то придумаю особенное)
Upd: перенесли на 16:35 😐
😁6😢4❤1
Друзья, хочется делать больше историй в канал 👉👈
Закиньте голосов в канальчик пж:
https://t.me/boost/pleshakovsky
Ps: победил вот этот анекдот https://t.me/pleshakovsky/759?comment=2659
Поздравим 👏👏👏
Закиньте голосов в канальчик пж:
https://t.me/boost/pleshakovsky
Ps: победил вот этот анекдот https://t.me/pleshakovsky/759?comment=2659
Поздравим 👏👏👏
Telegram
Канал Доброго Вани | Data Science и Продуктики
Проголосуйте за канал, чтобы он получил больше возможностей.
👍3👎2❤1🔥1 1
Думал я думал, с чем связать следующие два года своей академической жизни. Многие из вас знают о моей симпатии к Центральному Университету, но вот какую мысль я гоняю в своей голове последний год:
А почему бы не попробовать что-то новое?
Как я неоднократно упоминал постах, я приверженец бизнесового МЛ и считаю, что востребованный ДСер = ДСер умеющий приносить деньги компании. Следовательно, продуктовые скилы необходимы, и это как раз то, что мне самостоятельно достаточно трудно постигать.
Ну и для мини-продуктов своих пригодится.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19 9👍7❤4 3
Заказывали тур по Грузии 🇬🇪? Нет? Ну все равно будет
Основная валюта: Лари (1 доллар ~ 2.7 лари)
Ключевые особенности:
Тут очень свободно (есть казики, есть легалайз)
Очень вкусно кормят и поят
Балдежные горы
Стоит увидеть западную и восточную части Грузии, разделенные горными хребтами
Такси очень дешевое (работает яндекс такси)
1. Гуляем по городу: посещаем набережную, шаримся по улочкам, едем в ботаничесий сад на весь день (опционально заглядываем в казик и ловим бонуски)
2. Едем на уазиках в горы
3. Едем в парк Мтирала (там катаемся на квадриках, балдеем от гор, стреляем из калашей)
Кушаем тут, тут и тут
Я жил в Orbi City, но вам не советую. Много народу, не самые лучшие номера. Но если берете, то обязательно с видом на море
1. Гуляем по городу
2. Посещаем источники за 5 лари, набираем бутылочки горной Боржомской водички
3. Пьем вино с роскошными видами
Кушаем тут
Живем тут (отличные апарты, еще и бутылка домашнего вина в подарок)
#Путешествия
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14🔥9👍2
Продолжаем тур по Грузии 🇬🇪
Тбилиси. День 5-9
Живем тут
Кушаем тут (прям очень рекомендую), тут, ну и все остальное тоже очень славное - везде кормят вкусно (кроме рестика на пути к Казбеги, не ходите туда, даже если гид тащит за волосы)
Вобщем, как-то так отдохнуть получилось
Ps: ставьте кита, если нужен пост про Грузинский банковский счет
#Путешествия
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳22🔥18❤9 1