ML for Value / Ваня Максимов

Middle+ ML engineers ко мне в команду рекомендаций Я.Маркета (3 вакансии)
300-400к руб на руки
Москва, Спб или remote
*если вы senior - тоже пишите, договоримся)

Наша команда рекомендаций Яндекс.Маркета делает персональные рекомендации товаров на главной странице, подбирает похожие и сопутствующие товары, персонализирует поиск, crm-коммуникации и другие поверхности. Мы - бизнесовая команда, которая приносит прямой прирост выручки/прибыли компании в АВ-тестах. Баланс бизнес-рисерч у нас 80-20

Сейчас мы ищем уверенных ML инженеров на 3 трека: нейросетевые рекомендации, более классический recsys + discovery, СRM-персонализация.
Внутри команды со временем трек можно менять, это скорее фокус на ближайшие полгода

1. Нейросетевые рекомендации
Предстоит работать в первую очередь над трансформерной моделью ARGUS-8k, глубоко погружаться в архитектуру

- Добавление новых входных данных для нейросетей: поисковые запросы, новые типы действий (шеринг ссылки на товар), фичи пользователей и тп
- Эксперименты с эмбеддингом товара: что из текстового описания и характеристик использовать, как учесть картинки товаров, semantic id и дп
- Эксперименты с архитектурой: добавление отдельной головы под новый таргет, изменение лосса и тп
- Адаптация моделей под сценарии: рекомендации на главной странице, товары-аналоги (учет контекста основного товара), поиск (учет контекста поискового запроса)
- Анализ наших данных и поиск точек роста в ML-моделях через новые таргеты, входные данные или фичи

2. RecSys и Discovery
Нужно оптимизировать не только количество действий пользователя в моменте (заказы, корзины и тп), но и учитывать юнит экономику товара
+ оптимизировать долгосрочный LTV пользователя. С нейронками работать тоже нужно, но без настолько глубокого погружения как в выкансии выше: и BERT-ы для похожих товаров учить, и LLM-ки применять, и многое другое.
Основы нашей архитектуры рекомендаций можно посмотреть в докладе на highload

- Эксперименты с таргетом ранжирующих моделей: как учесть юнит экономику товаров? как балансировать текущий интерес и новые discovery категории для пользователя?
- Discovery брендов: например, как любителям одежды показывать новые фэшн-бренды?
- Lifelong рекомендации: как запомнить релевантные интересы пользователя из далекого прошлого? Купил сноуборд 1,5 года назад (интерес/хобби - катание на сноуборде) -> рекомендуем ботинки для сноуборда или горнолыжный шлем сейчас
- Развитие моделей для подбора товаров-аналогов: коллаборативная фильтрация, статистическая со-встречаемость (PMI, swing, ...), BERT и тп
- Внедрять и улучшать LLM для рекомендаций
- Анализ наших данных и поиск точек роста в ML-моделях через новые таргеты, фичи или бизнес-логику

3. Персонализация CRM
- Строить ML-модели склонности к покупке категорий и брендов (Catboost, ALS, LightFM, трансформерные модели)
- Uplift-модели для коммуникаций с пользователем
- Определять персональную контактную политику (как часто коммуницировать? в какие дни и время?)
- Запускать АВ-тесты и влиять на бизнес-метрики
- Анализ наших данных и поиск точек роста в ML-моделях через новые таргеты, фичи или бизнес-логику

Что жду от кандидата
- Опыт работы в ML/DL от 1 года
- Python, Airflow
- SQL
- A/B тестирование и статистика
- Классический ML: catboost и способы генерации фич, ml-метрики
- Базовые знания в DL: эмбеддинги, типы слоев, функции активации, attention
- (доп для DL) Глубокое понимание нейросетей в NLP или RecSys: BERT-подобные модели

Будет плюсом
- Продакшен опыт работы с задачами поиска или рекомендаций
- Опыт работы с LLM: rag, sgr, so
- (доп для DL) Опыт с нейросетевыеми моделями рекомендаций: SASRec, HSTU

🔤 Резюме можно присылать напрямую мне в лс - @Ivan_maksimov

UPD 22 янв. Спасибо большое всем, кто откликнулся! Я не ожидал, что будет так много желающих: на ближайшие пару недель мы заняли все слоты собеседующих:) Поэтому временно резюме больше не принимаю, чтобы оперативнее отсобесить текущий пул кандидатов. Если откроем найм вновь - обязательно сообщу 😊

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

ARGUS: как масштабировать рекомендательные трансформеры

Привет! Меня зовут Кирилл Хрыльченко. Я руковожу командой, которая занимается R&D для рекомендательных технологий в Яндексе. Одна из наших основных задач — развивать...

1🔥28❤12👍10😱1

3.76K viewsedited 07:34

ML for Value / Ваня Максимов

Не проводи АВ-тест, пока не прочитаешь этот пост
Да-да, это кликбейтный заголовок)

Остановись на минутку. Вероятно, прямо сейчас у тебя идет какой-то АВ-тест. Вот скажи, зачем ты его проводишь?
Вроде понятно, что это нужно для честного замера метрик. Но зачем их честно замерять? Попробуй ответить на несколько подряд идущих "Зачем?"

Не только же для аналитического удовольствия мы АВ-тесты крутим 😅

А зачем нужны АВ-тесты на мой взгляд, можно почитать ниже:

1. Не катить в прод красные фичи с падением бизнес-мерик + находить баги
Все хотят новой фичей нанести благо компании (все же, да?). Но по ходу написания фич периодически вылезают проблемы: забыли корнер кейс, не рассчитали нагрузку, отсортировали реком ленту в обратном порядке (тут и я грешен) - все это не всегда можно отловить на ручном/авто-тестировании. АВ как финальный босс покажет явные слабости и баги

2. Не катить в прод серые фичи без изменения метрик = сильно снижаем тех долг и упрощаем систему
Это нас частично избавляет от напиливания фич ради фичей, а не реальной пользы. Плюс, меньше кода в проде - проще система, быстрее внедрять изменения и меньше времени на тех долг. По сути, экономия на часах разработки ну или на токенах ai-агентов, если вы уже в будущем, где они пишут подакшен код)

3. Понимать, что работает, а что нет = выявлять направления развития
Если просто делать тикеты без оценки эффекта, то не получится узнать, что реально дает доп метрики и на чем стоит фокусироваться. Можно год оптимизировать UI и гордо говорить, что мы молодцы. А можно посмотреть на результаты пары АВ и увидеть, что конверсия от этого прекрасного UI не меняется - гораздо раньше переключиться на что-то другое

4. Оценивать команды по реальному вкладу
Я сторонник того, что практически любую метрику можно свести к итоговому эффекту на выручку/прибыль компании. Соответственно, работу любой команды над ее метрикой можно свести к влиянию на выручку/прибыль = легко оценить их вклад и сравнить между собой

Я знаю единственный кейс, где это и правда сложно: команды, которые строят совсем новые направления, такие мини-стартапы внутри компании. И то только потому, что их влияние долгосрочное, а не в моменте. Но и его оценить можно (существует же оценка стоимости стартапов как-никак)

💬 Можете поспорить со мной про DWH, BI, поддержку и другие команды, кого якобы "нельзя оценить в приросте денег компании" в комментариях:)

❤16👍9🔥6🗿3💅2

3.39K viewsedited 11:12

ML for Value / Ваня Максимов

LLM долгосрочные интересы пользователя

Понемногу LLM-ки находят полезное применение в рекомендациях!

Обычная реком система упрощенно устроена так:
- Модель на короткой realtime истории пользователя (SLIM, SASRec, …) вытаскивает товары текущего интереса
- Модель на очень длинной offline истории пользователя (часто ALS, LightFM) вытаскивает некие долгосрочные интересы
- Их результаты смешиваются и переранжируются

Есть гипотеза, что кусочек с длинной историей можно обрабатывать LLM-кой и вытаскивать оттуда доп профит!

Отчасти такой подход сработал в Taobao (их модель RecGPT v2). Ну и мы в Я.Маркете тоже внедрили свою адаптацию - Влад из моей команды недавно рассказал об этом на ML Party

Подход относительно простой, но с кучей подводных камней: о них как раз в нашем докладе 😎

❤8👍5🔥4😎1

2.53K views08:07

ML for Value / Ваня Максимов

LLM - велосипед в новой обертке

Холиварный пост выходного дня)
Доля правды в этом есть - и это наоборот круто!

LLM научились довольно неплохо решать в zero shot режиме (без обучения на доп данных) классические задачи:

- Классификация текста
- Named entity recognition (NER)
- Суммаризация текста
- Question answering по тексту (хотя тут еще есть куда расти)

Куча бизнес-задач = комбинация нескольких таких простых классических задач

🆘 Автоматизация поддержки пользователей = Классифицировать запрос пользователя + достать нужный кусок документации / инфы о юзере из базы данных (RAG) + ответить на вопрос по вытащенным данным (question answering)

И если раньше на каждый кусочек задачи нужно было учить свои модели, что долго/дорого, то сейчас это решает LLM…не всегда дешево, но заметно быстрее!

Подобных примеров в бизнесе еще довольно много: автоматизация пушей, генерация простого контента по шаблону, …

P.S. Настоящий reasoning я пока вижу только на очень «строгих» и задачах с понятными критериями успеха: написание отдельных кусков кода и решение не оч сложных математических задач

В общем, решать много простых задач = решать и сложные задачи, которые можно разделить на несколько простых. И тогда хорошо решать простые задачи = успех 🚀

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🔥4😁3

2.74K views09:21

ML for Value / Ваня Максимов

Начинать писать после перерыва всегда непросто, поэтому пока легкий пост про мои новости)

Официально стал частью Transactional AI в Яндексе 🤖
Помимо персонализации всего в Я.Маркете буду делать ИИ-агентов для покупок товаров

Съездил на теннисный турнир Barcelona Open 🎾
Мой первый турнир в качестве зрителя - это конечно топ! В полуфинале Рублев был крут, но и восходящие звезды Фис и Ходар впечатлили.
Теперь еще больше мотивации все же сыграть и самому pro турнир уровня сильно пониже: ATP 15/25

Отметил 4ую годовщину с моей женой ❤️
Лучшее решение, всем советую)

Бодро иду к своим 30 годам: записался на все чекапы и операции на год вперед

🔴

Собираю базу данных анализов для ~~терапевта~~ gpt :)
Возобновил регулярный спорт: бег, качалка, теннис и улучшил питание

Вот такие новости: а дальше пойдут посты про фейлы в ml — stay tuned, будет интересно!

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤42👍17🔥9

1.49K views08:04

About

Blog

Apps

Platform