Интересное что-то

💳

Turbo ML Conf 2025

Уже 2-ой год подряд Т-банк проводит свою конференцию, в этом году понравилось еще больше чем в прошлом:
- Отличная площадка проведения, конференция проходила в 3-х этажном здании кластера Ломоносов от МГУ, залы были с мягкими стульями, а зал по NLP (мб еще какие-то, где я не был) вообще киношного стиля с рядами на разной высоте и мягкими креслами - за это отдельный +реп.
- Интересные доклады по разным трекам, по CV в этом году было не очень много интересного для меня, старался больше сходить на всякие мультимодальные вещи.
- Различных активностей стало по ощущениям больше.
- Кормили хорошо.

Доклады
1. "Мультимодальные трансформеры в рекомендациях — лучшее, что с нами случалось, или все-таки нет" - было прикольно послушать про рекомендации, которые ребята у себя делают в одной из команд Т-банка, но ожидал больше деталей про мультимодальность и какие-то подводные камни с ней связанные, было в основном про SASRec, который ребята делали и чуть-чуть про мультимодальность. Оценка 3/5.

2. "Visual Language Models: архитектурные решения и опыт внедрения в Авито" - хороший доклад, я бы сказал, что лучший из тех на которых я был, рассказали про VLM в Авито, зачем и как применяют VLM, какие сложности были в процессе внедрения и как их решали. Оценка 5/5.

3. "Как сделать сервисную команду эффективной с помощью AutoML?" - доклад про то как делали платформу с AutoML для снижения нагрузки на разработчиков и предоставлении готового инструмента заказчикам, интересно было послушать про сложности и ограничения с точки зрения ресурсов (как вычислительных, так и человеческих), но как мне кажется, все равно данный инструмент не позволит решать сложные задачи. Оценка 4/5.

4. “GigaSynthol: синтетические данные для предобучения языковых моделей” - самый печальный (на мой взгляд) доклад, во-первых: он шел всего 10-15 минут, во-вторых: не было каких-то интересных вещей про синтетические данные, были примеры промптов и виды данных которые собирали, на этом по сути все. Оценка 1/5.

5. "SAE: что мы исследуем и почему" - интересный ресерч доклад про то, как обучали Sparse Autoencoder (SAE) для интерпретируемости фичей, рассказали зачем вообще это нужно, какие есть ограничения и подводные камни. Оценка 5/5.

P.S. кстати разбор статьи по схожей теме от Antropic был недавно в посте.

6. "Высоконагруженный RAG в 2025 году" - рассказали про применение RAG в большой поисковой системе, понравилось про различные этапы с разными объемами данных и разными подходами в условиях различных вычислительных ограничений каждой из стадий, по сути показали как сделать из обычного RAG большую гибридную систему с несколькими моделями разных размеров, а также дополнительной логикой вообще без тяжеловесных моделей. Оценка 5/5.

7. "VLM в Умной камере" - про применение VLM для обработки документов, какие данные собирали и как дообучали модель, честно говоря к этому моменту я уже подустал и не супер внимательно слушал, поэтому оценивать данных доклад не буду, но послушать было интересно.

Также на самой конференции ребята анонсировали релиз T-pro-2.0 - своей LLM адаптации Qwen3-32B под русский язык и выложили датасеты T-Wix (SFT датасет на русском языке), T-Math (олимпиадные задачки по математике на русском языке).

Оценка конференции: 5/5.

#conference

Please open Telegram to view this post

VIEW IN TELEGRAM

Turbo ML Conf

Делимся опытом, разбираемся в трендах и погружаемся в кейсы

55 views15:37