Big Ledovsky | AI изнутри

Forwarded from Б/У ml

Всем привет!
Хочу поделиться запуском соревы - https://ods.ai/competitions/avitotechmlcup2026

Так как времени не так много, а соревы я люблю то нашел такое хобби:
запускать соревы самому

В этот раз вложились гораздо больше чем год назад (задача про ноды):
1) Большой относительно рекомендаций объем данных - в 20 раз больше с прошлым годом
2) Более продуманная метрика - есть баланс по вертикалям + геп. В прошлый раз был весьма обрезанный датасет
3) Гораздо ближе к текущему проду чем в прошлом году - завязываемся на item_id, а не на ноды

Залетайте в соревку и делитесь инсайдами :)
PS это сорева сделана полностью на добровольных началах из за любви к ds. Ну почти - мне еще дадут мерчь :)

❤4🔥4

1.45K views16:13

Big Ledovsky | AI изнутри

Что я поменял в DS работе

Я не люблю Jupyter ноутбуки как результат DS работы 🔫 Отдельно можно поговорить почему. Но так или иначе раньше отказаться от них не получалось

Появление кодинговых агентов все поменяло. Мы с командой постепенно переходим на следующую схему

- Python скрипты
- Оформление выводов в маркдаун а затем сразу на конфлюенс
- Визуализация в streamlit

Почему

1. Выяснилось, что удобная механика «запустил ячейку, получил вывод» заменяется на «агент запустил скрипт и красиво оформил результат в markdown»

2. Клод нереально быстро клепает стримлит. А стримлит это полноценный дашборд / data app. Для каждого проекта я делаю свой стримлит, как полноценный сервис в кубере. Выкатывается одной командой и сразу доступен коллегам

Ноутбуки остаются только как средство вручную что-то покопать. Для чего они и нужны 😌

Please open Telegram to view this post

VIEW IN TELEGRAM

streamlit.io

Streamlit • A faster way to build and share data apps

Streamlit is an open-source Python framework for data scientists and AI/ML engineers to deliver interactive data apps – in only a few lines of code.

❤18🔥14

1.8K views07:31

Big Ledovsky | AI изнутри

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

Собираюсь на Inside AI Meetup от Wildberries & Russ

Программа очень интересная: LLM, поиск, рекомендации, модерация, ML инфра. Собираюсь пойти сам и готов порекомендовать остальным. Вот чуть более подробное описание.

—

На митапе обсудят реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов.

▫️Выступать будут: эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot.

▫️Кому будет интересно: senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене.

▫️Когда и где: 20 мая, старт в 15:00. Москва + онлайн-трансляция.

Регистрируйтесь и приглашайте коллег! Подробности — на сайте.

🔥63

1.51K views08:01

Big Ledovsky | AI изнутри

История блокировки не клода

Телеграм гудит от массовой блокировки аккаунтов клода россиян 🔫. Вот вам другая свежая история.

Мы какое-то время назад создали аккаунт OpenAI. Все официально, в белую, на рабочие почты. Компания у нас международная. Положили денег, стали использовать, подняли тир. И тут нас резко банят. Всем, кто был добавлен в организацию приходят отбивки о блокировке. Причина.. дистиляция. Деньги которые мы положили естественно не вернули 💸 (хотя честно говоря это последнее, что меня беспокоило).

Никакой дистиляции конечно мы не делали. Размечали релевантность поиска и тюнили промпты для переводов. Видимо за тюнинг промптов через DSPy нас и забанили.

Мы написали с двух аккаунтов аппеляцию, что мы ничего плохого не делали. Две недели ответа не было и мы уже думали куда писать дальше (например, чуваку на форуме в такой же ситуации помогло только публично пожаловаться, что ему не отвечают). Неожиданно через две недели на один аккаунт пришел ответ, что мы были заблокированы ошибочно и этот аккаунт разблокировали. Правда автоматика работает странно и все остальные аккаунты все равно не разбанили. Нужно теперь и с ними что-то делать 🦶

Мораль

Завязываться на внешних провайдеров LLM опасно. Однако использовать их все равно нужно. Поднимать топовые модели самим - нужно иметь вескую причину и огромный бюджет на железо. Не говоря уже о том, что закрытые модели сейчас работают реально лучше.

Не завязывайтесь на одного провайдера. Продумывайте план, если вас отключат, чтобы у вас не встал прод. Мы именно это и сделали.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤19🔥5🤯5

1.61K viewsedited 17:41

Big Ledovsky | AI изнутри

OpenAI прекращают поддержку файнтюнинга моделей

Новость, которая отражает какие подходы побеждают, а какие проигрывают 💀

Насколько я вижу вокруг: вау решений на LLM, дообученных LoRa адаптерами не получается. Хотя я не настолько категоричен как автор LLM под капотом, который считает эту ветку тупиковой.

Дообучением занимаются, когда хотят получить хороший результат на маленькой модели. Но это трудозатратный и нестабильный метод.

Лучше сперва делать решение на больших моделях, а затем думать как удешевить.

Мы так и поступили на нескольких проектах. В одном кейсе экономика на самом деле уже сошлась. А если что, ее можно удешевить продуктово, ограничив тех, на кого раскатывается фича.

А в другом экономика тоже сходится, но хочется более быстрых ответов. Поэтому мы обучаем легкий декодер (не факт что на основе LLM). Интересно что получится. У нас оптимистичные ожидания 😎

Please open Telegram to view this post

VIEW IN TELEGRAM

LLM под капотом

OpenAI осознали бесперспективность файн-тюнинга моделей

7 Мая OpenAI оповестили разработчиков, что лавочка закрывается. Новые компании уже больше не могут запускать задачи тюнинга. В течение полугода закроют возможность даже для тех, кто уже тюнил. А возможность…

🔥8

1.49K views12:01

Big Ledovsky | AI изнутри

Моя фабрика разработки на claude code, n8n и jira

Хочу в двух словах рассказать к чему я пришел очень плотно работая на claude code с января. Прочитав статью Harness Engineering от OpenAI и послушав других людей я понял, что нужно стремиться к увеличению автономности кодиногвых агентов. Я начинал с интерактивной работы с claude и в итоге дошел до создания своей фабрики.

Общая архитектура. С помощью n8n у меня подняты workflow с 3-мя агентами, которые запускаются каждую минуту. Два workflow впомогательные, нужны чтобы разворачивать и удалять рабочее окружение. И один workflow запускает основного агента, который выполняет задачу. Каждый workflow включает получение задачи из jira, сбор контекста и запуск команды claude code —agent agent-name

Основной агент использует 3 режима: PLAN, EXECUTE, FIX. Каждый запуск (который происходит раз в минуту) агент получает таску, выбирает режим, отрабатывает, обновляет Jira и засыпает

- PLAN декомпозирует задачу на сабтаски. PLAN вызывается в начале, либо в процессе, если в комментариях написать новые требования

- EXECUTE делает одну сабтаску за раз, т.е. реализует Ralph Loop

- FIX читает комментарии в джире и делает небольшие правки не входя в планирование

Jira используется для заведения требований и написания фидбека агенту. Для передачи контекста между запусками используется специальный MD файл.

Дополнительно я реализовал "ручной режим". Скилл, который позволяет запустить агента руками, прочитать контекст задачи и доделать что-то в интерактивном режиме.

По итогу, я могу паралелльно делать 4 задачи. Больше не получается - нужно писать требования в джире и ревьюить результаты.

🔥19❤6

1.6K views12:08

Big Ledovsky | AI изнутри

Удивился решению Майкрософта срезать косты на Claude 😏. Не смогли найти 100 долларов в месяц на разработчика? В ту же сторону отреагировал убер

💬 Мысли по теме

- Факт, что при неаккуратном использовании на агентах можно сжигать нереальное количество денег. Я недавно пробовал запускать Hermes на Opus 4.7. Расхотелось 😅

- Просто подписка на курсор или клод код многократно себя окупает. Это видно невооруженным взглядом без всяких аб тестов

💬 Чтобы AI не стал только лишь дополнительным финансовым бременем 🔫, нужно делать две вещи.

1. Вводить политики на траты сверх обычных подписок. Например, включать бюджет на AI в бюджет проектов. У меня вот есть такой бюджет на DS функцию и я трижды думаю на что его тратить.

2. Закладывать сокращение количества сотрудников на тот же объем работы. Иначе это правда все бессмысленно.

Майкрософту сложно быстро отреагировать на такую смену парадигмы. Я думаю, что кран прикрыт временно. Либо они будут просто использовать не Антропик.

Please open Telegram to view this post

VIEW IN TELEGRAM

Data Secrets

После утренней новости про отказ Microsoft от Claude Code выяснилось, что они в своих идеях не одиноки

Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи…

🔥3❤2💯1

1.53K viewsedited 07:36

Big Ledovsky | AI изнутри

Какой алгоритм рекомендаций победил в Avito ML Cup

Пока на разных днях датафеста рассказывали про трансформерные рекомендации, интересно было посмотреть, что нарешали победители соревнования, про которое я писал. Напомню, что датасет был серьезный - 5kkk взаимодействий.

🔜

Как вы наверное догадались, это не трансформер. И самое интересное, что не ALS

Победил графовый кандидатогенератор. Базовая идея этого алгоритма очень простая. Это когда вы ходите по графу взаимодействий: юзер - айтем на который он кликал - другой юзер - новый айтем. И так при желании какое-то количество раз. Дальше у алгоритма есть усложнения, как ходить лучше, чем случайно. Примеры вариаций: Pixie от Pinterest аж 2017 года и RP3beta аж 2016 года.

🔜

Все топ решения использовали подобные кандидатогенераторы и ранжирование бустингом поверх

Интересно, почему получилось так? Может быть виной хитрая метрика, которая усредняет перформанс по разным вертикалям (товары, услуги итд). Может быть то, что оставили только прогретых пользователей, у которых был контакт. Может быть гэп в 12 часов между трейном и валидацией. А может быть было мало данных на такой объем пользователей и айтемов. Говорят, трансформер не выучивал item_id (хотя они уже были semantic id).

По итогу, соревнование показало пример, что хорошие рекомендации можно построить достаточно простым подходом.

YouTube - Запись разбора решений
Б/У ML - Канал Толи, автора сорева

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

30 мая — Data Fest 2026 / Соревновательный трек

AvitoTech х Data Fest 2026, день 8: офлайн в Москве 30 мая

В программе данной трансляции доклады:
• ML & Education от сообщества ODS
• соревновательный трек AvitoTech ML CUP 2026 и не только!
Полное расписание: https://ods.ai/events/fest2026-avito-msc/schedule…

🔥13❤5

1.79K viewsedited 11:05

Big Ledovsky | AI изнутри

Я заметил, что мало у кого в итоге прижились OpenClaw, Hermes и похожие агенты 🦀

Проблема OpenClaw как класса агентов, что люди им играются и бросают. Почему, можно описать одним примером.

Допустим, человек просит вести за него задачи и планировать время. Но до этого он что-нибудь делал? Есть ли у него привычка записывать задачи? Умеет ли вообще придерживаться расписания?

Поставит ему агент с 6 до 8 утра слот учить data science, он все равно не проснется. Дело не в инструментах, дело в человеке 🤷‍♂️

Please open Telegram to view this post

VIEW IN TELEGRAM

💯15🌚3🤨3❤2

1.33K views07:27

Big Ledovsky | AI изнутри

«Это Гулаг» - что происходит в Мете*

Эту историю на прошлой неделе мне рассказал один знакомый. Я честно говоря поделил на 10, но тут новости просто взорвались.

Мета принудительно отправила 6.5 тысяч инженеров размечать данные для AI на фул-тайм. Люди бунтуют.

Выглядит ооочень плохо. Принудиловка требует либо большой кредит доверия у компании, либо хорошую компенсацию взамен. Учитывая ситуацию с волнами сокращений, ни того ни другого нет.

Мета очевидно отстанет в AI гонке и хочет это изменить. Но вместо камбека пока получается саморазрушение 🏌️

* запрещенная организация в РФ

https://techcrunch.com/2026/06/12/metas-months-old-ai-unit-is-a-soul-crushing-gulag-say-the-engineers-stuck-inside-it/

Please open Telegram to view this post

VIEW IN TELEGRAM

TechCrunch

Meta's months-old AI unit is a soul-crushing gulag, say the engineers stuck inside it | TechCrunch

A new report suggests the unit, which employs 6,500 people, is on the verge of revolt.

🤯13😁5😱32❤1

1.7K views08:41

Big Ledovsky | AI изнутри

0:44

Media is too big

VIEW IN TELEGRAM

Коллеги прислали. Говорят про меня 🤷‍♂️🙈

😁29💯12🤣7😱1

1.21K views08:21

Big Ledovsky | AI изнутри

Прохожу новый курс

Начал проходить Стэнфордский курс Language Modeling from Scratch

Моя цель - проходить по два курса в год. Зимой я проходил курс по программированию на CUDA, теперь вот учусь обучать LLM с нуля.

➡️ Мысль за этим следующая. Во-первых, чтобы хорошо делать свою работу, нужно иметь знания на 1-2 уровня глубже чем используешь в повседневной деятельности. Во-вторых, в части задач я все-таки рассчитываю, что мы начнем использовать легкие зафайнтюненные LLM-ки. Чтобы сэкономить, снизить лейтенси и главное - быть менее зависимыми от внешних API. Но тут хз, непонятно, что будет с областью через пару лет 🤷‍♂️

Прикольный курс. Я пока не смотрю лекции, только делаю домашки. Лекции буду смотреть по факту, когда сделаю. То, что ты не трогаешь руками - не откладывается. На этом курсе абсолютно шикарные домашки с хорошими тестами. Курс рассчитан в том числе и на самостоятельное прохождение.

Уже написал и обучил токенизатор с нуля, сейчас пишу компоненты LLM на торче.

➡️ Из интересного, с домашками идут настройки Клода и Кодекса, которые не дают агенту напрямую писать код за студента, но дают отвечать на вопросы и помогать искать ошибки. Супер полезно.

Буду делиться впечатлениями!

Please open Telegram to view this post

VIEW IN TELEGRAM

Stanford CS336

Stanford CS336 | Language Modeling from Scratch

Official course website for Stanford CS336: Language Modeling from Scratch (Spring 2026), including logistics, schedule, assignments, and course materials.

🔥41❤2

900 views07:45

Big Ledovsky | AI изнутри

Люблю Дорофеева за философский подход к продуктивности. Кто тоже любит, рекомендую свежий подкаст.

Джун: не использует техники продуктивности, вокруг пожары

Мидл: обмазан миллионом техник продуктивности, пожаров нет, но очень тревожный и результаты не выдающиеся

Мастер: не использует никаких техник, достигает выдающихся результатов естественно и спонтанно (на первый взгляд)

https://youtu.be/7Ipt0a43U4Q?si=lVkky-fdeqqz0X2q

YouTube

Джедайские техники Максима Дорофеева: продуктивность, созвоны, выгорание и главный миф о времени #86

🔹 Присоединяйся к курсу «ИИ для разработчиков» https://ru.hexlet.io/programs/ai-for-developers?utm_source=youtube

В этом выпуске у меня в гостях Максим Дорофеев — автор «Джедайских техник», книг, которые для многих стали первой серьёзной попыткой разобраться…

❤3🔥1

322 viewsedited 13:40

About

Blog

Apps

Platform