Big Ledovsky | AI изнутри
1.84K subscribers
228 photos
18 videos
4 files
190 links
Александр Ледовский
Head of AI | stealth ecom стартап, ex: Avito, Сбер, ШАД
ML в проде и что реально происходит в AI
DS карьера и менеджмент

@aledovsky
Download Telegram
OpenAI прекращают поддержку файнтюнинга моделей

Новость, которая отражает какие подходы побеждают, а какие проигрывают 💀

Насколько я вижу вокруг: вау решений на LLM, дообученных LoRa адаптерами не получается. Хотя я не настолько категоричен как автор LLM под капотом, который считает эту ветку тупиковой.

Дообучением занимаются, когда хотят получить хороший результат на маленькой модели. Но это трудозатратный и нестабильный метод.

Лучше сперва делать решение на больших моделях, а затем думать как удешевить.

Мы так и поступили на нескольких проектах. В одном кейсе экономика на самом деле уже сошлась. А если что, ее можно удешевить продуктово, ограничив тех, на кого раскатывается фича.

А в другом экономика тоже сходится, но хочется более быстрых ответов. Поэтому мы обучаем легкий декодер (не факт что на основе LLM). Интересно что получится. У нас оптимистичные ожидания 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8
Моя фабрика разработки на claude code, n8n и jira

Хочу в двух словах рассказать к чему я пришел очень плотно работая на claude code с января. Прочитав статью Harness Engineering от OpenAI и послушав других людей я понял, что нужно стремиться к увеличению автономности кодиногвых агентов. Я начинал с интерактивной работы с claude и в итоге дошел до создания своей фабрики.

Общая архитектура. С помощью n8n у меня подняты workflow с 3-мя агентами, которые запускаются каждую минуту. Два workflow впомогательные, нужны чтобы разворачивать и удалять рабочее окружение. И один workflow запускает основного агента, который выполняет задачу. Каждый workflow включает получение задачи из jira, сбор контекста и запуск команды claude code —agent agent-name

Основной агент использует 3 режима: PLAN, EXECUTE, FIX. Каждый запуск (который происходит раз в минуту) агент получает таску, выбирает режим, отрабатывает, обновляет Jira и засыпает

- PLAN декомпозирует задачу на сабтаски. PLAN вызывается в начале, либо в процессе, если в комментариях написать новые требования

- EXECUTE делает одну сабтаску за раз, т.е. реализует Ralph Loop

- FIX читает комментарии в джире и делает небольшие правки не входя в планирование

Jira используется для заведения требований и написания фидбека агенту. Для передачи контекста между запусками используется специальный MD файл.

Дополнительно я реализовал "ручной режим". Скилл, который позволяет запустить агента руками, прочитать контекст задачи и доделать что-то в интерактивном режиме.

По итогу, я могу паралелльно делать 4 задачи. Больше не получается - нужно писать требования в джире и ревьюить результаты.
🔥196
Удивился решению Майкрософта срезать косты на Claude 😏. Не смогли найти 100 долларов в месяц на разработчика? В ту же сторону отреагировал убер

💬 Мысли по теме

- Факт, что при неаккуратном использовании на агентах можно сжигать нереальное количество денег. Я недавно пробовал запускать Hermes на Opus 4.7. Расхотелось 😅

- Просто подписка на курсор или клод код многократно себя окупает. Это видно невооруженным взглядом без всяких аб тестов

💬 Чтобы AI не стал только лишь дополнительным финансовым бременем 🔫, нужно делать две вещи.

1. Вводить политики на траты сверх обычных подписок. Например, включать бюджет на AI в бюджет проектов. У меня вот есть такой бюджет на DS функцию и я трижды думаю на что его тратить.

2. Закладывать сокращение количества сотрудников на тот же объем работы. Иначе это правда все бессмысленно.

Майкрософту сложно быстро отреагировать на такую смену парадигмы. Я думаю, что кран прикрыт временно. Либо они будут просто использовать не Антропик.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32💯1
Какой алгоритм рекомендаций победил в Avito ML Cup

Пока на разных днях датафеста рассказывали про трансформерные рекомендации, интересно было посмотреть, что нарешали победители соревнования, про которое я писал. Напомню, что датасет был серьезный - 5kkk взаимодействий.

🔜 Как вы наверное догадались, это не трансформер. И самое интересное, что не ALS

Победил графовый кандидатогенератор. Базовая идея этого алгоритма очень простая. Это когда вы ходите по графу взаимодействий: юзер - айтем на который он кликал - другой юзер - новый айтем. И так при желании какое-то количество раз. Дальше у алгоритма есть усложнения, как ходить лучше, чем случайно. Примеры вариаций: Pixie от Pinterest аж 2017 года и RP3beta аж 2016 года.

🔜 Все топ решения использовали подобные кандидатогенераторы и ранжирование бустингом поверх

Интересно, почему получилось так? Может быть виной хитрая метрика, которая усредняет перформанс по разным вертикалям (товары, услуги итд). Может быть то, что оставили только прогретых пользователей, у которых был контакт. Может быть гэп в 12 часов между трейном и валидацией. А может быть было мало данных на такой объем пользователей и айтемов. Говорят, трансформер не выучивал item_id (хотя они уже были semantic id).

По итогу, соревнование показало пример, что хорошие рекомендации можно построить достаточно простым подходом.

YouTube - Запись разбора решений
Б/У ML - Канал Толи, автора сорева
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥135
Я заметил, что мало у кого в итоге прижились OpenClaw, Hermes и похожие агенты 🦀

Проблема OpenClaw как класса агентов, что люди им играются и бросают. Почему, можно описать одним примером.

Допустим, человек просит вести за него задачи и планировать время. Но до этого он что-нибудь делал? Есть ли у него привычка записывать задачи? Умеет ли вообще придерживаться расписания?

Поставит ему агент с 6 до 8 утра слот учить data science, он все равно не проснется. Дело не в инструментах, дело в человеке 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
💯15🌚3🤨32
«Это Гулаг» - что происходит в Мете*

Эту историю на прошлой неделе мне рассказал один знакомый. Я честно говоря поделил на 10, но тут новости просто взорвались.

Мета принудительно отправила 6.5 тысяч инженеров размечать данные для AI на фул-тайм. Люди бунтуют.

Выглядит ооочень плохо. Принудиловка требует либо большой кредит доверия у компании, либо хорошую компенсацию взамен. Учитывая ситуацию с волнами сокращений, ни того ни другого нет.

Мета очевидно отстанет в AI гонке и хочет это изменить. Но вместо камбека пока получается саморазрушение 🏌️

* запрещенная организация в РФ

https://techcrunch.com/2026/06/12/metas-months-old-ai-unit-is-a-soul-crushing-gulag-say-the-engineers-stuck-inside-it/
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯13😁5😱321
Media is too big
VIEW IN TELEGRAM
Коллеги прислали. Говорят про меня 🤷‍♂️🙈
😁29💯12🤣7😱1
Прохожу новый курс

Начал проходить Стэнфордский курс Language Modeling from Scratch

Моя цель - проходить по два курса в год. Зимой я проходил курс по программированию на CUDA, теперь вот учусь обучать LLM с нуля.

➡️ Мысль за этим следующая. Во-первых, чтобы хорошо делать свою работу, нужно иметь знания на 1-2 уровня глубже чем используешь в повседневной деятельности. Во-вторых, в части задач я все-таки рассчитываю, что мы начнем использовать легкие зафайнтюненные LLM-ки. Чтобы сэкономить, снизить лейтенси и главное - быть менее зависимыми от внешних API. Но тут хз, непонятно, что будет с областью через пару лет 🤷‍♂️

Прикольный курс. Я пока не смотрю лекции, только делаю домашки. Лекции буду смотреть по факту, когда сделаю. То, что ты не трогаешь руками - не откладывается. На этом курсе абсолютно шикарные домашки с хорошими тестами. Курс рассчитан в том числе и на самостоятельное прохождение.

Уже написал и обучил токенизатор с нуля, сейчас пишу компоненты LLM на торче.

➡️ Из интересного, с домашками идут настройки Клода и Кодекса, которые не дают агенту напрямую писать код за студента, но дают отвечать на вопросы и помогать искать ошибки. Супер полезно.

Буду делиться впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥432
Люблю Дорофеева за философский подход к продуктивности. Для меня он как-то пропал из инфоповестки последнее время. Рекомендую свежий подкаст, если вам тоже такое заходит.

Джун: не использует техники продуктивности, вокруг пожары

Мидл: обмазан миллионом техник продуктивности, пожаров нет, но очень тревожный и результаты не выдающиеся

Мастер: не использует никаких техник, достигает выдающихся результатов естественно и спонтанно (на первый взгляд)


https://youtu.be/7Ipt0a43U4Q?si=lVkky-fdeqqz0X2q
5🔥2💯1