OpenAI прекращают поддержку файнтюнинга моделей
Новость, которая отражает какие подходы побеждают, а какие проигрывают💀
Насколько я вижу вокруг: вау решений на LLM, дообученных LoRa адаптерами не получается. Хотя я не настолько категоричен как автор LLM под капотом, который считает эту ветку тупиковой.
Дообучением занимаются, когда хотят получить хороший результат на маленькой модели. Но это трудозатратный и нестабильный метод.
Лучше сперва делать решение на больших моделях, а затем думать как удешевить.
Мы так и поступили на нескольких проектах. В одном кейсе экономика на самом деле уже сошлась. А если что, ее можно удешевить продуктово, ограничив тех, на кого раскатывается фича.
А в другом экономика тоже сходится, но хочется более быстрых ответов. Поэтому мы обучаем легкий декодер (не факт что на основе LLM). Интересно что получится. У нас оптимистичные ожидания😎
Новость, которая отражает какие подходы побеждают, а какие проигрывают
Насколько я вижу вокруг: вау решений на LLM, дообученных LoRa адаптерами не получается. Хотя я не настолько категоричен как автор LLM под капотом, который считает эту ветку тупиковой.
Дообучением занимаются, когда хотят получить хороший результат на маленькой модели. Но это трудозатратный и нестабильный метод.
Лучше сперва делать решение на больших моделях, а затем думать как удешевить.
Мы так и поступили на нескольких проектах. В одном кейсе экономика на самом деле уже сошлась. А если что, ее можно удешевить продуктово, ограничив тех, на кого раскатывается фича.
А в другом экономика тоже сходится, но хочется более быстрых ответов. Поэтому мы обучаем легкий декодер (не факт что на основе LLM). Интересно что получится. У нас оптимистичные ожидания
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
LLM под капотом
OpenAI осознали бесперспективность файн-тюнинга моделей
7 Мая OpenAI оповестили разработчиков, что лавочка закрывается. Новые компании уже больше не могут запускать задачи тюнинга. В течение полугода закроют возможность даже для тех, кто уже тюнил. А возможность…
7 Мая OpenAI оповестили разработчиков, что лавочка закрывается. Новые компании уже больше не могут запускать задачи тюнинга. В течение полугода закроют возможность даже для тех, кто уже тюнил. А возможность…
🔥8
Моя фабрика разработки на claude code, n8n и jira
Хочу в двух словах рассказать к чему я пришел очень плотно работая на claude code с января. Прочитав статью Harness Engineering от OpenAI и послушав других людей я понял, что нужно стремиться к увеличению автономности кодиногвых агентов. Я начинал с интерактивной работы с claude и в итоге дошел до создания своей фабрики.
Общая архитектура. С помощью n8n у меня подняты workflow с 3-мя агентами, которые запускаются каждую минуту. Два workflow впомогательные, нужны чтобы разворачивать и удалять рабочее окружение. И один workflow запускает основного агента, который выполняет задачу. Каждый workflow включает получение задачи из jira, сбор контекста и запуск команды
Основной агент использует 3 режима: PLAN, EXECUTE, FIX. Каждый запуск (который происходит раз в минуту) агент получает таску, выбирает режим, отрабатывает, обновляет Jira и засыпает
- PLAN декомпозирует задачу на сабтаски. PLAN вызывается в начале, либо в процессе, если в комментариях написать новые требования
- EXECUTE делает одну сабтаску за раз, т.е. реализует Ralph Loop
- FIX читает комментарии в джире и делает небольшие правки не входя в планирование
Jira используется для заведения требований и написания фидбека агенту. Для передачи контекста между запусками используется специальный MD файл.
Дополнительно я реализовал "ручной режим". Скилл, который позволяет запустить агента руками, прочитать контекст задачи и доделать что-то в интерактивном режиме.
По итогу, я могу паралелльно делать 4 задачи. Больше не получается - нужно писать требования в джире и ревьюить результаты.
Хочу в двух словах рассказать к чему я пришел очень плотно работая на claude code с января. Прочитав статью Harness Engineering от OpenAI и послушав других людей я понял, что нужно стремиться к увеличению автономности кодиногвых агентов. Я начинал с интерактивной работы с claude и в итоге дошел до создания своей фабрики.
Общая архитектура. С помощью n8n у меня подняты workflow с 3-мя агентами, которые запускаются каждую минуту. Два workflow впомогательные, нужны чтобы разворачивать и удалять рабочее окружение. И один workflow запускает основного агента, который выполняет задачу. Каждый workflow включает получение задачи из jira, сбор контекста и запуск команды
claude code —agent agent-nameОсновной агент использует 3 режима: PLAN, EXECUTE, FIX. Каждый запуск (который происходит раз в минуту) агент получает таску, выбирает режим, отрабатывает, обновляет Jira и засыпает
- PLAN декомпозирует задачу на сабтаски. PLAN вызывается в начале, либо в процессе, если в комментариях написать новые требования
- EXECUTE делает одну сабтаску за раз, т.е. реализует Ralph Loop
- FIX читает комментарии в джире и делает небольшие правки не входя в планирование
Jira используется для заведения требований и написания фидбека агенту. Для передачи контекста между запусками используется специальный MD файл.
Дополнительно я реализовал "ручной режим". Скилл, который позволяет запустить агента руками, прочитать контекст задачи и доделать что-то в интерактивном режиме.
По итогу, я могу паралелльно делать 4 задачи. Больше не получается - нужно писать требования в джире и ревьюить результаты.
🔥19❤6
Удивился решению Майкрософта срезать косты на Claude 😏 . Не смогли найти 100 долларов в месяц на разработчика? В ту же сторону отреагировал убер
💬 Мысли по теме
- Факт, что при неаккуратном использовании на агентах можно сжигать нереальное количество денег. Я недавно пробовал запускать Hermes на Opus 4.7. Расхотелось 😅
- Просто подписка на курсор или клод код многократно себя окупает. Это видно невооруженным взглядом без всяких аб тестов
💬 Чтобы AI не стал только лишь дополнительным финансовым бременем 🔫 , нужно делать две вещи.
1. Вводить политики на траты сверх обычных подписок. Например, включать бюджет на AI в бюджет проектов. У меня вот есть такой бюджет на DS функцию и я трижды думаю на что его тратить.
2. Закладывать сокращение количества сотрудников на тот же объем работы. Иначе это правда все бессмысленно.
Майкрософту сложно быстро отреагировать на такую смену парадигмы. Я думаю, что кран прикрыт временно. Либо они будут просто использовать не Антропик.
- Факт, что при неаккуратном использовании на агентах можно сжигать нереальное количество денег. Я недавно пробовал запускать Hermes на Opus 4.7. Расхотелось 😅
- Просто подписка на курсор или клод код многократно себя окупает. Это видно невооруженным взглядом без всяких аб тестов
1. Вводить политики на траты сверх обычных подписок. Например, включать бюджет на AI в бюджет проектов. У меня вот есть такой бюджет на DS функцию и я трижды думаю на что его тратить.
2. Закладывать сокращение количества сотрудников на тот же объем работы. Иначе это правда все бессмысленно.
Майкрософту сложно быстро отреагировать на такую смену парадигмы. Я думаю, что кран прикрыт временно. Либо они будут просто использовать не Антропик.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Data Secrets
После утренней новости про отказ Microsoft от Claude Code выяснилось, что они в своих идеях не одиноки
Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи…
Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи…
🔥3❤2💯1
Какой алгоритм рекомендаций победил в Avito ML Cup
Пока на разных днях датафеста рассказывали про трансформерные рекомендации, интересно было посмотреть, что нарешали победители соревнования, про которое я писал. Напомню, что датасет был серьезный - 5kkk взаимодействий.
🔜 Как вы наверное догадались, это не трансформер. И самое интересное, что не ALS
Победил графовый кандидатогенератор. Базовая идея этого алгоритма очень простая. Это когда вы ходите по графу взаимодействий: юзер - айтем на который он кликал - другой юзер - новый айтем. И так при желании какое-то количество раз. Дальше у алгоритма есть усложнения, как ходить лучше, чем случайно. Примеры вариаций: Pixie от Pinterest аж 2017 года и RP3beta аж 2016 года.
🔜 Все топ решения использовали подобные кандидатогенераторы и ранжирование бустингом поверх
Интересно, почему получилось так? Может быть виной хитрая метрика, которая усредняет перформанс по разным вертикалям (товары, услуги итд). Может быть то, что оставили только прогретых пользователей, у которых был контакт. Может быть гэп в 12 часов между трейном и валидацией. А может быть было мало данных на такой объем пользователей и айтемов. Говорят, трансформер не выучивал item_id (хотя они уже были semantic id).
По итогу, соревнование показало пример, что хорошие рекомендации можно построить достаточно простым подходом.
YouTube - Запись разбора решений
Б/У ML - Канал Толи, автора сорева
Пока на разных днях датафеста рассказывали про трансформерные рекомендации, интересно было посмотреть, что нарешали победители соревнования, про которое я писал. Напомню, что датасет был серьезный - 5kkk взаимодействий.
Победил графовый кандидатогенератор. Базовая идея этого алгоритма очень простая. Это когда вы ходите по графу взаимодействий: юзер - айтем на который он кликал - другой юзер - новый айтем. И так при желании какое-то количество раз. Дальше у алгоритма есть усложнения, как ходить лучше, чем случайно. Примеры вариаций: Pixie от Pinterest аж 2017 года и RP3beta аж 2016 года.
Интересно, почему получилось так? Может быть виной хитрая метрика, которая усредняет перформанс по разным вертикалям (товары, услуги итд). Может быть то, что оставили только прогретых пользователей, у которых был контакт. Может быть гэп в 12 часов между трейном и валидацией. А может быть было мало данных на такой объем пользователей и айтемов. Говорят, трансформер не выучивал item_id (хотя они уже были semantic id).
По итогу, соревнование показало пример, что хорошие рекомендации можно построить достаточно простым подходом.
YouTube - Запись разбора решений
Б/У ML - Канал Толи, автора сорева
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
30 мая — Data Fest 2026 / Соревновательный трек
AvitoTech х Data Fest 2026, день 8: офлайн в Москве 30 мая
В программе данной трансляции доклады:
• ML & Education от сообщества ODS
• соревновательный трек AvitoTech ML CUP 2026 и не только!
Полное расписание: https://ods.ai/events/fest2026-avito-msc/schedule…
В программе данной трансляции доклады:
• ML & Education от сообщества ODS
• соревновательный трек AvitoTech ML CUP 2026 и не только!
Полное расписание: https://ods.ai/events/fest2026-avito-msc/schedule…
🔥13❤5
Я заметил, что мало у кого в итоге прижились OpenClaw, Hermes и похожие агенты 🦀
Проблема OpenClaw как класса агентов, что люди им играются и бросают. Почему, можно описать одним примером.
Допустим, человек просит вести за него задачи и планировать время. Но до этого он что-нибудь делал? Есть ли у него привычка записывать задачи? Умеет ли вообще придерживаться расписания?
Поставит ему агент с 6 до 8 утра слот учить data science, он все равно не проснется. Дело не в инструментах, дело в человеке 🤷♂️
Проблема OpenClaw как класса агентов, что люди им играются и бросают. Почему, можно описать одним примером.
Допустим, человек просит вести за него задачи и планировать время. Но до этого он что-нибудь делал? Есть ли у него привычка записывать задачи? Умеет ли вообще придерживаться расписания?
Поставит ему агент с 6 до 8 утра слот учить data science, он все равно не проснется. Дело не в инструментах, дело в человеке 🤷♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
💯15🌚3🤨3❤2
«Это Гулаг» - что происходит в Мете*
Эту историю на прошлой неделе мне рассказал один знакомый. Я честно говоря поделил на 10, но тут новости просто взорвались.
Мета принудительно отправила 6.5 тысяч инженеров размечать данные для AI на фул-тайм. Люди бунтуют.
Выглядит ооочень плохо. Принудиловка требует либо большой кредит доверия у компании, либо хорошую компенсацию взамен. Учитывая ситуацию с волнами сокращений, ни того ни другого нет.
Мета очевидно отстанет в AI гонке и хочет это изменить. Но вместо камбека пока получается саморазрушение🏌️
* запрещенная организация в РФ
https://techcrunch.com/2026/06/12/metas-months-old-ai-unit-is-a-soul-crushing-gulag-say-the-engineers-stuck-inside-it/
Эту историю на прошлой неделе мне рассказал один знакомый. Я честно говоря поделил на 10, но тут новости просто взорвались.
Мета принудительно отправила 6.5 тысяч инженеров размечать данные для AI на фул-тайм. Люди бунтуют.
Выглядит ооочень плохо. Принудиловка требует либо большой кредит доверия у компании, либо хорошую компенсацию взамен. Учитывая ситуацию с волнами сокращений, ни того ни другого нет.
Мета очевидно отстанет в AI гонке и хочет это изменить. Но вместо камбека пока получается саморазрушение
* запрещенная организация в РФ
https://techcrunch.com/2026/06/12/metas-months-old-ai-unit-is-a-soul-crushing-gulag-say-the-engineers-stuck-inside-it/
Please open Telegram to view this post
VIEW IN TELEGRAM
TechCrunch
Meta's months-old AI unit is a soul-crushing gulag, say the engineers stuck inside it | TechCrunch
A new report suggests the unit, which employs 6,500 people, is on the verge of revolt.
🤯13😁5😱3 2❤1
Прохожу новый курс
Начал проходить Стэнфордский курс Language Modeling from Scratch
Моя цель - проходить по два курса в год. Зимой я проходил курс по программированию на CUDA, теперь вот учусь обучать LLM с нуля.
➡️ Мысль за этим следующая. Во-первых, чтобы хорошо делать свою работу, нужно иметь знания на 1-2 уровня глубже чем используешь в повседневной деятельности. Во-вторых, в части задач я все-таки рассчитываю, что мы начнем использовать легкие зафайнтюненные LLM-ки. Чтобы сэкономить, снизить лейтенси и главное - быть менее зависимыми от внешних API. Но тут хз, непонятно, что будет с областью через пару лет 🤷♂️
Прикольный курс. Я пока не смотрю лекции, только делаю домашки. Лекции буду смотреть по факту, когда сделаю. То, что ты не трогаешь руками - не откладывается. На этом курсе абсолютно шикарные домашки с хорошими тестами. Курс рассчитан в том числе и на самостоятельное прохождение.
Уже написал и обучил токенизатор с нуля, сейчас пишу компоненты LLM на торче.
➡️ Из интересного, с домашками идут настройки Клода и Кодекса, которые не дают агенту напрямую писать код за студента, но дают отвечать на вопросы и помогать искать ошибки. Супер полезно.
Буду делиться впечатлениями!
Начал проходить Стэнфордский курс Language Modeling from Scratch
Моя цель - проходить по два курса в год. Зимой я проходил курс по программированию на CUDA, теперь вот учусь обучать LLM с нуля.
Прикольный курс. Я пока не смотрю лекции, только делаю домашки. Лекции буду смотреть по факту, когда сделаю. То, что ты не трогаешь руками - не откладывается. На этом курсе абсолютно шикарные домашки с хорошими тестами. Курс рассчитан в том числе и на самостоятельное прохождение.
Уже написал и обучил токенизатор с нуля, сейчас пишу компоненты LLM на торче.
Буду делиться впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
Stanford CS336
Stanford CS336 | Language Modeling from Scratch
Official course website for Stanford CS336: Language Modeling from Scratch (Spring 2026), including logistics, schedule, assignments, and course materials.
🔥43❤2
Люблю Дорофеева за философский подход к продуктивности. Для меня он как-то пропал из инфоповестки последнее время. Рекомендую свежий подкаст, если вам тоже такое заходит.
https://youtu.be/7Ipt0a43U4Q?si=lVkky-fdeqqz0X2q
Джун: не использует техники продуктивности, вокруг пожары
Мидл: обмазан миллионом техник продуктивности, пожаров нет, но очень тревожный и результаты не выдающиеся
Мастер: не использует никаких техник, достигает выдающихся результатов естественно и спонтанно (на первый взгляд)
https://youtu.be/7Ipt0a43U4Q?si=lVkky-fdeqqz0X2q
YouTube
Джедайские техники Максима Дорофеева: продуктивность, созвоны, выгорание и главный миф о времени #86
🔹 Присоединяйся к курсу «ИИ для разработчиков» https://ru.hexlet.io/programs/ai-for-developers?utm_source=youtube
В этом выпуске у меня в гостях Максим Дорофеев — автор «Джедайских техник», книг, которые для многих стали первой серьёзной попыткой разобраться…
В этом выпуске у меня в гостях Максим Дорофеев — автор «Джедайских техник», книг, которые для многих стали первой серьёзной попыткой разобраться…
❤5🔥2💯1