AI-Driven Development. Родион Мостовой
5.09K subscribers
97 photos
3 videos
1 file
115 links
Увлекательно рассказываю про AI в разработке, про построение продуктов с LLM под капотом и иногда про .NET.
Связь: @rodion_m_tg
Чат: @ai_driven_chat
Download Telegram
Сегодня выступаю у Саши Кугушева в подкасте DotNet and more - будем обсуждать средний и продвинутый уровень Agentic Engineering.
Формат там свободный, так что приходите со своими вопросами.
6
Митап с Сергеем Барановым про LLM в архитектуре IT решений

Как вы поняли, на стримы мы подсели плотно :)
Очень интересные гости у нас. Почти в мой день рождения к нам на канал прийдет в гости Сергей Баранов @blog_sb - опытный IT архитектор, консультант и эксперт по DDD, довольно известных деятель в архитектурных кругах. Собственно, говорить будем о том, что там с нашей любимой ИИшкой в работе архитектора и вообще распросим Сергея о том, как он использует ИИ и что он думает про SDD, будущее разработки и архитектуры.
Небольшой пост из канал Сергея по мотивам нашей подготовки: https://t.me/blog_sb/716

Выходим в прямом эфире 1-го апреля в 11:00 по МСК, в 13:00 по Алматы и в 8:00 по UTC.

Регистрация на событие по ссылке: https://luma.com/k4uvyuvq
👍123
Митап с Валерой Ковальским про SGR, GraphRAG по коду и воркфлоу Валеры

Ну, в AI индустрии Валеру не знает, наверно, только ленивый. Но на всякий случай:

- Head of AI Engineering, автор канала @neuraldeep
- Популяризатор SGR подхода (Scheme-Guided Reasoning) и автор популярного фреймворка-реализации SGR https://github.com/vamplabAI/sgr-agent-core (1100+ звезд!)
- Автор 10+ опенсорс проектов, включая ру базу скиллов https://neuraldeep.ru
- Наверное, один из наиболее востребованных экспертов по RAG и агентным системам в СНГ.

Что будет на митапе?
В прямом эфире создадим агента по SGR, который собирает связи по кодовой базе для последующего создания GraphRAG. Но самое интересное, что агента мы будем кодить вместе с Валерой по его воркфлоу (а значит, мы узнаем почему в узких кругах Валеру называют "120 минут").

Встречаемся сегодня в 14:00 по МСК онлайн.
Ссылка на встречу: https://luma.com/dheyf8hl
👍2111
Не покупайте дорогие подписки на топовые модели (пост для вашего работодателя)

Иначе вы рискуете затерять ваших разработчиков в исследованиях.

Инсайт такой - подписки уровня 200$/mo обычно легко позволяют, скажем так, в параллель с основными задачами запускать разного рода эксперименты - когда агент не просто выводит гипотезы, но и запускает проверку каждой гипотезы в поисках наиболее оптимального решения - это может быть как определение оптимального алгоритма (ну например, стратегии чанкинга), так и поиск оптимального промпта/конфигурации системы. А в связке с субагентами это может быть особенно эффективным.

Например, в апреле мы апдейтнулись с Claude Max 100$ до Claude Max 200$ (это х4 лимиты от 100) и это позволило мне свободно провести эксперименты по код ревью с новыми моделями (их сейчас вышло как никогда много) и поймать инсайт, что связка из 8 по-своему сфокусированных Qwen 3.6 Plus + DeepSeek 4 Flash ловят больше проблем при код ревью, чем одиночный Opus 4.7 - это при том, что часть проблем в нашем бенчмарке синьерного и даже экспертного уровня. А это, на секундочку, получается минимум 2-х кратная экономия. Но про этот кейс отдельно расскажу.

Вообще, AI разработка прямо изобилует экспериментами - потому, что никто не знает как правильно. Больше того, то, что было "правильно" вчера, сегодня уже неактуально и замещено чем-то более эффективным (как в примере с ревью). Именно поэтому в этом дивном новом AI-мире разработчикам важно не только бюджет выделять на эксперименты, но и время - в принципе, компании смело могут легитимизировать 20-30% рабочего времени инженеров на эксперименты с AI - это, опять же, потому что даже один такой успешный эксперимент, может принести пользы больше, чем месяц усердной работы (здесь можно отметить, например, эксперименты по улучшению пайплайна тестов и верификации изменений, которые можно проводить бесконечно), и совсем хорошо когда инженеры хотя бы пару раз в месяц собираются на выделенный звонок и делятся находками и результатами своих экспериментов.

В итоге, экономя на топовые подписки вы, возможно, теряете такие инсайты, которые потенциально могут сэкономить вам или вашему бизнесу гораздо больше. И тут я подчеркну, что токенов, доступных разработчику должно быть в избытке, тогда не будет постоянного страха, что из-за какого-либо эксперимента в сторону не хватит квоты на рабочие задачи и появляется свобода на творчество.



@ai_driven
133👎7
Мок-собеседование Agentic Software Engineer (AI Automation)

Мне все чаще попадаются новости о том, что кол-во кандидатов на программистские вакансии достигло какого-то аномального пика и этот разрыв продолжает расти, а востребованность обычных классических разработчиков стремительно падает. С другой стороны, появилась совершенно новая должность Agentic Software Engineer - это человек, который перестраивает разработку, да и весь SDLC на AI рельсы. Еще эта должность называется AI Automation Engineer, Agentic Advocate и т. д. - суть одна. Поскольку позиция новая, пока еще не очень понятно как на нее интервьюировать. К счастью, у Коли (автор канал @ai_grably, CTO и консультант) это понимание есть, поэтому мы решили провести первое публичное мок-интервью в рунете на эту позицию. Как обычно, проводим в формате стрима, онлайн.
А пока мы все дружно ждем это важное событие, вот интересное чтиво о том, как меняет подходу к интервью инженеров в AI-эпоху: https://sierra.ai/blog/the-ai-native-interview

Дата и время: 30 апреля 15:00 МСК, 17:00 Алматы, 13:00 CET.
Длительность: 1.5 часа.
Регистрация: https://luma.com/mm9dv0im

@ai_driven
113👍5
Forwarded from Этихлид
Стрим про кодинг-интервью в эпоху агентов

Классические форматы найма разработчиков в свете AI устаревают на глазах.
Задачки с условного литкода оценивают навык, который в реальной работе и так редко использовался, да и сам процесс подготовки и проведения таких интервью давно уже превратился в специфический ритуал.

Так что некоторые компании уже начали в пилотном режиме проводить AI-assisted coding interview, где кандидату выдаётся агент и задача по работе с реальной кодовой базой.

Раньше мы чаще проверяли кандидата на то, может ли он писать код, а теперь всё больше становится интересно другое: как он декомпозирует задачу, ставит её агенту; как отличает хорошее решение от галлюцинаций; ревьюит результат и объясняет, почему сделано именно так.

О чём хочется поговорить:
● какие форматы устаревают и какие становятся важнее;
● какие из них теперь покрываются ИИшкой;
● какие задачи в принципе подходят для такого формата;
● какого агента давать кандидату (hot take, что не очень умного :));
● уровни и критерии оценки.

Короче, сегодня стихийно соберемся вместе:
● Коля с канала AI и грабли
● Родион - AI-Driven Development. Родион Мостовой
● Максим - Этихлид

...и поразгоняем на эту тему.

1 мая (сегодня), 15:00 МСК: https://luma.com/r3hyapoy

Кидайте ваши вопросы в комменты - постараемся и на них ответить на стриме.

#ai #hiring #interview
6👎1
Улучшаем понимание контекста через субагентов

Собственно, исследование кода (или чего угодно другого) через субагентов на сегодня один из наиболее полезных кейсов применения этих самых субагентов - для этих целей, кстати, в Claude Code есть встроенные агенты, в т. ч. Explore.

Как правило, Claude Code (а с недавних пор еще и Codex) перед тем, как перейти к выполнению задачи запускает одного Explore субагента для сбора контекста. Но его явно бывает недостаточно для полноценного сбора, особенно на больших кодовых базах. К счастью, Claude Code позволяет прямо в запросе указать "запусти 3 сфокусированных субагента для глубого изучения контекста по задаче".

Explore агент на Sonnet
А если вы понимаете, что вопрос действительно сложный (запутанный), то можно просто попросить агента "запустить explore субагентов на Sonnet" и он так и сделает.

Codex
В Codex тоже с недавних пор появились субагенты и работают они примерно так же. На эту тему Денис DEKSDEN недавно делал большой обзор в своем канале.



Напомню, что для комфортной работы с агентами в больших кодовых базах могу горячо рекомендовать наш продукт CodeAlive - он дает агентам суперсилу использовать очень качественный семантический поиск, с помощью которого в течение пары сотен мс. агент находит 90%+ релевантной информации, затем быстро добирает то, чего не хватает - экономит и время и токены. Мы, кстати, обновили и MCP и скиллы, а еще вот-вот выкатим обновленный чатик с новым супер-агентом, который быстро и глубоко отвечает даже на самые сложные вопросы по кодовым базам на 1М+ строк кода и по сотням репозиториев сразу - для компаний с тоннами кода и документации просто бомбическая штука. Скорее всего, отдельный стрим сделаем на эту тему чуть позже.

@ai_driven
👍197
Safety Hooks моей мечты

Наконец-то сделал хуки моей мечты - достаточно безопасные и практически без false-positive. Хуки вымученные, эволюционировали на граблях можно сказать.

Собсна, любой, кто проработал с агентами какое-то время отлично знает, что иногда они чудят, удаляя лишнее - папки, докер образы или даже целые базы вместе с инфрой. И их важно вовремя ловить за руку.
Хуки - это важнейшая часть работы с кодинг агентами, привносящая в них не только детерменированности, но и безопасности.

Соответственно, когда хуков нет совсем или их мало, безопасность хромает - агент может уронить базу, сделать rm rf и тд, а если хуков слишком много , то... вы привыкаете клацать Enter на Allow, уже даже не читая о чем вообще сыр-бор. Поэтому, нужен тонкий баланс и хуками важно закрывать только действительно деструктивные, необратимые или критические действия.

Ну, и сразу второй нюанс - для блоков я предпочитаю использовать ask хуки вместо блокирующих, т. к. агенты нынче слишком умные и получив блокирующий хук, наверняка найдет способ обойти ограничение (особенно если прилетел какой-нибудь prompt-injection), тк хуки обычно весьма примитивны.

Короче-говоря, с учетом всех этих нюансов я написал свои opiniated-хуки, которые сам использую, они максимально сбалансированны по allow/ask с практически нулевым false positive - благодаря парсингу AST, а не regex'ам, которые обычно в хуках. Частично в основе лежит claude-code-safety-net (спасибо Рефату за наводку) весьма сильно переработанный и дополненный.

Внутри:
1. rmrm/unlink/shred вне cwd, по /etc, $HOME; через sudo, xargs, find -delete, pipe-to-shell.
2. infrakubectl, docker, terraform, helm, gcp.
3. dbDROP/TRUNCATE/DELETE через psql/mysql; redis-cli FLUSHALL/SHUTDOWN, supabase.
4. paas — Railway, Fly, Heroku, Vercel, Netlify с destructive-глаголами (PocketOS-класс).
5. gitreset --hard, clean -fd, checkout . / restore ., branch -D, stash drop/clear, push -f, push --delete.

Ссылка на репо: https://github.com/CodeAlive-AI/ai-driven-development/tree/main/hooks/balanced-safety-hooks - звезды как обычно приветствуются.

Быстро ставятся так: curl -fsSL https://raw.githubusercontent.com/CodeAlive-AI/ai-driven-development/main/hooks/balanced-safety-hooks/install-prebuilt.sh | sh

Из особенностей - написаны хуки на Go, поэтому выполняются буквально за несколько мс. Ну, и каждый, может поправить их под свои нужды, перекомпилячив бинарник. Еще из интересного - большинство хуков покрыты тестами.

Кстати, для простого и корректного управления своими хуками у меня есть отдельный скилл hooks-management, который теперь поддерживает Claude Code, Codex и OpenCode.

@ai_driven - AI-Driven Development
4👍3912
В это воскресенье в 18:00 МСК, 20:00 по Алматы поговорим с ребятами о том, как экономить на LLMках. Приходите. И пишите свои вопросы.
👍10
Я забыл попросить вопросы к стриму "Каждый токен на счету"! 🙈

Задайте их, пожалуйста, в комментариях к этому посту.

Кстати, Сергей, один из участников нашего стрима, опубликовал целую серию статей на Хабре про prefix_cache:

1. Экономика кэширования и особенности провайдеров

2. Самые частые анти-паттерны

3. Кэш в AI-агентах

Материалы – огонь. Если прочитать их до стрима, то просмотр станет ещё интереснее.

На стриме на практике проверим, как учёт особенностей prefix_cache влияет на расход токенов.

Добавить событие в календарь

Вопросы для стрима – в комментарии 😊
8👍5
Уже видели, что Антропики переписали bun с Zig на Rust? Тут Никита Соболев интересный разбор этой истории сделал.
Вообще, мое почтение ребятам из Bun за смелость такое вмердживать - в PR'е на секундочку +1 009 257 строк и 6000+ коммитов. Я-то думал мои вымученные PR'ы на 10к+ строк - это много, а тут вон чего люди делают.
Интересно будет почитать блогпост про этот процесс миграции - ждем.
🤯53
ИИ переписал Bun с Zig на Rust

PR: https://github.com/oven-sh/bun/pull/30412 (он настолько большой, что гитхаб его не открывает у меня)

Последние несколько дней в чате очень плотно обсуждали последнюю ИИ новость.

Один из альтернативных JS рантаймов bun полность переписали с zig на #rust.
Переписывали, конечно же, используя исключительно агентов и ИИ (от компании Anthropic) .
На все про все ушло 10 дней, тесты прошли, перформанс остался такой же.

Звучит красиво? Красиво.

Таймлайн истории

1. 2 декабря 2025 года Anthropic покупает bun и всю команду: https://bun.com/blog/bun-joins-anthropic
2. Команда Zig известна своим "No AI Slop" policy (прямо как django-modern-rest), некоторые люди сразу предсказывали конфликт интересов между Bun + Anthropic и Zig
3. 26 апреля 2026 года, команда bun форкает zig и добавляет туда поддержку параллельного семантического анализа https://x.com/bunjavascript/status/2048427636414923250
4. 9 мая открывается тот самый PR
5. 14 мая он успешно смерджен

Важные детали

А вот тут начинается интересное.

- Для начала авторы Zig объяснили, что подход форка с семаналом некорректный, и что они сами работают над данной фичей, скоро она будет доступна: https://ziggit.dev/t/bun-s-zig-fork-got-4x-faster-compilation-times/15183/19
- Билды получились недетерминированные, о чем им и рассказала кор-команда. Тогда форк пришлось закопать, видимо

Теперь посмотрим на качество PR.

- Качество кода там примерно вот такое: https://github.com/oven-sh/bun/commit/d144fa6e20ab65d55add82ef3241609dcbb04cdc (то есть - никакое)
- Файлы в нем даже были неотформатированы встроенным cargo fmt, что делается буквально в каждом Rust проекте: https://github.com/oven-sh/bun/pull/30695
- Ревью не было, потому что внутри PRа +1 009 257, -4 024 и 6000+ коммитов
- unsafe в коде встречает 10487 раз (да, там много ffi, но все равно). Для сравнения в uv (кода правда меньше в 2 раза) - всего 73 раза
- "Скорость работы осталось такой же" - довольно странный тезис, учитывая что zig и rust оба генерят код через LLVM, часто практически идентичный, заслуги ИИ здесь нет

Выводы

- Прикольно, что такое вообще можно сделать (с неограниченными токенами)
- Как теперь bun будет владеть своей базой кода, кто сможет в ней разобраться и что-то пофиксить - вопрос открытый
- Какой смысл во всем действии (кроме очевидного маркетинга) - вопрос открытый
- Брать ли теперь bun в прод? Конечно нет

Обсуждение: что вы думаете по данному вопросу? Стали бы использовать bun у себя в проекте в новом виде?

| Поддержать | YouTube | GitHub | Чат |
👍17
Радость же для любитей Claude Code. Установил себе.
3🤔53
На протяжении последних 3 месяцев активной работы с Claude Code Терминалом я постоянно дорабатывал свой Status Line

И вот, считаю, что он практически идеален

Это одна строка внизу терминала, которая показывает всё, что обычно приходится держать в голове или проверять руками. И многое из того, что интерфейсный клод код не показывает

Кому полезно
Если вы реально работаете в Claude Code, ведёте проекты в Git и хотите меньше думать о техническом состоянии сессии, а больше о самой задаче


Из чего состоит ⤵️⤵️⤵️

✔️ Модель
Сразу видно, на чём работаешь: Opus / Sonnet / Haiku, версия и размер контекста.

✔️ Папка и ветка Git
Показывает текущий проект и branch. Умеет делать truncate длинных названий проекта

✔️ Состояние репозитория
Modified / added / deleted / renamed / untracked / conflicts — всё в одной компактной строке. Конфликты подсвечиваются красным, потому что это единственное, что реально блокирует коммит.
Визуализируется через стандартные гитовские сокращения
3M — 3 files modified
1A — 1 added
1D — 1 deleted
1R — 1 renamed
2? — 2 untracked

1! — 1 conflict


✔️ Ahead / behind относительно origin
Надо ли пушить или подтянуть изменения

✔️ Drift между CLAUDE.md / AGENTS.md / GEMINI.md
Я использую и Claude Code, и CODEX и GEMINI — у них разные главные контекст-файлы.
Мой статуслайн показывает, когда они разъехались. Чтобы все имели одинаковый контекст

✔️ Контекстное окно
Це база
Показывает, сколько контекста уже занято: бар + токены типа 480k/1M. Есть ранние предупреждения, когда сессия начинает подходить к зоне, где Claude скоро захочет compact.

✔️ Prompt cache
Видно cache hit ratio, сколько токенов читается из кэша, сколько записывается, и когда TTL протухнет. Помогает лучше понимать, сколько стоит каждый запрос и была ли инвалидация кеша

✔️ Rate limits 5h и 7d
Показывает, сколько лимитов осталось и время до reset

Формат сделал плотным, чтобы всё помещалось в одну строку. Если нада, то можно сделать мультистрочный статуслайн

Цвета показывают уровень важности: норм / внимание / опасно

Плюс внутри несколько доп хуков

Ссылка на гитхаб
https://github.com/ilia-pluzhnikov/claude-code-statusline
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍37👎2
Май богат на конференции

23-го мая меня можно будет найти на Beetech 2026 в Алматы. Будем говорить на злободневную тему "AI-разработка в enterprise: риск, контроль и доверие". Хороший повод увидеться с моими подписчиками в Алматы :)

Скажу честно, не очень люблю формат панельных дискуссий, т. к. в виду жестких ограничений по времени трудно достаточно погрузиться в тему и добраться до действительно ценных инсайтов. Зато у участников будет возможность поймать меня в кулуарах и позадавать мне вопросы там - я обычно очень охотно отвечаю. Кстати, если будете организовывать конфу и захотите меня позвать - формат Q&A с моим индивидуальным участием залетит лучше всего, проверенно :)



Воркшоп "ИИ операционка для руководителя" на AI Camp Almaty

В общем, ребята организовали мощный интенсив для руководителей и владельцев бизнесов и попросили меня рассказать и показать как я автоматизирую бизнес рутину в OpenClaw - опенкло сам проводит для меня регулярные ресерчи, смотрит на метрики продукта, выявляя аномалии, подсказывает возможные партнерства и тд. В общем, с помощью агентов будем секьюрно ставить опенкло в облако и настраивать его.
Сам интенсив стартует 20 мая, а мой воркшоп пройдет 21 мая. Кстати, наш друг Костя Доронин будет выступать там же с другим воркшопом 20 мая.

Хорошая новость - всем, кто зарегистрируется на мероприятиях из моего канала полагается скидка.
* Промокод BEEAIDRIVEN25 на Beetech 2026 дает скидку 25% (действует до 21 мая).
* Промокод CODEALIVE на AI Camp Almaty дает скидку 15%.

@ai_driven | AI-Driven Development. Родион Мостовой.
👍10👎1
OS Deep Cleaner + Health Checker: новый кейс с кодагентами

С чего бы это в канале про AI кодинг я рассказываю об очистке мака и поддержании его в здоровом состоянии? Да все дело в том, что ваш покорный слуга в последнее время весьма активно начал работать в 4-5 параллельных сессий (почти как Борис Черный), а также еще и использовать субагентов. С чем я столкнулся работая в таком режиме? (помимо ментального перегруза) - да банально с тем, что ПК стал перегружаться - ЦП на 100%+, RAM в минусе и т.д., а в некоторые моменты мак и попросту аварийно вырубался с фатальной ошибкой.
Так вот, после очередного такого фейла всей системы после перезагрузки я отправил Opus разбираться в реальных причинах такого падения и в том и как его избежать в дальнейшем. Здесь важно отметить, что перед запуском расследования я попросил клода провести исследование в интернете о том, как бы профессиональный инженер из Apple проводил такое расследование - выяснить его подходы и методологию.
Исследование выявило несколько проблем, но ключевая в нехватке места на диске для файла подкачки. И вот тут начинается самое интересное. Ранее для периодической чистки диска я использовал Mole - у него несколько режимов работы, но основной просто сканирует кеши инструментов разработки (npm, brew, cargo, gradle, pip и прочее), плюс чистит системные логи и temp-файлы старше недели - это команда mo clean. И есть ещё mo purge, который сканирует уже поумнее - находит dev-проекты по маркер-файлам (package.json, Cargo.toml, *.csproj и т. д.) и предлагает снести node_modules, target, bin/obj и прочее регенерируемое. И изначально я завернул эти команды в скилл, которым периодически проходился по системе. Но в реальности этого, конечно, мало - в системе в самых неожиданных местах появляются папки на десятки гигабайт, которые тихонько лежат на диске до тех, пока кто-нибудь не начнет искать большие файлы/папки каким-нибудь сканом. Почему бы такой скан тоже не завернуть в скилл? А почему бы еще не научить скилл определять разные другие пути в которых может лежать мусор? И вообще, пусть скилл себя ведет как опытный сисадмин - предлагая разных стоящих кандидатов к удалению. И зацените еще в какую красивую HTML-ку агент заворачивает отчет для выбора списка на удаление (на скрине) - есессно, списочек итоговый вы сами определяете (с оптимальными дефолтами, ведь UX наше всё).

Предупреждаем беду
Ок, уже получилось довольно круто. Но что если мы со всеми этими бесконечными сессиями забыли о том, что нам периодически нужно запускать чистку - в этом случае в какой-то момент опять может случиться маковский BSOD. Тогда почему бы нам не добавить проактивный режим - а именно, вотчер, наблюдающий за системой и сообщающий нам о надвигающихся проблемах по тригеру.
Сказано - сделано: LaunchAgent раз в 5 минут проверяет: диск меньше 10%, memory pressure Critical вместе со swap больше 8 ГБ, и появление новых JetsamEvent файлов с тегом vm-compressor-space-shortage (это как раз про мой кейс). При триггере - macOS уведомление через alerter.
Отмечу, что у скилла есть неплохой список чувствительных мест, которые трогать не стоит, поэтому он достаточно уверенно сам подсвечивает исключения.

Вообще, в итоге получилась на удивление идеальная чистилка, которая еще и понятным языком объясняет значения каждого кандидата. Чистилка на голову выше всего софта для очистки, что я видел раньше. Хоть в продукт заворачивай :) У себя я совершенно безобидно вычистил около 150 гбайт.

Ссылка на скилл: https://github.com/CodeAlive-AI/ai-driven-development/tree/main/skills/maintaining-macos-health (звезды сюда, если оказалось полезно).

P.S. PR с адаптацией под Windows приветствуется.

@ai_driven | AI-Driven Development. Родион Мостовой.
10👍2915