AI-Driven Development. Родион Мостовой
4.82K subscribers
88 photos
3 videos
1 file
103 links
Увлекательно рассказываю про AI в разработке, про построение продуктов с LLM под капотом и иногда про .NET.
Связь: @rodion_m_tg
Чат: @ai_driven_chat
Download Telegram
Друзья, начинаем митап про AI кодинг в больших проектах через 5 минут. Приходите!
"Во всех кионтеатрах всех стран", :)) выбирайте что душе угодно.

Ссылка на Зум в Luma: https://luma.com/event/manage/evt-AuFhLXtqp1DlqGi/overview

Трансляции:
https://www.youtube.com/live/F2cpHNF0Jwg

https://rutube.ru/video/private/93a8d325a1a8be7dccc785542fe9a1ae/?p=PEbI8DRIhdVL1CAamGDD6w

Важно: Смотреть можно откуда угодно, но вопросы читаем только из Зума.
👍149
Промпт-инжиниринг умер... или нет?

Действительно, нынешние модели (reasoning версии, прежде всего) теперь менее капризны и придирчивы к промптингу, но тем не менее все еще остается множество нюансов, которые следует учитывать при создании/отладке промпта. И часть из них совсем неочевидны.

Мы в CodeAlive постоянно улучшаем наши промпты и недавно прямо через промпт сделали файлы кликабельными, на основе этих скиллов генерируется ответ (LLM просто оборачивает название файла в ссылку). Сделали, написали тест - все ок.
Но через какое-то время мы заметили, что чатик периодически выплёвывает сырые XML-теги прямо в ответ. Пользователь спрашивает про код, а ему в ответе почти рандомно вылетает <repository_links>. Вроде мелочь, но выглядит как баг - надо фиксить.

Короче, как вы уже поняли, проблема оказалась в промпте - мы активно используем технику с XML-тегами для структурирования инпута в LLM, и в некоторых местах, когда нужно сослаться на конкретную секцию писали что-то вроде "в секции <smthng> лежат ссылки на репозитории" - так вот, этот нюанс, что мы ссылались именно через тэг и создавал тот неприятный артефакт в ответе от LLM.

В принципе, починилось это простым выпиливанием скобок:
"см. секцию <repository_links>" -> "см. секцию repository_links"

Ну, в общем, чтоб во всех этих техниках, ошибках и мис-юзах не утонуть, я, уже по традиции, соорудил скилл для вашего агента, который умеет как писать новые промпты, так и проводит аудит существующих - техник и ошибок там довольно много всяких с четким описанием юзкейсов, так что в должно быть полезно всем, кто хоть как-то соприкасается с промптингом.

Скилл: https://github.com/CodeAlive-AI/prompt-engineering-skill
Ставится одной командой: npx skills add CodeAlive-AI/prompt-engineering-skill



Кстати, про автоматизированную отладку и улучшение промптов (мета-промптинг) я уже рассказывал в своем посте - ведь как бы здорово вы не написали промпт, все равно нужно провести ряд экспериментов конкретно на вашей LLM, чтобы убедиться, что все работает корректно.

Расскажите в комментариях о ваших факапах с промптингом и неочевидными техниками, которые пришлось применить, чтобы достичь желаемого результата.

@ai_driven
112👍6
AI-Driven Development. Родион Мостовой
Тест-система как гарант качества AI-generated кода Я пишу большой гайд о том, как грамотно использовать и получать высококачественный результат от AI-агентов и многоуровневая надежная тест-система там является центральной фигурой, эдакой страховочой сеткой…
Внимательно слежу за творчеством Андрея Бреслава и его новым продуктом CodeSpeak и интересно, на сколько мы в одну сторону думаем - только на днях я написал о важности тест-системы (верификации изменений), а ребята так же на днях выпустили новую фичу для автоматизации покрытия Python-проекта тестами: https://codespeak.dev/blog/coverage-20260302

Интересно, будем пробовать.
Ещё, CodeSpeak умеет генерировать код по спеке и наоборот спеку из кода - в принципе, сейчас и обычные агенты с таким неплохо справляются при должной сноровке, но поскольку Андрей супер-профессионал (создатель языка Kotlin на минуточку), есть высокие шансы, что CodeSpeak сможет выдавать сильно более качественный результат. Постараюсь вытащить Андрея на интервью к нам на канал.

А на очереди у меня как раз пост про повышение верифицируемости кодовых баз на Python.

Кто уже успел попробовать CodeSpeak - поделитесь фидбеком, очень интересно как это на практике работает, особенно на средних и больших проектах.

@ai_driven
👍164
Митап: Agentic Engineering полного цикла или как сгенерировать пару десятков тысяч prod-ready кода

Друзья, вы тоже замечали, что использовать кодагентов в разработке можно очень по-разному? Кто-то на пару с AI агентом становится эффективнее на 10%, а кто-то на 1000%. Так вот, Денис, наш завтрашний эксперт, явно из второй категории.

Уже в этот четверг Денис (автор канала @deksden_notes) покажет нам свой воркфлоу агентной разработки.
Из известных мне вайб-кодеров экспертов по агентной разработке, Денис, пожалуй, абсолютный чемпион по расходу токенов - агенты, генерирующие тысячи строк кода в параллель для него совершенная обыденность. Но интереснее всего - это воркфлоу Дениса, а именно все то, что происходит до кодогенерации (спека, планирование) и после нее (верификация, тестирование). На встрече Денис расскажет про свой протокол агентной разработки поделиться наиболее ценными инсайтами из своего воркфлоу.

Кстати, свой протокол разработки Денис подробно описал в своем канале (получилось аж 9 постов), поэтому могу смело рекомендовать сие чтиво: https://t.me/deksden_notes/197

Дата и время: 5 марта 16:00 МСК.
Ссылка на регистрацию: https://luma.com/e7clxtiw

@ai_drivenAI-Driven Development
12👍10
Сегодня в 14:00 МСК продолжаем разбираться в Full-Cycle Agentic Engineering вместе с Денисом @deksden_notes.
Сегодня больше будем говорить про практическую часть:

* Флоу артефактов: откуда что берется из документов и как собирается
* CLI: особенности организации фронтенда для быстрого тестирования
* Memory bank: как устроен и как с ним работать
* Vertical slices: принципы архитектуры, удобной для агентов
* Связка сценариев и UI QA: POM, data-test-id, автотесты
* Кросс-эпик сценарии (что бы это ни значило)

Стрим проведем в ютубе, ссылка будет ближе к встрече.
Событие тут: https://luma.com/904bned9

Запись будет.
👍20🤔1
Самый важный этап агентной разработки - уточнение требований и проработка спецификации

Знаете какой челлендж агентной разработки пока толком не решён? И на каком этапе наша роль как инженеров все ещё критически важна? Этап планирования изменений и принятия ключевых решений. В этом месте вы можете сказать - так есть же SDD, чем тебе не решение? И действительно, уже существует множество фреймворков, призванных помочь в проработке спеки: open spec, BMAD, GSD, GitHub spec kit и т. д., но проблема этих фреймворков во-первых, в качестве уточняющих вопросов, во-вторых в количестве этих вопросов - их либо слишком много, либо нет вообще. Так вот, когда человек на вход агенту отдает какую-то хотелку, для хорошего агента ключевая задача на этом этапе - это не код сгенерировать, а на основе граундинга контекста проекта (бизнесового, продуктового и технического) правильно принять ключевые решения - так, чтобы найти тот самый оптимум, который и задачу решит в приемлемый срок желательно без багов (в конце концов, временные затраты на тестирование пока никто не отменял) и не умножит тех. долг до big ball of mud, в котором каждое новое изменение что-то ломает, а каждый новый фикс этого нарушает стабильность вообще в другом месте - это, к слову, тот самый лимит, в который упёрлась Opus 4.6 со своим роем агентов при попытке создать C Compiler.

Соответственно, чем сложнее и масштабнее система, тем важнее именно этот этап проработки спеки.
И вот здесь важно, что от агента требуется именно помочь оператору в принятии ключевых оптимальных решений - я убежден, что это и есть главная цель SDD. Поэтому, хороший SDD фреймворк - это, прежде всего, операционная система анализа и принятия решений и, в итоге, основа любой зрелой системы агентной разработки. Особенно в компаниях, где профессионально разрабатывают софт.
Причем это работает на всех уровнях - от доработки PRD и UX до архитектурных и технических решений.

Так вот, SDD и верификация изменений - это темы, которые сейчас увлекают меня больше всего, поэтому дальше в канале мы будем много говорить об этом, так и проводить митапы с разбором разных подходов.
👍174
AI-Driven Development. Родион Мостовой
Самый важный этап агентной разработки - уточнение требований и проработка спецификации Знаете какой челлендж агентной разработки пока толком не решён? И на каком этапе наша роль как инженеров все ещё критически важна? Этап планирования изменений и принятия…
Сегодня в 13:00 по МСК мы проводим митап как раз на тему системного мышления и его применения в SDD - Иван Закутный (@neuralstack) расскажет нам про FPF (First Principle Framework) операционную систему мышления для LLM и как он на основе FPF сделал обвязку для Claude Code, набравшую более 1000 звёзд на GitHub.

Добавляйте встречу в календарь, чтобы не пропустить: https://luma.com/z0hnbsnl
👍12
Сегодня выступаю у Саши Кугушева в подкасте DotNet and more - будем обсуждать средний и продвинутый уровень Agentic Engineering.
Формат там свободный, так что приходите со своими вопросами.
6
Митап с Сергеем Барановым про LLM в архитектуре IT решений

Как вы поняли, на стримы мы подсели плотно :)
Очень интересные гости у нас. Почти в мой день рождения к нам на канал прийдет в гости Сергей Баранов @blog_sb - опытный IT архитектор, консультант и эксперт по DDD, довольно известных деятель в архитектурных кругах. Собственно, говорить будем о том, что там с нашей любимой ИИшкой в работе архитектора и вообще распросим Сергея о том, как он использует ИИ и что он думает про SDD, будущее разработки и архитектуры.
Небольшой пост из канал Сергея по мотивам нашей подготовки: https://t.me/blog_sb/716

Выходим в прямом эфире 1-го апреля в 11:00 по МСК, в 13:00 по Алматы и в 8:00 по UTC.

Регистрация на событие по ссылке: https://luma.com/k4uvyuvq
👍113
Митап с Валерой Ковальским про SGR, GraphRAG по коду и воркфлоу Валеры

Ну, в AI индустрии Валеру не знает, наверно, только ленивый. Но на всякий случай:

- Head of AI Engineering, автор канала @neuraldeep
- Популяризатор SGR подхода (Scheme-Guided Reasoning) и автор популярного фреймворка-реализации SGR https://github.com/vamplabAI/sgr-agent-core (1100+ звезд!)
- Автор 10+ опенсорс проектов, включая ру базу скиллов https://neuraldeep.ru
- Наверное, один из наиболее востребованных экспертов по RAG и агентным системам в СНГ.

Что будет на митапе?
В прямом эфире создадим агента по SGR, который собирает связи по кодовой базе для последующего создания GraphRAG. Но самое интересное, что агента мы будем кодить вместе с Валерой по его воркфлоу (а значит, мы узнаем почему в узких кругах Валеру называют "120 минут").

Встречаемся сегодня в 14:00 по МСК онлайн.
Ссылка на встречу: https://luma.com/dheyf8hl
👍2011