Самообучающиеся агенты
На днях разбирал winning solution с конкурса ERC3 по построению ИИ-агентов. Парень выиграл с системой, где агенты сами себя улучшают - без человека.
Архитектура довольно простая: основной агент на Anthropic SDK с Claude Opus 4.5, все инструменты описаны в одном файле, динамические HTTP-запросы к API бенчмарка. Ничего сложного.
Системный промпт собрал все правила из корпоративной вики в компактный алгоритм: проверить личность, верифицировать права, собрать данные, вернуть результат.
Но самое интересное - это три агента, которые работают в связке.
Первый агент запускает бенчмарк и решает задачи, логирует всё подряд. Второй анализирует логи проваленных задач и формулирует гипотезы, что пошло не так. Третий читает эти гипотезы, решает что внедрить и генерирует новую версию промпта.
Получается замкнутый цикл: прогнал бенчмарк → проанализировал ошибки → пропатчил промпт → повторил.
Финальный промпт, который пошел в продакшн, был 80-й генерацией. Он автоматически эволюционировал из базовой версии через десятки итераций, каждая из которых фиксила конкретные паттерны ошибок.
Никакого ручного prompt engineering. Просто агенты, улучшающие агентов.
Как вам такой подход? Пробовали что-то похожее?
На днях разбирал winning solution с конкурса ERC3 по построению ИИ-агентов. Парень выиграл с системой, где агенты сами себя улучшают - без человека.
Архитектура довольно простая: основной агент на Anthropic SDK с Claude Opus 4.5, все инструменты описаны в одном файле, динамические HTTP-запросы к API бенчмарка. Ничего сложного.
Системный промпт собрал все правила из корпоративной вики в компактный алгоритм: проверить личность, верифицировать права, собрать данные, вернуть результат.
Но самое интересное - это три агента, которые работают в связке.
Первый агент запускает бенчмарк и решает задачи, логирует всё подряд. Второй анализирует логи проваленных задач и формулирует гипотезы, что пошло не так. Третий читает эти гипотезы, решает что внедрить и генерирует новую версию промпта.
Получается замкнутый цикл: прогнал бенчмарк → проанализировал ошибки → пропатчил промпт → повторил.
Финальный промпт, который пошел в продакшн, был 80-й генерацией. Он автоматически эволюционировал из базовой версии через десятки итераций, каждая из которых фиксила конкретные паттерны ошибок.
Никакого ручного prompt engineering. Просто агенты, улучшающие агентов.
Как вам такой подход? Пробовали что-то похожее?
🔥23
Прочитали пост выше? А теперь самое интересное - я написал его с помощью самообучившегося ИИ-агента. ХА
В чем вообще фишка - когда вы просите улучшить что-то в ChatGPT, то он запоминает это лишь на ближайшее время, далее память сжимает все что было до короткого саммари.
Таким образом “обучение” ИИ-агента возможно через память, системный промпт или файнтюнинг. К файнтюнингу прибегают очень редко, а вот память и промпт являются по сути главным рычагом влияния на агента. При этом и память, и системный ромпт одно и то же - это инпут, который вы отправляете вместе со своим сообщением.
Системный промпт в итоге остается мозгом ИИ-агента и именно через его улучшение вы можете добиться более хороших результатов.
Поэтому так важны разработки самообучающихся агентов, которые могут улучшать свой промпт по ходу разговора.
Я решил собрать такого бота на n8n - это достаточно просто. Я вручил агенту инструмент, который является еще одним агентом для обработки изменений и обновления системного промпта.
Каждый раз, когда мне что-то не нравится, агент идет менять свой “мозг” и далее выдает более релевантные результаты “навсегда”, а не только насколько хватит ему памяти.
В итоге, используя систему с такими агентом, каждый ваш чат будет автоматически затачиваться под определенную задачу и самообучаться на вашей обратной связи.
Так и вышел предыдущий пост - сначала я скормил решение и попросил сделать пост, а далее дал обратную связь и пример моего поста, чтобы скорректировать формат. ИИ-агент скорректировал не только сам текст, но и свой промпт и теперь в следующий раз он будет писать как надо.
UPD: мини-гайд https://www.loom.com/share/4cb014a8894b4ab2b81755031e8020e6
____
Готовый шаблон уже в сообществе
В чем вообще фишка - когда вы просите улучшить что-то в ChatGPT, то он запоминает это лишь на ближайшее время, далее память сжимает все что было до короткого саммари.
Таким образом “обучение” ИИ-агента возможно через память, системный промпт или файнтюнинг. К файнтюнингу прибегают очень редко, а вот память и промпт являются по сути главным рычагом влияния на агента. При этом и память, и системный ромпт одно и то же - это инпут, который вы отправляете вместе со своим сообщением.
Системный промпт в итоге остается мозгом ИИ-агента и именно через его улучшение вы можете добиться более хороших результатов.
Поэтому так важны разработки самообучающихся агентов, которые могут улучшать свой промпт по ходу разговора.
Я решил собрать такого бота на n8n - это достаточно просто. Я вручил агенту инструмент, который является еще одним агентом для обработки изменений и обновления системного промпта.
Каждый раз, когда мне что-то не нравится, агент идет менять свой “мозг” и далее выдает более релевантные результаты “навсегда”, а не только насколько хватит ему памяти.
В итоге, используя систему с такими агентом, каждый ваш чат будет автоматически затачиваться под определенную задачу и самообучаться на вашей обратной связи.
Так и вышел предыдущий пост - сначала я скормил решение и попросил сделать пост, а далее дал обратную связь и пример моего поста, чтобы скорректировать формат. ИИ-агент скорректировал не только сам текст, но и свой промпт и теперь в следующий раз он будет писать как надо.
UPD: мини-гайд https://www.loom.com/share/4cb014a8894b4ab2b81755031e8020e6
____
Готовый шаблон уже в сообществе
6👍14🔥8❤3🗿1
Creatomate - сервис для рендеринга
Продолжаю работать над курсом по контент-заводам. Сегодня добавил часть по Creatomate - это крайне удобный сервис, который позволяет монтировать сложные ролики по API.
Кроме стандартных шаблонов, в которые вы можете подставлять свои динамические данные (картинки, текста, видео, музыку), сервис позволяет монтировать сложные сценарии через JSON, накладывая нужные эффекты - отличная альтернатива ffmpeg.
Прикрепил пример сложного ролика, который мы копировали для себя.
____
Курс по контент-заводам будет доступен в сообществе
Продолжаю работать над курсом по контент-заводам. Сегодня добавил часть по Creatomate - это крайне удобный сервис, который позволяет монтировать сложные ролики по API.
Кроме стандартных шаблонов, в которые вы можете подставлять свои динамические данные (картинки, текста, видео, музыку), сервис позволяет монтировать сложные сценарии через JSON, накладывая нужные эффекты - отличная альтернатива ffmpeg.
Прикрепил пример сложного ролика, который мы копировали для себя.
____
Курс по контент-заводам будет доступен в сообществе
This media is not supported in your browser
VIEW IN TELEGRAM
🔥2🤯1