А это очень интересно 🧐
Попросил Perplexity проанализировать логи и собственное окружение.
Что примечательно:
Perplexity может сгенерировать python код, выполнить его и отрефлексировать свое окружение 😁
Похоже что каждый запрос выполняется в собственном Sandbox контейнере, там особо не набедокуришь, но исследовательский интерес зашкаливает.
В потрохах: FastAPI, Jupyter, рассыпуха python и npm пакетов, буду исследовать дальше, Perplexity весьма откровенен )
Посмотреть и вдохновиться можно здесь
Update: Sandbox это не просто docker контейнер-песочница, а E2BSandbox - инструменты для запуска ресерч агентов. О дивный новый мир, я каждый день узнаю о новой ИИ тулзе. 🤪
Попросил Perplexity проанализировать логи и собственное окружение.
Что примечательно:
Perplexity может сгенерировать python код, выполнить его и отрефлексировать свое окружение 😁
Похоже что каждый запрос выполняется в собственном Sandbox контейнере, там особо не набедокуришь, но исследовательский интерес зашкаливает.
В потрохах: FastAPI, Jupyter, рассыпуха python и npm пакетов, буду исследовать дальше, Perplexity весьма откровенен )
Посмотреть и вдохновиться можно здесь
Update: Sandbox это не просто docker контейнер-песочница, а E2BSandbox - инструменты для запуска ресерч агентов. О дивный новый мир, я каждый день узнаю о новой ИИ тулзе. 🤪
Perplexity AI
Проанализируй логи и собственное окружение, опиши стек технологий в которых...
На основе анализа доступного окружения выполнения и публичной информации о платформе, система Perplexity AI работает на многоуровневой технологической...
1🤯8🔥7 3👍2
Друзья, нас уже больше 3️⃣ 0️⃣ 0️⃣ !
Мне, честно говоря, самому не верилось, что это возможно. Огромное спасибо🙏 каждому за внимание (самый ценный ресурс нашего времени), оказанное доверие и интерес.
Это событие застало меня врасплох, заставило хорошенько задуматься, чем я хочу быть полезен, находясь в публичном поле. Поэтому я окончательно принял для себя стратегию делиться фундаментальными мыслями, артефактами деятельности и инсайтами сквозь призму практического опыта. Именно поэтому тут не будет ежедневного постинга, обсуждения событий или новостей, о которых говорят из каждого утюга.
Это то, чего лично мне не хватает в авторских каналах - редких, но основательных мыслей, вместо бесконечного потока сознания.
Пока я заканчиваю материал по эффективному программированию с ИИ в больших проектах (контента получилось неожиданно много), хочу попросить в небольшом опросе поделиться, какие темы вас интересуют больше всего. (Опрос в следующем сообщении)
Мне, честно говоря, самому не верилось, что это возможно. Огромное спасибо
Это событие застало меня врасплох, заставило хорошенько задуматься, чем я хочу быть полезен, находясь в публичном поле. Поэтому я окончательно принял для себя стратегию делиться фундаментальными мыслями, артефактами деятельности и инсайтами сквозь призму практического опыта. Именно поэтому тут не будет ежедневного постинга, обсуждения событий или новостей, о которых говорят из каждого утюга.
Это то, чего лично мне не хватает в авторских каналах - редких, но основательных мыслей, вместо бесконечного потока сознания.
Пока я заканчиваю материал по эффективному программированию с ИИ в больших проектах (контента получилось неожиданно много), хочу попросить в небольшом опросе поделиться, какие темы вас интересуют больше всего. (Опрос в следующем сообщении)
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥18 7 5
🙋♂️ Какие темы вас интересуют больше всего. (Можно выбрать несколько)
Anonymous Poll
31%
AI тренды и макроэкономика
10%
Программирование на Java, Kotlin, Swift, JavaScript
19%
О языках программирования, девелоперском тулинге и подходах
83%
Про разработку ИИ агентов (то на чем много я сфокусирован сейчас)
37%
IT управление: как создавать production-ready продукты и технологии
22%
Про жизнь стартапа глазами технического со-основателя B2B Sales платформы
🔥8👍2 1
Анатомия ИИ-агентов. Вступление
Книга Антонио Гулли очень хороша для старта в понимании агентских ИИ-систем, но оказалась слишком поверхностна, а темы разрозненны, чтобы покрыть спектр практического понимания, а как же на самом деле строить эти системы.
Я испробовал почти всё популярное: LangChain/LangGraph для python и typescript, CrewAI, ADK, даже Koog для Kotlin и yaml-ориентированный Composio. Каждый фреймоворк предлагает свои особенности и уровень простоты. Чем проще инструмент, тем меньше остается контроля над происходящим. Наш путь - заглянуть под капот, разобраться в нюансах и сделать для себя правильный выбор.
План такой:
1️⃣ Сначала разберемся, а из чего же состоит AI-агент и что, собственно, его делает агентом.
2️⃣ Исследуем, какие подходы предлагают фреймворки для смешивания детерминированной бизнес-логики c тем бардаком, что генерируют LLM
3️⃣ Столкнемся главным вызовом разработчика агентской системы - как заставить группу агентов работать совместно, защититься от галлюцинаций, таск-дрифта и других побочных эффектов работы систем с нечеткой логикой
4️⃣ В конце, обсудим плюсы и минусы, сделаем наметки на будущие шаги, возможно даже построим свой агентский фреймворк, обсуждая его дизайн в прямом эфире.
Мой собственный кейс зачем я полез с этим разбираться - создание AI-плейбука менеджера по продажам. Важнейший шаг плейбука - глубокое исследование клиентской компании. Суть задачи в том, чтобы взять целевую компанию, коммерческое предложение продавца, обойти интернет и скомпилировать отчет, который подскажет менеджеру как правильно зайти вхату компанию, с кем говорить, какие правильные вопросы задавать, выявить и соединить стратегические цели компании с предложением.
Это отличная задача для ИИ, но со звездочкой. Я для себя разделил целевое использование ИИ-агентов на 2 части:
- Исследовательское - компиляция данных, с LLM-верификацией источника. Мы не знаем заранее куда пойдет Агент и мы не можем полагаться на достоверность источника.
- Функциональное - компиляция данных из заранее верифицированного источника. Агент ходит в базы данных или в документы и предоставляет результат, которому мы, в целом, можем доверять.
Моя задача исследовательская, однако к результату особые требования. В отличие результатов, которые дают Deep Research режимы популярных вендоров, нам нужна строгая форма отчета + структурированный вывод, соблюдение акцентов на специфике оффера, переносимость workflow между разными LLM, достоверность и верификации найденных данных на уровне процесса, восставливаемость при сбое в точке остановки. И вот какие проблемы вылезли по дороге:
👻 Галлюцинации
OSS модели (а именно такие являются приритетными для российских реалий) легко выдумывают людей, факты, гипотезы ценности. Понижение температуры и требование “НИКОГДА НЕ ВЫДУМЫВАЙ …” в большом контексте не дает ожидаемого результата.
🏎️ Дрифт задачи
По мере заполнения контекстного окна агент отклоняется от исходной задачи и возвращает ответ, косвенно связанный с целевым.
🥵 Переполнение контекста
Контекстное окно в 1М токенов - привилегия проприетарных моделей, но такой объем драматически удорожает исследование. Стандартные подходы к сжатию режут массу полезных данных, а значит хорошо бы знать как сжимать контекст избегая потерь
💾 Сохранение состояния
Когда агентов в коллаборации много, результат работы каждого нужно держать в структурированном виде в виде обычной структуры данных в коде, учить одного из агентов управлять этим состоянием, выстраивать циклы обратной связи если возврат одного из агентов по какой-то причине не смог сохраниться.
... продолжение ниже
Книга Антонио Гулли очень хороша для старта в понимании агентских ИИ-систем, но оказалась слишком поверхностна, а темы разрозненны, чтобы покрыть спектр практического понимания, а как же на самом деле строить эти системы.
Я испробовал почти всё популярное: LangChain/LangGraph для python и typescript, CrewAI, ADK, даже Koog для Kotlin и yaml-ориентированный Composio. Каждый фреймоворк предлагает свои особенности и уровень простоты. Чем проще инструмент, тем меньше остается контроля над происходящим. Наш путь - заглянуть под капот, разобраться в нюансах и сделать для себя правильный выбор.
План такой:
1️⃣ Сначала разберемся, а из чего же состоит AI-агент и что, собственно, его делает агентом.
2️⃣ Исследуем, какие подходы предлагают фреймворки для смешивания детерминированной бизнес-логики c тем бардаком, что генерируют LLM
3️⃣ Столкнемся главным вызовом разработчика агентской системы - как заставить группу агентов работать совместно, защититься от галлюцинаций, таск-дрифта и других побочных эффектов работы систем с нечеткой логикой
4️⃣ В конце, обсудим плюсы и минусы, сделаем наметки на будущие шаги, возможно даже построим свой агентский фреймворк, обсуждая его дизайн в прямом эфире.
Мой собственный кейс зачем я полез с этим разбираться - создание AI-плейбука менеджера по продажам. Важнейший шаг плейбука - глубокое исследование клиентской компании. Суть задачи в том, чтобы взять целевую компанию, коммерческое предложение продавца, обойти интернет и скомпилировать отчет, который подскажет менеджеру как правильно зайти в
Это отличная задача для ИИ, но со звездочкой. Я для себя разделил целевое использование ИИ-агентов на 2 части:
- Исследовательское - компиляция данных, с LLM-верификацией источника. Мы не знаем заранее куда пойдет Агент и мы не можем полагаться на достоверность источника.
- Функциональное - компиляция данных из заранее верифицированного источника. Агент ходит в базы данных или в документы и предоставляет результат, которому мы, в целом, можем доверять.
Моя задача исследовательская, однако к результату особые требования. В отличие результатов, которые дают Deep Research режимы популярных вендоров, нам нужна строгая форма отчета + структурированный вывод, соблюдение акцентов на специфике оффера, переносимость workflow между разными LLM, достоверность и верификации найденных данных на уровне процесса, восставливаемость при сбое в точке остановки. И вот какие проблемы вылезли по дороге:
👻 Галлюцинации
OSS модели (а именно такие являются приритетными для российских реалий) легко выдумывают людей, факты, гипотезы ценности. Понижение температуры и требование “НИКОГДА НЕ ВЫДУМЫВАЙ …” в большом контексте не дает ожидаемого результата.
🏎️ Дрифт задачи
По мере заполнения контекстного окна агент отклоняется от исходной задачи и возвращает ответ, косвенно связанный с целевым.
🥵 Переполнение контекста
Контекстное окно в 1М токенов - привилегия проприетарных моделей, но такой объем драматически удорожает исследование. Стандартные подходы к сжатию режут массу полезных данных, а значит хорошо бы знать как сжимать контекст избегая потерь
💾 Сохранение состояния
Когда агентов в коллаборации много, результат работы каждого нужно держать в структурированном виде в виде обычной структуры данных в коде, учить одного из агентов управлять этим состоянием, выстраивать циклы обратной связи если возврат одного из агентов по какой-то причине не смог сохраниться.
... продолжение ниже
1👍11🔥5 3
… начало в предыдущем сообщении
🧠 Reasoning
Одна из мощнейших возможностей LLM после включения кратно снизила качество отчета и услила дрифт задачи уже на 3-4 итерации. Вот пример, ищу данные по компании “Ит1-Холдинг”:
Модель на 3 итерации размышляет: “Отлично, я получил последние новости по “ИТ-холдинг Т1”, этих данных мне хватит для понимания приоритетов развития на ближайший год. В тексте также упоминается ****ов Антон, который вероятно занимает пост директора по инновациям, поищу его цитаты и выступления за последний год“. Далее идет в гугл, получает лавину информации скрейпит ее и вместо 3-5 стратегических целей одной компании, выдает факты из высказываний совершенного другого человека из совершенно другой компании. Вывод: пойдем разбираться, как нам сделать Планирование и Размышление предсказуемым (и нет, примеры в промпте, zero-learning не помогут)
Помимо этих проблем: нюансы работы с краткросрочной и долгосрочной памятью, стриминг процесса в UI, sandboxing deep research агента и многое другое.
Мне кажется из этого может выйти довольно интересная серия постов. Начнем мы, как видно из заголовка, с препарирования ИИ-агента. Поделюсь тем, что уже знаю, а потом будем копать вместе. Надеюсь вам тоже будет интересно.
Подписывайтесь на MachineHead и делитесь с друзьями.
#анатомияииагентов
🧠 Reasoning
Одна из мощнейших возможностей LLM после включения кратно снизила качество отчета и услила дрифт задачи уже на 3-4 итерации. Вот пример, ищу данные по компании “Ит1-Холдинг”:
Модель на 3 итерации размышляет: “Отлично, я получил последние новости по “ИТ-холдинг Т1”, этих данных мне хватит для понимания приоритетов развития на ближайший год. В тексте также упоминается ****ов Антон, который вероятно занимает пост директора по инновациям, поищу его цитаты и выступления за последний год“. Далее идет в гугл, получает лавину информации скрейпит ее и вместо 3-5 стратегических целей одной компании, выдает факты из высказываний совершенного другого человека из совершенно другой компании. Вывод: пойдем разбираться, как нам сделать Планирование и Размышление предсказуемым (и нет, примеры в промпте, zero-learning не помогут)
Помимо этих проблем: нюансы работы с краткросрочной и долгосрочной памятью, стриминг процесса в UI, sandboxing deep research агента и многое другое.
Мне кажется из этого может выйти довольно интересная серия постов. Начнем мы, как видно из заголовка, с препарирования ИИ-агента. Поделюсь тем, что уже знаю, а потом будем копать вместе. Надеюсь вам тоже будет интересно.
Подписывайтесь на MachineHead и делитесь с друзьями.
#анатомияииагентов
3👍16🔥9 2
Вопрос года:
- Чем вы занимаетесь?
- ИИ пинаю
Не успел я наиграться с ACP, который позиционируют как протокол для скрещивания редакторов текста и AI, который я вообще-то хотел скрестить с другими интерфейсами, Google берет и выкатывает A2UI - протокол, устремляющийся именно к этим целям, который тут же именуют стандартом.
Когда-то нам показывали лабораторные эксперименты где прототипы Gemini OS по требованию в реалтаме генерируют интерфейсы с директориями, файлами и другими функциями ОС. Но идея оказалась черезчур хороша, чтобы с двух ног запрыгнуть в будущее, одним махом отменив индустрию разработки графических приложений.
В новой итерации, передовики из гугл спустились на грешную землю и предлагают нам агентскую обертку, которая проследит, чтобы модель генерировала JSON с описанием интерфейсного виджета, который можно будет отрисовать в любой из сред: Web, Flutter, Jetpack Compose, SwiftUI и тд.
Звучит как «мы бы и сами что-то такое сделали с помощью ACP 😁», но у этого протокола нашлась полезная фича: стриминг потока изменений в отрисованный элемент.
На странице с описанием транспортных протоколов для A2UI меня ждало странное - среди привычных REST и Websocket нашелся зверь под названием AG-UI, который сам является протоколом агентско-пользовательского взаимодействия (больше агентских протоколов богу агентских протоколов ) но более низкого уровня, если можно так выразиться.
Идти и пробовать находку рано. Там пока есть клиенты только для Flutter и Angular. Да и бекенд на питоне, что в целом такое себе.
Выводы.
На мой взгляд в гонке протоколов корпорации пытаются застолбить место для своих решений, чтобы в будущем силком затянуть нас в своифеодальные облачные вотчины. Я бы не торопился называть такие библиотеки протоколами и уж тем более стандартами. Нет никаких проблем заставить LLM генерить именно тот output, который можно распарсить и отрисовать виджет на манер Backend Driven UI так, как подходит именно вам. Весь UI в приложение тоже отправить не получится, речь идет об отдельных виджетах, например, на лету создавать интерактивные карточки для языковых приложений. Не то, чтобы нам нужен был для этого спец протокол, но начало положено. Эра ИИ-интерфейсов на пороге.
- Чем вы занимаетесь?
- ИИ пинаю
Не успел я наиграться с ACP, который позиционируют как протокол для скрещивания редакторов текста и AI, который я вообще-то хотел скрестить с другими интерфейсами, Google берет и выкатывает A2UI - протокол, устремляющийся именно к этим целям, который тут же именуют стандартом.
Когда-то нам показывали лабораторные эксперименты где прототипы Gemini OS по требованию в реалтаме генерируют интерфейсы с директориями, файлами и другими функциями ОС. Но идея оказалась черезчур хороша, чтобы с двух ног запрыгнуть в будущее, одним махом отменив индустрию разработки графических приложений.
В новой итерации, передовики из гугл спустились на грешную землю и предлагают нам агентскую обертку, которая проследит, чтобы модель генерировала JSON с описанием интерфейсного виджета, который можно будет отрисовать в любой из сред: Web, Flutter, Jetpack Compose, SwiftUI и тд.
Звучит как «мы бы и сами что-то такое сделали с помощью ACP 😁», но у этого протокола нашлась полезная фича: стриминг потока изменений в отрисованный элемент.
На странице с описанием транспортных протоколов для A2UI меня ждало странное - среди привычных REST и Websocket нашелся зверь под названием AG-UI, который сам является протоколом агентско-пользовательского взаимодействия (
Идти и пробовать находку рано. Там пока есть клиенты только для Flutter и Angular. Да и бекенд на питоне, что в целом такое себе.
Выводы.
На мой взгляд в гонке протоколов корпорации пытаются застолбить место для своих решений, чтобы в будущем силком затянуть нас в свои
a2ui.org
A2UI, a streaming protocol for Agent-Driven User Interfaces
5👍13 3 2
С Наступающим Новым Годом, друзья! 🎄
Подходит к концу этот непростой, вихревой год. Для многих из нас он был проверкой на прочность — в работе, в делах, в вере в себя и свои силы.
Я и сам прошел через сложный этап: запуск стартапа, первые попытки оторваться от земли, преодоление страха неизвестности, борьбы с неопределенностью. Но именно в такие моменты понимаешь, что ценнее всего — поддержка близких, честность с собой и упрямая готовность сделать ещё один шаг.
Пусть в наступающем году у нас у всех будет чуть больше ясности и спокойствия. Не гнаться за всем сразу, а сосредоточиться на том, что по-настоящему важно.
Желаю вам в 2026 году устойчивости. Твёрдой почвы под ногами. Верных решений. И надежной команды — на работе и в жизни — которая будет рядом, создавая надежную опору в движении к общей цели.
Спасибо, что остаётесь здесь. Ваша поддержка и внимание значат для меня очень много.
С наступающим! Берегите себя и своих близких. ❤️
Подходит к концу этот непростой, вихревой год. Для многих из нас он был проверкой на прочность — в работе, в делах, в вере в себя и свои силы.
Я и сам прошел через сложный этап: запуск стартапа, первые попытки оторваться от земли, преодоление страха неизвестности, борьбы с неопределенностью. Но именно в такие моменты понимаешь, что ценнее всего — поддержка близких, честность с собой и упрямая готовность сделать ещё один шаг.
Пусть в наступающем году у нас у всех будет чуть больше ясности и спокойствия. Не гнаться за всем сразу, а сосредоточиться на том, что по-настоящему важно.
Желаю вам в 2026 году устойчивости. Твёрдой почвы под ногами. Верных решений. И надежной команды — на работе и в жизни — которая будет рядом, создавая надежную опору в движении к общей цели.
Спасибо, что остаётесь здесь. Ваша поддержка и внимание значат для меня очень много.
С наступающим! Берегите себя и своих близких. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥16👍4 3 1
Анатомия ИИ-агентов. Часть 1 - Истоки и архитектура. [1/2]
Подходит концу первая рабочая неделя этого года. Дабы провести выходные с пищей для ума, самое время с двух ног запрыгнуть в устройство ИИ-агентов. Начнем с истоков.⚡️
Первыми практическими предшественниками современных ИИ-агентов стали экспертные системы, появившиеся в 1960-х годах. Экспертная система — это система искусственного интеллекта (весьма ограниченного), которая на основании знаний и опыта эксперта-человека может решать задачи в определенной области. В 1965 году в Стэнфордском университете Эдвард Фейгенбаум создал DENDRAL — первую в истории экспертную систему для определения структуры химических веществ.
Прорыв в понимании ИИ-агентов произошел в 1973 году, когда Карл Хьюитт разработал модель актора — подход, позволяющий создавать системы, где независимые агенты взаимодействуют друг с другом через обмен сообщениями. Одной из первых таких систем стала Distributed Problem Solver, созданная в 1981 году. В 1986 году Марвин Минский в книге “Society of Mind” предложил представлять сложные задачи как результат взаимодействия множества отдельных агентов, работающих в “сообществе”. Почему это важно? Модель актора обеспечила сдвиг ментальной модели программирования от систем с общей памятью и блокировками к архитектуре, основанной на передаче сообщений и изоляции состояния.
Современный ИИ-агент, следуя принципам акторной модели и построенный поверх большой лингвистической модели, отличителен 3-мя ключевыми свойствами:
Свойство 1. Автономность и независимое выполнение задач.
В понимании современных ИИ-агентов речь идет о способности агента к планированию следующего шага. В отличие от “голой” LLM, где мы работаем в режиме “запрос-ответ”, агент действует в, так называемом, агентском цикле: Наблюдение → Планирование → Действие. Агентский цикл конечен. Независимо от его сложности, агент на вход получает запрос, запускает цикл и его цель вернуть ожидаемый результат. Вот, что делают шаги цикла:
1. Наблюдение. Агент анализирует результаты своих предыдущих действий, собирает данные из окружения, выполняет контекстное обогащение.
2. Планирование. Агент использует различные методы рассуждений для определения наилучшего способа действий. Модель начинает думать над решением запроса пользователя, разрабатывает план для дальнейших действий и определяет, какие инструменты можно использовать.
3. Действие. Агент выбирает необходимые инструменты и начинает их использовать в соответствии с задачами, сформулированными на этапе планирования.
Свойство 2. Интеграция с инструментами и окружением
В шаге планирования и действия агенту доступно мета-описание его окружения: команд, которые может выбрать LLM, для взаимодействия с окружающим миром. Между командой и LLM - тонкий слой управляющего кода, интерпретирующего текстовые ответы в вызов кода самой команды. Именно поэтому к LLM выдвигается требование к способности отвечать структурированно (Structured output). Действуя, агент делает 1 или множество запросов к LLM, получая структурированные ответы, вызывает инструменты - обычный код в функциях и классах с поведением, исполняемый процессором, выполняет работу, а также сверяется с исходным планом.
продолжение...
Подходит концу первая рабочая неделя этого года. Дабы провести выходные с пищей для ума, самое время с двух ног запрыгнуть в устройство ИИ-агентов. Начнем с истоков.
Первыми практическими предшественниками современных ИИ-агентов стали экспертные системы, появившиеся в 1960-х годах. Экспертная система — это система искусственного интеллекта (весьма ограниченного), которая на основании знаний и опыта эксперта-человека может решать задачи в определенной области. В 1965 году в Стэнфордском университете Эдвард Фейгенбаум создал DENDRAL — первую в истории экспертную систему для определения структуры химических веществ.
Прорыв в понимании ИИ-агентов произошел в 1973 году, когда Карл Хьюитт разработал модель актора — подход, позволяющий создавать системы, где независимые агенты взаимодействуют друг с другом через обмен сообщениями. Одной из первых таких систем стала Distributed Problem Solver, созданная в 1981 году. В 1986 году Марвин Минский в книге “Society of Mind” предложил представлять сложные задачи как результат взаимодействия множества отдельных агентов, работающих в “сообществе”. Почему это важно? Модель актора обеспечила сдвиг ментальной модели программирования от систем с общей памятью и блокировками к архитектуре, основанной на передаче сообщений и изоляции состояния.
Современный ИИ-агент, следуя принципам акторной модели и построенный поверх большой лингвистической модели, отличителен 3-мя ключевыми свойствами:
Свойство 1. Автономность и независимое выполнение задач.
Многие проводят равенство между автономностью и самостоятельностью, мол, агент живет сам по себе и делает работу, как человек, то нет. Самостоятельность - способность не только выполнять действия без надзора, но и ставить подцели, адаптироваться к неизвестным заранее условиям. Дело не в технических ограничениях. Самостоятельность (и его объем) - производное от доверия, а доверие - краеугольный камень любых внешних, не только агентских систем.
В понимании современных ИИ-агентов речь идет о способности агента к планированию следующего шага. В отличие от “голой” LLM, где мы работаем в режиме “запрос-ответ”, агент действует в, так называемом, агентском цикле: Наблюдение → Планирование → Действие. Агентский цикл конечен. Независимо от его сложности, агент на вход получает запрос, запускает цикл и его цель вернуть ожидаемый результат. Вот, что делают шаги цикла:
1. Наблюдение. Агент анализирует результаты своих предыдущих действий, собирает данные из окружения, выполняет контекстное обогащение.
2. Планирование. Агент использует различные методы рассуждений для определения наилучшего способа действий. Модель начинает думать над решением запроса пользователя, разрабатывает план для дальнейших действий и определяет, какие инструменты можно использовать.
3. Действие. Агент выбирает необходимые инструменты и начинает их использовать в соответствии с задачами, сформулированными на этапе планирования.
Свойство 2. Интеграция с инструментами и окружением
В шаге планирования и действия агенту доступно мета-описание его окружения: команд, которые может выбрать LLM, для взаимодействия с окружающим миром. Между командой и LLM - тонкий слой управляющего кода, интерпретирующего текстовые ответы в вызов кода самой команды. Именно поэтому к LLM выдвигается требование к способности отвечать структурированно (Structured output). Действуя, агент делает 1 или множество запросов к LLM, получая структурированные ответы, вызывает инструменты - обычный код в функциях и классах с поведением, исполняемый процессором, выполняет работу, а также сверяется с исходным планом.
продолжение...
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍8🔥7 4
Анатомия ИИ-агентов. Часть 1 - Истоки и архитектура. [2/2]
В начало
Свойство 3. Память
LLM не обладает собственной памятью (или состоянием) между запросами - каждый запрос обрабатывается независимо, как в первый раз. То, что мы называем агентом, является обычной программой с собственным окружением. Как и любая другая программа, она может хранить состояние в оперативной памяти, обращаться к базам данных, собирать необходимый контекст для выполнения пользовательской задачи. Простейший вид памяти - сохранение всей последовательности запросов к LLM и ее ответов.
Так же как человеческий мозг имеет полушария и специализированные отделы, обеспечивающие нам интеллектуальные способности во всем их многообразии, ИИ-агент может быть разделен на части для пущей интеллектуальности. Программную архитектуру можно представить в виде фрактала - узора, обладающего свойством самоподобия: его части в уменьшенном масштабе повторяют структуру целого, где основной узор - агентский цикл. Агентский цикл, как архитектурная единица, в том же виде используется для создания под-модулей: планировщика, рефлексии, цензора, интерпретатора и тд. Когда и как эти подмодули-микроагенты (не путать с суб-агентами) будут вступать в работу определяет разработчик, склеивая их в процесс всё тем же обычным кодом (как, увидим в следующих статьях).
——
Подытоживая, архитектура ИИ-агента удивляет своей простотой и масштабируемостью, являясь кирпичиком системы любой сложности. Агент может быть как простейшим SingleRun-вызовом к LLM с остановкой после ответа, так и ReAct-агентом, самостоятельно принимающим решение как действовать дальше и когда заканчивать. Их и будем разбирать далее.
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!✌️
В начало
Свойство 3. Память
LLM не обладает собственной памятью (или состоянием) между запросами - каждый запрос обрабатывается независимо, как в первый раз. То, что мы называем агентом, является обычной программой с собственным окружением. Как и любая другая программа, она может хранить состояние в оперативной памяти, обращаться к базам данных, собирать необходимый контекст для выполнения пользовательской задачи. Простейший вид памяти - сохранение всей последовательности запросов к LLM и ее ответов.
Так же как человеческий мозг имеет полушария и специализированные отделы, обеспечивающие нам интеллектуальные способности во всем их многообразии, ИИ-агент может быть разделен на части для пущей интеллектуальности. Программную архитектуру можно представить в виде фрактала - узора, обладающего свойством самоподобия: его части в уменьшенном масштабе повторяют структуру целого, где основной узор - агентский цикл. Агентский цикл, как архитектурная единица, в том же виде используется для создания под-модулей: планировщика, рефлексии, цензора, интерпретатора и тд. Когда и как эти подмодули-микроагенты (не путать с суб-агентами) будут вступать в работу определяет разработчик, склеивая их в процесс всё тем же обычным кодом (как, увидим в следующих статьях).
——
Подытоживая, архитектура ИИ-агента удивляет своей простотой и масштабируемостью, являясь кирпичиком системы любой сложности. Агент может быть как простейшим SingleRun-вызовом к LLM с остановкой после ответа, так и ReAct-агентом, самостоятельно принимающим решение как действовать дальше и когда заканчивать. Их и будем разбирать далее.
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍13🔥8 5
Обожаю оптимизм Claude Code в отношении сроков реализации. Он еще не знает, что он всё это запилит в следующие 20 минут 🤣
Нет, ребята, я не забил на канал. Последние 1,5 месяца, не поднимая головы трудился над платформой и развитием бизнеса.
Собственно, давайте расскажу, что мы тут строим. Это SaaS платформа Prospect Guide призванная решить проблему разваливающихся сделок в B2B если сделка сложнее чем просто продать стулья и дольше 2-х месяцев, когда есть пресейл, переговоры, сложный продукт и вот это вот всё.
Даже не спрашивайте где посмотреть лендинг, пилотируясь с клиентами из первого "ручного" захода в рынок, итерируемся с ними доставляя обновления чуть ли не каждый день. картинки и тезисы на ленде устареют за 2 недели. Но пунктик насчет лендинга есть и думаю в марте выйдем из стелс-режима.
"Ну а где там AI?" спросит любопытный читатель. (канал-то с акцентом на ИИ). Удивительно, но в 2026 году, это одна из немночисленных ниш, где AI не является самоценностью. Но без него конечно же было бы не айс, поэтому различные хелперы-генераторы живут под фиче-флагами и тестируются избранными желающими, толерантными к выкрутасам отечественных нейронок (увы, б2б секьюрити комплаенс суров).
Claude Code в разработке используется в хвост и в гриву с claude-mem, плагинами, агентами, скилами и всем что сейчас есть. Репозиторий был не мал до клода, поэтому пришлось вырабатывать на ходу правила, работы над очень большими кодовыми базами. Накидайте 🔥 если хотите, чтобы я на этой недельке выложил полный список этих наработок.
Такие вот новости. Адская пахота чуть сбавляет обороты, поэтому появится больше времени на канал. Я по вам скучал )
Нет, ребята, я не забил на канал. Последние 1,5 месяца, не поднимая головы трудился над платформой и развитием бизнеса.
Собственно, давайте расскажу, что мы тут строим. Это SaaS платформа Prospect Guide призванная решить проблему разваливающихся сделок в B2B если сделка сложнее чем просто продать стулья и дольше 2-х месяцев, когда есть пресейл, переговоры, сложный продукт и вот это вот всё.
Даже не спрашивайте где посмотреть лендинг, пилотируясь с клиентами из первого "ручного" захода в рынок, итерируемся с ними доставляя обновления чуть ли не каждый день. картинки и тезисы на ленде устареют за 2 недели. Но пунктик насчет лендинга есть и думаю в марте выйдем из стелс-режима.
"Ну а где там AI?" спросит любопытный читатель. (канал-то с акцентом на ИИ). Удивительно, но в 2026 году, это одна из немночисленных ниш, где AI не является самоценностью. Но без него конечно же было бы не айс, поэтому различные хелперы-генераторы живут под фиче-флагами и тестируются избранными желающими, толерантными к выкрутасам отечественных нейронок (увы, б2б секьюрити комплаенс суров).
Claude Code в разработке используется в хвост и в гриву с claude-mem, плагинами, агентами, скилами и всем что сейчас есть. Репозиторий был не мал до клода, поэтому пришлось вырабатывать на ходу правила, работы над очень большими кодовыми базами. Накидайте 🔥 если хотите, чтобы я на этой недельке выложил полный список этих наработок.
Такие вот новости. Адская пахота чуть сбавляет обороты, поэтому появится больше времени на канал. Я по вам скучал )
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥30 3 3🤯1
ИИ в больших инженерных командах
Давно собирался расписать.
В разговорах с тимлидами и CTO постоянно одна и та же картина: дали кодерам ИИ (тот же Cursor), надеялись на буст продуктивности, а бустанули число инцидентов или просто замедлились в тех или иных местах.
Поначалу я думал, дело в инструментах. Потом в зрелости команд. Потом в моделях. Оказалось, нет. Подход. Административная инициатива "сверху-вниз" без ясного понимания как это будет работать на местах, не работает с разработчиками высоких грейдов.
Расписал, как с этим жить.
Туториал для IT руководителей как дать ИИ команде, чтобы пересадить ребят на работу с агентами:
1️⃣ почему решение спущенное сверху-вниз проваливается,
2️⃣ что такое «подчинённая проактивная позиция» агента
3️⃣ три фазы интеграции агентского кодинга.
Там же скилы для агентов и расписанный воркфлоу, как кодить в кодовой базе любого масштаба, которыми я давно хотел поделиться. Наконец-то всё запаковал в статью для удобного восприятия не только разработчиками.
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!✌️
https://habr.com/ru/articles/1030314
Давно собирался расписать.
В разговорах с тимлидами и CTO постоянно одна и та же картина: дали кодерам ИИ (тот же Cursor), надеялись на буст продуктивности, а бустанули число инцидентов или просто замедлились в тех или иных местах.
Поначалу я думал, дело в инструментах. Потом в зрелости команд. Потом в моделях. Оказалось, нет. Подход. Административная инициатива "сверху-вниз" без ясного понимания как это будет работать на местах, не работает с разработчиками высоких грейдов.
Расписал, как с этим жить.
Туториал для IT руководителей как дать ИИ команде, чтобы пересадить ребят на работу с агентами:
Там же скилы для агентов и расписанный воркфлоу, как кодить в кодовой базе любого масштаба, которыми я давно хотел поделиться. Наконец-то всё запаковал в статью для удобного восприятия не только разработчиками.
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!
https://habr.com/ru/articles/1030314
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
ИИ‑агенты в инженерной команде: гайд для тимлида, который не хочет получить бунт
Вы прочитали гайд по Cursor, посмотрели демку Claude Code, посчитали в голове экономику и решили: пора. Спускаете в команду указание — попробовать на следующей итерации. Через...
50🔥7 3 3
TL:DR к статье, для тех кто не тимлид и не руководитель, но хочет резко прокачать свою работу с агентами
Я вывел для себя, что мне веселее когда агент не пишет всё сам по одному промпту "сделай хорошо, а плохо постарайся не делать", а помогает креативить, комплексно искать подходы к реализации фич, подбирать архитектурные решения, собирать спецификацию, которую я одобрил. Где вместо предположения "наверное там всё ок", я точно знаю потому, что каждый шаг обдумывал и подтвердал.
Для этого, путем многих итераций был создан скилл brainstorm. Он организует весь этот цикл. Просто попробуйте. Работает в Codex, Claude Code, и более менее других популярных агентах. Обычно, в промпте я триггерю скилл вручную и начинаю фразу "давай спроектируем/продумаем и тд". Крайне полезно после перечислить UserStory или верхнеуровневые требования. Самая крутая фича этого скила: возможность обсудить проблему/подход/решение с агентом и когда вопрос уточнен, он сам возвращается на прежний трек последовательных вопросов-ответов. Без форка сессии, с сохранением в контексте потока мыслей и гипотез.
Далее. Эту спеку я перекладываю в скилл Planner. Этот скилл разбивает спеку на спринты так, чтобы с 90% вероятностью 1 спринт уложился в 1 контекстное окно и выполнен за 1 заход. Кто бы что ни говорил, а 1М контекста в клоде либо оверюзает токены, либо качество деградирует. Модель держит форму до 400К, но после ... такое себе. GPT 5.5 стал есть драматически меньше токенов и я перестал сталкиваться с ухудшением результатов после автокомпакта.
На выходе обоих скиллов я получаю 2 артекфакта: спека + план. Далее я приступаю к методичной работе plan-implement используя простейший промпт, как например этот, когда делал дешборды аналитики в Prospect Guide:
И финалочка - скилл code-review. Через него я прогоняю результат работы по спринту.
Не доверяясь целиком машине, ревьюю глазами, правлю, слежу за полной тестов и тд. В масштабе 1 спринта, делать это комфортно, есть возможность сверяться со спекой.
Вы вероятно спросите, почему это лучше популярного набора скилов superpowers, в котором есть brainstorm, write-plan, implement и другие?
1. Их brainstorm не дает подумать или изменить решение. Задает 3-4 вопроса, зачастую просто подтверждая указанные требования и фиксирует их в спеке. Я хочу, чтобы вопросов было больше, они были глубже, агент фильтровал их по значимости, исследовал код и нашел проблемы, невидимые с поверхности и обсудил и со мной. А потом убедился, что он правильно понял мое намерение.
2. write-plan пишет готовые вставки куда код воткнуть. Это дичь, которая меня дико бесила. Я хочу, чтобы спека и план формулировали ЧТО я хочу и КАК это лучше сделать, а не впихивали в план готовые куски кода, чтобы потом растасовать их по файлам. Ну и этот план нереально рабивать на куски. Useless вообщем. Хорошо для замены примитивного промптинга, но для серьезной работы никуда не годится.
Вот мой пак скилов завернутый в набор Skillforce на Github, забирайте, пользуйтесь, кидайте идеи и фидбек. Ставятся на изи, стандартным способом в любой репозиторий.
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!✌️
Я вывел для себя, что мне веселее когда агент не пишет всё сам по одному промпту "сделай хорошо, а плохо постарайся не делать", а помогает креативить, комплексно искать подходы к реализации фич, подбирать архитектурные решения, собирать спецификацию, которую я одобрил. Где вместо предположения "наверное там всё ок", я точно знаю потому, что каждый шаг обдумывал и подтвердал.
Для этого, путем многих итераций был создан скилл brainstorm. Он организует весь этот цикл. Просто попробуйте. Работает в Codex, Claude Code, и более менее других популярных агентах. Обычно, в промпте я триггерю скилл вручную и начинаю фразу "давай спроектируем/продумаем и тд". Крайне полезно после перечислить UserStory или верхнеуровневые требования. Самая крутая фича этого скила: возможность обсудить проблему/подход/решение с агентом и когда вопрос уточнен, он сам возвращается на прежний трек последовательных вопросов-ответов. Без форка сессии, с сохранением в контексте потока мыслей и гипотез.
Далее. Эту спеку я перекладываю в скилл Planner. Этот скилл разбивает спеку на спринты так, чтобы с 90% вероятностью 1 спринт уложился в 1 контекстное окно и выполнен за 1 заход. Кто бы что ни говорил, а 1М контекста в клоде либо оверюзает токены, либо качество деградирует. Модель держит форму до 400К, но после ... такое себе. GPT 5.5 стал есть драматически меньше токенов и я перестал сталкиваться с ухудшением результатов после автокомпакта.
На выходе обоих скиллов я получаю 2 артекфакта: спека + план. Далее я приступаю к методичной работе plan-implement используя простейший промпт, как например этот, когда делал дешборды аналитики в Prospect Guide:
Бери в работу Sprint 1 плана content-section-analytics-plan.md
И финалочка - скилл code-review. Через него я прогоняю результат работы по спринту.
/code-review Sprint 1 of content-section-analytics-plan.md
Не доверяясь целиком машине, ревьюю глазами, правлю, слежу за полной тестов и тд. В масштабе 1 спринта, делать это комфортно, есть возможность сверяться со спекой.
Вы вероятно спросите, почему это лучше популярного набора скилов superpowers, в котором есть brainstorm, write-plan, implement и другие?
1. Их brainstorm не дает подумать или изменить решение. Задает 3-4 вопроса, зачастую просто подтверждая указанные требования и фиксирует их в спеке. Я хочу, чтобы вопросов было больше, они были глубже, агент фильтровал их по значимости, исследовал код и нашел проблемы, невидимые с поверхности и обсудил и со мной. А потом убедился, что он правильно понял мое намерение.
2. write-plan пишет готовые вставки куда код воткнуть. Это дичь, которая меня дико бесила. Я хочу, чтобы спека и план формулировали ЧТО я хочу и КАК это лучше сделать, а не впихивали в план готовые куски кода, чтобы потом растасовать их по файлам. Ну и этот план нереально рабивать на куски. Useless вообщем. Хорошо для замены примитивного промптинга, но для серьезной работы никуда не годится.
Вот мой пак скилов завернутый в набор Skillforce на Github, забирайте, пользуйтесь, кидайте идеи и фидбек. Ставятся на изи, стандартным способом в любой репозиторий.
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - pridees/skillforce: General purpose AI skills improve spec-driven development and structured approach to code with AI
General purpose AI skills improve spec-driven development and structured approach to code with AI - pridees/skillforce
5🔥4 2 2
This media is not supported in your browser
VIEW IN TELEGRAM
Нынче все кому не лень делают свои надстройки поверх всевозможных агентских harness, в основном codex и cc. Приложений десятки. Твиттер забит анонсами, чуть ли не каждый день появляется новая приблуда на electron. Я ненароком начал думать, что где-то раздают стартер-пак для разработки. Сегодня мне на глаза попался Lunel и это кое-что любопытное.
Приложение состоит из 2х частей: cli и мобильное приложение для iOS и Android. С весьма приятным UI/UX. Запускаешь CLI в директории проекта, сканируешь qr и у тебя полный комплект мобильной разработки прямо в твоем репозитории. Git, любой агент, файловый менеджер, терминал, запуск процессов и тд. И работает очень шустро.
В чем-то очень похоже на remote control от claude code, но без вендор лока. Единственное чего мне не хватило, так это вызова команд codex, типа compact или ревью. В остальном - топ. Ко всему еще и open source.
Что самое интересное, сессию можно закрыть, но к ней можно в любой момент вернуться если cli на компьютере сохраняет активность. Конечно, могут быть вопросики к безопасности, но для самоуспокоения можно всё собрать вручную.
Сайт проекта здесь
Подписывайтесь на MachineHead и делитесь с друзьями! Stay tuned!
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍3 3 3 2
Завтра во всех каналах про ИИ: От AI статистически нет пользы. Пузырь лопнул. Расходимся 😄
Ну а если посмотреть серьезно, токены - пыль. Вся суть в том, чтобы их умно жечь. Опытный разработчик много думает, мало пишет. ИИ наоборот надо заставлять писать много кода, много думать, чтобы итеративно придти более-менее оптимальному результату.
Ранее, токены стремительно дешевели, но сокращение лимитов последнее время резко развернуло тренд (то бишь удорожание). Так это что получается, мы двигаемся к первому кризису - более продвинутые модели теряют рентабельность, а рынок уже на пределе платежеспособности?
Есть ненулевой шанс, что при таком корпоративном долге и коммитментом в инфраструктурные инвестиции на годы вперед под вероятные, но не гарантированные доходы, передовики ИИ на внутреннем рынке поймают GG.
https://t.me/data_secrets/9300
Ну а если посмотреть серьезно, токены - пыль. Вся суть в том, чтобы их умно жечь. Опытный разработчик много думает, мало пишет. ИИ наоборот надо заставлять писать много кода, много думать, чтобы итеративно придти более-менее оптимальному результату.
Ранее, токены стремительно дешевели, но сокращение лимитов последнее время резко развернуло тренд (то бишь удорожание). Так это что получается, мы двигаемся к первому кризису - более продвинутые модели теряют рентабельность, а рынок уже на пределе платежеспособности?
Есть ненулевой шанс, что при таком корпоративном долге и коммитментом в инфраструктурные инвестиции на годы вперед под вероятные, но не гарантированные доходы, передовики ИИ на внутреннем рынке поймают GG.
https://t.me/data_secrets/9300
Telegram
Data Secrets
После утренней новости про отказ Microsoft от Claude Code выяснилось, что они в своих идеях не одиноки
Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи…
Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи…
15👍8🔥4🤯4