Эд Хорьков из КОД9
1.41K subscribers
162 photos
14 videos
2 files
116 links
Платиновые тейки про разработку и бизнес. // для связи -> @edcode9

Master @ www.code9.studio

Сотрудничество, коллаборации -> Андрей, @gorbynov
Download Telegram
2603.05344v1.pdf
23.2 MB
Архитектура AI-агентов: учимся у тех, кто уже поймал все проблемы

1. Если вы как и мы делаете AI-агентов - вы точно знаете что после 15-20 вызовов инструментов начинается тупняк и агент забывает свои собственные инструкции и/или съедает весь контекст и/или зацикливается на одном и том же действии.

2. Большинство эти проблемы уже решены в кодинг-агентах. Клодкод, Курсор, и т.п. — это самые плюс минус зрелые и рабочие агенты на рынке сейчас.

3. К счастью, по некоторым из них есть прям пишут научной статьи. OpenDev — это open-source кодинг-агент, документна 80 страниц):

Я конечно целиком не прочитал, но с помощью LLM прочитал.

Какие подходы описаны:

— Разные модели под разные задачи. Дешёвая для суммаризации, дорогая для логики, отдельная для рассуждений.

— Контекст — это бюджет. Вызов тулов съедают 70-80% окна. Поэтому 5-стадийное сжатие. Детали ищите в статье.

— Планировщик-агент не знает что write-инструменты существуют. Разделение ответственности.

— Точечные напоминания вместо повторения системного промта. После 15 вызовов тула модель забывает инструкции.

— Инструменты подгружаются лениво. Вместо загрузки всех MCP-схем в контекст, агент ищет нужные по ключевым словам.

— Doom-loop detection: 3 одинаковых вызова подряд - значит тормозим агента и задаем вопрос пользователю.

Всё это применимо к любым агентам, не только кодинговым. Управление контекстом, затухание инструкций, зацикливание - это универсальная боль.

Советую грузить PDF в своего любимого дружбана и там с ним изучать его.

Оригинал: https://arxiv.org/abs/2603.05344
👍5
Бизнес-завтрак №3

20 марта, 10:10

Собираемся там же: Рихтер, Пятницкая 42.

Собираемся так же: небольшой круг, живое общение, разговоры по делу.

Формат тот же: без презентаций, разговор о том, что происходит в бизнесе. Что работает, что нет, где помогает ИИ, а где пока только мешает.

На прошлой встрече обсудили:
- как ИИ помогает с рутиной в коммуникациях
- архивы корп документов лежат мертвым грузом и что с этим делать
- риски чат-ботов без гардрейлов
- зачем бизнесу хранилище знаний по каждому проекту и где там ИИ

Если хотите присоединиться — пишите в личку @edcode9

(фотки с прошлого БЗ)
Это я был на закрытой встреча в AIRI - институте искусственного интеллекта. Слушал как правильно делать агентов.

Сейчас я уже дома
🔥3
Индивидуальный ИИ это не корпоративный ИИ

В эту пятницу на бизнес-завтраке обсудим, как нам построить новый завод

Когда я/вы начинаем пользоваться ЧатГПТ или Клодом - мы типа становимся продуктивнее.

Но компания от этого не становятся продуктивнее или лучше. Проблема в том, что индивидуальный ИИ (который у нас есть сейчас) и корпоративный ИИ (который мы еще придумываем) — это разные вещи.

Какие ключевые отличия?

— Координация
Компания из 100 человек с ChatGPT — это сто агентов, которые двигаются в разные стороны. Корпоративный ИИ нужен чтобы они двигались в одну.

— Сигнал или шум
С ИИ мы можем создавать кучу контента (шума). Корпоративный ИИ должен находить в этих горах то единственное, что важно.

— Объективность
ЧатГПТ/Клод скажет тебе что ты абсолютно прав даже когда ты не прав. Корпоративный ИИ должен уметь говорить нет.


— Специализация.
Корпоративный ИИ будет специализирован под конкретную задачу, а не делать все подряд как текущие модели.

— Выручка а не экономия времени
Большинство ИИ-продуктов продают экономию времени. Корпоративный ИИ должен генерировать доход.


— Автономность
Самый ценный ИИ — тот, который находит риск до того, о чем вообще никто не подумал.


Аналогия из статьи:
- в 1890-х заводы поставили электромоторы вместо паровых.
- 30 лет был почти нулевой прирост производительности.
- Только в 1920-х, когда полностью перестроили сам завод под электричество, пошёл результат.

Мы сейчас в 1900 году. Электричество есть а завод старый.
1🔥42💯2
Проблема последней мили

По моим постам дорогой читатель уже понял, что сфера моих интересов - это ИИзация бизнеса.

На эту тему вышла крутая статья от HBS, где описывается опыт внедрения AI в организации: pilot-rich but transformation-poor - много пилотов но мало трансформации.

И проблема не в агентах и не в моделях, а (к сожалению) в архитектуре/структуре организаций.

Какие основные проблемы:

- Нету понятного пути от пилота с масштабному внедрению. Один банк внедрил 250 приложений на базе ИИ, но никакого результата на уровне всего бизнеса это не привело.

- Хрупкие/устаревшие процессы. Накладываем AI на старые процесс и ничего не происходит. Нужно редизайнить весь процесс чтобы был результат.

- (Мое любимое) Экспертиза организации живет в головах у специалистов а не в документах. Более того - специалисты часто бояться делиться этой экспертизой, чтобы не лишиться работы.

- Human-in-the-loop становится проблемой, когда агентов сотки.

- Зоопарк из enterprise-система с которыми нужно работать агентом сильно затрудняет внедрение.


Итого - чтобы все получилось нужно менять структуру организации, оцифровывать экспертизу, воспринимать агентов как сотрудников (онбоардить их, ставить KPI и т.д.)

—-

Мы сейчас работаем над ИИ-трансформацией маркетингового агентства в том числе использую принципы, описанные в данной статье. Если у вас есть подобная задачи - пишите мне.
13🔥3👍1
ИИ в медицине

На полях Телемедфорума в Сколково сегодня я буду стоять возле нашего розового🌸 ролл-апа и отвечать на вопросы про искусственный интеллект🦾.

Приходите пообщаться. Регистрация кстати бесплатная. Я буду ближе к 15 часам.
7🔥6👍4
Просто оставлю это здесь. Всем хорошей пятницы!
2
Клод Дизайн

У нас в CRM9 есть UI Kit базовый.

Загрузил наш текущий код и этот UI KIt в Клод Дизайн, сделай мне мол дизайн систему.

Клод долго думал, окончательно исчерпал все лимиты. На дизайн систему оч слабо похоже.

Работаем дальше
Сделал свой первый скилл

Спойлер: вайбкодинг-контент ниже

Если вы работаете много с PostgreSQL и/или Supabase, то можете часто ловить проблемы с RLS - Row Level Security. На Insert политика есть, а на Update - нету и т.п.

Сделай специальный скилл для ауйдита RLS-политик на проекте, проверяет ваш RLS, приоретизирует проблему и говорить как их исправить.

https://github.com/ekhorkov/rls-audit

ставится так
/plugin marketplace add ekhorkov/rls-audit
/plugin install rls-audit@ekhorkov-rls-audit
12
Провел страт-сессию по ИИ-трансформации бизнеса

Последние месяцы я собирал свою структуру для таких сессий - из чего собирал:
1. страт-сессии, где я сам был участником и мог изнутри посмотреть как все происходит и как принимаются решения.

2. наш опыт в КОД9 внедрения ИИ в бизнес - в свои и в клиентский - где-то работало, где-то не работало и не обязательно проблема была в технологиях;

3. Исследования Harward Business Review и подобные - почему компании делают пилоты которые не доходят до операционного внедрения.


В итоге стало понятно., что проблема не в модельках, а в том что часто не понятно откуда нужно начинать ИИ-автоматизацию и как к ней правильно подходить, какие роли должны быть в процессе и кто за что должен отвечать. Модельки уже достаточно умные (и продолжают умнеть каждые 3-4 месяца), теперь нам нужно научиться их правильно готовить.

Сессия была в компании которая занимается serm-оптимизиций. Первым процессом выбрали срез инфополя — сбор поисковой выдачи, карт, разных источников и первичный анализ тональности и наметили следующие процессы которые можно перевести на иишку, какие роли нужно сформировать внутри и какие задачи нужно сделать в ближайший месяц. Получился такой контур стратегии по внедрению ИИ в бизнес.

Методологию собрал, дальше буду ее докручивать
24🔥4👍3
Как компании трансформируются в AI-native

Мы в 1900 году - электричество (ИИ-агенты) есть, а заводы (процессы) старые. Компании делают много пилотов с ИИ и получают мало результата.

Поэтому интересно смотреть на компании, которые перестраивают саму структуру под ИИ, а не прикручивают иишку к старым процессам.


CEO Coinbase написал о том, как они перестраивают свою компанию.

Вот его принципы:

1.Меньше менеджерских уровней, быстрее решения
Каждый управленческий уровень это накладные расходы на первод и пересказ контекста. Если ИИ ускоряет работу - структура должна за этим успевать, иначе ускорение упирается в менеджеров и результата нет.

2. No pure managers — нужны играющие тренеры
С учетом того что ИИ инструменты появляются каждый день - нельзя управлять AI-native организацией не используя их. Иначе не будешь понимать как работает твоя команда;

3. AI-native pods — маленькие команды, изначально построенные вокруг агентов.
Давайте соберем 3-5 человек, у которых половина задач делается агентами с первого дня. Без старых процессов -- по идее Coibase это будет быстрее, чем переучивать большую команду.


Вся эта трансформация она про структуру организации и новые роли, а не про инструменты (итоги страт-сессии). Coinbase будет перестраивать организацию, чтобы агенты вообще начали приносить пользу.

Если у вас в компании что-то подобное планируется — пишите. И приходите на AI & Breakfast, разбираем такие кейсы по пятницам. Кстати скоро будет анонс след завтрака.
👍2
AI & Break-fast ⚡️— 15 мая

Пятница - день бизнес-завтрака. В этот раз в новом месте.

Тема будет про скорость -- как внедрить ИИ с быстрым результатом (за 2 недели, а не 2 года).

На встрече потренируемся выделять такие места/процессы. Чтобы все участники не только позавтракали, но и ушли с пониманием, что можно запустить уже на следующей неделе.

Формат без презентаций, живое общение, 7–10 человек за столом, с конкретными кейсами.

Когда: 15 мая, начинаем в 10:30.
Где: Novikov School на Якиманке.

Мест мало. Для записи пишите мне в личку — @edcode9.
🤝1
AI & Breakfast — 29 мая

Этот завтрак будет тематический - с фокусом на HR-функцию. Как внедрить ИИ в HR-процессы и получить результат, который видно уже через месяц.

В своем эcce от декабря прошлого года я писал
Машины возьмут на себя рутинные задачи: скрининг, сортировку резюме, обновление знаний, построение программ обучения, аналитику, прогнозирование. Людям останется то, что невозможно автоматизировать: построение и развитие корпоративной культуры и ценностей, с которыми сотрудники себя хотят ассоциировать.

Прошло пол года, самое время посмотреть как близко мы пришли к этому прогнозу.

Формат без презентаций, живое общение, 7–10 человек за столом. Конкретные кейсы, цифры, подходы.

Когда: 29 мая, начинаем в 10:30.
Где: Novikov School.

Для записи пишите мне в личку — @edcode9. Или на TimePad.
🔥2👍1💯1