DEKSDEN notes

Please open Telegram to view this post

VIEW IN TELEGRAM

09:03

DEKSDEN notes

Channel photo updated

10:06

DEKSDEN notes

# Лимиты Anthropic's Claude / Claude Code
1/2

≐ Очень часто спрашивают про лимиты у СС или Клода. Что ж - вопрос закономерный, система лимитов у Антропиков очень оригинальная, такой больше нигде не видел. Кратко ответить в чате сложно, напишу что знаю тут.

Дело в том что жёстких лимитов на CC/claude.ai нет. Есть следующая система.

Вся работа с веб-версией сервиса (на claude.ai), все инструменты там (research и простые чаты), а также сеансы работы с Claude Code (которые с авторизацией через Account с подпиской) - вся эта активность пользователя делит общие лимиты. Лимиты устроены как "корзина токенов", которая пополняется каждые 5 часов - этот промежуток времени называется сессия. Сессию начинает любое действие, которое тратит токены - отправка сообщения в чат к любой модели, вызов сервиса на сайте, обращение к агенту. После окончания сессии новая сессия автоматически не начнётся, если нет пользовательской активности. Интересно, что сессия считается по часу, в котором она началась, с отбрасыванием минут. То есть если вы отправите первое сообщение в 9:57, то считается что сессия началась с 9:00 и новые токены вы получите с 14:00. Если вы отправляете первое сообщение в 10:01 - то сессия с 10:00.

👉 Когда сессия начинается, на неё выделяется определённое количество токенов (за базу возьмём платную подписку "про" за 20 баксов) для каждой модели - для опуса, соннета и хайку. Точное количество токенов антропики никогда не разглашали, кроме того, есть обоснованное мнение, что это количество зависит от нагрузки на сервера - то есть в часы пик (американский рабочий день), это количество поменьше.

Люди в интернетах оценивали количество токенов на одну сессию для "про" подписки следующим образом:

* 500к токенов Опус4,
* менее 2м токенов соннет4,
* более 3.5м токенов хайку.

▶️ Использование токенов разных моделей. Когда вы переключаетесь на другую модель, то для неё остаётся столько же процентов первоначального количества токенов, как вы потратили другой моделью. То есть если вы из 500к токенов опуса4 сожгли 50%, то при переключении на соннет у вас будет 50% лимита соннета, это около 800k-1м токенов. То есть нельзя сжечь токены опуса, а потом переключиться на соннет - трата идёт для всех моделей. Так как для реальной работы токенов опуса дают немного, то потратить лимит опусом можно гораздо быстрее. Ещё раз повторю - вся система нигде не анонсирована официально, это все догадки и обобщения опыта использования.

🔥 Как вы тратите токены / кэш: трата токенов агентом довольно линейная - он быстро выходит на использование запросов по 100-150к токенов за раз. Да, 95% этих запросов уходят из кэша, что спасает ситуацию, и токены жгутся менее интенсивно: при попадании запроса в кэш лимит токенов тратится значительно меньше, видимо пропорционально скидке к цене (90%).

Отмечу только, что не все понимают что пристёгнутые MCP сервера - это каждый раз несколько килотокенов в каждом запросе (каждом тулюзе) - на описание сервера, на описание всех его инструментов, схем их параметров и возвращаемых значений, промптов и прочего содержимого сервера. То есть лишние mcp сервера лучше отключать: помимо траты токенов, модели ещё и тяжело выбирать между большим ассортиментом тулов (а у агента штук 10 своих тулов, встроенных).

🔥 На всякий случай скажу, что в веб версии если вы используете проекты, нужно понимать, что все содержимое проекта отправляется с каждым запросом (да, кэшируется). Поэтому запрос низ проекта лучше не делать, если для контекста этого запроса проект не нужен - мало того, что трата токенов лишняя, ещё и модель будет отвлекаться на нерелевантный контекст.

... (продолжение тут: https://t.me/deksden_notes/5)

#post

DEKSDEN notes

# Лимиты Anthropic's Claude / Claude Code
2/2
(начало тут: https://t.me/deksden_notes/4)

...

🛗 Насчёт уровней подписки: есть подписка за 20 долларов - "про". Подписка "макс" за 100 долларов даёт х5 использования к уровню "про", а за 200 долларов - х20…

❤4👍1

473 viewsedited 12:39

DEKSDEN notes

# Лимиты Anthropic's Claude / Claude Code
2/2
(начало тут: https://t.me/deksden_notes/4)

...

🛗 Насчёт уровней подписки: есть подписка за 20 долларов - "про". Подписка "макс" за 100 долларов даёт х5 использования к уровню "про", а за 200 долларов - х20 к уровню "про". У подписок "макс" есть ещё одно публичное ограничение - 50 сессий в месяц (которые по 5 часов), но это тоже не жёсткое ограничение - если превысить, вас "могут" ограничить (а могут и не ограничить). Пока не превышал, не знаю как оно работает на практике.

👯 Что делать с лимитами, если они постоянно кончаются и не вовремя. Помимо очевидного решения перейти на следующий "тир", можно попробовать использовать несколько аккаунтов (2 или 3, если нужно больше - логично уже брать следующий уровень подписки). В веб версии доступа к проектам между аккаунтами нет, зато агент переключается между аккаунтами и продолжает ровно с места остановки: если СС прервался с сообщением "usage limit", то логинимся в новый аккаунт и пишем "продолжай". Все работает.

💡 Как логинится в несколько аккаунтов удобнее? так как более 2-3 аккаунтов у вас вряд ли будет, то я придумал такой лайвхак: я залогинился в разные аккаунты в разных браузерах на компе (у меня установлено несколько). СС открывает ссылку на логин в дефолтном браузере. Я копирую эту ссылку в нужный браузер и там кликаю на кнопку - происходит логин в нужный аккаунт. Реально 5 секунд на весь процесс.

␄

#post

DEKSDEN notes

# Лимиты Anthropic's Claude / Claude Code
1/2

≐ Очень часто спрашивают про лимиты у СС или Клода. Что ж - вопрос закономерный, система лимитов у Антропиков очень оригинальная, такой больше нигде не видел. Кратко ответить в чате сложно, напишу что знаю тут.…

❤3👍2

542 viewsedited 12:39

DEKSDEN notes

AI IDE vs AI SWE

🤯 В последнее время много сталкиваюсь с обсуждением - может или нет ИИ в проф программирование. И часто в нем участвуют люди с опытом условного Cursor и историями "а вчера мне курсор нахерачил в проекте такой дичи, что очевидно ИИ не готов к серьёзной работе, я все за ним перепроверяю". Ну или хайповое "replit стёр мне бизнес".

Сразу disclaimer: я считаю Cursor отличным IDE с лучшим (одним из лучших) ИИ ассистентов. Но лично я им не буду пользоваться вот по какой причине.

‼️ Надо разделять AI IDE vs AI SWE. Это фундаментально разные методики.

🚴 С AI IDE работаете с проектом вы сами, а ИИ вам ассистирует - дополняет код, выполняет поручения, запускает там чего то, настраивает. Но работаете вы, вы все направляете и контролируете. Это как "езда на велосипеде без рук", вроде бы и руками руля не касаетесь, но управляете постоянно.

🤖 AI SWE - это когда ИИ агент работает сам, а ваша работа становится другой. Я сейчас форсю 100% ai swe. Топовая штука в этом поле нынче антропиковская Claude Code (СС). Все методики и подходы тут другие, и автоматическая индексация проекта не решает. Это важно понимать и различать подходы. Поэтому когда курсор выпускается "в дикую природу" без загородки "из красных флажков" спеков - наступают последствия. Это как при езде на велосипеде без рук удивляться, что въехал в яму когда перестал смотреть на дорогу.

💰 А "как правильно" работать с AI SWE - это, конечно, вопрос на "миллион долларов", но уже другой.

#post
@deksden_notes

🔥8❤3

850 viewsedited 06:32

DEKSDEN notes

Persona Vectors: нейронные сигнатуры личности

😈 Антропики выявили в моделях отдельные вектора, которые формируют "нежелательные" черты и личности, и вместо фильтрации такого поведения перед деплоем "вырезают" такой вектор из модели. Работает.

Интересно! Интерпретируемость моделей - крутой домен, с неочевидными открытиями.

https://www.anthropic.com/research/persona-vectors

П.с. А куда они девают "вырезанное"? Или как в анекдоте - "а что отрезаем, мы мы сраазу выбрасываем!" 😁

#news
@deksden_notes

Anthropic

Persona vectors: Monitoring and controlling character traits in language models

A paper from Anthropic describing persona vectors and their applications to monitoring and controlling model behavior

👍3🤔1

609 viewsedited 06:49

DEKSDEN notes

Specs - это новый код

🔹 Наверное, тоже надо зафиксировать! Спеки - это новый код. Под спеками понимаю всю совокупность:

- memory bank с эпиками/фичами, гайдами, steering, design и прочими структурами.

- процессы для ИИ агентов + системпромпты агентов + кастомные команды

- докстринги всех видов: jsdoc, тэги, реферальные ссылки в коде

⚙️ Агентные системы будут переводить все это в работающие системы: генерировать код, конфигурации, докерфайлы, скрипты деплоя и прочие артефакты - это уже становится не особо ценными деталями, главное - это инфа. "Компиляция" в готовую систему будет/является делом техники, как раньше делом техники стала генерация кода для разных архитектур процессоров. Кстати, уже мало кто на практике смотрит как тот или иной компилятор задействует массив регистров процессора разных моделей, или насколько полна реализация системы команд.

📝 Постановка задачи, фиксация требований, логика работы в чистом виде - вот это остаётся ценностью. А их реализация скоро будет ваншотится моделями "со свистом" - уже для всех доступен инференс 2000 tps.

Думаю уже и язык реализации системы может особого значения не иметь - лишь бы в обучающей выборе модели пистутствовал! А паттерны модель все ранво обобщает - сможет на любом языке выразить.

#post
@deksden_notes

🔥5

778 viewsedited 13:27

DEKSDEN notes

Оглавление постов в канале (и чат):

* Чат 💬 :: https://t.me/+B1fB3sZbaVthMDhi
* ‼️ Правила канала: https://t.me/deksden_notes/478

——
👉 2026.01 🆕 : скиллы от подписчиков https://t.me/deksden_notes/387

---

Статьи:

⚡️AI Software Engineering: От хаоса Vibe Coding к системной разработке с AI-агентами (хабр) - введение в меморибанк

Я - соавтор, с Дмитрием @filippov_dm :: https://t.me/deksden_notes/15

⚡️ Calude-Code: субагенты (хабр)
https://t.me/deksden_notes/88

⚡️ 6 советов от практиков AI coding:
С Тимуром @yatimur
https://habr.com/ru/articles/997098/
---

‼️ ИИ-Словарик: Термины из мира AI SWE :: https://t.me/deksden_notes/174
- Учить и повторять перед сном

——

Большая серия постов про #deksdenFlow - мой флоу разработки:

👉 вот стартовый пост: https://t.me/deksden_notes/197
остальные идут следом, и поиск по тегу #deksdenFlow собирает все по теме в канале! Пользуйте тег

——

## Посты (#post):

* Лимиты Anthropic's Claude / Claude Code (2) :: https://t.me/deksden_notes/4
* AI IDE vs AI SWE :: https://t.me/deksden_notes/6
* Specs - это новый код :: https://t.me/deksden_notes/8
* Когда возможностей модели не хватает (2) :: https://t.me/deksden_notes/11
* 🐞 Неприятный баг в Claude Desktop :: https://t.me/deksden_notes/35
* 📦 Memory bank через Obsidian :: https://t.me/deksden_notes/43
* 📦 Пакуем проекты с Repomix: https://t.me/deksden_notes/102
* ♊️ Планируем с Gemini : https://t.me/deksden_notes/104

## Серия статей про агентные процессы:

* 🔥 Субагенты в Claude Code :: https://t.me/deksden_notes/16
- ⏳ Обновление списка агентов Claude Code :: https://t.me/deksden_notes/29

* ⚡️ Агентные процессы (Agentic Workflows) в Claude Code (2) :: https://t.me/deksden_notes/27
* 🗃️ Операционная память для агентских процессов на Папках задач (4):: https://t.me/deksden_notes/36
- 🤓 Простой пример для простого примера - доносим смыслы : https://t.me/deksden_notes/42
* ⚛️ Атомарные Duo файлы :: https://t.me/deksden_notes/49
* 🧩 Управление агентным контекстом :: https://t.me/deksden_notes/50

-—

▶️ Контекст-инжиниринг для меморибанков:

* индексные файлы index.md : https://t.me/deksden_notes/46
* 📂 Фронтмэттр :: https://t.me/deksden_notes/45
* главный индекс меморибанка и прайминг контекста: https://t.me/deksden_notes/51
* 🔗 Аннотированные md ссылки :: https://t.me/deksden_notes/47
* атомарные файлы : https://t.me/deksden_notes/49 , https://t.me/deksden_notes/52
* С4 модель : https://t.me/deksden_notes/52
* XML-like теги : https://t.me/deksden_notes/73
* оверинжиниринг : https://t.me/deksden_notes/368
* Progressive Disclosure : пробеги по граблям Skills и меморибанки : https://t.me/deksden_notes/407

▶️ кейсы и разбор проблем с агентами:

* Vibe Coding мифы и "охотничьи рассказы" : https://t.me/deksden_notes/59
* Разбор vibe-кейса 1️⃣ : https://t.me/deksden_notes/60
* Модель не справляется : https://t.me/deksden_notes/262

▶️ Тактические приемы работы с агентами:

* планирование в СС : https://t.me/deksden_notes/64 и https://t.me/deksden_notes/65
* vibecoding в CC : https://t.me/deksden_notes/89 и https://t.me/deksden_notes/90
* вайбкодинг в Кодексе : https://t.me/deksden_notes/124
* Codex workflow для рефакторинга : https://t.me/deksden_notes/144
* Local multiagent flow : https://t.me/deksden_notes/146
* Прайминг - Специализированные сессии : https://t.me/deksden_notes/329
* Флоу Peter Steinberger : https://t.me/deksden_notes/331
* Прайминг, если нет меморибанка : https://t.me/deksden_notes/412
* Планирование с агентом: работа с контекстом после прайминга : https://t.me/deksden_notes/413

👉 (Продолжение оглавления тут: https://t.me/deksden_notes/475)

DEKSDEN (chat)

Чат канала @deksden_notes
У нас - для продолжающих. Ai Dev goes BRRR!
(ц) Denis @deksden ))

❤4🔥4👍1🏆1

906 viewsedited 15:08

DEKSDEN notes

DEKSDEN notes pinned «Оглавление постов в канале (и чат): * Чат 💬 :: https://t.me/+B1fB3sZbaVthMDhi * ‼️ Правила канала: https://t.me/deksden_notes/478 —— 👉 2026.01 🆕 : скиллы от подписчиков https://t.me/deksden_notes/387 --- Статьи: ⚡️AI Software Engineering: От хаоса Vibe…»

15:08

DEKSDEN notes

Когда возможностей модели не хватает
1/2

🧐 В общении пару раз сталкивался с таким кейсом при обсуждении AI SWE - Spec-driven development. Все соглашаются, что БЕЗ подготовки проекта к работе с AI SWE, использование ИИ для работы с проектом возможно только в режиме ИИ-ассистента программиста.

Но сложности случаются и в, казалось бы, грамотно подготовленном к AI SWE проекте, с детальными спецификациями и хорошо проработанными процессами. Мы можем получить ситуацию, когда ИИ-агент генерирует код откровенно низкого уровня.

❓ В чем может быть дело?

Конечно, в каждом случае надо разбираться отдельно. Но я разберу не самые очевидные причины, которые возникают даже при, казалось бы, идеальной подготовке.

Допустим, у нас есть всё:

- действительно подробные инструкции;
- грамотно прописанные спецификации;
- процесс, разбитый на «правильные» этапы;
- код, структурированный на понятные модули;
- ясная и прописанная структура проекта;
- подробные JSDoc с перекрестными ссылками.

Казалось бы, идеальные условия. Но при генерации мы получаем код низкого качества: синтаксические ошибки, путаница в именах, падающие тесты, ошибки как в тестах, так и в коде.

Часто слышу: «Мы же говорили, ИИ не может!». И да, и нет. Когда модель сталкивается с задачей, сложность которой превышает её «емкость», она действительно может не справиться. Разберём, что происходит под капотом.

Например, нам известны параметры модели DeepSeek: 128 голов внимания, 61 слой. При обработке контекста 128 голов первого слоя ищут свои паттерны, затем 128 голов второго слоя обрабатывают контекст с учетом результатов первого, и так далее. Взаимосвязи простраиваются вглубь на протяжении всех 61 слоев. В итоге на стадии prefill создается KV Cache — «конспект» контекста. Далее начинается процесс декодирования, где для генерации каждого нового токена модель обращается к этому кэшу, чтобы понять, на что обратить внимание.

Вернёмся к нашим проблемам. В чем возникла сложность?

🚑 Общий диагноз: Да, в контексте модели есть все нужные требования, но из-за высокой общей сложности некоторым из них «не досталось» достаточного веса внимания и они проиграли в конкуренции за «бюджет внимания» модели. В результате нам кажется, что модель забыла или упустила какие то требования.

... (продолжение - https://t.me/deksden_notes/12)

#post

DEKSDEN notes

Что можно сделать?
2/2 (начало - https://t.me/deksden_notes/11)

1️⃣ Упростить контекст. Первое и самое прямолинейное решение — снизить когнитивную нагрузку. Уберите из контекста лишние файлы или нерелевантную информацию. Чем меньше в контексте «смысловых…

🔥4👍3🕊1

505 viewsedited 14:59

DEKSDEN notes

Когда возможностей модели не хватает
2/2 (начало - https://t.me/deksden_notes/11)

Что можно сделать?

1️⃣ Упростить контекст. Первое и самое прямолинейное решение — снизить когнитивную нагрузку. Уберите из контекста лишние файлы или нерелевантную информацию. Чем меньше в контексте «смысловых групп», тем проще модели выстроить между ними правильные связи. Если это практически возможно — сделайте это в первую очередь.

2️⃣ Повысить «читаемость» контекста для ИИ. Вы считаете, что у вас хорошо прописанные спецификации? Проверьте, реализованы ли в них эти техники:

- Жесткая структура: XML-теги для разметки семантических блоков, а внутри — Markdown с четкой иерархией и использованием разных маркеров списков для разных уровней.

- «Якоря» для внимания: Уникальные идентификаторы после каждого требования (так называемая «китайская запись», создающая сильную локальную ассоциацию и учитывающая казуальность трансформеров): "Функция должна быть асинхронной. ::ID-SPEC-FUNC-ASYNC-01::".

- Few-shot примеры: 1-2 коротких примера кода, который уже следует вашим спецификациям.

- Группировка: Раздельные блоки для требований к логике, стилю, тестам и т. д.

Часто именно эти детали отличают просто «хороший» промпт от стабильно «работающего».

3️⃣ Гранулировать задачу. Ваш процесс уже разбит на этапы? Проверьте, достаточно ли они мелкие. Часто решение кроется в том, чтобы разбить «большой» этап на несколько «микро-задач»:

- Сначала план, потом код: Первым шагом заставьте модель сгенерировать детальный implementation plan (список файлов, классов, функций).

- Генерация по плану: Следующими шагами давайте модели по одному пункту из её же плана.

4️⃣ Использовать итеративное «фокусное ревью». Если после генерации все равно остались ошибки, переходите к режиму исправления. Возьмите сгенерированный код и узкую подгруппу требований (например, только требования к безопасности) и дайте агенту команду проверить и исправить код только по этим пунктам. Так мы принудительно фокусируем всю «емкость» модели на очень маленьком срезе задачи.

⁉️ А если даже это не помогло?

Вероятность такого исхода крайне мала. Если модель не справляется с четкой, сфокусированной задачей, это почти всегда означает проблему в самом контексте. Вспоминаем главное правило: «Мусор на входе — мусор на выходе». Значит, нужно вернуться и проанализировать, не содержит ли промпт противоречивых инструкций или скрытой двусмысленности.

✨ Вывод: При грамотной инженерной проработке, сочетающей подготовку контекста, декомпозицию и итеративные исправления, процессы с использованием ИИ-агентов становятся предсказуемыми, надежными и качественными.

␄
#post

DEKSDEN notes

Когда возможностей модели не хватает
1/2

🧐 В общении пару раз сталкивался с таким кейсом при обсуждении AI SWE - Spec-driven development. Все соглашаются, что БЕЗ подготовки проекта к работе с AI SWE, использование ИИ для работы с проектом возможно только…

🔥7👍3

454 viewsedited 14:59

DEKSDEN notes

🌲Запускаем VS Coding Agents в JetBrains

IDE от JetBrains мною исторически любимы, я к ним привык - основной инструмент это шарм (PyCharm). Но с ассортиментом ai extensions для джетов всегда было хуже чем для VS Code-based IDEs.

Но вот какой проект нашелся: https://github.com/wecode-ai/RunVSAgent

В настоящее время поддерживают как минимум RooCode, что уже неплохо.

Я, конечно, за автономного агента без встраивания в IDE, и за 100% ai swe flow, но вдруг кому надо ассистента в IDE?) Можно пробовать

#link
@deksden_notes

GitHub

GitHub - wecode-ai/RunVSAgent: Run VSCode-based coding agents and extensions seamlessly within other IDE platforms - bridging the…

Run VSCode-based coding agents and extensions seamlessly within other IDE platforms - bridging the gap between VSCode ecosystem and other development environment. - wecode-ai/RunVSAgent

👍4🔥2🏆1

461 viewsedited 03:50

DEKSDEN notes

04:47

DEKSDEN notes

⚡️Статья на хабре: AI Software Engineering: От хаоса Vibe Coding к системной разработке с AI-агентами (введение в меморибанк)

Я - соавтор, с Дмитрием @filippov_dm

https://habr.com/ru/articles/934806/

#link
@deksden_notes

Хабр

AI Software Engineering: От хаоса Vibe Coding к системной разработке с AI-агентами

Введение: В мире разработки программного обеспечения происходит фундаментальная революция. Мы стоим на пороге перелома в самом подходе к созданию кода : от традиционного программирования, где...

🔥10👍5❤2

566 viewsedited 06:37

DEKSDEN notes

🔥 Субагенты в Claude Code
1/5

Решил написать обзор фишки субагентов в Claude Code (далее - сокращаем до общепринятого СС).

⏳ История вопроса уходит к первому публичному релизу СС. В ту пору субагенты были "обычным" инструментом Task - так он указывался в интерфейсе, но в исходном коде они сразу были названы AgentTool. Давайте для ясности далее будем называть его задачей (именно так, не субагентом или агентом, - почему объясню далее).

Это был простой инструмент: основной агент (будем дальше для ясности называть его **оркестратором**), это тот, с которым вы непосредственно общаетесь интерактивным чатом, вызывает инструмент Task, передаёт ему "задание" (промпт). Далее задача работает в отдельном контексте самостоятельно и возвращет результат оркестратору. В ходе работы задачи в интерфейсе СС мы видим некие сообщения о происходящих действиях, и все это пишется в json в сессию. Если есть желание почитать подробнее - можно использовать инструменты типа Claudia.

#post

(продолжение: https://t.me/deksden_notes/17)

DEKSDEN notes

🔥 Субагенты в Claude Code
Простой пример с картинками - оркестратор и задача
2/5

Давайте рассмотрим простой с картинками - запустили СС, попросили промптом выполнить некую задачу и СС запускает инструмент Task (1). Можно увидеть что в ui действия задачи…

1🔥3👍2

649 viewsedited 06:08

DEKSDEN notes

🔥 Субагенты в Claude Code
Простой пример с картинками - оркестратор и задача
2/5

Давайте рассмотрим простой с картинками - запустили СС, попросили промптом выполнить некую задачу и СС запускает инструмент Task (1). Можно увидеть что в ui действия задачи с инструментами отражаются, далее инструмент завершает работу, и отдаёт результат оркестратору, и оркестратор распоряжается ими в своём контексте. В нашем случае - сообщает пользователью (2). Обратите внимание что задача работала довольно долго, даже по такому несложному запросу.

"Под капотом" происходит все немного более многословно - запустив Claudia и проанализировав сессию, можно увидеть запуск инструмента задачи, увидеть промпт от оркестратора, на английском кстати (3).

Следом начинается лог работы задачи, запуск инструментов (4).

Последнеё сообщение в сессии работы задачи это резюме работы. Именно оно возвращается оркестратору, который его использует в своём контексте (5). Видно, что задача работала на английском, а оркестратор - на русском. И по языку явно видно что итоговое сообщение пользователю было сформировано именно оркестратором, но на основании информации от задачи.

Для просмотра сессии использована Claudia

#post

1👍3🔥2✍1

443 views06:11

DEKSDEN notes

🔥 Субагенты в Claude Code
3/5
Продолжим.

Что нам дал инструмент "задача"? Уже стало неплохо за счёт важного свойства - самостоятельного контекста задачи. Можно было делать длинные сессии работы оркестратора, промптом заставляя вести основную работу внутри задач. В результате последовательные линейные воркфлоу даже из значительного количества шагов выполнялис в челом неплохо. Можно было довести длительность сессии работы оркестратора до десятков минут, а самые талантливые умудрялись "выжимать" часы! Это важно, потому что время отражает количество сделанной полезной работы.

Какие были подводные камни? Их было несколько:

- управление работой инструмента "задача" осуществлялось оркестратором, и полностью зависело от него; когда у оркестратора в контексте было много информации, происходила деградация внимания, и он уже не мог внимательно и с требуемыми деталями прописывать задачи.
- задача наследовала от родительского процесса инструменты, и нельзя было настроить инструменты, доступные отдельной "задаче", в результате чего аналитические или поисковые задачи работали в контексте с им абсолютно не нужным условным менеджером БД postgres.
- работа всей системы (оркестратора и задач) велась с выбранной моделью

☑️ Резюмируем проблемы: точность промпта, контекст инструментов, модель.

Что мы могли видеть в работе, симптомы проблем? При попытках прописать "навороченный" flow оркестратору на поздних шагах происходила некоторая деградация внимания оркестратора, и он мог "забыть" указать важные вещи. Далее: убедить оркестратора писать длиныне подробные промпты почти невозможно: они выходят краткие и без требуемых деталей. Далее: оркестратор может заниматься "самодеятельностью" и добавлять в промпт чего то "от себя" в зависимости от полученного контекста. Например, задача поиска информации могла потом чего то этой информацией обновить, если оркестратору показалось что это актуально.

#post

1🔥5👍2✍1

438 views06:11

About

Blog

Apps

Platform