⚪️ DeepSeek v4
Кучно пошли! Не успеваем фронтир смотреть))
1.6T параметров - не напасешься макмиников запускать.. Будем смотреть, конечно - дипсик ждали весьма.
Бенчи не самые крутые, но на уровне фронтира чуть прошлого поколения. к слову - но бенчи бенчам рознь, подождем обзоров. Плюс это 1m контекст, что тоже интересно - насколько он эффективен будет
Ух! Напряженное завершение месяца выдалось
@deksden_notes
Кучно пошли! Не успеваем фронтир смотреть))
1.6T параметров - не напасешься макмиников запускать.. Будем смотреть, конечно - дипсик ждали весьма.
Бенчи не самые крутые, но на уровне фронтира чуть прошлого поколения. к слову - но бенчи бенчам рознь, подождем обзоров. Плюс это 1m контекст, что тоже интересно - насколько он эффективен будет
Ух! Напряженное завершение месяца выдалось
@deksden_notes
🔥11👍6❤🔥1
⚪️ Куда делись дешевые подписки chatGPT
Оказалось, что таки уязвимость в платежном сервисе OpenAI эксплуатировалась
🔗 Тут есть кое какие детали: https://community.openai.com/t/eligibility-for-the-chatgpt-google-trial-continues-to-be-illegally-exploited-and-monetized-by-countless-individuals/1379386
Видимо, разборки посредников, кто стоял близко к вершине пирамиды перепродажи "дешевых" аккаунтов. Интересно, что codex уязвимость не нашел и клозеды ее "не замечали". Думаю, не сильно переживали, а просто набирали пользователей. Ведь "подсев" на ИИ - слазить будет тяжело, заплатят рано или поздно)) Разумный расчет, к слову.
В общем, пока дешевые подписки кончились, имейте ввиду.
@deksden_notes
Оказалось, что таки уязвимость в платежном сервисе OpenAI эксплуатировалась
🔗 Тут есть кое какие детали: https://community.openai.com/t/eligibility-for-the-chatgpt-google-trial-continues-to-be-illegally-exploited-and-monetized-by-countless-individuals/1379386
Видимо, разборки посредников, кто стоял близко к вершине пирамиды перепродажи "дешевых" аккаунтов. Интересно, что codex уязвимость не нашел и клозеды ее "не замечали". Думаю, не сильно переживали, а просто набирали пользователей. Ведь "подсев" на ИИ - слазить будет тяжело, заплатят рано или поздно)) Разумный расчет, к слову.
В общем, пока дешевые подписки кончились, имейте ввиду.
@deksden_notes
OpenAI Developer Community
Eligibility for the ChatGPT Google trial continues to be illegally exploited and monetized by countless individuals
Up to now there are still countless people taking credentials from Google trial eligible accounts and using Android packet sniffing methods to apply them to other accounts that are not eligible including Plus one month six months one year plans and Pro one…
😢11🔥6👍3
⚪️ Активация GPT-5.5 в Codex.app который через CPA
Gpt 5.5 раскатали всем платным тарифам, но я работаю через кучу аккаунтов через CliProxyAPI (оболочка Quotio для мака). В итоге, в нем оно так и не завелось - пришлось немного поковырять, чтобы все заработало.
Сначала был исследован сам CPA - но он с версии .36 уже выдает поддерживаемую модель gpt-5.5 и вроде бы не виноват. Даже генерация картинок в Кодексе завелась (это починили). Поэтому подозреваемым был назначен клиент Codex.app.
Исследования issues на гитхабе подтвердили - вопрос к клиентам. Нашелся патчер для codex.app текущих версий (.422 поддерживается).
Он включает:
• Fast settings control in Settings
• Composer /fast slash command
• Speed submenu in the composer
• GPT-5.5 model-list entry for custom-API users
• Plugins access for custom-API users
По всей видимости часть фич приложения отключается для "неродных" эндпоинтов, а эта штука включает все обратно. Для CLI такого патчера пока не нашел, подождем новых релизов CLI, может там само починится. Либо прийдется писать "по мотивам" самому! Не хотелось бы, впрочем.
Так как на гитхабе у проекта ДВЕ звезды было (одна - моя), пришлось исследовать проект на наличие закладок и вредного поведения. Исследовал проект через 5.5 (она же была прокачана в кибербезе, даром что ли?) - кражи секретов или иньекции майнеров не обнаружено. Кодекс думает что там все хорошо, но вы поняли - на свой страх и риск))
🔗 Патчер: https://github.com/Veath/codexfast
(ц) ынжой!
@deksden_notes
Gpt 5.5 раскатали всем платным тарифам, но я работаю через кучу аккаунтов через CliProxyAPI (оболочка Quotio для мака). В итоге, в нем оно так и не завелось - пришлось немного поковырять, чтобы все заработало.
Сначала был исследован сам CPA - но он с версии .36 уже выдает поддерживаемую модель gpt-5.5 и вроде бы не виноват. Даже генерация картинок в Кодексе завелась (это починили). Поэтому подозреваемым был назначен клиент Codex.app.
Исследования issues на гитхабе подтвердили - вопрос к клиентам. Нашелся патчер для codex.app текущих версий (.422 поддерживается).
Он включает:
• Fast settings control in Settings
• Composer /fast slash command
• Speed submenu in the composer
• GPT-5.5 model-list entry for custom-API users
• Plugins access for custom-API users
По всей видимости часть фич приложения отключается для "неродных" эндпоинтов, а эта штука включает все обратно. Для CLI такого патчера пока не нашел, подождем новых релизов CLI, может там само починится. Либо прийдется писать "по мотивам" самому! Не хотелось бы, впрочем.
Так как на гитхабе у проекта ДВЕ звезды было (одна - моя), пришлось исследовать проект на наличие закладок и вредного поведения. Исследовал проект через 5.5 (она же была прокачана в кибербезе, даром что ли?) - кражи секретов или иньекции майнеров не обнаружено. Кодекс думает что там все хорошо, но вы поняли - на свой страх и риск))
🔗 Патчер: https://github.com/Veath/codexfast
(ц) ынжой!
@deksden_notes
❤🔥10🔥7
⚪️ CuaDriver - фоновое руление софом на macOS (для агентов)
Computer Use на кодексе представил как можно в фоновом режиме не особо мешая человеку работать агентом с любым приложением и в фоновом режиме. Это удобно.
Этот open source проект позволяет делать так же любому агенту.
🔗 Репо: https://github.com/trycua/cua
🔗 Блог с потрохами: https://github.com/trycua/cua/blob/main/blog/inside-macos-window-internals.md
——
В комменты кинули аналог:
🔗 rust, кросс-платформа, cli: https://github.com/lahfir/agent-desktop
@deksden_notes
Computer Use на кодексе представил как можно в фоновом режиме не особо мешая человеку работать агентом с любым приложением и в фоновом режиме. Это удобно.
Этот open source проект позволяет делать так же любому агенту.
🔗 Репо: https://github.com/trycua/cua
🔗 Блог с потрохами: https://github.com/trycua/cua/blob/main/blog/inside-macos-window-internals.md
——
В комменты кинули аналог:
🔗 rust, кросс-платформа, cli: https://github.com/lahfir/agent-desktop
@deksden_notes
👍6🔥2
⚪️ Codex.app for Linux (unofficial)
Am.will такую штуку сделал:
🔗 Репо: https://github.com/am-will/codex-app
Работает 5.5 и релиз - последний. Это все потому что электрон приложение, перепаковать его не так сложно. В общем, это сделали. Неофициальное, зато полнофункциональное.
@deksden_notes
Am.will такую штуку сделал:
🔗 Репо: https://github.com/am-will/codex-app
Работает 5.5 и релиз - последний. Это все потому что электрон приложение, перепаковать его не так сложно. В общем, это сделали. Неофициальное, зато полнофункциональное.
@deksden_notes
👍13❤6
⚪️ GPT-5.5 Codex
Есть слуха про такую штуку.
❓ А оно нам надо?
По мне - не факт. Я так и нге понял большого профита от моделей -кодекс. Или есть фанаты таких сборок?
@deksden_notes
Есть слуха про такую штуку.
❓ А оно нам надо?
По мне - не факт. Я так и нге понял большого профита от моделей -кодекс. Или есть фанаты таких сборок?
@deksden_notes
👍5
⚪️ Кодекс - используем субагентов
Я в своих операционных интерактивных промптах с кодексом использую сварм. Но в ванильном виде он слегка лажает, поэтому проптим субагентов дополнительными инструкциями.
Вот сабж:
Это отражение моих забегов по граблям с субагентами кодекса. Уверен что у СС свои приколы с этой системой, ибо я пока не видел модели, которая до конца правильно и грамотно дирижирует набором субагентов
▶️ Почему обмен через файлы? Потому что в контекст оркестратор сильно лаконично формулирует промпты, и еще как ссылаться при верификации? а тут - есть файл, и мы можем на него сослаться в любой момент.
❓ Как вы дрессируете стаю субагентов?
@deksden_notes
Я в своих операционных интерактивных промптах с кодексом использую сварм. Но в ванильном виде он слегка лажает, поэтому проптим субагентов дополнительными инструкциями.
Вот сабж:
<правила_использования_субагентов>
Используй временную папку .tasks/ в корне репо и сделай папку внутри под хранение файлов задач этого протокола, для хранения там артефактов исследования агентов - это будет рабочая папка.
Задачи агентам ставим путем создания файлов в рабочей папке. Отчеты субагентов тоже размещаются в рабочей папке, проинструктируй об этом субагентов.
Есть лимит по количеству субагентов, поэтому предварительно удали тех субагентов которых ты не используешь и следи за их количеством. Оставляй субагента только если собираешься дать ему задание в дополнение к текущему заданию (flollow up).
Обязательно дожидайся результатов работы субагента, не прерывай его без веской причины. Следи за количеством субагентов, грамотно используй лимит чтобы выполнить работу.
Делай запуск субагентов параллельно насколько возможно, если не вся работа сделана - запускай ее как освободятся слоты.
Для новой задачи лучше всего запускать работу с новым субагентом (удалив ненужного из пула), чем переиспользовать существующего. Ставь для каждой работы подходящую модель субагенту (выбирай из gpt-5.5 для сложной работы, gpt-5.3-codex или gpt-5.4-mini).
С полным форком контекста нельзя переопределять тип/модель агента, имей ввиду!
Твоя задача как оркестартора - не только запускать субагентов, но и передать им грамотно контекст - либо это будет форк твоей сессии, либо нужно в инструкциях субагенту отразить все что он должен знать.
После получения отчета субагента нужно иметь ввиду, что он работал в немного другом контексте и перепроверять, все ли моменты были сделаны на основании правильного контекста.
</правила_использования_субагентов>
Это отражение моих забегов по граблям с субагентами кодекса. Уверен что у СС свои приколы с этой системой, ибо я пока не видел модели, которая до конца правильно и грамотно дирижирует набором субагентов
▶️ Почему обмен через файлы? Потому что в контекст оркестратор сильно лаконично формулирует промпты, и еще как ссылаться при верификации? а тут - есть файл, и мы можем на него сослаться в любой момент.
❓ Как вы дрессируете стаю субагентов?
@deksden_notes
1❤19👍9🔥5❤🔥1🕊1
⚪️ Codex Sub-Agents, vNext
В связи с предыдущим постом, я тут немного поразбирался в субагентах кодекса. В связи с чем решил накатать этот пост.
▶️ Во-первых, и это уже месяц минимум как не новость - в кодексе сделали более-менее стандартных субагентов как в СС. То есть их можно описывать в отдельном файле, обзывать по имени, и задавать им кастомный промпт с настройками тулов/mcp. Всё "как у людей", вернее, как в СС было с лета 2025)) Поэтому чувство дежавю легкое. Но тут клозеды не удержались, и сделали не в стандартном md файле описание, а в .toml. Не особо страшно, но не удобно - скиллы то они нормальные заюзали! Надо будет насоветовать им в сторону md с фронтметтером. Чего они выделяются то?!
❓Спросите - ну и чо? На самом деле это открывает возможность создания кастомных агентов, промптом заточенных на определенную задачу, которые уже умеют делать эту задачу (за счет промпта) и им не надо разбираться как оно делается. Вроде бы и стандартный агент может скилл прочитать... Поэтому - да, сейчас скиллы во многом заменили кастомных агентов, может быть поэтому новость прошла мимо меня.
▶️ Во-вторых, поразбирался в потрохах системы суб-агентов. Не особый секрет, что сейчас в кодексе делается новая версия агентного сварма, который исторически в коде именуется multi-agent, а на публике стал sub-agents. В общем, в кодексе готовится multi-agents-v2, которую уже можно включить фичафлагом (multi_agent_v2).
Тут много заметных ихменений. Самое главное - это модель коммуникации/управления субагентами. Раньше субагент запускался как дочерняя сессия, и задачи ему поступали как имитация сообщения пользвоателя. И ответ поступал как сообщение пользвоателя. Поэтому в апи управления субагентами было ожидание определенного субагента.
▶️ В новой системе перешли на "агентную почту". Агент может отпарвить сообщения другому агенту (считайте, что по имени). Можно "заснуть" до момента поступления любого сообщения. То есть оркестратор запустив в работу сварм субагентов, может "заснуть" и ожидать, когда его разбудит или сообщение от любого агента, или ввод пользователя. Теперь не обязательно "бегать кругами вокруг агентов" в ожидании результата! Ну и агентная почта поступает с метаданными - то есть видно кто написал.
Письма субагенту могут прерывать его текущую работу, или нет. Если нет - то это аналог steer сообщений пользователя, которые поступают в контекст модели и она принимает их "к сведению".
▶️ Есть некоторые особенности управления контекстом для субагентов. Если мы наследуем контекст родительской сессии - то мы наследуем и модель, и все сообщения сессии, и уровень ризонинга.
Но есть и возможность начинать субагента либо с пустого контекста, либо взять в контекст один или более последних "ходов". Ход - это группа сообщений сессии, обычно от сообщения пользователя до завершения работы модели и ее финального сообщения. Из этих ходов фильтруются все блоки размышлений, тулюза - остаются только промежуточные комментарии модели при выполнении и сообщения (видимо, пользвоателя и других агентов).
Кастомного субагента (терминология плавает - это то agent role, то agent type) может быть назначена только если контекст пустой или настледует ограниченное количество ходов. полный форк сессии не позволяет "повесить" на нее роль - видимо, потому что только чатсичный форк позволяет собрать контекст заново, с инъекцией инструкций кастомного субагента вначале.
▶️ В общем, система выглядит гораздо более рабочей в части мультиагентного применения.
@deksden_notes
В связи с предыдущим постом, я тут немного поразбирался в субагентах кодекса. В связи с чем решил накатать этот пост.
▶️ Во-первых, и это уже месяц минимум как не новость - в кодексе сделали более-менее стандартных субагентов как в СС. То есть их можно описывать в отдельном файле, обзывать по имени, и задавать им кастомный промпт с настройками тулов/mcp. Всё "как у людей", вернее, как в СС было с лета 2025)) Поэтому чувство дежавю легкое. Но тут клозеды не удержались, и сделали не в стандартном md файле описание, а в .toml. Не особо страшно, но не удобно - скиллы то они нормальные заюзали! Надо будет насоветовать им в сторону md с фронтметтером. Чего они выделяются то?!
❓Спросите - ну и чо? На самом деле это открывает возможность создания кастомных агентов, промптом заточенных на определенную задачу, которые уже умеют делать эту задачу (за счет промпта) и им не надо разбираться как оно делается. Вроде бы и стандартный агент может скилл прочитать... Поэтому - да, сейчас скиллы во многом заменили кастомных агентов, может быть поэтому новость прошла мимо меня.
▶️ Во-вторых, поразбирался в потрохах системы суб-агентов. Не особый секрет, что сейчас в кодексе делается новая версия агентного сварма, который исторически в коде именуется multi-agent, а на публике стал sub-agents. В общем, в кодексе готовится multi-agents-v2, которую уже можно включить фичафлагом (multi_agent_v2).
Тут много заметных ихменений. Самое главное - это модель коммуникации/управления субагентами. Раньше субагент запускался как дочерняя сессия, и задачи ему поступали как имитация сообщения пользвоателя. И ответ поступал как сообщение пользвоателя. Поэтому в апи управления субагентами было ожидание определенного субагента.
▶️ В новой системе перешли на "агентную почту". Агент может отпарвить сообщения другому агенту (считайте, что по имени). Можно "заснуть" до момента поступления любого сообщения. То есть оркестратор запустив в работу сварм субагентов, может "заснуть" и ожидать, когда его разбудит или сообщение от любого агента, или ввод пользователя. Теперь не обязательно "бегать кругами вокруг агентов" в ожидании результата! Ну и агентная почта поступает с метаданными - то есть видно кто написал.
Письма субагенту могут прерывать его текущую работу, или нет. Если нет - то это аналог steer сообщений пользователя, которые поступают в контекст модели и она принимает их "к сведению".
▶️ Есть некоторые особенности управления контекстом для субагентов. Если мы наследуем контекст родительской сессии - то мы наследуем и модель, и все сообщения сессии, и уровень ризонинга.
Но есть и возможность начинать субагента либо с пустого контекста, либо взять в контекст один или более последних "ходов". Ход - это группа сообщений сессии, обычно от сообщения пользователя до завершения работы модели и ее финального сообщения. Из этих ходов фильтруются все блоки размышлений, тулюза - остаются только промежуточные комментарии модели при выполнении и сообщения (видимо, пользвоателя и других агентов).
Кастомного субагента (терминология плавает - это то agent role, то agent type) может быть назначена только если контекст пустой или настледует ограниченное количество ходов. полный форк сессии не позволяет "повесить" на нее роль - видимо, потому что только чатсичный форк позволяет собрать контекст заново, с инъекцией инструкций кастомного субагента вначале.
▶️ В общем, система выглядит гораздо более рабочей в части мультиагентного применения.
@deksden_notes
👍15🔥6❤3✍1❤🔥1
⚪️ Суб-агенты: зачем
❓ В чатике нашего канала (welcome, если что, ссылка в описании канала) встал закономерный вопрос: а как можно использовать субагентов, чем они важны или полезны?
▶️ Сразу скажу что работать можно вполне и без субагентов, нет такой работы, которую бы можно сделать только субагентами. Последовательное выполнение задач вполне себе работает (исключение которое мне кажется имеется - скажу позже)
Какие же задачи можно решать субагентами эффективно?
▶️ Прежде всего - исследования. Шикарно сварм работает когда мы хотим что то найти в проекте, разобраться в чем то. Можно назначит ьсубагенту мелкую модель (например, gpt-5.4-mini) и она довольно быстро, щадящим образом для лимитов соберет вам контекст по кодовой базе. Примеры промптов типа "разберись как в проекте работает система аутентификации, ее взаимосвязи и контракты, как она документирована - в общем, собери все. Используй субагентов для поиска на gpt-5.4-mini". В кодексе есть даже субагент explore вроде бы, видел несколько раз как он сам запускался.
▶️ Проработка разных аспектов плана. Тут посложнее.
👉 Лирическое отступление про постановку задачи и отчетность. Я ВСЕГДА делаю материализованные планы, постаноку задач и отчеты о выполнении. Это значит что все через md файлы. Да, можно в контекст сессии все пихать, и оно где то в сессии даже будет в файл записано, но использвоание файлов дает мне:
• прослеживаемость: я всегда могу открыть файл и посомтреть какое задание было дано
• артефакты задачи все в одном месте, в папке задачи, не надо искать по сессиям
• можно сослаться на план работы (ставя задачу верификации или ревью)
• часто агент может лучше поставить задачу в файл, чем в контекст, более развернуто, плюс - можно записывать задачу через паттерн рефлексии: первым шагом записали черновик задачи, вторым шагом промпт на "доработай задачу, ..." - и станет заметно лучше;
• задачу в файле можно прорабатывать в много проходов, по разным аспектам - в контексте агент не будет пересказывать ее дословно со всеми деталями, она потеряется при длительном обсуждении;
Теперь к аспектам: когда мы делаем план, надо много вещей держать ввиду. Соблюдение паттернов, стандартов кода. Не оверинжинирить. Безопасность кода. Документирвоание именений. Переимпользование сущностей кода и следование архзитектуре проекта. Работа с БД/хранилищем, миграции и прочие приколы. Соблюдение принятого в проекте гит флоу. Соблюдение подходов к CI / CD, схема выкатки деплоев. ... Думаю, вы можете в зависимости от специфики проекта перечислить массу таких аспектов!
Для того чтобы план работы был проработан по всем этим аспектам, и проработан хорошо, в идеале нужно каждый аспект прогонять моделью отдельно - тогда она качественно этот аспект проработает. В отдельных ответственных случаях я делаю @3 самплинг (это когда задача повторяется три раза, а потом мы интегрируем результат, при это 3 минимально полезный самплинг, лучше 5 делать для прям хорошего качества).
Как вы понимаете, если у вас десяток аспектов - то это уже 10 запусков агента. А если на часть и @3 самплинг, ... В общем, тут тоже здорово работает модель запустить это через субагентов. Промптинг я делаю на постановку задачи через файл, на результат отработки задачи через файл.
... (продолжение: https://t.me/deksden_notes/713)
❓ В чатике нашего канала (welcome, если что, ссылка в описании канала) встал закономерный вопрос: а как можно использовать субагентов, чем они важны или полезны?
▶️ Сразу скажу что работать можно вполне и без субагентов, нет такой работы, которую бы можно сделать только субагентами. Последовательное выполнение задач вполне себе работает (исключение которое мне кажется имеется - скажу позже)
Какие же задачи можно решать субагентами эффективно?
▶️ Прежде всего - исследования. Шикарно сварм работает когда мы хотим что то найти в проекте, разобраться в чем то. Можно назначит ьсубагенту мелкую модель (например, gpt-5.4-mini) и она довольно быстро, щадящим образом для лимитов соберет вам контекст по кодовой базе. Примеры промптов типа "разберись как в проекте работает система аутентификации, ее взаимосвязи и контракты, как она документирована - в общем, собери все. Используй субагентов для поиска на gpt-5.4-mini". В кодексе есть даже субагент explore вроде бы, видел несколько раз как он сам запускался.
▶️ Проработка разных аспектов плана. Тут посложнее.
👉 Лирическое отступление про постановку задачи и отчетность. Я ВСЕГДА делаю материализованные планы, постаноку задач и отчеты о выполнении. Это значит что все через md файлы. Да, можно в контекст сессии все пихать, и оно где то в сессии даже будет в файл записано, но использвоание файлов дает мне:
• прослеживаемость: я всегда могу открыть файл и посомтреть какое задание было дано
• артефакты задачи все в одном месте, в папке задачи, не надо искать по сессиям
• можно сослаться на план работы (ставя задачу верификации или ревью)
• часто агент может лучше поставить задачу в файл, чем в контекст, более развернуто, плюс - можно записывать задачу через паттерн рефлексии: первым шагом записали черновик задачи, вторым шагом промпт на "доработай задачу, ..." - и станет заметно лучше;
• задачу в файле можно прорабатывать в много проходов, по разным аспектам - в контексте агент не будет пересказывать ее дословно со всеми деталями, она потеряется при длительном обсуждении;
Теперь к аспектам: когда мы делаем план, надо много вещей держать ввиду. Соблюдение паттернов, стандартов кода. Не оверинжинирить. Безопасность кода. Документирвоание именений. Переимпользование сущностей кода и следование архзитектуре проекта. Работа с БД/хранилищем, миграции и прочие приколы. Соблюдение принятого в проекте гит флоу. Соблюдение подходов к CI / CD, схема выкатки деплоев. ... Думаю, вы можете в зависимости от специфики проекта перечислить массу таких аспектов!
Для того чтобы план работы был проработан по всем этим аспектам, и проработан хорошо, в идеале нужно каждый аспект прогонять моделью отдельно - тогда она качественно этот аспект проработает. В отдельных ответственных случаях я делаю @3 самплинг (это когда задача повторяется три раза, а потом мы интегрируем результат, при это 3 минимально полезный самплинг, лучше 5 делать для прям хорошего качества).
Как вы понимаете, если у вас десяток аспектов - то это уже 10 запусков агента. А если на часть и @3 самплинг, ... В общем, тут тоже здорово работает модель запустить это через субагентов. Промптинг я делаю на постановку задачи через файл, на результат отработки задачи через файл.
... (продолжение: https://t.me/deksden_notes/713)
Telegram
DEKSDEN notes
⚪️ Суб-агенты: зачем (ч2)
... (начало тут: https://t.me/deksden_notes/712)
▶️ Параллельные кодинговые задачи. Если поручить модели прописать некоторые задачи параллельно, то она справится. Ваш план будет разбит на задачи, они выстроены в граф, который…
... (начало тут: https://t.me/deksden_notes/712)
▶️ Параллельные кодинговые задачи. Если поручить модели прописать некоторые задачи параллельно, то она справится. Ваш план будет разбит на задачи, они выстроены в граф, который…
👍11❤3🔥2❤🔥1🕊1
⚪️ Суб-агенты: зачем (ч2)
... (начало тут: https://t.me/deksden_notes/712)
▶️ Параллельные кодинговые задачи. Если поручить модели прописать некоторые задачи параллельно, то она справится. Ваш план будет разбит на задачи, они выстроены в граф, который можно будет частично запустить параллельно. Конечно, промптинг должен быть на работу через файлы.
Если у меня субагенты меняют код или доку, я обязательно запускаю субагента на верификацию этих изменений против оригинального плана. Потом дорабатываем выявленные недостатки.
Это не заменяет того, что большие задачи параллельно делать можно только через разбивку на рабочие деревья и работу в изолированной ветке с последующим PR.
▶️ (что сложно сделать в один поток без субагентов) Если вы хотите интерактивно в сессии с codex.app/cli сделать длинную и объемную задачу, то с 5.4 и 5.5 это довольно просто сделать субагентами. Когда задача разложена на субагентов, а модель верхнего уровня занимается только оркестрацией: отслеживанием протокола выполнения вашего плана, то у меня удавалось за один шот делать протоколы полностью длинной в несколько часов: где было предусмотрено и внесение изменений в кучу модулей кода и документации, запуск тестов, запуск приемочных сценариев, деплой на бэта стейджи, контроль CI на хостингах (гитхаб и vercel как минимум), смоук проверки на деплое. В общем, даже такой кучерявый план работы вполне ваншотится.
Линейно в рамках одного контекста это сделать было бы сложно: модель теряет агентную выносливость, когда перегружается тулюзами/деталями кодинга, и прочих операций нижнего уровня.
В модели же "оркестратор" - "субагенты" такая связка бегает на очень и очень длинные дистанции!
👉 Надеюсь, я подсветил некоторые полезные паттерны использвоания субагентов. Да, это же самое работает для СС с пометкой что клод немного менее ответственный для следования инструкциям и работает немного по своей логике.
❓ Какими вы пользуетесь паттернами для субагентов? Чего то забыл? подсказывайте - зашарим как апдейт к посту в канал
@deksden_notes
... (начало тут: https://t.me/deksden_notes/712)
▶️ Параллельные кодинговые задачи. Если поручить модели прописать некоторые задачи параллельно, то она справится. Ваш план будет разбит на задачи, они выстроены в граф, который можно будет частично запустить параллельно. Конечно, промптинг должен быть на работу через файлы.
Если у меня субагенты меняют код или доку, я обязательно запускаю субагента на верификацию этих изменений против оригинального плана. Потом дорабатываем выявленные недостатки.
Это не заменяет того, что большие задачи параллельно делать можно только через разбивку на рабочие деревья и работу в изолированной ветке с последующим PR.
▶️ (что сложно сделать в один поток без субагентов) Если вы хотите интерактивно в сессии с codex.app/cli сделать длинную и объемную задачу, то с 5.4 и 5.5 это довольно просто сделать субагентами. Когда задача разложена на субагентов, а модель верхнего уровня занимается только оркестрацией: отслеживанием протокола выполнения вашего плана, то у меня удавалось за один шот делать протоколы полностью длинной в несколько часов: где было предусмотрено и внесение изменений в кучу модулей кода и документации, запуск тестов, запуск приемочных сценариев, деплой на бэта стейджи, контроль CI на хостингах (гитхаб и vercel как минимум), смоук проверки на деплое. В общем, даже такой кучерявый план работы вполне ваншотится.
Линейно в рамках одного контекста это сделать было бы сложно: модель теряет агентную выносливость, когда перегружается тулюзами/деталями кодинга, и прочих операций нижнего уровня.
В модели же "оркестратор" - "субагенты" такая связка бегает на очень и очень длинные дистанции!
👉 Надеюсь, я подсветил некоторые полезные паттерны использвоания субагентов. Да, это же самое работает для СС с пометкой что клод немного менее ответственный для следования инструкциям и работает немного по своей логике.
❓ Какими вы пользуетесь паттернами для субагентов? Чего то забыл? подсказывайте - зашарим как апдейт к посту в канал
@deksden_notes
Telegram
DEKSDEN notes
⚪️ Суб-агенты: зачем
❓ В чатике нашего канала (welcome, если что, ссылка в описании канала) встал закономерный вопрос: а как можно использовать субагентов, чем они важны или полезны?
▶️ Сразу скажу что работать можно вполне и без субагентов, нет такой…
❓ В чатике нашего канала (welcome, если что, ссылка в описании канала) встал закономерный вопрос: а как можно использовать субагентов, чем они важны или полезны?
▶️ Сразу скажу что работать можно вполне и без субагентов, нет такой…
👍20❤🔥3🕊2❤1🔥1
⚪️ Клод и сторонние упряжки
Шикарный баг раскопал мужик!
🔗 Полная история тут: https://x.com/om_patel5/status/2048204411986469232?s=46
Короче, ничего не предвещало, никаких сторонних упряжек, и тут он очень удивился когда увидел сожженные $200 на своем extra usage. Стал разбираться. История, похоже, такая: у него в гит репо есть файлик HERMES.md (именно так, капсом и с мелкими буквами в расширении, и именно с расширением). Hermes ok, HERMES без расширения ок.
Короче, СС в системный промпт добавляет гит статус и список правок репо. В итоге сервера антропика видят HERMES.md и помечают сессию как "сторонняя упряжка" (видимо, детектят hermes agent).
Боты поддержки денег не вернули. Но нытье в твиттере творит чудеса - разрабы баг признали, и обещают рефанд пострадавшим, и еще один месяц экстра-кредитов в размере подписки ($200 в его случае).
👉 В общем, случай возможно кончился хорошо, но вы имейте ввиду - если вас удивит текущий биллинг. Думаю, это не единственный паттерн детекции сторонних упряжек, и не единственный баг в ней.
(ц) будни мира с вайбкоденным софтом
@deksden_notes
Шикарный баг раскопал мужик!
🔗 Полная история тут: https://x.com/om_patel5/status/2048204411986469232?s=46
Короче, ничего не предвещало, никаких сторонних упряжек, и тут он очень удивился когда увидел сожженные $200 на своем extra usage. Стал разбираться. История, похоже, такая: у него в гит репо есть файлик HERMES.md (именно так, капсом и с мелкими буквами в расширении, и именно с расширением). Hermes ok, HERMES без расширения ок.
Короче, СС в системный промпт добавляет гит статус и список правок репо. В итоге сервера антропика видят HERMES.md и помечают сессию как "сторонняя упряжка" (видимо, детектят hermes agent).
Боты поддержки денег не вернули. Но нытье в твиттере творит чудеса - разрабы баг признали, и обещают рефанд пострадавшим, и еще один месяц экстра-кредитов в размере подписки ($200 в его случае).
👉 В общем, случай возможно кончился хорошо, но вы имейте ввиду - если вас удивит текущий биллинг. Думаю, это не единственный паттерн детекции сторонних упряжек, и не единственный баг в ней.
(ц) будни мира с вайбкоденным софтом
@deksden_notes
X (formerly Twitter)
Om Patel (@om_patel5) on X
THIS GUY LOST $200 IN ONE DAY BECAUSE THE STRING "HERMES.md" WAS IN HIS GIT COMMITS
HERMES.md is a real convention used in AI agent projects. it's a system prompt specification file. not some obscure edge case
he's on claude max 20x at $200 a month. yesterday…
HERMES.md is a real convention used in AI agent projects. it's a system prompt specification file. not some obscure edge case
he's on claude max 20x at $200 a month. yesterday…
🔥10🤡6❤3😁3
⚪️ Никогда такого не было - и вот опять!
Не могу не написать про этот шикарный случай. Помимо того что он поучителен сам по себе, особенно дсотавляет тон - "все виноваты кроме меня" (мем в тему - в комменте будет)
🔗 Вот сабж: https://x.com/lifeof_jer/status/2048103471019434248
История банальна. Клод (4.6!) в Курсоре (!) удалил том на котором был и staging, и production базы, И БЭКАПЫ в railway (!). Типа, там так принято. Рестор тома за 30 часов не случился.
В статье подробно расписано почему виноват:
* клод (но он извинился и покаялся)
* курсор
* railway
В результате слегка раком всал СааС чувака с платформой для аренды (машинки) - чего то восстанавливали по email подтверждениям, логам stripe, записям в календарях и прочее.. Весело, в общем людям было
▶️ Почитайте! Чтение весьма доставляет
👉 Я вот специально писать не буду чего думаю - отчего и почему. Прочитайте и сами скажите ваше мнение! Пишите в комменты чего думаете по описываемой ситуации.
👉 А я потом обзор мнения сообщества сделаю, ну и свое мнение присовокуплю)) Кмк, так мы хоть какую то пользу извлечем из очередного забега по граблям. Так сказать, разбор полетов / срез мнений.
@deksden_notes
Не могу не написать про этот шикарный случай. Помимо того что он поучителен сам по себе, особенно дсотавляет тон - "все виноваты кроме меня" (мем в тему - в комменте будет)
🔗 Вот сабж: https://x.com/lifeof_jer/status/2048103471019434248
История банальна. Клод (4.6!) в Курсоре (!) удалил том на котором был и staging, и production базы, И БЭКАПЫ в railway (!). Типа, там так принято. Рестор тома за 30 часов не случился.
В статье подробно расписано почему виноват:
* клод (но он извинился и покаялся)
* курсор
* railway
В результате слегка раком всал СааС чувака с платформой для аренды (машинки) - чего то восстанавливали по email подтверждениям, логам stripe, записям в календарях и прочее.. Весело, в общем людям было
▶️ Почитайте! Чтение весьма доставляет
👉 Я вот специально писать не буду чего думаю - отчего и почему. Прочитайте и сами скажите ваше мнение! Пишите в комменты чего думаете по описываемой ситуации.
👉 А я потом обзор мнения сообщества сделаю, ну и свое мнение присовокуплю)) Кмк, так мы хоть какую то пользу извлечем из очередного забега по граблям. Так сказать, разбор полетов / срез мнений.
@deksden_notes
🤣14🤗1
⚪️ Отчет Яндекса за 1 квартал
Просто скажу что у меня потребление в месяц около 50B токенов, и это я облачный оркестратор не доделал. В квартал 150-160B выходит
Странно что это превышает потребление Яндекса
Либо я что то не так понял
Либо это о чем то говорит про ситуацию с ИИ в РФ
@deksden_notes
Просто скажу что у меня потребление в месяц около 50B токенов, и это я облачный оркестратор не доделал. В квартал 150-160B выходит
Странно что это превышает потребление Яндекса
Либо я что то не так понял
Либо это о чем то говорит про ситуацию с ИИ в РФ
@deksden_notes
😁38
⚪️ Доступность моделей Claude
Две новости рядом. Гитхаб Копилот переходит на usage based модель с ростом коэффициентов на опус в 27 раз. Напомню, что Антропиков Microsoft не хостит, а перепродает.
А Антропики тихонько убирают Опус из Про подписки (как это было когда то, если кто помнит). Или это очередной A/B тест со стороны антропиков и все уберут и поправят?
В общем, как то не особо открыто и клиентооринтирвоано выглядит у Клода все.
На этом фоне очередной ресет лимитов Кодекса выглядит попыткой позабивать гвоздиков в некие крышки. Причина - ну просто хорошая неделя))
ИИ зима близко?) Или все таки надо было ориентироваться на оптимистичный сценарий при планировании мощностей, а не на консервативный? (не даром же все эти гигаватные сделки антропиков с амазоном и гуглом по получению мощностей)
——
Upd 1️⃣ : Антропики отписались что это старая статья до выхода опуса 4.5, и неактуально.
@deksden_notes
Две новости рядом. Гитхаб Копилот переходит на usage based модель с ростом коэффициентов на опус в 27 раз. Напомню, что Антропиков Microsoft не хостит, а перепродает.
А Антропики тихонько убирают Опус из Про подписки (как это было когда то, если кто помнит). Или это очередной A/B тест со стороны антропиков и все уберут и поправят?
В общем, как то не особо открыто и клиентооринтирвоано выглядит у Клода все.
На этом фоне очередной ресет лимитов Кодекса выглядит попыткой позабивать гвоздиков в некие крышки. Причина - ну просто хорошая неделя))
ИИ зима близко?) Или все таки надо было ориентироваться на оптимистичный сценарий при планировании мощностей, а не на консервативный? (не даром же все эти гигаватные сделки антропиков с амазоном и гуглом по получению мощностей)
——
Upd 1️⃣ : Антропики отписались что это старая статья до выхода опуса 4.5, и неактуально.
@deksden_notes
👍7😁3
⚪️ Codex Limit Reset
В чате мы уже обсудили, но и канал порадую - ресет лимитов Кодекса.
Причина забавная, да) Великий повод
Клозеды, конечно, во все лопатки переманивают к себе. Лишь бы мощностей хватило! Не хочется как у антропиков сейчас - эти закручивания гаек, вот это всё..
(ц) ... пляшем дельше!
@deksden_notes
В чате мы уже обсудили, но и канал порадую - ресет лимитов Кодекса.
Причина забавная, да) Великий повод
Клозеды, конечно, во все лопатки переманивают к себе. Лишь бы мощностей хватило! Не хочется как у антропиков сейчас - эти закручивания гаек, вот это всё..
(ц) ... пляшем дельше!
@deksden_notes
❤13👍9😁5
⚪️ Tencent Cloud - сервачок на год за $10
Если вам нужен, ну - мало ли под какие цели серверок в облаке, то сейчас даю первый сервер за $10 в год. Не сильно жирный, но цена!
Для агента, квн, мало ли ...
Обратите внимание, трафика всего 0.5T в месяц, но $10 в год - все равно интересная сделка, как мне показалось
Ссылочка (там кстати разные акции есть):
🔗 https://www.tencentcloud.com/act/pro/lighthouse
——
Upd 1️⃣: да, облако китайское, но деплоить можно в ДЦ по миру - 9 регионов, карта в комментах.
@deksden_notes
Если вам нужен, ну - мало ли под какие цели серверок в облаке, то сейчас даю первый сервер за $10 в год. Не сильно жирный, но цена!
Для агента, квн, мало ли ...
Обратите внимание, трафика всего 0.5T в месяц, но $10 в год - все равно интересная сделка, как мне показалось
Ссылочка (там кстати разные акции есть):
🔗 https://www.tencentcloud.com/act/pro/lighthouse
——
Upd 1️⃣: да, облако китайское, но деплоить можно в ДЦ по миру - 9 регионов, карта в комментах.
@deksden_notes
🔥15❤8👍4🙏1
⚪️ Warp отдали в Open Source (!!!)
Omfg. Неожиданно. Это тот самый терминал, который стал агентной средой!
🔗 Репо: https://github.com/warpdotdev/warp
🔗 Roadmap: https://github.com/warpdotdev/warp/issues/9233
🔗 Анонс в X: https://x.com/warpdotdev/status/2049153766977421444
🔗 Оффсайт: https://www.warp.dev/
Сильный ход)) Посмотрим чего из этого выйдет.
@deksden_notes
Omfg. Неожиданно. Это тот самый терминал, который стал агентной средой!
🔗 Репо: https://github.com/warpdotdev/warp
🔗 Roadmap: https://github.com/warpdotdev/warp/issues/9233
🔗 Анонс в X: https://x.com/warpdotdev/status/2049153766977421444
🔗 Оффсайт: https://www.warp.dev/
Сильный ход)) Посмотрим чего из этого выйдет.
@deksden_notes
🔥23👍3🕊2
⚪️ ShipOS
Новость собственно такая:
🔗 Новость: https://t.me/UAVDEV/11189
Да, ВПК, оборонка, милитари, все дела, - но я тут про другое.
Тут я хотел подсветить такой аспект - цель внедрения была не "заменить людей" даже, а исправить недостатки людей так, чтобы это работало НАМНОГО лучше и быстрее. Текущая система планирования "на людях" справлялась за 160 часов. Агенты делают за 10 минут.
Забавно что цель верхнего уровня - ДОГНАТЬ Китай, и ИИ как инструмент.
А вы говорите - "не скоро заменят"! Я думаю технология УЖЕ готова к огромному количеству применений, дело во внедрении и осознании. УЖЕ можно делать очень многие процессы.
А ведь ИИ развивается...
В общем, надо бы уже смотреть на ситуацию с разных углов. Фактическая жизнь уже поменялась, просто не все и не полностью это поняли.
Можно ждать, когда новая реальность "протает" в нашу жизнь, а можно вливаться в ее формирование
(ц) философское - в интересное время живем!
@deksden_notes
Новость собственно такая:
🔗 Новость: https://t.me/UAVDEV/11189
Да, ВПК, оборонка, милитари, все дела, - но я тут про другое.
Тут я хотел подсветить такой аспект - цель внедрения была не "заменить людей" даже, а исправить недостатки людей так, чтобы это работало НАМНОГО лучше и быстрее. Текущая система планирования "на людях" справлялась за 160 часов. Агенты делают за 10 минут.
Забавно что цель верхнего уровня - ДОГНАТЬ Китай, и ИИ как инструмент.
А вы говорите - "не скоро заменят"! Я думаю технология УЖЕ готова к огромному количеству применений, дело во внедрении и осознании. УЖЕ можно делать очень многие процессы.
А ведь ИИ развивается...
В общем, надо бы уже смотреть на ситуацию с разных углов. Фактическая жизнь уже поменялась, просто не все и не полностью это поняли.
Можно ждать, когда новая реальность "протает" в нашу жизнь, а можно вливаться в ее формирование
(ц) философское - в интересное время живем!
@deksden_notes
👍11
⚪️ Codex++
Твикер для Codex app: местами может быть полезен
🔗 Репо: https://github.com/b-nnett/codex-plusplus
Архитектура слегка хитрая - он грузит лоадер, который грузит каталог твиков.
Там щас баг при установке, поэтому вкратце ставить так: пускаем codex cli, даем ему промпт
он через пару минут поставит
Ну - твики в UI можно вкорячивать, и пара есть в комплекте. Для UI и для горячих клавиш
@deksden_notes
Твикер для Codex app: местами может быть полезен
🔗 Репо: https://github.com/b-nnett/codex-plusplus
Архитектура слегка хитрая - он грузит лоадер, который грузит каталог твиков.
Там щас баг при установке, поэтому вкратце ставить так: пускаем codex cli, даем ему промпт
поставь curl -fsSL https://raw.githubusercontent.com/b-nnett/codex-plusplus/main/install.sh | bash
он через пару минут поставит
Ну - твики в UI можно вкорячивать, и пара есть в комплекте. Для UI и для горячих клавиш
@deksden_notes
👍6
⚪️ Комплимент Codex
Я не приверженец брендов, компаний или продуктов. Видимо, низкая лояльность. Я приверженец функций, действий и поступков. Как говорится, критерий истины - практика.
В этом разрезе не могу не отметить одну штуку, которую подсветил чел в твиттере, и про которую я знал, - но еще раз хотел бы похвалить.
Когда агент кодекса работает, и встречает лимит - он доделывает свой текущих ход (жаль что субагенты в лимит упираются, но это же новые сессии технически). Но текущая основная сессия агента тянется до завершения его текущей задачи. И вот уже после завершенного хода он покажет плашку исчерпания лимита. (Компакт серверный от тоже не может сделать при лимите, к слову).
Но текущее задание во многих случаях доделывается.
Это крутой режим в дизайне, и сильно снижает раздражение при упирании в лимит. Tibo подтвердил что это осознанный подход в дизайне фичи, а не какое то техническое ограничение. Они могли сделать так, чтобы экономить токены, но сделали так, чтобы экономить нервы пользователям. Побольше бы таких решений в продуктах! Респект Кодексовцам за такие мелкие детали.
@deksden_notes
Я не приверженец брендов, компаний или продуктов. Видимо, низкая лояльность. Я приверженец функций, действий и поступков. Как говорится, критерий истины - практика.
В этом разрезе не могу не отметить одну штуку, которую подсветил чел в твиттере, и про которую я знал, - но еще раз хотел бы похвалить.
Когда агент кодекса работает, и встречает лимит - он доделывает свой текущих ход (жаль что субагенты в лимит упираются, но это же новые сессии технически). Но текущая основная сессия агента тянется до завершения его текущей задачи. И вот уже после завершенного хода он покажет плашку исчерпания лимита. (Компакт серверный от тоже не может сделать при лимите, к слову).
Но текущее задание во многих случаях доделывается.
Это крутой режим в дизайне, и сильно снижает раздражение при упирании в лимит. Tibo подтвердил что это осознанный подход в дизайне фичи, а не какое то техническое ограничение. Они могли сделать так, чтобы экономить токены, но сделали так, чтобы экономить нервы пользователям. Побольше бы таких решений в продуктах! Респект Кодексовцам за такие мелкие детали.
@deksden_notes
🔥59💯20❤11👌1
⚪️ Cursor SDK
Я пишу об этом только чтобы сказать: ура! Теперь вы сможете стереть свой прод из своего скрипта!))
@deksden_notes
Я пишу об этом только чтобы сказать: ура! Теперь вы сможете стереть свой прод из своего скрипта!))
@deksden_notes
😁17🤣10