DEKSDEN notes
967 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
Эволюция MCP


Не прошло и года, как "фраер сдал назад". Не совсем, конечно, но осознание - что чего то надо делать, видимо, настигло и антропиков.

О чем речь? Про этот блогопост:

https://www.anthropic.com/engineering/code-execution-with-mcp

Суть в том, что антропики признают:
- MCP сервера мощно нагружают контекст (тратя, между прочим, не только окно, но и внимание моделей - они с ума сходят, глядя на сотни тулов);
- тулюзы грузят контекст

Выход? несколько:

1) делаем searchTool тул - для поиска нужных тулов в MCP серверах. Получаем динамическое discovery "по требованию".


2) с вызовами MCP и перегрузкой контекста - сложнее. Предлагается делать "обертку" в виде кода вокруг вызова тулов. Заменяем тулюз на вызов некоего скрипта, который выполняет код.

Я так понял, что некий клиент, имея подключённые MCP сервера, конвертит их в некую файловую систему, туда прописывает каждый сервер с его тулами как скрипты по папочкам (одна папка - один сервер), и даёт агенту возможность писать код, используя эти модули!

🟢 Плюшки:
- агент ищет тулы по мере необходимости, не нагружая контекст описаниями тулов изначально;
- скрипт может обработать результат вызова тула, и не "сливать" весь дамп результатов, а выбрать ползное;
- можно цепочку вызовов превратить в простую функцию с несколькими вызовами тулов - сильно быстрее работает, и надёжно;
- за счёт обработки данных в коде можно токенизировать чувствительные данные - повышаем ениного безопасность;
- можно стейт обработки заполучить за счёт сохранения его из кода;

Всего-то надо завести code execution sandbox для агента! Впрочем, они их и так уже имеют.

Что напоминает? Верно - давайте превратим MCP в SKILL! Фактически, какой то MCP->SKILL конвертер советуют ))


😀 До моих индексных файлов с аннотированными ссылками они ещё не дошли, конечно, но мы не будем отчаиваться - глядишь, дозреют и тут.


Стоило, конечно, паковать SDK в MCP, чтобы потом делать такие клиенты, которые распакуют MCP и оформят как SDK. Какая то пост-ирония.


‼️ Upd: в упоминаемом муравьями посте кодофлёра расписано тоже вполне ясно все, стоит и его прочитать:

🔗 https://blog.cloudflare.com/code-mode/


Такое мы обдумываем, конечно!

#post
@deksden_notes
🔥5😁3👍2
Gemini 3 WEN?


Удачным завершением активности Гугла был бы релиз Гемини3 превью.

Шорох по Интернетам определенный идет.

Как тестим?
Прокидываем промпт в AI Studio через URL:


Гугл не останавливается

https://x.com/_philschmid/status/1985752510444015650

Мелкое удобство реализовали.


Правильный пример:

ai(.)studio/prompts/new_chat?prompt=Gemini3 WEN
🔥2
Юмор безопасности


Сабж:

https://x.com/theahmadosman/status/1986013094834016361?s=46

😂 Интересна статистика сервиса. Сколько людей проверили свои ключи?

Надо конечно еще хосты собирать, чтобы уже не нагибаться.
😁5
Codex и лимиты


▶️ Пользовать агента по апи ценам нынче дорого. подписки - это выгодно, очень.

Но подписки - это лимиты, в которые постоянно упираешься, и надо чего то мудрить.

▶️ С клозедами нынче такая ситуация: подписка на 200 предлагает почти безлимит. Надо очень стараться, чтобы высадить лимиты на такой подписке (в твиттере есть люди, у которых получается, но они запускают 6-8 агентов в параллель). Можно не выдумывать, и взять её - работать можно условно без перерывов.

Лимитов у нас 2 типа:
- сессия по 5 часов
- недельный лимит


▶️ Но 200 баксов - это заметно, поэтому для вариантов "подешевле" у клозедов есть только:
- Плюс за 20
- Тим за 30. Team аккаунты идёт от 2х штук, поэтому бюджет от 60/mo

На Team дополнительно: лимиты немного поболее, и есть возможность сделать пару запростов в gpt 5 pro, что приятно. такой "триал" pro аккаунта!

Какой там лимит? при 1 потоке непрерывно и ещё одном в режиме диалога у меня Плюс аккаунт лимит "5 часов" "сжигается" часа за 2 работы. То есть для непрерывной работы надо ТРИ аккаунта Plus минимум.

Team акакаунт "держится" немного дольше, но все равно 2 аккаунта team не всегда "вывозят" лимитами сессию в 5 часов.

▶️ С недельными лимитами сложнее: мне весь эксперимент "портят" клозеды, которые второй раз восстанавливают лимиты кодекса (там у них то кредиты раздают, то кодекс падает).

поэтому мне пока не понятно - сколько аккаунтов мне надо для бесперебофйной работы.

▶️ Акция: клозеды приглашают получить МЕСЯЦ бесплатно на Plus / Team аккаунте при первоначальной регистрации.

Я регистрируюсь на почтовые алиасы своей почты (есть у меня такая фича в почтовом сервере - это когда адрес ящика другой, а физически используется основной ящик). Телефонов при регистрации аккаунта с меня не спрашивали.

▶️ Самый цирк - это менеджмент аккаунтов. Я завёл профили гугла в хроме для каждого аккаунта. В каждом профиле я вошёл в chatgpt под нужным аккаунтом. В итоге он и аккаунт сохранил в менеджер паролей профиля, и путаницы чуть меньше - страничку с оставшимися лимитами аккаунта можно посмотреть без проблем.

▶️ Когда кодекс в чате пишет что вы "стукнулись об лимит" - переключаемся на хром, переключаемся на нужный профиль, возвращаемся в кодекс.

Выходим. кодекс напишет команду для восстановления именно этой сессии с её id. не трём её! пригодится.

В консоли делаем "codex login". Открывается хром в том профиле, который вы юзали последним - а это нужный вам профиль. Входим в профиль.

после логина возвращаемся в консоль, копируем команду кодекса для восстановления сессии.

Кодекс грузит сессию, но глючно её отображает немного - не боимся, все норм. Пишем "/approvals" чтобы выбрать нужный режим одобрения (у меня всегда full access) и "продолжить"

Процесс продолжается бесшовно с места прерывания.


▶️ Итого:
- щас юзаю 2 team аккаунта + 3 plus аккаунта. Лимитов пока хватает, но надо делать скидку на сбросы лимитов.

Посмотрим чем дело кончится! 120 баксов все равно не 200. вроде возни не так много - привыкнуть можно.

Такой вот практический опыт!

#post
@deksden_notes
🔥7🥰42👍1
Codex и лимиты - кредиты


Спросите - почему не пользую кредиты? Во первых, их на Плюсы завезли вот только что.

Во вторых, подписка вроде бы выгоднее кредитов!

Тут надо будет эксперимент провести - как быстро "сгорает" кредит. Но по моему разумению, подписка - самый выгодный "пакет" токенов. Кредиты - выгоднее апи, но менее выгодно чем подписка.

Непроверенные данные, из обсуждений предварительно: один поток агента выжигает 50 кредитов за 2 часа. То есть 10 часов - это 250 кредитов!

1000 кредитов за 40 долларов - выходит что хватает на 40 часов работы.

Если 2 подписки за 20 баксов работают по 1.5 часа раз в 5 часов, то за 10 часов рабочего дня они сработают по 3 часа каждая.

В недельный лимит это ударяется дня за 3-4! То есть часов по 10 в неделю минимум каждая отработает - это 40 часов в месяц. За 20 баксов.

40 часов за 40 баксов за кредиты, и 40 часов за 20 баксов по подписке. Пока так вижу!

но кредиты - это без переключения аккаунтов, перелогинов и отслеживания времени ресета лимита! дороже, но без шаманства.

вот и думайте))
🔥6👍1
Conductor


Вопрос: Кто то юзает сабж?


🔗 https://conductor.build/

Create parallel Codex + Claude Code agents in isolated workspaces. See at a glance what they’re working on, then review and merge their changes.


Какие отзывы?
Ну ... что тут у нас?


погнали

Upd: похоже, лавочку прикрыли - 404

Ну- ладно ))
🔥12
Модель Gpt-5-codex обновилась


🆕 Клозеды анансировали небольшое обновление своей кодинговой модели:

- стала более коллоборативная (что бы это ни значило);
- тратит чуть меньше токенов
- чуть лучше работает на некоторых бенчмарках (но на каких именно - не сказали)

Amazing! Enjoy

🔗 https://x.com/thsottiaux/status/1986602121572327650?s=46


Такое мы, конечно, пользуем! Ну а куда деваться)

‼️ Upd: важные детали доработок:
- Less `git reset`ing
- More reliably edits with apply_patch

Аккуратность с ресетами гита - эт оважно. так можно немного незакоммиченной работы потерять. Редактирование более надёжное - тоже хорошо, бывали сложности некоторые, переход на питоны - вот это всё! Если подкрутили - это в кассу


#post
@deksden_notes
😁4🔥2💔1
Minimax M2 Coding Plan …


… будет скоро!

Анонс в твиттере имеем:

🔗 https://x.com/skylermiao7/status/1986625358041620954?s=46

😂 Золотым стандартом отрасли становится считать во сколько раз это дешевле антропиков!) намекнули на бюджеты меньше $20

Пока не выпустили -> бесплатный триал M2 продолжается.

Крутой ход.

Такое мы ценим!

#post
@deksden_notes
1🔥5👍1
Codex : фоллбэки на -mini


новинка в 0.56 видимо!

Немного напоминает гугл с флешем, хотя возможностей mini внимательно не тестил. Надеюсь, она получше код пишет, по плану к написанному коду у меня вопросов вроде бы не было, но я мало пока пользовал.

▶️ Upd: кстати, в кодексе тоже не стоит отказываться от верификации планов. У меня регулярно на планах в 5-8 шагов с 3-4 пунктами в каждом шаге оказывается 2-3 пункта недоделаны.

Внимательность модели высокая, но не абсолютная.

Ну ничего - АГИ придет, порядок наведёт!

Ну или нужно делать работу по протоколу. Когда делаю по "полному" воркфлоу с планом, гейтами, ворктрее, мержами - там таких вопросов не бывает. Но сильно дольше выходит.

Щас надо посмотреть насколько шустрее работает -mini и насколько она нормально пишет код. Тут эксперимент требуется! Продумываю

▶️ Upd-2: повесил картинку, чтобы было понятно масштаб проблем. Это верификация по плану, который колбасил gpt-5-codex (medium). Жёлтенький значок - недоделки по этому пункту.
3👍2
О терминах


Пару раз за последнее время заходила речь об используемых терминах / жаргонных наименованиях. Вопрос не самый первостепенный, но словарик постепенно сформируем. Это не исчерпывающий словарик AI терминов, но это про те термины, в которых были какие-то разнотолки. Изложу своё понимание, не претендуя на истину.

Начнём-с!

▶️ Вендор - это "производитель" модели, та организация которая натренировала модель. Например, OpenAI, Google, Anthropic, Moonshot и так далее. Синонимы: "лаба".

▶️ Провайдер - это тот, кто "предоставляет" услугу инференса модели, обеспечивая обработку запросов пользователя в ответы модели. Вендоры, как правило, являются провайдерами своих моделей - но они могут быть не единственными. Open Source модели ведущих китайских лаб инферят много других компаний.

▶️ Агент - многогранный термин, значит очнь разное, а именно:

- компьютерная программа, предоставляющая "инструменты" (tools, через function calling, может быть упаковано в MCP server), поддерживающим такую функцию моделям; в итоге система обретает возможность условно автономных действий "по своему разумению" для достижения поставленных целей;

я такую программу чтобы не путаться называю Agentic Engine (движок), она сейчас часто бывает в виде CLI приложения (самая известная - Claude Code/CC, есть ещё куча, типа Gemini CLI, Qoder CLI, Codex CLI, ...). Но агенты бывают встроены в приложения - самый известный такой софт это Cursor, ну и системы типа Manus;

синонимы: консольный агент, CLI-агент;

- специальный промпт для агентного движка, который даёт специфические инструкции модели, и работает в своём контексе; также известен как Sub-Agents у Антропиков в Claude Code, но при этом управляется командой "/agents", живёт в папке "agents/"; будем считать Sub-Agent синонимом для этого значения "agents";

- Computer-Use Agents / Browser Agents / AI Browsers - это категория агентных приложений, в которых к модели подключён браузер/комптютер, и модель научена понимать скриншоты; кроме тогда дали инструменты, которыми можно рулить браузером (или в общем случае - компьюером целиком);

- Generic Agent: это агент общего профиля, без специфической ориентации как Browser Agent - пример Manus.

- Фоновый / Удалённый / Облачный агент - агентная система, работающая с кодом, расположенная "в облаке" удалённо (в противовес локально работающим CLI-агентам); примеры - Codex Cloud, Google Jules, Claude Code Web;

- Ну и тьма других агентных решений/систем - Gpt-5 Pro, DeepSearch, Grok Heavy, Google Deep Think, куча PPT агентов (создавать презентации) ...

▶️ Агентный воркфлоу - некий алгоритм, который выполняет агентная система


▶️ Жаргонные, местами шуточные термины:

- СС - Claude Code
- Клозеды - компания OpenAI (от closedAI, троллинг за отход от открытости в разработке AGI/ASI);
- Жульес: Google Jules;
- Муравьи (Ants) - сотрудники Anthropic;
- Зайка - Z.ai, вендор модели GLM; или сама модель GLM;
- Клод - продукт Антропика - Claude, общее название их семейства моделей;

👉 Upd 1️⃣:
- Раг - RAG: техника построения AI систем, предусматривающая наполнение контекста модели дополнительной информацией для генерации ответа на запрос пользователя;
- Барыги - компании, перепродающие токены и не оказывающие собственных услуг инференса/не производящие модели;

👉 Upd 2️⃣ (декабрь 2025): появилось пара новых словечек

- Руление (steering) : инструкции, добавляемые по месту для "подруливания" модели в ходе работы; например, инстуркции доабвляются к целевому файлу при работе с ним и объясняющие модели особенности работы именно с этим файлом; инструкции по генерации какого-либо контента (добавляются к контенту);

- Оправа / Упряжка (harness) : програмное обеспечение для ИИ модели, которое реализует агентные функции; пример - как ClaudeCode, так и OpenCode могут быть оправой для моделей семейства Claude. (ц) @almazom

🆕 - Наездник (жарг, негативное) - такой вайбкодер, пользователь ИИ, не имеющий глубокий профессиональных знаний и эксплуататорски использующий ИИ с получением слабопрофессионального результата;

...продолжение тут: https://t.me/deksden_notes/269
👍9🔥75
Gemini Cli :: субагенты


Тихонько и незаметно в Gemini CLI появились субагенты. PR замержен и уже в 0.12 релизе.

Конечно, первым делом там появился Codebase investigator subagent


Замечу - что это компания с моделями с самым большим контекстом на рынке! А ведь я давно говорил - что дело не в контексте)) Фокусная задача, выбор модели для субагента, параллельный запуск - это все важные дополнительные факторы!


Документация как обычно: в PR github

https://github.com/google-gemini/gemini-cli/pull/9988

https://github.com/google-gemini/gemini-cli/pull/10282


Большое дело! Осталось в этом все таки признаться. Так, глядишь, и до планмода дело дойдёт


#post
@deksden_notes
3🔥641
Подписочки от Minimax


Мне нравится тенденция на рынке - подписочки вместо Api usage, которое для агентов весьма накладно, даже если это китайские цены.

MiniMax разродился подписками: золотой стандарт отрасли - сравнить с ценами Антропиков)) Тут в разы больше использования, в разы дешевле.

https://x.com/MiniMax__AI/status/1986815058249408541

Дополнительно вводят цены на API ($0.3, $0.03 / $1.2)

Интересно, что дополнительно и отдельно введён план для Агента - $0 / $19 / $69.

В общем, знакомимься.

#post
@deksden_notes
👍3
Нотификации к Кодексу


Кто привык к развитому тулингу СС немного страдает на кодексе. У СС давно были хуки через которые можно было сделать нотификацию со звуком, когда СС ждёт реакции от пользователя.

Теперь похожую штуку можно сделать для Кодекса вместе с некоторым другим тюнингом!

🔗 https://github.com/regenrek/codex-1up


Такое мы смотрим

⭐️250 звёзд )) Не ураган популярности.


#post
@deksden_notes
🔥4
Утилита :: свитчер моделей в СС/Codex


Раз уж у нас пошёл поток моделей от китайский вендоров, некоторые из которых прям интересные и/или очень бюджетные, такой проект просто обязан был появиться. Собственно, сабж:

🔗 https://github.com/farion1231/cc-switch


Такое мы пользуем

Upd: там половина моделей/провайдеров про которые я даже не слышал

#post
@deksden_notes
🔥72
Кодекс и запуск тулов


Кодекс - сильная модель, но недостатки тулинга в codex cli - очевидны.

вот такую картину (git commit) наблюдаю регулярно!

В промпте написано - не запускать интерактивные команды, но оно запускает. Надо дорабатывать промптинг.

Вот в СС такого не бывает - там bash tool имеет встроенный таймаут по-умолчанию в 2 минуты. А кодекс в таком состоянии будет висеть часами.

В общем, направление для инструментов пока очевидно - добейтесь feature parity с лидером.

А пока пользуем чего дают

#post
@deksden_notes
Используем СС со сторонними моделями


Напомню, что в Claude Code легко подключить почти любую модель, и пользоваться всем её возможностями - планмоды, баш/джоб менеджер, кастомные субагенты, и прочее


Принципиально - две возможности: если у провайдера anthropic-совместимый эндпоинт есть (как у z.ai, deepseek, minimax, kimi), можно прописать его напрямую в переменных окружения, вместе с названиями моделей.

пример: https://docs.z.ai/devpack/tool/claude

Либо используем проект claude-code router, прокси, конвертирующий любой open-ai совместимый эндпоинт в anthropic совместимый.

https://github.com/musistudio/claude-code-router


А тулинг в СС - топовый!

Конечно, рекомендуется использовать по подписке, чтобы не платить по ценам api, что накладно даже с китайскими ценами. Благо кодинговые планы сейчас есть у z.ai, kimi, minimax, возможно и других вендоров.


Такое мы пользуем, конечно )

#post
@deksden_notes
👍6