DEKSDEN notes
979 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
CodeBuddy 🆕

Вы удивитесь, но у нас новый консольный агент: Tencent Code Buddy Code. Да, нейминг топовый)) code-code.

Есть и ide, впрочем - ее не смотрел, хотя несколько фич заявлено интересных: конечно -sdd, интеграция бэкэндов Supabase и CloudBase (аналог от тенцента), импорт figma дизайнов для генерации ui, поддержка библиотек компонентов (tdesign, mui, shadcn), mac/win.

▶️ Для CLI заявлены фичи:
- подержка картинок: dnd, copy/paste, links
- сессии: --resotre
- print mode -p + поддержка pipe ; json/stream-json/text;
- mcp: stdio/sse/http; но про oauth ничего не сказано; mpc.json;
- custom slash commands: похоже на СС, project/user уровень, но без $ARGUMENTS и с индивидуальными $1, $2, ...
- memory: через CODEBUDDY.md/AGENTS.md; /memory;
- субагенты: ровно как в СС - md, frontmatter, model, tools теги; /agents команда;
- yolo: --dangerously-skip-permissions;
- интеграция с ide для cli ожидается

🔗 https://www.codebuddy.ai/cli

💰 Цены:
- 2w free trial с 250 кредитами;
- $10/mo за 1000 кредитов в мес; доп 1000 кредитов - тоже $10;
- бонусные кредиты отменили, а давали ранее 100 в день; жаль!

#post
@deksden_notes
1👍42🔥1
MiniMax M2 в ClaudeCode 🆕


▶️ Это не единственная обновка из Китая: minimax m2 доступна до 7 ноября бесплатно в api! можно подключить ClaudeCode через endpoint api в стиле anthropic (хорошая китайская мода пошла! я больше одобряю чем выпуско очередного не совсем доделанного cli).


🔗 https://platform.minimax.io/docs/guides/text-ai-coding-tools

Надо тестить!
🔥

#post
@deksden_notes
👍54🔥3
Minimax в CC


👉 Интересная деталь. Модель Minimax M2 думает как Клод - interleaved thinking, то есть подумает - поделает, потом опять подумает.

Поэтому лучше всего работает внутри СС, которая изначально поддерживает такой режим работы.

👉 Конечно, надо включить thinking: заметное отличие!


#post
@deksden_notes
👍42🔥2
Gemini CLI 0.11 🆕


Продолжаем мониторить ландшафт инструментов. У гемини немаленький релиз 0.11!


🔗 https://x.com/ntaylormullen/status/1983579911202992179

- делегация задач удалённому агеноту jules (через Jules Gemini CLI extension)
- поддержка stream json для non-interactive
- режим просмотра маркдаун файлов можно переключать - между Raw и рендером
- очередь отправленных сообщений с редакированием (да, как в СС)
- улучшения web fetch


🔗https://github.com/google-gemini/gemini-cli/discussions/12229

(0.10 тут: https://github.com/google-gemini/gemini-cli/discussions/11683)

Развивается. хорошо. Будет удачным пристанищем для 3.0!

#post
@deksden_notes
5👍3
Cursor 2.0 Agent Mode


▶️ Курсор обновился - это уже все знают, но я немного о другом: это вторая ИДЕ, которая представила специальный режим для работы с агентами.

Первая на моей памяти - это была TRAE с режимом SOLO.

https://www.trae.ai/solo

Интересен тейк продуктов на агентный флоу.

👉 Оба продукта вынесли чат как одно из главных панелей в среде - это логично. Артефакты работы агентов позволяют рассмтривать оба - я про диффы в кодобазе.

👉 Браузеры есть у обоих, но браузер курсора иметь полезную фишку - тыкаем выделенный элемент и он попадает в контекст агента, и можно выделенно менять. так удобнее, конечно.

👉 Планмод у курсора тоже немного более развитый - но в базе - это все ещё простая тудушка. Рисеч перед планированием - это большой и правильный шаг в нужном направлении, надо продолжать.



🟢 Личное имхо: направление правильное, но реализовано пока самое-самое базовое. Нужно давать возможность базовые кусочки правильных методик реализовывать инстурментами, и прививать правильные практики. Интеграция spec based development в kiro - это шаги тоже правильные, quest mode у qoder.

Для себя я особого интереса и смысла для ai swe на агентах использовать IDE вместо консольных агентов пока не замечаю: код просмотреть если надо я и в чарме могу, а каждый дифф рассматривать - не практикую.

Мне кажется момент оркестрации агента в части связки исследования, плана и реализации его в ветках и мержа мог бы быть поддержан в инструментах.


Что думаете?
3🔥3👍2
Гугл запускает сайт для CLI

Сабж:

🔗 https://geminicli.com/

Помимо описания, есть:
- дока 🔥 - её много не бывает
- галерея extensions: MCP и для контекста

https://blog.google/technology/developers/gemini-cli-extensions/

Большой хороший шаг! Респект гуглам

#post
@deksden_notes
🔥6
Gemini CLI todos


Ещё одна фича успешно "заимствована" у СС: todos

https://x.com/JackWoth98/status/1985430754319364275

Даже включается / выключается тоже Ctrl+t

Респект на самом деле - не стесняйтесь, уже соприте тотально все! Это прям надо

#post
@deksden_notes
1👍3😁3
Эволюция MCP


Не прошло и года, как "фраер сдал назад". Не совсем, конечно, но осознание - что чего то надо делать, видимо, настигло и антропиков.

О чем речь? Про этот блогопост:

https://www.anthropic.com/engineering/code-execution-with-mcp

Суть в том, что антропики признают:
- MCP сервера мощно нагружают контекст (тратя, между прочим, не только окно, но и внимание моделей - они с ума сходят, глядя на сотни тулов);
- тулюзы грузят контекст

Выход? несколько:

1) делаем searchTool тул - для поиска нужных тулов в MCP серверах. Получаем динамическое discovery "по требованию".


2) с вызовами MCP и перегрузкой контекста - сложнее. Предлагается делать "обертку" в виде кода вокруг вызова тулов. Заменяем тулюз на вызов некоего скрипта, который выполняет код.

Я так понял, что некий клиент, имея подключённые MCP сервера, конвертит их в некую файловую систему, туда прописывает каждый сервер с его тулами как скрипты по папочкам (одна папка - один сервер), и даёт агенту возможность писать код, используя эти модули!

🟢 Плюшки:
- агент ищет тулы по мере необходимости, не нагружая контекст описаниями тулов изначально;
- скрипт может обработать результат вызова тула, и не "сливать" весь дамп результатов, а выбрать ползное;
- можно цепочку вызовов превратить в простую функцию с несколькими вызовами тулов - сильно быстрее работает, и надёжно;
- за счёт обработки данных в коде можно токенизировать чувствительные данные - повышаем ениного безопасность;
- можно стейт обработки заполучить за счёт сохранения его из кода;

Всего-то надо завести code execution sandbox для агента! Впрочем, они их и так уже имеют.

Что напоминает? Верно - давайте превратим MCP в SKILL! Фактически, какой то MCP->SKILL конвертер советуют ))


😀 До моих индексных файлов с аннотированными ссылками они ещё не дошли, конечно, но мы не будем отчаиваться - глядишь, дозреют и тут.


Стоило, конечно, паковать SDK в MCP, чтобы потом делать такие клиенты, которые распакуют MCP и оформят как SDK. Какая то пост-ирония.


‼️ Upd: в упоминаемом муравьями посте кодофлёра расписано тоже вполне ясно все, стоит и его прочитать:

🔗 https://blog.cloudflare.com/code-mode/


Такое мы обдумываем, конечно!

#post
@deksden_notes
🔥5😁3👍2
Gemini 3 WEN?


Удачным завершением активности Гугла был бы релиз Гемини3 превью.

Шорох по Интернетам определенный идет.

Как тестим?
Прокидываем промпт в AI Studio через URL:


Гугл не останавливается

https://x.com/_philschmid/status/1985752510444015650

Мелкое удобство реализовали.


Правильный пример:

ai(.)studio/prompts/new_chat?prompt=Gemini3 WEN
🔥2
Юмор безопасности


Сабж:

https://x.com/theahmadosman/status/1986013094834016361?s=46

😂 Интересна статистика сервиса. Сколько людей проверили свои ключи?

Надо конечно еще хосты собирать, чтобы уже не нагибаться.
😁5
Codex и лимиты


▶️ Пользовать агента по апи ценам нынче дорого. подписки - это выгодно, очень.

Но подписки - это лимиты, в которые постоянно упираешься, и надо чего то мудрить.

▶️ С клозедами нынче такая ситуация: подписка на 200 предлагает почти безлимит. Надо очень стараться, чтобы высадить лимиты на такой подписке (в твиттере есть люди, у которых получается, но они запускают 6-8 агентов в параллель). Можно не выдумывать, и взять её - работать можно условно без перерывов.

Лимитов у нас 2 типа:
- сессия по 5 часов
- недельный лимит


▶️ Но 200 баксов - это заметно, поэтому для вариантов "подешевле" у клозедов есть только:
- Плюс за 20
- Тим за 30. Team аккаунты идёт от 2х штук, поэтому бюджет от 60/mo

На Team дополнительно: лимиты немного поболее, и есть возможность сделать пару запростов в gpt 5 pro, что приятно. такой "триал" pro аккаунта!

Какой там лимит? при 1 потоке непрерывно и ещё одном в режиме диалога у меня Плюс аккаунт лимит "5 часов" "сжигается" часа за 2 работы. То есть для непрерывной работы надо ТРИ аккаунта Plus минимум.

Team акакаунт "держится" немного дольше, но все равно 2 аккаунта team не всегда "вывозят" лимитами сессию в 5 часов.

▶️ С недельными лимитами сложнее: мне весь эксперимент "портят" клозеды, которые второй раз восстанавливают лимиты кодекса (там у них то кредиты раздают, то кодекс падает).

поэтому мне пока не понятно - сколько аккаунтов мне надо для бесперебофйной работы.

▶️ Акция: клозеды приглашают получить МЕСЯЦ бесплатно на Plus / Team аккаунте при первоначальной регистрации.

Я регистрируюсь на почтовые алиасы своей почты (есть у меня такая фича в почтовом сервере - это когда адрес ящика другой, а физически используется основной ящик). Телефонов при регистрации аккаунта с меня не спрашивали.

▶️ Самый цирк - это менеджмент аккаунтов. Я завёл профили гугла в хроме для каждого аккаунта. В каждом профиле я вошёл в chatgpt под нужным аккаунтом. В итоге он и аккаунт сохранил в менеджер паролей профиля, и путаницы чуть меньше - страничку с оставшимися лимитами аккаунта можно посмотреть без проблем.

▶️ Когда кодекс в чате пишет что вы "стукнулись об лимит" - переключаемся на хром, переключаемся на нужный профиль, возвращаемся в кодекс.

Выходим. кодекс напишет команду для восстановления именно этой сессии с её id. не трём её! пригодится.

В консоли делаем "codex login". Открывается хром в том профиле, который вы юзали последним - а это нужный вам профиль. Входим в профиль.

после логина возвращаемся в консоль, копируем команду кодекса для восстановления сессии.

Кодекс грузит сессию, но глючно её отображает немного - не боимся, все норм. Пишем "/approvals" чтобы выбрать нужный режим одобрения (у меня всегда full access) и "продолжить"

Процесс продолжается бесшовно с места прерывания.


▶️ Итого:
- щас юзаю 2 team аккаунта + 3 plus аккаунта. Лимитов пока хватает, но надо делать скидку на сбросы лимитов.

Посмотрим чем дело кончится! 120 баксов все равно не 200. вроде возни не так много - привыкнуть можно.

Такой вот практический опыт!

#post
@deksden_notes
🔥7🥰42👍1
Codex и лимиты - кредиты


Спросите - почему не пользую кредиты? Во первых, их на Плюсы завезли вот только что.

Во вторых, подписка вроде бы выгоднее кредитов!

Тут надо будет эксперимент провести - как быстро "сгорает" кредит. Но по моему разумению, подписка - самый выгодный "пакет" токенов. Кредиты - выгоднее апи, но менее выгодно чем подписка.

Непроверенные данные, из обсуждений предварительно: один поток агента выжигает 50 кредитов за 2 часа. То есть 10 часов - это 250 кредитов!

1000 кредитов за 40 долларов - выходит что хватает на 40 часов работы.

Если 2 подписки за 20 баксов работают по 1.5 часа раз в 5 часов, то за 10 часов рабочего дня они сработают по 3 часа каждая.

В недельный лимит это ударяется дня за 3-4! То есть часов по 10 в неделю минимум каждая отработает - это 40 часов в месяц. За 20 баксов.

40 часов за 40 баксов за кредиты, и 40 часов за 20 баксов по подписке. Пока так вижу!

но кредиты - это без переключения аккаунтов, перелогинов и отслеживания времени ресета лимита! дороже, но без шаманства.

вот и думайте))
🔥6👍1
Conductor


Вопрос: Кто то юзает сабж?


🔗 https://conductor.build/

Create parallel Codex + Claude Code agents in isolated workspaces. See at a glance what they’re working on, then review and merge their changes.


Какие отзывы?
Ну ... что тут у нас?


погнали

Upd: похоже, лавочку прикрыли - 404

Ну- ладно ))
🔥12
Модель Gpt-5-codex обновилась


🆕 Клозеды анансировали небольшое обновление своей кодинговой модели:

- стала более коллоборативная (что бы это ни значило);
- тратит чуть меньше токенов
- чуть лучше работает на некоторых бенчмарках (но на каких именно - не сказали)

Amazing! Enjoy

🔗 https://x.com/thsottiaux/status/1986602121572327650?s=46


Такое мы, конечно, пользуем! Ну а куда деваться)

‼️ Upd: важные детали доработок:
- Less `git reset`ing
- More reliably edits with apply_patch

Аккуратность с ресетами гита - эт оважно. так можно немного незакоммиченной работы потерять. Редактирование более надёжное - тоже хорошо, бывали сложности некоторые, переход на питоны - вот это всё! Если подкрутили - это в кассу


#post
@deksden_notes
😁4🔥2💔1
Minimax M2 Coding Plan …


… будет скоро!

Анонс в твиттере имеем:

🔗 https://x.com/skylermiao7/status/1986625358041620954?s=46

😂 Золотым стандартом отрасли становится считать во сколько раз это дешевле антропиков!) намекнули на бюджеты меньше $20

Пока не выпустили -> бесплатный триал M2 продолжается.

Крутой ход.

Такое мы ценим!

#post
@deksden_notes
1🔥5👍1
Codex : фоллбэки на -mini


новинка в 0.56 видимо!

Немного напоминает гугл с флешем, хотя возможностей mini внимательно не тестил. Надеюсь, она получше код пишет, по плану к написанному коду у меня вопросов вроде бы не было, но я мало пока пользовал.

▶️ Upd: кстати, в кодексе тоже не стоит отказываться от верификации планов. У меня регулярно на планах в 5-8 шагов с 3-4 пунктами в каждом шаге оказывается 2-3 пункта недоделаны.

Внимательность модели высокая, но не абсолютная.

Ну ничего - АГИ придет, порядок наведёт!

Ну или нужно делать работу по протоколу. Когда делаю по "полному" воркфлоу с планом, гейтами, ворктрее, мержами - там таких вопросов не бывает. Но сильно дольше выходит.

Щас надо посмотреть насколько шустрее работает -mini и насколько она нормально пишет код. Тут эксперимент требуется! Продумываю

▶️ Upd-2: повесил картинку, чтобы было понятно масштаб проблем. Это верификация по плану, который колбасил gpt-5-codex (medium). Жёлтенький значок - недоделки по этому пункту.
3👍2
О терминах


Пару раз за последнее время заходила речь об используемых терминах / жаргонных наименованиях. Вопрос не самый первостепенный, но словарик постепенно сформируем. Это не исчерпывающий словарик AI терминов, но это про те термины, в которых были какие-то разнотолки. Изложу своё понимание, не претендуя на истину.

Начнём-с!

▶️ Вендор - это "производитель" модели, та организация которая натренировала модель. Например, OpenAI, Google, Anthropic, Moonshot и так далее. Синонимы: "лаба".

▶️ Провайдер - это тот, кто "предоставляет" услугу инференса модели, обеспечивая обработку запросов пользователя в ответы модели. Вендоры, как правило, являются провайдерами своих моделей - но они могут быть не единственными. Open Source модели ведущих китайских лаб инферят много других компаний.

▶️ Агент - многогранный термин, значит очнь разное, а именно:

- компьютерная программа, предоставляющая "инструменты" (tools, через function calling, может быть упаковано в MCP server), поддерживающим такую функцию моделям; в итоге система обретает возможность условно автономных действий "по своему разумению" для достижения поставленных целей;

я такую программу чтобы не путаться называю Agentic Engine (движок), она сейчас часто бывает в виде CLI приложения (самая известная - Claude Code/CC, есть ещё куча, типа Gemini CLI, Qoder CLI, Codex CLI, ...). Но агенты бывают встроены в приложения - самый известный такой софт это Cursor, ну и системы типа Manus;

синонимы: консольный агент, CLI-агент;

- специальный промпт для агентного движка, который даёт специфические инструкции модели, и работает в своём контексе; также известен как Sub-Agents у Антропиков в Claude Code, но при этом управляется командой "/agents", живёт в папке "agents/"; будем считать Sub-Agent синонимом для этого значения "agents";

- Computer-Use Agents / Browser Agents / AI Browsers - это категория агентных приложений, в которых к модели подключён браузер/комптютер, и модель научена понимать скриншоты; кроме тогда дали инструменты, которыми можно рулить браузером (или в общем случае - компьюером целиком);

- Generic Agent: это агент общего профиля, без специфической ориентации как Browser Agent - пример Manus.

- Фоновый / Удалённый / Облачный агент - агентная система, работающая с кодом, расположенная "в облаке" удалённо (в противовес локально работающим CLI-агентам); примеры - Codex Cloud, Google Jules, Claude Code Web;

- Ну и тьма других агентных решений/систем - Gpt-5 Pro, DeepSearch, Grok Heavy, Google Deep Think, куча PPT агентов (создавать презентации) ...

▶️ Агентный воркфлоу - некий алгоритм, который выполняет агентная система


▶️ Жаргонные, местами шуточные термины:

- СС - Claude Code
- Клозеды - компания OpenAI (от closedAI, троллинг за отход от открытости в разработке AGI/ASI);
- Жульес: Google Jules;
- Муравьи (Ants) - сотрудники Anthropic;
- Зайка - Z.ai, вендор модели GLM; или сама модель GLM;
- Клод - продукт Антропика - Claude, общее название их семейства моделей;

👉 Upd 1️⃣:
- Раг - RAG: техника построения AI систем, предусматривающая наполнение контекста модели дополнительной информацией для генерации ответа на запрос пользователя;
- Барыги - компании, перепродающие токены и не оказывающие собственных услуг инференса/не производящие модели;

👉 Upd 2️⃣ (декабрь 2025): появилось пара новых словечек

- Руление (steering) : инструкции, добавляемые по месту для "подруливания" модели в ходе работы; например, инстуркции доабвляются к целевому файлу при работе с ним и объясняющие модели особенности работы именно с этим файлом; инструкции по генерации какого-либо контента (добавляются к контенту);

- Оправа / Упряжка (harness) : програмное обеспечение для ИИ модели, которое реализует агентные функции; пример - как ClaudeCode, так и OpenCode могут быть оправой для моделей семейства Claude. (ц) @almazom

🆕 - Наездник (жарг, негативное) - такой вайбкодер, пользователь ИИ, не имеющий глубокий профессиональных знаний и эксплуататорски использующий ИИ с получением слабопрофессионального результата;

...продолжение тут: https://t.me/deksden_notes/269
👍9🔥75