DEKSDEN notes
984 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
Небольшой релиз СС


🆕 Version 2.0.24:
• Fixed a bug where project-level skills were not loading when --setting-sources 'project' was specified
• Claude Code Web: Support for Web -> CLI teleport
• Sandbox: Releasing a sandbox mode for the BashTool on Linux & Mac

👉 Из интересного, обратите внимание: Web -> CLI teleport

Может быть мы таки дождёмся Claude Code Desktop, в котором будет вместо TUI обычный web GUI? )

Sandbox потенциально тоже полезная штука, но тут разбираться надо.

#post
@deksden_notes
👍4🔥2
☎️ Звонок - 18:30 Мск, Иишница у Алмаза - @aiclubsweggs

Рассказываю про flow работы с агентами в несколько потоков

Приходите!
👍9🙏1
Qoder CLI

Кто не видел - но полку cli агентов прибыло! Кводер выпустил CLI агент.

https://qoder.com/blog/qoder-cli

https://qoder.com/cli


🤟 Это оч интересно. Фичи на старте (курсору должн быть стыдно, как и кодексу), чек-лист:

☑️ Кастомные команды есть,
☑️ субагенты есть, /agents команда чата есть;
☑️ quest mode есть: это plan mode + todo контроль выполнения - их версия моих protocols.
☑️ agents.md поддерживаем, # команда чата есть (быстрая запись в память),
☑️ сессии есть, восстановление сессий командой чата есть (/resume) - привет кодексу
☑️ компакт есть (ладно, в кодексе тоже "довольно давно есть")
☑️ даже /usage есть - "как в лучших домах парижу!"
☑️ даже /release-notes есть (интересно - чем вдохновлялись при дизайне cli, даже не знаю!)
☑️ /bashes даже есть - для управления бэкграундными процессами! большой привет кодексу
☑️ yolo режим (--yolo, так и назвали, удивительно что не --dangerously-... , но печатать сильно быстрее)
☑️ неинтерактивный print mode/exec (--print), режимы выдачи text, json, stream-json (удивительно сопало с кем то)
☑️ MCP поддерживаем, добавляем знакомой командой mcp add <...> (опять удивительно совпало!)

Параллельные задачи агент сам делает в worktree. Смотрим опции --worktree и job. Умеет управлять окружениями сам.

Формат субагентов идентичен оригиналу (спасибо, не переписываем их для qoder), включая frontmatter. Агенты уровня проекта поддерживаются, как и уровня пользователя.

Кастомные команды есть, папка commands, уровень проекта/пользователя. Нет аргументов (ни общих, ни индивидуальных - странно что не сделали).

Сделали даже hooks, только notification пока - как в первых версиях сами знаете чего.

В общем, крайне достойный релиз! Не feature complete, но почти. Для первого релиза - 🔥



▶️ Кстати, Qoder Cloud тоже завезли: https://qoder.com/blog/quest-remote

Можно отправлять задачи на выполнение в контейнера в облако: настраивать ничего вроде бы не надо, там они сами разберутся как лучше сделать.

Насчёт цены ничего не говорят, контейнера входят в подписку.

#post
@deksden_notes
🔥11👍32
Kimi CLI


🆕 Обнаружен очередной кодовый агент! (@xpos587) Ничего про него сказать не могу - доки почти никакой, но пилят активно. Почитал changelog: сессии, субагенты упоминаются. MCP, ACP есть. На скрине - авторизация, но хз чего там за планы и прочее. За апи прайс интереса щупать особо нету.

Но Kimi все таки довольно сильная модель, если появится какой то план подписки - можно будет потестить. Пока 380 ⭐️ на гитхабе - это о популярности.

🤔 Единственный необычный нюанс - это питон: получается, оригинальная разработка!

🔗 https://github.com/MoonshotAI/kimi-cli


Агентов прибывает
"... Выключите свет! Они ползут на свет!.."

#post
@deksden_notes
🔥3
CodeMachine


🟢 Довольно любопытная штука прорисовалась:

https://github.com/moazbuilds/CodeMachine-CLI

У нас сегодня день "популярных" решений - 442 ⭐️

Но система любопытная: это оркестратор, который, понукая codex / claude code / cursor cli собирает из спецификации готовую систему.

🦖 Любопытен кейс в документации - он очень энтерпрайзный, видимо, хотят туда продавать:

- микросервисы,
- python на бэк (fastapi, openapi spec) + node/nest на crud
- react на фронт (без next и shadcn, что характерно)
- aws очереди SQS, SNS, SQS DLQ,
- облачные сервисы: s3, k8s, helms/terraform, kong,
- pg + mongo + redis, elastic,
- Istio, ci cd на github с ArgoCD,
- prometheus + graphana метрики, логгер ELK + CloudWatch + Jaeger, и отдельно PagerDuty + Slack для сообщений
- Auth0
- анализаторы OWSAP ZAP + snyk + sonarqube


⏱️ Такого монстра оно пилит 8 часов:


- Architecture Planning: 30 minutes - System architecture, C4 diagrams, ERDs, technical design decisions

- Service Implementation: 5 hours - 7 microservices with 42 API endpoints, 60,008 lines of code across 482 files

- Integration & Testing: 2 hours - Automated validation, unit tests, integration tests, E2E workflows

- Deployment Setup: 30 minutes - Terraform modules, Helm charts, CI/CD pipelines, runtime automation scripts


Total Active Development ~8 hours

👉 НО! Написано что исходная спецификация на 187 страниц. Они там им код расписали в спецификации?))

Всегда не мешает почитать промпты

▶️ В общем, такое мы смотрим!


#post
@deksden_notes
👍12🤯5
Please open Telegram to view this post
VIEW IN TELEGRAM
Codex v0.50.0


⭐️ Релиз кодекса! Ничего примечательного, скорее bugfix релиз, НО - зацените время: суббота, день.


Готов верить в переработки во фронтирных лабах

#post
@deksden_notes
👍5👏3🤔21
CodeBuddy 🆕

Вы удивитесь, но у нас новый консольный агент: Tencent Code Buddy Code. Да, нейминг топовый)) code-code.

Есть и ide, впрочем - ее не смотрел, хотя несколько фич заявлено интересных: конечно -sdd, интеграция бэкэндов Supabase и CloudBase (аналог от тенцента), импорт figma дизайнов для генерации ui, поддержка библиотек компонентов (tdesign, mui, shadcn), mac/win.

▶️ Для CLI заявлены фичи:
- подержка картинок: dnd, copy/paste, links
- сессии: --resotre
- print mode -p + поддержка pipe ; json/stream-json/text;
- mcp: stdio/sse/http; но про oauth ничего не сказано; mpc.json;
- custom slash commands: похоже на СС, project/user уровень, но без $ARGUMENTS и с индивидуальными $1, $2, ...
- memory: через CODEBUDDY.md/AGENTS.md; /memory;
- субагенты: ровно как в СС - md, frontmatter, model, tools теги; /agents команда;
- yolo: --dangerously-skip-permissions;
- интеграция с ide для cli ожидается

🔗 https://www.codebuddy.ai/cli

💰 Цены:
- 2w free trial с 250 кредитами;
- $10/mo за 1000 кредитов в мес; доп 1000 кредитов - тоже $10;
- бонусные кредиты отменили, а давали ранее 100 в день; жаль!

#post
@deksden_notes
1👍42🔥1
MiniMax M2 в ClaudeCode 🆕


▶️ Это не единственная обновка из Китая: minimax m2 доступна до 7 ноября бесплатно в api! можно подключить ClaudeCode через endpoint api в стиле anthropic (хорошая китайская мода пошла! я больше одобряю чем выпуско очередного не совсем доделанного cli).


🔗 https://platform.minimax.io/docs/guides/text-ai-coding-tools

Надо тестить!
🔥

#post
@deksden_notes
👍54🔥3
Minimax в CC


👉 Интересная деталь. Модель Minimax M2 думает как Клод - interleaved thinking, то есть подумает - поделает, потом опять подумает.

Поэтому лучше всего работает внутри СС, которая изначально поддерживает такой режим работы.

👉 Конечно, надо включить thinking: заметное отличие!


#post
@deksden_notes
👍42🔥2
Gemini CLI 0.11 🆕


Продолжаем мониторить ландшафт инструментов. У гемини немаленький релиз 0.11!


🔗 https://x.com/ntaylormullen/status/1983579911202992179

- делегация задач удалённому агеноту jules (через Jules Gemini CLI extension)
- поддержка stream json для non-interactive
- режим просмотра маркдаун файлов можно переключать - между Raw и рендером
- очередь отправленных сообщений с редакированием (да, как в СС)
- улучшения web fetch


🔗https://github.com/google-gemini/gemini-cli/discussions/12229

(0.10 тут: https://github.com/google-gemini/gemini-cli/discussions/11683)

Развивается. хорошо. Будет удачным пристанищем для 3.0!

#post
@deksden_notes
5👍3
Cursor 2.0 Agent Mode


▶️ Курсор обновился - это уже все знают, но я немного о другом: это вторая ИДЕ, которая представила специальный режим для работы с агентами.

Первая на моей памяти - это была TRAE с режимом SOLO.

https://www.trae.ai/solo

Интересен тейк продуктов на агентный флоу.

👉 Оба продукта вынесли чат как одно из главных панелей в среде - это логично. Артефакты работы агентов позволяют рассмтривать оба - я про диффы в кодобазе.

👉 Браузеры есть у обоих, но браузер курсора иметь полезную фишку - тыкаем выделенный элемент и он попадает в контекст агента, и можно выделенно менять. так удобнее, конечно.

👉 Планмод у курсора тоже немного более развитый - но в базе - это все ещё простая тудушка. Рисеч перед планированием - это большой и правильный шаг в нужном направлении, надо продолжать.



🟢 Личное имхо: направление правильное, но реализовано пока самое-самое базовое. Нужно давать возможность базовые кусочки правильных методик реализовывать инстурментами, и прививать правильные практики. Интеграция spec based development в kiro - это шаги тоже правильные, quest mode у qoder.

Для себя я особого интереса и смысла для ai swe на агентах использовать IDE вместо консольных агентов пока не замечаю: код просмотреть если надо я и в чарме могу, а каждый дифф рассматривать - не практикую.

Мне кажется момент оркестрации агента в части связки исследования, плана и реализации его в ветках и мержа мог бы быть поддержан в инструментах.


Что думаете?
3🔥3👍2
Гугл запускает сайт для CLI

Сабж:

🔗 https://geminicli.com/

Помимо описания, есть:
- дока 🔥 - её много не бывает
- галерея extensions: MCP и для контекста

https://blog.google/technology/developers/gemini-cli-extensions/

Большой хороший шаг! Респект гуглам

#post
@deksden_notes
🔥6
Gemini CLI todos


Ещё одна фича успешно "заимствована" у СС: todos

https://x.com/JackWoth98/status/1985430754319364275

Даже включается / выключается тоже Ctrl+t

Респект на самом деле - не стесняйтесь, уже соприте тотально все! Это прям надо

#post
@deksden_notes
1👍3😁3
Эволюция MCP


Не прошло и года, как "фраер сдал назад". Не совсем, конечно, но осознание - что чего то надо делать, видимо, настигло и антропиков.

О чем речь? Про этот блогопост:

https://www.anthropic.com/engineering/code-execution-with-mcp

Суть в том, что антропики признают:
- MCP сервера мощно нагружают контекст (тратя, между прочим, не только окно, но и внимание моделей - они с ума сходят, глядя на сотни тулов);
- тулюзы грузят контекст

Выход? несколько:

1) делаем searchTool тул - для поиска нужных тулов в MCP серверах. Получаем динамическое discovery "по требованию".


2) с вызовами MCP и перегрузкой контекста - сложнее. Предлагается делать "обертку" в виде кода вокруг вызова тулов. Заменяем тулюз на вызов некоего скрипта, который выполняет код.

Я так понял, что некий клиент, имея подключённые MCP сервера, конвертит их в некую файловую систему, туда прописывает каждый сервер с его тулами как скрипты по папочкам (одна папка - один сервер), и даёт агенту возможность писать код, используя эти модули!

🟢 Плюшки:
- агент ищет тулы по мере необходимости, не нагружая контекст описаниями тулов изначально;
- скрипт может обработать результат вызова тула, и не "сливать" весь дамп результатов, а выбрать ползное;
- можно цепочку вызовов превратить в простую функцию с несколькими вызовами тулов - сильно быстрее работает, и надёжно;
- за счёт обработки данных в коде можно токенизировать чувствительные данные - повышаем ениного безопасность;
- можно стейт обработки заполучить за счёт сохранения его из кода;

Всего-то надо завести code execution sandbox для агента! Впрочем, они их и так уже имеют.

Что напоминает? Верно - давайте превратим MCP в SKILL! Фактически, какой то MCP->SKILL конвертер советуют ))


😀 До моих индексных файлов с аннотированными ссылками они ещё не дошли, конечно, но мы не будем отчаиваться - глядишь, дозреют и тут.


Стоило, конечно, паковать SDK в MCP, чтобы потом делать такие клиенты, которые распакуют MCP и оформят как SDK. Какая то пост-ирония.


‼️ Upd: в упоминаемом муравьями посте кодофлёра расписано тоже вполне ясно все, стоит и его прочитать:

🔗 https://blog.cloudflare.com/code-mode/


Такое мы обдумываем, конечно!

#post
@deksden_notes
🔥5😁3👍2
Gemini 3 WEN?


Удачным завершением активности Гугла был бы релиз Гемини3 превью.

Шорох по Интернетам определенный идет.

Как тестим?
Прокидываем промпт в AI Studio через URL:


Гугл не останавливается

https://x.com/_philschmid/status/1985752510444015650

Мелкое удобство реализовали.


Правильный пример:

ai(.)studio/prompts/new_chat?prompt=Gemini3 WEN
🔥2
Юмор безопасности


Сабж:

https://x.com/theahmadosman/status/1986013094834016361?s=46

😂 Интересна статистика сервиса. Сколько людей проверили свои ключи?

Надо конечно еще хосты собирать, чтобы уже не нагибаться.
😁5
Codex и лимиты


▶️ Пользовать агента по апи ценам нынче дорого. подписки - это выгодно, очень.

Но подписки - это лимиты, в которые постоянно упираешься, и надо чего то мудрить.

▶️ С клозедами нынче такая ситуация: подписка на 200 предлагает почти безлимит. Надо очень стараться, чтобы высадить лимиты на такой подписке (в твиттере есть люди, у которых получается, но они запускают 6-8 агентов в параллель). Можно не выдумывать, и взять её - работать можно условно без перерывов.

Лимитов у нас 2 типа:
- сессия по 5 часов
- недельный лимит


▶️ Но 200 баксов - это заметно, поэтому для вариантов "подешевле" у клозедов есть только:
- Плюс за 20
- Тим за 30. Team аккаунты идёт от 2х штук, поэтому бюджет от 60/mo

На Team дополнительно: лимиты немного поболее, и есть возможность сделать пару запростов в gpt 5 pro, что приятно. такой "триал" pro аккаунта!

Какой там лимит? при 1 потоке непрерывно и ещё одном в режиме диалога у меня Плюс аккаунт лимит "5 часов" "сжигается" часа за 2 работы. То есть для непрерывной работы надо ТРИ аккаунта Plus минимум.

Team акакаунт "держится" немного дольше, но все равно 2 аккаунта team не всегда "вывозят" лимитами сессию в 5 часов.

▶️ С недельными лимитами сложнее: мне весь эксперимент "портят" клозеды, которые второй раз восстанавливают лимиты кодекса (там у них то кредиты раздают, то кодекс падает).

поэтому мне пока не понятно - сколько аккаунтов мне надо для бесперебофйной работы.

▶️ Акция: клозеды приглашают получить МЕСЯЦ бесплатно на Plus / Team аккаунте при первоначальной регистрации.

Я регистрируюсь на почтовые алиасы своей почты (есть у меня такая фича в почтовом сервере - это когда адрес ящика другой, а физически используется основной ящик). Телефонов при регистрации аккаунта с меня не спрашивали.

▶️ Самый цирк - это менеджмент аккаунтов. Я завёл профили гугла в хроме для каждого аккаунта. В каждом профиле я вошёл в chatgpt под нужным аккаунтом. В итоге он и аккаунт сохранил в менеджер паролей профиля, и путаницы чуть меньше - страничку с оставшимися лимитами аккаунта можно посмотреть без проблем.

▶️ Когда кодекс в чате пишет что вы "стукнулись об лимит" - переключаемся на хром, переключаемся на нужный профиль, возвращаемся в кодекс.

Выходим. кодекс напишет команду для восстановления именно этой сессии с её id. не трём её! пригодится.

В консоли делаем "codex login". Открывается хром в том профиле, который вы юзали последним - а это нужный вам профиль. Входим в профиль.

после логина возвращаемся в консоль, копируем команду кодекса для восстановления сессии.

Кодекс грузит сессию, но глючно её отображает немного - не боимся, все норм. Пишем "/approvals" чтобы выбрать нужный режим одобрения (у меня всегда full access) и "продолжить"

Процесс продолжается бесшовно с места прерывания.


▶️ Итого:
- щас юзаю 2 team аккаунта + 3 plus аккаунта. Лимитов пока хватает, но надо делать скидку на сбросы лимитов.

Посмотрим чем дело кончится! 120 баксов все равно не 200. вроде возни не так много - привыкнуть можно.

Такой вот практический опыт!

#post
@deksden_notes
🔥7🥰42👍1
Codex и лимиты - кредиты


Спросите - почему не пользую кредиты? Во первых, их на Плюсы завезли вот только что.

Во вторых, подписка вроде бы выгоднее кредитов!

Тут надо будет эксперимент провести - как быстро "сгорает" кредит. Но по моему разумению, подписка - самый выгодный "пакет" токенов. Кредиты - выгоднее апи, но менее выгодно чем подписка.

Непроверенные данные, из обсуждений предварительно: один поток агента выжигает 50 кредитов за 2 часа. То есть 10 часов - это 250 кредитов!

1000 кредитов за 40 долларов - выходит что хватает на 40 часов работы.

Если 2 подписки за 20 баксов работают по 1.5 часа раз в 5 часов, то за 10 часов рабочего дня они сработают по 3 часа каждая.

В недельный лимит это ударяется дня за 3-4! То есть часов по 10 в неделю минимум каждая отработает - это 40 часов в месяц. За 20 баксов.

40 часов за 40 баксов за кредиты, и 40 часов за 20 баксов по подписке. Пока так вижу!

но кредиты - это без переключения аккаунтов, перелогинов и отслеживания времени ресета лимита! дороже, но без шаманства.

вот и думайте))
🔥6👍1