DEKSDEN notes
955 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
GLM от Z.ai - на тест!

Подписался тестить coding plan on z.ai

Посмотрим чего там и как работает в сравнении с клодом

Рефералка тем кто хочет тоже попробовать с 10% скидкой:

🚀 You’ve been invited to join the GLM Coding Plan! Enjoy full support for Claude Code, Cline, and 10+ top coding tools — starting at just $3/month. Subscribe now and grab the limited-time deal!

Link:

https://z.ai/subscribe?cc=fission_glmcode_sub_v1&ic=JCBQLOIW7I&n=de***n%40deksden.com

#post
@deksden_notes
👍42🔥2
🆕 Новый релиз кодекса


Кодекс продолжает бодро добавлять фичи. Я отметил из новых:
- лимиты показывает
- расширен режим /review
- автокомпакт появился (только для gpt-5-codex после 220k)
- подготовка к undo на базе git - но пока не ясно в какую фичу завернут

Агентов пока нету

https://github.com/openai/codex/releases/tag/rust-v0.40.0

#post
@deksden_notes
🔥43👀2
⚒️ Клод Код тоже развивается - Claude Code v1.0.123


новый релиз, и новая интересная возможность!

🆕 Version 1.0.123:
• Bash permission rules now support output redirections when matching (e.g., Bash(python:*) matches `python script.py > output.txt`)
• Fixed thinking mode triggering on negation phrases like "don't think"
• Fixed rendering performance degradation during token streaming
• Added SlashCommand tool, which enables Claude to invoke your slash commands.
https://docs.claude.com/en/docs/claude-code/slash-commands#SlashCommand-tool
• Enhanced BashTool environment snapshot logging
• Fixed a bug where resuming a conversation in headless mode would sometimes enable thinking unnecessarily
• Migrated --debug logging to a file, to enable easy tailing & filtering

🟢 Из этого всего интересно смотреть на SlashCommand Tool. Интересно, что раздел документации по ссылке пока не появился.

Я так понимаю, теперь можно будет агентом вызвать команду, которая у вас определена! то есть многие воркфлоу которые запускались руками теперь можно запускать агентом. Nice

#post
@deksden_notes
1👍1🔥1
Вы же знали что с Клод Кодом можно поговорить про Клод Код?

Да, и документация в него встроена актуальная. Удобно, к слову.

На скринах - расспросы про SlashCommand tool.

Upd: на про тарифе будет жалко тратить запросы? Подключайте зая - там задёшево дают х3 трафика, работает точно не хуже соннета на простых задачах. тарифы с $3 стартуют, кмк демпинг, конечно! продают на месяц/квартал/год

Я, кстати, подписок на квартал вроде пока даже и не видел в других местах! Новация получается, что ли?)


#post
@deksden_notes
🔥53👍2
⁉️ Лимиты кодекса на тарифе за $20


Коллеги! Кто юзает подписку клозедов за 20 баксов - смотрели свежий кодекс и лимит использования? за сколько сжигается?

Может кто то пользует business аккаунты - там вроде поболее лимиты.

Кодекс 0.40 позволяет смотреть лимиты в /status - сильно удобнее стало
🔥21
▶️ Хорошие художники копируют, гениальные - воруют


Тут у Алмаза в Иишнице @aiclubsweggs обсуждали свежие фичи Qwen Coder. Интересно, что по фичам он обгоняет "прародителя" Gemini Cli.

Если конкретно - todoWrte и субагентов. Ну и чекпоинты. Сделали все правильно - скопировали все как было))

Интересно, как много продуктовых фич проработано в СС: например, todoWrite усилен не просто наличием инструмента для модели (todoWrite/todoRead), но и UI решением (пункты плана пишутся под строкой индикатором текущего действия), сделана возможно сть разворачивать план действий агента (переключается Ctrl+T), сделана слеш команда /todos для просмотра плана в любой момент, сделано напоминание в контекст <system-reminder> про план и необходимость его использования.

Фича выглядит порработанной со многих сторон. Это и делает СС одним из лучших решений на рынке! Хотелось бы чтобы и остальные решения подтягивались к уровню.

‼️ вот Кодекс нынче объявляет сбор фидбэка про функцию planning mode. Обязательно кидаем им свои мысли - это реально повлияет на развитие продукта! Не проходите мимо, помогите художникам:

https://x.com/embirico/status/1970944774460015072?s=46

☝️

upd: я просил:
- Research перед планирвоанием
- Explanatory style в ответах
- отдельный контекст исполнения от планирования
- ну и СУБАГЕНТОВ

#post
@deksden_notes
1👍63
Апдейт: появилась дока про SlashCommand tool в СС


https://t.me/deksden_notes/113

Много интересных нюансов использования:

- встроенные команды не поддерживаются; то есть /compact дёрнуть не получится
- можно запретить определённые команды
- можно контролировать вызов и наличие аргументов
- поддерживается бюджет токенов

Эта фича помещает в контекст описание всех команд в рамках бюджета. смотреть сколько контекста тратится через /context.

Вот дока:

https://docs.claude.com/en/docs/claude-code/slash-commands#slashcommand-tool


#post
@deksden_notes
🔥3👍1
⚒️ Qwen Code: появился Plan Mode


Новости AI SWE tools тусовки. Краем глаза слежу за развитием других консольных агентов, даже за форками - в последнее время квенкод решил добить все известные фичи. Недавно - субагентов, а нынче в квенкода завезли plan mode. Пока оригинальный Gemini Cli и Codex все его пилят, китайцы уже сделали! Из описания видно что ориентировались на СС, что есть хорошо - там удобный планмод.

https://github.com/QwenLM/qwen-code/pull/658


Ну - респект китайцам. Жду feature parity и когда они приступят к отработке нестандартных экспериментальных направлений.

Upd: обращаем внимание, квенкод - это софтина, агент, квенкодер - это модель.

#post
@deksden_notes
2👍41
Это уже конкуренция или как?))

Кодекс по ходу дела, молча
😁17🔥1
▶️ Code (он же CODER) - форк Кодекса


Обнаружен новый форк кодекса с парой дополнительных фич - CODE (также известен под именем CODER).

https://github.com/just-every/code

🟢 Добавлена:
- интеграция с браузером
- умеет запускать мульти-агентные задачи (запускает Claude, gemini, qwen) для plan, code, solve.
- работает под подписке ChatGPT и даже не требует отдельного логина, использует кодекс


Посмотреть точно любопытьно, но где взять время чтобы во всем разобраться!))

Upd: пока по мне самая любопытная фича - это работа нескольких агентов. CODE находит других агентов в системе (у меня нашлись gemini, qwen, CC). Глючит, но в режиме /plan чего то отвечает. Смотреть на панель - Ctrl+A.

Сыровато, но концепт такой системы очевидно имеет смысл: ответы вполне интересные.

#post
@deksden_notes
👍9🔥2🤝1
Осень 🍂 в этом году наступила раньше!

Осеннее обновление от антропиков: Sonnet 4.5! В этом сезоне - раньше обычного. Что кодекс животворящий делает.

Профильные каналы уже опубликовали кучу графиков, где новый соннет повыше кодекса-5 и 2.5-про. Что интересно, повые опуса 4.1! Кто бы сомневался.

🟢 Вот карточка модели:

https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf


Что надо посмотреть на практике - насколько убрали:

- подхалимство
- тягу "срезать углы" (халтурить и лениться)
- эффекты "отупения", преследующие антропиков с августа

▶️ соннет 4.-5 может так: An experimental new way to design software

https://www.youtube.com/watch?v=dGiqrsv530Y

и живьём: https://claude.ai/imagine/

▶️ Само-редактирование контекста в апи:

https://www.anthropic.com/news/context-management
https://docs.claude.com/en/docs/build-with-claude/context-editing

-

‼️ А вот это - интересно: Claude Code 2.0 🔥

- нативный VS Code plugin
- новый look
- чекпоинты (/rewind)
- /usage - показываем лимиты (и для веб-приложения на claude.ai тоже можно смотреть лимиты, https://x.com/claudeai/status/1972732965219438674?t=0h9rnmwoyvVD6pzVuXjWZg&s=35)
- Tab для вкл/выкл thinking (а как же кастомная анимация?!)
- Ctrl+R которая раньше включала Transcript mode (теперь Ctrl+O) получила функцию Поиска по истории
- "Unshipped claude config command" - чтоб бы это ни значило;
- Claude Code SDK переименован в Claude Agent SDK
- Add subagents dynamically with --agents flag : с этим надо разобраться, чего такое

https://github.com/anthropics/claude-code/blob/main/CHANGELOG.md#200

👉 Почитать про SDK: https://www.anthropic.com/engineering/building-agents-with-the-claude-agent-sdk

а вот под капотом SDK есть содержательные изменения: https://docs.claude.com/en/docs/claude-code/sdk/migration-guide

- системный промпт теперь пустой по-умолчанию, раньше был от claude code; можно настроить чтобы было как раньше;
- больше не грузим по-умолчанию настройки из файловой системы (CLAUDE.md, settings.json, slash commands, etc.); можно специально настроить чтобы было как раньше;


👉 Меморибанк от антропиков, начало: https://docs.claude.com/en/docs/agents-and-tools/tool-use/memory-tool (Memory tool): довольно базовая штука, просто абстрактная память, похожая на файловую систему.

В общем, есть что посмотреть и потрогать! Удачно началась неделя.

#post
@deksden_notes
👍9🔥62
🔥 ЗАЙку не бросила хозяйка!

Не так давно я упоминал про тест GLM с Coding Plan:

https://t.me/deksden_notes/87
https://t.me/deksden_notes/111

Нынче, сразу за Соннетом 4.5 появился доработанный GLM-4.6!

https://docs.z.ai/guides/llm/glm-4.6

Есть даже тесты в сравнении с соннетом 4.5 - что очень необычно: он же вышел буквально вчера. Вот это оперативность! Поспешили)) Даже видно как статейку на сайте через search/replace готовили - там соннет иногда упоминается как 4.6)) но все равно приятно, молодцы.

Что 🆕 нового:

- контекст 200к! 🔥
- доработали кодинг в общем, и фронт в частности;
- сильнее рассуждения и агентность
- лучше работает с текстом и держит стиль

Бенчи по ссылке на картинках, там все немного лучше!

Респект китайцам. Обновляем env переменную в настройках СС))

#post
@deksden_notes
🔥8👍1
▶️ Кодекс Cli и Gpt-5-Codex-high, приёмчики


Работа с Кодексом может давать иллюзию что модель сильно умнее и особенно "париться" с ней не стоит. Когда агент по 40 минут работает и делает что то серьёзное - это впечатляет. 🔥

Однако особенно расслабляться пока рано: кодекс не волшебный. Да, он тоже может упустить что то при работе, не доделать. Да, с роcтом сложности задачи возникают все те же самые проблемы.

🟢 Напомню - что рецепт один, актуален и для СС, и для Кодекса, да и для любого агента:
- готовим грамотный контекст
- правильно нарезаем задачу
- следим за выполнением и переполнением контекста
- используем steering техники

👉 Как это все выглядит в переложении на Кодекс?

1) подготовка контекста: начинаем задачу с "чистого листа" - новый чат /new; у нас есть меморибанк по проекту, поэтому просим агента "подготовится к обсуждению (... тема нашего рефакторинга), прочитать меморибанк, создать необходимый контекст для осбуждения темы";

я сделал типовой промпт (так называются кастомные слеш команды в кодексе) на эту тему - про проект: чтобы агент прочитал меморибанк проекта, изучил код системы, и прочие необхоидмые файлы.

при выполнении агент читает документацию, смотрит файлы кода - уходит до 25-30% контекста на это (очевидно, зависит от размеров проекта);

2) после начинаем обсуждать тематику рефакторинга - я набрасываю тему и прошу его изучить задачу, изучить код, документацию, тесты, провести анализ, подумать и предложить варианты решения задачи, и возвращаться с отчётом для обсуждения;

3) при обсуждении несколько раз просим максимально интегрировать решение в систему, DRY, TRIZ, использовать имеющийся код максимально, следовать лучшим паттернам и подходам, делать грамотную архитектуру и отличный DX, обходиться без усложнений и оверинжиниринга, но делать полнофункциональное элегантное решение, соблюдать баланс простоты и функциональности, делать надёжно;

4) не забываем при планировании - планировать обновление меморибанка;

5) когда обсудили план работ - пишем файл с планом в папку '.protocols/' под очередным номером: прописываем что делаем, где, как именно, на что обращать внимание, каким стандартам следовать, чему соответствует реализация, каким требованиям и где описана в документации, и прочие полезные при реализации детали;

пропишите: написать такой файл плана, чтобы можно было сделать этот план без доступа к контексту обсуждения, включить в план все сведения для его воплощения.

6) после формирования плана оцените, сколько осталось контекста - если немного, лучше сделать /compact, прочитать план снова и просить подготовить контекст заново, и только потом стартовать план на выполнение;

7) при выполнении обязательно просим помечать в плане прогресс; когда останавливается агент - тоже просим отмечать прогресс в плане;

😍 если подошли к заполнению контекста и агент остановился - просим прописать прогресс и делаем /compact с дальнейшим чтением плана и просьбой восстановить контекст; продолжаем когда он прочитал себе в контекст что нужно;

9) при завершении - обязательно просим верифицировать полноту выполнения плана

▶️ Итог: вы можете делать рефакторинги на 1.5 часа в 2-3 контекста с нормальным качеством! Может быть количество доделываемых пунктов вас немного удивит))

🤟

#post
@deksden_notes
🔥13👍41
▶️ Codex :: cloud tasks


Интересно! cli будет интерфейсом к облачному кодексу и будет им рулить?

https://github.com/openai/codex/pull/3197

Любопытно ///


🆕 Upd: параметры в промпты (у кодекса так зовут кастомные слеш команды) тоже завозят - https://github.com/openai/codex/pull/4470


#post
@deksden_notes
❤‍🔥4👍1
▶️Codex :: SDK

Не Claude Agents / Code SDK единым! У кодекса тоже будет SDK. Уже готовят.

Можно почитать readme тут:

https://github.com/openai/codex/pull/4513/files#diff-9be9f99d130daf9a9aea3153e83306403823122bffa83285f1545b5048f04dda

хорошие новости, будем встраивать)

#post
@deksden_notes
🔥5👍4
♊️Gemini Cli :: Agents


Команда Gemini Cli работает над созданием своей системы агентов:

https://github.com/google-gemini/gemini-cli/pull/9778

Живьём пока вроде бы такого не видно, но "под капотом" работа идет. Даже модель с контекстом 1m токенов "сломалась" на эту тему.

Интересно - сколько будет держаться Кодекс?) Gemini делает, Qwen сделал ...

#post
@deksden_notes
1👍4🔥3
Google Jules :: обновки конца сентября

Не CLI единым - развиваетс все, и довольно бодро. У Жульеса тоже куча обновок:

- общается в комментариях к PR
- файловый @ селектор в чате
- ПАМЯТЬ: агент выделяет какие то заметки про репо и сохраняет их на будущее; довольно просто - но мы только начали;
- ENV - наконец то можно "официальным" способом давать переменные окружения на уровне репозитория, для фонового агента это BIG; управляемая выдача переменных таскам;

Смотрим и читаем про сабж тут:

https://jules.google/docs/changelog/

#post
@deksden_notes
👍6🔥2