DEKSDEN notes
952 subscribers
155 photos
2 videos
1 file
269 links
Канал с моими заметками на разные темы
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi
Download Telegram
Подписочки от Minimax


Мне нравится тенденция на рынке - подписочки вместо Api usage, которое для агентов весьма накладно, даже если это китайские цены.

MiniMax разродился подписками: золотой стандарт отрасли - сравнить с ценами Антропиков)) Тут в разы больше использования, в разы дешевле.

https://x.com/MiniMax__AI/status/1986815058249408541

Дополнительно вводят цены на API ($0.3, $0.03 / $1.2)

Интересно, что дополнительно и отдельно введён план для Агента - $0 / $19 / $69.

В общем, знакомимься.

#post
@deksden_notes
👍3
Нотификации к Кодексу


Кто привык к развитому тулингу СС немного страдает на кодексе. У СС давно были хуки через которые можно было сделать нотификацию со звуком, когда СС ждёт реакции от пользователя.

Теперь похожую штуку можно сделать для Кодекса вместе с некоторым другим тюнингом!

🔗 https://github.com/regenrek/codex-1up


Такое мы смотрим

⭐️250 звёзд )) Не ураган популярности.


#post
@deksden_notes
🔥4
Утилита :: свитчер моделей в СС/Codex


Раз уж у нас пошёл поток моделей от китайский вендоров, некоторые из которых прям интересные и/или очень бюджетные, такой проект просто обязан был появиться. Собственно, сабж:

🔗 https://github.com/farion1231/cc-switch


Такое мы пользуем

Upd: там половина моделей/провайдеров про которые я даже не слышал

#post
@deksden_notes
🔥72
Кодекс и запуск тулов


Кодекс - сильная модель, но недостатки тулинга в codex cli - очевидны.

вот такую картину (git commit) наблюдаю регулярно!

В промпте написано - не запускать интерактивные команды, но оно запускает. Надо дорабатывать промптинг.

Вот в СС такого не бывает - там bash tool имеет встроенный таймаут по-умолчанию в 2 минуты. А кодекс в таком состоянии будет висеть часами.

В общем, направление для инструментов пока очевидно - добейтесь feature parity с лидером.

А пока пользуем чего дают

#post
@deksden_notes
Используем СС со сторонними моделями


Напомню, что в Claude Code легко подключить почти любую модель, и пользоваться всем её возможностями - планмоды, баш/джоб менеджер, кастомные субагенты, и прочее


Принципиально - две возможности: если у провайдера anthropic-совместимый эндпоинт есть (как у z.ai, deepseek, minimax, kimi), можно прописать его напрямую в переменных окружения, вместе с названиями моделей.

пример: https://docs.z.ai/devpack/tool/claude

Либо используем проект claude-code router, прокси, конвертирующий любой open-ai совместимый эндпоинт в anthropic совместимый.

https://github.com/musistudio/claude-code-router


А тулинг в СС - топовый!

Конечно, рекомендуется использовать по подписке, чтобы не платить по ценам api, что накладно даже с китайскими ценами. Благо кодинговые планы сейчас есть у z.ai, kimi, minimax, возможно и других вендоров.


Такое мы пользуем, конечно )

#post
@deksden_notes
👍6
Kimi K2 Thinking в CC


Не утерпел! Любопытно потыкать

Впечатлениями, конечно, поделюсь!
1🔥15👍7
tg_image_3908045610.png
35.6 KB
Codex Credits и прочая экономика лимитов


Я для себя получил предварительную оценку системы кредитов клозедов

День не самой интенсивной работы - средней, в 1-2 потока агента мне вышел чуть более 350 кредитов.

500 кредитов - это $20. Выходит, что примерно $15 в день на кредитах!

При этом аккаунт Team Стоит $30 в месяц. Успел отследить следующую цифру - если "сжечь" полностью 5часовой лимит, то выходит что тратится ровно 30% недельного лимита.

Теперь осталось прикинуть за сколько я полностью жгу лимит сессии в 5 часов на Team плане при таком использовании, и экономика сложится.

Но уже ясно что кредиты - не самая лучшая альтернатива подписке.

Также довольно очевидно, насколько выгодна подписка за 200 - там я только один раз приблизился к недельному лимиту. и то работало все в 3-4 потока. То есть это стараться надо!

Продолжаем наблюдение

▶️ Upd: Итоги дня - 502 кредита в день. Слухи про 350 кредитов оказались ложными.

Итого $20 в сутки.

‼️ Это дешевле апи-цен: cusage/codex говорит мне $173.40, всего 891m токенов, 852m кеш. Вот почему я не люблю апи цены. Замечу, это сильно подешевевшая gpt-5. С соннетом было бы больше, видимо.
👍6🔥4
Раш китайцами


На опенроутере нынче котокодер


Где же время то найти - чтобы это все затестить!

И я вспоминаю времена как нам рассказывал Дарио о безумных затратах на производство модели!

А щас пучок китайцев выкатывает их регулярно

Как похорошел пекин при собянине!
👍61
OpenRouter и новые китайские ризонинги


https://x.com/scaling01/status/1987938809628291168?s=20

Не всякий роутор освоит думать по-китайски! перфоманс модели через Опен Роутер хуже чем напрямую у провайдера

Раз сандал немного пошёл - есть шансы что починят

Просто лучше юзать официальное апи, кому надо
2👍2
Ещё раз об экономике токенов


Я все время топлю за подписки, и не пользую инструменты если у них нет возможности использования по подписке.

Щас покажу почему

▶️ Вы же пользуйтесь семейством продуктов ccusage? Оно считает токены потраченные СС и Кодексом. Отличный софт, рекомендую!

🔗 https://github.com/ryoppippi/ccusage

👉 Итак, не самый интенсивный месяц на Кодексе: $1431 по апи-ценам.

▶️ Вы скажете - конечно! Это же проклятые капиталисты. Китайские модели гораздо гуманнее по ценам.

👉 Это так и есть, но гуманизм спасает ситуацию не сильно - $362 на китайских моделях, простенькие задачи - раннер и эксперименты. Причём, траф 1.1T всего, это не много.

▶️ Подписка за $200 уже не кажется такой дорогой, да?)

А китайские планы за $10-40 так вообще капец какими выгодными!

#post
@deksden_notes
👍5🤣2🥰1
Специализация моделей


Мы все читае мбенчмарки, и мы все понимаем что часто бенчмарки особенного отношения к жизни (нашей, во всяком случае) не имеют. Это,кстати, вполне закономерно - если лезть в детали бенчмарков, там можно найти много всякого весёлого, когда становится очевидно что бенчмарк измеряет, мягко говоря, странное, или странно измеряет, или при таких вводных, что без понимания особенностей бенчмарка он малополезен.


В общем, мы пользуем модели для разных целей и имеем разный опыт.


Идея 👉 : давайте поделимся, кто и для чего имел хороший опыт с разными моделями. Типа, какая модель для каких задач лучше всего подходит


Я попробую свои наблюдения сформирвоать:

▶️ Claude Sonnet: классика кодинга, - код делает хорошо, на твёрдую 4 даже сейчас. Неочевидное применение - devops, хорошо знает многие системы, хорошо применяет cli утилиты, высокая агентность, не так часто чудит с опасными командами (хотя случается). Нормально рисует веб интерфейсы, но некоторые говорят что они кондовые.

▶️ Gpt-5-thinking : одна из топовых моделей сейчас. Умная, много знает. Слабо может в текст, излагает корявенько и как интроверт какой то - как минимум, нужен специальный промптинг для хорошего перфоманса для текста. В коде много знает, очень умная, но за оверинжинирингом рекомендуется следить - чтобы на заачу записать текст в файл вам не делали менеджер файловой системы. Как кодовый агент - пугливая, двигается очень короткими интервалами, часто переспрашивает чего и как продолжаем - это не очень высокая агентность. В вебе говорят неплохо делает веб интерфейсы.

▶️ Gpt-5-codex. Топовая модель для написания кода сейчас - высокая агентность, тянет долгие задачи, разумно останавливается. Хорошее внимание, до разумных пределов. Неважно запускает консольные тулы (хуже соннета). Интерфейс тоже похуже Gpt-5. Вроде не настолько знающая чем Gpt-5. Говорит как аутист, раскрутить на нормальный стиль общения едва ли выйдет - особенно внутри cli-агента (там промпты ещё накладываются).

▶️ Gemini 2.5 pro: Очень умная модель, хорошо работает с текстами и переводами, отличный OCR, огромное контекстное окно. Из недостатков - только низкая агентность, и низкое умение пользвоать тулами в агенте - поэтому не пускайте её писать код. Зато анализировать и обсуждать код с ней - топ. Ещё она довольно подхалимская, это минус - будет поддерживать вас в любой дичи, для работы такое вредно.
👍13
Qoder Pro subscription $2


Налетай! подешевело )))

Раш зергами китайцами продолжается: скидки у кводера - первый месяц за $2, потом $10.

https://docs.qoder.com/events/discount

https://qoder.com/pricing

Конкуренция - великая штука. Курсору и антропику бы задуматься, причём антропику надо думать больше.

#post
@deksden_notes
1😁5👀1
Мультисмплинг в Jules


Как там говаривали гуглеры? Ship! ship! ship! Раш не одними китайцами - что гуд.

👉 Жульес разродился мультисемплингом и некоторыми приятными допиливаниями.

Можно сделать 2 варианта на указанный промпт. Вопрос, конечно, кто там их потом сравнивает и как - но это за скобками и в других инструментах (да, облачный Кодекс?) 😀

Мелкие фиксы и допиливания прилагаются, в ченжлоге поподробнее.

🔗 https://jules.google/docs/changelog/

Такое мы приветствуем!

Upd: номера версий на паблике - это считается за доработку?)) 0.1.40. Тоже далеко не 1.0 версия! Все мы в эпохе альфа-версий

#post
@deksden_notes
2
Grok Code?



Полку cli агентов прибыло скоро может прибыть.

Ну - посмотрим, конечно.
👍7👀2
Кодекс устаёт и выгорает

Аж 3 минуты работал!

редко, но ловит какую то хрень в контексте что отказывается нормально работать.

Хорошо можно контекст выкинуть и в другом начать
Кредиты в кодексе, продолжение


посмотрел текущее использование кредитов. Итого получается примерно $45 за 2 дня. Стабильно чуть больше 500 кредитов в день в среднем (это $20), 600 максимум.

Итого: если планируем регулярный объём работы то или пучок Team аккаунтов (штук 5, не меньше), или Pro план. подписки сильно выгоднее даже кредитов, а кредиты сильно выгоднее апи.

При активном использовании никакой экономии не получится, бюджеты в диапазоне $100-200 в мес. Это только на клозедов!
🔥6👍3😱2
Очередной CLI на посмотреть

Сайт сделан грамотно, 10c все таки приличная большая контора - но с азиатским уклоном, конечно, что даже прикольно.

Фичи:
- Субагенты имеются (и пучок встреонных),
- менеджер фоновых процессов,
- выбор моделей (gpt-5/codex, gemini, glm),
- кастомные слеш команды есть (с параметрами),
- маркетплейс/плагины тоже
- mcp: local/sse/http
- memory: в кастомном CODEBUDDY.md, пользователь/проект, @ссылки, нет folder-bound памяти - это все базовая функциональность, но имеется

Интересная штука, довольно функциональная.

▶️ Upd: plan-mode тоже осилили, оказывается!
Ещё есть какой то Spec-kit, но где, пока не понятно

https://www.codebuddy.ai/blog/Automate%20Complex%20CLI%20Tasks%20CodeBuddy%20Code%201.20%20Bri

▶️ Upd 2: SpecKit оказался не доморощенный, а оригинал от гитхаба

Есть мануал как это в CodeBuddy запустить

https://www.codebuddy.ai/blog/Exploring%20Spec-Based%20Programming%20(Spec%20Coding)%20Usi



#post
@deksden_notes
👍6👀1
MiniMax M2 vs GLM 4.6 React UI


Сравнили:

https://x.com/donvito/status/1988561391553323287?s=20

GLM местами поинтереснее, но подглючивает вроде))
Воркфлоу - анализ

(идея)

В связи с тем, что мой оркестратор чего то шуршит и уже даже что то может делать, и не каждый раз упирается в какую то хрень, начал думать над теми самыми воркфлоу, ради которых я его и делал.

Как тестовая штука хочу такую вещь прикрутить: анализ проекта через ИИ.

Стадия 1️⃣: структура

- берём проект вменяемого размера (чтобы список файлов вмещался в контекстное окно), путь к нему - это входящий параметр воркфлоу
- снимаем список файлов, фильтруем кодовые файлы, документацию
- обрабатываем каждый кодовый файл: достаем все сущности кода и складываем их в json; достаём внешние сущности - чего импортируем, чего зовём и откуда;
- обрабатываем файл документации: выбираем оттуда все сущности кода и складываем в json;
- по итогам берём все json и пихаем в sqlite для обработки

При извлечении пробуем получить гипотезу о месте сущности по C4 классификации в системе - к какой подсистеме она относится и тп. Гипотеза этапа извлечения остаётся в БД.

Итог стадии: неструктурированный массив сущностей кода

Стадия 2️⃣: формирование структуры

Берём итоги прогона, обрабатываем все необработанные сущности

- собираем все упоминания сущности в коде/доке; смотрим на гиптезы к какому уровню в структуре проекта она относится; принимаем решение куда её определяем - по совокупности информации;

Итог стадии: имеем структурированную информацию о проекте - со ссылками на источники информации

- побочно: видим какие сущности кода упоминаются в документации и где; получаем покрытие документацией кода;
- видим какие сущности упоминаются в документации но в коде отсутствуют (косячная документация)

- на сдачу можно построить repoWiki по проекту

🟢 Интересно попробовать имея БД сущностей кода (практически граф) - попробовать по разному его структурировать, выделить разные срезы. Хотя это немного сомнительно, но ведь у нас все карты: код, комменты, дока!

Стадия 3️⃣: анализ

У нас есть библиотека "аспектов". Аспект - это отдельное направление анализа кода (безопасность, архитектура, code smells, границы сервисов, контракты, обработка ошибок, стиль кода, ...). Аспект может быть применён к разным скоупам: по C4 уровню - система, домен, контейнер, компонент/юнит.

Для каждого аспекта выбираем набор сущностей, которые попадают под анализ по этому аспекту. Формируем набор задачек для анализа каждого аспекта. Анализируем. Агенту рассказываем как доп информацию смотреть - делать запросы в БД сущностей, ходить смотреть исходный код/доку по ссылкам из БД на источники.

Набор проведённых анализов по аспекту консолидируем в единый документ по этому аспекту.

Такой процесс производим по каждому аспекту.


🟢 Вот такая задумка. Что думаете? Годный план? Кто чего уловил - кому то актуально? или я чего то невнятно пояснил?

- хочу погонять анализ через разные модели: что найдёт на одной и той же базе gemini, codex, gpt-5, k2 thinking, sonnet.

🟢 Да, такие воркфлоу я и понимаю под сложными. может для кого то это и не сложно на агентах сделать - но мне кажется на стоковом СС такое вряд ли летает


#post
@deksden_notes
🔥5👍1😱1