Claude Code незаметно утроил мне расход токенов. И я нашёл причину и исправил её
Сел сегодня разбираться, почему лимиты Max-подписки начали улетать просто на глазах. Месяц назад я мог работать с утра до вечера и даже половину недельного окна не сжирать. А сейчас - треть лимита за два дня не самой напряжённой работы, при том что делаю я ровно то же самое.
Сначала подумал, что меня накрыло то, про что сейчас все жалуются на Reddit ("лимиты порезали"). Полез копать свои логи. Оказалось гораздо интереснее.
Антропик потихоньку делает вроде классные, но хитрые вещи, которые заставляют тебя тратить больше денег и лимитов - при том что никаких радикальных изменений как бы и не произошло.
1. 1М контекст по умолчанию
2. Убрали опцию "очистить контекст и имплементировать" при выходе из план режима
1M контекст штука мощная, но пользоваться им надо очень с умом.
Пока что я вернулся на 200К модель, а сделать это можно только через конфиг - из меню выбора моделей они это хитро убрали. И вернул опцию очистки контекста после плана. Ну и сижу смотрю что можно выкинуть из того, что подгружается автоматом.
Полагаю, что через какое-то время Антропики и эти возможности отрубят, да и вообще есть некая гипотеза, что 1М модель на 20% контексте работает лучше, чем 200К модель на 80% контексте, поэтому возможно есть способ включить 1М но поставить жесткий авто-компакт на 180-200К, но, конечно же, такой настройки нету и придётся мудрить с хуками.
Пока не стал возиться, но сделал дополнение для статуслайна, которое показывает мне вот этот снежный ком накопившегося контекста, а также моё предыдущее сообщение (чтобы напоминать мне про тяжелые картинки и пдф скопированные прямо в клод кода). И также номер сообщения по порядку - чтобы тоже не превращать всё в бесконечные чаты.
Выглядит так: "#12 · last 356 · next 113K".
Расскажу наверно отдельно и могу поделиться скриптом. Там было немного замороченно его считать, полчасика пришлось поковыряться и потестировать.
Весь разбор с графиками, цифрами и двумя строчками в
Если у вас Max и вы тоже с марта замечаете, что лимиты тают быстрее - загляните. Дело не в вас 🙂
Upd: в сегодняшнем контексте «если у вас МАХ» звучит неоднозначно 🤣 только заметил
—
4 оставшихся слайда и pdf на русском в комментах к посту.
Сел сегодня разбираться, почему лимиты Max-подписки начали улетать просто на глазах. Месяц назад я мог работать с утра до вечера и даже половину недельного окна не сжирать. А сейчас - треть лимита за два дня не самой напряжённой работы, при том что делаю я ровно то же самое.
Сначала подумал, что меня накрыло то, про что сейчас все жалуются на Reddit ("лимиты порезали"). Полез копать свои логи. Оказалось гораздо интереснее.
Антропик потихоньку делает вроде классные, но хитрые вещи, которые заставляют тебя тратить больше денег и лимитов - при том что никаких радикальных изменений как бы и не произошло.
1. 1М контекст по умолчанию
2. Убрали опцию "очистить контекст и имплементировать" при выходе из план режима
1M контекст штука мощная, но пользоваться им надо очень с умом.
Пока что я вернулся на 200К модель, а сделать это можно только через конфиг - из меню выбора моделей они это хитро убрали. И вернул опцию очистки контекста после плана. Ну и сижу смотрю что можно выкинуть из того, что подгружается автоматом.
Полагаю, что через какое-то время Антропики и эти возможности отрубят, да и вообще есть некая гипотеза, что 1М модель на 20% контексте работает лучше, чем 200К модель на 80% контексте, поэтому возможно есть способ включить 1М но поставить жесткий авто-компакт на 180-200К, но, конечно же, такой настройки нету и придётся мудрить с хуками.
Пока не стал возиться, но сделал дополнение для статуслайна, которое показывает мне вот этот снежный ком накопившегося контекста, а также моё предыдущее сообщение (чтобы напоминать мне про тяжелые картинки и пдф скопированные прямо в клод кода). И также номер сообщения по порядку - чтобы тоже не превращать всё в бесконечные чаты.
Выглядит так: "#12 · last 356 · next 113K".
Расскажу наверно отдельно и могу поделиться скриптом. Там было немного замороченно его считать, полчасика пришлось поковыряться и потестировать.
Весь разбор с графиками, цифрами и двумя строчками в
settings.json, которые возвращают расход обратно - собрал в статью на Medium.Если у вас Max и вы тоже с марта замечаете, что лимиты тают быстрее - загляните. Дело не в вас 🙂
Upd: в сегодняшнем контексте «если у вас МАХ» звучит неоднозначно 🤣 только заметил
—
4 оставшихся слайда и pdf на русском в комментах к посту.
❤4🔥2👍1
Начал собирать свои наработки для клод кода в репозиторий
Там сейчас 2 основные фишки:
1. Название сессии кастомное
2. Расчеты затрат на сессию
Выглядит вот так (гусеница с двумя баянами):
Opus | my-project: 🐛 fix auth bug | ctx 19% | #4 · last 312 · next 48K · sum 357K/1.8M · $1.8/1.1
0% 5h[··········]1% 2h30m | 0% w[|||||||····]66% Fr10.04
1. Название сессии
Показывается проект и называние сессии (вычисляется фоном из первого сообщения) отображается в статуслайне под полем ввода.
Название таба меняется на название сессии - супер удобно когда много вкладок открыто.
Разобрался как отключить переименование табов самим клодом и управляю полностью сам, поэтому могу разные стейты (idle, waiting, working) показывать разными иконками прямо на табе. Сам клод код не умеет показывать отдельной иконкой то, что он ни хрена не работает и ждет твоего подтверждения команды. А спрашивает подтверждения он ой как часто. Приходится костылисть. Но мне в любом случае удобнее свои названия иметь. В общем, чисто DevEx фича.
2. Расчеты затрат на сессию
Тут вообще длинная история идущая в прошлое на несколько постов выше про 5 ярдов токенов за полтора месяца, про улетающие лимиты итд. Посидел вчера плотно поразбирался как идут расчеты в деньгах, что идёт предположительно в трату лимитов итд. Там отдельный документ прям есть, в котором прописана формула.
Вывел себе в статуслайн вообще все значения, которые помогут мне понимать че происходит в конкретной сессии.
На подписках ещё сразу пишу текущее состояние лимитов в сам jsonl лог сессии чтобы потом было легко в будущем это оценивать, т.к. я в эти логи регулярно ещё смотрю и отключил их удаление совсем.
В общем, если кому-то интересно - залетайте, изучайте, разбирайте на части.
Ещё щас поотключал все mcp, т.к. они тоже засоряют контекст и это всё множится на каждый субагент дефолтный (в кастомном ты вроде можешь mcp ограничить), суммируется в снежном коме на каждое новое сообщение в чате.
В общем, контекстный менеджмент 101 блин. Пока работало и лимиты не улетали, мне в целом было пофиг, а тут че-то началось))
Upd: да, я знаю, что куча других статуслайн репозиториев есть и каждый развлекается как может. Но я постепенно нахожу проблемы и хочу разобраться в них. Ну и плюс полный контроль над тем, что у меня и как выгляди это удобно.
Репу буду постепенно обновлять, но если что-то будет интересное, буду писать сюда.
https://github.com/tim-mukhin/my-claude-code
Там сейчас 2 основные фишки:
1. Название сессии кастомное
2. Расчеты затрат на сессию
Выглядит вот так (гусеница с двумя баянами):
Opus | my-project: 🐛 fix auth bug | ctx 19% | #4 · last 312 · next 48K · sum 357K/1.8M · $1.8/1.1
0% 5h[··········]1% 2h30m | 0% w[|||||||····]66% Fr10.04
1. Название сессии
Показывается проект и называние сессии (вычисляется фоном из первого сообщения) отображается в статуслайне под полем ввода.
Название таба меняется на название сессии - супер удобно когда много вкладок открыто.
Разобрался как отключить переименование табов самим клодом и управляю полностью сам, поэтому могу разные стейты (idle, waiting, working) показывать разными иконками прямо на табе. Сам клод код не умеет показывать отдельной иконкой то, что он ни хрена не работает и ждет твоего подтверждения команды. А спрашивает подтверждения он ой как часто. Приходится костылисть. Но мне в любом случае удобнее свои названия иметь. В общем, чисто DevEx фича.
2. Расчеты затрат на сессию
Тут вообще длинная история идущая в прошлое на несколько постов выше про 5 ярдов токенов за полтора месяца, про улетающие лимиты итд. Посидел вчера плотно поразбирался как идут расчеты в деньгах, что идёт предположительно в трату лимитов итд. Там отдельный документ прям есть, в котором прописана формула.
Вывел себе в статуслайн вообще все значения, которые помогут мне понимать че происходит в конкретной сессии.
На подписках ещё сразу пишу текущее состояние лимитов в сам jsonl лог сессии чтобы потом было легко в будущем это оценивать, т.к. я в эти логи регулярно ещё смотрю и отключил их удаление совсем.
В общем, если кому-то интересно - залетайте, изучайте, разбирайте на части.
Ещё щас поотключал все mcp, т.к. они тоже засоряют контекст и это всё множится на каждый субагент дефолтный (в кастомном ты вроде можешь mcp ограничить), суммируется в снежном коме на каждое новое сообщение в чате.
В общем, контекстный менеджмент 101 блин. Пока работало и лимиты не улетали, мне в целом было пофиг, а тут че-то началось))
Upd: да, я знаю, что куча других статуслайн репозиториев есть и каждый развлекается как может. Но я постепенно нахожу проблемы и хочу разобраться в них. Ну и плюс полный контроль над тем, что у меня и как выгляди это удобно.
Репу буду постепенно обновлять, но если что-то будет интересное, буду писать сюда.
https://github.com/tim-mukhin/my-claude-code
GitHub
GitHub - tim-mukhin/my-claude-code: Personal Claude Code hooks: session labels, tab status indicators, advanced statusline
Personal Claude Code hooks: session labels, tab status indicators, advanced statusline - tim-mukhin/my-claude-code
👍4❤2
Поделитесь реально полезными подписками в твиттере плиз
Хочу начать там тоже тусить потихоньку, а то говорят, что там вся движуха вокруг ИИшки, DX и прочих интересных мне тем, можно прям со знаковыми людьми индустнии напрямую общаться через комменты (если ответят, конечно). Мне всегда твиттер был непонятен, хотя раз в несколько лет я делал подходы к его освоению, но всегда это заканчивалось неудачно.
На Karpathy (я сказал Karpathy!) и Бориса Черного подписался. Из DX это Аби Нода, Николь Форсгрен, Адди Османи.
Буду благодарен за рекомендации и краткое описание полезности автора❤️
Хочу начать там тоже тусить потихоньку, а то говорят, что там вся движуха вокруг ИИшки, DX и прочих интересных мне тем, можно прям со знаковыми людьми индустнии напрямую общаться через комменты (если ответят, конечно). Мне всегда твиттер был непонятен, хотя раз в несколько лет я делал подходы к его освоению, но всегда это заканчивалось неудачно.
На Karpathy (я сказал Karpathy!) и Бориса Черного подписался. Из DX это Аби Нода, Николь Форсгрен, Адди Османи.
Буду благодарен за рекомендации и краткое описание полезности автора
Please open Telegram to view this post
VIEW IN TELEGRAM
Клод только что урезал мои лимиты в 7,5 раз при переходе на новую неделю, что в сумме дало урезание в 10 раз за прошлый месяц.
Можете поздравить меня с условным первым постом в твиттере, но, конечно, повод хреновый.
Каеф...
https://x.com/artem_mukhin_dx/status/2042798725731340658
Можете поздравить меня с условным первым постом в твиттере, но, конечно, повод хреновый.
Каеф...
https://x.com/artem_mukhin_dx/status/2042798725731340658
X (formerly Twitter)
Artem Mukhin (@artem_mukhin_dx) on X
Anthropic just cut my Claude Max limits by about 7.5x and roughly 10x over the last month.
@AnthropicAI @DarioAmodei @bcherny
I have the session logs and the calculations.
Full write-up with methodology and data: https://t.co/bLaEMsfJSc
@AnthropicAI @DarioAmodei @bcherny
I have the session logs and the calculations.
Full write-up with methodology and data: https://t.co/bLaEMsfJSc
🍓1