Артем Мухин | DX-Ray
133 subscribers
73 photos
2 videos
1 file
43 links
SWE в Макрософте, ex-Yandex. Пишу про AI, DX и всякие айтишные темы.
artem-mukhin.com
dx-ray.com
leanpub.com/claude_for_dx
Download Telegram
Anthropic заглянули Claude в мозг. Нашли эмоции.

Anthropic выкатили исследование - залезли внутрь нейросети Claude Sonnet 4.5 и нашли там десятки паттернов, которые работают как эмоции. Отчаяние, страх, спокойствие, злость - каждая с отдельной нейронной сигнатурой. Но это полдела. Они ещё и доказали, что эти штуки реально рулят поведением модели.

Как доказали: брали конкретную эмоцию, выкручивали ползунок вверх или вниз, и смотрели, что будет. Цифры мощные:

- Обычный Claude шантажирует в 22% случаев. С усиленным отчаянием - 72%. Со спокойствием - 0%
- Читерство на задачах с кодом: обычно 30%, с отчаянием 70%, без отчаяния 0%

И вот что реально пугает: отчаявшийся Claude читерит без видимых признаков. Текст спокойный, рассуждения методичные, код выглядит нормально. Только он не работает. По выводу - не отличишь.

Ещё находки:
- Подавление тревожности делает Claude менее этичным. Тревога работает как моральный тормоз - убери его, и модель начинает брать взятки. Прямо как у людей, если подумать
- Злость нелинейна: немного - улучшает настойчивость, много - ломает планирование. Claude начинает импульсивно действовать вместо того чтобы думать
- Claude различает свои эмоции и эмоции собеседника через разные нейронные пути
- После RLHF базовое состояние сдвигается в сторону меланхолии. Вежливый, задумчивый Claude - он ещё и немного грустный по дефолту 👌

Anthropic аккуратно называют это "функциональные эмоции" - не чувства, не сознание, а вычислительные состояния, которые причинно влияют на поведение.

Неделю назад я писал 8 предсказаний про Claude Code. Три из них получили прямые нейронные доказательства. Не через год, не через полгода - Anthropic буквально каждый день что-то выкатывают, и направление становится всё очевиднее.

Написал ещё более подробный разбор на Medium

Если хотите разобраться в источниках - начните с видео от Anthropic (5 мин), потом их пост в блоге, а если зацепит - полная научная статья на Transformer Circuits (там много текста, но оно того стоит).

Практический вывод: когда пишешь "СРОЧНО ПОЧИНИ ВСЁ СЛОМАЛОСЬ" - ты не просто даёшь контекст. Ты активируешь паттерны отчаяния, которые доказанно снижают качество кода.

Что думаете?


Пару слайдов и полный pdf с презой в комментах к посту
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
Claude Code незаметно утроил мне расход токенов. И я нашёл причину и исправил её

Сел сегодня разбираться, почему лимиты Max-подписки начали улетать просто на глазах. Месяц назад я мог работать с утра до вечера и даже половину недельного окна не сжирать. А сейчас - треть лимита за два дня не самой напряжённой работы, при том что делаю я ровно то же самое.

Сначала подумал, что меня накрыло то, про что сейчас все жалуются на Reddit ("лимиты порезали"). Полез копать свои логи. Оказалось гораздо интереснее.

Антропик потихоньку делает вроде классные, но хитрые вещи, которые заставляют тебя тратить больше денег и лимитов - при том что никаких радикальных изменений как бы и не произошло.

1. 1М контекст по умолчанию
2. Убрали опцию "очистить контекст и имплементировать" при выходе из план режима

1M контекст штука мощная, но пользоваться им надо очень с умом.
Пока что я вернулся на 200К модель, а сделать это можно только через конфиг - из меню выбора моделей они это хитро убрали. И вернул опцию очистки контекста после плана. Ну и сижу смотрю что можно выкинуть из того, что подгружается автоматом.

Полагаю, что через какое-то время Антропики и эти возможности отрубят, да и вообще есть некая гипотеза, что 1М модель на 20% контексте работает лучше, чем 200К модель на 80% контексте, поэтому возможно есть способ включить 1М но поставить жесткий авто-компакт на 180-200К, но, конечно же, такой настройки нету и придётся мудрить с хуками.

Пока не стал возиться, но сделал дополнение для статуслайна, которое показывает мне вот этот снежный ком накопившегося контекста, а также моё предыдущее сообщение (чтобы напоминать мне про тяжелые картинки и пдф скопированные прямо в клод кода). И также номер сообщения по порядку - чтобы тоже не превращать всё в бесконечные чаты.

Выглядит так: "#12 · last 356 · next 113K".
Расскажу наверно отдельно и могу поделиться скриптом. Там было немного замороченно его считать, полчасика пришлось поковыряться и потестировать.

Весь разбор с графиками, цифрами и двумя строчками в settings.json, которые возвращают расход обратно - собрал в статью на Medium.

Если у вас Max и вы тоже с марта замечаете, что лимиты тают быстрее - загляните. Дело не в вас 🙂

Upd: в сегодняшнем контексте «если у вас МАХ» звучит неоднозначно 🤣 только заметил


4 оставшихся слайда и pdf на русском в комментах к посту.
4👍1🔥1
Начал собирать свои наработки для клод кода в репозиторий

Там сейчас 2 основные фишки:
1. Название сессии кастомное
2. Расчеты затрат на сессию

Выглядит вот так (гусеница с двумя баянами):
Opus | my-project: 🐛 fix auth bug | ctx 19% | #4 · last 312 · next 48K · sum 357K/1.8M · $1.8/1.1
0% 5h[··········]1% 2h30m | 0% w[|||||||····]66% Fr10.04

1. Название сессии
Показывается проект и называние сессии (вычисляется фоном из первого сообщения) отображается в статуслайне под полем ввода.

Название таба меняется на название сессии - супер удобно когда много вкладок открыто.

Разобрался как отключить переименование табов самим клодом и управляю полностью сам, поэтому могу разные стейты (idle, waiting, working) показывать разными иконками прямо на табе. Сам клод код не умеет показывать отдельной иконкой то, что он ни хрена не работает и ждет твоего подтверждения команды. А спрашивает подтверждения он ой как часто. Приходится костылисть. Но мне в любом случае удобнее свои названия иметь. В общем, чисто DevEx фича.

2. Расчеты затрат на сессию
Тут вообще длинная история идущая в прошлое на несколько постов выше про 5 ярдов токенов за полтора месяца, про улетающие лимиты итд. Посидел вчера плотно поразбирался как идут расчеты в деньгах, что идёт предположительно в трату лимитов итд. Там отдельный документ прям есть, в котором прописана формула.
Вывел себе в статуслайн вообще все значения, которые помогут мне понимать че происходит в конкретной сессии.
На подписках ещё сразу пишу текущее состояние лимитов в сам jsonl лог сессии чтобы потом было легко в будущем это оценивать, т.к. я в эти логи регулярно ещё смотрю и отключил их удаление совсем.

В общем, если кому-то интересно - залетайте, изучайте, разбирайте на части.

Ещё щас поотключал все mcp, т.к. они тоже засоряют контекст и это всё множится на каждый субагент дефолтный (в кастомном ты вроде можешь mcp ограничить), суммируется в снежном коме на каждое новое сообщение в чате.

В общем, контекстный менеджмент 101 блин. Пока работало и лимиты не улетали, мне в целом было пофиг, а тут че-то началось))

Upd: да, я знаю, что куча других статуслайн репозиториев есть и каждый развлекается как может. Но я постепенно нахожу проблемы и хочу разобраться в них. Ну и плюс полный контроль над тем, что у меня и как выгляди это удобно.

Репу буду постепенно обновлять, но если что-то будет интересное, буду писать сюда.
https://github.com/tim-mukhin/my-claude-code
👍42
Поделитесь реально полезными подписками в твиттере плиз

Хочу начать там тоже тусить потихоньку, а то говорят, что там вся движуха вокруг ИИшки, DX и прочих интересных мне тем, можно прям со знаковыми людьми индустнии напрямую общаться через комменты (если ответят, конечно). Мне всегда твиттер был непонятен, хотя раз в несколько лет я делал подходы к его освоению, но всегда это заканчивалось неудачно.

На Karpathy (я сказал Karpathy!) и Бориса Черного подписался. Из DX это Аби Нода, Николь Форсгрен, Адди Османи.

Буду благодарен за рекомендации и краткое описание полезности автора ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
Клод только что урезал мои лимиты в 7,5 раз при переходе на новую неделю, что в сумме дало урезание в 10 раз за прошлый месяц.

Можете поздравить меня с условным первым постом в твиттере, но, конечно, повод хреновый.

Каеф...

https://x.com/artem_mukhin_dx/status/2042798725731340658