На днях всплыл вопрос: Правда ли, что Claude Code буквально штрафует за отключение телеметрии??
Если её отключить, Anthropic сокращает время жизни кеша с 1 часа до 5 минут.
Получается, в Claude Code при отключённой телеметрии ты платишь примерно 12-кратным падением производительности?
Ответ от Бориса Черни:
Документация: https://platform.claude.com/docs/en/build-with-claude/prompt-caching#pricing
Если её отключить, Anthropic сокращает время жизни кеша с 1 часа до 5 минут.
Получается, в Claude Code при отключённой телеметрии ты платишь примерно 12-кратным падением производительности?
Ответ от Бориса Черни:
Кеш промптов на 1 час на самом деле устроен сложнее. Запись в кеш стоит дороже, чтение из кеша — дешевле. Выигрыш от дешёвых чтений зависит от паттерна использования: размер контекстного окна, основной агент или сабагент и т.д.
Мы тестируем разные эвристики, чтобы повысить долю попаданий в кеш у подписчиков. Это снижает расход токенов и задержки, если работает, но эффект нестабильный из-за описанных нюансов. Например, если включён кеш на 1 час, но агент сделал один запрос, кеш бесполезен и фактически приводит к лишним затратам.
Сейчас кеш на 1 час включён по умолчанию в ряде сценариев, где это даёт оптимизацию под реальные паттерны использования. При этом для многих запросов остаётся 5 минут (например, сабагенты, которые редко переиспользуются, и платить за час кеша там невыгодно). Для клиентов через API режим на 1 час пока не включён по умолчанию — нужно больше тестирования, чтобы убедиться, что это даёт выигрыш в среднем.
Отдельно: для таких экспериментов используются флаги, которые кешируются на стороне клиента. При отключённой телеметрии эти флаги тоже отключаются — клиент не обращается к серверу и используется значение по умолчанию, сейчас это 5 минут. В ближайшее время дефолт на клиенте поменяют на 1 час для части запросов, где уже видно небольшой выигрыш по токенам. Также появятся переменные окружения, чтобы принудительно задать 1 час или 5 минут.
В любом случае экономия токенов далека от 12×. Это небольшой, но постепенный прирост эффективности, который раскатывается на всех.
Документация: https://platform.claude.com/docs/en/build-with-claude/prompt-caching#pricing
Vercel также выпустили опенсорс платформу хостинга агентов: open-agents.
Протестировал - уровень зрелости высокий, под внутреннюю доработку в корпоративных сценариях заходит без проблем.
Как и ожидалось, у Vercel агенты не изолированы в песочнице.
Протестировал - уровень зрелости высокий, под внутреннюю доработку в корпоративных сценариях заходит без проблем.
Как и ожидалось, у Vercel агенты не изолированы в песочнице.
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code получил редизайн на десктопе.
Теперь можно запускать несколько сессий Claude параллельно в одном окне, с новой боковой панелью для управления ими.
Редизайн также добавляет встроенный терминал, редактирование файлов, предпросмотр HTML и PDF, а также более быстрый просмотр диффов — всё это в интерфейсе с поддержкой drag-and-drop, который можно настроить под себя.
Ваши плагины для CLI работают точно так же, как и в командной строке.
Теперь можно запускать несколько сессий Claude параллельно в одном окне, с новой боковой панелью для управления ими.
Редизайн также добавляет встроенный терминал, редактирование файлов, предпросмотр HTML и PDF, а также более быстрый просмотр диффов — всё это в интерфейсе с поддержкой drag-and-drop, который можно настроить под себя.
Ваши плагины для CLI работают точно так же, как и в командной строке.
2
Определяй функции на обычном языке и запускай их локально: PAW
PAW компилирует спецификации на естественном языке в компактные нейронные программы. После компиляции они работают как обычные Python-функции (без интернета, без внешнего сервиса, без оплаты за вызовы).
Нейронная программа объединяет дискретный текст и непрерывную LoRA для адаптации фиксированного интерпретатора.
Подходит для нечетких задач: триаж по срочности, починка сломанного JSON, фильтрация логов, роутинг инструментов.
Хорошо сочетается с код-агентами: http://programasweights.com/agents
Интерпретатор — предобученный Qwen3 0.6B, без модификаций. Вся адаптация под задачи происходит через скомпилированную нейронную программу.
На FuzzyBench: 73.4% точности против 9.8% у прямого промпт-инжиниринга той же 0.6B. Даже Qwen3 32B даёт только 68.7%.
Их интерпретатор на базе GPT-2 — всего 124M параметров, достаточно компактный, чтобы полностью работать в браузере через WebAssembly.
Скачиваешь базовую модель ~134 МБ один раз, затем каждая нейронная программа занимает ~5 МБ. Сервер для инференса не нужен.
python:
js:
PAW компилирует спецификации на естественном языке в компактные нейронные программы. После компиляции они работают как обычные Python-функции (без интернета, без внешнего сервиса, без оплаты за вызовы).
Нейронная программа объединяет дискретный текст и непрерывную LoRA для адаптации фиксированного интерпретатора.
Подходит для нечетких задач: триаж по срочности, починка сломанного JSON, фильтрация логов, роутинг инструментов.
Хорошо сочетается с код-агентами: http://programasweights.com/agents
Интерпретатор — предобученный Qwen3 0.6B, без модификаций. Вся адаптация под задачи происходит через скомпилированную нейронную программу.
На FuzzyBench: 73.4% точности против 9.8% у прямого промпт-инжиниринга той же 0.6B. Даже Qwen3 32B даёт только 68.7%.
Их интерпретатор на базе GPT-2 — всего 124M параметров, достаточно компактный, чтобы полностью работать в браузере через WebAssembly.
Скачиваешь базовую модель ~134 МБ один раз, затем каждая нейронная программа занимает ~5 МБ. Сервер для инференса не нужен.
python:
pip install programasweightsjs:
npm install @programasweights/webPlease open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
На днях кто-то релизнул новую IDE для вайбкодинга, в которой теперь можно генерить код, картинки, видео, музыку. Всё в одном месте
Под капотом — 40+ моделей: claude-opus-4.6, gpt-5.4, grok-4, Flux2 Pro, Suno, ElevenLabs, VEO3. Можно выбрать модель вручную или автоматически.
Что внутри:
- Генерация изображений и видео: 15+ режимов, включая inpaint, ipadapter, спрайты
- Музыка и саунд-эффекты прямо из IDE
- Деплой одной кнопкой
- IDE с AI, RAG по всему проекту, дебаггер, автофикс при запуске
13 агентов сами делегируют задачи друг другу для наилучшего результата.
Затестить можно здесь - quadcode.ai
Под капотом — 40+ моделей: claude-opus-4.6, gpt-5.4, grok-4, Flux2 Pro, Suno, ElevenLabs, VEO3. Можно выбрать модель вручную или автоматически.
Что внутри:
- Генерация изображений и видео: 15+ режимов, включая inpaint, ipadapter, спрайты
- Музыка и саунд-эффекты прямо из IDE
- Деплой одной кнопкой
- IDE с AI, RAG по всему проекту, дебаггер, автофикс при запуске
13 агентов сами делегируют задачи друг другу для наилучшего результата.
Затестить можно здесь - quadcode.ai
Дают 500 кредов ранним юзерам, промокод QC14
This media is not supported in your browser
VIEW IN TELEGRAM
Появилась открытая альтернатива ElevenLabs с открытыми весами.
Voxtral — модель синтеза речи (текст-в-речь) от Mistral:
- всего 4 млрд параметров
- задержка 70 мс для голосовых агентов
- клонирование голоса по 3 секундам аудио
- 9 языков + кросс-языковой перенос
- 68.4% побед по сравнению с ElevenLabs Flash v2.5
Открытые веса доступны на Hugging Face.
Voxtral — модель синтеза речи (текст-в-речь) от Mistral:
- всего 4 млрд параметров
- задержка 70 мс для голосовых агентов
- клонирование голоса по 3 секундам аудио
- 9 языков + кросс-языковой перенос
- 68.4% побед по сравнению с ElevenLabs Flash v2.5
Открытые веса доступны на Hugging Face.
This media is not supported in your browser
VIEW IN TELEGRAM
В Claude Code появились: рутины (в превью)
Настраиваешь рутину один раз (промпт, репозиторий и коннекторы), и она может запускаться по расписанию, через вызов API или в ответ на событие.
Рутины выполняются в веб-инфраструктуре Anthropic, поэтому не нужно держать ноутбук включённым.
У каждой рутины есть собственная точка API, так что можно направлять алерты, хуки деплоя или внутренние инструменты напрямую в Claude. Попробуй отправить алерт-пейлоад и попросить найти владеющий сервис и запостить триаж-саммари в #oncall.
Сделай POST-запрос с сообщением и получи в ответ URL сессии.
Webhook-рутины подписываются на события GitHub и позволяют Claude реагировать на них по мере поступления. Можно подключить такую к репозиторию и попросить отмечать любые PR, которые затрагивают /auth-provider, и постить саммари в #auth-changes.
Скоро появятся дополнительные источники событий.
Рутины по расписанию позволяют задать периодичность и не возвращаться к задаче. Можно настроить, чтобы каждую ночь в 2:00 Claude брал топовый баг из Linear, пытался его исправить и открывал draft PR.
Если ты использовал
Доступно уже сейчас на всех платных планах при включённом Claude Code в вебе.🤔
Настраиваешь рутину один раз (промпт, репозиторий и коннекторы), и она может запускаться по расписанию, через вызов API или в ответ на событие.
Рутины выполняются в веб-инфраструктуре Anthropic, поэтому не нужно держать ноутбук включённым.
У каждой рутины есть собственная точка API, так что можно направлять алерты, хуки деплоя или внутренние инструменты напрямую в Claude. Попробуй отправить алерт-пейлоад и попросить найти владеющий сервис и запостить триаж-саммари в #oncall.
Сделай POST-запрос с сообщением и получи в ответ URL сессии.
Webhook-рутины подписываются на события GitHub и позволяют Claude реагировать на них по мере поступления. Можно подключить такую к репозиторию и попросить отмечать любые PR, которые затрагивают /auth-provider, и постить саммари в #auth-changes.
Скоро появятся дополнительные источники событий.
Рутины по расписанию позволяют задать периодичность и не возвращаться к задаче. Можно настроить, чтобы каждую ночь в 2:00 Claude брал топовый баг из Linear, пытался его исправить и открывал draft PR.
Если ты использовал
/schedule в CLI, теперь это рутины, ничего мигрировать не нужно.Доступно уже сейчас на всех платных планах при включённом Claude Code в вебе.
Please open Telegram to view this post
VIEW IN TELEGRAM
Демо день Рег.облака — 16 апреля
Главная продуктовая конференция облачного и Bare Metal направления Рег.ру состоится в Центре событий РБК в Москве. Среди тем — актуальные сценарии масштабирования инфраструктуры, перспективы ИИ для бизнеса, облака 152-ФЗ, Terraform, и вообще — какие эффективные способы снизить издержки на IT существуют в 2026 году. Среди гостей — эксперты из X5 Tech, банка Синара, СОГАЗа и РБК.
Участие бесплатное, но надо зарегистрироваться, количество мест ограничено. Регистрация и другие подробности — вот здесь: https://demoday.reg.cloud/
Главная продуктовая конференция облачного и Bare Metal направления Рег.ру состоится в Центре событий РБК в Москве. Среди тем — актуальные сценарии масштабирования инфраструктуры, перспективы ИИ для бизнеса, облака 152-ФЗ, Terraform, и вообще — какие эффективные способы снизить издержки на IT существуют в 2026 году. Среди гостей — эксперты из X5 Tech, банка Синара, СОГАЗа и РБК.
Участие бесплатное, но надо зарегистрироваться, количество мест ограничено. Регистрация и другие подробности — вот здесь: https://demoday.reg.cloud/
This media is not supported in your browser
VIEW IN TELEGRAM
Кто-то собрал скилл «nothing design» для Claude Code.
Просто вызываешь
Швейцарская типографика, матричные паттерны и глубокий OLED-чёрный — всё зашито прямо в агент.
Просто вызываешь
/nothing-design, и он генерирует весь UI в фирменном монохромном индустриальном стиле.Швейцарская типографика, матричные паттерны и глубокий OLED-чёрный — всё зашито прямо в агент.
This media is not supported in your browser
VIEW IN TELEGRAM
Называется Decepticon — система из 5 ИИ-агентов, названных в стиле трансформеров.
Задаёшь целевой IP, и дальше платформа внутри изолированной Kali-среды сама проводит весь сценарий: разведку, поиск уязвимостей, эксплуатацию, закрепление, сбор учётных данных и латеральное перемещение.
Без участия человека в цикле. Опенсорс.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
LLM-база знаний → слайды
После поста Karpathy (про свой сетап LLM Knowledge Base) стало понятно: вики удобно хранить, но неудобно показывать. Нужен быстрый способ превращать это в презентации.
Один чувак сделал простой пайплайн: вики с AI-статьями (1000+ работ, 20 тем) автоматически уходит в Gamma и превращается в слайды.
Флоу: Obsidian → Gamma MCP → сразу предпросмотр в дашборде.
Одна команда агенту и он сам берёт нужные статьи, прогоняет через Gamma и отдаёт готовую презентацию.
Подключаешь коннектор Gamma к Claude , и у агента появляется доступ к инструментам генерации.
Оркестрация через Claude Agent SDK, с встраиванием результата через iframe.
После поста Karpathy (про свой сетап LLM Knowledge Base) стало понятно: вики удобно хранить, но неудобно показывать. Нужен быстрый способ превращать это в презентации.
Один чувак сделал простой пайплайн: вики с AI-статьями (1000+ работ, 20 тем) автоматически уходит в Gamma и превращается в слайды.
Флоу: Obsidian → Gamma MCP → сразу предпросмотр в дашборде.
Одна команда агенту и он сам берёт нужные статьи, прогоняет через Gamma и отдаёт готовую презентацию.
Подключаешь коннектор Gamma к Claude , и у агента появляется доступ к инструментам генерации.
Оркестрация через Claude Agent SDK, с встраиванием результата через iframe.
This media is not supported in your browser
VIEW IN TELEGRAM
Нашёл новую игрушку в Claude Code
Одной командой можно разобрать любой Android APK до последнего слоя:
Что умеет:
Грубо говоря, ИИ может сгенерировать полную API-документацию любого приложения за 5 минут.
Для ресёрча безопасности / анализа конкурентов / изучения реверс-инжиниринга — самое то🔮
https://github.com/SimoneAvogadro/android-reverse-engineering-skill
Одной командой можно разобрать любой Android APK до последнего слоя:
/decompile app.apk
Что умеет:
→ Декомпилирует APK / XAPK / JAR / AAR → автоматически извлекает все интерфейсы Retrofit, вызовы OkHttp, скрытые URL
→ Трассирует полный чейн вызовов: Activity → ViewModel → Repository → HTTP
→ Анализ в один клик: Manifest, архитектурные паттерны → справляется даже с кодом, обфусцированным через ProGuard/R8
Грубо говоря, ИИ может сгенерировать полную API-документацию любого приложения за 5 минут.
Для ресёрча безопасности / анализа конкурентов / изучения реверс-инжиниринга — самое то
https://github.com/SimoneAvogadro/android-reverse-engineering-skill
Please open Telegram to view this post
VIEW IN TELEGRAM