Механика простая: executor модель выполняет задачу, вызывает инструменты, читает результаты. Когда упирается в решение, которое не может принять самостоятельно, обращается к advisor. Advisor видит весь контекст, отдаёт план или корректировку в 400–700 токенов и executor продолжает. Всё это в одном API-запросе, без лишних раундтрипов.
В Claude Code это настраивается через /advisor: можно выбрать Opus, Sonnet или отключить. Opus как advisor для Sonnet-executor, Sonnet как advisor для Haiku-executor. Anthropic рекомендуют связку Sonnet + Opus как оптимальную по умолчанию.
По бенчмаркам: Sonnet с Opus-advisor +2.7 pp на SWE-bench Multilingual при снижении стоимости на 11.9% по сравнению с Sonnet соло. Haiku с Opus-advisor удвоил результат на BrowseComp (19.7% до 41.2%), при этом стоит на 85% дешевле Sonnet.
В Claude Code доступно через
/advisor без дополнительных настроек уже сейчас.Попробовал сам через Claude Code — advisor действительно вызывается не на каждом шаге, а именно когда агент упирается в архитектурное решение. Пауза в стриме заметная, но оценить как с ним и без мне сложно.
#claude #claudecode #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23👎6
🤯 Пока уходить с Claude Code... После релиза Opus 4.7 пошли массовые жалобы на то, как быстро сжигаются токены, и что Claude уже не позволяет выполнить те же объемы работы с разницей в месяц за те же деньги.
Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.
🔗 Сравнение Kimi 2.6 vs Opus 4.6
#AI
Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.
🔗 Сравнение Kimi 2.6 vs Opus 4.6
#AI
👍22👎3
Порекомендуйте что попробовать вместо Claude Code и их моделей для AI кодинга без IDE (вайбкодинг)
Anonymous Poll
28%
OpenAI модели
4%
Kimi 2.6
8%
GLM 5.1
4%
DeepSeek v4
5%
Qwen 3.6 Plus
2%
MiniMax M2.7
10%
Оставайся на Claude моделях
2%
Другая модель (пиши в комментарияз)
36%
Не участвую в опросе
👍5👎5
Anthropic разобрались, что именно сломалось. Оказалось не один баг и не деградация модели, а три несвязанных изменения с разными датами, каждое из которых прошло через все тесты и code review.
Второй баг вообще не воспроизводился внутри: параллельный эксперимент с отображением thinking скрывал его в большинстве CLI-сессий. Прошёл code review, unit-тесты и e2e-тесты без замечаний.
Я замечал странности в Claude Code в марте и апреле, но списывал на свои ошибки. Теперь понятно что это было - накопленный эффект трёх независимых изменений одновременно. Именно так и устроены самые неприятные баги: каждое изменение по отдельности выглядит нормально, а в сумме дают что-то, что не ловится никакими тестами.
#ClaudeCode #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👎8👍2
С 23 апреля всем подписчикам сбрасывают лимиты использования (подписка продлена НЕ будет, хотя бы было честно). Это признание того, что люди платили за инструмент, который работал хуже обещанного.
По изменениям в процессе. Большинство команды внутри использовало тестовый билд Claude Code, а не публичный — именно это и маскировало баги, которые видели внешние пользователи. Теперь переходят на точный публичный билд для внутреннего использования (а так можно было?)
Для системных промптов появится отдельный набор проверок на каждую модель перед любым изменением, новый инструментарий для аудита и другие улучшения контроля качества.
Также изменения, затрагивающие качество ответов, будут раскатываться постепенно, а не на всех сразу.
‼️ ВАЖНО: Code Review получит поддержку дополнительных репозиториев как контекста. Именно в такой расширенной конфигурации он нашёл баг при бэктесте проблемных PR — Opus 4.7 нашёл его, Opus 4.6 нет.
На X появился аккаунт @ClaudeDevs для объяснения продуктовых решений. Важные обновления будут дублироваться в треды на GitHub.
Отчёт честный, без попыток замять или переложить ответственность или замолчать. Три независимых изменения с разными графиками, каждое прошло через тесты, но в сумме дали эффект который было сложно отследить. Приятно, что компания умеет признавать свои ошибки и разбирать их публично. Теперь смотрю как будет реализовано на практике.
🔗 Источник
#ClaudeCode #AITools #Postmortem
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎4
Anthropic сбросили 5 часовой недельный лимит но в момент когда он и так сбрасывался. По сути сделали красивое заявление, но для пользователей ничего не поменялось. На огромный аппетит токенов тоже молчат... Пока не пойдет массового оттока ситуация меняться не станет. "Продолжаем пока хавают!"
👍12👎3
Чтобы вы перестали сранивать Claude и Codex за 20$ Anthropic удалили Claude Code из Pro подписки
UPD После бурной реакции от этого эксперимента отказались. Не понимаю какая разница чем тратить токены в рамках одной подписки?
#ClaudeCode
UPD После бурной реакции от этого эксперимента отказались. Не понимаю какая разница чем тратить токены в рамках одной подписки?
#ClaudeCode
👎27👍2
Каждый запрос в облачную нейронку — это отправка данных на серверы провайдера. Если у вас не self-hosted модель, альтернатив не много. Privacy Filter закрывает этот пробел: запускается локально, работает как токен-классификатор и размечает чувствительные данные до того, как они уйдут куда не надо.
Модель определяет 8 категорий:
👉 имена (private_person)
👉 адреса, email, телефоны, URL
👉 номера счётов
👉 даты
👉 секреты — токены, ключи, credentials
Запускается в браузере или на ноутбуке, контекстное окно 128k токенов. Лицензия Apache 2.0.
Я сам делал похожее в рамках своих MCP-инструментов — плагин sensitive-guard, который фильтрует данные на основе правил в стиле GitLeaks. Про то, чтобы запустить лёгкую локальную модель для той же задачи, я не думал — а решение уже готово. Буду смотреть, как это ложится на MCP-воркфлоу.
‼️ ВАЖНО: сами авторы пишут, что модель не даёт гарантий анонимизации. Это один из слоёв защиты, не единственный. На английском работает лучше всего, для других языков качество ниже.
#ai #безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎3
Как вы следите за AGENTS.md/CLAUDE.md файлами? (выбирайте утверждения что про вас)
Anonymous Poll
30%
Настроили 1 раз для проекта и всё
30%
Регулярно обновляем файлы инструкций
29%
Есть настройка в корне проекта
8%
Настроили только глобально (в папке пользователя на компе)
10%
Есть настройка в папках проекта (не в корне)
1%
Другой вариант (делись в комментариях)
27%
Не участвую в опросе
👍4👎4
О деградации качества в длинных диалогах с ИИ
При работе с моделями в рамках одной сессии иногда заметно, что к середине диалога ответы становятся менее точными: модель может повторять уже сделанное, противоречить своим более ранним решениям или терять нить многоэтапной задачи. На контексте в 1 млн токенов, такое поведение может быть заметно более явно.
Это не субъективное ощущение. В исследовании Стэнфорда «Lost in the Middle» показано, что при увеличении объёма контекста точность reasoning может падать на 15–47% независимо от заявленного размера окна. Явление называют
Практическое наблюдение: до 50–60% заполнения контекста (вот непонятно как его сичтать лучше в токенах или процентах) качество остаётся приемлемым, ближе к 75% начинаются заметные проблемы. Поэтому полезно контролировать заполнение — например, командой
Когда контекст перегружен, помогает ручное сжатие:
Но бывают ситуации, когда даже после сжатия проблема не уходит. Если вы несколько раз объяснили модели, что именно нужно исправить, а она продолжает ошибаться, значит, контекст уже засорён неудачными подходами. В этом случае
Также с целью уменьшения заполнения контекста полезно делегировать задачу субагенту, работающий со своим окном контекста, а основную сессию использовать как оркестратора для постановки задач и обработка результата.
#ИИ #AI
При работе с моделями в рамках одной сессии иногда заметно, что к середине диалога ответы становятся менее точными: модель может повторять уже сделанное, противоречить своим более ранним решениям или терять нить многоэтапной задачи. На контексте в 1 млн токенов, такое поведение может быть заметно более явно.
Это не субъективное ощущение. В исследовании Стэнфорда «Lost in the Middle» показано, что при увеличении объёма контекста точность reasoning может падать на 15–47% независимо от заявленного размера окна. Явление называют
context rot — «контекстное ухудшение».Практическое наблюдение: до 50–60% заполнения контекста (вот непонятно как его сичтать лучше в токенах или процентах) качество остаётся приемлемым, ближе к 75% начинаются заметные проблемы. Поэтому полезно контролировать заполнение — например, командой
/context.Когда контекст перегружен, помогает ручное сжатие:
/compact с явным указанием, что именно нужно сохранить (текущую цель, список изменённых файлов, принятые решения, текущую ошибку и следующие шаги), а что можно отбросить (стилистические правки, неудачные варианты промптов). НЕ полагайтесь на автоматическое сжатие (auto‑compaction) часто менее качественно, так как модель сама решает, что важно. Также в глобальные инструкции агента добавить правила что важно сохранить при compact.Но бывают ситуации, когда даже после сжатия проблема не уходит. Если вы несколько раз объяснили модели, что именно нужно исправить, а она продолжает ошибаться, значит, контекст уже засорён неудачными подходами. В этом случае
/compact может не помочь, так как сохранит неверные паттерны в сжатом виде. Делайте /clear для очистки текущей сессии и перезапуск сессии с уточнённым промптом. Отсекайте наработки предыдущей, что могут повлиять на снижение качества результата выдачи.Также с целью уменьшения заполнения контекста полезно делегировать задачу субагенту, работающий со своим окном контекста, а основную сессию использовать как оркестратора для постановки задач и обработка результата.
#ИИ #AI
👍17👎5
Media is too big
VIEW IN TELEGRAM
📺 Sloppy: как управлять армией ИИ-агентов — демо от автора
К видео прилагаю подробную расшифровку по таймингам. Автор разобрал платформу🐱 Sloppy от установки до реальной работы с агентами и проектами.
- 00:00 Первичная настройка
- 03:29 Bootstrap-чат с агентом
- 04:00 Вкладка Overview
- 04:36 Вкладка Agents
- 10:34 Создаём проект из директории на компьютере
- 15:48 Настройка команд из агентов
- 22:57 Создаём первую задачу и выполняем её
- 25:49 Интеграция чата и проектов
- 27:33 Устройство супервизора и экран настроек
- 32:46 Проектный чат
- 34:50 Что такое Swarm и как двигаются задачи
- 35:50 Прочие настройки
Будет полезно разработчикам AI, автоматизаторам, энтузиастам LLM — всем, кто хочет прозрачного и структурированного управления агентами, а не чёрного ящика.
#AI
К видео прилагаю подробную расшифровку по таймингам. Автор разобрал платформу
- 00:00 Первичная настройка
- 03:29 Bootstrap-чат с агентом
- 04:00 Вкладка Overview
- 04:36 Вкладка Agents
- 10:34 Создаём проект из директории на компьютере
- 15:48 Настройка команд из агентов
- 22:57 Создаём первую задачу и выполняем её
- 25:49 Интеграция чата и проектов
- 27:33 Устройство супервизора и экран настроек
- 32:46 Проектный чат
- 34:50 Что такое Swarm и как двигаются задачи
- 35:50 Прочие настройки
Будет полезно разработчикам AI, автоматизаторам, энтузиастам LLM — всем, кто хочет прозрачного и структурированного управления агентами, а не чёрного ящика.
#AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎3
Forwarded from Android Broadcast
C начала 2026 года я активно сел изучать практическим путем решения задач в проектах и также создания новых идей. Много неудач, проб заново, изменяя подход, и первые результаты. Всё это я освещаю на Boosty в виде дневника.
Все видео погружения я выкладываю на
P.S. Cкоро уже начну делать стримы/видео на Boosty чтобы показывать вживую Videcoding т.к. уже получил достаточный навык.
#AndroidBroadcast
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎7
This media is not supported in your browser
VIEW IN TELEGRAM
Builder - кодинг агент в CLI поверх моделей OpenAI, который значительно прокачивает опыт после Codex. Автор - @nek.12
После использования Codex автор понял как много там сделано поверхностно и допили разные аспекты. Подробнее в блоге автора
#AI #Codex
После использования Codex автор понял как много там сделано поверхностно и допили разные аспекты. Подробнее в блоге автора
#AI #Codex
👎16👍10
Это набор навыков, которые загружаются в Claude Code, Gemini или Android Studio Agent Mode. Они дают AI строгие правила диагностики и правки лагов в Compose: стабильность, рекомпозиции, LazyColumn, модификаторы и эффекты.
Никакой магии — просто проверенные гайды на основе документации и опыта топ-разработчиков.
Как использовать: скопируйте нужный SKILL.md в папку со скилами и спросите у AI, почему тормозит скролл. Он будет знать, что делать.
#Compose #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52👎3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19👎3
🤖 Как ИИ закрыл 5-летний iOS-техдолг за 2 месяца
🤯 Команда Яндекс Браузера за 2 месяца переписала на Swift то, что вручную тянули 5 лет. 97,5 тысяч строк, 2000+ файлов, 106 pull request'ов. Ускорение в 2.5 раза против ручной миграции (интересно как считали).
Тулкит выложили под Apache 2.0.🐱 Migration Toolkit for Swift — это набор Jinja-шаблонов и Python-скрипта setup_migration_rules.py, который из заполненного rules.md генерирует 4 готовых промпта под конкретный проект.
В rules.md около десятка макросов под специфику любого репо: префиксы ObjC-классов для ренейминга, маппинг ObjC→Swift, code style, инструкции для билд-системы (BUILD.gn, Bazel, Xcode), типичные ошибки компиляции с решениями, правила удаления @objc. В репозитории сразу лежат два готовых конфига как примеры: yandex-browser и wikipedia.
Качество обеспечивается тремя слоями. После каждой конверсии гоняется компиляция и тесты, при ошибках LLM итерирует сама. Отдельный промпт integration-tests.md пишет интеграционные тесты на мигрированный модуль. И комментарии ревьюеров с PR подаются обратно в LLM, она сама правит мелочи вроде форматирования и нейминга. Финальная валидация остаётся за разработчиком, но рутину забирает на себя.
Очень крутой пример того, что нейросеть при правильном подходе реально способна разгрести большой техдолг, а не снести кодбейс к чертям, как принято стращать в твиттере. Чёткий пайплайн, жёсткие рамки и автоматическая валидация через компиляцию и тесты, и LLM становится инструментом, а не лотереей. Точно хочу попробовать такой же подход для Android-миграций.
🔗 Статья на Хабре
🐱 GitHub репо
#AI #iOS #Swift #Яндекс
🤯 Команда Яндекс Браузера за 2 месяца переписала на Swift то, что вручную тянули 5 лет. 97,5 тысяч строк, 2000+ файлов, 106 pull request'ов. Ускорение в 2.5 раза против ручной миграции (интересно как считали).
Тулкит выложили под Apache 2.0.
В rules.md около десятка макросов под специфику любого репо: префиксы ObjC-классов для ренейминга, маппинг ObjC→Swift, code style, инструкции для билд-системы (BUILD.gn, Bazel, Xcode), типичные ошибки компиляции с решениями, правила удаления @objc. В репозитории сразу лежат два готовых конфига как примеры: yandex-browser и wikipedia.
Качество обеспечивается тремя слоями. После каждой конверсии гоняется компиляция и тесты, при ошибках LLM итерирует сама. Отдельный промпт integration-tests.md пишет интеграционные тесты на мигрированный модуль. И комментарии ревьюеров с PR подаются обратно в LLM, она сама правит мелочи вроде форматирования и нейминга. Финальная валидация остаётся за разработчиком, но рутину забирает на себя.
Очень крутой пример того, что нейросеть при правильном подходе реально способна разгрести большой техдолг, а не снести кодбейс к чертям, как принято стращать в твиттере. Чёткий пайплайн, жёсткие рамки и автоматическая валидация через компиляцию и тесты, и LLM становится инструментом, а не лотереей. Точно хочу попробовать такой же подход для Android-миграций.
🔗 Статья на Хабре
#AI #iOS #Swift #Яндекс
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37👎2
This media is not supported in your browser
VIEW IN TELEGRAM
После каждого хода условие завершение проверяет небольшая быстрая модель (по умолчанию Haiku). Когда условие не выполнено, стартует новый раунд с подсказкой, что именно ещё не так.
Можно решать задачи которые имеют четки критерий окончания. Например:
👉 миграция модуля на новое API пока все вызовы не скомпилируются и тесты не пройдут
👉 разбор очереди issue по лейблу до пустого списка
👉 Покрытие кода тестами, пока не будет достигнут заданный coverage
Работает в non-interactive режиме через флаг -p, переживает --resume сессии, можно ограничить количество turns прямо в тексте условия фразой типа «or stop after 20 turns». Условие допускает до 4000 символов, так что можно затолкать туда полноценные "acceptance criteria".
Фактически из коробки получаешь готовый флоу для реализации фичи с проверкой критериев приёмки. То что раньше городил сам через stop-хуки или скрипты, теперь делается одной командой на сессию. Но это не убирает настройку MCP и окружения для самих проверок: /goal судит по тому, что Claude вывел в чат, и без рабочих тестов, линтера и сборки проверять ему будет нечего.
🔗 Документация
#claudecode #ai #agents #devtools
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19👎2
Пу-пу-пуу новость - Claude не даёт регистрироваться новым пользователям. Проблемы со скоростью и стабильностью работы, новые правила лимитов с 15 июня все больше и больше заставляют меня задуматься о смене AI агента, а альтернатива в той же лиге качества одна
#AI #ИИ #Anthropic #Claude
#AI #ИИ #Anthropic #Claude
👎12👍4