📃 Наткнулся на статью на Хабре, где человек без бэкграунда в разработке выстроил полноценный агентный фреймворк поверх Claude Code.
Суть не в том, что он использует субагентов. Суть в том, как организован сам процесс:
👉 user-spec: агент сам проводит интервью и задаёт уточняющие вопросы
👉 tech-spec с декомпозицией на атомарные задачи
👉 каждую задачу делает отдельный агент, потом проверяет агент-ревьювер
👉 TDD обязателен — иначе агент подгоняет тесты под свои же баги
👉 project knowledge обновляется командой /done после каждой фичи
Подход резонирует с тем, что сам Anthropic рекомендует для мультиагентных систем — агенты проверяют друг друга, роли разделены, pipeline структурирован.
🐱 Исходники Claude Code плагина автора статьи на GitHub
💬 А как вы организуете работу с агентами? Делитесь в комментах.
#AI #ИИ
Суть не в том, что он использует субагентов. Суть в том, как организован сам процесс:
👉 user-spec: агент сам проводит интервью и задаёт уточняющие вопросы
👉 tech-spec с декомпозицией на атомарные задачи
👉 каждую задачу делает отдельный агент, потом проверяет агент-ревьювер
👉 TDD обязателен — иначе агент подгоняет тесты под свои же баги
👉 project knowledge обновляется командой /done после каждой фичи
Подход резонирует с тем, что сам Anthropic рекомендует для мультиагентных систем — агенты проверяют друг друга, роли разделены, pipeline структурирован.
#AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10👍7
Media is too big
VIEW IN TELEGRAM
Может сделать дизайн сайта, презентацию, визуализацию исследование и много всего. Дизайн мобильных приложений пока не заявлен, а вот очень бы хотелось делать всё не через Figma, но останется как есть пока.
Экспорт возможен в Canva, PDF, PPTX и HTML.
#Claude #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎2
Docker Sandbox - изоляция агентов на вашем компе на основе легкого Docker контейнера. Использую на всех машинах, чтобы ограничить доступ Claude Code и иметь больше контроля над доступами. Полагаться на соблюдением агентом инструкций НЕ СТОИТ
Из коробки работает с Claude Code, Codex, Copilot, Gemini, Kiro, OpenCode, Docker Agent но можно по аналогии запустить с другими CLI
Из коробки работает с Claude Code, Codex, Copilot, Gemini, Kiro, OpenCode, Docker Agent но можно по аналогии запустить с другими CLI
👍24👎5
Попробовал Claude Design - я в шоке от того как классно вышло. За 20 минут сделал весь фундамент стиля, остается только наполнить контентом и уточнить требования
👍42👎8
Механика простая: executor модель выполняет задачу, вызывает инструменты, читает результаты. Когда упирается в решение, которое не может принять самостоятельно, обращается к advisor. Advisor видит весь контекст, отдаёт план или корректировку в 400–700 токенов и executor продолжает. Всё это в одном API-запросе, без лишних раундтрипов.
В Claude Code это настраивается через /advisor: можно выбрать Opus, Sonnet или отключить. Opus как advisor для Sonnet-executor, Sonnet как advisor для Haiku-executor. Anthropic рекомендуют связку Sonnet + Opus как оптимальную по умолчанию.
По бенчмаркам: Sonnet с Opus-advisor +2.7 pp на SWE-bench Multilingual при снижении стоимости на 11.9% по сравнению с Sonnet соло. Haiku с Opus-advisor удвоил результат на BrowseComp (19.7% до 41.2%), при этом стоит на 85% дешевле Sonnet.
В Claude Code доступно через
/advisor без дополнительных настроек уже сейчас.Попробовал сам через Claude Code — advisor действительно вызывается не на каждом шаге, а именно когда агент упирается в архитектурное решение. Пауза в стриме заметная, но оценить как с ним и без мне сложно.
#claude #claudecode #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23👎6
🤯 Пока уходить с Claude Code... После релиза Opus 4.7 пошли массовые жалобы на то, как быстро сжигаются токены, и что Claude уже не позволяет выполнить те же объемы работы с разницей в месяц за те же деньги.
Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.
🔗 Сравнение Kimi 2.6 vs Opus 4.6
#AI
Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.
🔗 Сравнение Kimi 2.6 vs Opus 4.6
#AI
👍22👎3
Порекомендуйте что попробовать вместо Claude Code и их моделей для AI кодинга без IDE (вайбкодинг)
Anonymous Poll
28%
OpenAI модели
4%
Kimi 2.6
8%
GLM 5.1
4%
DeepSeek v4
5%
Qwen 3.6 Plus
2%
MiniMax M2.7
10%
Оставайся на Claude моделях
2%
Другая модель (пиши в комментарияз)
36%
Не участвую в опросе
👍5👎5
Anthropic разобрались, что именно сломалось. Оказалось не один баг и не деградация модели, а три несвязанных изменения с разными датами, каждое из которых прошло через все тесты и code review.
Второй баг вообще не воспроизводился внутри: параллельный эксперимент с отображением thinking скрывал его в большинстве CLI-сессий. Прошёл code review, unit-тесты и e2e-тесты без замечаний.
Я замечал странности в Claude Code в марте и апреле, но списывал на свои ошибки. Теперь понятно что это было - накопленный эффект трёх независимых изменений одновременно. Именно так и устроены самые неприятные баги: каждое изменение по отдельности выглядит нормально, а в сумме дают что-то, что не ловится никакими тестами.
#ClaudeCode #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👎8👍2
С 23 апреля всем подписчикам сбрасывают лимиты использования (подписка продлена НЕ будет, хотя бы было честно). Это признание того, что люди платили за инструмент, который работал хуже обещанного.
По изменениям в процессе. Большинство команды внутри использовало тестовый билд Claude Code, а не публичный — именно это и маскировало баги, которые видели внешние пользователи. Теперь переходят на точный публичный билд для внутреннего использования (а так можно было?)
Для системных промптов появится отдельный набор проверок на каждую модель перед любым изменением, новый инструментарий для аудита и другие улучшения контроля качества.
Также изменения, затрагивающие качество ответов, будут раскатываться постепенно, а не на всех сразу.
‼️ ВАЖНО: Code Review получит поддержку дополнительных репозиториев как контекста. Именно в такой расширенной конфигурации он нашёл баг при бэктесте проблемных PR — Opus 4.7 нашёл его, Opus 4.6 нет.
На X появился аккаунт @ClaudeDevs для объяснения продуктовых решений. Важные обновления будут дублироваться в треды на GitHub.
Отчёт честный, без попыток замять или переложить ответственность или замолчать. Три независимых изменения с разными графиками, каждое прошло через тесты, но в сумме дали эффект который было сложно отследить. Приятно, что компания умеет признавать свои ошибки и разбирать их публично. Теперь смотрю как будет реализовано на практике.
🔗 Источник
#ClaudeCode #AITools #Postmortem
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎4
Anthropic сбросили 5 часовой недельный лимит но в момент когда он и так сбрасывался. По сути сделали красивое заявление, но для пользователей ничего не поменялось. На огромный аппетит токенов тоже молчат... Пока не пойдет массового оттока ситуация меняться не станет. "Продолжаем пока хавают!"
👍12👎3
Чтобы вы перестали сранивать Claude и Codex за 20$ Anthropic удалили Claude Code из Pro подписки
UPD После бурной реакции от этого эксперимента отказались. Не понимаю какая разница чем тратить токены в рамках одной подписки?
#ClaudeCode
UPD После бурной реакции от этого эксперимента отказались. Не понимаю какая разница чем тратить токены в рамках одной подписки?
#ClaudeCode
👎27👍2
Каждый запрос в облачную нейронку — это отправка данных на серверы провайдера. Если у вас не self-hosted модель, альтернатив не много. Privacy Filter закрывает этот пробел: запускается локально, работает как токен-классификатор и размечает чувствительные данные до того, как они уйдут куда не надо.
Модель определяет 8 категорий:
👉 имена (private_person)
👉 адреса, email, телефоны, URL
👉 номера счётов
👉 даты
👉 секреты — токены, ключи, credentials
Запускается в браузере или на ноутбуке, контекстное окно 128k токенов. Лицензия Apache 2.0.
Я сам делал похожее в рамках своих MCP-инструментов — плагин sensitive-guard, который фильтрует данные на основе правил в стиле GitLeaks. Про то, чтобы запустить лёгкую локальную модель для той же задачи, я не думал — а решение уже готово. Буду смотреть, как это ложится на MCP-воркфлоу.
‼️ ВАЖНО: сами авторы пишут, что модель не даёт гарантий анонимизации. Это один из слоёв защиты, не единственный. На английском работает лучше всего, для других языков качество ниже.
#ai #безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎3
Как вы следите за AGENTS.md/CLAUDE.md файлами? (выбирайте утверждения что про вас)
Anonymous Poll
30%
Настроили 1 раз для проекта и всё
30%
Регулярно обновляем файлы инструкций
29%
Есть настройка в корне проекта
8%
Настроили только глобально (в папке пользователя на компе)
10%
Есть настройка в папках проекта (не в корне)
1%
Другой вариант (делись в комментариях)
27%
Не участвую в опросе
👍4👎4
О деградации качества в длинных диалогах с ИИ
При работе с моделями в рамках одной сессии иногда заметно, что к середине диалога ответы становятся менее точными: модель может повторять уже сделанное, противоречить своим более ранним решениям или терять нить многоэтапной задачи. На контексте в 1 млн токенов, такое поведение может быть заметно более явно.
Это не субъективное ощущение. В исследовании Стэнфорда «Lost in the Middle» показано, что при увеличении объёма контекста точность reasoning может падать на 15–47% независимо от заявленного размера окна. Явление называют
Практическое наблюдение: до 50–60% заполнения контекста (вот непонятно как его сичтать лучше в токенах или процентах) качество остаётся приемлемым, ближе к 75% начинаются заметные проблемы. Поэтому полезно контролировать заполнение — например, командой
Когда контекст перегружен, помогает ручное сжатие:
Но бывают ситуации, когда даже после сжатия проблема не уходит. Если вы несколько раз объяснили модели, что именно нужно исправить, а она продолжает ошибаться, значит, контекст уже засорён неудачными подходами. В этом случае
Также с целью уменьшения заполнения контекста полезно делегировать задачу субагенту, работающий со своим окном контекста, а основную сессию использовать как оркестратора для постановки задач и обработка результата.
#ИИ #AI
При работе с моделями в рамках одной сессии иногда заметно, что к середине диалога ответы становятся менее точными: модель может повторять уже сделанное, противоречить своим более ранним решениям или терять нить многоэтапной задачи. На контексте в 1 млн токенов, такое поведение может быть заметно более явно.
Это не субъективное ощущение. В исследовании Стэнфорда «Lost in the Middle» показано, что при увеличении объёма контекста точность reasoning может падать на 15–47% независимо от заявленного размера окна. Явление называют
context rot — «контекстное ухудшение».Практическое наблюдение: до 50–60% заполнения контекста (вот непонятно как его сичтать лучше в токенах или процентах) качество остаётся приемлемым, ближе к 75% начинаются заметные проблемы. Поэтому полезно контролировать заполнение — например, командой
/context.Когда контекст перегружен, помогает ручное сжатие:
/compact с явным указанием, что именно нужно сохранить (текущую цель, список изменённых файлов, принятые решения, текущую ошибку и следующие шаги), а что можно отбросить (стилистические правки, неудачные варианты промптов). НЕ полагайтесь на автоматическое сжатие (auto‑compaction) часто менее качественно, так как модель сама решает, что важно. Также в глобальные инструкции агента добавить правила что важно сохранить при compact.Но бывают ситуации, когда даже после сжатия проблема не уходит. Если вы несколько раз объяснили модели, что именно нужно исправить, а она продолжает ошибаться, значит, контекст уже засорён неудачными подходами. В этом случае
/compact может не помочь, так как сохранит неверные паттерны в сжатом виде. Делайте /clear для очистки текущей сессии и перезапуск сессии с уточнённым промптом. Отсекайте наработки предыдущей, что могут повлиять на снижение качества результата выдачи.Также с целью уменьшения заполнения контекста полезно делегировать задачу субагенту, работающий со своим окном контекста, а основную сессию использовать как оркестратора для постановки задач и обработка результата.
#ИИ #AI
👍17👎5
Media is too big
VIEW IN TELEGRAM
📺 Sloppy: как управлять армией ИИ-агентов — демо от автора
К видео прилагаю подробную расшифровку по таймингам. Автор разобрал платформу🐱 Sloppy от установки до реальной работы с агентами и проектами.
- 00:00 Первичная настройка
- 03:29 Bootstrap-чат с агентом
- 04:00 Вкладка Overview
- 04:36 Вкладка Agents
- 10:34 Создаём проект из директории на компьютере
- 15:48 Настройка команд из агентов
- 22:57 Создаём первую задачу и выполняем её
- 25:49 Интеграция чата и проектов
- 27:33 Устройство супервизора и экран настроек
- 32:46 Проектный чат
- 34:50 Что такое Swarm и как двигаются задачи
- 35:50 Прочие настройки
Будет полезно разработчикам AI, автоматизаторам, энтузиастам LLM — всем, кто хочет прозрачного и структурированного управления агентами, а не чёрного ящика.
#AI
К видео прилагаю подробную расшифровку по таймингам. Автор разобрал платформу
- 00:00 Первичная настройка
- 03:29 Bootstrap-чат с агентом
- 04:00 Вкладка Overview
- 04:36 Вкладка Agents
- 10:34 Создаём проект из директории на компьютере
- 15:48 Настройка команд из агентов
- 22:57 Создаём первую задачу и выполняем её
- 25:49 Интеграция чата и проектов
- 27:33 Устройство супервизора и экран настроек
- 32:46 Проектный чат
- 34:50 Что такое Swarm и как двигаются задачи
- 35:50 Прочие настройки
Будет полезно разработчикам AI, автоматизаторам, энтузиастам LLM — всем, кто хочет прозрачного и структурированного управления агентами, а не чёрного ящика.
#AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎3