Claude AI Dev Broadcast
2.06K subscribers
98 photos
9 videos
91 links
Всё про разработку с использованием IT технологий
Download Telegram
📃 Наткнулся на статью на Хабре, где человек без бэкграунда в разработке выстроил полноценный агентный фреймворк поверх Claude Code.

Суть не в том, что он использует субагентов. Суть в том, как организован сам процесс:
👉 user-spec: агент сам проводит интервью и задаёт уточняющие вопросы
👉 tech-spec с декомпозицией на атомарные задачи
👉 каждую задачу делает отдельный агент, потом проверяет агент-ревьювер
👉 TDD обязателен — иначе агент подгоняет тесты под свои же баги
👉 project knowledge обновляется командой /done после каждой фичи

Подход резонирует с тем, что сам Anthropic рекомендует для мультиагентных систем — агенты проверяют друг друга, роли разделены, pipeline структурирован.

🐱 Исходники Claude Code плагина автора статьи на GitHub

💬 А как вы организуете работу с агентами? Делитесь в комментах.

#AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10👍7
🧠 Король умер, да здравствует король! Вышла модель Opus 4.7, которая превосходит всех конкурентов и ближайших соперников в программировании по результатам тестов. Но есть что-то ещё круче — Mythos, доступ к которой пока ограничен узким кругом избранных компаний. Ну что, попробуем?

#Claude #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎5
Media is too big
VIEW IN TELEGRAM
🧠 Убийца Figma от Claude Code - Design. С помощью ИИ генерите базу и дальше редактируете свойства и дополняете промптами

Может сделать дизайн сайта, презентацию, визуализацию исследование и много всего. Дизайн мобильных приложений пока не заявлен, а вот очень бы хотелось делать всё не через Figma, но останется как есть пока.

Экспорт возможен в Canva, PDF, PPTX и HTML.

#Claude #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎2
Docker Sandbox - изоляция агентов на вашем компе на основе легкого Docker контейнера. Использую на всех машинах, чтобы ограничить доступ Claude Code и иметь больше контроля над доступами. Полагаться на соблюдением агентом инструкций НЕ СТОИТ

Из коробки работает с Claude Code, Codex, Copilot, Gemini, Kiro, OpenCode, Docker Agent но можно по аналогии запустить с другими CLI
👍24👎5
Попробовал Claude Design - я в шоке от того как классно вышло. За 20 минут сделал весь фундамент стиля, остается только наполнить контентом и уточнить требования
👍42👎8
🧠 Anthropic добавили в Claude Code команду /advisor и инструмент Advisor для API. Идея в том, что вместо одной дорогой модели на всё, можно поставить дешёвую как executor и дорогую как advisor, который подключается только в нужный момент.

Механика простая: executor модель выполняет задачу, вызывает инструменты, читает результаты. Когда упирается в решение, которое не может принять самостоятельно, обращается к advisor. Advisor видит весь контекст, отдаёт план или корректировку в 400–700 токенов и executor продолжает. Всё это в одном API-запросе, без лишних раундтрипов.

В Claude Code это настраивается через /advisor: можно выбрать Opus, Sonnet или отключить. Opus как advisor для Sonnet-executor, Sonnet как advisor для Haiku-executor. Anthropic рекомендуют связку Sonnet + Opus как оптимальную по умолчанию.

По бенчмаркам: Sonnet с Opus-advisor +2.7 pp на SWE-bench Multilingual при снижении стоимости на 11.9% по сравнению с Sonnet соло. Haiku с Opus-advisor удвоил результат на BrowseComp (19.7% до 41.2%), при этом стоит на 85% дешевле Sonnet.

В Claude Code доступно через /advisor без дополнительных настроек уже сейчас.

Попробовал сам через Claude Code — advisor действительно вызывается не на каждом шаге, а именно когда агент упирается в архитектурное решение. Пауза в стриме заметная, но оценить как с ним и без мне сложно.

#claude #claudecode #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23👎6
🤯 Пока уходить с Claude Code... После релиза Opus 4.7 пошли массовые жалобы на то, как быстро сжигаются токены, и что Claude уже не позволяет выполнить те же объемы работы с разницей в месяц за те же деньги.

Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.

🔗 Сравнение Kimi 2.6 vs Opus 4.6

#AI
👍22👎3
Порекомендуйте что попробовать вместо Claude Code и их моделей для AI кодинга без IDE (вайбкодинг)
Anonymous Poll
28%
OpenAI модели
4%
Kimi 2.6
8%
GLM 5.1
4%
DeepSeek v4
5%
Qwen 3.6 Plus
2%
MiniMax M2.7
10%
Оставайся на Claude моделях
2%
Другая модель (пиши в комментарияз)
36%
Не участвую в опросе
👍5👎5
🧠 Три независимых изменения за один месяц — вот откуда шли жалобы на Claude Code

Anthropic разобрались, что именно сломалось. Оказалось не один баг и не деградация модели, а три несвязанных изменения с разными датами, каждое из которых прошло через все тесты и code review.

1️⃣ 4 марта reasoning effort по умолчанию сменили с high на medium, чтобы убрать зависание UI при тяжёлых задачах. Claude заметно поглупел. Откатили 7 апреля. Сейчас для Opus 4.7 стоит xhigh, для остальных моделей high.

2️⃣ 26 марта добавили оптимизацию кэша. Если сессия простаивала больше часа, старый reasoning должен был сброситься один раз для экономии токенов. Баг сделал сброс на каждом ходу до конца сессии. Claude продолжал работать, но без памяти зачем вообще делал предыдущие шаги. Отсюда повторы, странные вызовы инструментов, забывчивость. Починили 10 апреля.

3️⃣ 16 апреля в системный промпт добавили лимит на длину — не больше 25 слов между tool calls и не больше 100 слов в финальном ответе. В сочетании с другими промпт-изменениями это дало падение качества кода на 3% в метриках. Откатили 20 апреля.

Второй баг вообще не воспроизводился внутри: параллельный эксперимент с отображением thinking скрывал его в большинстве CLI-сессий. Прошёл code review, unit-тесты и e2e-тесты без замечаний.

Я замечал странности в Claude Code в марте и апреле, но списывал на свои ошибки. Теперь понятно что это было - накопленный эффект трёх независимых изменений одновременно. Именно так и устроены самые неприятные баги: каждое изменение по отдельности выглядит нормально, а в сумме дают что-то, что не ловится никакими тестами.

#ClaudeCode #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👎8👍2
‼️ Что Anthropic меняют в процессе после апрельских проблем с Claude Code

С 23 апреля всем подписчикам сбрасывают лимиты использования (подписка продлена НЕ будет, хотя бы было честно). Это признание того, что люди платили за инструмент, который работал хуже обещанного.

По изменениям в процессе. Большинство команды внутри использовало тестовый билд Claude Code, а не публичный — именно это и маскировало баги, которые видели внешние пользователи. Теперь переходят на точный публичный билд для внутреннего использования (а так можно было?)

Для системных промптов появится отдельный набор проверок на каждую модель перед любым изменением, новый инструментарий для аудита и другие улучшения контроля качества.
Также изменения, затрагивающие качество ответов, будут раскатываться постепенно, а не на всех сразу.

‼️ ВАЖНО: Code Review получит поддержку дополнительных репозиториев как контекста. Именно в такой расширенной конфигурации он нашёл баг при бэктесте проблемных PR — Opus 4.7 нашёл его, Opus 4.6 нет.

На X появился аккаунт @ClaudeDevs для объяснения продуктовых решений. Важные обновления будут дублироваться в треды на GitHub.

Отчёт честный, без попыток замять или переложить ответственность или замолчать. Три независимых изменения с разными графиками, каждое прошло через тесты, но в сумме дали эффект который было сложно отследить. Приятно, что компания умеет признавать свои ошибки и разбирать их публично. Теперь смотрю как будет реализовано на практике.

🔗 Источник

#ClaudeCode #AITools #Postmortem
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎4
Anthropic сбросили 5 часовой недельный лимит но в момент когда он и так сбрасывался. По сути сделали красивое заявление, но для пользователей ничего не поменялось. На огромный аппетит токенов тоже молчат... Пока не пойдет массового оттока ситуация меняться не станет. "Продолжаем пока хавают!"
👍12👎3
Чтобы вы перестали сранивать Claude и Codex за 20$ Anthropic удалили Claude Code из Pro подписки

UPD После бурной реакции от этого эксперимента отказались. Не понимаю какая разница чем тратить токены в рамках одной подписки?

#ClaudeCode
👎27👍2
🧠 OpenAI выпустила Privacy Filter — локальную модель для фильтрации персональных данных перед отправкой в LLM.

Каждый запрос в облачную нейронку — это отправка данных на серверы провайдера. Если у вас не self-hosted модель, альтернатив не много. Privacy Filter закрывает этот пробел: запускается локально, работает как токен-классификатор и размечает чувствительные данные до того, как они уйдут куда не надо.

Модель определяет 8 категорий:
👉 имена (private_person)
👉 адреса, email, телефоны, URL
👉 номера счётов
👉 даты
👉 секреты — токены, ключи, credentials

Запускается в браузере или на ноутбуке, контекстное окно 128k токенов. Лицензия Apache 2.0.

Я сам делал похожее в рамках своих MCP-инструментов — плагин sensitive-guard, который фильтрует данные на основе правил в стиле GitLeaks. Про то, чтобы запустить лёгкую локальную модель для той же задачи, я не думал — а решение уже готово. Буду смотреть, как это ложится на MCP-воркфлоу.

‼️ ВАЖНО: сами авторы пишут, что модель не даёт гарантий анонимизации. Это один из слоёв защиты, не единственный. На английском работает лучше всего, для других языков качество ниже.

#ai #безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎3
aitmpl - подоборка различных расширений для Claude Code

#AI #ИИ #ClaudeCode
👍11👎1
О деградации качества в длинных диалогах с ИИ

При работе с моделями в рамках одной сессии иногда заметно, что к середине диалога ответы становятся менее точными: модель может повторять уже сделанное, противоречить своим более ранним решениям или терять нить многоэтапной задачи. На контексте в 1 млн токенов, такое поведение может быть заметно более явно.

Это не субъективное ощущение. В исследовании Стэнфорда «Lost in the Middle» показано, что при увеличении объёма контекста точность reasoning может падать на 15–47% независимо от заявленного размера окна. Явление называют context rot — «контекстное ухудшение».

Практическое наблюдение: до 50–60% заполнения контекста (вот непонятно как его сичтать лучше в токенах или процентах) качество остаётся приемлемым, ближе к 75% начинаются заметные проблемы. Поэтому полезно контролировать заполнение — например, командой /context.

Когда контекст перегружен, помогает ручное сжатие: /compact с явным указанием, что именно нужно сохранить (текущую цель, список изменённых файлов, принятые решения, текущую ошибку и следующие шаги), а что можно отбросить (стилистические правки, неудачные варианты промптов). НЕ полагайтесь на автоматическое сжатие (auto‑compaction) часто менее качественно, так как модель сама решает, что важно. Также в глобальные инструкции агента добавить правила что важно сохранить при compact.

Но бывают ситуации, когда даже после сжатия проблема не уходит. Если вы несколько раз объяснили модели, что именно нужно исправить, а она продолжает ошибаться, значит, контекст уже засорён неудачными подходами. В этом случае /compact может не помочь, так как сохранит неверные паттерны в сжатом виде. Делайте /clear для очистки текущей сессии и перезапуск сессии с уточнённым промптом. Отсекайте наработки предыдущей, что могут повлиять на снижение качества результата выдачи.

Также с целью уменьшения заполнения контекста полезно делегировать задачу субагенту, работающий со своим окном контекста, а основную сессию использовать как оркестратора для постановки задач и обработка результата.

#ИИ #AI
👍17👎5
Media is too big
VIEW IN TELEGRAM
📺 Sloppy: как управлять армией ИИ-агентов — демо от автора

К видео прилагаю подробную расшифровку по таймингам. Автор разобрал платформу 🐱 Sloppy от установки до реальной работы с агентами и проектами.

- 00:00 Первичная настройка
- 03:29 Bootstrap-чат с агентом
- 04:00 Вкладка Overview
- 04:36 Вкладка Agents
- 10:34 Создаём проект из директории на компьютере
- 15:48 Настройка команд из агентов
- 22:57 Создаём первую задачу и выполняем её
- 25:49 Интеграция чата и проектов
- 27:33 Устройство супервизора и экран настроек
- 32:46 Проектный чат
- 34:50 Что такое Swarm и как двигаются задачи
- 35:50 Прочие настройки

Будет полезно разработчикам AI, автоматизаторам, энтузиастам LLM — всем, кто хочет прозрачного и структурированного управления агентами, а не чёрного ящика.

#AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎3