Claude AI Dev Broadcast
2.06K subscribers
98 photos
9 videos
91 links
Всё про разработку с использованием IT технологий
Download Telegram
Claude Code всё? Люди пишу о снижение качества работу флагманской модели - Opus. Вполне ожидаемо, потому что манипулировать цифрами чтобы получать более выгодные условия для компании важно, особенно когда железо и энергия дорогие.

Пользователи платят за то что им показали на презентации, а потом начинается плавная деградация чтобы сделать модель дешевле. Люди думают что плохо пишут запросы, тратят больше денег, но причина совсем другая.

Всерьез задумался чтобы взять GLM 5.1 модель и подкинуть её в Claude Code, продолжив в привычном агенте

https://t.me/itstorytelling/2170
👎8👍6
🧠 Anthropic опубликовал разбор пяти паттернов координации мульти-агентных систем.

1️⃣ Generator-Verifier — агент генерирует результат, второй проверяет по явным критериям. Самый простой и самый распространённый в продакшене.

2️⃣ Orchestrator-Subagent — оркестратор разбивает задачу, раздаёт подагентам, собирает результат. Claude Code использует именно этот паттерн.

3️⃣ Agent Teams — агенты живут дольше одного запроса, накапливают контекст по своей области. Хорошо для параллельных задач с долгим циклом, например миграция большого кодобазы по сервисам. Требует строгого разбиения задач, иначе агенты затирают правки друг друга.

4️⃣ Message Bus — агенты общаются через шину событий, подписываются на нужные события. Подходит когда пайпланй работы строится вокруг потока событий и состав агентов будет расти.

5️⃣ Shared State — агенты координируются через общее хранилище без центрального координатора (агента-оркестратора). Идеально для исследовательских задач, где агенты строят на находках друг друга. Главный враг — чтение/редактирование состояния.

Anthropic рекомендует начинать с Orchestrator-Subagent и усложнять только там, где конкретно заканчивается.

#ИИ #агенты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎2
Forwarded from Android Broadcast
📹 ИИ ломает open source. Авторы закрывают проекты

ИИ уже везде. Нравится вам это или нет, но с этим придется жить и в какой-то момент адаптироваться. Но с любой большой силой приходит и большая ответственность, а доступность этой силы всего за 20 $ в месяц делает её опасной в руках дилетантов, что приводит к печальным изменениям в процессе open source. С другой стороны, это заставит проекты адаптироваться и стать лучше. Все подробности в новом 📹 видео 📹

#AndroidBroadcast #Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎7
🧠 Скилл для Claude Code, который знает Material Design 3 лучше, чем твоя мама большинство разработчиков.

material-3-skill — это набор инструкций для Claude Code с покрытием 30+ компонентов MD3, всей системой токенов, цветовыми ролями, типографикой, адаптивными лейаутами и аудитом соответствия спецификации. Поддерживает три платформы: web (@material/web), Flutter и Jetpack Compose.

Внутри семь файлов: главный SKILL.md с деревьями решений и таблицей компонентов, плюс отдельные референсы по цветовой системе (29+ ролей), типографике, шейпам, навигационным паттернам и адаптивным лейаутам.

Отдельная фича — режим аудита. Даёшь URL или путь к коду, скилл проверяет соответствие MD3 по 10 категориям и выдаёт отчёт с конкретными правками.

Я вижу в этом правильный паттерн и практикую его: вместо того чтобы держать спецификацию в голове и доносить её агенту, один раз упаковываешь в скилл и AI агент работает с контекстом системно, а не угадывает.

#ClaudeCode #Material3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34👎5
📃 Наткнулся на статью на Хабре, где человек без бэкграунда в разработке выстроил полноценный агентный фреймворк поверх Claude Code.

Суть не в том, что он использует субагентов. Суть в том, как организован сам процесс:
👉 user-spec: агент сам проводит интервью и задаёт уточняющие вопросы
👉 tech-spec с декомпозицией на атомарные задачи
👉 каждую задачу делает отдельный агент, потом проверяет агент-ревьювер
👉 TDD обязателен — иначе агент подгоняет тесты под свои же баги
👉 project knowledge обновляется командой /done после каждой фичи

Подход резонирует с тем, что сам Anthropic рекомендует для мультиагентных систем — агенты проверяют друг друга, роли разделены, pipeline структурирован.

🐱 Исходники Claude Code плагина автора статьи на GitHub

💬 А как вы организуете работу с агентами? Делитесь в комментах.

#AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10👍7
🧠 Король умер, да здравствует король! Вышла модель Opus 4.7, которая превосходит всех конкурентов и ближайших соперников в программировании по результатам тестов. Но есть что-то ещё круче — Mythos, доступ к которой пока ограничен узким кругом избранных компаний. Ну что, попробуем?

#Claude #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎5
Media is too big
VIEW IN TELEGRAM
🧠 Убийца Figma от Claude Code - Design. С помощью ИИ генерите базу и дальше редактируете свойства и дополняете промптами

Может сделать дизайн сайта, презентацию, визуализацию исследование и много всего. Дизайн мобильных приложений пока не заявлен, а вот очень бы хотелось делать всё не через Figma, но останется как есть пока.

Экспорт возможен в Canva, PDF, PPTX и HTML.

#Claude #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎2
Docker Sandbox - изоляция агентов на вашем компе на основе легкого Docker контейнера. Использую на всех машинах, чтобы ограничить доступ Claude Code и иметь больше контроля над доступами. Полагаться на соблюдением агентом инструкций НЕ СТОИТ

Из коробки работает с Claude Code, Codex, Copilot, Gemini, Kiro, OpenCode, Docker Agent но можно по аналогии запустить с другими CLI
👍24👎5
Попробовал Claude Design - я в шоке от того как классно вышло. За 20 минут сделал весь фундамент стиля, остается только наполнить контентом и уточнить требования
👍42👎8
🧠 Anthropic добавили в Claude Code команду /advisor и инструмент Advisor для API. Идея в том, что вместо одной дорогой модели на всё, можно поставить дешёвую как executor и дорогую как advisor, который подключается только в нужный момент.

Механика простая: executor модель выполняет задачу, вызывает инструменты, читает результаты. Когда упирается в решение, которое не может принять самостоятельно, обращается к advisor. Advisor видит весь контекст, отдаёт план или корректировку в 400–700 токенов и executor продолжает. Всё это в одном API-запросе, без лишних раундтрипов.

В Claude Code это настраивается через /advisor: можно выбрать Opus, Sonnet или отключить. Opus как advisor для Sonnet-executor, Sonnet как advisor для Haiku-executor. Anthropic рекомендуют связку Sonnet + Opus как оптимальную по умолчанию.

По бенчмаркам: Sonnet с Opus-advisor +2.7 pp на SWE-bench Multilingual при снижении стоимости на 11.9% по сравнению с Sonnet соло. Haiku с Opus-advisor удвоил результат на BrowseComp (19.7% до 41.2%), при этом стоит на 85% дешевле Sonnet.

В Claude Code доступно через /advisor без дополнительных настроек уже сейчас.

Попробовал сам через Claude Code — advisor действительно вызывается не на каждом шаге, а именно когда агент упирается в архитектурное решение. Пауза в стриме заметная, но оценить как с ним и без мне сложно.

#claude #claudecode #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23👎6
🤯 Пока уходить с Claude Code... После релиза Opus 4.7 пошли массовые жалобы на то, как быстро сжигаются токены, и что Claude уже не позволяет выполнить те же объемы работы с разницей в месяц за те же деньги.

Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.

🔗 Сравнение Kimi 2.6 vs Opus 4.6

#AI
👍22👎3
Порекомендуйте что попробовать вместо Claude Code и их моделей для AI кодинга без IDE (вайбкодинг)
Anonymous Poll
28%
OpenAI модели
4%
Kimi 2.6
8%
GLM 5.1
4%
DeepSeek v4
5%
Qwen 3.6 Plus
2%
MiniMax M2.7
10%
Оставайся на Claude моделях
2%
Другая модель (пиши в комментарияз)
36%
Не участвую в опросе
👍5👎5
🧠 Три независимых изменения за один месяц — вот откуда шли жалобы на Claude Code

Anthropic разобрались, что именно сломалось. Оказалось не один баг и не деградация модели, а три несвязанных изменения с разными датами, каждое из которых прошло через все тесты и code review.

1️⃣ 4 марта reasoning effort по умолчанию сменили с high на medium, чтобы убрать зависание UI при тяжёлых задачах. Claude заметно поглупел. Откатили 7 апреля. Сейчас для Opus 4.7 стоит xhigh, для остальных моделей high.

2️⃣ 26 марта добавили оптимизацию кэша. Если сессия простаивала больше часа, старый reasoning должен был сброситься один раз для экономии токенов. Баг сделал сброс на каждом ходу до конца сессии. Claude продолжал работать, но без памяти зачем вообще делал предыдущие шаги. Отсюда повторы, странные вызовы инструментов, забывчивость. Починили 10 апреля.

3️⃣ 16 апреля в системный промпт добавили лимит на длину — не больше 25 слов между tool calls и не больше 100 слов в финальном ответе. В сочетании с другими промпт-изменениями это дало падение качества кода на 3% в метриках. Откатили 20 апреля.

Второй баг вообще не воспроизводился внутри: параллельный эксперимент с отображением thinking скрывал его в большинстве CLI-сессий. Прошёл code review, unit-тесты и e2e-тесты без замечаний.

Я замечал странности в Claude Code в марте и апреле, но списывал на свои ошибки. Теперь понятно что это было - накопленный эффект трёх независимых изменений одновременно. Именно так и устроены самые неприятные баги: каждое изменение по отдельности выглядит нормально, а в сумме дают что-то, что не ловится никакими тестами.

#ClaudeCode #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👎8👍2
‼️ Что Anthropic меняют в процессе после апрельских проблем с Claude Code

С 23 апреля всем подписчикам сбрасывают лимиты использования (подписка продлена НЕ будет, хотя бы было честно). Это признание того, что люди платили за инструмент, который работал хуже обещанного.

По изменениям в процессе. Большинство команды внутри использовало тестовый билд Claude Code, а не публичный — именно это и маскировало баги, которые видели внешние пользователи. Теперь переходят на точный публичный билд для внутреннего использования (а так можно было?)

Для системных промптов появится отдельный набор проверок на каждую модель перед любым изменением, новый инструментарий для аудита и другие улучшения контроля качества.
Также изменения, затрагивающие качество ответов, будут раскатываться постепенно, а не на всех сразу.

‼️ ВАЖНО: Code Review получит поддержку дополнительных репозиториев как контекста. Именно в такой расширенной конфигурации он нашёл баг при бэктесте проблемных PR — Opus 4.7 нашёл его, Opus 4.6 нет.

На X появился аккаунт @ClaudeDevs для объяснения продуктовых решений. Важные обновления будут дублироваться в треды на GitHub.

Отчёт честный, без попыток замять или переложить ответственность или замолчать. Три независимых изменения с разными графиками, каждое прошло через тесты, но в сумме дали эффект который было сложно отследить. Приятно, что компания умеет признавать свои ошибки и разбирать их публично. Теперь смотрю как будет реализовано на практике.

🔗 Источник

#ClaudeCode #AITools #Postmortem
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎4
Anthropic сбросили 5 часовой недельный лимит но в момент когда он и так сбрасывался. По сути сделали красивое заявление, но для пользователей ничего не поменялось. На огромный аппетит токенов тоже молчат... Пока не пойдет массового оттока ситуация меняться не станет. "Продолжаем пока хавают!"
👍12👎3
Чтобы вы перестали сранивать Claude и Codex за 20$ Anthropic удалили Claude Code из Pro подписки

UPD После бурной реакции от этого эксперимента отказались. Не понимаю какая разница чем тратить токены в рамках одной подписки?

#ClaudeCode
👎27👍2