Claude AI Dev Broadcast
2.06K subscribers
98 photos
9 videos
91 links
Всё про разработку с использованием IT технологий
Download Telegram
Forwarded from NN
Anthropic создали Claude Mythos — самую крутую модель среди известных нейронок. Еще на тестах она нашла тысячи уязвимостей в популярном софте, включая ОС и бразуеры.

Mythos с отрывом обогнала Opus 4.6 во всех бенчмарках — в SWE-bench у Mythos 93,9% против 80,8% у Opus. По уровню модель не уступает команде топовых инженеров.

Доступ пока не открывают. В Anthropic боятся дать новый инструмент хакерам. Сначала Mythos будут тестить бигтехи.

Это уже AGI?
👎16👍9
NN
Photo
Модель однозначно крутая, будет рвать и метать, но не факт что нам дадут к ней доступ, а если и дадут то подписки за 200$ не хватит точно, так как ее токены будут уже даже не золотыми, а платиновыми
👍11👎5
🐱 MemPalace — локальная долгосрочная память для AI-агентов

Большинство AI-инструментов теряют контекст между сессиями. MemPalace решает это принципиально иначе: не пересказывает историю через LLM, а хранит всё дословно и индексирует в локальной базе.

Ключевая идея: вместо того чтобы сжимать воспоминания в резюме (с потерей деталей), система хранит последовательности и строит из них структуру домен → тема → конкретный фрагмент. По заявлениям авторов, такой подход даёт высокое качество лучше всех существующих подходов.

Подключается как обычный MCP-сервер к любому клиенту — Claude Desktop, Claude Code, Cursor, Codex CLI и другим. После этого агент получает 19 инструментов: поиск по памяти, навигация по структуре, запись в knowledge graph с временными метками, дневник агента. Можно также использовать напрямую через Python API или CLI.

Ещё есть AAAK — собственный сжатый диалект для передачи контекста в промпт: якобы 30x компрессия при сохранении смысла, эмоций и ключевых решений. Спорно, но интересно как идея.

Мне эта идея нравится именно потому что в неё заложено правильное предположение: LLM-резюме — это потеря информации. Verbatim хранение + векторный поиск честнее. Буду пробовать на реальных проектах — посмотрим, насколько работает на практике.

Отдельный прикольный факт: репозиторий принадлежит аккаунту Милы Йовович (той самой из фильмов Обитель Зла) — и судя по всему, это реально она, которая сделала библиотеку в паре с партнёром. Актриса, занявшаяся вайб-кодингом — это уже само по себе говорит кое-что о том, куда всё движется.


🐱 GitHub

#MCP #память #оптимизация
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎6
🐱 Superset — обертка над терминалом, которая позволяет удобно работать с несколькими сессиями в разных проектах, берет на себя всю работу с worktree и предоставляет приятный интерфейс.

Прямо то, что я искал и хотел! Видел наработку Леши Гладкова, но мне не хватило там определенных функций. Искал что-то подобное Codex, только для Claude Code, и вот оно! Поддерживает множество агентов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14👎12
Claude Code всё? Люди пишу о снижение качества работу флагманской модели - Opus. Вполне ожидаемо, потому что манипулировать цифрами чтобы получать более выгодные условия для компании важно, особенно когда железо и энергия дорогие.

Пользователи платят за то что им показали на презентации, а потом начинается плавная деградация чтобы сделать модель дешевле. Люди думают что плохо пишут запросы, тратят больше денег, но причина совсем другая.

Всерьез задумался чтобы взять GLM 5.1 модель и подкинуть её в Claude Code, продолжив в привычном агенте

https://t.me/itstorytelling/2170
👎8👍6
🧠 Anthropic опубликовал разбор пяти паттернов координации мульти-агентных систем.

1️⃣ Generator-Verifier — агент генерирует результат, второй проверяет по явным критериям. Самый простой и самый распространённый в продакшене.

2️⃣ Orchestrator-Subagent — оркестратор разбивает задачу, раздаёт подагентам, собирает результат. Claude Code использует именно этот паттерн.

3️⃣ Agent Teams — агенты живут дольше одного запроса, накапливают контекст по своей области. Хорошо для параллельных задач с долгим циклом, например миграция большого кодобазы по сервисам. Требует строгого разбиения задач, иначе агенты затирают правки друг друга.

4️⃣ Message Bus — агенты общаются через шину событий, подписываются на нужные события. Подходит когда пайпланй работы строится вокруг потока событий и состав агентов будет расти.

5️⃣ Shared State — агенты координируются через общее хранилище без центрального координатора (агента-оркестратора). Идеально для исследовательских задач, где агенты строят на находках друг друга. Главный враг — чтение/редактирование состояния.

Anthropic рекомендует начинать с Orchestrator-Subagent и усложнять только там, где конкретно заканчивается.

#ИИ #агенты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎2
Forwarded from Android Broadcast
📹 ИИ ломает open source. Авторы закрывают проекты

ИИ уже везде. Нравится вам это или нет, но с этим придется жить и в какой-то момент адаптироваться. Но с любой большой силой приходит и большая ответственность, а доступность этой силы всего за 20 $ в месяц делает её опасной в руках дилетантов, что приводит к печальным изменениям в процессе open source. С другой стороны, это заставит проекты адаптироваться и стать лучше. Все подробности в новом 📹 видео 📹

#AndroidBroadcast #Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎7
🧠 Скилл для Claude Code, который знает Material Design 3 лучше, чем твоя мама большинство разработчиков.

material-3-skill — это набор инструкций для Claude Code с покрытием 30+ компонентов MD3, всей системой токенов, цветовыми ролями, типографикой, адаптивными лейаутами и аудитом соответствия спецификации. Поддерживает три платформы: web (@material/web), Flutter и Jetpack Compose.

Внутри семь файлов: главный SKILL.md с деревьями решений и таблицей компонентов, плюс отдельные референсы по цветовой системе (29+ ролей), типографике, шейпам, навигационным паттернам и адаптивным лейаутам.

Отдельная фича — режим аудита. Даёшь URL или путь к коду, скилл проверяет соответствие MD3 по 10 категориям и выдаёт отчёт с конкретными правками.

Я вижу в этом правильный паттерн и практикую его: вместо того чтобы держать спецификацию в голове и доносить её агенту, один раз упаковываешь в скилл и AI агент работает с контекстом системно, а не угадывает.

#ClaudeCode #Material3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34👎5
📃 Наткнулся на статью на Хабре, где человек без бэкграунда в разработке выстроил полноценный агентный фреймворк поверх Claude Code.

Суть не в том, что он использует субагентов. Суть в том, как организован сам процесс:
👉 user-spec: агент сам проводит интервью и задаёт уточняющие вопросы
👉 tech-spec с декомпозицией на атомарные задачи
👉 каждую задачу делает отдельный агент, потом проверяет агент-ревьювер
👉 TDD обязателен — иначе агент подгоняет тесты под свои же баги
👉 project knowledge обновляется командой /done после каждой фичи

Подход резонирует с тем, что сам Anthropic рекомендует для мультиагентных систем — агенты проверяют друг друга, роли разделены, pipeline структурирован.

🐱 Исходники Claude Code плагина автора статьи на GitHub

💬 А как вы организуете работу с агентами? Делитесь в комментах.

#AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10👍7
🧠 Король умер, да здравствует король! Вышла модель Opus 4.7, которая превосходит всех конкурентов и ближайших соперников в программировании по результатам тестов. Но есть что-то ещё круче — Mythos, доступ к которой пока ограничен узким кругом избранных компаний. Ну что, попробуем?

#Claude #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎5
Media is too big
VIEW IN TELEGRAM
🧠 Убийца Figma от Claude Code - Design. С помощью ИИ генерите базу и дальше редактируете свойства и дополняете промптами

Может сделать дизайн сайта, презентацию, визуализацию исследование и много всего. Дизайн мобильных приложений пока не заявлен, а вот очень бы хотелось делать всё не через Figma, но останется как есть пока.

Экспорт возможен в Canva, PDF, PPTX и HTML.

#Claude #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👎2
Docker Sandbox - изоляция агентов на вашем компе на основе легкого Docker контейнера. Использую на всех машинах, чтобы ограничить доступ Claude Code и иметь больше контроля над доступами. Полагаться на соблюдением агентом инструкций НЕ СТОИТ

Из коробки работает с Claude Code, Codex, Copilot, Gemini, Kiro, OpenCode, Docker Agent но можно по аналогии запустить с другими CLI
👍24👎5
Попробовал Claude Design - я в шоке от того как классно вышло. За 20 минут сделал весь фундамент стиля, остается только наполнить контентом и уточнить требования
👍42👎8
🧠 Anthropic добавили в Claude Code команду /advisor и инструмент Advisor для API. Идея в том, что вместо одной дорогой модели на всё, можно поставить дешёвую как executor и дорогую как advisor, который подключается только в нужный момент.

Механика простая: executor модель выполняет задачу, вызывает инструменты, читает результаты. Когда упирается в решение, которое не может принять самостоятельно, обращается к advisor. Advisor видит весь контекст, отдаёт план или корректировку в 400–700 токенов и executor продолжает. Всё это в одном API-запросе, без лишних раундтрипов.

В Claude Code это настраивается через /advisor: можно выбрать Opus, Sonnet или отключить. Opus как advisor для Sonnet-executor, Sonnet как advisor для Haiku-executor. Anthropic рекомендуют связку Sonnet + Opus как оптимальную по умолчанию.

По бенчмаркам: Sonnet с Opus-advisor +2.7 pp на SWE-bench Multilingual при снижении стоимости на 11.9% по сравнению с Sonnet соло. Haiku с Opus-advisor удвоил результат на BrowseComp (19.7% до 41.2%), при этом стоит на 85% дешевле Sonnet.

В Claude Code доступно через /advisor без дополнительных настроек уже сейчас.

Попробовал сам через Claude Code — advisor действительно вызывается не на каждом шаге, а именно когда агент упирается в архитектурное решение. Пауза в стриме заметная, но оценить как с ним и без мне сложно.

#claude #claudecode #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23👎6
🤯 Пока уходить с Claude Code... После релиза Opus 4.7 пошли массовые жалобы на то, как быстро сжигаются токены, и что Claude уже не позволяет выполнить те же объемы работы с разницей в месяц за те же деньги.

Изучаю модели Kimi и DeepSeek v4 и действительно хочу попробовать перейти на KimiCode/OpenCode, а может, в том же Claude Code продолжить, но с другой моделью. Возможностей много, конкуренция высокая, и нужно пробовать на основе моего опыта работы с AI-кодингом.

🔗 Сравнение Kimi 2.6 vs Opus 4.6

#AI
👍22👎3
Порекомендуйте что попробовать вместо Claude Code и их моделей для AI кодинга без IDE (вайбкодинг)
Anonymous Poll
28%
OpenAI модели
4%
Kimi 2.6
8%
GLM 5.1
4%
DeepSeek v4
5%
Qwen 3.6 Plus
2%
MiniMax M2.7
10%
Оставайся на Claude моделях
2%
Другая модель (пиши в комментарияз)
36%
Не участвую в опросе
👍5👎5