Claude AI Dev Broadcast
2.06K subscribers
98 photos
9 videos
91 links
Всё про разработку с использованием IT технологий
Download Telegram
Forwarded from Нейро
Claude Code прокачали до уровня комбайна — разработчик выпустил апгрейд Oh-My-ClaudeCode, который заметно расширяет возможности модели.

Внутри несколько режимов работы:

• Autopilot — ставите задачу, дальше всё делает ИИ
• Ultrapilot — многопоточная работа, когда разные части проекта делаются параллельно
• Swarm — над задачей одновременно работает группа агентов
• Pipeline — чёткая последовательность шагов без лишних отклонений
• Ecomode — тяжёлые модели подключаются только при необходимости, экономя токены

Система может задействовать до 32 агентов, а Claude сам выбирает, кого подключить для лучшего результата.

Забираем — Oh-My-ClaudeCode
1👎9👍5
Forwarded from NN
Claude Code внезапно стал опенсорсным: Anthropic случайно слили исходный код агента, и его моментально скопировали.

На GitHub у репозитория набралось уже 15 тыс. звезд за час. Внутри: скиллы, системные промты, скрытые функции. Всего — тысячи строк кода.

Изучаем по ссылке.
👍20👎4
Forwarded from AI Projects (Vladimir Ivanov)
🔍 Очень важный пост с реверс-инжинирингом Claude Code по утечке его кода. Кратко пройдусь по тезисам.

1. Реальный статус успешности правок доступен только сотрудникам Anthropic. Обычные пользователи Claude Code получают ложноположительное заявление Claude об успехе примерно в 30% случаев.
Это связано с известным эффектом «доверчивости» ИИ к статусу операций без контекста. Я писал об этом в части работы с автотестами: нужно давать LLM больше информации, чем просто SUCCESS.

2. Скрытое от пользователя сжатие контекста после 167k токенов.
Причём сжатие не беспроблемное — с потерями названий важных объектов, типа имён переменных. Это одна из причин галлюцинаций Claude в Claude Code.

3. Требование к Claude принудительно упрощать архитектурные решения с целью писать код просто короче.

4. Claude Code уже сделан под рой ИИ-агентов, но часто это недоступно пользователю, т.к. он не знает лимит в 5 субагентов и 167k токенов на субагент, без чего параллелизм не работает.

5. Слепая зона на 2000 строк. Если ваши модули длиннее, то Claude может быть «ослеплён» не всегда хорошо работающим RAG-механизмом чтения чанками кода и просто галлюцинировать обрезанный код в Claude Code.

6. Ослепление Tools с результатами выше 50k символов. Наиболее критично для поиска агентом, т.к. если найдётся много, то агент попадает в preview, но Claude не знает об усечении, поэтому может сделать неверный вывод.

7. AST не применяется в Claude Code.

https://x.com/iamfakeguru/status/2038965567269249484
👍18👎4
🤖 DTA - MCP-сервер, который даёт AI-агенту полноценный доступ к Android-приложению

Концепция такая: подключить AI-агента не просто к коду, а к живому приложению на девайсе. Агент видит реальный layout с Compose-иерархией, перехватывает сетевой трафик с момента запуска, мокирует HTTP и WebSocket ответы, и сам тапает по экрану. Всё через MCP.

Технически это одна debugImplementation зависимость в приложении — библиотека внедряется в байткод и сразу пишет трафик и раскрывает UI-дерево без изменений в коде. На стороне агента поднимается MCP-сервер через CLI. Дальше агент сам: смотрит экран, анализирует запрос, ставит мок, тапает кнопку, проверяет результат — и докладывает.

Интересная деталь — WebView и Chrome Custom Tabs не чёрный ящик, их DOM-дерево инжектится прямо в нативную иерархию. И трафик не надо предугадывать когда записывать — он пишется с первого же запроса.

Доступна версия 0.9.27, но идея рабочая. На мой взгляд это правильное направление для AI в мобильной разработке.

🔗 Статья про подход и либу
🐱 Исходники на GitHub

#Android #MCP #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍39👎4
📱 ИИ-агент как QA-тестер для твоего мобильного приложения

Даёшь задание: "проверь, что пользователь может залогиниться и попасть на главный экран". Агент берёт эмулятор, прокликивает приложение, сообщает что получилось. Примерно так работает claude-in-mobile.

Это MCP-сервер, который подключает Claude Code к Android-эмулятору, iOS Simulator, десктопным приложениям и браузеру. Агент видит экран, может тапать, свайпать, вводить текст, читать UI-дерево — и делает это по твоим инструкциям на обычном языке, без тест-скриптов.

Отдельно стоит отметить: уже есть поддержка Aurora OS. Для тех, кто разрабатывает под российскую мобильную платформу — агент умеет работать и с ней.

Сценарий простой:
👉 описываешь что нужно проверить
👉 агент прокликивает
👉 возвращает результат

Полезно для smoke-тестирования через агента, исследования приложения перед написанием автотестов или чтобы не переключаться между терминалом и эмулятором руками.

Проект открыт к участию сообщества — если есть идеи что добавить или доработать, создавайте issues в репозитории. PR тоже приветствуются.

🐱 github.com/AlexGladkov/claude-in-mobile

#MCP #ClaudeCode #AndroidDev #AuroraOS #iOS #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎10
This media is not supported in your browser
VIEW IN TELEGRAM
Сделать аналог любого open source решения стало проще с сервисом Gitreverse, позволяющий получить промпт для создания аналого open source проекта.

Попробовал для своего небольшого проекта. Результат - маркетинговый промпт с презентаций, позволяющий получить счастье из пару предложений. И близко не дал нужного результата в Claude Code с Opus.

#AI #OpenSource
👎7👍4
⭐️ Вышла Gemma 4. Четыре размера моделей от 2 до 31 миллиардов параметров, все с Apache 2.0 лицензией. Главное — это не очередная пиар-история про "самую способную модель", а прикладной инструмент, который реально можно загрузить и юзать локально.

Числа впечатляют: 31B модель прямо сейчас на 3 месте в Arena.ai мировом лидерборде для open source. Главная фишка для мобилки — E2B и E4B модели. Это 2B и 4B параметров эффективной ширины, работают оффлайн на Pixel, Raspberry Pi и вообще на чём угодно.

Поддержка видео, аудио, 140+ языков нативно. Контекст 256K на больших моделях. Для кода работает хорошо — Google позиционирует как локальную альтернативу Claude Code и прочим облачным ассистентам.

🔗 Источник - google.blog

#ai #models #openmodels #locallm
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26👎5
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Вышел Cursor 3, которые фактически визуальный клон Codex. Продукт отходит от работы как IDE и теперь стал визуальной оберткой над работой параллельных агентов в нескольких проекта

🔗 Источник - Cursor Blog

#Cursor
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎4
Пробую gemma4:26b через Claude Code на MacBook Pro 14" M3 Max/36GB/1TB и это пока печально. Не может справиться даже с тем чтобы удалить вмерженные ветки, что в целом простая и задача и чисто локальная по истории Git. Вообщем, надо искать подходящего агента где модель сможет работать с тулингом.
👎13👍4
🧠 Как настроить Claude Code под себя раз и навсегда (но работает и для других агентов)

Голый агент из коробки знает много, но не знает тебя. Без кастомизации стабильного результата не добиться — какие бы инструменты ты ни подключал.
Есть две вещи, которые нужно понять: где хранить и зачем это вообще нужно.

ГДЕ ХРАНИТЬ:
👉 Глобальные настройки пользователя (~/.claude)
👉 Проектный настройки (папка .claude/ в корне репозитория) — Хранит то что можно пошарить с командой или только для себя
👉 CLAUDE.md в поддиректориях — грузится, когда агент заходит в конкретную папку. Для специфики отдельных модулей.

Чем более верхнеуровневый файле тем меньше инструкции должны быть привязаны к специфичнам аспектам отдельной директории/проекта

ИНСТРУКЦИИ МОЖНО ПЕРЕДАТЬ ЧЕРЕЗ
👉 CLAUDE.md — "что мне важно знать про тебя, чтобы работать так, как ты ждёшь". Стиль, предпочтения, поведение в спорных ситуациях. Это рабочий договор. Подгружается автоматом там где работает агент, загружая все от более высокого уровня к частным
👉 Рулы — "что важно, когда я работаю в этих файлах или директории". Контекст под конкретный тип файла
👉 Агент — "кто я и что я умею". Профиль, экспертиза, зона ответственности.
👉 Скилл — "как именно делать вот эту операцию". Рецепт, не роль.

Путаница между этими четырьмя приводит к тому, что агент работает непредсказуемо. Как только расставляешь каждую вещь на своё место — поведение становится стабильным.
Без такой настройки — это как взять нового разработчика и ждать, что он сам догадается обо всех твоих стандартах.

🔗 Лучшие практики от Claude Code
🔗 Кастомизация и расширение возможностей Claude Code

#ClaudeCode #ЛучшиеПрактики #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👎4
Forwarded from NN
Anthropic создали Claude Mythos — самую крутую модель среди известных нейронок. Еще на тестах она нашла тысячи уязвимостей в популярном софте, включая ОС и бразуеры.

Mythos с отрывом обогнала Opus 4.6 во всех бенчмарках — в SWE-bench у Mythos 93,9% против 80,8% у Opus. По уровню модель не уступает команде топовых инженеров.

Доступ пока не открывают. В Anthropic боятся дать новый инструмент хакерам. Сначала Mythos будут тестить бигтехи.

Это уже AGI?
👎16👍9
NN
Photo
Модель однозначно крутая, будет рвать и метать, но не факт что нам дадут к ней доступ, а если и дадут то подписки за 200$ не хватит точно, так как ее токены будут уже даже не золотыми, а платиновыми
👍11👎5
🐱 MemPalace — локальная долгосрочная память для AI-агентов

Большинство AI-инструментов теряют контекст между сессиями. MemPalace решает это принципиально иначе: не пересказывает историю через LLM, а хранит всё дословно и индексирует в локальной базе.

Ключевая идея: вместо того чтобы сжимать воспоминания в резюме (с потерей деталей), система хранит последовательности и строит из них структуру домен → тема → конкретный фрагмент. По заявлениям авторов, такой подход даёт высокое качество лучше всех существующих подходов.

Подключается как обычный MCP-сервер к любому клиенту — Claude Desktop, Claude Code, Cursor, Codex CLI и другим. После этого агент получает 19 инструментов: поиск по памяти, навигация по структуре, запись в knowledge graph с временными метками, дневник агента. Можно также использовать напрямую через Python API или CLI.

Ещё есть AAAK — собственный сжатый диалект для передачи контекста в промпт: якобы 30x компрессия при сохранении смысла, эмоций и ключевых решений. Спорно, но интересно как идея.

Мне эта идея нравится именно потому что в неё заложено правильное предположение: LLM-резюме — это потеря информации. Verbatim хранение + векторный поиск честнее. Буду пробовать на реальных проектах — посмотрим, насколько работает на практике.

Отдельный прикольный факт: репозиторий принадлежит аккаунту Милы Йовович (той самой из фильмов Обитель Зла) — и судя по всему, это реально она, которая сделала библиотеку в паре с партнёром. Актриса, занявшаяся вайб-кодингом — это уже само по себе говорит кое-что о том, куда всё движется.


🐱 GitHub

#MCP #память #оптимизация
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎6
🐱 Superset — обертка над терминалом, которая позволяет удобно работать с несколькими сессиями в разных проектах, берет на себя всю работу с worktree и предоставляет приятный интерфейс.

Прямо то, что я искал и хотел! Видел наработку Леши Гладкова, но мне не хватило там определенных функций. Искал что-то подобное Codex, только для Claude Code, и вот оно! Поддерживает множество агентов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14👎12
Claude Code всё? Люди пишу о снижение качества работу флагманской модели - Opus. Вполне ожидаемо, потому что манипулировать цифрами чтобы получать более выгодные условия для компании важно, особенно когда железо и энергия дорогие.

Пользователи платят за то что им показали на презентации, а потом начинается плавная деградация чтобы сделать модель дешевле. Люди думают что плохо пишут запросы, тратят больше денег, но причина совсем другая.

Всерьез задумался чтобы взять GLM 5.1 модель и подкинуть её в Claude Code, продолжив в привычном агенте

https://t.me/itstorytelling/2170
👎8👍6
🧠 Anthropic опубликовал разбор пяти паттернов координации мульти-агентных систем.

1️⃣ Generator-Verifier — агент генерирует результат, второй проверяет по явным критериям. Самый простой и самый распространённый в продакшене.

2️⃣ Orchestrator-Subagent — оркестратор разбивает задачу, раздаёт подагентам, собирает результат. Claude Code использует именно этот паттерн.

3️⃣ Agent Teams — агенты живут дольше одного запроса, накапливают контекст по своей области. Хорошо для параллельных задач с долгим циклом, например миграция большого кодобазы по сервисам. Требует строгого разбиения задач, иначе агенты затирают правки друг друга.

4️⃣ Message Bus — агенты общаются через шину событий, подписываются на нужные события. Подходит когда пайпланй работы строится вокруг потока событий и состав агентов будет расти.

5️⃣ Shared State — агенты координируются через общее хранилище без центрального координатора (агента-оркестратора). Идеально для исследовательских задач, где агенты строят на находках друг друга. Главный враг — чтение/редактирование состояния.

Anthropic рекомендует начинать с Orchestrator-Subagent и усложнять только там, где конкретно заканчивается.

#ИИ #агенты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12👎2
Forwarded from Android Broadcast
📹 ИИ ломает open source. Авторы закрывают проекты

ИИ уже везде. Нравится вам это или нет, но с этим придется жить и в какой-то момент адаптироваться. Но с любой большой силой приходит и большая ответственность, а доступность этой силы всего за 20 $ в месяц делает её опасной в руках дилетантов, что приводит к печальным изменениям в процессе open source. С другой стороны, это заставит проекты адаптироваться и стать лучше. Все подробности в новом 📹 видео 📹

#AndroidBroadcast #Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎7
🧠 Скилл для Claude Code, который знает Material Design 3 лучше, чем твоя мама большинство разработчиков.

material-3-skill — это набор инструкций для Claude Code с покрытием 30+ компонентов MD3, всей системой токенов, цветовыми ролями, типографикой, адаптивными лейаутами и аудитом соответствия спецификации. Поддерживает три платформы: web (@material/web), Flutter и Jetpack Compose.

Внутри семь файлов: главный SKILL.md с деревьями решений и таблицей компонентов, плюс отдельные референсы по цветовой системе (29+ ролей), типографике, шейпам, навигационным паттернам и адаптивным лейаутам.

Отдельная фича — режим аудита. Даёшь URL или путь к коду, скилл проверяет соответствие MD3 по 10 категориям и выдаёт отчёт с конкретными правками.

Я вижу в этом правильный паттерн и практикую его: вместо того чтобы держать спецификацию в голове и доносить её агенту, один раз упаковываешь в скилл и AI агент работает с контекстом системно, а не угадывает.

#ClaudeCode #Material3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34👎5