🤝 Как я подружил AI-агента со статическим анализатором, или История одной миграции
Делал на днях миграцию в проекте: переводил код с Java Date API на котлиновский kotlinx-datetime. Вроде бы всё классно, AI-агент прошёлся, основную массу мест поправил. Но нет — в коде всё равно оставались вызовы старого API. Почему? Проблема оказалась в том, как агент ищет места для замены. По умолчанию он ориентируется на импорты. А если класс используется с fully qualified name (полным путём без импорта), такие вызовы он просто пропускает. Не нашёл — не поменял.
Долго мучиться не стал, а сделал простую, но жёсткую штуку: написал кастомное правило для Detekt (статический анализатор кода). Правило запрещает использование определённых классов и пакетов — как в короткой форме, так и в полной.
Теперь процесс выглядит так:
1. Хочу что-то замигрировать — сначала добавляю "старые" классы в анализатор
2. Ветка начинает светиться красным от ошибок анализатора.
3. Агент, видя этот контекст, чётко понимает, где и что нужно менять, и идёт править уже точечно и полностью.
По итогу всё сработало! Если работаете с AI агентами в коде, не полагайтесь только на их "поиск по тексту". Лучше обвяжите их статическими проверками. Чем жёстче и точнее правило, тем меньше шансов, что агент что-то упустит. По сути, это готовый скилл для миграций — или просто надёжный способ не оставлять хвостов.
#AI #Kotlin #Detekt
Делал на днях миграцию в проекте: переводил код с Java Date API на котлиновский kotlinx-datetime. Вроде бы всё классно, AI-агент прошёлся, основную массу мест поправил. Но нет — в коде всё равно оставались вызовы старого API. Почему? Проблема оказалась в том, как агент ищет места для замены. По умолчанию он ориентируется на импорты. А если класс используется с fully qualified name (полным путём без импорта), такие вызовы он просто пропускает. Не нашёл — не поменял.
Долго мучиться не стал, а сделал простую, но жёсткую штуку: написал кастомное правило для Detekt (статический анализатор кода). Правило запрещает использование определённых классов и пакетов — как в короткой форме, так и в полной.
Теперь процесс выглядит так:
1. Хочу что-то замигрировать — сначала добавляю "старые" классы в анализатор
2. Ветка начинает светиться красным от ошибок анализатора.
3. Агент, видя этот контекст, чётко понимает, где и что нужно менять, и идёт править уже точечно и полностью.
По итогу всё сработало! Если работаете с AI агентами в коде, не полагайтесь только на их "поиск по тексту". Лучше обвяжите их статическими проверками. Чем жёстче и точнее правило, тем меньше шансов, что агент что-то упустит. По сути, это готовый скилл для миграций — или просто надёжный способ не оставлять хвостов.
#AI #Kotlin #Detekt
👍32👎4
This media is not supported in the widget
VIEW IN TELEGRAM
👍7👎3
Буквально на этой неделе OpenAI добавил в Codex систему плагинов. Плагин — это упакованный набор из skills, коннекторов к приложениям и MCP-серверов, который можно поставить одной командой и сразу получить готовый рабочий workflow.
Доступно уже больше 20 плагинов. Один из самых показательных примеров — плагин "build web app", который объединяет сразу три MCP-сервера (Stripe, Supabase, Vercel) со скиллами для деплоя и фронтенда. То есть вместо того, чтобы настраивать всё это руками, ставишь один плагин и работаешь.
Плагины доступны в приложении Codex, CLI и VS Code расширении. Встроенный скилл
@plugin-creator помогает сгенерировать плагин. Публикация в официальный каталог пока не открыта для сторонних разработчиков, но это в планах.Интересно, что OpenAI сам формулирует это не просто как расширение инструмента для кода, а как шаг к более широкой платформе — часть плагинов вообще не про разработку, а про планирование, коммуникацию и организацию работы. Codex явно хочет быть чем-то большим, чем ассистентом для кодинга.
На мой взгляд, это прямой ответ на Claude Code с его Agent Skills и MCP-экосистемой. Механика очень похожа: Markdown-файл с инструкциями для агента плюс конфигурация инструментов. У Anthropic эта система работает уже какое-то время и мне она очень нравится, теперь OpenAI формализовал то же самое у себя. Посмотрим, насколько активно сообщество начнёт создавать и публиковать плагины — это всегда ключевой вопрос для подобных экосистем, но кажется понесётся!
🔗 Документация developers.openai.com
#Codex #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎5
OpenAI добавили в Codex отдельный плагин для Swift/SwiftUI разработки - Build iOS Apps.
Агент и итерирует приложение полностью в терминале через
xcodebuild без использования Xcode. Для более глубокой автоматизации подключается XcodeBuildMCP — MCP-сервер, который даёт агенту доступ к возможностями XCode для открытого проекта.Для нового проекта всё начинается с простого промпта — Codex скаффолдит SwiftUI-приложение и пишет build-скрипт под локальное окружение. Для существующих проектов в схеме работы появляется XcodeBuildMCP, который помогает агенту разобраться в структуре таргетов и правильно выбрать схему сборки.
Интересная часть — набор Agent Skills:
👉 SwiftUI expert — базовые практики и паттерны
👉 SwiftUI Pro — аудит современных API, доступности и производительности
👉 Liquid Glass expert — работа с новым iOS/macOS 26 API
👉 Swift concurrency expert — для борьбы с предупреждениями компилятора
👉 SwiftUI view refactor — уменьшение файлов и консистентность кода
На мой взгляд это интересный сигнал: Codex всё сильнее метит в нишу специализированного агента под конкретные платформы, а не просто универсального ИИ-помощника, что в целом уже давно было подтверждено. Посмотрим, насколько это работает на практике со Swift-кодом, где у моделей исторически больше пробелов, чем с Python или TypeScript из-за меньшего объема данных для обучения.
🔗 Источник: developers.openai.com
#iOS #macOS #SwiftUI #AI #Codex #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7👎7
Forwarded from Нейро
Claude Code прокачали до уровня комбайна — разработчик выпустил апгрейд Oh-My-ClaudeCode, который заметно расширяет возможности модели.
Внутри несколько режимов работы:
• Autopilot — ставите задачу, дальше всё делает ИИ
• Ultrapilot — многопоточная работа, когда разные части проекта делаются параллельно
• Swarm — над задачей одновременно работает группа агентов
• Pipeline — чёткая последовательность шагов без лишних отклонений
• Ecomode — тяжёлые модели подключаются только при необходимости, экономя токены
Система может задействовать до 32 агентов, а Claude сам выбирает, кого подключить для лучшего результата.
Забираем — Oh-My-ClaudeCode
Внутри несколько режимов работы:
• Autopilot — ставите задачу, дальше всё делает ИИ
• Ultrapilot — многопоточная работа, когда разные части проекта делаются параллельно
• Swarm — над задачей одновременно работает группа агентов
• Pipeline — чёткая последовательность шагов без лишних отклонений
• Ecomode — тяжёлые модели подключаются только при необходимости, экономя токены
Система может задействовать до 32 агентов, а Claude сам выбирает, кого подключить для лучшего результата.
Забираем — Oh-My-ClaudeCode
1👎9👍5
Forwarded from AI Projects (Vladimir Ivanov)
🔍 Очень важный пост с реверс-инжинирингом Claude Code по утечке его кода. Кратко пройдусь по тезисам.
1. Реальный статус успешности правок доступен только сотрудникам Anthropic. Обычные пользователи Claude Code получают ложноположительное заявление Claude об успехе примерно в 30% случаев.
Это связано с известным эффектом «доверчивости» ИИ к статусу операций без контекста. Я писал об этом в части работы с автотестами: нужно давать LLM больше информации, чем просто SUCCESS.
2. Скрытое от пользователя сжатие контекста после 167k токенов.
Причём сжатие не беспроблемное — с потерями названий важных объектов, типа имён переменных. Это одна из причин галлюцинаций Claude в Claude Code.
3. Требование к Claude принудительно упрощать архитектурные решения с целью писать код просто короче.
4. Claude Code уже сделан под рой ИИ-агентов, но часто это недоступно пользователю, т.к. он не знает лимит в 5 субагентов и 167k токенов на субагент, без чего параллелизм не работает.
5. Слепая зона на 2000 строк. Если ваши модули длиннее, то Claude может быть «ослеплён» не всегда хорошо работающим RAG-механизмом чтения чанками кода и просто галлюцинировать обрезанный код в Claude Code.
6. Ослепление Tools с результатами выше 50k символов. Наиболее критично для поиска агентом, т.к. если найдётся много, то агент попадает в preview, но Claude не знает об усечении, поэтому может сделать неверный вывод.
7. AST не применяется в Claude Code.
https://x.com/iamfakeguru/status/2038965567269249484
1. Реальный статус успешности правок доступен только сотрудникам Anthropic. Обычные пользователи Claude Code получают ложноположительное заявление Claude об успехе примерно в 30% случаев.
Это связано с известным эффектом «доверчивости» ИИ к статусу операций без контекста. Я писал об этом в части работы с автотестами: нужно давать LLM больше информации, чем просто SUCCESS.
2. Скрытое от пользователя сжатие контекста после 167k токенов.
Причём сжатие не беспроблемное — с потерями названий важных объектов, типа имён переменных. Это одна из причин галлюцинаций Claude в Claude Code.
3. Требование к Claude принудительно упрощать архитектурные решения с целью писать код просто короче.
4. Claude Code уже сделан под рой ИИ-агентов, но часто это недоступно пользователю, т.к. он не знает лимит в 5 субагентов и 167k токенов на субагент, без чего параллелизм не работает.
5. Слепая зона на 2000 строк. Если ваши модули длиннее, то Claude может быть «ослеплён» не всегда хорошо работающим RAG-механизмом чтения чанками кода и просто галлюцинировать обрезанный код в Claude Code.
6. Ослепление Tools с результатами выше 50k символов. Наиболее критично для поиска агентом, т.к. если найдётся много, то агент попадает в preview, но Claude не знает об усечении, поэтому может сделать неверный вывод.
7. AST не применяется в Claude Code.
https://x.com/iamfakeguru/status/2038965567269249484
X (formerly Twitter)
fakeguru (@iamfakeguru) on X
I reverse-engineered Claude Code's leaked source against billions of tokens of my own agent logs.
Turns out Anthropic is aware of CC hallucination/laziness, and the fixes are gated to employees only.
Here's the report and CLAUDE.md you need to bypass employee…
Turns out Anthropic is aware of CC hallucination/laziness, and the fixes are gated to employees only.
Here's the report and CLAUDE.md you need to bypass employee…
👍18👎4
Концепция такая: подключить AI-агента не просто к коду, а к живому приложению на девайсе. Агент видит реальный layout с Compose-иерархией, перехватывает сетевой трафик с момента запуска, мокирует HTTP и WebSocket ответы, и сам тапает по экрану. Всё через MCP.
Технически это одна
debugImplementation зависимость в приложении — библиотека внедряется в байткод и сразу пишет трафик и раскрывает UI-дерево без изменений в коде. На стороне агента поднимается MCP-сервер через CLI. Дальше агент сам: смотрит экран, анализирует запрос, ставит мок, тапает кнопку, проверяет результат — и докладывает.Интересная деталь — WebView и Chrome Custom Tabs не чёрный ящик, их DOM-дерево инжектится прямо в нативную иерархию. И трафик не надо предугадывать когда записывать — он пишется с первого же запроса.
Доступна версия 0.9.27, но идея рабочая. На мой взгляд это правильное направление для AI в мобильной разработке.
🔗 Статья про подход и либу
#Android #MCP #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍39👎4
GitHub
GitHub - AlexGladkov/claude-in-mobile: MCP server for mobile and desktop automation — Android (via ADB), iOS Simulator (via simctl)…
MCP server for mobile and desktop automation — Android (via ADB), iOS Simulator (via simctl), and Desktop (Compose Multiplatform). Like Claude in Chrome but for mobile devices and desktop apps - Al...
Даёшь задание: "проверь, что пользователь может залогиниться и попасть на главный экран". Агент берёт эмулятор, прокликивает приложение, сообщает что получилось. Примерно так работает claude-in-mobile.
Это MCP-сервер, который подключает Claude Code к Android-эмулятору, iOS Simulator, десктопным приложениям и браузеру. Агент видит экран, может тапать, свайпать, вводить текст, читать UI-дерево — и делает это по твоим инструкциям на обычном языке, без тест-скриптов.
Отдельно стоит отметить: уже есть поддержка Aurora OS. Для тех, кто разрабатывает под российскую мобильную платформу — агент умеет работать и с ней.
Сценарий простой:
👉 описываешь что нужно проверить
👉 агент прокликивает
👉 возвращает результат
Полезно для smoke-тестирования через агента, исследования приложения перед написанием автотестов или чтобы не переключаться между терминалом и эмулятором руками.
Проект открыт к участию сообщества — если есть идеи что добавить или доработать, создавайте issues в репозитории. PR тоже приветствуются.
#MCP #ClaudeCode #AndroidDev #AuroraOS #iOS #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎10
This media is not supported in your browser
VIEW IN TELEGRAM
Сделать аналог любого open source решения стало проще с сервисом Gitreverse, позволяющий получить промпт для создания аналого open source проекта.
Попробовал для своего небольшого проекта. Результат - маркетинговый промпт с презентаций, позволяющий получить счастье из пару предложений. И близко не дал нужного результата в Claude Code с Opus.
#AI #OpenSource
Попробовал для своего небольшого проекта. Результат - маркетинговый промпт с презентаций, позволяющий получить счастье из пару предложений. И близко не дал нужного результата в Claude Code с Opus.
#AI #OpenSource
👎7👍4
Числа впечатляют: 31B модель прямо сейчас на 3 месте в Arena.ai мировом лидерборде для open source. Главная фишка для мобилки — E2B и E4B модели. Это 2B и 4B параметров эффективной ширины, работают оффлайн на Pixel, Raspberry Pi и вообще на чём угодно.
Поддержка видео, аудио, 140+ языков нативно. Контекст 256K на больших моделях. Для кода работает хорошо — Google позиционирует как локальную альтернативу Claude Code и прочим облачным ассистентам.
🔗 Источник - google.blog
#ai #models #openmodels #locallm
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26👎5
This media is not supported in your browser
VIEW IN TELEGRAM
🔗 Источник - Cursor Blog
#Cursor
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎4
Пробую gemma4:26b через Claude Code на MacBook Pro 14" M3 Max/36GB/1TB и это пока печально. Не может справиться даже с тем чтобы удалить вмерженные ветки, что в целом простая и задача и чисто локальная по истории Git. Вообщем, надо искать подходящего агента где модель сможет работать с тулингом.
👎13👍4
Голый агент из коробки знает много, но не знает тебя. Без кастомизации стабильного результата не добиться — какие бы инструменты ты ни подключал.
Есть две вещи, которые нужно понять: где хранить и зачем это вообще нужно.
ГДЕ ХРАНИТЬ:
👉 Глобальные настройки пользователя (~/.claude)
👉 Проектный настройки (папка .claude/ в корне репозитория) — Хранит то что можно пошарить с командой или только для себя
👉 CLAUDE.md в поддиректориях — грузится, когда агент заходит в конкретную папку. Для специфики отдельных модулей.
Чем более верхнеуровневый файле тем меньше инструкции должны быть привязаны к специфичнам аспектам отдельной директории/проекта
ИНСТРУКЦИИ МОЖНО ПЕРЕДАТЬ ЧЕРЕЗ
👉 CLAUDE.md — "что мне важно знать про тебя, чтобы работать так, как ты ждёшь". Стиль, предпочтения, поведение в спорных ситуациях. Это рабочий договор. Подгружается автоматом там где работает агент, загружая все от более высокого уровня к частным
👉 Рулы — "что важно, когда я работаю в этих файлах или директории". Контекст под конкретный тип файла
👉 Агент — "кто я и что я умею". Профиль, экспертиза, зона ответственности.
👉 Скилл — "как именно делать вот эту операцию". Рецепт, не роль.
Путаница между этими четырьмя приводит к тому, что агент работает непредсказуемо. Как только расставляешь каждую вещь на своё место — поведение становится стабильным.
Без такой настройки — это как взять нового разработчика и ждать, что он сам догадается обо всех твоих стандартах.
🔗 Лучшие практики от Claude Code
🔗 Кастомизация и расширение возможностей Claude Code
#ClaudeCode #ЛучшиеПрактики #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👎4
Forwarded from NN
Anthropic создали Claude Mythos — самую крутую модель среди известных нейронок. Еще на тестах она нашла тысячи уязвимостей в популярном софте, включая ОС и бразуеры.
Mythos с отрывом обогнала Opus 4.6 во всех бенчмарках — в SWE-bench у Mythos 93,9% против 80,8% у Opus. По уровню модель не уступает команде топовых инженеров.
Доступ пока не открывают. В Anthropic боятся дать новый инструмент хакерам. Сначала Mythos будут тестить бигтехи.
Это уже AGI?
Mythos с отрывом обогнала Opus 4.6 во всех бенчмарках — в SWE-bench у Mythos 93,9% против 80,8% у Opus. По уровню модель не уступает команде топовых инженеров.
Доступ пока не открывают. В Anthropic боятся дать новый инструмент хакерам. Сначала Mythos будут тестить бигтехи.
Это уже AGI?
👎16👍9
NN
Photo
Модель однозначно крутая, будет рвать и метать, но не факт что нам дадут к ней доступ, а если и дадут то подписки за 200$ не хватит точно, так как ее токены будут уже даже не золотыми, а платиновыми
👍11👎5
Большинство AI-инструментов теряют контекст между сессиями. MemPalace решает это принципиально иначе: не пересказывает историю через LLM, а хранит всё дословно и индексирует в локальной базе.
Ключевая идея: вместо того чтобы сжимать воспоминания в резюме (с потерей деталей), система хранит последовательности и строит из них структуру домен → тема → конкретный фрагмент. По заявлениям авторов, такой подход даёт высокое качество лучше всех существующих подходов.
Подключается как обычный MCP-сервер к любому клиенту — Claude Desktop, Claude Code, Cursor, Codex CLI и другим. После этого агент получает 19 инструментов: поиск по памяти, навигация по структуре, запись в knowledge graph с временными метками, дневник агента. Можно также использовать напрямую через Python API или CLI.
Ещё есть AAAK — собственный сжатый диалект для передачи контекста в промпт: якобы 30x компрессия при сохранении смысла, эмоций и ключевых решений. Спорно, но интересно как идея.
Мне эта идея нравится именно потому что в неё заложено правильное предположение: LLM-резюме — это потеря информации. Verbatim хранение + векторный поиск честнее. Буду пробовать на реальных проектах — посмотрим, насколько работает на практике.
Отдельный прикольный факт:репозиторий принадлежит аккаунту Милы Йовович (той самой из фильмов Обитель Зла) — и судя по всему, это реально она, которая сделала библиотеку в паре с партнёром. Актриса, занявшаяся вайб-кодингом — это уже само по себе говорит кое-что о том, куда всё движется.
#MCP #память #оптимизация
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎6
Прямо то, что я искал и хотел! Видел наработку Леши Гладкова, но мне не хватило там определенных функций. Искал что-то подобное Codex, только для Claude Code, и вот оно! Поддерживает множество агентов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14👎12