Обвес вокруг модели, будь то CLAUDE.md, AGENTS.md, hooks или skills, не нейтрален. Anthropic в статье про Claude Code в больших проектах прямо говорит: слишком много контекста в каждой сессии деградирует качество, а лишние правила в корневом файле просто превращаются в шум.
Отсюда главное: harness нужно держать в балансе. Давать модели только то, что реально необходимо, и убирать всё остальное. Корневой файл — это указатели и критичные подводные камни, не больше. Чем меньше лишнего, тем точнее агент.
При этом баланс не статичен. Модели развиваются быстро, и то, что было необходимой подсказкой для прошлой модели, для новой уже шум. Свежая модель часто вытягивает больше сама, без правил, которые раньше держали агента в рамках. Поэтому обвес приходится регулярно пересматривать и минимизировать заново. Даже две модели одного вендора тянут задачи по-разному, и держать на них один неизменный конфиг не очень честно.
Я прочувствовал это на своём flow. Собрал воркфлоу для ИИ-кодинга, всё работало, показывал его на Boosty. А в какой-то момент агент начал стабильно уходить в плохой сценарий. Никита @nek12 подсказал посмотреть на задачу иначе, я пересобрал подход, убрал лишнее, и результаты заметно выросли. Подробно этот разбор скоро покажу отдельно.
В командах к этому добавляется ещё шаг: весь harness стоит распространять через плагины или хранить прямо в проекте в GIT, чтобы он был общим. Тогда баланс настраивает не каждый под себя, а команда централизованно, и улучшение прилетает всем сразу.
Регулярная ревизия обвеса прямо сейчас — одна из самых полезных привычек в работе с агентами. Не наращивать правила, а искать минимум, на котором модель работает лучше всего.
#AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22👎1
В статье про работу в больших проектах Anthropic объясняет: агентный поиск, то есть обход файлов, grep и переход по ссылкам, надёжнее RAG, потому что у RAG индекс устаревает быстрее, чем команда коммитит. С этим сложно спорить.
Но у grep есть обратная сторона. Он на порядок медленнее индекса и находит не всегда, особенно когда паттерн размытый, а кодовая база большая. Агент по сути работает с кодом как с плоским текстом, без понимания его структуры.
Поэтому к агенту полезно подключать что-то поверх. Я, например, использую AST Index. Есть и более серьёзные наработки: у Виталика есть инструмент Vibe Analyzer, который строит и поддерживает базу знаний о коде специально под агента. С такой надстройкой агент работает на совсем другом уровне.
И вот тут начинается самое интересное. JetBrains годами вкладывалась в индексацию кода, поиск, анализ изменений. На этой базе можно собрать агента, который понимает структуру кода, а не видит в нём набор строк. По экспертизе вокруг кода у JetBrains карты сильнее, чем у кого-либо.
Параллельно классические IDE постепенно вымирают, шаг за шагом. Разработка уходит либо в CLI, что хардкорно для инженера, либо в визуальный интерфейс (Cursor, Codex, Claude App). Даже OpenAI втянул Codex прямо в ChatGPT, потому что видит: пользователи будут работать именно так. Встроить в такой интерфейс настоящий инструментарий для разработчиков — большой шаг.
Мне кажется, связка ИИ с серьёзным инструментарием вокруг кода — это направление, где выигрыш будет самым крупным, и JetBrains здесь способна сделать больше всех. Куда всё вырастет, вопрос пока открытый. Очень интересно, как на это смотрят те, кто уже строит подобные надстройки над агентом.
#ClaudeCode #AI #JetBrains
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18👎1
JetBrains совместно с Zed Industries выкатили открытый протокол Agent Client Protocol (ACP). Идея простая: сделать так, чтобы любой AI-агент (Claude Code, Cursor, Gemini CLI, Copilot и т.д.) мог работать в любой IDE без уникальных плагинов. По сути, это LSP для мира AI.
Для пользователя это выглядит как встроенный реестр агентов прямо в IDE. Выбрал нужного, нажал «Install» — и он тут же появляется в окне AI-чата JetBrains. Никакой ручной возни с конфигами.
Список уже внушительный: Claude Code, Cursor Agent, Gemini CLI, GitHub Copilot, Mistral Vibe, OpenCode, Qwen Code... Ставка — на свободу выбора и отсутствие привязки к вендору.
JetBrains явно пытается стать инфраструктурным слоем, через который разработчики будут взаимодействовать с любыми AI-ассистентами. То есть не просто «наша IDE с нашим AI», а «ваша любимая IDE как хаб для любых AI». Вендоры нейтральны, всё открыто, реестр пополняется.
Звучит логично, но... Моё мнение: находиться в IDE больше нет смысла
ACP, при всей его технологической красоте, выглядит как попытка реанимировать уходящую парадигму. Сама IDE — слишком сложный и тяжёлый профессиональный инструмент. А AI-агенты всё сильнее смещают фокус с процесса написания кода на управление результатом.
Зачем мне монструозная IntelliJ IDEA, если агент сам может выполнить задачу, отрепортить и даже задеплоить, работая фоном в CLI или в лёгком веб-интерфейсе? IDE, с её бесконечными индексациями, плагинами и интерфейсным шумом, начинает казаться пережитком.
JetBrains делает ставку на то, что разработчик останется «главным», а код должен быть контролируемым и обратимым. Но будущее, кажется, идёт в сторону «агент делает — я только утверждаю». И для этого полноценная среда разработки уже не нужна. Достаточно терминала, чата и, может быть, легковесного редактора для быстрых правок.
Поэтому вся эта гонка протоколов выглядит скорее как попытка удержать пользователей внутри привычного софта, пока рынок неспешно утекает в сторону минимализма и агентных рантаймов.
Интересно, сколько лет ещё мы будем запускать IDE ради того, чтобы просто написать промпт?
Please open Telegram to view this post
VIEW IN TELEGRAM
👎46👍16
Forwarded from Android Broadcast
Media is too big
VIEW IN TELEGRAM
Опубликовал запись своего выступления с конференции Mobius Москва Весна 2026 в Москве. Рассказал о своём пути адаптации к ИИ, какие вызовы пришлось решать и как я менял отношение и подход к работе с ИИ, чтобы достигать ожидаемых результатов при разработке программного обеспечения.
#Mobius #AI #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16👎4
Pr Review Toolkit - это не просто плагин, а набор из 6 специализированных агентов, которые превращают скучную проверку кода в детальный аудит. Я использую плагин для ревью кода, который пишут другие ИИ-агенты, а также для проверки изменений моих коллег — и он находит действительно крутые кейсы, подчищая код до блеска.
Вот что умеет каждый субагент:
👁
comment-analyzer – проверяет, не врут ли комментарии. Анализирует, соответствует ли документация реальности, и ищет устаревшие пояснения, которые превратились в техдолг.🧪
pr-test-analyzer – анализирует не просто покрытие строк, а то, насколько хорошо тесты проверяют логику и граничные случаи.🤫
silent-failure-hunter – охотник за «тихими» ошибками. Находит пустые блоки catch, неправильную обработку исключений и проблемы с логированием, которые могут "убить" продакшен незаметно.📐
type-design-analyzer – оценивает качество дизайна типов (например, в TypeScript). Ставит оценки по шкале от 1 до 10 за инкапсуляцию и полезность типа.📋
code-reviewer – общий ревьювер, который сверяет код с гайдами проекта, ищет баги и нарушения стиля.🧹
code-simplifier – мой любимый «чистильщик». Он берёт работающий, но сложный код и упрощает его, делая понятнее, без потери функциональности.Каждым агентом можно пользоваться по отдельности, просто задав вопрос в Claude Code, или запустить всех разом для тотальной проверки PR. Установка из официального магазина
#AI #ClaudeCode #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29👎5
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👎8
#AI #ClaudeCode
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👎6
This media is not supported in your browser
VIEW IN TELEGRAM
Заявляют что теперь сможет держать сессии дольше (у меня вчера на Opus 4.7 было 15 часов)
Также будет меньше останавливаться и задавать вопросы, сможет больше сам принимать решения.
Написали "делать вызовы как опытный инженер"
Также будет меньше останавливаться и задавать вопросы, сможет больше сам принимать решения.
Написали "делать вызовы как опытный инженер"
👍5👎2
#AI #ClaudeCode #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎5
Каждый день по несколько раз сталкиваюсь с проблемой "API Error" в Claude Code. Бывает что приходится ждать минут по 5 чтобы сессия вернулась к жизни, если вовсе не запускать заново (исключительные ситуации).
💬 У вас часто видится такая ошибка?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎13
Переход из Claude Code в... ? Мне все хвалят решение XXX и советуют перейти на него.
Я не вижу смысла переходить на OpenAI, потому что вижу смену одного поставщика закрытых моделей на другого. Потенциально интересно Cursor, потому что они игрок, независимый от производителя моделей. Хвалят их Composer.
💬 Есть реальные истории кто перешел с Агента X на Y для полного цикла разработки фичей и получил в чем-то улучшение (хоть в цене подписки)?
Я не вижу смысла переходить на OpenAI, потому что вижу смену одного поставщика закрытых моделей на другого. Потенциально интересно Cursor, потому что они игрок, независимый от производителя моделей. Хвалят их Composer.
Please open Telegram to view this post
VIEW IN TELEGRAM
👎9👍6
🤔 Nvidia сделала RTX-ноутбуки на ARM — и я не понимаю, зачем именно ноутбук.
Суть анонса: чипы с CUDA-ядрами и NPU для локального запуска моделей, ноутбуки собирают сторонние вендоры. Идея — полностью локальные AI-агенты, никакой зависимости от облака. Это правильное направление.
Но сравнивать с Apple тут некорректно. Apple сделала unified memory architecture: CPU, GPU, NPU в одном кристалле с общей памятью — это фундаментально иная эффективность. Nvidia добавляет свой GPU/NPU к стороннему ARM CPU. Разные вещи по тепловыделению и latency.
И вот здесь вопрос: у меня MacBook M3 Max с его NPU греется при серьёзных задачах. А что будет с RTX-ноутбуком под inference? Плюс цена, плюс охлаждение, плюс ты прикован к этой машине.
Мне DGX Spark изначально нравился больше как концепция: небольшой сервер у себя дома, подключаешься с чего угодно, задачи выполняются там. Никакого перегрева в руках, нет компромисса между мощностью и портативностью.
Тренд правильный — компьютеры трансформируются в агентные платформы, которым не нужен доступ в сеть. Но форм-фактор под этот сценарий, на мой взгляд, не должен быть ноутбук.
Буду смотреть на первые устройства. Особенно интересно, сколько это будет стоить.
#nvidia #AI
Суть анонса: чипы с CUDA-ядрами и NPU для локального запуска моделей, ноутбуки собирают сторонние вендоры. Идея — полностью локальные AI-агенты, никакой зависимости от облака. Это правильное направление.
Но сравнивать с Apple тут некорректно. Apple сделала unified memory architecture: CPU, GPU, NPU в одном кристалле с общей памятью — это фундаментально иная эффективность. Nvidia добавляет свой GPU/NPU к стороннему ARM CPU. Разные вещи по тепловыделению и latency.
И вот здесь вопрос: у меня MacBook M3 Max с его NPU греется при серьёзных задачах. А что будет с RTX-ноутбуком под inference? Плюс цена, плюс охлаждение, плюс ты прикован к этой машине.
Мне DGX Spark изначально нравился больше как концепция: небольшой сервер у себя дома, подключаешься с чего угодно, задачи выполняются там. Никакого перегрева в руках, нет компромисса между мощностью и портативностью.
Тренд правильный — компьютеры трансформируются в агентные платформы, которым не нужен доступ в сеть. Но форм-фактор под этот сценарий, на мой взгляд, не должен быть ноутбук.
Буду смотреть на первые устройства. Особенно интересно, сколько это будет стоить.
#nvidia #AI
👍12👎3
До этого мультимодальные модели работали так: картинку сначала обрабатывает отдельный блок, аудио тоже через свой. Каждый такой блок ест память и добавляет задержку. Gemma 4 12B делает это без посредников. Картинка и звук идут прямо в модель. Один пайплайн для всего.
На практике это значит меньше памяти под инфраструктуру и выше скорость отклика. Модель запускается на железе с 16GB VRAM (не потребляет, а столько оперативки в компе надо) или unified memory, то есть MacBook Pro с M3 тянет без проблем. Apache 2.0, весы на Hugging Face и Kaggle, запуск через Ollama или LM Studio.
Задачи, которые это открывает:
👉 локальный агент с пониманием скриншотов и голоса
👉 анализ изображений без отправки данных в облако
👉 голосовой ввод прямо в агентный пайплайн.
Для тех, кто строит агентов с приватными данными или просто не хочет зависеть от API-ключей и облачных лимитов — это рабочий вариант.
Мне интересно попробовать именно в связке с локальным агентом: один инстанс, текст плюс скриншот плюс аудио, без облака. Посмотрим, насколько это работает на практике, а не только на бенчмарках.
🔗 Оф анонс
#AI #Gemma
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26👎1
MiniMax выпустили модель M3. Это первая open-weight модель, которая сочетает три вещи сразу: контекст в миллион токенов, нативная мультимодальность (видео и картинки), и кодинг на уровне топовых закрытых моделей.
Главная техническая фишка — новая архитектура внимания MSA. Она позволяет работать с миллионом токенов без квадратичного роста вычислений: в 20 раз меньше compute на токен, prefill быстрее в 9 раз.
На SWE-Bench Pro модель набирает 59%. Больше GPT-5.5, больше Gemini 3.1 Pro. Но MiniMax аккуратно сравнивают себя с Opus 4.7, игнорируя 4.8 — а там разрыв уже 10 пунктов. Это не "почти на уровне Claude", это "хороший уровень, но не frontier". Даже Opus 4.6 делом круто, поэтому некритично.
Есть два интересных нюанса.
1️⃣ Первый: большинство бенчмарков они гоняли через Claude Code как scaffolding. То есть результаты конкурента получены с помощью инструмента Anthropic.
2️⃣ Второй: у них теперь есть свой агент — MiniMax Code. Прямой конкурент Claude Code. Демки впечатляют — 24-часовая оптимизация CUDA-ядра, 12-часовое воспроизведение научной статьи без участия человека.
Цена в 10-15 раз дешевле Claude Opus и GPT-5.5.
#AI #MiniMax
Главная техническая фишка — новая архитектура внимания MSA. Она позволяет работать с миллионом токенов без квадратичного роста вычислений: в 20 раз меньше compute на токен, prefill быстрее в 9 раз.
На SWE-Bench Pro модель набирает 59%. Больше GPT-5.5, больше Gemini 3.1 Pro. Но MiniMax аккуратно сравнивают себя с Opus 4.7, игнорируя 4.8 — а там разрыв уже 10 пунктов. Это не "почти на уровне Claude", это "хороший уровень, но не frontier". Даже Opus 4.6 делом круто, поэтому некритично.
Есть два интересных нюанса.
Цена в 10-15 раз дешевле Claude Opus и GPT-5.5.
#AI #MiniMax
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Забирайте записи с ДевФеста — devfest.ru
26 сессий о том, как реально применяют ИИ в разработке: лучшие практики, безопасность ИИ-агентов, опыт создателей стандартов и инженеров, стоящих за технологиями, которыми мы пользуемся каждый день.
👉 Доступ к записям:
Бесплатно — за подписку на каналы
Через Timepad — по цене Claude Max
#реклама
26 сессий о том, как реально применяют ИИ в разработке: лучшие практики, безопасность ИИ-агентов, опыт создателей стандартов и инженеров, стоящих за технологиями, которыми мы пользуемся каждый день.
👉 Доступ к записям:
Бесплатно — за подписку на каналы
Через Timepad — по цене Claude Max
#реклама
👎17👍3
Forwarded from Android Broadcast
🔴 Созвон Закрытого Сообщества. Жаркая дискуссия: какой агент лучше. Best practices, ошибки и как работать с ИИ.
Гость — Никита @Nek.12. Один из немногих в русскоязычном сообществе, у кого я реально нашел много интересного для работы с ИИ. Никита не использует Claude Code, Codex или Cursor. Он написал своего агента с нуля. Builder — это CLI-хarness с супервайзером, скиллами, Docker-сэндбоксингом, клиент-серверной архитектурой и возможностью гонять агента автономно сутками. Всё сам. На Kotlin-бекенде. В одиночку.
У нас принципиально разные подходы. Я работаю с Claude Code, активно использую MCP-серверы и верю в это. Никита написал статью "MCP is Deprecated" и считает, что сложные агентные оркестраторы — это микроменеджмент, который мешает модели работать.
Будем разбираться, кто прав. Или оба правы по-своему. Или оба не правы.
Формат — живой разговор, вы можете задавать вопросы в чате прямо во время эфира.
🪙 Стрим пройдет для платных подписчиков на Boosty
#AndroidBroadcast #LIVE
Гость — Никита @Nek.12. Один из немногих в русскоязычном сообществе, у кого я реально нашел много интересного для работы с ИИ. Никита не использует Claude Code, Codex или Cursor. Он написал своего агента с нуля. Builder — это CLI-хarness с супервайзером, скиллами, Docker-сэндбоксингом, клиент-серверной архитектурой и возможностью гонять агента автономно сутками. Всё сам. На Kotlin-бекенде. В одиночку.
У нас принципиально разные подходы. Я работаю с Claude Code, активно использую MCP-серверы и верю в это. Никита написал статью "MCP is Deprecated" и считает, что сложные агентные оркестраторы — это микроменеджмент, который мешает модели работать.
Будем разбираться, кто прав. Или оба правы по-своему. Или оба не правы.
Формат — живой разговор, вы можете задавать вопросы в чате прямо во время эфира.
#AndroidBroadcast #LIVE
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29👎4