Поляков считает: AI, код и кейсы
4.18K subscribers
313 photos
98 videos
197 links
Пишу про AI, вайбкодинг и кейсы применения. Связаться: @polyakovbest
Download Telegram
Opus 4.6: первые впечатления от того, кто уже сломал agent teams

Anthropic с третьей попытки (если верить слухам) выкатили Opus 4.6. Протестировал на реальных задачах, собрал грабли — делюсь.

🧠 Что нового в цифрах / бенчмаркетинг

Terminal-Bench 2.0 (агентный кодинг): 65,4% — первое место, но GPT-5.2-codex дышит в спину с 64,7%. На GDPval-AA (финансы, юриспруденция) разрыв серьёзнее: +144 Elo над GPT-5.2, побеждает в 70% случаев.

Контекстное окно выросло до 1М токенов (бета) — в 5 раз больше Opus 4.5. На тесте «иголка в стоге сена» (MRCR v2) — 76% против 18,5% у Sonnet 4.5. Но кому нужно такое контекстное окно, если работа с ним будет дорогой.

Цена не изменилась: $5/$25 за миллион токенов.

🔧 Что реально изменилось в работе

1️⃣ Генерация баннеров для Авито через fal.ai. У меня есть скилл для этого. Обычно из шести вариантов нормальные два. Opus 4.6 подумал и выдал все шесть годными.

2️⃣ Пересборка проекта с агентами ElevenLabs. Задача, к которой не хотелось подступаться — даже с ИИ-кодингом это не один день. Включил agent teams, и за 60 минут проект пересобран (1. со второй попытки, 2. e2e тестов не было, 3. возможно что из функциоонала проходят только тесты).

💡 Agent teams — рой агентов в Claude Code. Один сеанс становится тимлидом, остальные работают параллельно в своих контекстных окнах.


⚠️ Грабли, на которые я уже наступил

🔸 Agent teams работают на tmux → внутри tmux запускаются с ошибками. В Agent Deck рой не запустить.

🔸 Если написать тиммейту, пока его тормозит тимлид — вы в потерянном терминале. Убивайте сессию и продолжайте через resume.

🔸 Extended thinking жрёт токены со страшной силой. Проценты 5-часовых лимитов растут каждые 10 секунд. Для простых задач переключайте усилие на medium.

🔸 На Reddit уже посты «Opus 4.6 lobotomized» — жалуются на деградацию текстов при улучшении кодинга. Пока не подтверждаю, но имейте в виду.

🎁 $50 на попробовать

Anthropic раздаёт $50 кредита подписчикам Pro и Max. Условия: подписка оформлена до 4 февраля, забрать до 16 февраля. Settings → Usage → включаете Extra Usage — кредит применится автоматически. Тратить можно на Claude, Claude Code и Cowork. Сгорает через 60 дней.

Claude Code теперь пишет в persistent memory краткое изложение
CLAUDE.md
— похоже, фикс бага с одноразовым прочтением при инициализации. Память пишется и читается постоянно. Возможно, стоит придумать скилл для инъекций в неё при крупных сессиях.


Какую модель используете для кодинга — и замечали разницу между 4.5 и 4.6?

----

Поляков считает — AI, код и кейсы
2👍54🔥2
Claude Cowork падает при старте? Починка за 5 минут

Мне нравится Cowork: даёшь задачу, уходишь пить кофе, возвращаешься к результату. Если не брать в расчет, что не хватает многооконного режима, то есть лишь один нюанс: он регулярно ломается.

Классический симптом — при запуске вылетает:

Failed to start Claude's workspace
Your network traffic may be routing through a VPN...

VPN при этом может быть выключен. Перезапуск Claude и перезагрузка Mac не помогают. За две недели после релиза меня это задолбало. Решил разобраться как чинить.

🔍 Почему ломается

Cowork крутится в виртуальной машине на базе Apple Virtualization.framework. При обновлении Claude образ ОС внутри VM может повредиться — пропадают библиотеки, ломаются зависимости.

На GitHub у Anthropic десятки открытых issues:
битые образы после апдейтов,
конфликты с VPN,
зависания на «Sending request...».

💡 Ключевой инсайт: данные ваших сессий хранятся отдельно от образа ОС. Файл `sessiondata.img` (~120 МБ) — это ваш workspace. А `rootfs.img` (~10 ГБ) — это «мозги», которые легко пересадить.


🛠️ Суть решения: пересадка мозгов

1️⃣ Бекапим старую VM
2️⃣ Удаляем её, запускаем Claude — он скачивает свежий образ
3️⃣ Подменяем чистый sessiondata.img на старый
4️⃣ Запускаем — всё работает, все сессии на месте

Раньше я просто убивал VM целиком и терял данные. Оказалось, можно сохранить всё.

Быстрый фикс (если повезёт)

Иногда виноват зависший процесс гипервизора. Проверьте:


ps aux | grep "Virtualization.VirtualMachine"


Висит с высоким CPU — kill -9 <PID>, перезапускаем Claude. Не помогло — полный гайд по ссылке ниже.

📎 Полный гайд с командами:

https://telegra.ph/Claude-Cowork-VM--pochinka-pri-padenii-starta-02-06

Если вы пользуетесь Cowork и сталкивались с подобным — расскажите в комментариях, как решали. Может, у кого-то есть способ проще.

----

Поляков считает — AI, код и кейсы
1👍91😁1👌1
Об авторе: кто такой Поляков и зачем он считает

Меня зовут Александр Поляков. Помогаю бизнесу внедрять ИИ — от первых экспериментов до работающих систем в продакшене.

🤖 Чем занимаюсь

Консультирую по AI-трансформации: аудит процессов, выбор технологий, запуск пилотов. Строю RAG-базы знаний, агентные воркфлоу, автоматизации на LLM, обучаю команды.

У меня рекламное агентство и веб-студия, где ИИ уже встроен в процессы — от автоматической обработки минус-фраз в Директе до ревью договоров через Claude Code.

За плечами почти 20 лет в ИТ, 10+ лет в программировании (Python, Kotlin, Swift, C++). Многие решения проектирую и пишу сам.

🎓 Бэкграунд

Первое высшее — электрооборудование летательных аппаратов, ТулГУ. Магистерская про систему наведения ракеты. Не совсем AI, но я люблю говорить, что это был мой первый self-driving проект.

💼 С чем ко мне можно обратиться

🔸 Внедрение ИИ в бизнес — LLM-ассистенты, RAG-системы, агентные автоматизации, обучение команд

🔸 Автоматизация рутины — документы, аналитика, отчёты, всё, что отнимает часы и поддаётся алгоритмизации

🔸 Рекламные кампании — Яндекс.Директ, ВК, аналитика, когда реклама работает непредсказуемо

👨‍👩‍👧‍👦 Личное

Живу в Москве с женой Дашей — она тренирует команды по внедрению ИИ в рабочие задачи. В августе 2025 стали родителями.

Сложные настолки, сноуборд, фрирайд. Читаю каждый день больше 2 000 дней подряд.

🔗 Контакты

🤖 Про ИИ: ohmyai.ru
🤩 Про рекламу: aaarrr.agency
👋 Написать лично: @polyakovbest

P.S. Год назад я уже писал пост-знакомство, но Даша справедливо заметила, что по нему непонятно — ко мне можно прийти за ИИ или только за рекламой. Исправился.

----

Поляков считает — AI, код и кейсы
611👍9🔥7
Поляков считает: AI, код и кейсы pinned «Об авторе: кто такой Поляков и зачем он считает Меня зовут Александр Поляков. Помогаю бизнесу внедрять ИИ — от первых экспериментов до работающих систем в продакшене. 🤖 Чем занимаюсь Консультирую по AI-трансформации: аудит процессов, выбор технологий, запуск…»
Перестал описывать правки текстом — сделал GUI для скиллов

Некоторые скиллы Claude Code неудобно использовать текстом. Мой навык для картинок — как раз такой: чтобы поправить область на изображении, нужно описать словами что и где менять. «Убери фон в правом верхнем углу» — и молишься, что модель поймёт правильно.

А хочется просто обвести мышкой и написать комментарий.

Помните скилл Playground от Anthropic? Он как раз про это — оборачивает навыки в HTML-интерфейс. Но на практике: UI только на английском, CORS блокирует запросы к API, и вместо рабочего инструмента получаешь прослойку для копирования промптов.

Написал свой промпт, который это чинит.

⚙️ Как работает

Говоришь



/playground Сделай интерфейс для [скилл]
инструкция тут [ссылка на промпт из этого поста]



Всё агент разбирает скрипты навыка, находит эндпоинты и ключи, задаёт уточняющие вопросы и собирает три файла:

🔸 HTML-интерфейс (русский или английский на выбор)
🔸 Python-прокси для обхода CORS
🔸 скрипт start.sh для запуска одной командой

Запускаешь скрипт — браузер открывается, всё работает.

🖼 Демо: fal.ai скилл для картинок

Натравил промпт на свой навык генерации изображений. Получил редактор: drag & drop, рисование областей на canvas, прогресс генерации и история результатов — клик по миниатюре загружает её как новый исходник.

Вместо «сгенерируй → Finder → посмотри → терминал» — всё в одном окне.

🧠 Проблемы, которые промпт обходит сам

При сборке интерфейса для API натыкаешься на одни и те же ошибки: браузер блокирует запросы, файлы не подгружаются, API отвечает ошибками. Каждая мелочь — минус полчаса. Промпт знает про них заранее и генерирует код, который сразу работает.

А раз крутится сервер — можно прямо из интерфейса вызывать Claude Code. Нажал «Спросить Claude» → получил анализ → итерируешь дальше, не переключаясь в терминал.

🔗 Забирайте

Промпт: playground-builder.md

Работает с Claude Code, просто сошлитесь на инструкцию при формулировке задачи.

А какие задачи вам неудобно решать текстом? Может, им тоже нужен интерфейс.

----

Поляков считает — AI, код и кейсы
🔥12👍54
20 февраля покажу, как дать AI-агенту «руки» — воркшоп на конференции ROИИ

Меня позвали спикером на конференцию ROИИ 2026 — онлайн-ивент для тех, кто внедряет AI ради P&L, а не ради хайпа. 12 докладов за 2 дня, 19–20 февраля. Никакой воды про промпты — только цифры, архитектура и реальные боли внедрения.

🛠️ Что покажу я

Воркшоп на 60 минут про скиллы — штуку, которая превращает ChatGPT и Claude из «умного собеседника» в рабочий инструмент с доступом к реальным данным.

Разберём анатомию скилла на примере Вордстата — того самого, который стал самым залетевшим постом в истории канала. Покажу, как он устроен внутри, сделаем живое демо доработки, и главное — объясню, как адаптировать этот подход под любой API: от CRM до рекламных кабинетов.

💡 Готовый скилл и шаблон для создания своих уже лежат в открытом репозитории — заберёте после воркшопа. А на самом воркшопе разберёмся, почему это работает и как не наступить на грабли.


🎤 Про конференцию

Два дня, два трека. Первый день — продукт и стратегия: экономика AI-фич, трансформация команд, build vs buy. Второй — маркетинг и рост: автоматизация воронок, персонализация, founder-led контент.

Все спикеры — практики с реальными кейсами. Среди компаний — Битрикс24, Skyeng, DialogAI. Формат жёсткий: 30 минут контент, 10 минут Q&A, без длинных вступлений про историю ИИ.

Полный состав и программа — на лендинге.

📋 Как попасть

🔸 Бесплатно — при подписке на каналы спикеров через бота на сайте.
🔸 Платно — если не хотите подписываться или нужен сертификат.

👉 Зарегистрироваться и забрать билет

Увидимся 20 февраля!

----

Поляков считает — AI, код и кейсы
17🔥7👍4
Домашний ИИ-бот, который заказывает продукты из ВкусВилл

С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.

Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.

🧠 Opus — дорого даже для домашнего бота

Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.

Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix

Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.

💡 OpenClaw имеет встроенную поддержку Kimi Coding — не нужно возиться с эндпоинтами. Указал модель, прописал ключ — работает.


🛒 MCP ВкусВилл: ищет, но не проверяет наличие

MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.

Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.

🔧 Решение: Puppeteer рядом с Docker

Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.

Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.

💰 Стоимость: ~$33 в месяц

🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки

Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.

🔒 Безопасность

Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.

📦 Гайд со всеми граблями

Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide

Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.

----

Поляков считает — AI, код и кейсы
4🔥39👍1211
Поляков считает, что он победил управляющую компанию

Разогнался с навыками для OpenClaw и заметил неэффективность: чтобы курьер Вкусвилл попал к нам домой, надо зайти в приложение УК и заказать пропуск. Иначе — пропущеные звонки, недоставленные заказы и нервы.

Наш Домпульт ужасен: 5 экранов ради одного пропуска. А гостевой паркинг — вообще боль: слоты по 30 минут, максимум 3 за раз, по мере освобождения можно ещё 3. Без пропуска — предупреждение, потом бан.

🔍 Charles Proxy: приложение для отладки трафика

Проблема: у приложения УК нет публичного API. Но любое приложение общается с сервером по HTTP. Я посмотрел сетевой трафик своего аккаунта на своём устройстве, чтобы понять, что делает приложение.

Charles Proxy — прокси для мониторинга сетевых запросов. Настроил отладочный прокси — и стало видно, какие запросы и параметры уходят при обычных действиях.

💡 Делаешь действие в приложении — и становится понятно, какие сетевые вызовы за ним стоят.


Нюанс: не уверен, что утилита работает с Андроид.

⚙️ Что автоматизировал

🔸 Парсинг новостей УК: закрытие проездов, ремонт, отключения
🔸 Заказ пропусков для курьеров и гостей
🔸 Бронирование парковочных мест
🔸 Связка: заказ во ВкусВилл → пропуск для курьера

Всё это доступно мне в приложении — бот просто повторяет те же действия, но без лишних экранов.

Последний пункт — главный. Бот собирает корзину, проверяет наличие и сам заказывает пропуск на время доставки.

🤦 Про вчерашний Puppeteer

Вчера городил безголовый Chrome с авторизацией для проверки наличия товаров ВкусВилл. Но можно было бы и по другому. Хотя и сложнее в разы.

📌 Итого

Бот теперь умеет: искать продукты → проверять наличие → собирать корзину → заказывать пропуск курьеру. Полный цикл от «хочу форель» до «курьер у двери».

Расскажите, уже пробовали бытовую автоматизацию через ИИ?

----

Поляков считает — AI, код и кейсы
5🔥499👍5😱1
И почему я этого не знал: голосовой ввод для AI-агентов

Я печатаю промпты руками. Всегда. Привычка за 20 лет в IT — клавиатура как продолжение мозга. Даже мысли не возникало, что можно по-другому.

А потом случилось два события подряд.

Даша пыталась работать с Claude Code, держа на руках ребёнка. Одна рука свободна, клавиатура недоступна — задача простая, а ввести промпт невозможно. Она первая сказала: «Почему нельзя просто надиктовать?»

Через пару дней на зуме с @oestick я увидел, что он не печатает промпты, а надиктовывает. Спросил — как? Оказалось, Wispr Flow.

🎙️ Что это такое

Нажимаешь fn на маке, говоришь — текст появляется где стоит курсор. Claude Code, Cursor, Telegram, браузер — без разницы.

Но главное не транскрипция, а постобработка. Flow убирает слова-паразиты, расставляет пунктуацию, форматирует под контекст приложения, но пока не оценил.

Еще из крутого — шорткаты. У меян очень много сообщений вроде: «У нас тут кончаются средства, прикладываю счет», можно сократить до голосововго ввода.

🧐 Правда если шорткат попадет внутрь текста — тоже распакуется, проверено.


Поддерживает 100+ языков, включая русский.

💰 Сколько стоит

Бесплатно: 2 000 слов в неделю — хватит попробовать.
Pro: $15/мес за безлимит и Command Mode (голосовое редактирование: «сделай формальнее», «переведи на английский»). При годовой оплате — $12/мес.

🚀 Почему это важно для работы с AI

Когда работаешь с Claude Code или Cursor, ты не пишешь код — ты объясняешь задачу. Описываешь контекст, уточняешь требования, корректируешь. По сути, разговариваешь.

💡 Мы привыкли: программирование = клавиатура. Но с AI-агентами ты не кодишь, а ставишь задачи. А задачи голосом ставить быстрее и точнее. Проявляются больше деталей.


⚠️ Нюансы

Всё через облако — аудио уходит на серверы. Есть Privacy Mode с нулевым хранением, но если параноите — учтите. Ещё потребляет ~800 МБ оперативки в фоне.

Какими приложениями пользовались для ввода промптов

----

Поляков считает — AI, код и кейсы
677🔥13👍104💩4💯21
Как я проверяю, готов ли человек работать с AI

Всё больше компаний добавляют «AI-компетенции» в грейды. Сбер уже требует базовые AI-навыки при найме на любую позицию. Звучит правильно. Но что именно проверять — вопрос открытый.

🏦 Типичный подход: галочки

Недавно видел презентацию одного банка, где AI-компетенции для менеджеров и проектных команд выглядели примерно так: «знает, что LLM может галлюцинировать», «понимает важность приватности данных», «умеет формулировать промпты».

Это важные вещи, но скорее гигиенический минимум. Примерно как оценивать водителя по знанию того, что аварии бывают. Вопрос в том, что проверять дальше — и тут у каждого свой подход.

🎯 Мой подход: два вопроса

Я собеседую продакт-менеджеров — людей, которые должны применять ИИ в продуктах. У меня два любимых вопроса, один из которых я задаю всегда.

Вопрос 1: Расскажи свой самый интересный проект или опыт работы с AI

Не «какими инструментами пользуешься» или «покажи проекты». Нужен конкретный процесс: что за задача, какие шаги, что получилось.

А потом: что в этом процессе не так и как его улучшить?

Люблю, когда человек начинает разбирать узкие места: тут теряется контекст, тут ручная проверка, тут можно автоматизировать. Для меня критическое мышление важнее любого инструмента или дорогой подписки.

Вопрос 2: Задача на сортировку

Есть 500 элементов, нужно отранжировать по нечёткому критерию с помощью LLM. Как будешь делать?

💡 Смотрю на два момента: уходит ли человек от «bulk»-подхода (сгрузить всё в модель одним промптом) и доходит ли до идеи скоринга или сравнений.


Кто-то декомпозирует критерий на метрики, кто-то предлагает батчи с попарными сравнениями, кто-то придумывает формулу. Писал подробнее об этих методах раньше (тут, Хабр). Идеального ответа нет — интересен сам ход мысли.

И снова: какие недостатки у твоего метода? Где сломается?

🧠 Почему именно эти вопросы

Оба проверяют одно: умение думать, а не пользоваться. Инструменты устаревают за месяцы — способность рассуждать о процессе остаётся.

Понятно, что мои два вопроса — не истина в последней инстанции. Скорее отправная точка. Наверняка у вас есть свои способы понять, готов ли человек работать с AI.

Расскажите — как вы это проверяете?
Что спрашиваете на собеседованиях? Какие задачи даёте?

-----

Поляков считает — AI, код и кейсы
417👍10🔥5👎31🤡11
Директологам приготовиться, часть 2: аудит кампаний через Claude

Скилл Вордстата из прошлого поста оказался только началом. Я добавил полноценный аудит рекламных кампаний — выгружаете кампанию из Яндекс Директа в Excel, скармливаете Claude, он находит дыры в семантике.

🧠 Как устроен подход

Каждая группа объявлений раскладывается на слоты: объекты (что продаём), действия (купить, заказать), модификаторы (ретро, винтажный) и дополнительные (в москве, недорого).

Из слотов собирается OR-запрос для Вордстата. Claude расширяет каждый слот — синонимы, транслит, разговорные формы — и сравнивает спрос «до» и «после».

💡 Расширение зависит от типа группы. Транзакционную расширяем действиями и модификаторами. Брендированную — только транслитом. Навигационную — станциями метро. Одна стратегия на всё не работает. Не хватает еще логики для микрозапросов товарных групп. Добью.


🔍 Что система делает сама

🔸 Парсит XLSX из Директа, понимает структуру групп и минус-слова
🔸 Сегментирует фразы на слоты и определяет тип группы
🔸 Расширяет OR-схему и замеряет дельту через Вордстат
🔸 При дельте >200% проверяет топ выдачи на мусор
🔸 Генерирует ссылки на редактирование группы в Директе

В Claude Code группы обрабатываются параллельно через субагентов. 13 групп — ~3 минуты.

📊 Пример из реального аудита

Кампания по глобус-барам. Группа «Со столом» — +71% упущенного спроса: люди ищут «глобус столик», а не «глобус бар со столиком».

В группе «Грамофон» формально +102%, но Claude нашёл в топе «Золотой Грамофон» и Авито — реальный рост после чистки +30–40%.

А ещё всплыл ресторан «Бар-Мангал Глобус» в Луге — ~129 мусорных показов, о которых вручную никто бы не подумал.

⚙️ Как попробовать

1️⃣ Настройте скилл Вордстата из первого поста
2️⃣ Директ → Инструменты → Управление с помощью Excel → выгрузить кампанию
3️⃣ Загрузите .xlsx в Claude и попросите исследовать упущенный спрос. Триггер-слово именно такое.

Скилл: https://github.com/artwist-polyakov/polyakov-claude-skills/tree/main/plugins/yandex-wordstat/skills/yandex-wordstat

🤖 MISSED_DEMAND.md — это инструкция для ИИ-агента: как думать о рекламных кампаниях. Методологию пишешь один раз — а агент воспроизводит её на каждой кампании. Любой агент с доступом к Wordstat API может по ней работать.

Кто попробует — кидайте результаты в комменты. Кто хочет добавить экспертизы в skill — добро пожаловать в Pull Requests.

----

Поляков считает — AI, код и кейсы
3🔥299👏8🥱1