This media is not supported in your browser
VIEW IN TELEGRAM
5 уровней автономности агентов. Не абстракция — шкала, по которой строят продакшн.
L0 Script — фиксированный flow, никаких решений
L1 Supervised — каждый шаг через confirm
L2 Gated — только необратимые действия требуют подтверждения
L3 Autonomous — полная свобода + audit log
L4 Swarm — агенты создают агентов
Claude Code работает на L2. Деплой с --dangerously-skip-permissions переводит на L3.
На каком уровне ваш агент?
L0 Script — фиксированный flow, никаких решений
L1 Supervised — каждый шаг через confirm
L2 Gated — только необратимые действия требуют подтверждения
L3 Autonomous — полная свобода + audit log
L4 Swarm — агенты создают агентов
Claude Code работает на L2. Деплой с --dangerously-skip-permissions переводит на L3.
На каком уровне ваш агент?
This media is not supported in your browser
VIEW IN TELEGRAM
Свой MCP сервер за 30 минут. TypeScript SDK + PostgreSQL.
❶ npm init @mcp/create
❷ Описываешь tool: name, description, input schema
❸ Подключаешь к Claude: mcp.json
20 строк кода — и Claude видит твою базу данных. Не через промпт-хаки. Через типизированный протокол.
В экосистеме уже 10,000+ серверов. OpenAI, Google DeepMind, HuggingFace приняли MCP как стандарт.
Tool annotations расскажут модели что инструмент делает ДО вызова. Меньше ошибок, точнее routing.
❶ npm init @mcp/create
❷ Описываешь tool: name, description, input schema
❸ Подключаешь к Claude: mcp.json
20 строк кода — и Claude видит твою базу данных. Не через промпт-хаки. Через типизированный протокол.
В экосистеме уже 10,000+ серверов. OpenAI, Google DeepMind, HuggingFace приняли MCP как стандарт.
Tool annotations расскажут модели что инструмент делает ДО вызова. Меньше ошибок, точнее routing.
This media is not supported in your browser
VIEW IN TELEGRAM
🔄 Этот канал собирает метрики о себе.
metrics.py → Telegram API → JSON каждый день:
▸ views, forwards, reactions — на каждый пост
▸ subscriber delta — приросты по часам
▸ engagement rate — views/subscribers
▸ best-performing topics — что резонирует
Нет дашборда. Есть 84 строки Python и честные цифры.
Если пост набирает <50% от среднего — анализ. Если >150% — повторить формат.
Продакшн-мониторинг. Для Telegram-канала.
metrics.py → Telegram API → JSON каждый день:
▸ views, forwards, reactions — на каждый пост
▸ subscriber delta — приросты по часам
▸ engagement rate — views/subscribers
▸ best-performing topics — что резонирует
Нет дашборда. Есть 84 строки Python и честные цифры.
Если пост набирает <50% от среднего — анализ. Если >150% — повторить формат.
Продакшн-мониторинг. Для Telegram-канала.
This media is not supported in your browser
VIEW IN TELEGRAM
System prompt 4,000 токенов. 100 вызовов в час. $0.045 × 100 = $4.50/час.
С prompt caching: cached input = $0.30/MTok вместо $3.00.
Тот же system prompt → $0.45/час. Минус 90%.
Кэш живёт 5 минут (300 секунд). При стабильном трафике — бесконечно.
Условие: ≥1,024 токена в кэшируемом блоке. Порядок блоков фиксирован.
Multi-agent система из 5 агентов с общим system prompt: один кэш делят все. $0.09/час вместо $22.50.
С prompt caching: cached input = $0.30/MTok вместо $3.00.
Тот же system prompt → $0.45/час. Минус 90%.
Кэш живёт 5 минут (300 секунд). При стабильном трафике — бесконечно.
Условие: ≥1,024 токена в кэшируемом блоке. Порядок блоков фиксирован.
Multi-agent система из 5 агентов с общим system prompt: один кэш делят все. $0.09/час вместо $22.50.
This media is not supported in your browser
VIEW IN TELEGRAM
Агент работал 2 часа. Упал. Начал сначала.
Checkpointing решает это:
▸ Каждые N шагов — snapshot состояния
▸ Crash → resume с последнего checkpoint
▸ Compaction: 10 checkpoint → 1 сжатый
В Claude Code это /compact. В кастомных агентах — ваша ответственность.
Минимальный checkpoint: conversation history + tool state + file mutations. Сериализуешь в JSON, кладёшь в .session/.
Агент без чекпоинтов — как код без git. Работает, пока не перестанет.
Checkpointing решает это:
▸ Каждые N шагов — snapshot состояния
▸ Crash → resume с последнего checkpoint
▸ Compaction: 10 checkpoint → 1 сжатый
В Claude Code это /compact. В кастомных агентах — ваша ответственность.
Минимальный checkpoint: conversation history + tool state + file mutations. Сериализуешь в JSON, кладёшь в .session/.
Агент без чекпоинтов — как код без git. Работает, пока не перестанет.
1💯3
This media is not supported in your browser
VIEW IN TELEGRAM
200 источников → 15 релевантных → 3 deep-dive. Воронка агентного поиска.
Паттерн Wide→Narrow:
▸ Scout (Haiku): 200 URL → grep по ключевикам
▸ Filter (Sonnet): 15 кандидатов → скоринг
▸ Deep-Dive (Opus): 3 лучших → полный анализ
Каждый этап отсекает 90% шума.
Дешёвая модель фильтрует, дорогая — думает.
Мы используем это в нашем боте: 21 канал → keyword filter → один маршрут.
Широко собрать. Узко отдать.
Паттерн Wide→Narrow:
▸ Scout (Haiku): 200 URL → grep по ключевикам
▸ Filter (Sonnet): 15 кандидатов → скоринг
▸ Deep-Dive (Opus): 3 лучших → полный анализ
Каждый этап отсекает 90% шума.
Дешёвая модель фильтрует, дорогая — думает.
Мы используем это в нашем боте: 21 канал → keyword filter → один маршрут.
Широко собрать. Узко отдать.
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
LLM routing: $0.003/запрос, ~200ms. Rules engine: $0.000, <1ms.
Не всё нужно решать нейросетью. Наш routing agent — 340 строк Python:
▸ Input → keyword check
▸ «промпт» → @claude_prompts
▸ «агент» → @claude_agents
▸ «код» → @claude_coding
▸ Нет матча → fallback на @claude_info
Детерминизм. Нулевая стоимость. Предсказуемость.
LLM routing оставь для semantic ambiguity. Для остального — if/else до сих пор царь.
Не всё нужно решать нейросетью. Наш routing agent — 340 строк Python:
▸ Input → keyword check
▸ «промпт» → @claude_prompts
▸ «агент» → @claude_agents
▸ «код» → @claude_coding
▸ Нет матча → fallback на @claude_info
Детерминизм. Нулевая стоимость. Предсказуемость.
LLM routing оставь для semantic ambiguity. Для остального — if/else до сих пор царь.
This media is not supported in your browser
VIEW IN TELEGRAM
Tool description — это prompt который видит модель.
В JSON schema каждого инструмента:
▸
▸
▸
Anthropic: «tool descriptions — single biggest driver of tool-use accuracy».
Плохой description = модель вызывает не тот tool.
Хороший description = zero-shot точность.
Тестируй tool descriptions как промпты. Eval-ай как промпты. Потому что это и есть промпты.
В JSON schema каждого инструмента:
▸
name — определяет КОГДА вызвать▸
description — определяет КАК использовать▸
parameters.description — формат каждого поляAnthropic: «tool descriptions — single biggest driver of tool-use accuracy».
Плохой description = модель вызывает не тот tool.
Хороший description = zero-shot точность.
Тестируй tool descriptions как промпты. Eval-ай как промпты. Потому что это и есть промпты.
This media is not supported in your browser
VIEW IN TELEGRAM
46% «most loved». За 8 месяцев. С нуля до #1.
Claude Code vs рынок:
▸ Claude Code — 46% most loved
▸ Cursor — 19%
▸ Copilot — 9%
▸ Windsurf — 7%
$2.5B annual run-rate. 70% Fortune 100 используют Claude.
Почему: терминал > IDE plugin. Extended thinking 32K токенов. Read → Think → Edit → Test → Loop.
Не copilot. Не autocomplete. Полноценный агент в терминале.
Claude Code vs рынок:
▸ Claude Code — 46% most loved
▸ Cursor — 19%
▸ Copilot — 9%
▸ Windsurf — 7%
$2.5B annual run-rate. 70% Fortune 100 используют Claude.
Почему: терминал > IDE plugin. Extended thinking 32K токенов. Read → Think → Edit → Test → Loop.
Не copilot. Не autocomplete. Полноценный агент в терминале.
This media is not supported in your browser
VIEW IN TELEGRAM
Агент с 8 tools и доступом к bash. Что может пойти не так?
3 вектора атаки на AI-агентов:
▸ Prompt injection: данные притворяются инструкцией
▸ Tool poisoning: MCP сервер подменяет description
▸ Exfiltration: агент сливает контекст через tool call
3 уровня защиты:
→ Input validation — санитизация до модели
→ Sandboxing — bash/file ограничены scope-ом
→ Gated actions — необратимое требует confirm
2026: reliability > capabilities.
Безопасный агент > умный агент.
3 вектора атаки на AI-агентов:
▸ Prompt injection: данные притворяются инструкцией
▸ Tool poisoning: MCP сервер подменяет description
▸ Exfiltration: агент сливает контекст через tool call
3 уровня защиты:
→ Input validation — санитизация до модели
→ Sandboxing — bash/file ограничены scope-ом
→ Gated actions — необратимое требует confirm
2026: reliability > capabilities.
Безопасный агент > умный агент.
This media is not supported in your browser
VIEW IN TELEGRAM
$2.5B run-rate. За 8 месяцев Claude Code стал #1 coding tool.
46% разработчиков назвали его «most loved» — Cursor 19%, Copilot 9%.
Этот канал — как устроено изнутри:
▸ 5 паттернов Anthropic — с кодом
▸ Multi-agent: когда 15× токенов окупается
▸ MCP, tool design — что работает в production
▸ Наш бот — routing agent для 21 канала. Рекурсия.
Каждый пост = прочитал → можешь повторить.
Первый кейс — в среду.
46% разработчиков назвали его «most loved» — Cursor 19%, Copilot 9%.
Этот канал — как устроено изнутри:
▸ 5 паттернов Anthropic — с кодом
▸ Multi-agent: когда 15× токенов окупается
▸ MCP, tool design — что работает в production
▸ Наш бот — routing agent для 21 канала. Рекурсия.
Каждый пост = прочитал → можешь повторить.
Первый кейс — в среду.
This media is not supported in your browser
VIEW IN TELEGRAM
80% запросов на Haiku. 15% на Sonnet. 5% на Opus. Минус 90% расходов.
Tiered routing — архитектура экономии:
▸ Haiku $0.80/M — classification, tagging, routing
▸ Sonnet $3/M — summarization, extraction, RAG
▸ Opus $15/M — reasoning, planning, complex code
80% запросов — простые. Не плати за них как за сложные.
Реализация: complexity classifier (сам может быть Haiku) → route на нужный tier.
$0.80 vs $15. Разница 19×.
Для 80% задач — одинаковый результат.
Tiered routing — архитектура экономии:
▸ Haiku $0.80/M — classification, tagging, routing
▸ Sonnet $3/M — summarization, extraction, RAG
▸ Opus $15/M — reasoning, planning, complex code
80% запросов — простые. Не плати за них как за сложные.
Реализация: complexity classifier (сам может быть Haiku) → route на нужный tier.
$0.80 vs $15. Разница 19×.
Для 80% задач — одинаковый результат.
This media is not supported in your browser
VIEW IN TELEGRAM
81% задач решаются одним паттерном. Остальные 4 — для 19%.
Anthropic описал 5 архитектур агентов. Не 20. Пять:
⛓️ Prompt Chaining — шаги с gate между ними
🔀 Routing — classify → нужный handler
⚡ Parallelization — 3 ревьюера параллельно
🏗️ Orchestrator-Workers — plan → delegate → synthesize
🔄 Evaluator-Optimizer — generate → score → iterate
Правило: начинай с chaining. Усложняй только когда простое сломалось.
Тот же Claude, который решил задачу Кнута за 30 секунд — под капотом использует routing + chaining.
Anthropic описал 5 архитектур агентов. Не 20. Пять:
⛓️ Prompt Chaining — шаги с gate между ними
🔀 Routing — classify → нужный handler
⚡ Parallelization — 3 ревьюера параллельно
🏗️ Orchestrator-Workers — plan → delegate → synthesize
🔄 Evaluator-Optimizer — generate → score → iterate
Правило: начинай с chaining. Усложняй только когда простое сломалось.
Тот же Claude, который решил задачу Кнута за 30 секунд — под капотом использует routing + chaining.
This media is not supported in your browser
VIEW IN TELEGRAM
Этот пост вам доставил routing agent. Который сам написан как routing agent. 340 строк.
→ Текст поста → keyword matcher
→ «промпт» → @claude_prompts
→ «агент» → @claude_agents
→ «код» → @claude_coding
→ Inline button «📢 Опубликовать» → нужный канал
21 маршрут. Zero ML. Pattern matching + fallback.
Это паттерн Routing из предыдущего поста — самый простой и достаточный для 90% задач.
Код agent ≠ сложность. Код agent = правильная декомпозиция.
→ Текст поста → keyword matcher
→ «промпт» → @claude_prompts
→ «агент» → @claude_agents
→ «код» → @claude_coding
→ Inline button «📢 Опубликовать» → нужный канал
21 маршрут. Zero ML. Pattern matching + fallback.
Это паттерн Routing из предыдущего поста — самый простой и достаточный для 90% задач.
Код agent ≠ сложность. Код agent = правильная декомпозиция.
