Разработчик поделился практическим подходом к созданию Agent Skills, который, по его словам, даёт более лучшие результаты примерно в 90% случаев. 🍭
Ключевой принцип это harness optimization - строгую регламентацию того, что агент может делать. Идея проста: лучше работает даже посредственный агент внутри строгой системы ограничений, чем более мощный агент в плохо структурированном окружении.
По его словам, речь идёт не о prompt-инженерии, а о дизайне системы взаимодействия с агентом.
В своём подходе он выделяет несколько основных элементов:
Главный принцип метода - атомарные и узкоспециализированные задачи. Каждый Skill должен выполнять только одну функцию, а итоговое решение получается за счёт комбинации нескольких таких Skill-oв .
Если вы пишете Skills и агент выдаёт нестабильные результаты, скорее всего harness слишком слабый.
Ключевой принцип это harness optimization - строгую регламентацию того, что агент может делать. Идея проста: лучше работает даже посредственный агент внутри строгой системы ограничений, чем более мощный агент в плохо структурированном окружении.
По его словам, речь идёт не о prompt-инженерии, а о дизайне системы взаимодействия с агентом.
В своём подходе он выделяет несколько основных элементов:
1. Metadata
Name, description, triggers. LLM хорошо распознают такие секции и их не нужно усложнять. Они должны быть функциональными и по делу.
2. Skill Purpose
Один короткий абзац. По сути — pitch. Нужно лишь, чтобы агент понял основную идею. Детали идут дальше.
3. Instructions
Каждый шаг — с чёткими и точными инструкциями. Если нужно выполнить скрипт, он указывает точный путь:
Execute: ~/Documents/script/run.py
Его личное правило: если Skill требует больше 3 шагов — разбиваем её на более мелкие Skills.
Больше ограничений → лучше результат
(он специализирует агента на узких задачах).
4. Non-Negotiable Acceptance Criteria
Самая важная секция. Здесь ты определяешь, что НЕ обсуждается.
Агент не выдаёт результат, если не выполнены все критерии.
Многие используют “Rules” или “Objectives”.
Но он предпочитает “Non-Negotiable”, потому что, это как бы не подлежит обсуждению
А слово “Rules” звучит мягче, оно оставляет агенту пространство решать, что соблюдать, а что игнорировать.
5. Output
Точный формат ответа. Без строгого формата невозможно стабильно связывать Skills в цепочки.
Главный принцип метода - атомарные и узкоспециализированные задачи. Каждый Skill должен выполнять только одну функцию, а итоговое решение получается за счёт комбинации нескольких таких Skill-oв .
Если вы пишете Skills и агент выдаёт нестабильные результаты, скорее всего harness слишком слабый.
Please open Telegram to view this post
VIEW IN TELEGRAM
На Stepik вышел первый курс по: Claude Code — вайбкодинг с нуля
Изучаете всё шаг за шагом:
🔴 Оформите правила проекта через
🔴 Сделаете свои slash-команды с frontmatter (
🔴 Освоите саб-агентов: когда их запускать, как писать определения и как делегировать им расследования и проверки без засора основного контекста.
🔴 Поднимете Hooks под реальный воркфлоу:
🔴 Настроите Skills (
Скидка 25%, действует 48 часов
⬇️ Пройти курс на Stepik
Изучаете всё шаг за шагом:
CLAUDE.md → rules → commands → sub-agent → Skills → hooks:CLAUDE.md, подключение файлов через @ и разнесение логики в .claude/rules, чтобы не раздуло инструкцию.description/allowed-tools/model) и аргументами через $ARGUMENTS и $1/$2/$3 для буста воркфлоу./hooks, sh-скрипты, SessionStart/Stop/PreToolUse/PostToolUse, exit codes, matchers и env-переменные.SKILL.md + references), свяжете их с саб-агентами через skills-поле и подключите MCP, Web и headless (-p) для продвинутых случаевСкидка 25%, действует 48 часов
Please open Telegram to view this post
VIEW IN TELEGRAM
Вещи, которые Anthropic запустила в 2026 году (на данный момент):
- Claude Cowork
- добавили коннекторы и skills в бесплатный план
- Claude Opus 4.6
- Claude Sonnet 4.6
- Claude Haiku 4.5
- Claude Code Security
- Claude Code Review
- Claude Code Desktop (preview)
- добавили voice-mode в Claude Code
- Claude в PowerPoint
- Claude в Excel
- шаринг контекста между Excel и PowerPoint
- плагины для investment banking, HR, PE (private equity), wealth management, design
- добавили интеграции и коннекторы в Cowork
- Claude Marketplace
- функция memory и экспорт памяти
- добавили inline-визуализации в чате
- запустили Skills API
- контекстное окно 1M
и многое другое
Бонус:
- Claude будет без рекламы
- отказались от сделки с Пентагоном
- №1 в App Store
- привлекли $30B в раунде Series G при оценке $380B
Claude сейчас переживает по-настоящему прорывной период.🎉
- Claude Cowork
- добавили коннекторы и skills в бесплатный план
- Claude Opus 4.6
- Claude Sonnet 4.6
- Claude Haiku 4.5
- Claude Code Security
- Claude Code Review
- Claude Code Desktop (preview)
- добавили voice-mode в Claude Code
- Claude в PowerPoint
- Claude в Excel
- шаринг контекста между Excel и PowerPoint
- плагины для investment banking, HR, PE (private equity), wealth management, design
- добавили интеграции и коннекторы в Cowork
- Claude Marketplace
- функция memory и экспорт памяти
- добавили inline-визуализации в чате
- запустили Skills API
- контекстное окно 1M
и многое другое
Бонус:
- Claude будет без рекламы
- отказались от сделки с Пентагоном
- №1 в App Store
- привлекли $30B в раунде Series G при оценке $380B
Claude сейчас переживает по-настоящему прорывной период.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Новая модель: huihui-ai/Huihui-Qwen3.5-27B-Claude-4.6-Opus-abliterated
Это нецензурированная версия Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled, созданная с использованием abliteration.
В настоящее время Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled занимает первое место по тренду на платформе hf.
После процесса абляции модель huihui-ai/Huihui-Qwen3.5-27B-Claude-4.6-Opus-abliterated практически не показывает отказов в ответах с точки зрения производительности, при этом вызовы инструментов также работают нормально.
Её значительно легче джейлбрейкнуть, чем оригинальную Qwen3.5-27B. В основном это связано с тем, что в её обучающих данных почти отсутствуют примеры отказов, из-за чего происходит сдвиг в выравнивании , а не какое-то намеренное ослабление механизмов отказа.
Это нецензурированная версия Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled, созданная с использованием abliteration.
В настоящее время Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled занимает первое место по тренду на платформе hf.
После процесса абляции модель huihui-ai/Huihui-Qwen3.5-27B-Claude-4.6-Opus-abliterated практически не показывает отказов в ответах с точки зрения производительности, при этом вызовы инструментов также работают нормально.
Её значительно легче джейлбрейкнуть, чем оригинальную Qwen3.5-27B. В основном это связано с тем, что в её обучающих данных почти отсутствуют примеры отказов, из-за чего происходит сдвиг в выравнивании , а не какое-то намеренное ослабление механизмов отказа.
huggingface.co
huihui-ai/Huihui-Qwen3.5-27B-Claude-4.6-Opus-abliterated · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Нашёл репозиторий, где 40+ советов, как использовать Claude Code: открыть
Полезно, можно что-то для себя подчерпнуть. Самый ценный совет здесь это работа с Git worktrees
Как только я перестал ломать свою основную ветку (main branch), работа с Claude Code стала гораздо менее напряжённой.🙊
Полезно, можно что-то для себя подчерпнуть. Самый ценный совет здесь это работа с Git worktrees
Как только я перестал ломать свою основную ветку (main branch), работа с Claude Code стала гораздо менее напряжённой.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Знал ли ты о модели opusplan в Claude Code? 🤭
Это гибридный алиас, который автоматически использует Opus в режиме планирования для сложных рассуждений, а затем переключается на Sonnet для выполнения.
Лучшее из двух миров: Opus думает, Sonnet реализует.
Но, настоящее преимущество opusplan даже не в разделении моделей — а в том, что планировщик и исполнитель используют одно и то же контекстное окно. Большинство воркфлоу ломается, потому что тот, кто думает, и тот, кто реализует, работают с разными мапами.
/model opusplan
Это гибридный алиас, который автоматически использует Opus в режиме планирования для сложных рассуждений, а затем переключается на Sonnet для выполнения.
Лучшее из двух миров: Opus думает, Sonnet реализует.
Но, настоящее преимущество opusplan даже не в разделении моделей — а в том, что планировщик и исполнитель используют одно и то же контекстное окно. Большинство воркфлоу ломается, потому что тот, кто думает, и тот, кто реализует, работают с разными мапами.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
This media is not supported in your browser
VIEW IN TELEGRAM
В VS Code, у агентов появился доступ к браузеру (экспериментально)
Агенты могут открывать страницы, читать контент, кликать по элементам и проверять изменения прямо во встроенном браузере во время разработки веб-приложения.
Чтобы попробовать, включи
Агенты могут открывать страницы, читать контент, кликать по элементам и проверять изменения прямо во встроенном браузере во время разработки веб-приложения.
Чтобы попробовать, включи
workbench.browser.enableChatTools.4
Кстати, можно добавить
Он получает чистое контекстное окно с
Подходит практически любой самодостаточный скилл, где важен только итоговый результат — например, ресёрч, ревью PR и т.п.
Если же у тебя есть скилл, который влияет на то, как Claude работает с текущим кодом (например, задаёт конвенции или паттерны), то лучше держать его в основном контексте (inline).
context: fork, чтобы запускать скилл в изолированном сабагенте. Основной контекст видит только финальный результат, без промежуточных вызовов инструментов.Он получает чистое контекстное окно с
CLAUDE.md и твоим скиллом в качестве промпта. Поле agent даже позволяет задать тип сабагентаПодходит практически любой самодостаточный скилл, где важен только итоговый результат — например, ресёрч, ревью PR и т.п.
Если же у тебя есть скилл, который влияет на то, как Claude работает с текущим кодом (например, задаёт конвенции или паттерны), то лучше держать его в основном контексте (inline).
Теперь дизайн можно программировать: появился SDK для Stitch 💓
Генерируйте и итерируйте дизайн с помощью естественного языка. Один скрипт и можно сгенерировать сразу несколько экранов и получить на выходе чистый HTML с конфигом Tailwind.
Можно подключать источники данных и генерировать UI на основе живых данных.
Есть интеграция с AI SDK — можно собирать кастомные агентные воркфлоу под свои задачи.
Доки: http://stitch.withgoogle.com/docs/sdk/tutorial
Примеры кода: http://github.com/google-labs-code/stitch-sdk/tree/main/packages/sdk/examples
Генерируйте и итерируйте дизайн с помощью естественного языка. Один скрипт и можно сгенерировать сразу несколько экранов и получить на выходе чистый HTML с конфигом Tailwind.
Можно подключать источники данных и генерировать UI на основе живых данных.
Есть интеграция с AI SDK — можно собирать кастомные агентные воркфлоу под свои задачи.
Доки: http://stitch.withgoogle.com/docs/sdk/tutorial
Примеры кода: http://github.com/google-labs-code/stitch-sdk/tree/main/packages/sdk/examples
Please open Telegram to view this post
VIEW IN TELEGRAM
📘 На Stepik вышел курс — «AI Agents PRO: LangGraph, AutoGen и LLMOps в продакшне»
Хотите собирать AI-агентов и RAG-сервисы так, чтобы это стабильно работало в эксплуатации: с метриками, оценкой качества, контролем стоимости и нормальным деплоем? Этот курс — полный путь от прототипа к прод-сервису.
Агенты: LangGraph/AutoGen, роли/состояния, FSM/DAG, параллелизм
RAG: hybrid retrieval + rerank (Qdrant/FAISS/Weaviate)
Надёжность: таймауты, ретраи, идемпотентность, DLQ
Eval/качество: golden-сеты, LLM-judge, pass@k, quality-гейты
Observability: логи/трейсы, OpenTelemetry, Prometheus/Grafana
Security: строгий JSON (Pydantic), guardrails, PII, RBAC/ABAC
🎓 Сертификат Stepik — добавьте в резюме или LinkedIn
🚀 Скидка 25% по ссылке — действует 72ч
👉 Забрать курс на Stepik
Хотите собирать AI-агентов и RAG-сервисы так, чтобы это стабильно работало в эксплуатации: с метриками, оценкой качества, контролем стоимости и нормальным деплоем? Этот курс — полный путь от прототипа к прод-сервису.
Агенты: LangGraph/AutoGen, роли/состояния, FSM/DAG, параллелизм
RAG: hybrid retrieval + rerank (Qdrant/FAISS/Weaviate)
Надёжность: таймауты, ретраи, идемпотентность, DLQ
Eval/качество: golden-сеты, LLM-judge, pass@k, quality-гейты
Observability: логи/трейсы, OpenTelemetry, Prometheus/Grafana
Security: строгий JSON (Pydantic), guardrails, PII, RBAC/ABAC
🎓 Сертификат Stepik — добавьте в резюме или LinkedIn
🚀 Скидка 25% по ссылке — действует 72ч
👉 Забрать курс на Stepik
Нашёл руководство полезное. Написано для инженеров, которые уже используют Claude Code и хотят сделать свои воркфлоу более предсказуемыми, более контролируемыми и проще проверяемыми.
Рекомендации в этом гайде основаны на:
- личном опыте использования
- экспериментах
- публичных материалах Anthropic, доступных на март 2026 года
Рассматривайте это как инженерные рекомендации, а не как официальную спецификацию внутренних механизмов Claude Code.
Это английский перевод китайской статьи, опубликованной в марте 2026 года.
Оригинал получил более 6000 лайков от сообщества разработчиков по всей Азии.☕️
Рекомендации в этом гайде основаны на:
- личном опыте использования
- экспериментах
- публичных материалах Anthropic, доступных на март 2026 года
Рассматривайте это как инженерные рекомендации, а не как официальную спецификацию внутренних механизмов Claude Code.
Это английский перевод китайской статьи, опубликованной в марте 2026 года.
Оригинал получил более 6000 лайков от сообщества разработчиков по всей Азии.
Please open Telegram to view this post
VIEW IN TELEGRAM
1