Media is too big
VIEW IN TELEGRAM
Николас Карлини, один из самых уважаемых специалистов по безопасности, на днях показал на живой демке, как CLAUDE находит zero-day уязвимости.
Причём это был не тестовый проект, а Ghost CMS — один из самых популярных open-source проектов на GitHub. Кодовая база, которая за всю свою историю не имела ни одной критической уязвимости.
Claude нашёл blind SQL-инъекцию за 90 минут, получил admin API key и полный доступ к базе данных. Затем сделал то же самое с ядром Linux и обнаружил heap buffer overflow, который там находился с 2003 года.
Карлини сказал со сцены, что «эти модели уже лучше него как исследователи уязвимостей». Для контекста: у него 67 000 цитирований и реальные CVE на его имя.😳
Причём это был не тестовый проект, а Ghost CMS — один из самых популярных open-source проектов на GitHub. Кодовая база, которая за всю свою историю не имела ни одной критической уязвимости.
Claude нашёл blind SQL-инъекцию за 90 минут, получил admin API key и полный доступ к базе данных. Затем сделал то же самое с ядром Linux и обнаружил heap buffer overflow, который там находился с 2003 года.
Карлини сказал со сцены, что «эти модели уже лучше него как исследователи уязвимостей». Для контекста: у него 67 000 цитирований и реальные CVE на его имя.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Гений переписал CLI "claude" с использованием Codex и GPT-5.4-high.
По его словам, это стоило $1100 в токенах, при этом скорость работы на 73% выше, а потребление памяти в режиме активного взаимодействия на 80% ниже.
Очень легко реверсировать claude из npm-дистрибутива, затем его переписка происходит 1:1. Он неотличим от версии от Anthropic по заголовкам и аналитике, которую он отправляет обратно.
исходный код😳
По его словам, это стоило $1100 в токенах, при этом скорость работы на 73% выше, а потребление памяти в режиме активного взаимодействия на 80% ниже.
Очень легко реверсировать claude из npm-дистрибутива, затем его переписка происходит 1:1. Он неотличим от версии от Anthropic по заголовкам и аналитике, которую он отправляет обратно.
исходный код
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - krzyzanowskim/claude-better: better claude harness
better claude harness. Contribute to krzyzanowskim/claude-better development by creating an account on GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
5
В этом подробном руководстве Vahe показывает, как пользоваться Claude Code - от первоначальной настройки до продвинутых возможностей.
Вы узнаете про параллельные workflow, skills и rules, безопасность и многое другое — там даже есть несколько интересных стартовых проектов, которые можно попробовать.🙈
Вы узнаете про параллельные workflow, skills и rules, безопасность и многое другое — там даже есть несколько интересных стартовых проектов, которые можно попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Mohit Mishra поделился своими low-level skills для разрабов на C, C++, Rust, Zig и других языков и направлений в системном + низкоуровневом программировании. ☺️
Использовать их можно практически со всеми кодинг агентами.
Посмотреть и внести свой вклад можно здесь: https://skills.sh/mohitmishra786/low-level-dev-skills
Использовать их можно практически со всеми кодинг агентами.
Посмотреть и внести свой вклад можно здесь: https://skills.sh/mohitmishra786/low-level-dev-skills
Please open Telegram to view this post
VIEW IN TELEGRAM
skills.sh
Skill for mohitmishra786/low-level-dev-skills
Skills for mohitmishra786/low-level-dev-skills
Please open Telegram to view this post
VIEW IN TELEGRAM
Обновлённый Skill Creator от команды Anthropic, имеет встроенный фреймворк для оценки (eval framework), который запускает тесты с дочерними агентами, чтобы определить эффективность и способствовать улучшению.
В этом skill по сути зашит многолетний исследовательский опыт.
Очень впечатлён эффективностью.🆒
Ссылка: Skill Creator repository
В этом skill по сути зашит многолетний исследовательский опыт.
Очень впечатлён эффективностью.
Ссылка: Skill Creator repository
Please open Telegram to view this post
VIEW IN TELEGRAM
Люди: 100%
Gemini 3.1 Pro: 0.37%
GPT 5.4: 0.26%
Opus 4.6: 0.25%
Grok-4.20: 0.00%
Франсуа Шолле выпустил ARC-AGI-3 — самый сложный тест для ИИ на сегодняшний день.
135 новых игровых сред. Без инструкций. Без правил. Без заданных целей.
Разбирайся сам или проваливайся.
Неподготовленные люди справились со всеми заданиями. Все передовые модели ИИ набрали меньше 1%.
Каждая среда была вручную разработана гейм-дизайнерами. ИИ помещается в неё и должен исследовать, понять, что считается победой, и адаптироваться в реальном времени.
Система оценки наказывает брутфорс. Если человеку нужно 10 действий, а ИИ — 100, то ИИ получает не 10%, а 1%. Просто нарастить вычисления не получится.
Для контекста: ARC-AGI-1 практически решён. Gemini набирает на нём 98%. ARC-AGI-2 вырос с 3% до 77% менее чем за год. Лаборатории потратили миллионы на обучение на предыдущих версиях.
ARC-AGI-3 обнуляет прогресс — результаты снова близки к нулю.
Бенчмарк был представлен на Y Combinator в формате публичной беседы между Шолле и Сэмом Альтманом.
Призовой фонд — $2 млн на Kaggle. Все победившие решения должны быть с открытым исходным кодом.
Одного масштабирования недостаточно, чтобы закрыть этот разрыв. До AGI нам ещё очень далеко.
Если интересно, вот ссылка😭
Gemini 3.1 Pro: 0.37%
GPT 5.4: 0.26%
Opus 4.6: 0.25%
Grok-4.20: 0.00%
Франсуа Шолле выпустил ARC-AGI-3 — самый сложный тест для ИИ на сегодняшний день.
135 новых игровых сред. Без инструкций. Без правил. Без заданных целей.
Разбирайся сам или проваливайся.
Неподготовленные люди справились со всеми заданиями. Все передовые модели ИИ набрали меньше 1%.
Каждая среда была вручную разработана гейм-дизайнерами. ИИ помещается в неё и должен исследовать, понять, что считается победой, и адаптироваться в реальном времени.
Система оценки наказывает брутфорс. Если человеку нужно 10 действий, а ИИ — 100, то ИИ получает не 10%, а 1%. Просто нарастить вычисления не получится.
Для контекста: ARC-AGI-1 практически решён. Gemini набирает на нём 98%. ARC-AGI-2 вырос с 3% до 77% менее чем за год. Лаборатории потратили миллионы на обучение на предыдущих версиях.
ARC-AGI-3 обнуляет прогресс — результаты снова близки к нулю.
Бенчмарк был представлен на Y Combinator в формате публичной беседы между Шолле и Сэмом Альтманом.
Призовой фонд — $2 млн на Kaggle. Все победившие решения должны быть с открытым исходным кодом.
Одного масштабирования недостаточно, чтобы закрыть этот разрыв. До AGI нам ещё очень далеко.
Если интересно, вот ссылка
Please open Telegram to view this post
VIEW IN TELEGRAM
В последнее время harness стал очень популярным, поэтому появился open-source репозиторий awesome-harness-engineering.
Внутри собрали ряд материалов по harness-инжинирингу для AI-агентов, включая архитектурные ограничения, feedback loop-ы, runtime-обвязку и многое другое — всё это ориентировано на команды, которые разрабатывают долгоживущих production-grade агентов.
Материалы охватывают определения, операционные принципы, evaluation и observability, референсные реализации и другие аспекты.
Внутри собрали ряд материалов по harness-инжинирингу для AI-агентов, включая архитектурные ограничения, feedback loop-ы, runtime-обвязку и многое другое — всё это ориентировано на команды, которые разрабатывают долгоживущих production-grade агентов.
Материалы охватывают определения, операционные принципы, evaluation и observability, референсные реализации и другие аспекты.
Новый бафф для Claude Code: oh-my-claudecode
Энтузиасты построили поверх Claude Code слой оркестрации мультиагентов, который даёт 5 режимов выполнения, 32 специализированных агента и "ускорение в 3–5 раза".
Что внутри:
→ Autopilot mode: полностью автономное выполнение — просто опиши задачу и можешь чилить
→ Ultrapilot mode: поднимает параллельных агентов и ускоряет выполнение в 3–5 раз на задачах с несколькими компонентами
→ Swarm mode: координирует несколько агентов, работающих независимо над одной целью
→ Pipeline mode: последовательные цепочки для многоэтапной обработки
→ Ecomode: экономичный режим, снижает затраты на 30–50% без потери качества
Что делает это решение другим: 32 специализированных агента для архитектуры, ресёрча, дизайна, тестирования и data science. Умная маршрутизация моделей: Haiku используется для простых задач, Opus — для сложного reasoning, и всё это автоматически. Тебе не нужно думать, какую модель выбрать, всё это решает сама система.
→ Напиши "autopilot" - и система полностью автономно соберёт решение
→ Напиши "ralph" - включится режим упорства: не остановится, пока задача не будет подтверждена как завершённая
→ Напиши "eco" - переключится в бюджетный режим
→ Напиши "plan" - сначала проведёт планирование (planning interview), прежде чем трогать файлы
Самое интересное? Система автоматически возобновляет сессии Claude Code после сброса rate limits.
3.6K звёзд на GitHub. 100% open-source.😎
Энтузиасты построили поверх Claude Code слой оркестрации мультиагентов, который даёт 5 режимов выполнения, 32 специализированных агента и "ускорение в 3–5 раза".
Что внутри:
→ Autopilot mode: полностью автономное выполнение — просто опиши задачу и можешь чилить
→ Ultrapilot mode: поднимает параллельных агентов и ускоряет выполнение в 3–5 раз на задачах с несколькими компонентами
→ Swarm mode: координирует несколько агентов, работающих независимо над одной целью
→ Pipeline mode: последовательные цепочки для многоэтапной обработки
→ Ecomode: экономичный режим, снижает затраты на 30–50% без потери качества
Что делает это решение другим: 32 специализированных агента для архитектуры, ресёрча, дизайна, тестирования и data science. Умная маршрутизация моделей: Haiku используется для простых задач, Opus — для сложного reasoning, и всё это автоматически. Тебе не нужно думать, какую модель выбрать, всё это решает сама система.
→ Напиши "autopilot" - и система полностью автономно соберёт решение
→ Напиши "ralph" - включится режим упорства: не остановится, пока задача не будет подтверждена как завершённая
→ Напиши "eco" - переключится в бюджетный режим
→ Напиши "plan" - сначала проведёт планирование (planning interview), прежде чем трогать файлы
Самое интересное? Система автоматически возобновляет сессии Claude Code после сброса rate limits.
3.6K звёзд на GitHub. 100% open-source.
Please open Telegram to view this post
VIEW IN TELEGRAM
Полная документация по реверс-инжинирингу логики Claude Code CLI Node.js Version v2.1.84
HitCC это не репозиторий с исходным кодом, а библиотека документации, ориентированная на изучение, анализ и переписывание.
Цель проекта не в том, чтобы воссоздать исходное дерево файлов, а в том, чтобы максимально полно восстановить ключевую runtime-логику, границы между модулями, систему конфигурации и периферийную экосистему Claude Code CLI, тем самым предоставив надёжную основу для создания «исполняемых альтернатив» или «переписываний высоко похожей версии».
HitCC это не репозиторий с исходным кодом, а библиотека документации, ориентированная на изучение, анализ и переписывание.
Цель проекта не в том, чтобы воссоздать исходное дерево файлов, а в том, чтобы максимально полно восстановить ключевую runtime-логику, границы между модулями, систему конфигурации и периферийную экосистему Claude Code CLI, тем самым предоставив надёжную основу для создания «исполняемых альтернатив» или «переписываний высоко похожей версии».
GitHub
GitHub - hitmux/HitCC: Complete reverse-engineering documentation of the full logic of Claude Code CLI Node.js version v2.1.84
Complete reverse-engineering documentation of the full logic of Claude Code CLI Node.js version v2.1.84 - hitmux/HitCC
3
This media is not supported in your browser
VIEW IN TELEGRAM
Computer use теперь доступен в Claude Code.
Claude может открывать ваши приложения, кликать по UI и тестировать то, что он собрал - прямо из CLI.
По одному промпту Claude может написать код, скомпилировать его, запустить приложение, прокликать его, найти баг, исправить его и проверить фикс.
Работает со всем, что вы можете открыть на вашем Mac: скомпилированное приложение на SwiftUI, локальный билд на Electron или GUI-инструмент без CLI.
Сейчас доступно в режиме research preview на тарифах Pro и Max.
Включается через /mcp. Документация
Claude может открывать ваши приложения, кликать по UI и тестировать то, что он собрал - прямо из CLI.
По одному промпту Claude может написать код, скомпилировать его, запустить приложение, прокликать его, найти баг, исправить его и проверить фикс.
Работает со всем, что вы можете открыть на вашем Mac: скомпилированное приложение на SwiftUI, локальный билд на Electron или GUI-инструмент без CLI.
Сейчас доступно в режиме research preview на тарифах Pro и Max.
Включается через /mcp. Документация
Вайб-кодинг
Новое в Claude Code: режим auto. Вместо подтверждения каждой записи в файл и каждой bash-команды или полного отключения разрешений — режим auto позволяет Claude самому принимать решения о доступе. Механизмы защиты проверяют каждое действие перед выполнением.…
Автоматический режим для Claude Code теперь доступен на Enterprise плане и для пользователей API.
Чтобы попробовать его, обновите установку и выполните команду
Чтобы попробовать его, обновите установку и выполните команду
claude --enable-auto-mode.This media is not supported in your browser
VIEW IN TELEGRAM
Вышел плагин Codex для Claude Code 🙈
Этот плагин Codex предоставляет вам простой способ интегрировать Codex в Claude Code
Он полезен для трех вещей:
1. Обычный обзор Codex
2. Более скептический и противостоящий обзор
3. Передача работы Codex, когда вам нужно, чтобы другой агент выполнил второй проход
Настройка:
Вам потребуется подписка на ChatGPT, включая бесплатную, или ключ API OpenAI, а также Node.js 18.18 или выше.
Если Codex ещё не установлен:
Если Codex установлен, но не аутентифицирован:
Основные команды:
Долгие задачи могут выполняться в фоновом режиме с командами
Простой первый запуск:
Когда использовать:
Основная ценность здесь — получение настоящего второго прохода от другого агента без выхода из Claude Code.
Хороший шаблон по умолчанию:
- Выполняйте
- Выполняйте
- Используйте
Противостоящий обзор особенно полезен для миграций, изменений в аутентификации, инфраструктурных скриптов, рефакторинга и всего, где опасность скрывается в неверных предположениях, а не в очевидных синтаксических ошибках.
Как это работает? Плагин делегирует через локальный CLI Codex и сервер приложения Codex. Так что он использует ту же локальную авторизацию, конфигурацию, окружение и настройку MCP, которые у вас уже есть с Codex.
Вот почему он чувствуется лёгким. Это не отдельное время выполнения. Это Codex, только вызванный изнутри Claude Code.
Вы также можете включить контроль обзора:
Это может остановить завершение работы Claude Code до того, как будет выполнен обзор Codex.
Полезно, но используйте это осторожно. Это может создать долгий цикл Claude/Codex и быстро расходовать лимиты использования.
Этот плагин Codex предоставляет вам простой способ интегрировать Codex в Claude Code
Он полезен для трех вещей:
1. Обычный обзор Codex
2. Более скептический и противостоящий обзор
3. Передача работы Codex, когда вам нужно, чтобы другой агент выполнил второй проход
Настройка:
/plugin marketplace add openai/codex-plugin-cc
/plugin install codex@openai-codex
/codex:setup
Вам потребуется подписка на ChatGPT, включая бесплатную, или ключ API OpenAI, а также Node.js 18.18 или выше.
Если Codex ещё не установлен:
npm install -g @openai/codex
Если Codex установлен, но не аутентифицирован:
!codex login
Основные команды:
/codex:review — выполняет стандартный обзор Codex только для чтения./codex:adversarial-review — выполняет обзор с возможностью настройки. Используйте его, когда хотите, чтобы Codex ставил под сомнение реализацию, а не просто проверял её./codex:rescue — передает задачу непосредственно Codex.Долгие задачи могут выполняться в фоновом режиме с командами
/codex:status, /codex:result и /codex:cancel для управления ими.Простой первый запуск:
Когда использовать:
/codex:review --background
/codex:status
/codex:result
Основная ценность здесь — получение настоящего второго прохода от другого агента без выхода из Claude Code.
Хороший шаблон по умолчанию:
- Выполняйте
/codex:review для всех задач.- Выполняйте
/codex:adversarial-review для всего важного и критического.- Используйте
/codex:rescue, когда поток работы останавливается или вы хотите, чтобы Codex взял задачу на себя.Противостоящий обзор особенно полезен для миграций, изменений в аутентификации, инфраструктурных скриптов, рефакторинга и всего, где опасность скрывается в неверных предположениях, а не в очевидных синтаксических ошибках.
Как это работает? Плагин делегирует через локальный CLI Codex и сервер приложения Codex. Так что он использует ту же локальную авторизацию, конфигурацию, окружение и настройку MCP, которые у вас уже есть с Codex.
Вот почему он чувствуется лёгким. Это не отдельное время выполнения. Это Codex, только вызванный изнутри Claude Code.
Вы также можете включить контроль обзора:
/codex:setup --enable-review-gate
Это может остановить завершение работы Claude Code до того, как будет выполнен обзор Codex.
Полезно, но используйте это осторожно. Это может создать долгий цикл Claude/Codex и быстро расходовать лимиты использования.
Please open Telegram to view this post
VIEW IN TELEGRAM
Если вы используете GitHub Copilot, то насторожитесь.
С 24 апреля ваши запросы, ответы, код и контекст могут использоваться для тренировки их моделей.😶
Если вы не хотите этого, отключите эту опцию в:
Настройки → Copilot → Функции → Конфиденциальность
Хорошо, что GitHub ясно отображает это при заходе на свою страницу. Также удивительно, что этого не было раньше.
С 24 апреля ваши запросы, ответы, код и контекст могут использоваться для тренировки их моделей.
Если вы не хотите этого, отключите эту опцию в:
Настройки → Copilot → Функции → Конфиденциальность
Хорошо, что GitHub ясно отображает это при заходе на свою страницу. Также удивительно, что этого не было раньше.
Please open Telegram to view this post
VIEW IN TELEGRAM
llm-sast-scanner: универсальный SAST-скилл (Static Application Security Testing) для анализа уязвимостей в коде с использованием LLM.
Разработан для подключения к AI coding-агентам (Claude Code, OpenAI Codex и др.) и выполнения структурированного taint-анализа (source-to-sink) по 34 классам уязвимостей.
исходники
Разработан для подключения к AI coding-агентам (Claude Code, OpenAI Codex и др.) и выполнения структурированного taint-анализа (source-to-sink) по 34 классам уязвимостей.
исходники
GitHub
GitHub - SunWeb3Sec/llm-sast-scanner: A SAST skill that gives AI coding agents structured vulnerability detection across 34 vulnerability…
A SAST skill that gives AI coding agents structured vulnerability detection across 34 vulnerability classes. - SunWeb3Sec/llm-sast-scanner
Новые исследования от CMU.
Главный прорыв в разработке агентов заключается в понимании стратегий их асинхронного запуска.
Простое увеличение числа итераций для одного агента помогает, но не масштабируется эффективно.
Исследования в области многоконтурных агентов показывают, что координация важнее вычислений.
Новая работа от CMU подтверждает это с помощью практической многоконтурной системы.
CAID (Centralized Asynchronous Isolated Delegation) заимствует проверенные практики человеческой разработки ПО: менеджер строит граф зависимостей, делегирует задачи инженерным агентам, работающим в изолированных git-деревьях, выполняющим задачи одновременно, проверяющим себя с помощью тестов и интегрирующим изменения через git merge.
CAID повышает точность на 26.7% по сравнению с одиночными агентами при воспроизведении задач с научными статьями (PaperBench) и на 14.3% для задач разработки Python-библиотек (Commit0).
Ключевое открытие состоит в том, что изоляция плюс явная интеграция превосходят как масштабирование одиночных агентов, так и наивные подходы с многоконтурными агентами.
Для долгосрочных задач в области разработки ПО координация многоконтурных агентов с использованием git-примитивов должна быть стандартной стратегией, а не запасным вариантом.
Статья: https://arxiv.org/abs/2603.21489
Главный прорыв в разработке агентов заключается в понимании стратегий их асинхронного запуска.
Простое увеличение числа итераций для одного агента помогает, но не масштабируется эффективно.
Исследования в области многоконтурных агентов показывают, что координация важнее вычислений.
Новая работа от CMU подтверждает это с помощью практической многоконтурной системы.
CAID (Centralized Asynchronous Isolated Delegation) заимствует проверенные практики человеческой разработки ПО: менеджер строит граф зависимостей, делегирует задачи инженерным агентам, работающим в изолированных git-деревьях, выполняющим задачи одновременно, проверяющим себя с помощью тестов и интегрирующим изменения через git merge.
CAID повышает точность на 26.7% по сравнению с одиночными агентами при воспроизведении задач с научными статьями (PaperBench) и на 14.3% для задач разработки Python-библиотек (Commit0).
Ключевое открытие состоит в том, что изоляция плюс явная интеграция превосходят как масштабирование одиночных агентов, так и наивные подходы с многоконтурными агентами.
Для долгосрочных задач в области разработки ПО координация многоконтурных агентов с использованием git-примитивов должна быть стандартной стратегией, а не запасным вариантом.
Статья: https://arxiv.org/abs/2603.21489
Все мы иногда ошибаемся, вот и Anthropic снова облажались. Исходный код Claude Code снова утёк в сеть — и в этот раз в огромных масштабах! 🤦♂️
Что вообще произошло? Официальный npm-пакет Anthropic был опубликован без исключения source map-файлов — инженер просто не убрал их из сборки, и команда выложила sourcemap прямо в npm.
В итоге любой, кто выполняет
Что ещё хуже — это уже второй раз, когда они допускают ту же самую элементарную ошибку. В феврале 2025 года уже был аналогичный слив, тогда Anthropic срочно всё удалила и пофиксила, но сейчас они снова наступили на те же грабли.
На данный момент на GitHub уже появилось несколько полных mirror-репозиториев (leeyeel, dnakov, ghuntley и др.), где исходники аккуратно разложены и доступны для изучения или форка.
Claude Code можно найти тут (переписанный на Rust), документация и как он работает здесь
Что вообще произошло? Официальный npm-пакет Anthropic был опубликован без исключения source map-файлов — инженер просто не убрал их из сборки, и команда выложила sourcemap прямо в npm.
В итоге любой, кто выполняет
npm install, может найти его прямо в node_modules, и буквально в один клик (через source map) получить все 1906 оригинальных .ts-файлов.Что ещё хуже — это уже второй раз, когда они допускают ту же самую элементарную ошибку. В феврале 2025 года уже был аналогичный слив, тогда Anthropic срочно всё удалила и пофиксила, но сейчас они снова наступили на те же грабли.
На данный момент на GitHub уже появилось несколько полных mirror-репозиториев (leeyeel, dnakov, ghuntley и др.), где исходники аккуратно разложены и доступны для изучения или форка.
Claude Code можно найти тут (переписанный на Rust), документация и как он работает здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В
claude-code есть «детектор раздражённого пользователя»Там есть regex, который определяет, когда ты злишься
(причём он полностью захардкожен)
Когда он срабатывает, Claude меняет своё поведение/состояние UI
Claude буквально понимает, когда ты на него материшься
Вот все захардкоженные ругательства:
const negativePattern =
wtf | wth | ffs | omfg | shit (ty|tiest)? | dumbass | horrible | awful | piss(ed|ing)? off | piece of (shit | crap | junk) | what the (fuck | hell) | fucking? (broken | useless | terrible | awful | horrible) | fuck you | screw (this | you) | so frustrating | this sucks | damn it
Please open Telegram to view this post
VIEW IN TELEGRAM
Anthropic запустил для своих автономных агентов новый портфель на $50,000, чтобы посмотреть, насколько хорошо они справляются с инвестированием в акции и смогут ли они обогнать Баффета 👊
Процесс построен так, чтобы полностью исключить участие человека. Вот как устроен этот портфель:
Этап 1. Скрининг:
Портфель управляется агентами, каждый из которых выполняет свою роль
Сначала они оценивают акции из индекса Russell 1000, загружая и анализируя финансовую отчетность, новости и данные аналитиков
Топ-50 акций по скорингу переходят на следующий этап
Этап 2. Состязательное исследование (Adversarial Research):
30 AI-агентов запускаются параллельно
15 отстаивают медвежий сценарий (почему продавать), 15 — бычий сценарий (почему покупать)
Каждый агент независимо ищет информацию в сети, при этом учитываются только новости за последние 7 дней — более старая информация уже учтена в цене
Этап 3. Моделирование сценариев:
Еще 15 агентов строят модели с учетом вероятностей для каждого кандидата: бычий, базовый и медвежий сценарии с целевыми ценами на горизонтах 1, 3, 6 и 12 месяцев
AI дискутирует сам с собой, чтобы избежать подтверждающего смещения и не видеть только то, что хочет увидеть
Это ключевой этап.
Этап 4. Формирование портфеля:
В дело вступает «агент над агентами»
Агент-оптимизатор выбирает 15 позиций с точными аллокациями на основе альфы, сектора и риска
Ограничения: ни один сектор не должен превышать 35%, каждая позиция должна иметь положительную ожидаемую доходность, а весь портфель — обгонять SPY
Этап 5. Регулярная ребалансировка:
Главный оркестратор заново прогоняет весь пайплайн, сравнивает результаты с бенчмарком из отскоренных акций и предлагает сделки с полной аргументацией
Если он считает, что акцию нужно продать — он это прямо укажет и заменит её на более высоко оцененную
Процесс построен так, чтобы полностью исключить участие человека. Вот как устроен этот портфель:
Этап 1. Скрининг:
Портфель управляется агентами, каждый из которых выполняет свою роль
Сначала они оценивают акции из индекса Russell 1000, загружая и анализируя финансовую отчетность, новости и данные аналитиков
Топ-50 акций по скорингу переходят на следующий этап
Этап 2. Состязательное исследование (Adversarial Research):
30 AI-агентов запускаются параллельно
15 отстаивают медвежий сценарий (почему продавать), 15 — бычий сценарий (почему покупать)
Каждый агент независимо ищет информацию в сети, при этом учитываются только новости за последние 7 дней — более старая информация уже учтена в цене
Этап 3. Моделирование сценариев:
Еще 15 агентов строят модели с учетом вероятностей для каждого кандидата: бычий, базовый и медвежий сценарии с целевыми ценами на горизонтах 1, 3, 6 и 12 месяцев
AI дискутирует сам с собой, чтобы избежать подтверждающего смещения и не видеть только то, что хочет увидеть
Это ключевой этап.
Этап 4. Формирование портфеля:
В дело вступает «агент над агентами»
Агент-оптимизатор выбирает 15 позиций с точными аллокациями на основе альфы, сектора и риска
Ограничения: ни один сектор не должен превышать 35%, каждая позиция должна иметь положительную ожидаемую доходность, а весь портфель — обгонять SPY
Этап 5. Регулярная ребалансировка:
Главный оркестратор заново прогоняет весь пайплайн, сравнивает результаты с бенчмарком из отскоренных акций и предлагает сделки с полной аргументацией
Если он считает, что акцию нужно продать — он это прямо укажет и заменит её на более высоко оцененную
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM