Сравнение подходов: как строить AI-агентов в продакшене 🤖
Думаю, что будет интересно всем. Две крупные AI-компании одновременно опубликовали диаметрально противоположные взгляды на архитектуру агентов.
Cognition утверждает "не стройте мульти-агентов", а Anthropic напротив детально описывает свою мульти-агентную систему для Claude Research.
Позиция Cognition: простота как залог надежности 🎯
Основные принципы:
• Общий контекст для всех операций
• Действия несут неявные решения
• Параллельные агенты создают конфликты
Почему мульти-агенты НЕ работают:
1️⃣ Потеря контекста между агентами
2️⃣ Противоречивые решения подагентов
3️⃣ Сложность отладки и координации
4️⃣ Накопление ошибок в цепочке
Cognition предлагает линейную архитектуру с единым потоком выполнения и компрессией истории для длинных задач.
Подход Anthropic: сложность под контролем ⚡️
Архитектура Advanced Research:
• Главный агент-координатор
• Специализированные подагенты для поиска
• Параллельное выполнение задач
• Система цитирования
Ключевые решения:
1️⃣ Детальное делегирование задач
2️⃣ Масштабирование усилий под сложность запроса
3️⃣ Параллельные вызовы инструментов
4️⃣ Расширенный режим мышления
Результаты: мульти-агентная система превосходит одиночного агента на 90% в исследовательских задачах.
Сравнение подходов 📊
Управление контекстом:
• Cognition: единый поток, компрессия истории
• Anthropic: распределенный контекст, память системы
Обработка ошибок:
• Cognition: минимизация точек отказа
• Anthropic: graceful degradation, retry логика
Производительность:
• Cognition: предсказуемость и стабильность
• Anthropic: скорость через распараллеливание задач
Сложность разработки:
• Cognition: простая отладка, линейный флоу
• Anthropic: сложная координация, но больше возможностей
Когда какой подход использовать 🎪
Линейные агенты (Cognition):
• Задачи с высокими требованиями к надежности
• Ограниченные ресурсы на разработку
• Последовательные рабочие процессы
Мульти-агенты (Anthropic):
• Исследовательские задачи
• Высокая ценность результата
• Возможность распараллеливания задач
Выводы 💡
Оба подхода имеют право на существование.
Выбор зависит от:
• Типа задач
• Требований к надежности
• Бюджета на разработку
• Опыта команды
Главное - понимать все trade-offs и не пытаться решить все задачи одним универсальным подходом.
@llm_notes
#agents #multi_agent_systems #production_ai #claude_research #battle #anthropic #cognition
Думаю, что будет интересно всем. Две крупные AI-компании одновременно опубликовали диаметрально противоположные взгляды на архитектуру агентов.
Cognition утверждает "не стройте мульти-агентов", а Anthropic напротив детально описывает свою мульти-агентную систему для Claude Research.
Позиция Cognition: простота как залог надежности 🎯
Основные принципы:
• Общий контекст для всех операций
• Действия несут неявные решения
• Параллельные агенты создают конфликты
Почему мульти-агенты НЕ работают:
1️⃣ Потеря контекста между агентами
2️⃣ Противоречивые решения подагентов
3️⃣ Сложность отладки и координации
4️⃣ Накопление ошибок в цепочке
Cognition предлагает линейную архитектуру с единым потоком выполнения и компрессией истории для длинных задач.
Подход Anthropic: сложность под контролем ⚡️
Архитектура Advanced Research:
• Главный агент-координатор
• Специализированные подагенты для поиска
• Параллельное выполнение задач
• Система цитирования
Ключевые решения:
1️⃣ Детальное делегирование задач
2️⃣ Масштабирование усилий под сложность запроса
3️⃣ Параллельные вызовы инструментов
4️⃣ Расширенный режим мышления
Результаты: мульти-агентная система превосходит одиночного агента на 90% в исследовательских задачах.
Сравнение подходов 📊
Управление контекстом:
• Cognition: единый поток, компрессия истории
• Anthropic: распределенный контекст, память системы
Обработка ошибок:
• Cognition: минимизация точек отказа
• Anthropic: graceful degradation, retry логика
Производительность:
• Cognition: предсказуемость и стабильность
• Anthropic: скорость через распараллеливание задач
Сложность разработки:
• Cognition: простая отладка, линейный флоу
• Anthropic: сложная координация, но больше возможностей
Когда какой подход использовать 🎪
Линейные агенты (Cognition):
• Задачи с высокими требованиями к надежности
• Ограниченные ресурсы на разработку
• Последовательные рабочие процессы
Мульти-агенты (Anthropic):
• Исследовательские задачи
• Высокая ценность результата
• Возможность распараллеливания задач
Выводы 💡
Оба подхода имеют право на существование.
Выбор зависит от:
• Типа задач
• Требований к надежности
• Бюджета на разработку
• Опыта команды
Главное - понимать все trade-offs и не пытаться решить все задачи одним универсальным подходом.
@llm_notes
#agents #multi_agent_systems #production_ai #claude_research #battle #anthropic #cognition
❤7🔥4✍2
🚀 Cognition представила SWE-1.5 — новую модель для разработки ПО
Не успели мы порадоваться новой модели для кодинга от Cursor, как компания Cognition (которая этим летом купила Windsurf) анонсировала выпуск SWE-1.5 - специализированной модели для кодинга с сотнями миллиардов параметров.
Модель показывает производительность на уровне GPT-5-high в бенчмарке SWE-Bench Pro, работая при этом в 6 раз быстрее Haiku 4.5 и в 13 раз быстрее Sonnet 4.5.
🔧 Ключевые особенности:
• Скорость до 950 токенов в секунду благодаря партнерству с Cerebras
• Обучение с подкреплением на реальных задачах программирования (именно RL и помог сделать модель такой классной)
• Интеграция в IDE Windsurf
• Обучение на кластере GB200 NVL72 (возможно, первая публичная модель, прошедшая обучение на таком "железе")
📊 Подход к обучению:
1️⃣ Создание собственного датасета, отражающего реальные задачи разработчиков
2️⃣ Три механизма оценки: классические тесты, рубрики качества кода и агентная проверка
3️⃣ Процесс "reward hardening" для предотвращения обхода системы оценки
4️⃣ Совместная оптимизация модели и агентной системы
⚡️ Практическое применение:
• Изучение больших кодовых баз (используется в функциональности Codemaps, которая строит иерархические карты кодовых баз)
• Создание full-stack приложений
• Редактирование конфигураций
• Задачи, которые раньше занимали 20 секунд, теперь выполняются за 5 секунд
Модель доступна в последней версии Windsurf. Разработчики отмечают, что SWE-1.5 устраняет необходимость выбирать между скоростью и качеством работы ИИ-помощника.
🔗 Источники:
• [Официальный блог Cognition]
• [Скачать Windsurf]
@llm_notes
#windsurf #swe15 #cognition #vibecoding #ai #programming
Не успели мы порадоваться новой модели для кодинга от Cursor, как компания Cognition (которая этим летом купила Windsurf) анонсировала выпуск SWE-1.5 - специализированной модели для кодинга с сотнями миллиардов параметров.
Модель показывает производительность на уровне GPT-5-high в бенчмарке SWE-Bench Pro, работая при этом в 6 раз быстрее Haiku 4.5 и в 13 раз быстрее Sonnet 4.5.
🔧 Ключевые особенности:
• Скорость до 950 токенов в секунду благодаря партнерству с Cerebras
• Обучение с подкреплением на реальных задачах программирования (именно RL и помог сделать модель такой классной)
• Интеграция в IDE Windsurf
• Обучение на кластере GB200 NVL72 (возможно, первая публичная модель, прошедшая обучение на таком "железе")
📊 Подход к обучению:
1️⃣ Создание собственного датасета, отражающего реальные задачи разработчиков
2️⃣ Три механизма оценки: классические тесты, рубрики качества кода и агентная проверка
3️⃣ Процесс "reward hardening" для предотвращения обхода системы оценки
4️⃣ Совместная оптимизация модели и агентной системы
⚡️ Практическое применение:
• Изучение больших кодовых баз (используется в функциональности Codemaps, которая строит иерархические карты кодовых баз)
• Создание full-stack приложений
• Редактирование конфигураций
• Задачи, которые раньше занимали 20 секунд, теперь выполняются за 5 секунд
Модель доступна в последней версии Windsurf. Разработчики отмечают, что SWE-1.5 устраняет необходимость выбирать между скоростью и качеством работы ИИ-помощника.
🔗 Источники:
• [Официальный блог Cognition]
• [Скачать Windsurf]
@llm_notes
#windsurf #swe15 #cognition #vibecoding #ai #programming
❤2