Заметки LLM-энтузиаста

Сравнение подходов: как строить AI-агентов в продакшене 🤖

Думаю, что будет интересно всем. Две крупные AI-компании одновременно опубликовали диаметрально противоположные взгляды на архитектуру агентов.
Cognition утверждает "не стройте мульти-агентов", а Anthropic напротив детально описывает свою мульти-агентную систему для Claude Research.

Позиция Cognition: простота как залог надежности 🎯

Основные принципы:
• Общий контекст для всех операций
• Действия несут неявные решения
• Параллельные агенты создают конфликты

Почему мульти-агенты НЕ работают:
1️⃣ Потеря контекста между агентами
2️⃣ Противоречивые решения подагентов
3️⃣ Сложность отладки и координации
4️⃣ Накопление ошибок в цепочке

Cognition предлагает линейную архитектуру с единым потоком выполнения и компрессией истории для длинных задач.

Подход Anthropic: сложность под контролем ⚡️

Архитектура Advanced Research:
• Главный агент-координатор
• Специализированные подагенты для поиска
• Параллельное выполнение задач
• Система цитирования

Ключевые решения:
1️⃣ Детальное делегирование задач
2️⃣ Масштабирование усилий под сложность запроса
3️⃣ Параллельные вызовы инструментов
4️⃣ Расширенный режим мышления

Результаты: мульти-агентная система превосходит одиночного агента на 90% в исследовательских задачах.

Сравнение подходов 📊

Управление контекстом:
• Cognition: единый поток, компрессия истории
• Anthropic: распределенный контекст, память системы

Обработка ошибок:
• Cognition: минимизация точек отказа
• Anthropic: graceful degradation, retry логика

Производительность:
• Cognition: предсказуемость и стабильность
• Anthropic: скорость через распараллеливание задач

Сложность разработки:
• Cognition: простая отладка, линейный флоу
• Anthropic: сложная координация, но больше возможностей

Когда какой подход использовать 🎪

Линейные агенты (Cognition):
• Задачи с высокими требованиями к надежности
• Ограниченные ресурсы на разработку
• Последовательные рабочие процессы

Мульти-агенты (Anthropic):
• Исследовательские задачи
• Высокая ценность результата
• Возможность распараллеливания задач

Выводы 💡

Оба подхода имеют право на существование.

Выбор зависит от:
• Типа задач
• Требований к надежности
• Бюджета на разработку
• Опыта команды

Главное - понимать все trade-offs и не пытаться решить все задачи одним универсальным подходом.

@llm_notes

#agents #multi_agent_systems #production_ai #claude_research #battle #anthropic #cognition

❤7🔥4✍2

364 views20:06

🚀 Cognition представила SWE-1.5 — новую модель для разработки ПО

Не успели мы порадоваться новой модели для кодинга от Cursor, как компания Cognition (которая этим летом купила Windsurf) анонсировала выпуск SWE-1.5 - специализированной модели для кодинга с сотнями миллиардов параметров.

Модель показывает производительность на уровне GPT-5-high в бенчмарке SWE-Bench Pro, работая при этом в 6 раз быстрее Haiku 4.5 и в 13 раз быстрее Sonnet 4.5.

🔧 Ключевые особенности:

• Скорость до 950 токенов в секунду благодаря партнерству с Cerebras
• Обучение с подкреплением на реальных задачах программирования (именно RL и помог сделать модель такой классной)
• Интеграция в IDE Windsurf
• Обучение на кластере GB200 NVL72 (возможно, первая публичная модель, прошедшая обучение на таком "железе")

📊 Подход к обучению:

1️⃣ Создание собственного датасета, отражающего реальные задачи разработчиков
2️⃣ Три механизма оценки: классические тесты, рубрики качества кода и агентная проверка
3️⃣ Процесс "reward hardening" для предотвращения обхода системы оценки
4️⃣ Совместная оптимизация модели и агентной системы

⚡️ Практическое применение:

• Изучение больших кодовых баз (используется в функциональности Codemaps, которая строит иерархические карты кодовых баз)
• Создание full-stack приложений
• Редактирование конфигураций
• Задачи, которые раньше занимали 20 секунд, теперь выполняются за 5 секунд

Модель доступна в последней версии Windsurf. Разработчики отмечают, что SWE-1.5 устраняет необходимость выбирать между скоростью и качеством работы ИИ-помощника.

🔗 Источники:
• [Официальный блог Cognition]
• [Скачать Windsurf]

@llm_notes

#windsurf #swe15 #cognition #vibecoding #ai #programming

❤2

1.02K viewsedited 13:24

About

Blog

Apps

Platform