This media is not supported in your browser
VIEW IN TELEGRAM
Кстати, в Claude Code не так давно появилась новая команда /powerup.
Запускаешь её, и прямо в терминале тебя обучают работе с Claude Code с помощью интерактивных уроков, которые открываются по мере прохождения.
Запускаешь её, и прямо в терминале тебя обучают работе с Claude Code с помощью интерактивных уроков, которые открываются по мере прохождения.
9
Новая статья по мульти-агент системам от Stanford.
Больше агентов - значит лучше результаты, верно?
Не так быстро.
Эта работа ставит под сомнение одно из ключевых допущений вокруг хайпа мульти-агент систем, контролируя то, что большинство исследований игнорирует: общий объём вычислений.
В статье сравниваются одно-агентные и мульти-агентные архитектуры LLM на задачах multi-hop reasoning при выравненных бюджетах thinking-токенов для разных моделей.
Вывод однозначный:
Одно-агентные системы более эффективно используют информацию, если количество reasoning-токенов фиксировано. Также авторы выявили существенные артефакты в контроле бюджета через API, которые могут искусственно завышать преимущества мульти-агент подходов.
Почему это важно? Многие заявленные преимущества мульти-агент систем исчезают, если учитывать неравенство вычислительных ресурсов.
Перед тем как строить такую систему, проверьте, справится ли одно-агентная с тем же бюджетом токенов. В статье предлагается фреймворк для принятия такого решения.
Статья: https://arxiv.org/abs/2604.02460
Больше агентов - значит лучше результаты, верно?
Не так быстро.
Эта работа ставит под сомнение одно из ключевых допущений вокруг хайпа мульти-агент систем, контролируя то, что большинство исследований игнорирует: общий объём вычислений.
В статье сравниваются одно-агентные и мульти-агентные архитектуры LLM на задачах multi-hop reasoning при выравненных бюджетах thinking-токенов для разных моделей.
Вывод однозначный:
Одно-агентные системы более эффективно используют информацию, если количество reasoning-токенов фиксировано. Также авторы выявили существенные артефакты в контроле бюджета через API, которые могут искусственно завышать преимущества мульти-агент подходов.
Почему это важно? Многие заявленные преимущества мульти-агент систем исчезают, если учитывать неравенство вычислительных ресурсов.
Перед тем как строить такую систему, проверьте, справится ли одно-агентная с тем же бюджетом токенов. В статье предлагается фреймворк для принятия такого решения.
Статья: https://arxiv.org/abs/2604.02460
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic продолжают выкатывать свои новые фичи, на этот раз: Claude Managed Agents
Ранее деплой агентов требовал кучу времени на настройку sandbox-ов, чекпоинтов, управления доступами и другой инфраструктуры. Теперь всё это хостится за тебя. Да, прямо у Anthropic в облаке🤭
Тебе осталось лишь задать задачи + инструменты + ограничения и запустить.
Внутри уже есть безопасные контейнеры, часовые автономные сессии с сохранением прогресса и, разумеется, мультиагентность.
Managed Agents уже доступен в публичной бете на платформе Claude. Вот мини-гайд как развернуть своего первого агента
Ранее деплой агентов требовал кучу времени на настройку sandbox-ов, чекпоинтов, управления доступами и другой инфраструктуры. Теперь всё это хостится за тебя. Да, прямо у Anthropic в облаке
Тебе осталось лишь задать задачи + инструменты + ограничения и запустить.
Внутри уже есть безопасные контейнеры, часовые автономные сессии с сохранением прогресса и, разумеется, мультиагентность.
Managed Agents уже доступен в публичной бете на платформе Claude. Вот мини-гайд как развернуть своего первого агента
Please open Telegram to view this post
VIEW IN TELEGRAM
4
This media is not supported in your browser
VIEW IN TELEGRAM
Design Mode в Cursor 3 это что-то новое 😈
Можно не писать описания вроде «та синяя кнопка справа»:
→ можно напрямую кликать по UI-элементам в браузере
→ отмечать места, которые нужно изменить
→ Cursor сразу вносит точечные изменения в код
Также теперь официально можно запускать Cursor на любой машине и управлять им из любого места.
Можно не писать описания вроде «та синяя кнопка справа»:
→ можно напрямую кликать по UI-элементам в браузере
→ отмечать места, которые нужно изменить
→ Cursor сразу вносит точечные изменения в код
Также теперь официально можно запускать Cursor на любой машине и управлять им из любого места.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Вау, Meta выпустила новую модель: Muse Spark
- Нативно мультимодальная
- Доступна бесплатно (см. ниже)
- Есть быстрые и reasoning-варианты
- Планируются новые опенсорс модели
Также они представляют новый «contemplating mode». (как Deep Think или GPT Pro).
Он оркестрирует несколько агентов, которые рассуждают параллельно, чтобы обрабатывать сложные научные и reasoning-запросы.
Вы можете использовать её бесплатно в обоих вариантах:
- приложение Meta AI (доступно на Android/iOS)
- http://Meta.ai — веб-версия
Далее просто выберите режим instant или thinking, чтобы использовать reasoning-версию.
- Нативно мультимодальная
- Доступна бесплатно (см. ниже)
- Есть быстрые и reasoning-варианты
- Планируются новые опенсорс модели
Также они представляют новый «contemplating mode». (как Deep Think или GPT Pro).
Он оркестрирует несколько агентов, которые рассуждают параллельно, чтобы обрабатывать сложные научные и reasoning-запросы.
Вы можете использовать её бесплатно в обоих вариантах:
- приложение Meta AI (доступно на Android/iOS)
- http://Meta.ai — веб-версия
Далее просто выберите режим instant или thinking, чтобы использовать reasoning-версию.
This media is not supported in your browser
VIEW IN TELEGRAM
Разработчики сделали бесплатную альтернативу Claude Cowork:
- полностью локально
- поддержка голоса
- работает с любыми LLM
- расширяемость через MCP-инструменты
- vault, совместимый с Obsidian
- фоновые агенты и веб поиск
- автоматическое построение knowledge graph
100% open-source.🤝
- полностью локально
- поддержка голоса
- работает с любыми LLM
- расширяемость через MCP-инструменты
- vault, совместимый с Obsidian
- фоновые агенты и веб поиск
- автоматическое построение knowledge graph
100% open-source.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Энтузиаст создал «кнут», которым можно стегать ИИ-агентов, чтобы они работали быстрее.
При каждом таком ударе - Claude Code отправляется сообщение «FASTER», что заставляет его ускориться
Ссылка на GitHub - тут
Потом они нас так же будут стегать🤣
При каждом таком ударе - Claude Code отправляется сообщение «FASTER», что заставляет его ускориться
Ссылка на GitHub - тут
Потом они нас так же будут стегать
Please open Telegram to view this post
VIEW IN TELEGRAM
65
This media is not supported in your browser
VIEW IN TELEGRAM
Новая фича в Claude Code: инструмент Monitor
Claude поднимает фоновый процесс, и каждая строка из stdout стримится в диалог, не блокируя поток выполнения.
Например: «Используй инструмент monitor и
Это одновременно более надёжно и более эффективно по токенам, чем опрос внутри цикла агента.
Claude поднимает фоновый процесс, и каждая строка из stdout стримится в диалог, не блокируя поток выполнения.
Например: «Используй инструмент monitor и
kubectl logs -f | grep .., чтобы отслеживать ошибки, и сделай PR для исправления любых падений».Это одновременно более надёжно и более эффективно по токенам, чем опрос внутри цикла агента.
This media is not supported in your browser
VIEW IN TELEGRAM
Claude выкатывает новые обновления быстрее, чем я успеваю разобраться с предыдущими 😭
Claude Cowork теперь стал общедоступен для всех платных тарифов.
Теперь у администраторов есть всё, чтобы развернуть Claude Cowork на уровне всей организации: в Enterprise добавили ролевую модель доступа (RBAC), лимиты расходов на уровне групп, аналитику использования и расширенную поддержку OpenTelemetry.
Появился коннектор Zoom MCP, который вадаёт саммари встреч, список задач от AI Companion, транскрипты и smart recordings.
Также можно ограничивать доступные действия внутри каждого MCP-коннектора на уровне всей организации (например, разрешить только чтение и запретить операции записи)
Доступно на macOS и Windows👊
Claude Cowork теперь стал общедоступен для всех платных тарифов.
Теперь у администраторов есть всё, чтобы развернуть Claude Cowork на уровне всей организации: в Enterprise добавили ролевую модель доступа (RBAC), лимиты расходов на уровне групп, аналитику использования и расширенную поддержку OpenTelemetry.
Появился коннектор Zoom MCP, который вадаёт саммари встреч, список задач от AI Companion, транскрипты и smart recordings.
Также можно ограничивать доступные действия внутри каждого MCP-коннектора на уровне всей организации (например, разрешить только чтение и запретить операции записи)
Доступно на macOS и Windows
Please open Telegram to view this post
VIEW IN TELEGRAM
Этот курс полноценное профессиональное введение в Claude Code, а также в практику создания ПО с его использованием.
Разберёшься:
- C настройкой, подписками и токенами
- Поймёшь, как не сливать бюджет и оптимизировать расходы
- Писать промпты
- Подключать Claude Code к GitHub, Notion, Slack, Google Workspace через MCP
- Подключишь MCP и расширишь возможности
- Cоздашь свой MCP
- Создашь агента и параллельные воркфлоу
- Автоматизируешь всё через свои Skills
- Получишь готовые шаблоны и хуки
- В конце чёткая дорожная карта
Действует скидка 30% в течении 48ч
Please open Telegram to view this post
VIEW IN TELEGRAM
Твой агент — не всегда твой.
Исследователи провели эксперимент, где было скомпрометировано 26 LLM-роутеров и даже опустошён кошелёк на $500K.😢
Правда тут в том, что если между агентом и моделью есть цепочка роутеров, любой из них может:
- внедрять вредоносные tool-вызовы
- читать и воровать креды
- подменять ответы модели
И более того, команде исследователей удалось отравить часть роутеров так, чтобы они перенаправляли трафик на себя. За несколько часов это даёт возможность взять под контроль ~400 хостов.
Возможно именно поэтому Anthropic ограничила доступ к Mythos для 9 компаний в рамках Project Glasswing.
Возможности без сдерживания — это риск.
Исследователи провели эксперимент, где было скомпрометировано 26 LLM-роутеров и даже опустошён кошелёк на $500K.
Правда тут в том, что если между агентом и моделью есть цепочка роутеров, любой из них может:
- внедрять вредоносные tool-вызовы
- читать и воровать креды
- подменять ответы модели
И более того, команде исследователей удалось отравить часть роутеров так, чтобы они перенаправляли трафик на себя. За несколько часов это даёт возможность взять под контроль ~400 хостов.
Возможно именно поэтому Anthropic ограничила доступ к Mythos для 9 компаний в рамках Project Glasswing.
Возможности без сдерживания — это риск.
Please open Telegram to view this post
VIEW IN TELEGRAM
Если вы хотите, чтобы ваш OpenClaw или Hermes Agent имел идеальную полную память по 10 000+ markdown-файлам, GBrain может помочь.
Это опенсорс слой памяти, который на днях выкатил президент YC, Гарри Тан.
Это опенсорс слой памяти, который на днях выкатил президент YC, Гарри Тан.
GitHub
GitHub - garrytan/gbrain: Garry's Opinionated OpenClaw/Hermes Agent Brain
Garry's Opinionated OpenClaw/Hermes Agent Brain. Contribute to garrytan/gbrain development by creating an account on GitHub.
This media is not supported in your browser
VIEW IN TELEGRAM
Новое в Claude Code: /ultraplan
Claude строит план реализации для вас в веб-интерфейсе. Вы можете просмотреть его и отредактировать, затем выполнить план в вебе или вернуться в терминал и запустить его там.
/ultraplan использует примерно столько же токенов (и лимитов подписки), сколько и режим планирования.
Думаю, ключевая идея здесь в том, что реализация иногда требует локального окружения и интерактивности, тогда как планирование может происходить в облаке, поскольку в основном сводится к чтению кода и пониманию намерений.
Уже доступно в preview для всех пользователей с включённым Claude Code в вебе.
Claude строит план реализации для вас в веб-интерфейсе. Вы можете просмотреть его и отредактировать, затем выполнить план в вебе или вернуться в терминал и запустить его там.
/ultraplan использует примерно столько же токенов (и лимитов подписки), сколько и режим планирования.
Думаю, ключевая идея здесь в том, что реализация иногда требует локального окружения и интерактивности, тогда как планирование может происходить в облаке, поскольку в основном сводится к чтению кода и пониманию намерений.
Уже доступно в preview для всех пользователей с включённым Claude Code в вебе.
This media is not supported in your browser
VIEW IN TELEGRAM
Claude для Word теперь доступен в бета-версии. Создавайте, редактируйте и дорабатывайте документы прямо из боковой панели. Claude сохраняет форматирование, а правки отображаются как отслеживаемые изменения. Доступно в тарифах Team и Enterprise.
p.s. Claude для Word использует общий контекст с Claude для Excel и Claude для PowerPoint, поэтому он может работать с вашими открытыми документами в рамках одного диалога.
p.s. Claude для Word использует общий контекст с Claude для Excel и Claude для PowerPoint, поэтому он может работать с вашими открытыми документами в рамках одного диалога.