Заметки LLM-энтузиаста
518 subscribers
144 photos
17 videos
1 file
175 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#anthropic #news #claude

Похоже сегодня день больших анонсов 🚀

🎉 ДОЛГОЖДАННЫЕ НОВОСТИ ОТ ANTHROPIC!

🤖 Встречайте Claude 3.7 Sonnet - самую умную версию нашего любимого ИИ-помощника!

Что нового? 🤔

Теперь Claude может работать в двух режимах:

• Мгновенные ответы
• Расширенное пошаговое мышление

📈 Модель получила серьезный апгрейд:
• Улучшена работа с математикой и физикой
• Лучше следует инструкциям
• Прокачан код и многие другие задачи
• На 45% меньше необоснованных отказов выполнять запросы

🖥 БОНУС: Anthropic также представили Claude Code! Это новый инструмент для разработчиков, который позволяет делегировать задачи прямо из терминала. По результатам тестов, Claude справляется с 45-минутными задачами в один присест! 🚀

🎯 Интересный факт: при разработке команда сфокусировалась не на решении олимпиадных задач по математике и информатике, а на реальных повседневных задачах, с которыми сталкиваются пользователи.

🛡 Безопасность прежде всего: Модель прошла тщательное тестирование на безопасность, надежность и стабильность работы.

🌟 Claude 3.7 Sonnet и Claude Code - это важный шаг к созданию ИИ-систем, которые действительно могут усилить человеческие возможности.

🔗 Если хотите попробовать Claude Code, то можно присоединиться к ограниченному предварительному доступу.

💡 Подробности можно узнать в полном посте на официальном сайте Anthropic.

#ClaudeAI #AI #Tech #Innovation
🔥62
#yandexgpt #openai #claude #battle #classification

🔥 По горячим следам: YandexGPT 5 Pro против всех (GPT-4.5, Claude-3.7 и другие)

Сегодня с одним из заказчиков провели эксперимент по классификации отзывов. 🧪
Результат оказался приятным сюрпризом: YandexGPT 5 Pro (см. анонс здесь) справилась с задачей лучше, чем GPT-4o, GPT-o1, llama 3, Claude 3.7, Qwen 2.5 и даже новейшая GPT-4.5! 🤯

Ключ к успеху — правильный промпт, улучшенный с помощью Deepseek-R1.

📊 Что тестировали:

Мы проверяли, можно ли решить задачу классификации отзывов одним промптом к модели общего назначения (без использования классификаторов и их дополнительного обучения)

Модели должны были оценить 3 отзыва о ресторане по 7 категориям (еда, сервис, персонал и т.д.) с оценками от 0 до 3.

🏆 Результаты с промптом от Deepseek-R1 (см. скриншот N1):

• YandexGPT 5 Pro: всего 1 ошибка! 👑
Claude 3.7: середина таблицы (3 ошибки)
• GPT-4.5 и GPT-o1: аутсайдеры 😬

🔄 Результаты с промптом от GPT-o1 (см. скриншот N2):

Claude 3.7: абсолютный лидер (0 ошибок) 🥇
• GPT-4o: 2-е место (2 ошибки) 🥈
• YandexGPT 5 Pro: в тройке лидеров (3 ошибки) 🥉
• GPT-4.5: снова в аутсайдерах 📉

💡 Интересный вывод:

Похоже, мы нашли идеальную связку для работы: берем обычный "человеческий" промпт → улучшаем его через Deepseek-R1 → запускаем в YandexGPT 5 Pro!
Такой подход продемонстрировал сегодня потрясающие результаты и может стать золотым стандартом для решения сложных задач. 🚀

📝 Подробный разбор с примерами отзывов, промптами и результатами выложил здесь

Про то, где взять Deepseek R1 чтобы протестировать, писал здесь и тут

#ИИ #YandexGPT #GPT #Claude #Эксперимент #Промпты
8👏2🤡2🔥1
#trae #claude #free

🚀 Бесплатный доступ к Claude 3.7 в Trae AI IDE

Привет, друзья 👋

Хочу поделиться полезной находкой для тех, кто работает с кодом и использует AI-ассистентов.

🔥 Что случилось?

Trae AI IDE теперь предлагает неограниченный бесплатный доступ к Claude 3.7 Sonnet
Причем и в режиме Chat, и в режиме Builder (это аналог Cursor агента) - см. скриншоты.

Я не сразу это заметил, но это просто находка для всех AI-разработчиков.

🤔 Почему это важно?

Claude 3.7 — один из наиболее эффективных AI-ассистентов для написания кода на сегодняшний день. Но есть проблема:
• Cursor иногда бывает перегружен запросами при работе с Claude 3.7 и может притормаживать
• Многие другие редакторы либо ограничивают использование Claude 3.7 каким-то количеством вызовов, либо требуют платную подписку

Преимущества Trae AI:

1️⃣ Полностью бесплатный доступ к Claude 3.7
2️⃣ Без ограничений на количество запросов
3️⃣ Стабильная работа даже с большими проектами
4️⃣ Интуитивный интерфейс, похожий на привычные IDE

Я уже писал про Trae AI здесь, но на всякий случай продублирую часть по его установке.

🛠 Как начать использовать:

1️⃣ Перейдите на сайт: https://www.trae.ai
2️⃣ Зарегистрируйтесь
3️⃣ Начните новый проект или импортируйте существующий
4️⃣ Используйте Claude 3.7 без ограничений

Для тех, у кого Trae AI уже установлен, надо обновиться на последнюю версию Help -> Check for Updates...

💡 Личный опыт:

Недавно использовал Trae для некоторых проектов и отметил хорошую скорость и точность генерации кода. Не сравнить с тем, что было раньше. Claude 3.7 хорошо понимает контекст и генерирует релевантный код.

Можете попробовать и поделиться своими впечатлениями в комментариях. 👇

#AI #Programming #ClaudeAI #TraeAI #DevTools
👍93🔥1
Утечка системного промпта Claude: 25 тысяч токенов секретных инструкций 🕵️‍♂️

Похоже, что в сеть утекла системная инструкция для ИИ-помощника Claude — целых 25 тысяч токенов корпоративных секретов. Правда, подлинность документа пока под вопросом, так что не спешите верить всему, что видите 🤔

Что внутри этого "секретного" документа? 📝

Если верить информации из репозитория, системный промпт Claude разделен на несколько основных разделов:

• Инструкции по цитированию — подробные правила о том, как правильно оформлять ссылки на источники (видимо, чтобы Claude выглядел умнее, чем есть на самом деле :) 🧠💭

• Информация об артефактах — когда использовать код, HTML, SVG и прочие технические штуки, которые делают ответы более "впечатляющими"

• Инструкции по поиску — от простых запросов до "глубоких исследований" (хотя мы все знаем, что ИИ просто "гуглит" за нас) 🔍😏

• Стили и предпочтения — как подстраиваться под пользователя (читай: как создавать иллюзию, что ИИ действительно вас понимает) 🎭

• Функции и инструменты — список всех доступных инструментов с параметрами API 🛠

• Профиль Claude — версии модели, этические ограничения и прочие корпоративные формальности 📋

• Временные и юридические примечания — напоминание о том, что знания ограничены октябрем 2024 года ⚖️

Интересно, что компания Anthropic, создавшая Claude, пока никак не прокомментировала ситуацию. Возможно, они слишком заняты написанием нового системного промпта на 50 тысяч токенов? 🤪📚

#ИИ #Claude #Утечки #Anthropic #security
3👍1
Anthropic тестирует Claude с функцией самоисправления ошибок 🤖

Похоже, что Anthropic готовится выпустить обновленные версии своих моделей Claude Opus и Sonnet в ближайшие недели. По данным The Information, новые модели смогут работать гораздо более автономно, чем их предшественники. Звучит многообещающе, хотя мы уже не раз слышали подобные заявления от AI-компаний. 🙄

Что нового планируется в моделях? 🧠

Главное отличие — способность моделей переключаться между самостоятельным мышлением и использованием внешних инструментов. Если модель сталкивается с проблемой при использовании инструмента, она переходит в режим "размышления", анализирует ситуацию и исправляет ошибку.

Вот несколько примеров возможностей:

• При анализе рынка для кафе в Москве/Нью-Йорке модель начинает с изучения национальных трендов, но быстро понимает их бесполезность и переключается на демографические данные конкретного района (Хамовники/Гринвич Виллидж)

• В задачах программирования модель автоматически тестирует сгенерированный код и, если что-то идет не так, останавливается, чтобы найти и исправить ошибку.

• Даже с расплывчатыми запросами вроде "сделай приложение быстрее" модель самостоятельно пробует различные стратегии оптимизации

Меньше подсказок, больше инициативы 💡

Подход Anthropic соответствует общей тенденции в индустрии: создание AI-систем, способных работать с минимальными вводными и самостоятельно решать проблемы. Обновленные модели Claude призваны сочетать рассуждения и использование инструментов, переключаясь между этими режимами по мере необходимости.

OpenAI идет по тому же пути со своими моделями o3 и o4-mini. Хотя, как отмечают тестировщики, o3 все еще делает ошибки в сложных задачах чаще, чем предыдущие модели OpenAI. Что ж, идеальных AI пока не существует 😏

Остается надеяться, что Anthropic не только улучшит способность моделей к самоисправлению, но и увеличит контекстное окно до миллиона токенов (а может быть и двух 😏), а также обновит базу знаний до 2025 года. Иначе Gemini 2.5 Pro останется более привлекательным вариантом для большинства пользователей, несмотря на все новые "фишки".

#ИскусственныйИнтеллект #Claude #Anthropic #AIновости #МашинноеОбучение
2👍2
Claude 4: Новое поколение AI-моделей от Anthropic 🚀

Как и ожидалось компания Anthropic представила новое поколение своих языковых моделей: Claude Opus 4 и Claude Sonnet 4. Обе модели устанавливают новые стандарты в программировании, аналитическом мышлении и автономной работе.

Ключевые особенности новых моделей 🔍

• Расширенное мышление с использованием инструментов (бета): Обе модели могут использовать инструменты, такие как веб-поиск, во время процесса мышления, чередуя рассуждения и применение инструментов для улучшения ответов.

• Новые возможности: Модели могут использовать инструменты параллельно, точнее следовать инструкциям и демонстрируют значительно улучшенные возможности памяти при доступе к локальным файлам.

Claude Code теперь общедоступен: После положительных отзывов во время тестирования, Claude Code теперь поддерживает фоновые задачи через GitHub Actions и имеет нативные интеграции с VS Code и JetBrains.

• Новые возможности API: Выпущены четыре новые функции для API Anthropic, которые позволяют разработчикам создавать более мощных AI-агентов.

Характеристики моделей 💻

Claude Opus 4 — самая мощная модель компании на сегодняшний день и, по их заявлению, лучшая модель для программирования в мире. Она лидирует в бенчмарках SWE-bench (72,5%) и Terminal-bench (43,2%). Модель способна поддерживать высокую производительность на длительных задачах, требующих сосредоточенных усилий и тысяч шагов, с возможностью непрерывной работы в течение нескольких часов.

Claude Sonnet 4 значительно улучшает возможности Sonnet 3.7, демонстрируя впечатляющие результаты в программировании с показателем 72,7% на SWE-bench. Модель обеспечивает оптимальное сочетание возможностей и практичности.

Доступность и цены 💰

Обе модели доступны в двух режимах: мгновенные ответы и расширенное мышление для более глубоких рассуждений. Планы Pro, Max, Team и Enterprise включают обе модели и расширенное мышление, а Sonnet 4 также доступен бесплатным пользователям.

Модели доступны через API Anthropic, Amazon Bedrock и Google Cloud's Vertex AI. Цены остаются на уровне предыдущих моделей:
1️⃣ Opus 4: $15/$75 за миллион токенов (ввод/вывод)
2️⃣ Sonnet 4: $3/$15 за миллион токенов

В Cursor уже доступны обе модели (см. скриншот)

Улучшения в моделях 🛠

Помимо расширенного мышления с использованием инструментов, параллельного выполнения инструментов и улучшений памяти, компания значительно снизила вероятность использования моделями shortcuts (ярлыки) или loopholes (лазейки) для выполнения задач. Обе модели на 65% реже демонстрируют такое поведение по сравнению с Sonnet 3.7.

Claude Opus 4 также значительно превосходит все предыдущие модели по возможностям памяти. При доступе к локальным файлам Opus 4 умело создает и поддерживает "файлы памяти" для хранения ключевой информации, что обеспечивает лучшую осведомленность о долгосрочных задачах и согласованность.

#ai #claude #anthropic #llm #coding
👍31🔥1
Новые возможности для разработки агентов на базе API Anthropic 🤖

Продолжение предыдущего поста на тему новых функций в API, которые усиливают "агентные" возможности новых моделей Anthropic. Функции офигительные и заслуживают отдельного внимания.

Anthropic представила четыре новые функции для своего API, которые расширяют возможности разработчиков по созданию интеллектуальных агентов.
Эти инструменты дополняют недавно выпущенные модели Claude Opus 4 и Sonnet 4.

Что нового? 📋

1️⃣ Инструмент выполнения кода
Теперь Claude может запускать Python-код в изолированной среде для выполнения вычислений и создания визуализаций данных. Это превращает модель из помощника по написанию кода в полноценного аналитика данных.
Здесь весь фокус, как я понимаю, именно в том, что данная функциональность доступна "из коробки" через API интерфейс модели, и нам как разработчикам теперь можно обойтись без дополнительных песочниц типа https://e2b.dev/ для запуска кода в своем приложении - как мы видим, все полезные и часто используемые инструменты со временем "проникают" внутрь LLM'ок.

Основные применения:
• Финансовое моделирование
• Научные вычисления
• Бизнес-аналитика
• Обработка документов
• Статистический анализ

Организации получают 50 бесплатных часов использования ежедневно, после чего стоимость составляет $0,05 за час работы контейнера.

2️⃣ MCP-коннектор
Позволяет подключать Claude к любому удаленному серверу Model Context Protocol (MCP) из списка без необходимости писать клиентский код. API Anthropic автоматически управляет соединениями, обнаружением инструментов и обработкой ошибок.

Когда Claude получает запрос с настроенными MCP-серверами, он:
• Подключается к указанным серверам
• Получает доступные инструменты
• Анализирует, какой инструмент вызвать и какие аргументы передать
• Выполняет вызовы инструментов до достижения результата
• Управляет аутентификацией и обработкой ошибок
• Возвращает ответ с интегрированными данными

3️⃣ Files API
Упрощает хранение и доступ к документам при работе с Claude. Вместо загрузки файлов в каждом запросе, разработчики могут загрузить документы один раз и многократно ссылаться на них в разных беседах.

Files API интегрируется с инструментом выполнения кода, позволяя Claude напрямую обрабатывать загруженные файлы и создавать графики как часть ответа.

4️⃣ Расширенное кэширование запросов
Разработчики теперь могут выбирать между стандартным 5-минутным временем жизни (TTL) для кэширования запросов или расширенным 1-часовым TTL за дополнительную плату. Это 12-кратное улучшение может снизить расходы для длительных рабочих процессов агентов.

С расширенным кэшированием затраты могут быть снижены до 90%, а задержки — до 85% для длинных запросов.

Практическое применение 💡

Представьте AI-агента для управления проектами, который может:
• Подключаться к Asana через MCP-коннектор для работы с задачами
• Загружать отчеты через Files API
• Анализировать прогресс с помощью инструмента выполнения кода
• Поддерживать полный контекст на протяжении всего взаимодействия
и все это "из коробки" через API самой модели!

Все эти функции уже доступны в публичной бета-версии API Anthropic и дополняют существующие возможности, такие как веб-поиск и цитирование.

Видео-запись демонстрации A Day with Claude можно посмотреть здесь
Также вы можете отдельно прочитать транскрипт и саммари демонстрации.

#ai #anthropic #claude #api #development
🔥41
На днях на канале Anthropic посмотрел запись беседы с Борисом Черным - создателем Claude Code, инструмента, который я все чаще начинаю использовать совместно, а иногда и вместо Cursor/Windsurf/Roo Code/Cline 📝
Эта беседа - отличное дополнение к документу по лучшим практикам использования Claude Code (вот здесь подготовил перевод на русский язык)

Ниже мои заметки по данной беседе.

Что такое Claude Code 🤖

Claude Code - это агентный инструмент для программирования, который работает прямо в терминале. Не нужно осваивать новые IDE или сайты - работает там, где вы уже работаете.

Почему терминал?
• Универсальность - работает с любым редактором (VS Code, Vim, Zed)
• Простота - позволяет быстро итерировать
• Гибкость - интегрируется в любой workflow

Установка и использование ⚙️

Установка через npm:
npm install -g @anthropic-ai/claude-code


Запуск: просто введите claude в терминале

Работает везде: iTerm2, SSH сессии, TMUX, терминалы IDE

Ключевые особенности 🔧

Агентность: Claude не просто дополняет код, а выполняет полные задачи - анализирует кодовую базу, читает файлы, вносит изменения

Интеграция с GitHub: можно @упоминать Claude в issues и PR для автоматического исправления багов и написания тестов

Claude.md файлы - система "памяти" для инструкций:
1️⃣ Claude.md - общие инструкции для проекта 2️⃣ Claude.local.md - персональные настройки
3️⃣ Глобальный Claude.md в домашней папке 4️⃣ Локальные Claude.md в подпапках проекта
Очень похоже на cursor project rules

Стоимость и доступность 💰

• Тестирование: $5 через API ключ
• Серьезное использование: ~$50-200/месяц
Claude Max подписка: $100-200/месяц с практически безлимитным использованием - при регулярном использовании claude данный тариф получается выгодным.

Эволюция с
Claude 4 🚀

Новые модели значительно улучшили:
• Следование инструкциям с первого раза
• Способность к "one-shot" решениям сложных задач
• Качество автоматически генерируемых тестов

Практические советы 💡

Для сложных задач:
• Просите Claude сначала составить план
• Используйте extended thinking для лучших результатов
• Комбинируйте чтение контекста → размышления → кодирование

Рабочий процесс:
• Простые задачи - делегируйте полностью в GitHub Actions
• Сложные задачи - работайте в паре с Claude в IDE терминале

Будущее развитие 🔮

Планируется расширение интеграций с различными инструментами и упрощение доступа для быстрых задач без открытия терминала.

P.S. Беседа идет всего 20 минут, полный транскрипт на русском языке здесь, краткий - тут.

@llm_notes

#claude #aicoding #developertools #anthropic #programming
❤‍🔥3👍1
Сравнение подходов: как строить AI-агентов в продакшене 🤖

Думаю, что будет интересно всем. Две крупные AI-компании одновременно опубликовали диаметрально противоположные взгляды на архитектуру агентов.
Cognition утверждает "не стройте мульти-агентов", а Anthropic напротив детально описывает свою мульти-агентную систему для Claude Research.

Позиция Cognition: простота как залог надежности 🎯

Основные принципы:
• Общий контекст для всех операций
• Действия несут неявные решения
• Параллельные агенты создают конфликты

Почему мульти-агенты НЕ работают:
1️⃣ Потеря контекста между агентами
2️⃣ Противоречивые решения подагентов
3️⃣ Сложность отладки и координации
4️⃣ Накопление ошибок в цепочке

Cognition предлагает линейную архитектуру с единым потоком выполнения и компрессией истории для длинных задач.

Подход Anthropic: сложность под контролем ⚡️

Архитектура Advanced Research:
• Главный агент-координатор
• Специализированные подагенты для поиска
• Параллельное выполнение задач
• Система цитирования

Ключевые решения:
1️⃣ Детальное делегирование задач
2️⃣ Масштабирование усилий под сложность запроса
3️⃣ Параллельные вызовы инструментов
4️⃣ Расширенный режим мышления

Результаты: мульти-агентная система превосходит одиночного агента на 90% в исследовательских задачах.

Сравнение подходов 📊

Управление контекстом:
• Cognition: единый поток, компрессия истории
• Anthropic: распределенный контекст, память системы

Обработка ошибок:
• Cognition: минимизация точек отказа
• Anthropic: graceful degradation, retry логика

Производительность:
• Cognition: предсказуемость и стабильность
• Anthropic: скорость через распараллеливание задач

Сложность разработки:
• Cognition: простая отладка, линейный флоу
• Anthropic: сложная координация, но больше возможностей

Когда какой подход использовать 🎪

Линейные агенты (Cognition):
• Задачи с высокими требованиями к надежности
• Ограниченные ресурсы на разработку
• Последовательные рабочие процессы

Мульти-агенты (Anthropic):
• Исследовательские задачи
• Высокая ценность результата
• Возможность распараллеливания задач

Выводы 💡

Оба подхода имеют право на существование.

Выбор зависит от:
• Типа задач
• Требований к надежности
• Бюджета на разработку
• Опыта команды

Главное - понимать все trade-offs и не пытаться решить все задачи одним универсальным подходом.

@llm_notes

#agents #multi_agent_systems #production_ai #claude_research #battle #anthropic #cognition
7🔥42
Как отслеживать расходы на Claude Code 💰

Если вы пользователь Claude Max или Pro и задаетесь вопросом, стоит ли Claude Code своих денег — просто посмотрите на статистику расходов.

Без детального анализа сложно оценить эффективность затрат. Некоторые задачи могут обходиться в $5 за каждый запуск, что серьезно бьет по бюджету 💸

Есть два полезных инструмента для отслеживания использования Claude Code:

1️⃣ ccusage
• CLI-инструмент для анализа использования токенов Claude Code
• Помогает легко выявить ресурсозатратные задачи
• Работает с локальными JSONL файлами

2️⃣ claude-code-costs
• Предоставляет визуальную разбивку стоимости сессий Claude
• Показывает расходы в динамике по времени
• Полезен для контроля бюджета

Основные возможности:
🔹 Расчет общих затрат по всем диалогам
🔹 Ежедневная разбивка расходов за последние 30 дней
🔹 Топ-20 самых дорогих диалогов
🔹 Фильтрация по проектам
🔹 Интерактивные HTML-отчеты с графиками

Установка и использование:
npx ccusage@latest
npx claude-code-costs


Оба инструмента анализируют данные из ~/.claude/projects/ и не требуют дополнительной настройки 🛠

Определенно стоит попробовать, если регулярно используете Claude Code для работы.

@llm_notes

#claude #cost #budget #development #vibecoding
3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Zen MCP Server: интеграция Claude Code с другими AI-моделями 🤖

Несмотря на то, что Claude Code необычайно быстр и удобен, думаю, что многие из вас уже сталкивались с ситуацией когда он иногда "слегка забывает" предыдущие шаги при работе со сложными задачами из-за ограничений контекстного окна (даже при использовании опции /compact). В этот момент хочется следовать проверенному временем процессу.
Я когда работаю в Cursor/Windsurf/Roo для анализа существующей кодовой базы обычно использую Gemini 2.5 Pro, а для планирования использую o3 или o3-mini/o4-mini.
При использовании Claude Code у нас есть возможность использовать для планирования и сложного траблшутинга Claude 4 Opus, во всех других случаях - Claude 4 Sonnet.
Claude 4 Opus дорогой и даже при использовании Claude Max 5x плана (за $100 в месяц) можно близко подойти к лимитам его использования, и в голову начинает приходить мысль "а не перейти ли на Max 20x plan за $200 долларов в месяц", которых мне пока что жалко :)

Zen MCP Server позволяет решить эти проблемы, позволяя Claude Code взаимодействовать с другими моделями, у которых и контекстное окно значительно больше, и reasoning-способности на очень хорошем уровне.

Что это дает 📈

• Доступ к Gemini 2.5 Pro с контекстом до 1M токенов
• Работа с GPT O3 и другими моделями
• Возможность передать всю кодовую базу проекта для анализа

Основные инструменты 🛠

1️⃣ chat — мозговой штурм и обзор кода
2️⃣ thinkdeep — глубокий анализ сложных проблем
3️⃣ planner — пошаговое планирование
4️⃣ consensus — получение мнений от нескольких моделей
5️⃣ codereview — профессиональный код-ревью
6️⃣ precommit — проверка перед коммитом
7️⃣ debug — диагностика и исправление багов
8️⃣ analyze — анализ больших файлов
9️⃣ refactor — рефакторинг кода
🔟 tracer — отслеживание зависимостей
1️⃣1️⃣ testgen — генерация тестов
1️⃣2️⃣ настраиваемые инструменты

Поддерживаемые провайдеры 🌐
• Google Gemini (нативный API)
• OpenAI (O3 модель)
• OpenRouter (множество моделей через один API)
• Локальные модели (Ollama, vLLM, LM Studio)

Особенности⚡️
• Автоматический выбор подходящей модели для задачи
• Продолжение диалогов между моделями
• Работа с изображениями и диаграммами
• Обход ограничений MCP в 25K токенов

Проект с открытым исходным кодом, лицензия Apache 2.0.
Deepwiki по проекту здесь.
Настройка через Docker занимает около 5 минут.

@llm_notes

#claude #mcp #ai_tools #code_review #gemini
👍6542
Claude Code получил функцию Hooks для интеграции в рабочий процесс 🔧

В Claude Code появилась новая возможность — Hooks, которая позволяет выполнять пользовательские shell-команды до или после использования инструментов. Это позволяет пользователю интегрировать в пайплайн разработки с использованием Claude Code свои собственные скрипты.

Доступные типы хуков:

1️⃣ PreToolUse — выполняется перед использованием инструмента, подходит для блокировки потенциально опасных операций

2️⃣ PostToolUse — запускается после использования инструмента, полезен для автоформатирования или логирования

3️⃣ Notification — срабатывает когда Claude требует внимания или задает вопрос

4️⃣ Stop — выполняется перед завершением ответа, подходит для очистки или генерации сводок

5️⃣ SubagentStop — запускается когда субагент Claude Code (вызов инструмента Task) завершает свою работу

Настройка и использование ⚙️

• Настройка через интерфейс /hooks (см. скриншот)
• Возможность фильтрации по названию инструмента
• Команды могут выполняться параллельно

Практические примеры:

• Notification хук для macOS со звуковым уведомлением (если его настроить на хук Stop или SubagentStop, то будет аналог того, что есть в Cursor Settings в разделе Settings -> Chat -> Completion Sound)
• Можно настроить отправку уведомлений в Slack или WhatsApp при завершении задач 📱

Безопасность 🔒

Claude контролирует безопасность вызовов — всегда запрашивает подтверждение перед внесением изменений, что предотвращает выполнение потенциально вредоносных скриптов.

Что круто: функция совместима и может работать с MCP инструментами

Подробности настройки в официальной документации

@llm_notes

#claude #hooks #vibecoding #development #automation
🔥5👍2💯2
🚀 Claude Sonnet 4 получил поддержку контекстного окна в 1 миллион токенов

Anthropic наконец-то увеличила контекстное окно Claude Sonnet 4 до 1 млн токенов — это в 5 раз больше предыдущего лимита (то, чего я ждал еще в мае :)
Теперь модель может обрабатывать целые кодовые базы с 75,000+ строк кода или десятки исследовательских работ за один запрос.

Новые возможности:

• Анализ больших кодовых баз — загрузка исходного кода, тестов и документации для понимания архитектуры проекта
• Синтез документов — обработка обширных наборов документов: контрактов, исследований, технических спецификаций
• Контекстно-зависимые агенты — создание агентов, которые сохраняют контекст на протяжении сотен вызовов инструментов

💰 Ценообразование API:

1️⃣ Промпты ≤ 200K токенов: $3/MTok (вход), $15/MTok (выход)

2️⃣ Промпты > 200K токенов: $6/MTok (вход), $22.50/MTok (выход)

При использовании кэширования промптов и пакетной обработки можно получить дополнительную экономию до 50% 📉

Отзывы клиентов:

🔧 Bolt.new — CEO Eric Simons отмечает, что расширенный контекст позволяет работать с крупными проектами, сохраняя высокую точность (мой комментарий: возможно, кстати, недавние успехи bolt, которые я наблюдал, при решении практических задач, связаны с тем, что они использовали модель с расширенным контекстным окном)

⚡️ iGent AI — разработчики AI-партнера Maestro для создания кода. CEO Sean Ward подчеркивает, что 1M токенов открывает возможности для многодневных сессий работы с реальными кодовыми базами.

📅 Доступность:

Функция пока находится в публичной бете для клиентов с Tier 4 и кастомными лимитами на Anthropic API (подробнее про Tier 4 здесь). Также доступна в Amazon Bedrock, скоро появится в Google Cloud Vertex AI.
В течение ближайших недель обещают распространить на более широкий круг пользователей.
Ждем с нетерпением!

• Официальный анонс по ссылке.
• Подробная документация тут.

@llm_notes

#claude #anthropic #context #ai #llm #1m
12❤‍🔥21