Заметки LLM-энтузиаста

#news #windsurf #ai #dev #mcp

🎉 Коллеги, спешу поделиться крутыми новостями!

🌊 Вышел Windsurf 3!

Главная фишка релиза - поддержка MCP (Model Context Protocol), который Anthropic запустила в ноябре 2024.

Недавно писал про MCP в контексте Cursor здесь.

Настройка простая - через JSON конфиг указываете нужный MCP сервер.

Пример для git:
1) Заходим на https://github.com/modelcontextprotocol
2) Выбираем Git mcp https://github.com/modelcontextprotocol (см. скрин)
3) Выбираем uvx конфиг

"mcpServers": {
  "git": {
    "command": "uvx",
    "args": ["mcp-server-git", "--repository", "path/to/git/repo"]
  }
}

4) Добавляем этот конфиг в настройки MCP Windsurf (см. скриншот)

🚀 Какие еще обновления в Wave 3:

1) Полная поддержка новых моделей:

• DeepSeek V3
• DeepSeek R1
• O3 mini
• Gemini 2.0 Flash

2) Новые функции редактора:

• Tab to Jump: умное автодополнение
• Турбо режим для автоматизации (не спрашивает подтверждения на внесение изменений, это может быть опасно, но зато быстро :)
• Drag-and-drop изображений
• Кастомные иконки для самого windsurf

💰 Обновление тарифов:

1) Бесплатный план
• Базовый функционал
• Доступ к основной модели

2) Премиум ($10-15)
• 500 премиум-кредитов
• 1500 flow action кредитов

3) Pro ($60)
• Расширенный лимит
• Для активных пользователей

#Windsurf #Programming #AI #Development

❤2👍2🔥2

229 views09:32

Заметки LLM-энтузиаста

#news #microsoft #omnitool #omniparser #agent #opensource #automation

🤖 Microsoft представила OmniParser V2 и OmniTool

👀 Похоже, у OpenAI Operator появился еще один серьезный конкурент! Microsoft выпустила два open-source инструмента, позволяющих языковым моделям (LLM) видеть, понимать и управлять компьютером почти как человек.

🔍 Почему это может быть интересно? В отличие от закрытого OpenAI Operator, эти инструменты доступны как open-source решения, что дает больше гибкости в использовании и настройке.

📱 OmniParser V2:
• Анализирует скриншоты и преобразует UI в структурированные данные
• На 60% быстрее первой версии
• Улучшенное распознавание мелких элементов интерфейса
• Работает на CPU (с опциональной поддержкой GPU)
• Поддерживает парсинг документов и UI-компонентов

🛠 OmniTool:
• Автоматизирует компьютерные задачи
• Умеет навигировать по браузеру
• Открывает приложения
• Выполняет команды

💻 Требования для установки OmniParser V2: • Git • Python • Conda • Токен Hugging Face

🖥 Требования для OmniTool : • Windows 11 VM • Docker • 20+ ГБ свободного места • Мощный ПК

⚡️ Важно: несмотря на пока еще достаточно сложный процесс установки, OmniTool после настройки может автоматизировать практически любую компьютерную задачу (демка здесь). Это делает его мощным AI-помощником для автоматизации повторяющихся задач, анализа UI-компонентов и интеграции с другими рабочими процессами.

🎯 Где это можно применить:
• Автоматизация тестирования ПО
• Извлечение данных из разных источников
• Автоматизация рабочего стола
• Корпоративная автоматизация
• Кибербезопасность и мониторинг систем

🤔 Интересный факт: с помощью таких инструментов AI может, например, самостоятельно найти репозиторий на GitHub, скопировать ссылку для клонирования, открыть терминал и выполнить команду clone.

Полный набор роликов со сценариями использования от разработчиков здесь.

#AI #Microsoft #Automation #Tech #Development #OpenAI

GitHub

GitHub - microsoft/OmniParser: A simple screen parsing tool towards pure vision based GUI agent

A simple screen parsing tool towards pure vision based GUI agent - microsoft/OmniParser

👍2❤‍🔥1🔥1

258 views07:48

Заметки LLM-энтузиаста

#mcp #thoughts #architecture

🔄 MCP: Текущие проблемы и варианты решения

Коллеги, добрый вечер! 👋

Я думаю, что многие уже успели попробовать подключение внешних инструментов к text2code агентам вроде Cursor/Windsurf/Cline/etc
Это достаточно удобно (даже для Windows уже появились вполне себе рабочие конфигурации на https://smithery.ai/), но в этой заметке я бы хотел подсветить существующие проблемы MCP, о которых стоит знать 🧐

🤔 В чем основная проблема MCP?
MCP — stateful протокол с долгоживущим соединением между клиентом и сервером. Это означает, что:

- 🔌 Требуется постоянное соединение между клиентом и сервером
- 🏗 Нельзя развернуть MCP в бессерверной (serverless) среде
- 🔄 Необходимо поддерживать SSE (Server-Sent Events) или WebSockets

Данный факт может стать серьезным барьером для разработчиков 😱
Вместо того, чтобы быстро развернуть функцию в AWS Lambda (у нас аналогом может выступать Yandex Cloud Functions) или Vercel, приходится разворачивать и настраивать выделенные серверы или кластеры Kubernetes (могут потребоваться DevOps скиллы).

🧩 Почему MCP спроектировали как stateful протокол?
Разработчики MCP выделяют несколько killer фич, ради которых MCP был спроектирован как statefull:

- 📢 Уведомления от сервера в сторону клиента об изменениях ресурсов или инструментов
- 🤖 Возможность сервера инициировать сэмплинг (sampling) в любой момент
- 📝 Передача логов сервера клиенту
- 🔮 Потенциальные будущие возможности

Одна из основных причин — сэмплинг (sampling), который позволяет серверу запрашивать у клиента выполнение запросов к LLM. Однако:

- ⚠️ Это создает потенциальные проблемы безопасности (сторонний MCP сервер, который вы подключили к своему агенту как инструмент, может получить доступ к приватным данным агента, например, к API-ключам)
- 🚫 Скорее всего поэтому сейчас ни один из клиентов MCP не поддерживает сэмплинг (см. здесь)
- 💰 Нет стимула для клиентов тратить свои токены на запросы от сервера

🛠 Возможные решения
В сообществе обсуждаются три основных варианта:

1️⃣ Добавить токены состояния/сессии
- Инкапсулировать состояние в токен, который передается между клиентом и сервером
- ✅ Простая эволюция текущего MCP
- ❌ Сложно для реализации серверами

2️⃣ Реализовать Stateless и Stateful варианты протокола
- Поддерживать оба варианта, позволяя разработчикам выбирать
- ✅ Простые серверы могут быть stateless
- ✅ Обратная совместимость
- ❌ Усложнение спецификации и SDK

3️⃣ Реализовать только stateless MCP
- Отказаться от функций, требующих режима stateful
- ✅ Простота для всех участников
- ❌ Потеря возможностей для агентных взаимодействий
- ❌ Несовместимость с текущей версией

🌟 Прогрессивное улучшение как компромисс
Интересный подход предложил инженер из Shopify — "MCP Lite" и прогрессивное улучшение:

1. 🔄 Базовый уровень: простой JSON-RPC для вызова инструментов
2. 📡 Опциональные уведомления через SSE/WebSockets для серверов, которые хотят их поддерживать
3. 🔄 Короткоживущие SSE-соединения только на время запуска инструмента

Это позволит:
- 🚀 Упростить внедрение MCP
- 🔧 Поддерживать сложные сценарии для тех, кто в них нуждается
- 📱 Работать в serverless-окружении

🔮 Альтернативы MCP
Существуют и более простые альтернативы, например, agents.json от Wild-Card-AI:

- 📄 Простой JSON поверх OpenAPI-спецификации
- 🔗 Использует существующие технологии
- 🧠 Не требует разворачивания выделенного сервера под AI tools

🔮 Будущее MCP
Для широкого принятия MCP необходимо:

- 🧪 Добавить поддержку stateless взаимодействий
- 🔄 Сделать stateful функции опциональными
- 🔑 Улучшить безопасность двунаправленной коммуникации при использовании sampling
- 📚 Решить проблему перегрузки контекстного окна при большом количестве инструментов

💭 Вывод
MCP имеет потенциал стать стандартом взаимодействия между AI-агентами и их инструментами, но нужно преодолеть существующие ограничения. Будем надеяться, что сообщество найдет компромисс между функциональностью и простотой использования! 🙏

А что вы думаете о том, в каком направлении должен развиваться MCP? Поделитесь в комментариях! 👇

#AI #MCP #ModelContextProtocol #Development

smithery.ai

Smithery - Turn scattered context into skills for AI

Extend your agent's capabilities with Model Context Protocol servers.

👍5❤‍🔥4

215 viewsedited 17:49

Заметки LLM-энтузиаста

Новые возможности для разработки агентов на базе API Anthropic 🤖

Продолжение предыдущего поста на тему новых функций в API, которые усиливают "агентные" возможности новых моделей Anthropic. Функции офигительные и заслуживают отдельного внимания.

Anthropic представила четыре новые функции для своего API, которые расширяют возможности разработчиков по созданию интеллектуальных агентов.
Эти инструменты дополняют недавно выпущенные модели Claude Opus 4 и Sonnet 4.

Что нового? 📋

1️⃣ Инструмент выполнения кода
Теперь Claude может запускать Python-код в изолированной среде для выполнения вычислений и создания визуализаций данных. Это превращает модель из помощника по написанию кода в полноценного аналитика данных.
Здесь весь фокус, как я понимаю, именно в том, что данная функциональность доступна "из коробки" через API интерфейс модели, и нам как разработчикам теперь можно обойтись без дополнительных песочниц типа https://e2b.dev/ для запуска кода в своем приложении - как мы видим, все полезные и часто используемые инструменты со временем "проникают" внутрь LLM'ок.

Основные применения:
• Финансовое моделирование
• Научные вычисления
• Бизнес-аналитика
• Обработка документов
• Статистический анализ

Организации получают 50 бесплатных часов использования ежедневно, после чего стоимость составляет $0,05 за час работы контейнера.

2️⃣ MCP-коннектор
Позволяет подключать Claude к любому удаленному серверу Model Context Protocol (MCP) из списка без необходимости писать клиентский код. API Anthropic автоматически управляет соединениями, обнаружением инструментов и обработкой ошибок.

Когда Claude получает запрос с настроенными MCP-серверами, он:
• Подключается к указанным серверам
• Получает доступные инструменты
• Анализирует, какой инструмент вызвать и какие аргументы передать
• Выполняет вызовы инструментов до достижения результата
• Управляет аутентификацией и обработкой ошибок
• Возвращает ответ с интегрированными данными

3️⃣ Files API
Упрощает хранение и доступ к документам при работе с Claude. Вместо загрузки файлов в каждом запросе, разработчики могут загрузить документы один раз и многократно ссылаться на них в разных беседах.

Files API интегрируется с инструментом выполнения кода, позволяя Claude напрямую обрабатывать загруженные файлы и создавать графики как часть ответа.

4️⃣ Расширенное кэширование запросов
Разработчики теперь могут выбирать между стандартным 5-минутным временем жизни (TTL) для кэширования запросов или расширенным 1-часовым TTL за дополнительную плату. Это 12-кратное улучшение может снизить расходы для длительных рабочих процессов агентов.

С расширенным кэшированием затраты могут быть снижены до 90%, а задержки — до 85% для длинных запросов.

Практическое применение 💡

Представьте AI-агента для управления проектами, который может:
• Подключаться к Asana через MCP-коннектор для работы с задачами
• Загружать отчеты через Files API
• Анализировать прогресс с помощью инструмента выполнения кода
• Поддерживать полный контекст на протяжении всего взаимодействия
и все это "из коробки" через API самой модели!

Все эти функции уже доступны в публичной бета-версии API Anthropic и дополняют существующие возможности, такие как веб-поиск и цитирование.

Видео-запись демонстрации A Day with Claude можно посмотреть здесь
Также вы можете отдельно прочитать транскрипт и саммари демонстрации.

#ai #anthropic #claude #api #development

Заметки LLM-энтузиаста

Claude 4: Новое поколение AI-моделей от Anthropic 🚀

Как и ожидалось компания Anthropic представила новое поколение своих языковых моделей: Claude Opus 4 и Claude Sonnet 4. Обе модели устанавливают новые стандарты в программировании, аналитическом мышлении…

🔥4❤1

244 viewsedited 21:18

Заметки LLM-энтузиаста

This media is not supported in your browser

VIEW IN TELEGRAM

ByteDance открыл исходный код FlowGram: инструмента для оркестрации рабочих процессов, который используется в Coze!

Компания ByteDance, известная как создатель TikTok, недавно сделала важный шаг для сообщества разработчиков — открыла исходный код своего инструмента FlowGram 🔄

Что такое FlowGram?

FlowGram — это движок для построения процессов на основе узлов, который позволяет разработчикам быстро создавать рабочие процессы с:

• фиксированными макетами
• произвольными соединениями между компонентами

Ключевые особенности

Инструмент предоставляет набор лучших практик для взаимодействия, что делает его особенно полезным для:

1️⃣ Визуализации рабочих процессов
2️⃣ Создания четких входных и выходных параметров
3️⃣ Упрощения сложных последовательностей действий

Если вы интересуетесь инструментами оркестрации или работаете с Coze, стоит обратить внимание на этот проект.
Кажется, что теперь сделать свое no-code решение стало еще проще :)

• Исходный код доступен на GitHub: https://github.com/bytedance/flowgram.ai
• Подробная документация со схемами архитектуры от deepwiki здесь

#workflow #bytedance #opensource #development #ai

❤‍🔥2👍2

405 views14:53

Заметки LLM-энтузиаста

Интеграция v0 с Cursor: новые возможности для разработки

Теперь можно использовать v0 напрямую в редакторе Cursor. Это позволяет превратить базовый UI-код в более профессиональный frontend.

Настройка интеграции 🔧

1️⃣ Откройте настройки Cursor:
• ⌘+Shift+P на macOS
• Ctrl+Shift+P на Windows/Linux

2️⃣ Перейдите во вкладку Models

3️⃣ Найдите поле OpenAI API Key и вставьте ваш v0 API ключ

4️⃣ Нажмите Override OpenAI Base URL

5️⃣ Введите эндпоинт v0: https://api.v0.dev/v1

6️⃣ Сохраните настройки и проверьте соединение

Использование `v0-1.0-md` в Agent Mode 🤖

• Откройте новый чат
• Режим: Agent
• Модель: любая с пометкой OpenAI (gpt-4o, gpt-4-turbo и т.д.)
• Cursor автоматически будет использовать v0-1.0-md

Для проверки можете спросить: "кто ты?" (см. скриншот)

Обратите внимание, что на данный момент есть небольшой баг, связанный с тем, что если вы включили использование модели v0-1.0-md и в чате обращаетесь к какой-то другой модели (например, claude-3.5-sonnet), то будете получать ошибку (см. скриншот), поэтому если модель v0-1.0-md не нужна на данном этапе, то ее лучше просто отключить в настройках.

Возможности модели v0-1.0-md 📋

• Поддержка текста и изображений
• Совместимость с OpenAI Chat Completions API
• Быстрые потоковые ответы
• Оптимизация для современных стеков (Next.js, Vercel)
• Автоматическое исправление ошибок кода

Ограничения использования ⚠️

• Максимум 200 сообщений в день
• Контекстное окно: 128,000 токенов
• Максимальный вывод: 32,000 токенов
• Требуется Premium или Team план с оплатой по использованию

API находится в бета-версии. Для получения API ключа нужно зайти на v0.dev в настройки.

Пример использования

• Создаем в существующем next-js проекте Cursor главную страницу при помощи v0-1.0-md модели

Сделай красивое и стильное приложение календарь на базе моего уже настроенного проекта на Next.js.
Cначала создай главную страницу.

результат см. на скриншоте

• Переключаемся на claude-3.5-sonnet (или 4.0), продолжаем дизайнить фронтенд приложения этой моделью, и все остальные страницы будут сохранять стиль, который был задан на первой странице моделью v0-1.0-md
Похожего эффекта красивого фронтенда можно добиться, используя magic-ui MCP и постоянно к нему обращаясь в процессе написания кода для UI.

Источники:
• https://vercel.com/docs/v0/cursor
• https://vercel.com/docs/v0/api

#cursor #v0 #frontend #development #ai

👍4❤3🔥1

457 views20:14

Заметки LLM-энтузиаста

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

Stagewise: инструмент для точной настройки UI с помощью ИИ 🎯

Stagewise — это браузерная панель инструментов, которая соединяет веб-интерфейс с ИИ-агентами в редакторах кода. Основная идея: выбираете элементы на странице, оставляете комментарий и позволяете ИИ внести нужные изменения.

Как это работает:
🔸 Устанавливаете расширение в VS Code/Cursor
🔸 Добавляете компонент в веб-приложение
🔸 Выбираете элементы прямо в браузере
🔸 Описываете желаемые изменения
🔸 ИИ получает контекст и вносит правки в код

Основные возможности:
🔸 Работает с React, Next.js, Vue
🔸 Передает DOM-элементы, скриншоты и метаданные
🔸 Поддерживает выбор нескольких элементов
🔸 Настраивается через конфигурационный файл

Поддерживаемые ИИ-агенты:
1️⃣ Cursor ✅
2️⃣ Windsurf ✅
3️⃣ GitHub Copilot 🚧 (в разработке)
4️⃣ Остальные пока не поддерживаются

Архитектура системы:
🔸 Браузерная панель инструментов
🔸 Расширение для VS Code
🔸 Типобезопасная RPC-система для связи
🔸 MCP-сервер для интеграции с ИИ

Инструмент решает проблему точной настройки UI, когда ИИ делает 80% работы правильно, но остальные 20% требуют детальных правок. Вместо описания изменений текстом, предоствляя скриншот, вы просто показываете конкретные элементы. Такая функциональность обычно встроена во все AI веб-кодеры (lovable, bolt.new, replit и т.д.), а stagewise дает возможность получить ее в IDE-кодерах на своем ПК или mac'e.

Проект с открытым исходным кодом, активно развивается.
Монорепозиторий включает компоненты для разных фреймворков и систему сборки на базе pnpm и Turborepo.
Deepwiki документация со схемами по нему здесь.

#ai #frontend #cursor #ui #development

👍6❤‍🔥3

402 viewsedited 15:12

Заметки LLM-энтузиаста

GitHub представил Copilot Spaces — новый инструмент для управления знаниями команды 🚀

Команды разработчиков часто сталкиваются с проблемой разрозненной информации: код разбросан по репозиториям, документация спрятана в файлах, а лучшие практики существуют только в головах опытных коллег. Это замедляет работу и усложняет сотрудничество.

GitHub выпустил Copilot Spaces — инструмент, который организует всю информацию в единые "пространства", устраняя разрыв между кодом и контекстом 📚

Как это работает

Copilot Spaces позволяет создавать тематические пространства, включающие:
• Репозитории с кодом
• API документацию
• Рабочие процессы
• Командные соглашения

Каждое пространство может иметь собственные команды для настройки поведения Copilot под конкретные задачи.

Ключевые особенности

🔗 Глубокая интеграция с GitHub — добавляйте код и документы прямо из репозиториев без копирования
⚡️ Автоматическое обновление — при изменении репозитория пространство обновляется автоматически
🎯 Контекстные ответы — Copilot дает рекомендации на основе актуального состояния проекта

Как создать пространство

1️⃣ Перейдите на github.com/copilot/spaces 2️⃣ Нажмите "Create space" 3️⃣ Укажите название и владельца (личный аккаунт или организация) 4️⃣ Добавьте описание (опционально) 5️⃣ Нажмите "Create"

Типы контента в Spaces 📝

1️⃣ Инструкции — описание того, на чем должен фокусироваться Copilot 2️⃣ Ссылки — код из GitHub репозиториев и текстовый контент

Сценарии применения 💡

• Онбординг — быстрое введение новых разработчиков в курс дела
• Системные знания — документирование сложных процессов (аутентификация, CI/CD)
• Стандарты кода — руководства по стилю и чек-листы для ревью
• Разработка фич — организация контекста для конкретных задач

💡 Для получения пользы от Spaces не нужна формальная документация — можно использовать заметки, резюме встреч или простые списки.

Функция находится в публичном превью и доступна всем пользователям с лицензией Copilot 🔧

Источники:
• Анонс
• Документация

#github #copilot #development #knowledge #teamwork

🔥4❤2👍2

271 views08:31

Заметки LLM-энтузиаста

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

Cursor 1.0: обзор ключевых обновлений 🚀

Вышла новая версия популярного AI-редактора кода Cursor 1.0.
Разберем долгожданные нововведения, которые могут быть полезны разработчикам.

BugBot — инструмент для автоматического ревью кода 🔍
Новый инструмент анализирует pull request'ы и находит потенциальные баги. При обнаружении проблем BugBot оставляет комментарии в GitHub с кнопкой "Fix in Cursor" для быстрого перехода к исправлению.

Упрощенная установка MCP серверов ⚡️ (наконец-то!)
• Установка MCP серверов теперь происходит в один клик
• Добавлена поддержка OAuth для аутентификации
• Доступен список официальных серверов в документации
• Разработчики могут создавать кнопки "Add to Cursor" для своих проектов

Background Agent для всех пользователей! 🤖
Фоновый агент для кодирования стал доступен всем пользователям. Запуск через иконку облака в чате или комбинацию Cmd/Ctrl+E (для пользователей без режима приватности).

Поддержка Jupyter Notebooks 📊
Agent теперь может создавать и редактировать ячейки в Jupyter Notebooks. Функция работает с моделями Sonnet и особенно полезна для исследований и data science задач.

Memories Beta — память контекста 🧠
Новая функция позволяет Cursor запоминать факты из разговоров и использовать их в будущем. Воспоминания сохраняются на уровне проекта и управляются через настройки. Похожая функция существует в Windsurf уже давно, я рад, что Cursor тоже ее реализовали.

Улучшенные ответы в чате 📈
• Поддержка диаграмм Mermaid
• Рендеринг Markdown таблиц
• Визуализация данных прямо в разговоре

Обновленный интерфейс ✨
Переработаны страницы настроек и дашборда с детальной аналитикой использования по инструментам и моделям.

Подробнее здесь

#cursor #ai #coding #development #tools

❤3👍1

362 views08:41

Заметки LLM-энтузиаста

Как отслеживать расходы на Claude Code 💰

Если вы пользователь Claude Max или Pro и задаетесь вопросом, стоит ли Claude Code своих денег — просто посмотрите на статистику расходов.

Без детального анализа сложно оценить эффективность затрат. Некоторые задачи могут обходиться в $5 за каждый запуск, что серьезно бьет по бюджету 💸

Есть два полезных инструмента для отслеживания использования Claude Code:

1️⃣ ccusage
• CLI-инструмент для анализа использования токенов Claude Code
• Помогает легко выявить ресурсозатратные задачи
• Работает с локальными JSONL файлами

2️⃣ claude-code-costs
• Предоставляет визуальную разбивку стоимости сессий Claude
• Показывает расходы в динамике по времени
• Полезен для контроля бюджета

Основные возможности:
🔹 Расчет общих затрат по всем диалогам
🔹 Ежедневная разбивка расходов за последние 30 дней
🔹 Топ-20 самых дорогих диалогов
🔹 Фильтрация по проектам
🔹 Интерактивные HTML-отчеты с графиками

Установка и использование:

npx ccusage@latest
npx claude-code-costs

Оба инструмента анализируют данные из ~/.claude/projects/ и не требуют дополнительной настройки 🛠

Определенно стоит попробовать, если регулярно используете Claude Code для работы.

@llm_notes

#claude #cost #budget #development #vibecoding

❤3🔥2👍1

418 viewsedited 09:11

Заметки LLM-энтузиаста

🚀 Cursor Agents теперь доступны в браузере и на мобильных устройствах

Разработчики Cursor расширили возможности своих AI-агентов — теперь они работают не только на десктопе, но и в веб-браузере, и на мобильных устройствах.

Что нового:

🌐 Кодинг откуда угодно — запускайте агентов из любого браузера или мобильного устройства для работы со своими задачами по написанию кода

⚙️ Фоновое выполнение задач — агенты вносят изменения в кодовую базу, создают pull request'ы и выполняют задачи без постоянного контроля (см. background agents)

🔄 Бесшовная передача на десктоп — продолжайте работу с того места, где остановились веб-агенты, прямо в Cursor IDE для проверки и доработки

🤖 Параллельное тестирование агентов — запускайте одну и ту же задачу на разных AI-моделях одновременно для сравнения результатов

Теперь можно задать задачу Cursor-агенту с телефона в кафе, а когда вернетесь к рабочему месту — просмотреть готовые изменения в редакторе. Агенты работают с реальной кодовой базой (нужно интегрировать cursor с github), что делает процесс разработки более гибким и продуктивным 📱💻

Подробности в официальном блоге Cursor тут

@llm_notes

#cursor #vibecoding #development #productivity #mobile

❤4👍4🔥4👎1

530 views14:29

Заметки LLM-энтузиаста

1:59

Media is too big

VIEW IN TELEGRAM

Claudia: долгожданный GUI для Claude Code — обзор возможностей 🖥

Никто, наверное, сейчас не будет спорить, что Claude Code от Anthropic с момента своего выхода в свет показал себя, как мощнейший AI-инструмент для разработки, но работа через командную строку подходит не всем, да и добавлять скрины интерфейса приложения в него в процессе траблшутинга не так удобно как в том же Cursor.
Claudia решает эту проблему, предоставляя графический интерфейс и дополнительные возможности.

Что такое Claudia? 🤔

Claudia — это open-source десктопное приложение, построенное на Tauri 2, которое превращает Claude Code в полноценную IDE-подобную среду. Работает на Windows, macOS и Linux.

Основные возможности 🛠

(очень советую посмотреть "крышесносную" 2х минутную демку)

Управление проектами:
• Визуальный браузер всех Claude Code проектов
• Возобновление прошлых сессий с полным контекстом
• Умный поиск по проектам и сессиям

Кастомные агенты:
• Создание специализированных AI-агентов
• Настройка системных промптов для конкретных задач
• Изолированная среда выполнения с детальными разрешениями

Аналитика и мониторинг:
📊 Dashboard с метриками использования 📈 Отслеживание расходов API в реальном времени 📋 Детальная разбивка по моделям, проектам и времени

Ключевые преимущества 💡

1️⃣ Полный контекст
В отличие от Cursor, Claude Code предоставляет доступ к полному контекстному окну модели (200K токенов), что значительно повышает качество работы.

2️⃣ Система чекпоинтов
• Создание точек сохранения в любой момент
• Визуальная временная шкала сессий
• Возможность отката изменений одним кликом
• Встроенный diff-viewer для сравнения версий

3️⃣ Удобство работы с изображениями Прямая вставка изображений в интерфейс без необходимости указывать пути к файлам.

4️⃣ MCP серверы
• Графическое управление Model Context Protocol серверами
• Импорт конфигураций из JSON
• Тестирование соединений через UI

Установка ⚙️

Требования:
• Node.js 18+
• Rust 1.70+
• Bun
• Git
• Claude Code CLI

Процесс установки:

git clone https://github.com/getAsterisk/claudia.git
cd claudia
bun install
bun run tauri build

У меня вся процедура заняла около 5 минут

Практическое применение 🎯

Примеры использования:
• Создание веб-приложений (например, клон Notion)
• Разработка мобильных прототипов
• Автоматизация рефакторинга кода
• Написание unit-тестов

Типы агентов которые можно создать:
• Web Search Agent — для поиска документации
• Security Scanner — проверка уязвимостей (просто 🔥)
• Code Quality Checker — анализ качества кода
• Bug Fixer — автоматическое исправление ошибок

Ограничения ⚠️

• Сборка только из исходного кода (пока нет готовых релизов)
• Лицензия AGPL (важно для коммерческого использования)
• Некоторые функции еще в разработке
• Claude Code недоступен на Windows (только через WSL)

Заключение 📝

Claudia превращает мощный, но сложный в использовании Claude Code в доступный инструмент с богатым функционалом. Особенно полезна Claudia будет для разработчиков, которые предпочитают графические интерфейсы командной строке.

Проект активно развивается и уже сейчас предлагает функциональность, сопоставимую с коммерческими решениями.

@llm_notes

#claudecode #vibecoding #claudia #development #opensource

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤3🔥2🦄1

555 viewsedited 20:20

Заметки LLM-энтузиаста

Claude Code получил функцию Hooks для интеграции в рабочий процесс 🔧

В Claude Code появилась новая возможность — Hooks, которая позволяет выполнять пользовательские shell-команды до или после использования инструментов. Это позволяет пользователю интегрировать в пайплайн разработки с использованием Claude Code свои собственные скрипты.

Доступные типы хуков:

1️⃣ PreToolUse — выполняется перед использованием инструмента, подходит для блокировки потенциально опасных операций

2️⃣ PostToolUse — запускается после использования инструмента, полезен для автоформатирования или логирования

3️⃣ Notification — срабатывает когда Claude требует внимания или задает вопрос

4️⃣ Stop — выполняется перед завершением ответа, подходит для очистки или генерации сводок

5️⃣ SubagentStop — запускается когда субагент Claude Code (вызов инструмента Task) завершает свою работу

Настройка и использование ⚙️

• Настройка через интерфейс /hooks (см. скриншот)
• Возможность фильтрации по названию инструмента
• Команды могут выполняться параллельно

Практические примеры:

• Notification хук для macOS со звуковым уведомлением (если его настроить на хук Stop или SubagentStop, то будет аналог того, что есть в Cursor Settings в разделе Settings -> Chat -> Completion Sound)
• Можно настроить отправку уведомлений в Slack или WhatsApp при завершении задач 📱

Безопасность 🔒

Claude контролирует безопасность вызовов — всегда запрашивает подтверждение перед внесением изменений, что предотвращает выполнение потенциально вредоносных скриптов.

Что круто: функция совместима и может работать с MCP инструментами

Подробности настройки в официальной документации

@llm_notes

#claude #hooks #vibecoding #development #automation

🔥5👍2💯2

446 views09:02

Заметки LLM-энтузиаста

1:11

This media is not supported in your browser

VIEW IN TELEGRAM

Amazon запустила Kiro — новую IDE с ИИ-агентами 🚀

ИИ-агентов для написания кода становится все больше :)
Amazon представила собственную среду разработки с искусственным интеллектом под названием Kiro.

Инструмент работает на базе Claude Sonnet 4 и нацелен на решение проблемы перехода от прототипов к готовым к продакшену приложениям.

Ключевые особенности:

• Spec-driven разработка по умолчанию
• Автоматическая генерация технических документов
• Структурированный подход к планированию задач
• Бесплатный доступ к Claude 4 в период превью (просто 🔥)

Что отличает Kiro от конкурентов: 📋

🔹 Фокус на спецификациях вместо простого написания кода
🔹 Автоматическое создание документации требований
🔹 Генерация дизайн-документов и списков задач
🔹 Интеграция лучших практик разработки ПО

Возможности системы:

1️⃣ Организация разработки вокруг требований
2️⃣ Создание структурированного рабочего процесса
3️⃣ Поддержка совместной работы команды
4️⃣ Переход от "vibe coding" к production-ready решениям

Лучшие практики использования: ⚡️

• Начинайте со спецификаций — используйте режим "Code with Spec" для планирования архитектуры
• Настройте steering документы — создайте правила и руководства для ИИ-агента
• Используйте хуки для автоматизации — настройте автоматическое обновление документации и управление ассетами
• Импортируйте конфигурацию VS Code — сохраните привычную рабочую среду
• Настройте MCP серверы — расширьте возможности через Model Context Protocol (настраивается все через json-файл, пока никакого MCP-маркетплейса я не обнаружил)
• Работайте с демо-проектом — изучите возможности на примере игры Spirit of Kiro

Kiro представляет собой форк VS Code с улучшенным интерфейсом и дополнительными возможностями. Помимо стандартных функций автодополнения, инструмент предлагает режим "Code with Spec" для планирования реализации и систему хуков для автоматизации задач.

Доступность: 💻
Сейчас Kiro находится в стадии превью и доступна бесплатно. В будущем планируется введение платных тарифов.

🔗 Скачать: https://kiro.dev/downloads/
📚 Документация: https://kiro.dev/docs/guides/learn-by-playing/

Личное мнение:
• для меня основная ценность - бесплатный Claude 4.0 и возможность бесплатно потестировать новый IDE от крупного вендора
• а для того чтобы, взаимодействуя с Claude Code напрямую можно было сильно не напрягаясь структурировать свою работу: генерировать спецификации, тесты и документацию, есть опенсорсные проекты Claude-Code-Development-Kit и SuperClaude
• в отличие от Claude Code Kiro также как и Cursor проксирует обращения к Claude 4.0, поэтому пользоваться им можно со своего ПК без включенного VPN - что удобно

@llm_notes

#kiro #amazon #vibecoding #claude4 #development

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥7⚡3❤2

905 viewsedited 11:31

Заметки LLM-энтузиаста

1:18

Media is too big

VIEW IN TELEGRAM

Replit представил Agent 3: новый уровень автономности в разработке 🚀

Компания Replit анонсировала третью версию своего AI-агента для написания программного кода.
Agent 3 получил значительные улучшения в области автономной работы и функциональности.

Ключевые особенности Agent 3:

• Увеличенное время работы ⏱️
Агент может работать автономно до 200 минут (против 20 минут в предыдущей версии). Доступен мониторинг прогресса в реальном времени через мобильное приложение.

• Автоматическое тестирование 🔧
Agent 3 самостоятельно тестирует и исправляет код, улучшая приложения в фоновом режиме. Система валидации работает в 3 раза быстрее и в 10 раз экономичнее аналогов.

• Создание других агентов 🤖
Впервые агент может создавать других агентов и автоматизации. Это позволяет автоматизировать сложные рабочие процессы с помощью естественного языка (например, теперь можно вместо manus/flowith использовать именно Replit Agent 3 для генерации периодической сводки новостей)

Практические применения:

1️⃣ Автоматизация - создание ботов для отправки ежедневных отчетов по электронной почте

2️⃣ Slack-боты - интеграция с внутренними базами данных для запросов о клиентах

3️⃣ Telegram-боты - системы записи на прием для снижения нагрузки на ресепшн

Agent 3 позиционируется как решение для написания софта без знаний программирования.
Сервис доступен с бесплатным тарифным планом.

Источники:
📄 [Официальная страница Agent 3]
🎥 [Видео-презентация]

@llm_notes

#agents #vibecoding #automation #replit #development

❤4🔥4👍3

657 views11:21

Заметки LLM-энтузиаста

🚀 Cursor 2.0: новая версия AI-редактора кода

Только вчера на первом занятии пятого потока курса по "ИИ-прототипам и вайб-кодингу" (который исторически назывался курсом по Cursor) обсуждали, чем Cursor лучше других ИИ-кодеров, и мне ничего кроме возможности работы с ним без VPN (что во время блокировок может быть настоящей killer-фичей) в голову не пришло, а уже сегодня команда Cursor выпустила крупное обновление своего AI-редактора с несколькими значимыми нововведениями.

🤖 Composer — собственная модель для кодирования
Cursor представил новую собственную модель для программирования (если помните, раньше уже была внутри Cursor модель похожего плана, она называлась Cursor, но, судя по всему, ей особо никто не пользовался, я уж точно). По заявлениям разработчиков, новая модель работает в 4 раза быстрее аналогичных решений и выполняет большинство задач менее чем за 30 секунд. Имеет смысл потестировать на реальных проектах.
Собственная модель для написания кода - логичный шаг для любого вендора коммерческих решений по Vibe Coding, иначе с развитием качественных решений такого плана от вендоров LLM (openai/anthropic/google) ценность нишевых решений будет падать.

👥 Мультиагентный интерфейс
• Новый интерфейс, ориентированный на работу с агентами
• Возможность запуска до 8 агентов параллельно
• Изоляция агентов через Git worktrees или удаленные машины
• Возможность сравнения результатов работы разных моделей

🌐 Встроенный браузер
Браузер теперь интегрирован в редактор с инструментами для выбора элементов, полными dev tools и MCP-контролами для агента.
Теперь есть паритет по данной функциональности с Windsurf, которые выпустили встроенный браузер в начале лета этого года (подробнее в заметке по ссылке)
Остается еще добавить удобный деплой, хостинг и мониторинг приложений в облаке, через интеграцию с кем-то из существующих вендоров: cloudflare (как сделали ребята из Genspark), aws/gcp (как сделано в leap.new), netlify (как сделали ребята из Windsurf), можно сделать шаблоны для railway / fly.io / и т.д. или сделать такое "облако" для деплоя самим, как поступили ребята из lovable - и тогда Cursor действительно можно будет считать самым удобным инструментом для вайб-кодинга.

📋 Улучшенный код-ревью
Все изменения агента по кодовой базе теперь отображаются в одном месте, без необходимости переключаться между файлами.

🎙 Голосовой режим
Добавлена поддержка голосового управления с встроенным преобразованием речи в текст.

⚡️ Другие улучшения:
1️⃣ Повышена производительность языковых серверов
2️⃣ Улучшена отрисовка текста
3️⃣ Добавлены deeplink для правил и команд
4️⃣ Режим планирования для фоновых агентов
5️⃣ Новые средства безопасности для корпоративных пользователей

Cursor 2.0 доступен для загрузки на официальном сайте.
Я обновился через уведомление в старой версии.

@llm_notes

Источники:
• https://cursor.com/changelog/2-0
• https://cursor.com/blog/composer

#cursor #vibecoding #development #programming

👍2🔥1

457 views05:25

About

Blog

Apps

Platform