Заметки LLM-энтузиаста
489 subscribers
131 photos
17 videos
1 file
162 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#news #windsurf #ai #dev #mcp

🎉 Коллеги, спешу поделиться крутыми новостями!

🌊 Вышел Windsurf 3!

Главная фишка релиза - поддержка MCP (Model Context Protocol), который Anthropic запустила в ноябре 2024.

Недавно писал про MCP в контексте Cursor здесь.

Настройка простая - через JSON конфиг указываете нужный MCP сервер.

Пример для git:
1) Заходим на https://github.com/modelcontextprotocol
2) Выбираем Git mcp https://github.com/modelcontextprotocol (см. скрин)
3) Выбираем uvx конфиг
"mcpServers": {
"git": {
"command": "uvx",
"args": ["mcp-server-git", "--repository", "path/to/git/repo"]
}
}


4) Добавляем этот конфиг в настройки MCP Windsurf (см. скриншот)


🚀 Какие еще обновления в Wave 3:

1) Полная поддержка новых моделей:

• DeepSeek V3
• DeepSeek R1
• O3 mini
• Gemini 2.0 Flash

2) Новые функции редактора:

• Tab to Jump: умное автодополнение
• Турбо режим для автоматизации (не спрашивает подтверждения на внесение изменений, это может быть опасно, но зато быстро :)
• Drag-and-drop изображений
• Кастомные иконки для самого windsurf

💰 Обновление тарифов:

1) Бесплатный план
• Базовый функционал
• Доступ к основной модели

2) Премиум ($10-15)
• 500 премиум-кредитов
• 1500 flow action кредитов

3) Pro ($60)
• Расширенный лимит
• Для активных пользователей

#Windsurf #Programming #AI #Development
2👍2🔥2
#news #trae #ai #dev

Trae AI: Бесплатный AI-помощник для разработчиков теперь доступен на Windows

🎉 Важная новость для разработчиков

ByteDance выпустила Windows-версию своего AI-powered редактора кода Trae.
Всего через 28 дней после релиза macOS версии, инструмент стал доступен пользователям Windows 10 и 11.
И самое главное - он абсолютно бесплатный!

Что делает Trae особенным?
Полностью бесплатный AI-ассистент:
• Встроенные GPT-4 и Claude-3.5-Sonnet без ограничений
• Никаких платных подписок (для сравнения, Cursor стоит от $20/месяц)

🔄 Два режима работы:
• Chat Mode: возможность задавать вопросы о коде и получать помощь в отладке
• Builder Mode (Beta): автоматическая генерация проектов (аналог Cursor Composer, только пока без явных точек возврата к предыдущим состояниям кода, разве что можно попросить Trae вернуться к предыдущей рабочей версии)

Ключевые функции
🧠 AI-powered разработка:
• Достаточно написать "Create a Node.js e-commerce API" - и Trae сгенерирует код, создаст файлы и даже исправит ошибки
• Поддержка мультимодального взаимодействия: загружайте скриншоты или дизайны для генерации React/Tailwind компонентов с точностью 92%

💻 Удобный интерфейс:
• Знакомый интерфейс в стиле VS Code
• Легкая миграция настроек и расширений
• Поддержка китайского/английского языка в интерфейсе и документации

Как начать работу?
1️⃣ Скачайте Trae AI для Windows: https://traeide.com/download
2️⃣ Установите приложение
3️⃣ Начните работу с AI-ассистентом бесплатно!

💡 Мой вывод: Trae предлагает впечатляющий набор функций для AI-assisted разработки совершенно бесплатно. Это отличная альтернатива платным решениям, особенно для тех, кто только начинает работать с AI-инструментами в разработке.

#разработка #AI #Windows #IDE #programming
3🔥2🎉1
#news #cline #mcp #marketplace #ai #dev

🌟 Доступные MCP-серверы для AI-кодинга

🎯 Хорошие новости для всех, кто пишет код с использованием AI.

Команда Cline (инструмент для AI-кодинга - одна из самых классных опенсорсных альтернатив Cursor) представила MCP Marketplace, что существенно упрощает работу с AI-инструментами!

📱 Если раньше настройка MCP-сервера напоминала квест с поиском нужных репозиториев, чтением документации и настройкой конфигураций, то теперь процесс стал заметно проще:

1. Открываете маркетплейс
2. Выбираете нужный сервер
3. Нажимаете установить
4. Начинаете работу

🎁 Доступные возможности:

🔍 • Поиск по веб-ресурсам
🎨 • Интеграция с инструментами дизайна
💻 • Анализ кода
🎯 • И множество других AI-функций! (список категорий инструментов действительно впечатляет, см. скриншот)

👨‍💻 Для разработчиков:
Если у вас есть свой MCP-сервер, вы можете добавить его в каталог. Нужно создать issue в репозитории mcp-marketplace и предоставить:

📌 • URL вашего GitHub
🖼 • Логотип (400x400 PNG)
📝 • Краткое описание функционала

🌟Приятно видеть, как технологии AI становятся все доступнее для обычных пользователей, а не только для технических специалистов.

⚡️Ждем ответных шагов от Cursor и Windsurf.

💡P.S. не забудьте обновить плагин Cline, чтобы воспользоваться MCP Marketplace

#AI #технологии #разработка
👍3❤‍🔥1🔥1
#news #lovable #ai #dev #chatmode

🔄 Обновления в Lovable: что нового?

🛠 Разработчики улучшили отладку сетевых ошибок. Теперь система сама читает сетевые логи и использует их для контекста при отладке. Для тех, кто часто работает с API и внешними данными – должно стать попроще. Никаких больше всплывающих окошек с ошибками, всё отслеживается на лету 🚀

💬 Chat Mode, который недавно появился в "лабораторном" функционале, тоже обновился. Общение в нем стало похоже на разговор с техническим директором, который в курсе всех деталей проекта.
Очень эффективно использовать данный режим на этапе планирования проекта.

Тот самый подход "Plan-Act" (а точнее "Plan-Plan-Act" или "семь раз отмерь - один раз отрежь"), который рекомендуют использовать и сразу реализовали в своем продукте cоздатели Cline.

⚠️ Важное примечание: из-за высокой популярности и как следствие возросших затрат сообщения в Chat Mode теперь считаются в общем лимите. 😢
Команда работает над тем, чтобы сделать эту функцию доступнее.

💡 Кстати, если кто ещё не пробовал Chat Mode в lovable: Account → Settings → Labs
На всякий случай, я проиллюстрировал все на скриншотах.

#tech #update #dev
1👍1
#news #microsoft #omnitool #omniparser #agent #opensource #automation

🤖 Microsoft представила OmniParser V2 и OmniTool

👀 Похоже, у OpenAI Operator появился еще один серьезный конкурент! Microsoft выпустила два open-source инструмента, позволяющих языковым моделям (LLM) видеть, понимать и управлять компьютером почти как человек.

🔍 Почему это может быть интересно? В отличие от закрытого OpenAI Operator, эти инструменты доступны как open-source решения, что дает больше гибкости в использовании и настройке.

📱 OmniParser V2:
• Анализирует скриншоты и преобразует UI в структурированные данные
• На 60% быстрее первой версии
• Улучшенное распознавание мелких элементов интерфейса
• Работает на CPU (с опциональной поддержкой GPU)
• Поддерживает парсинг документов и UI-компонентов

🛠 OmniTool:
• Автоматизирует компьютерные задачи
• Умеет навигировать по браузеру
• Открывает приложения
• Выполняет команды

💻 Требования для установки OmniParser V2: • Git • Python • Conda • Токен Hugging Face

🖥 Требования для OmniTool : • Windows 11 VM • Docker • 20+ ГБ свободного места • Мощный ПК

⚡️ Важно: несмотря на пока еще достаточно сложный процесс установки, OmniTool после настройки может автоматизировать практически любую компьютерную задачу (демка здесь). Это делает его мощным AI-помощником для автоматизации повторяющихся задач, анализа UI-компонентов и интеграции с другими рабочими процессами.

🎯 Где это можно применить:
• Автоматизация тестирования ПО
• Извлечение данных из разных источников
• Автоматизация рабочего стола
• Корпоративная автоматизация
• Кибербезопасность и мониторинг систем

🤔 Интересный факт: с помощью таких инструментов AI может, например, самостоятельно найти репозиторий на GitHub, скопировать ссылку для клонирования, открыть терминал и выполнить команду clone.

Полный набор роликов со сценариями использования от разработчиков здесь.

#AI #Microsoft #Automation #Tech #Development #OpenAI
👍2❤‍🔥1🔥1
#cursor #ai #dev #heyboss #bolt #replit #lovable #trae #battle

🎨🤖 Битва AI-помощников: создаем финансовый дашборд 📊

👋 Привет, друзья!

🔬 Сегодня расскажу о новом эксперименте: на прошлом занятии курса по Cursor протестировали 6 разных AI-инструментов для разработки, создавая дашборд для мониторинга личных финансов.

📝 Вводная информация:
Идея проекта: создать веб-дашборд личных финансов для визуального анализа данных из Excel-таблицы.

🎯 Начали с Cursor по методике Plan-Plan-Act:

📋 Сформировали контуры ТЗ
📑 Разработали полное ТЗ
💻 Написали код

🛠 Технические детали первой версии:
🐍 Язык: Python
🌐 Веб-интерфейс: Streamlit

🔗 Полезные ссылки:
📦 Код: https://github.com/dzhechko/pu-finance-dashboard
🚀 Приложение: https://pu-finance-dashboard-production.up.railway.app/
📊 Тестовые данные: https://disk.yandex.ru/i/LoYazgIq82XYgA

🔄 После успешного эксперимента с Cursor решили пойти дальше и протестировать другие AI-помощники.
Для более современного подхода сменили стек технологий на:
⚡️ Next.js
🎨 Tailwind CSS
🎯 shadcn/ui

📊 Тестовые данные можно брать здесь

🏆 Лидеры гонки:

1️⃣ Lovable.dev
Быстрый старт
Рабочий проект с первой попытки
⚠️ Небольшая доработка UI для графиков
➡️ Результат: y-money-mosaic (исходники тут)


2️⃣ Bolt.new
Стабильная работа "из коробки"
Отличная интеграция с Supabase
Минимум проблем
⚠️ Консервативный дизайн
➡️ Результат: Personal Finance Dashboard

3️⃣ Replit Agent
Спокойный процесс разработки
Понятный траблшутинг
⚠️ Проблемы с графиками
➡️ Результат: Replit Finance Dashboard

😐 Середнячки и аутсайдеры:

🔸 Heyboss
Проблемы с аутентификацией на этапе тестирования
Быстрая генерация функций
⚠️ Нужна доработка кода и лучше ее делать в Cursor, т.к на небольшие изменения кредиты расходуются быстро.
➡️ Результат: Heyboss Finance Dashboard

🔸 Trae
Нет рабочего кода
Неэффективный траблшутинг

💡 Основные выводы:
🥇 Lovable и Bolt - лучшие для быстрых прототипов
🏃‍♂️ Replit Agent - для спокойной разработки
📋 Для успеха очень важно иметь четкое ТЗ перед стартом
⚠️ Не все AI-инструменты одинаково полезны

#AIdev #webdev #coding #dashboard #finance #tech #programming
3👍3🔥2
🚀 Ребята, вышла новая версия Cursor 0.46! 🎉 Спешу поделиться всеми крутыми обновлениями 🔥

👨‍💻 Разработчики реально прислушались к нашим отзывам и внесли серьезные изменения:

💅 Полностью обновили интерфейс, теперь он выглядит 🔥 (cм. скриншот)
🤝 Объединили чат и редактор в один интерфейс
🤖 Сделали агента режимом по умолчанию

⚙️ Что нового в редакторе

Теперь есть три режима (переключаются через cmd+. ⌨️):
💭 Ask - можно задавать вопросы о вашем коде
✏️ Edit - вносит изменения в текущие файлы (без доступа к инструментам)
🦾 Agent - полный доступ к инструментам, MCP и интернету для внесения изменений в разные файлы

🛠 Крутые технические фишки:
🏃‍♂️ Добавили MCP yolo mode
📄 Появился mcp.json (находится в .cursor/mcp.json)
🌍 Теперь можно делать правила глобальными
🔍 Агент автоматически ищет информацию в интернете, когда это нужно

🔥 Особо крутая фича с моей точки зрения: агент теперь может сам гуглить, когда ему нужна информация! 🤓 Например, может одним махом перевести проект с Tailwind CSS 3 на версию 4! 🚀

🎯 И самое интересное - скоро появится настраиваемый режим "thinking" 🤔 (см. скрин)

⚡️ Обновляйтесь, тестируйте и делитесь впечатлениями! 💫

P.S. как видно, уже поддерживается последняя модель от Anthropic claude-3.7-sonnet-thinking !

#Cursor #IDE #разработка #обновление 🚀
6🔥21
#anthropic #news #claude

Похоже сегодня день больших анонсов 🚀

🎉 ДОЛГОЖДАННЫЕ НОВОСТИ ОТ ANTHROPIC!

🤖 Встречайте Claude 3.7 Sonnet - самую умную версию нашего любимого ИИ-помощника!

Что нового? 🤔

Теперь Claude может работать в двух режимах:

• Мгновенные ответы
• Расширенное пошаговое мышление

📈 Модель получила серьезный апгрейд:
• Улучшена работа с математикой и физикой
• Лучше следует инструкциям
• Прокачан код и многие другие задачи
• На 45% меньше необоснованных отказов выполнять запросы

🖥 БОНУС: Anthropic также представили Claude Code! Это новый инструмент для разработчиков, который позволяет делегировать задачи прямо из терминала. По результатам тестов, Claude справляется с 45-минутными задачами в один присест! 🚀

🎯 Интересный факт: при разработке команда сфокусировалась не на решении олимпиадных задач по математике и информатике, а на реальных повседневных задачах, с которыми сталкиваются пользователи.

🛡 Безопасность прежде всего: Модель прошла тщательное тестирование на безопасность, надежность и стабильность работы.

🌟 Claude 3.7 Sonnet и Claude Code - это важный шаг к созданию ИИ-систем, которые действительно могут усилить человеческие возможности.

🔗 Если хотите попробовать Claude Code, то можно присоединиться к ограниченному предварительному доступу.

💡 Подробности можно узнать в полном посте на официальном сайте Anthropic.

#ClaudeAI #AI #Tech #Innovation
🔥62
#cursor #update #error #fix

Коллеги, всем привет!

🚨 Важное обновление для пользователей Cursor!

Если после обновления до версии 0.46 у вас появляются ошибки (см. скриншот), не паникуйте! 🎯

Есть два решения проблемы:

1️⃣ Можно откатиться назад, переустановив Cursor с официального сайта cursor.com ➡️ Получите стабильную версию 0.45.15

2️⃣ Установить новую рабочую версию 0.46.5 ➡️ Скачайте установщик по прямой ссылке
Я выбрал именно этот вариант (см. скриншот)

💡 Подробное обсуждение проблемы и вариантов ее решения можно найти на форуме по ссылке

🔧 Выбирайте решение, которое вам больше подходит! Удачной работы! 💪
👍21🤝1
#openai #news

🔥 OpenAI выпустила GPT-4.5! 🚀

Привет, друзья!

Этот долгожданный момент настал: OpenAI только что представила GPT-4.5 — их самую мощную и "человечную" модель на данный момент! 🤖

Что в ней особенного:
🧠 Это ОГРОМНАЯ модель с улучшенной эффективностью (в 10 раз лучше, чем GPT-4)
💬 Общение с ней ощущается более естественным и тёплым
🎭 Высокий эмоциональный интеллект (EQ) — понимает нюансы и контекст
📚 Обширная база знаний и меньше галлюцинаций
🎨 Отлично справляется с творческими задачами

Интересно, что это НЕ модель для рассуждений (как o1 или o3-mini), а модель для интуитивного понимания мира! Сэм Альтман говорит, что это "первая модель, общение с которой действительно воспринимается как разговор со вдумчивым человеком" 😮

📱 Доступность:
• Сейчас: для пользователей ChatGPT Pro ($200/месяц)
• На следующей неделе: для ChatGPT Plus ($20/месяц)
• Через две недели: для корпоративных и образовательных пользователей

💸 Цена API просто космическая: $150 за миллион токенов на выходе (для сравнения, GPT-4 стоит $10)!
Источник здесь
В общем, использовать 4.5 в софте пока дороговато.

🔍 Примеры использования GPT-4.5 vs другие модели 📊

Возьму один самый яркий пример из официальной презентации OpenAI:

Эмоциональная поддержка: 👤: "Мне сейчас тяжело после провала на экзамене"

GPT-4.5: "Ох, мне правда жаль это слышать. Провал на экзамене может ощущаться довольно паршиво и обескураживающе, но помни — это всего лишь один момент, а не отражение того, кто ты или на что способен. Хочешь поговорить о том, что случилось, или просто нужно отвлечься? Я здесь в любом случае."

GPT-4o: "Мне очень жаль, что вы переживаете трудные времена. Вот несколько вещей, которые стоит рассмотреть: 1. Проанализируйте, что пошло не так... 2. Обратитесь за поддержкой... 3. Поговорите с преподавателем..." [длинный список советов]

Очень дружеский ответ от GPT-4.5 👏❤️ и "дельный" совет от GPT-4o 📋🤖

🔢 Бенчмарки:
• Точность на SimpleQA: GPT-4.5 (62.5%) vs GPT-4o (38.2%)
• Уровень галлюцинаций: GPT-4.5 (37.1%) vs GPT-4o (61.8%)
• Предпочтения тестировщиков: 56.8-63.2% выбрали GPT-4.5 вместо GPT-4o

🔮 Что дальше?
OpenAI говорит, что будущее за моделями, которые сочетают масштабное предварительное обучение (как у GPT-4.5) с возможностями рассуждения (как у o1). Такие модели будут иметь и "высокий IQ", и "высокий EQ" одновременно!

А вы уже попробовали GPT-4.5? Делитесь впечатлениями в комментариях! 👇

#OpenAI #GPT45 #ИскусственныйИнтеллект #ChatGPT
3🔥2🎉2
#yandexgpt #openai #claude #battle #classification

🔥 По горячим следам: YandexGPT 5 Pro против всех (GPT-4.5, Claude-3.7 и другие)

Сегодня с одним из заказчиков провели эксперимент по классификации отзывов. 🧪
Результат оказался приятным сюрпризом: YandexGPT 5 Pro (см. анонс здесь) справилась с задачей лучше, чем GPT-4o, GPT-o1, llama 3, Claude 3.7, Qwen 2.5 и даже новейшая GPT-4.5! 🤯

Ключ к успеху — правильный промпт, улучшенный с помощью Deepseek-R1.

📊 Что тестировали:

Мы проверяли, можно ли решить задачу классификации отзывов одним промптом к модели общего назначения (без использования классификаторов и их дополнительного обучения)

Модели должны были оценить 3 отзыва о ресторане по 7 категориям (еда, сервис, персонал и т.д.) с оценками от 0 до 3.

🏆 Результаты с промптом от Deepseek-R1 (см. скриншот N1):

• YandexGPT 5 Pro: всего 1 ошибка! 👑
• Claude 3.7: середина таблицы (3 ошибки)
• GPT-4.5 и GPT-o1: аутсайдеры 😬

🔄 Результаты с промптом от GPT-o1 (см. скриншот N2):

• Claude 3.7: абсолютный лидер (0 ошибок) 🥇
• GPT-4o: 2-е место (2 ошибки) 🥈
• YandexGPT 5 Pro: в тройке лидеров (3 ошибки) 🥉
• GPT-4.5: снова в аутсайдерах 📉

💡 Интересный вывод:

Похоже, мы нашли идеальную связку для работы: берем обычный "человеческий" промпт → улучшаем его через Deepseek-R1 → запускаем в YandexGPT 5 Pro!
Такой подход продемонстрировал сегодня потрясающие результаты и может стать золотым стандартом для решения сложных задач. 🚀

📝 Подробный разбор с примерами отзывов, промптами и результатами выложил здесь

Про то, где взять Deepseek R1 чтобы протестировать, писал здесь и тут

#ИИ #YandexGPT #GPT #Claude #Эксперимент #Промпты
8👏2🤡2🔥1