Заметки LLM-энтузиаста
507 subscribers
135 photos
17 videos
1 file
168 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#news #bytedance #text2video

🤖 ByteDance выкатили новую ИИ-игрушку под названием Goku

Ребята из ByteDance (те самые, что подарили миру TikTok) вместе с Гонконгским университетом представили новый ИИ для создания картинок и видео. Назвали его Goku – видимо, кто-то в команде большой фанат аниме 😅

Что умеет:
• Генерит и картинки, и видео в рамках одной системы
• Создает довольно реалистичные аватары людей
• Может превращать фотки продуктов в видеоролики
• Особенно заточен под рекламу и маркетинг (ну а как же без этого)

Говорят, обучили модель на 160 млн картинок и 36 млн видео. Звучит впечатляюще, хотя кто их знает, как считали 🤔

Самое интересное, что качество генерации действительно на уровне – модель побила какие-то там рекорды в бенчмарках. Но главное, что теперь маркетологи смогут клепать еще больше "натуральной" рекламы, где не поймешь, где настоящий человек, а где ИИ.

Вот тут крутые демки.

Практические ограничения:
Нам самим воспользоваться этой моделью на данный момент не получится.
- Модель требует значительных вычислительных ресурсов
- Полная версия кода и весов модели не опубликована
- Судя по описанию архитектуры для воспроизведения результатов потребуется серьезная инфраструктура

На данный момент можно только "погонять" предзаписанные нашими китайскими друзьями демонстрации https://huggingface.co/spaces/benjamin-paine/goku-moviegen-bench-viewer

#AI #ByteDance #технологии
👍21
#tools #rag #opensource

🤖 RAG для ленивых разработчиков

Привет, друзья! Наткнулся тут на интересную штуку для тех, кто делает AI-проекты и не хочет изобретать велосипед (полагаю, что таких среди нас много 😅).

Ребята из Upstash запилили React-компонент для быстрой сборки чат-ассистентов с RAG (это та самая штука, которая помогает AI не нести чушь и опираться на реальные данные).

Что там внутри:

- Стриминг ответов (потому что кто в 2025 не стримит, тот не хипстер 😉)
- Серверная часть из коробки
- Хранение истории чатов
- Кастомизация UI (можно сделать и минимализм, и буйство красок – на ваш вкус)

В общем, если надо быстро прикрутить умный чат к своему Next.js проекту и не париться – может пригодиться.

Исходники лежат тут

Что еще ?
- При желании работу с YandexGPT (или Llama 3.1/3.3 из Yandex Foundation Models) можно настроить через Openai Adapter
- Через Cursor Agent Composer можно переписать компонент и настроить его на работу с любым Vector Store и потом использовать как готовый модуль в других проектах.

#разработка #ai #react #nextjs
2👍1🔥1🙏1
#ai #dev #cursor #mcp

Написал небольшую заметку по MCP в Cursor.
Ориентировался на официальную документацию и свой опыт использования.

Ниже основные тезисы.

🔥 Model Context Protocol в Cursor: Превращаем AI-ассистент в "швейцарский нож" разработчика

Ключевые моменты:

▪️ MCP позволяет AI управлять внешними сервисами прямо из Cursor
▪️ Поддерживает два типа серверов: stdio и SSE
▪️ Простая настройка через Settings > Features > MCP

Что умеет: 🐳 Docker-контейнеры 📊 Базы данных 🎵 Spotify 🌐 Reddit API 📸 Скриншоты ...и многое другое

🛠 Настройка за 3 шага:

- Выбрать сервер из каталога
- Добавить через настройки
- Начать использовать в Composer
⚡️ Bonus: Режим YOLO для автоматического выполнения команд без подтверждений


#CursorAI #DevTools #Productivity
🔥42👍1🙏1
#cursor #ai #dev #v0 #heyboss #bolt #replit #lovable #tools #batle

🎨 Битва AI-помощников: Создаем генератор мемов

Привет, друзья!

Сегодня расскажу о захватывающем эксперименте, который мы провели вчера, и где сравнили 5 популярных AI-инструментов для AI-разработки, пытаясь создать веб-приложение для генерации мемов "MemeForge" 🚀

🏆 Рейтинг по результатам:

v0.dev - Чемпион по скорости! Первым выдал рабочий интерфейс с функционалом загрузки изображений и добавления текста. Правда, с AI-генерацией мемов пришлось повозиться, и помог нам в этом Cursor! 🔗 Попробовать MemeForge от v0.dev

heyboss - Серебряный призер и единственный, где AI-генерация мемов заработала "из коробки". Причем даже не потребовала добавления API-ключа! 🎉 🔗 Попробовать MemeForge от heyboss (в этом примере свой API-ключ вводить обязательно)

bolt.new - Бронзовый призер по скорости, но с ограниченным функционалом. Текст на картинках так и не заработал 😅 Уверен, что Cursor исправил бы данный недостаток, но время было ограничено (всего 2 часа на 5 вариантов решения), поэтому оставили как есть. 🔗 Попробовать MemeForge от bolt.new

replit agent - Темная лошадка! Хоть и не самый быстрый, но единственный, где удалось довести до ума все функции без дополнительных инструментов 💪 Отличная нативно-облачная альтернатива Cursor Composer Agent для небольших проектов! 🔗 Попробовать MemeForge от replit agent

lovable.dev - Интересный случай! Мой изначальный фаворит, но в этом "забеге" мне не удалось получить рабочую версию проекта. Возможно, из-за того, что вместо Openai API я вдруг решил попробовать интеграцию с runware.ai, с которой ни lovable, ни Cursor в отведенное время не справились. 🔧 🔗 Посмотреть прототип на lovable.dev (с Openai)

💡 Вывод:
Каждый инструмент показал свои сильные и слабые стороны. Для быстрого прототипа лучше всего подошел - v0.dev, быстрее всего реализовал AI функциональность - heyboss, а для полного контроля над проектом идеально подошел replit agent. Практически все инструменты кроме replit agent потребовали доработки кода в Cursor.

А какой инструмент выбрали бы вы? 🤔

#AIdev #webdev #coding #memes #технологии
2👍2🔥1
#ai #dev #lovable #tools

🚀 Крутое обновление Lovable: Визуальный редактор!

Lovable продолжает удивлять! Теперь в платформе появился визуальный редактор интерфейса, который позволяет менять элементы без использования промптов и траты кредитов 🎨

Пример использования на скрине (взял ранее написанное приложение по генерации мемов)

Что нового:

- Раньше: выбор визуального элемента + описание его изменений через промпт (что, между прочим, до сих недостижимо для многих других AI-кодеров)
- Теперь: прямое редактирование через визуальный интерфейс
- Экономия кредитов на мелких правках

Что можно редактировать:
- Цвета (включая кастомные)
- Размеры текста
- Отступы
- Скругления углов
- Прозрачность
- Стили шрифтов
- Тексты кнопок и заголовков

💡 Почему это круто:
- Мгновенные изменения без ожидания ответа AI
- Экономия кредитов
- Точное попадание в желаемый результат
- Интуитивно понятный интерфейс

Единственное, чего не хватает - это возможности перетаскивать элементы мышкой по экрану. Но уверен, что это дело времени!

P.S. а знали ли вы, что в Lovable также есть аналог .cursorrules для задания общего контекста, в котором происходит разработка приложения?

#Lovable #NoCode #WebDev #AI
🔥32👍1
#ai #dev #tools #bolt

Похоже сегодня день новостей и релизов по AI-кодерам :)

🚀 Bolt теперь создает мобильные приложения!

Bolt представил потрясающую новую функцию - генерацию нативных мобильных приложений на базе Expo (React Native). И это не просто прототипы, а полноценные приложения, которые можно опубликовать в App Store и Google Play!

📱 Что умеет:

- Создает приложения для iOS и Android одновременно
- Генерирует красивый UI с анимациями
- Интегрируется с различными API (например, OpenAI)
- Позволяет легко кастомизировать код

🛠 Как это работает:

- Описываете желаемое приложение в промпте
- Bolt генерирует код на React Native
- Скачиваете проект и запускаете через Expo
- Деплоите через EAS (Expo Application Services)

🔥 Самое крутое, что весь процесс сборки и публикации происходит в облаке - не нужно устанавливать Android Studio или Xcode!

⚡️ Пример использования: я за пару минут создал полноценный чат-бот с OpenAI интеграцией, красивым UI и всей необходимой функциональностью. Скрины приложения выложу в комментариях. В качестве отдельного упражнения можно при желании заставить этот бот работать на Yandex Foundation Models через Openai адаптер.

🤔 Правда, функция деплоя прямо из Bolt пока в разработке, но уже сейчас можно легко выгрузить код и опубликовать приложение через EAS.

Похоже, будущее, где AI помогает создавать мобильные приложения, уже наступило!
4🔥3
#cursor #ai #dev #insights #bestpractice #tracking

С недавних пор при работе над проектами в Cursor я стал использовать методику автоматического трекинга изменений в специализированных md-файлах. Очень сильно экономит время. Ниже моя заметка по теме.

📝 Как правила трекинга делают разработку эффективнее

Двойная система документации: оперативная и стратегическая

progress.md — это ваш ежедневный дневник разработки
project-status.md — стратегическая карта проекта
• Вместе они создают полную картину развития проекта

Почему это работает:

🎯 Мгновенная фиксация прогресса после каждой задачи
🔍 Детальное документирование ошибок и их решений
📊 Структурированный подход к управлению проектом
🚀 Четкое понимание следующих шагов

Ключевые преимущества:

1️⃣ Предотвращение потери важной информации
2️⃣ Быстрый доступ к решениям прошлых проблем
3️⃣ Прозрачность процесса разработки
4️⃣ Упрощение коммуникации в команде

💡 Интересный факт:

Такой подход к документации похож на методику "рабочего журнала" в научных исследованиях, где каждый шаг эксперимента тщательно документируется для воспроизводимости результатов.

🎁 Практический эффект:

• Экономия времени на поиск решений
• Снижение стресса при работе над сложными задачами
• Улучшение качества кода через анализ ошибок
• Повышение продуктивности команды


🔍 P.S. Некоторые внимательные читатели заметили, что в нескольких вариантах реализации "Генератора мемов" (см. заметку выше) я использовал данный подход и стали задавать вопросы

- "Зачем это нужно?"
- "Как это настроить?"

Что ж, надеюсь, этот пост прояснил вопрос "зачем".
А для тех, кто жаждет узнать "как" - файл .cursorrules уже ждет вас на моём GitHub!

🔗 Загляните в предыдущий пост для контекста: https://t.me/llm_notes/58
22👍1🔥1
#news #windsurf #ai #dev #mcp

🎉 Коллеги, спешу поделиться крутыми новостями!

🌊 Вышел Windsurf 3!

Главная фишка релиза - поддержка MCP (Model Context Protocol), который Anthropic запустила в ноябре 2024.

Недавно писал про MCP в контексте Cursor здесь.

Настройка простая - через JSON конфиг указываете нужный MCP сервер.

Пример для git:
1) Заходим на https://github.com/modelcontextprotocol
2) Выбираем Git mcp https://github.com/modelcontextprotocol (см. скрин)
3) Выбираем uvx конфиг
"mcpServers": {
"git": {
"command": "uvx",
"args": ["mcp-server-git", "--repository", "path/to/git/repo"]
}
}


4) Добавляем этот конфиг в настройки MCP Windsurf (см. скриншот)


🚀 Какие еще обновления в Wave 3:

1) Полная поддержка новых моделей:

• DeepSeek V3
• DeepSeek R1
• O3 mini
• Gemini 2.0 Flash

2) Новые функции редактора:

• Tab to Jump: умное автодополнение
• Турбо режим для автоматизации (не спрашивает подтверждения на внесение изменений, это может быть опасно, но зато быстро :)
• Drag-and-drop изображений
• Кастомные иконки для самого windsurf

💰 Обновление тарифов:

1) Бесплатный план
• Базовый функционал
• Доступ к основной модели

2) Премиум ($10-15)
• 500 премиум-кредитов
• 1500 flow action кредитов

3) Pro ($60)
• Расширенный лимит
• Для активных пользователей

#Windsurf #Programming #AI #Development
2👍2🔥2
#news #trae #ai #dev

Trae AI: Бесплатный AI-помощник для разработчиков теперь доступен на Windows

🎉 Важная новость для разработчиков

ByteDance выпустила Windows-версию своего AI-powered редактора кода Trae.
Всего через 28 дней после релиза macOS версии, инструмент стал доступен пользователям Windows 10 и 11.
И самое главное - он абсолютно бесплатный!

Что делает Trae особенным?
Полностью бесплатный AI-ассистент:
• Встроенные GPT-4 и Claude-3.5-Sonnet без ограничений
• Никаких платных подписок (для сравнения, Cursor стоит от $20/месяц)

🔄 Два режима работы:
• Chat Mode: возможность задавать вопросы о коде и получать помощь в отладке
• Builder Mode (Beta): автоматическая генерация проектов (аналог Cursor Composer, только пока без явных точек возврата к предыдущим состояниям кода, разве что можно попросить Trae вернуться к предыдущей рабочей версии)

Ключевые функции
🧠 AI-powered разработка:
• Достаточно написать "Create a Node.js e-commerce API" - и Trae сгенерирует код, создаст файлы и даже исправит ошибки
• Поддержка мультимодального взаимодействия: загружайте скриншоты или дизайны для генерации React/Tailwind компонентов с точностью 92%

💻 Удобный интерфейс:
• Знакомый интерфейс в стиле VS Code
• Легкая миграция настроек и расширений
• Поддержка китайского/английского языка в интерфейсе и документации

Как начать работу?
1️⃣ Скачайте Trae AI для Windows: https://traeide.com/download
2️⃣ Установите приложение
3️⃣ Начните работу с AI-ассистентом бесплатно!

💡 Мой вывод: Trae предлагает впечатляющий набор функций для AI-assisted разработки совершенно бесплатно. Это отличная альтернатива платным решениям, особенно для тех, кто только начинает работать с AI-инструментами в разработке.

#разработка #AI #Windows #IDE #programming
3🔥2🎉1
#news #cline #mcp #marketplace #ai #dev

🌟 Доступные MCP-серверы для AI-кодинга

🎯 Хорошие новости для всех, кто пишет код с использованием AI.

Команда Cline (инструмент для AI-кодинга - одна из самых классных опенсорсных альтернатив Cursor) представила MCP Marketplace, что существенно упрощает работу с AI-инструментами!

📱 Если раньше настройка MCP-сервера напоминала квест с поиском нужных репозиториев, чтением документации и настройкой конфигураций, то теперь процесс стал заметно проще:

1. Открываете маркетплейс
2. Выбираете нужный сервер
3. Нажимаете установить
4. Начинаете работу

🎁 Доступные возможности:

🔍 • Поиск по веб-ресурсам
🎨 • Интеграция с инструментами дизайна
💻 • Анализ кода
🎯 • И множество других AI-функций! (список категорий инструментов действительно впечатляет, см. скриншот)

👨‍💻 Для разработчиков:
Если у вас есть свой MCP-сервер, вы можете добавить его в каталог. Нужно создать issue в репозитории mcp-marketplace и предоставить:

📌 • URL вашего GitHub
🖼 • Логотип (400x400 PNG)
📝 • Краткое описание функционала

🌟Приятно видеть, как технологии AI становятся все доступнее для обычных пользователей, а не только для технических специалистов.

⚡️Ждем ответных шагов от Cursor и Windsurf.

💡P.S. не забудьте обновить плагин Cline, чтобы воспользоваться MCP Marketplace

#AI #технологии #разработка
👍3❤‍🔥1🔥1
#news #lovable #ai #dev #chatmode

🔄 Обновления в Lovable: что нового?

🛠 Разработчики улучшили отладку сетевых ошибок. Теперь система сама читает сетевые логи и использует их для контекста при отладке. Для тех, кто часто работает с API и внешними данными – должно стать попроще. Никаких больше всплывающих окошек с ошибками, всё отслеживается на лету 🚀

💬 Chat Mode, который недавно появился в "лабораторном" функционале, тоже обновился. Общение в нем стало похоже на разговор с техническим директором, который в курсе всех деталей проекта.
Очень эффективно использовать данный режим на этапе планирования проекта.

Тот самый подход "Plan-Act" (а точнее "Plan-Plan-Act" или "семь раз отмерь - один раз отрежь"), который рекомендуют использовать и сразу реализовали в своем продукте cоздатели Cline.

⚠️ Важное примечание: из-за высокой популярности и как следствие возросших затрат сообщения в Chat Mode теперь считаются в общем лимите. 😢
Команда работает над тем, чтобы сделать эту функцию доступнее.

💡 Кстати, если кто ещё не пробовал Chat Mode в lovable: Account → Settings → Labs
На всякий случай, я проиллюстрировал все на скриншотах.

#tech #update #dev
1👍1
#news #microsoft #omnitool #omniparser #agent #opensource #automation

🤖 Microsoft представила OmniParser V2 и OmniTool

👀 Похоже, у OpenAI Operator появился еще один серьезный конкурент! Microsoft выпустила два open-source инструмента, позволяющих языковым моделям (LLM) видеть, понимать и управлять компьютером почти как человек.

🔍 Почему это может быть интересно? В отличие от закрытого OpenAI Operator, эти инструменты доступны как open-source решения, что дает больше гибкости в использовании и настройке.

📱 OmniParser V2:
• Анализирует скриншоты и преобразует UI в структурированные данные
• На 60% быстрее первой версии
• Улучшенное распознавание мелких элементов интерфейса
• Работает на CPU (с опциональной поддержкой GPU)
• Поддерживает парсинг документов и UI-компонентов

🛠 OmniTool:
• Автоматизирует компьютерные задачи
• Умеет навигировать по браузеру
• Открывает приложения
• Выполняет команды

💻 Требования для установки OmniParser V2: • Git • Python • Conda • Токен Hugging Face

🖥 Требования для OmniTool : • Windows 11 VM • Docker • 20+ ГБ свободного места • Мощный ПК

⚡️ Важно: несмотря на пока еще достаточно сложный процесс установки, OmniTool после настройки может автоматизировать практически любую компьютерную задачу (демка здесь). Это делает его мощным AI-помощником для автоматизации повторяющихся задач, анализа UI-компонентов и интеграции с другими рабочими процессами.

🎯 Где это можно применить:
• Автоматизация тестирования ПО
• Извлечение данных из разных источников
• Автоматизация рабочего стола
• Корпоративная автоматизация
• Кибербезопасность и мониторинг систем

🤔 Интересный факт: с помощью таких инструментов AI может, например, самостоятельно найти репозиторий на GitHub, скопировать ссылку для клонирования, открыть терминал и выполнить команду clone.

Полный набор роликов со сценариями использования от разработчиков здесь.

#AI #Microsoft #Automation #Tech #Development #OpenAI
👍2❤‍🔥1🔥1
#cursor #ai #dev #heyboss #bolt #replit #lovable #trae #battle

🎨🤖 Битва AI-помощников: создаем финансовый дашборд 📊

👋 Привет, друзья!

🔬 Сегодня расскажу о новом эксперименте: на прошлом занятии курса по Cursor протестировали 6 разных AI-инструментов для разработки, создавая дашборд для мониторинга личных финансов.

📝 Вводная информация:
Идея проекта: создать веб-дашборд личных финансов для визуального анализа данных из Excel-таблицы.

🎯 Начали с Cursor по методике Plan-Plan-Act:

📋 Сформировали контуры ТЗ
📑 Разработали полное ТЗ
💻 Написали код

🛠 Технические детали первой версии:
🐍 Язык: Python
🌐 Веб-интерфейс: Streamlit

🔗 Полезные ссылки:
📦 Код: https://github.com/dzhechko/pu-finance-dashboard
🚀 Приложение: https://pu-finance-dashboard-production.up.railway.app/
📊 Тестовые данные: https://disk.yandex.ru/i/LoYazgIq82XYgA

🔄 После успешного эксперимента с Cursor решили пойти дальше и протестировать другие AI-помощники.
Для более современного подхода сменили стек технологий на:
⚡️ Next.js
🎨 Tailwind CSS
🎯 shadcn/ui

📊 Тестовые данные можно брать здесь

🏆 Лидеры гонки:

1️⃣ Lovable.dev
Быстрый старт
Рабочий проект с первой попытки
⚠️ Небольшая доработка UI для графиков
➡️ Результат: y-money-mosaic (исходники тут)


2️⃣ Bolt.new
Стабильная работа "из коробки"
Отличная интеграция с Supabase
Минимум проблем
⚠️ Консервативный дизайн
➡️ Результат: Personal Finance Dashboard

3️⃣ Replit Agent
Спокойный процесс разработки
Понятный траблшутинг
⚠️ Проблемы с графиками
➡️ Результат: Replit Finance Dashboard

😐 Середнячки и аутсайдеры:

🔸 Heyboss
Проблемы с аутентификацией на этапе тестирования
Быстрая генерация функций
⚠️ Нужна доработка кода и лучше ее делать в Cursor, т.к на небольшие изменения кредиты расходуются быстро.
➡️ Результат: Heyboss Finance Dashboard

🔸 Trae
Нет рабочего кода
Неэффективный траблшутинг

💡 Основные выводы:
🥇 Lovable и Bolt - лучшие для быстрых прототипов
🏃‍♂️ Replit Agent - для спокойной разработки
📋 Для успеха очень важно иметь четкое ТЗ перед стартом
⚠️ Не все AI-инструменты одинаково полезны

#AIdev #webdev #coding #dashboard #finance #tech #programming
3👍3🔥2
🚀 Ребята, вышла новая версия Cursor 0.46! 🎉 Спешу поделиться всеми крутыми обновлениями 🔥

👨‍💻 Разработчики реально прислушались к нашим отзывам и внесли серьезные изменения:

💅 Полностью обновили интерфейс, теперь он выглядит 🔥 (cм. скриншот)
🤝 Объединили чат и редактор в один интерфейс
🤖 Сделали агента режимом по умолчанию

⚙️ Что нового в редакторе

Теперь есть три режима (переключаются через cmd+. ⌨️):
💭 Ask - можно задавать вопросы о вашем коде
✏️ Edit - вносит изменения в текущие файлы (без доступа к инструментам)
🦾 Agent - полный доступ к инструментам, MCP и интернету для внесения изменений в разные файлы

🛠 Крутые технические фишки:
🏃‍♂️ Добавили MCP yolo mode
📄 Появился mcp.json (находится в .cursor/mcp.json)
🌍 Теперь можно делать правила глобальными
🔍 Агент автоматически ищет информацию в интернете, когда это нужно

🔥 Особо крутая фича с моей точки зрения: агент теперь может сам гуглить, когда ему нужна информация! 🤓 Например, может одним махом перевести проект с Tailwind CSS 3 на версию 4! 🚀

🎯 И самое интересное - скоро появится настраиваемый режим "thinking" 🤔 (см. скрин)

⚡️ Обновляйтесь, тестируйте и делитесь впечатлениями! 💫

P.S. как видно, уже поддерживается последняя модель от Anthropic claude-3.7-sonnet-thinking !

#Cursor #IDE #разработка #обновление 🚀
6🔥21