Заметки LLM-энтузиаста
393 subscribers
125 photos
14 videos
1 file
150 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и LLM-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#ai #dev #news #vibecoding #lovable

Lovable 2.0: Новые возможности платформы 🚀

Команда Lovable представила значительное обновление своей платформы, которая позволяет создавать приложения и веб-сайты в режиме Vibe Coding. Версия 2.0 добавляет множество полезных функций, делающих процесс разработки более эффективным и удобным.

Ключевые обновления в Lovable 2.0 👀

1. Обновленный дизайн и интерфейс 💅 Как пишут разработчики: платформа получила современный визуальный стиль и более интуитивный интерфейс, который помогает сосредоточиться на творческом процессе.
Я не дизайнер и мне, если честно, предыдущая версия тоже нравилась, но и новая хороша :)

2. Командная работа 👨‍💻👩‍💻 Введены рабочие пространства для совместной работы:

• Pro-подписка: возможность приглашать до 2 человек в отдельные проекты
• Teams-подписка: до 20 пользователей в одном рабочем пространстве с разными уровнями доступа
• Общий пул кредитов для всех участников рабочего пространства

3. Улучшенный ИИ-ассистент 🧠 Новый режим чата стал значительно умнее и не вносит изменения в код напрямую. Он помогает:

• Отвечать на вопросы по проекту
• Планировать разработку
• Находить и исправлять ошибки

Ассистент самостоятельно определяет, когда нужно искать информацию в файлах, проверять логи или обращаться к базе данных.
Я думаю, что в сочетании со способностью делать непрерывный рефакторинг кода (lovable всегда предлагает его сделать когда размер какого-то файла с кодом начинает превышать 250 строчек, что и раньше позволяло доводить до успеха сложные проекты, такой фичи явно не хватает другому веб-кодеру bolt.new) это значительно улучшит и ускорит сходимость Vibe Coding процессов.

4. Проверка безопасности 🛡 Функция Security Scan автоматически выявляет уязвимости в приложении. Что с моей точки зрения очень актуально! И я пока еще не видел такого в других AI-кодерах. На данный момент работает с проектами, использующими Supabase. В будущем планируется расширение возможностей.

5. Режим разработчика (Dev Mode) ⌨️ Позволяет редактировать код проекта напрямую в Lovable — функция, которая уже получила положительные отзывы от пользователей.

6. Визуальное редактирование 🎨 Возможность визуально редактировать стили без необходимости писать CSS-код вручную. Функция стала еще более надежной и удобной.

7. Интеграция доменов 🌐 Покупка и подключение доменов теперь доступны непосредственно в Lovable. С момента внедрения этой функции подключено более 10 000 пользовательских доменов.

Обновление ценовой политики 💰

Компания упростила тарифные планы:

• Pro-план: начиная от $25 в месяц — для индивидуальных разработчиков
• Teams-план: от $30 в месяц — для команд, нуждающихся в общем рабочем пространстве

Планы на будущее 🔮

Команда Lovable отмечает, что это только начало нового этапа развития платформы. В ближайшие месяцы планируется сделать продукт еще более функциональным, безопасным и удобным в использовании.

Для тех, кто интересуется подробностями, команда Lovable проводит прямую трансляцию с ответами на вопросы. Основатель компании Антон и его команда будут рассказывать о новых возможностях и делиться планами на будущее.

#разработка_приложений #искусственный_интеллект #Lovable #новые_технологии
Replit: Безопасное "вайб-кодирование" теперь доступно всем

Команда Replit представила новые функции, делающие написание софта с помощью ИИ не только доступным, но и безопасным. 🚀

Что нового они представили? 🛡


1️⃣ Replit Auth по умолчанию
• Встроенная система аутентификации теперь включена автоматически
• Использует Firebase, reCAPTCHA и другие инструменты защиты
• Больше не нужно интегрировать сторонние сервисы или писать свою систему

2️⃣ Улучшенная история приложений
• Новый интерфейс для просмотра всех версий вашего приложения
• Возможность откатиться к любой предыдущей версии
• Предварительный просмотр старых версий перед откатом
• Возможность вернуть даже состояние базы данных

3️⃣ Сканирование безопасности
• Автоматический поиск уязвимостей в коде перед деплоем
• Интеграция с Semgrep для глубокого анализа (подробности здесь)
• Возможность автоматического исправления найденных проблем

4️⃣ Защита от случайных ошибок
• ИИ теперь физически не может удалить важные файлы проекта
• Автоматическое обнаружение API-ключей в промптах
• Перенаправление секретных данных в безопасное хранилище

Для корпоративных пользователей 🏢

Для тех, кто использует Replit в компаниях, добавили:
• Защищенные URL для разработки
• Роль "зрителя" для сотрудников (50 мест бесплатно)
• Поддержка SCIM для управления доступом
• Расширенные настройки приватности для администраторов

В ближайшие недели обещают разделение баз данных на dev/prod, чтобы разработка не влияла на рабочую версию приложения - очень круто, когда я делал витрину для AI-проектов, меня удивило, что базы общие.

Эти обновления значительно повышают уровень безопасности и удобства при создании приложений с помощью ИИ на платформе Replit.

#replit #dev #ai #security #vibecoding
Как устроен Cursor: технические детали от создателей 🔧

Вчера прочитал очень интересное интервью с основателем Cursor. Интервью содержит множество деталей внутреннего устройства самого популярного AI-кодера, и с моей точки зрения будет интересно практически каждому.

Ниже мой краткий конспект.

Полная оригинальная версия здесь.
Перевод на русский язык: часть 1 | часть 2

Cursor — AI-редактор кода, который за год вырос в 100 раз по нагрузке и обрабатывает более 1 млн запросов в секунду. Сооснователь Суалех Асиф рассказал об используемых технических решениях.

Цифры проекта 📊

• 50 инженеров в команде
• 1M+ транзакций в секунду в пике
• 100x рост пользователей за 12 месяцев
• $500M+ годовая выручка
• Миллиард строк кода пишется ежедневно

Технический стек 💻

Клиент:
• TypeScript — основная логика
• Electron — форк VS Code
• Rust — производительные компоненты

Бэкенд:
• TypeScript + Rust
• Монолитная архитектура
• Node API для связи с Rust

Базы данных:
• Turbopuffer — хранение зашифрованных файлов
• Pinecone — векторная БД для документации

Инфраструктура:
• AWS + Azure для вычислений
• Десятки тысяч NVIDIA H100 GPU
• Terraform для управления инфраструктурой

Как работает автодополнение ⚡️

1️⃣ Клиент собирает контекст кода локально 2️⃣ Код шифруется и отправляется на сервер 3️⃣ Сервер расшифровывает и генерирует предложение 4️⃣ Предложение возвращается в IDE 5️⃣ Пользователь принимает через Tab

Ключевая задача — минимизировать задержки при максимальном качестве предложений.

Чат без хранения кода 🔒

Cursor не хранит исходный код на серверах, используя умную систему индексации:

Создание индексов:
• Код разбивается на чанки
• Создаются эмбеддинги без сохранения имен файлов
• Используются обфусцированные названия

Поиск по коду:
• Векторный поиск по эмбеддингам
• Запрос нужных файлов с клиента
• Анализ и ответ на основе контекста

Синхронизация через Merkle Trees:
• Каждые 3 минуты сравнение деревьев клиент-сервер
• Переиндексация только измененных файлов
• Эффективное использование ресурсов

Anyrun: оркестратор агентов 🤖

Написанный на Rust сервис для запуска AI-агентов в облаке:

• AWS EC2 — для корпоративных клиентов
• AWS Firecracker — микро-ВМ с запуском за 125мс
• Изоляция процессов — безопасность на уровне ВМ
• Снапшоты — сохранение состояния для быстрого восстановления

Инженерные вызовы 🚧

Проблемы масштабирования:
• Рост использования в 100 раз за год
• Миллиарды эмбеддингов ежедневно
• Один из крупнейших клиентов OpenAI

Проблема холодного старта:
• При падении всех нодов перезапуск критичен
• Нужно контролировать трафик при восстановлении
• Приоритизация пользователей во время инцидентов

Шардинг и его сложности:
• Ручное разделение индексов в Pinecone
• Недоиспользование ресурсов (30% простоя)
• Сложные миграции между шардами

Миграции баз данных 🔄

От Yugabyte к PostgreSQL:
• Yugabyte не справлялся с нагрузкой
• Долгие транзакции в распределенной системе
• PostgreSQL на AWS RDS решил проблемы

От PostgreSQL к Turbopuffer:
• 22TB данных в RDS достигли лимитов
• Особенности VACUUM в PostgreSQL
• Экстренная миграция за 10 часов во время инцидента

Культура разработки 👥

Релизы:
• Каждые 2-4 недели (десктопное приложение)
• Консервативные feature flags
• Тщательное тестирование перед выпуском

Команда:
• 15 инженеров в инфраструктурной команде
• Культура экспериментов
• Использование собственного продукта

Будущие вызовы:
• Масштабирование reinforcement learning
• Тысячи GPU для обучения
• Сложная архитектура с множеством компонентов

Выводы 💡

• Небольшие команды могут превосходить гигантов при правильном подходе
• Облачные провайдеры критичны для быстрого масштабирования
• Надо быть очень осторожными с использованием стартап-продуктов в инфраструктуре - лучше доверять гиперскейлерам
• Создание продукта для собственной аудитории упрощает разработку

Cursor своим примером показывает, как 50 инженеров могут конкурировать с Microsoft и GitHub, фокусируясь на потребностях разработчиков.

@llm_notes

#cursor #vibecoding #tech_architecture #startup_scaling
Windsurf Wave 10: новый режим планирования и встроенный браузер 🌊

Windsurf выпустил обновление Wave 10 с двумя ключевыми функциями: встроенным браузером и режимом планирования. Рассмотрим кратко, что это значит для разработчиков.

Windsurf Browser 🌐

Встроенный браузер на базе Chromium интегрирован прямо в IDE. Основные возможности:

• ИИ-ассистент Cascade видит содержимое открытых вкладок
• Автоматическое использование контента веб-страниц без копирования (по сути аналог Stagewise для Cursor)
• Отладка фронтенда и просмотр логов в одном окне (аналог browser-tools-mcp, только встроенный в AI-кодер)
• Работа с документацией API без переключения между приложениями

Planning Mode 📋
Новый подход к долгосрочному планированию проектов:

1️⃣ Создает markdown-файл с целями и задачами 2️⃣ Синхронизируется между пользователем и ИИ 3️⃣ Обновляется автоматически при изменении контекста 4️⃣ Использует более мощную модель для долгосрочного планирования 5️⃣ Сохраняется локально и доступен для редактирования

Технические детали ⚙️

• Planning Mode доступен на всех платных тарифах
• Браузер находится в бета-версии
• Модель O3 стала дешевле в использовании
• Планируется добавление автоматизации веб-задач (по сути встроенный browser-use)

Обновление направлено на решение проблемы разрыва между краткосрочными действиями и долгосрочными целями в разработке. Браузер закрывает пробел в понимании ИИ контекста веб-активности разработчика.

2025 год превращается в настоящее поле битвы AI-браузеров. После Opera, Dia, Perplexity и Genspark теперь и Windsurf решил не отставать от трендов 📈

Ждем ответных шагов от команды Cursor!
Встроенный планировщик без необходимости настройки дополнительных кастомных агентных ролей, Memory Bank или Task Master теперь есть практически у всех популярных AI-кодеров: Windsurf, Claude Code.

@llm_notes

#windsurf #vibecoding #browser #planning #tools
Как отслеживать расходы на Claude Code 💰

Если вы пользователь Claude Max или Pro и задаетесь вопросом, стоит ли Claude Code своих денег — просто посмотрите на статистику расходов.

Без детального анализа сложно оценить эффективность затрат. Некоторые задачи могут обходиться в $5 за каждый запуск, что серьезно бьет по бюджету 💸

Есть два полезных инструмента для отслеживания использования Claude Code:

1️⃣ ccusage
• CLI-инструмент для анализа использования токенов Claude Code
• Помогает легко выявить ресурсозатратные задачи
• Работает с локальными JSONL файлами

2️⃣ claude-code-costs
• Предоставляет визуальную разбивку стоимости сессий Claude
• Показывает расходы в динамике по времени
• Полезен для контроля бюджета

Основные возможности:
🔹 Расчет общих затрат по всем диалогам
🔹 Ежедневная разбивка расходов за последние 30 дней
🔹 Топ-20 самых дорогих диалогов
🔹 Фильтрация по проектам
🔹 Интерактивные HTML-отчеты с графиками

Установка и использование:
npx ccusage@latest
npx claude-code-costs


Оба инструмента анализируют данные из ~/.claude/projects/ и не требуют дополнительной настройки 🛠

Определенно стоит попробовать, если регулярно используете Claude Code для работы.

@llm_notes

#claude #cost #budget #development #vibecoding