Заметки LLM-энтузиаста
518 subscribers
144 photos
17 videos
1 file
175 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
🚀 RAG на практике: создаем ИИ-помощников с нуля

На прошлой неделе я проводил занятие по RAG (Retrieval Augmented Generation) на курсе "Менеджер ИИ-продуктов" в Product University.
Специально к занятию собрал небольшой интерактивный курс по RAG, которым хотел бы поделиться с вами 👉 ссылка

К нему также "прикручен" ИИ-ассистент, который может проконсультировать по вопросам построения предметно-ориентированных вопросно-ответных систем (так по-умному называются ИИ-помощники :)

Что делали на практике:
• ИИ-помощники через OpenAI Assistant API
• ИИ-помощник на базе Yandex AI Assistant
• Flowse AI Assistant с векторной БД Pinecone
• Agent Flow Canvas

ИИ-помощник "прикручивался" к клону странички курса по AI-программированию (оригинал здесь) и тестировался вопросами по содержанию курса.

🔥 Приятное открытие: уже созданный OpenAI Assistant API можно просто загрузить во Flowise через OpenAI креды, затем выложить на Chatflow Canvas и опубликовать с крутыми опциями:

▫️ Rate Limit для безопасного инференса
▫️ Контроль адресатов подключения
▫️ Сбор и мониторинг обратной связи
▫️ Генерация лидов

💡 Преимущество Flowise: сразу получаешь рабочий код для виджета, который можно разместить на своем сайте. Именно им я и воспользовался, когда "прикручивал" ИИ-помощника к посадочной странице курса по RAG.

Тестирование AI-кодеров:
1️⃣ Lovable - справился с клонированием сайта по URL, но виджет от Flowise самостоятельно и без ошибок добавить не смог 😅 Пришлось вручную править код.
2️⃣ Bolt.new - выполнил задачу с первого раза! 💪 В bolt, кстати, появился режим "Discussion", который можно использовать для планирования изменений и создания "Implementation Plan", также добавилась встроенная библиотека промптов, в общем, инструмент меня неожиданно порадовал 😄

Именно на bolt.new я собрал финальную версию интерактивного курса по RAG.
К слову, lovable и здесь лажанулся: как я его ни уговаривал, он так и не смог сделать кликабельными ссылки на модули курса, пришлось даже пригрозить, что если он не решит задачу с очередной (пятой по счету) попытки, то я больше не буду им пользоваться - но все равно не помогло 😄

🏆 Yandex AI Assistant показал себя отлично - единственный понял, что в задаваемых вопросах слово "поток" означает "поток курса", остальные ассистенты упрямо писали, что вопрос не относится к курсам 😄

Полезный лайфхак: Flowise теперь можно развернуть из Yandex Cloud Marketplace и использовать YandexGPT через официальный OpenAI-совместимый API ! Так можно получить полностью локализованную в РФ версию ИИ-помощника, данные которого хранятся в инфраструктуре, которая выполняет требования ФЗ-152.

⚠️ Когда будете разворачивать flowise в Яндекс Облаке, то имейте ввиду, что дефолтная группа безопасности не открывает доступ по порту TCP 3000, поэтому применяйте кастомную группу с настройками permit any any, иначе не сможете подключиться по веб-интерфейсу к flowise.

@llm_notes

#rag #aiassistants #flowise #yandexgpt #lovable #bolt #openai
🔥54
Media is too big
VIEW IN TELEGRAM
Qwen3-Code: новый конкурент Claude Code 🚀

Alibaba выпустила Qwen3-Code — модель для программирования с 480 миллиардами параметров (35 млрд активных). Модель поддерживает контекст до 256K токенов нативно и до 1M через экстраполяцию.

Ключевые особенности:
• Mixture of Experts архитектура
• Обучена на 7.5 триллионах токенов (70% код)
• Поддержка агентных задач: кодирование, браузер, инструменты
• Производительность сравнима с Claude Sonnet 4

Инструменты разработки: 🛠

1️⃣ Qwen Code — CLI инструмент (форк Gemini Code)
2️⃣ Интеграция с Claude Code — через API совместимость (подробности в блоге по ссылке)
3️⃣ Поддержка в Cline

Результаты тестирования:
SWE-Bench Verified: выше Kimi K2 (которая при в 4-5 раз меньшей стоимости показывает результаты всего лишь немного хуже, чем Claude Sonnet 4), ниже Sonnet 4
• Хорошо справляется с задачами, где требуется использование внешних инструментов (tools)
• Более лаконичные ответы по сравнению с Kimi

Доступность и цены: 💰

Бесплатно: chat.qwen.ai
Дешево: Hyperbolic ($2), Parasail ($2-$3.5) - через openrouter.ai
Дорого: официальный API ($6-60 за 1M токенов) и из РФ не так то просто завести учетку на alibabacloud (нужна не только карточка иностранного банка, но и иностранный мобильный номер при регистрации)

Ограничения:
• Пока доступна только большая модель (480B)
• Контекст 256K (больше, чем у Claude)
• Спорные результаты бенчмарков от разработчиков

Установка Qwen Code:

npm i -g @qwen-code/qwen-code


Модель показывает хорошие результаты в задачах AI-программирования, но требует осторожности при выборе провайдера API из-за разброса цен 📊
Теперь в случае когда Claude Sonnet сбоит (как это было на прошлой неделе), у нас есть неплохая замена: Qwen3-code и Kimi-2 (оба варианта можно использовать в Claude Code)

@llm_notes

#qwen #vibecoding #llm #programming #opensource
1👍6
Заметки LLM-энтузиаста
#info #ai #tools Друзья, всем привет! Есть возможность очень сильно сэкономить на AI-инструментах, воспользовавшись вот этим офером https://www.lennysnewsletter.com/p/an-unbelievable-offer-now-get-one $200 за годовую подписку на 10 классных AI-инструментов…
🔥 Скидка на AI-инструменты возвращается!

Коллеги, всем привет! 👋

Для тех кто в апреле пропустил скидку на подписку на AI-инструменты есть возможность воспользоваться ей сейчас (https://www.lennysnewsletter.com/p/productpass)

💰 $200 или $350 за годовую подписку на 16 классных AI-инструментов (как правило, годовая подписка на 1-2 инструмента из списка стоит либо столько же, либо дороже)

Из апрельского списка "ушли" такие инструменты как v0, Cursor, Granola и Notion, но зато добавились такие интересные инструменты как:

🔧 n8n (https://n8n.io/) - самый популярный no-code инструмент для автоматизации процессов (я немного писал про работу с ним здесь и тут)

⚡️ Warp (https://www.warp.dev/) - кросс-платформенная агентная среда разработки, написанная на Rust (аналог Claude Code или Gemini CLI, но со своим UI)

🎨 Magic Patterns (https://www.magicpatterns.com/) - AI-инструмент для быстрого создания UI-прототипов, поддерживает командную работу и позиционируется для продуктовых команд

📋 ChatPRD (https://www.chatprd.ai/) - AI-инструмент для продукт-менеджеров, помогает создавать качественные PRDs (Product Requirement Document). Замечу, что для AI-программирования с моей точки зрения больше подойдет https://www.codeguide.dev/

🎬 Descript (https://www.descript.com/) - комплексная платформа для создания и редактирования видео и подкастов, которая использует AI для упрощения процесса создания контента

📊 Gamma (https://gamma.app/) - AI-инструмент для быстрого создания презентаций, документов и визуального контента

📱 Mobbin (https://mobbin.com/) - крупнейшая онлайн-библиотека UI/UX-паттернов и справочных материалов для дизайнеров и продуктовых команд. Бесплатные аналоги: https://dribbble.com/ и https://21st.dev/home (писал про него здесь)

🎤 Wispr Flow (https://wisprflow.ai/) - классный инструмент для транскрибации голоса в текст для мака, сам регулярно им пользуюсь при работе с AI-кодерами. У него есть бесплатный тир, которого при умеренном использовании может хватить

🔍 Raycast (https://www.raycast.ai/) - как я понял, это такой ИИ-помощник для мака: умный поиск, администрирование (можно дать ему доступ к календарю и файлам/папкам) и тому подобные вещи, похоже на AI-OS плагин. Скачивается только через VPN.

⚠️ Условия такие же: надо быть новым клиентом по выбранному продукту и не мешкать с активацией ключей. Если, конечно, не возьмете insider подписку за $350 - по ней пишут, что доступ к подпискам гарантированный.

Для тех кто уже как я оформлял подписку офер также действует - можно им воспользоваться на новые продукты из списка, но в связи со всплеском трафика соответствующая страничка (https://lennysproductpass.com/) недоступна

Главное через год не забыть отключить подписку, чтобы не получить продление по полной стоимости.

@llm_notes

#ai #tools #discount #productivity #automation #nocode
3👍2
Cursor CLI: новый терминальный AI-кодер с бесплатным GPT-5 🚀

Cursor выпустил CLI-версию своего AI-редактора кода, которая пока находится в бета-тестировании. Главная особенность — бесплатный доступ к GPT-5 даже без премиум-подписки.

Что умеет Cursor CLI 💻

• Редактирование кода прямо в терминале
• Управление процессом в реальном времени
• Настройка правил работы через AGENTS.md и MCP
• Интеграция с популярными IDE (JetBrains, VSCode, Android Studio)
• Поддержка трех моделей: GPT-5, Claude 4 Sonnet, Claude 4.1 Opus

Установка ⚙️

curl https://cursor.com/install -fsS | bash

Доступные команды 📝

1️⃣ /model ls — список всех моделей 2️⃣ /auto-run — автоматическое выполнение команд 3️⃣ /new-chat — новый чат 4️⃣ /clear — очистка сессии 5️⃣ /vim — включение Vim-биндингов

Результаты тестирования 📊

Сильные стороны:
• Справляется с длинными задачами
• Проверяет код на ошибки линтера
• Автоматически коммитит изменения
Бесплатный доступ к GPT-5. Что с точки зрения красивого фронтенда, с моей точки зрения дает преимущество - см. скриншоты: сверху (темного цвета) - игра "Сапер" в исполнении gpt-5 через cursor cli, снизу (светлого цвета) - та же игра в исполнении claude sonnet 4.0 через claude code

Слабые стороны:
• Медленная работа (особенно GPT-5)
• Нет hooks, sub-агентов и кастомных команд (что есть в Claude Code)

Вывод 🎯

Cursor CLI — неплохое решение для терминального кодирования, особенно учитывая бесплатный доступ к GPT-5. Пока что уступает Claude Code по функциональности, но для бета-версии показывает хорошие результаты.

Если вы тоже проводили тесты - обязательно поделитесь результатами! 🔥 Давайте обсудим в комментариях 💬🤝

@llm_notes

#cursor #cli #gpt5 #vibecoding #terminal
👍21
AI Fluency: Полное руководство по эффективной работе с ИИ 🤖

Примерно месяц назад Anthropic опубликовали с моей точки зрения интересный курс "AI Fluency: Framework & Foundations" по развитию навыков взаимодействия с искусственным интеллектом. Практические знания без воды. И главное - эти знания не устареют через неделю, месяц или год при появлении очередной LLM-модели, агентного фреймворка или нового ИИ-продукта.
Курс также оформлен в виде плейлиста на официальном youtube-канале Anthropic.

Ниже привожу мои краткие заметки по курсу.

Я также подготовил детальные транскрипты на русском языке для каждого урока (см. github) и представил все в виде интерактивного веб-сайта, пользуясь тем, что gpt5 сейчас в lovable.dev находится в limited preview до полуночи воскресенья 10 августа 😉 (к слову, мне очень понравилось "собирать" сайт при помощи gpt5 на lovable, отталкиваясь от транскриптов, выложенных на github - только 1 небольшая ошибка возникла в процессе)

Что такое AI Fluency? 🎯

AI Fluency — способность работать с ИИ эффективно, результативно, этично и безопасно. Это не знание промптов, а фундаментальные навыки для долгосрочного сотрудничества с ИИ.

Три способа взаимодействия с ИИ:

• Автоматизация — ИИ выполняет конкретные задачи по инструкциям
• Дополнение — совместная работа как с партнером
• Агентность — ИИ действует самостоятельно по заданным принципам

Фреймворк 4D 📊 (ДОКО - русскоязычная аббревиатура, которая у меня получилась)

🔹 Delegation - Делегирование
Решение о распределении задач между человеком и ИИ. Включает понимание проблемы, знание возможностей ИИ и стратегическое планирование работы.

🔹 Description - Описание
Четкое общение с ИИ через:
• Описание продукта — что создать
• Описание процесса — как подходить к задаче
• Описание производительности — стиль взаимодействия

🔹 Discernment - Контроль (мой вольный перевод по смыслу)
Критическая оценка результатов ИИ:
• Качество контента
• Логика процесса
• Эффективность взаимодействия

🔹 Diligence - Ответственность (мой вольный перевод по смыслу)
Ответственное использование:
• Выбор подходящих систем
• Прозрачность о роли ИИ
• Подотчетность за результаты

Генеративный ИИ: основы ⚙️

Большие языковые модели создают новый контент на основе статистических паттернов из обучающих данных. Три прорыва сделали это возможным:

1️⃣ Трансформерная архитектура (2017) 2️⃣ Массивы цифровых данных
3️⃣ Мощные вычислительные ресурсы

Возможности и ограничения ⚖️

Сильные стороны:
• Универсальность в языковых задачах
• Поддержание контекста разговора
• Подключение к внешним инструментам

Ограничения:
• Дата среза знаний
• Возможные "галлюцинации"
• Ограниченное контекстное окно
• Непредсказуемость результатов

Эффективные техники промптинга 💡

6 основных принципов:

1️⃣ Контекст — объясните что, зачем и кто вы 2️⃣ Примеры — покажите желаемый результат 3️⃣ Ограничения — укажите формат и требования 4️⃣ Декомпозиция — разбейте сложные задачи 5️⃣ Время на размышления — дайте ИИ обдумать 6️⃣ Роль — определите, кем должен быть ИИ

Секрет: Просите ИИ помочь улучшить ваши промпты! 🔥

Практические выводы 📝

• Ваша экспертиза — основа эффективного использования ИИ
• Четкая постановка задачи критична для получения качественных результатов
• Всегда проверяйте и оценивайте выводы ИИ
• Берите ответственность за итоговые результаты
• Будьте прозрачны и сообщайте об использовании ИИ

И как обычно - эти навыки развиваются только через практику.
Начните применять фреймворк 4D уже сегодня — результаты не заставят себя ждать.

Полезные ссылки 📝
• Интерактивный сайт по курсу на русском языке здесь
• Оригинальный курс "AI Fluency: Framework & Foundations" здесь
• Плейлист оригинального курса на youtube здесь

@llm_notes

#aifluency #anthropic #prompt #gpt5 #lovable #context #course
3👍8🔥3❤‍🔥1
RooCode обновился до версии 3.25: что нового в AI-редакторе кода 🚀

RooCode продолжает активно развиваться (ранее вскользь упоминал этот AI-кодер в контексте систем управления памятью и задачами). За последние месяцы вышло несколько крупных обновлений с версии 3.20 до 3.25. Разберем ключевые нововведения.

Основные обновления:

Версия 3.20 📦
• Экспериментальный маркетплейс расширений и режимов
• Одновременное редактирование и чтение файлов
• Навигация по истории промптов (стрелки вверх/вниз)

Версия 3.21 🛒
Официальный запуск MCP Marketplace
• Прямая поддержка Claude Max подписок (просто 🔥 - позволяет пользоваться RooCode вместо Claude Code всем Claude Max пользователям)
• Улучшенная работа с Excel файлами
• Рендеринг LaTeX уравнений в чате

Версия 3.22 ⚙️
• Поделиться задачей в один клик
• Поддержка Gemini CLI provider
• Автоматическое одобрение по таймеру для последующих запросов

Версия 3.23 🔍
• Индексация кодовой базы стала стабильной функцией
• Список задач (to-do list) прямо в чате (как в Claude Code)
• Список запрещенных команд
• Регистрация в RooCode Cloud
• Поддержка Windows для Claude Code provider

Версия 3.24 🤖
• Интеграция с Hugging Face (тысячи open-source моделей)
• Стандарт Agent Rule с файлами agents.md - такие файлы можно шарить между AI-кодерами, перенося свои лучшие шаблоны с кодом (примеры таких файлов можно найти здесь)
• Новый UI для управления разрешениями терминала

Версия 3.25 ⭐️
Кастомные slash-команды через markdown файлы (как в Claude Code)
• Очередь сообщений (можно отправлять новые, пока обрабатываются старые)
• Новые провайдеры: Cerebras, Dubao, Sambanova, New Shoots AI

RooCode Cloud ☁️ Новая облачная платформа с расширенными возможностями:
• История задач онлайн
• Функции совместной работы
• Отслеживание использования AI
• Оптимизация затрат

Ключевые возможности:

🔧 Маркетплейс - установка MCP и режимов в один клик без перезапуска

🧠 Индексация кодовой базы - семантический анализ всего проекта для лучшего понимания структуры

📝 To-do списки - автоматическое разбиение задач на шаги с отслеживанием прогресса

⚡️ Slash-команды - создание собственных команд через markdown файлы

📁 Мультифайловые операции - одновременная работа с несколькими файлами

🖼 OCR поддержка - извлечение текста из изображений и документов

Бесплатные API:
Horizon beta модель - без лимитов
Qwen3-Coder через OpenRouter и Cerebras (с лимитами)
Cerebras Code планы ($50/$200) со скоростями до 2000 токенов/сек (Qwen3-Coder)
KiloCode (это форк RooCode) - $20 бесплатных кредитов

Все обновления направлены на повышение продуктивности разработчиков и упрощение работы с кодом.

KiloCode и RooCode сейчас, мне кажется, смотрятся интереснее Cursor (разве что Cursor Agents и Cursor CLI могут стать диференциатором). На базе этих продуктов можно реализовать качественное локальное решение для AI-кодинга.

Если требуется полностью локальное (offline) решение для AI-кодинга, то я вижу 2 основных варианта:
1) комбинация KiloCode/RooCode + Qwen3-Coder (на базе ollama) кажется мне наиболее подходящим вариантом (вот здесь небольшой ресерч по данной теме)
2) или же cli-вариант на базе связки qwen code + Qwen3-coder (на базе ollama) - вот здесь ресерч по данному вопросу.

@llm_notes

#roocode #vibecoding #kilocode #dev
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍31
🔧 Open Lovable: быстрое клонирование сайтов и создание React-приложений через чат с ИИ

Команда Mendable AI выпустила открытый инструмент для быстрого создания React-приложений.
Open Lovable (не путать с lovable.dev, который является коммерческим развитием GPT Engineer) позволяет клонировать любой сайт и воссоздать его как современное React-приложение за несколько минут.

Основные возможности:
• Создание приложений через чат с ИИ
• Клонирование существующих веб-сайтов
• Автоматическая генерация React-кода
• Поддержка современного стека технологий

Технические требования: 1️⃣ E2B API ключ для песочниц 2️⃣ Firecrawl API для веб-скрапинга 3️⃣ Один из ИИ провайдеров: Anthropic, OpenAI или Groq

Установка:
git clone https://github.com/mendableai/open-lovable.git
cd open-lovable
npm install
npm run dev


Проект распространяется под лицензией MIT и уже набрал 3.1k звёзд на GitHub 📈

Инструмент может быть полезен для быстрого прототипирования и создания MVP, особенно когда нужно воссоздать дизайн существующего сайта.

На скриншоте - моя попытка склонировать сайт lovable.dev
Результат, который получился, можно найти по ссылке

DeepWiki по проекту здесь (в этот раз почему-то без схем архитектуры)

@llm_notes

#react #ai #vibecoding #opensource #javascript #lovable
👍4
🚀 v0.dev стал v0.app: еще одна агентная платформа для создания продуктов с ИИ

Популярная платформа v0.dev получила крупное обновление и сменила домен на v0.app. Теперь это более мощный инструмент, который позволяет создавать полноценные рабочие продукты с помощью агентного ИИ.

Это отличное дополнение к фронентд AI-кодерам lovable и bolt. Только v0.app сейчас бесплатный!

Что нового:
• Агентный ИИ планирует, исследует, создает и отлаживает проекты
• Возможность описать идею и получить готовый продукт
• Бесплатный доступ на этой неделе

Что уже создают пользователи: 1️⃣ Полноценные MVP стартапов 2️⃣ Интерактивные презентации с редактируемыми макетами 3️⃣ Приложения для опросов с подключением к базам данных 4️⃣ Витрины интернет-магазинов 5️⃣ Дашборды с реальными данными и API-интеграцией

Платформа предлагает бесплатный период для тестирования всех возможностей.

Основное преимущество платформы — не нужно писать промпты построчно. Достаточно описать, что хотите создать, и v0.app разберется с остальным 🤖

Я проверил на задаче создания сайта-визитки по профилю в linkedin (см. скриншоты)
Мне понравилось, как v0.app справился с созданием сайта, где есть переключение 2х языков и переключение с темной на светлую тему. Полгода назад, тестируя lovable и bolt на такой задаче, я потратил почти в 2 раза больше времени.
Осталось добавить форму обратной связи через email (для отправки email можно использовать EmailJS), сделать выгрузку CV в pdf и подправить ссылки на соц. сети.

После того как проект готов его можно либо сразу опубликовать на vercel (см. пример по ссылке), либо скачать архив и потом сделать частью более крупного проекта на claude/roocode/cursor/windsurf/...

Если сравнивать с lovable и bolt, то v0.app пока не хватает встроенного Security Audit, также нет отдельного режима планирования и автоматического рефакторинга кода (как в lovable).
А с точки зрения интеграций с Supabase и другими сервисами - у v0.app их даже больше! (подробности тут)

@llm_notes

#v0 #app #vibecoding #ui #agents #vercel #cv #site
👍63
🚀 Claude Sonnet 4 получил поддержку контекстного окна в 1 миллион токенов

Anthropic наконец-то увеличила контекстное окно Claude Sonnet 4 до 1 млн токенов — это в 5 раз больше предыдущего лимита (то, чего я ждал еще в мае :)
Теперь модель может обрабатывать целые кодовые базы с 75,000+ строк кода или десятки исследовательских работ за один запрос.

Новые возможности:

• Анализ больших кодовых баз — загрузка исходного кода, тестов и документации для понимания архитектуры проекта
• Синтез документов — обработка обширных наборов документов: контрактов, исследований, технических спецификаций
• Контекстно-зависимые агенты — создание агентов, которые сохраняют контекст на протяжении сотен вызовов инструментов

💰 Ценообразование API:

1️⃣ Промпты ≤ 200K токенов: $3/MTok (вход), $15/MTok (выход)

2️⃣ Промпты > 200K токенов: $6/MTok (вход), $22.50/MTok (выход)

При использовании кэширования промптов и пакетной обработки можно получить дополнительную экономию до 50% 📉

Отзывы клиентов:

🔧 Bolt.new — CEO Eric Simons отмечает, что расширенный контекст позволяет работать с крупными проектами, сохраняя высокую точность (мой комментарий: возможно, кстати, недавние успехи bolt, которые я наблюдал, при решении практических задач, связаны с тем, что они использовали модель с расширенным контекстным окном)

⚡️ iGent AI — разработчики AI-партнера Maestro для создания кода. CEO Sean Ward подчеркивает, что 1M токенов открывает возможности для многодневных сессий работы с реальными кодовыми базами.

📅 Доступность:

Функция пока находится в публичной бете для клиентов с Tier 4 и кастомными лимитами на Anthropic API (подробнее про Tier 4 здесь). Также доступна в Amazon Bedrock, скоро появится в Google Cloud Vertex AI.
В течение ближайших недель обещают распространить на более широкий круг пользователей.
Ждем с нетерпением!

• Официальный анонс по ссылке.
• Подробная документация тут.

@llm_notes

#claude #anthropic #context #ai #llm #1m
12❤‍🔥21
🔍 Как сделать виртуальную примерку очков: полный разбор проекта

Пока лето еще в самом разгаре и теплые деньки надеюсь у нас еще впереди, хотел бы поделиться опытом разработки веб-приложения для виртуальной примерки очков, которое мы делали в июне в рамках курса "Cursor. AI-прототипирование и ИИ-агенты".

Расскажу коротко (насколько позволяет формат заметки) о всех этапах - от исследования до деплоя.

Исследование решений 🔬

Сначала проводим анализ возможных подходов к решению задачи и существующих open-source проектов для AR-примерки, которые можно взять за основу. Как правило, после проведенного ресерча всегда возникает "развилка", которая в данном случае выглядит так:

• Самостоятельная разработка:
Создать решение с нуля, используя комбинацию передовых библиотек: MediaPipe для высокоточного отслеживания лица и Three.js для рендеринга 3D-моделей. Этот подход обеспечивает максимальный контроль, наилучшее качество и гибкость для будущего развития.

• Адаптация готового проекта: Взять за основу существующий open-source проект, например, bensonruan/Virtual-Glasses-Try-on (который демонстрирует связку MediaPipe + Three.js). Это может ускорить начальный этап, но в долгосрочной перспективе может оказаться менее гибким вариантом.

Мы решили пойти путем адаптации готового проекта. И выбирали из следующих вариантов:
jeeliz/jeelizGlassesVTOWidget - 300 ⭐️ Самое популярное решение с готовой базой 3D-моделей
bensonruan/Virtual-Glasses-Try-on - 46 ⭐️
alperenuzun/basic-virtual-tryon-glasses - 30 ⭐️ Базовая реализация без продвинутых функций

Попробовав все три варианта, я выбрал Jeeliz как наиболее зрелое решение (ну и "звездочек" у него больше).

Архитектура финального решения 🏗

• Фронтенд: Lovable.dev - быстрое создание React-интерфейса
• Бэкенд: Яндекс.Облако - Docker-контейнер с nginx и виджетом
• Интеграция: Stripe для платежей + система аутентификации (заодно проверили как lovable.dev справился с "прикруткой" данных функций - все прошло гладко)

Потестировать финальное приложение можно по ссылке (примеры на скриншотах)
На посадочной странице есть подробная информация про архитектуру и внутреннее устройство приложения.

Техническая база проекта ⚡️

Использовали готовую библиотеку Jeeliz VTO Widget:
• WebGL-рендеринг с физически корректным освещением
• Нейросеть для отслеживания лица в реальном времени
• База 3D-моделей очков (Ray-Ban, Oakley, Carrera)
• Поддержка мобильных устройств

Что пришлось решать 🔧

1️⃣ HTTPS-требование - камера работает только через защищенное соединение 2️⃣ Контейнеризация - настроил Docker + Nginx с SSL-сертификатами 3️⃣ Проксирование API - внешние ресурсы Jeeliz через локальный прокси 4️⃣ GPU-совместимость - проверка WebGL на клиенте

Разделение фронт/бэк 📐

Lovable.dev (фронтенд):
• Посадочная страница с описанием
• Система регистрации/авторизации
• Интеграция Stripe для оплаты
• Адаптивный дизайн

Яндекс.Облако (бэкенд):
• Docker-контейнер с Nginx
• Jeeliz VTO Widget
• SSL через Let's Encrypt
• Прокси для внешних API

Практические находки 💡

• GPU нужен только на клиенте, сервер работает без видеокарты
• Обязательно тестировать WebGL-совместимость (например, chrome://gpu)
• Для слабых устройств есть режим пониженной производительности
• Размер приложения всего 2.1MB благодаря оптимизации

Результат работы 📊

Получили полнофункциональное приложение:
• Работающая AR-примерка в браузере (safari/firefox/chrome)
• Каталог с 200+ моделями очков
• Система оплаты и личный кабинет (подписку оформлять не нужно, она сделана для проверки функциональности)
• Готовое к продакшн-деплою решение

Весь процесс занял несколько часов благодаря использованию готовой библиотеки и правильной архитектуре.

О курсе 🎓
• Данный проект был реализован в рамках курса "Cursor. AI-прототипирование и ИИ-агенты"
• Следующий поток стартует 27 августа - отличная возможность освоить современные инструменты разработки с ИИ.
• Примеры реализованных проектов можно найти здесь.

@llm_notes

#webgl #ar #lovable #cursor #yandexcloud #glasses #productuniversity
83
🔧 Полезный инструмент для Claude Code: Claude Code Templates

Для разработчиков, использующих Claude Code, появился полезный ресурс — платформа Claude Code Templates.
Это аналог популярного Playbooks для Cursor/Windsurf (ранее писал про него здесь), но созданный специально для Claude Code.

Что предлагает данный инструмент:

• Готовые AI-агенты (а точнее их полные спецификации с промптами и инструментами) для различных задач разработки
• Настроенные команды для автоматизации рутинных процессов
• Хуки для событийно-ориентированной автоматизации
• MCP интеграции с внешними сервисами
• Шаблоны проектов для разных языков и фреймворков

Основные возможности:

1️⃣ Специализированные агенты — от аудитора безопасности до оптимизатора производительности

2️⃣ Библиотека команд — автоматизация тестирования, рефакторинга, деплоя

3️⃣ Интеграции — подключение к GitHub, базам данных, инструментам автоматизации

4️⃣ Аналитическая панель — мониторинг использования Claude Code в реальном времени

5️⃣ Проверка системы — диагностика конфигурации и производительности

Платформа позволяет быстро найти нужный инструмент через поиск, не тратя время на создание решений с нуля. Все компоненты можно устанавливать как полными шаблонами проектов, так и отдельными модулями.

Инструмент распространяется через NPM и GitHub, имеет открытый исходный код и подробную документацию 📚

Есть красивая интеграция с DeepGraph, доступная прямо из UI, но для поиска нужного инструмента (агента, команды, шаблона, mcp и т.п.) под определенную задачу, по моему опыту, лучше использовать DeepWiki (чуть ранее писал о нем тут).

DeepGraph, например, не смог мне по репозиторию рассматриваемого проекта дать ответ на простой вопрос подскажи, какого агента лучше использовать для ревью кода? , хотя в проекте есть готовый суб-агент для решения такой задачи с говорящим названием code-reviewer
При этом DeepWiki на тот же вопрос сразу и достаточно быстро ответил что:
Рекомендуемый агент
code-reviewer - это специализированный агент для экспертного ревью кода, который проактивно проверяет качество, безопасность и поддерживаемость кода components.json:304 . Агент должен использоваться сразу после написания или модификации кода.


@llm_notes

#claudecode #templates #automation #vibecoding #mcp #agents #hooks
🔥43👍2😐1
GenSpark AI Developer: новый инструмент для создания веб-приложений методом vibecoding 🚀

Компания GenSpark AI представила GenSpark AI Developer — специализированного ИИ-агента, который дополняет функциональность супер-агента Genspark и позволяет создавать веб-сайты и приложения без навыков программирования (про genspark.ai и варианты его использования я писал чуть ранее, вот пример одного из постов)

Основные возможности:

• Работа с несколькими AI-моделями, включая Claude Sonnet 4
• Создание сайтов прямо в браузере или мобильном приложении
• Автоматическая генерация админ-панелей для управления контентом
• Интеграция с GitHub для разработчиков

Примеры использования:

1️⃣ Бизнес-сайты — система бронирования для салона красоты с возможностью выбора времени и подтверждения записей 2️⃣ E-commerce — интернет-магазин с корзиной покупок и каталогом товаров 3️⃣ Личные проекты — трекер домашних дел для детей с системой баллов и наград 4️⃣ Игры — простые игровые приложения по текстовому описанию

Для разработчиков 👨‍💻

Поддерживает работу с существующими GitHub-репозиториями (см. скриншот). Можно модифицировать код, создавать pull request'ы и деплоить изменения через браузер или мобильное приложение.

Технические детали:

• Поддерживаемые модели: Claude Sonnet 4.0, Opus 4.1, GPT-5, Kimi K2
• Модель нельзя изменить в процессе работы над проектом ⚠️
• Интеграция с GenSpark SuperAgent для создания программных продуктов или простых веб-сайтов на основе проведенных исследований (сам пользуюсь с начала этой недели, вот один из примеров)

Варианты публикации приложения: 📤

• Через сам GenSpark (не очень удобно, т.к. требует от пользователя приложения регистрации на самом genspark.ai)
Cloudflare Pages (хороший вариант, т.к. позволяет разместить веб-приложение на хостинге с развитыми инструментами мониторинга и сопровождения, но в РФ опубликованный таким образом сайт будет доступен только через VPN)
• Экспорт кодовой базы для размещения на любом хостинге
GitHub Pages для простых сайтов (бесплатно)

Конкуренты: Genspark AI Developer с моей точки зрения уже сейчас составляет хорошую конкуренцию таким решениям как lovable.dev, bolt.new и v0.app. Основное его преимущество в том, что после проведения подготовительной работы, которой обычно является глубокий ресерч по какой-то тематике, не требуется переключаться на другую платформу.

Чего не хватает: 🔍 Встроенного Security Audit — пока можно использовать внешние инструменты для проверки безопасности кода, такие как https://vibe-eval.com/ например.

Сервис позиционируется как решение для непрограммистов, которым нужно взаимодействовать с командами разработки или создавать простые веб-приложения самостоятельно.

Как я чаще всего использую 📚
Провожу ресерч по интересующей меня теме
Создаю для себя обучающий сайт с проверочными тестами (к слову, и раньше без специализированного ai dev-агента это тоже можно было делать, но с AI developer качество стало значительно выше, думаю, что другим популярным универсальным браузерным ИИ-агентам, таким как manus, flowith, abaqus deep agent и т.д. имеет смысл перенять опыт genspark.ai )
Очень удобно быстро собрать интерактивный материал для изучения новых областей. И все на одной универсальной платформе.

В следующем посте приведу пример подготовки комплексной обучающей программы, которым поделился один из моих коллег на своем тг-канале.

@llm_notes

#genspark #agent #vibecoding #lovable #bolt #replit
👍21
Как и обещал, ниже пример того, как можно создавать учебные курсы под личные потребности самостоятельно. У поста ниже есть продолжение на тг канале автора с шаблонами промптов, которые он использует. Я себе взял на заметку.
1
Forwarded from Applied AI 2
Как сэкономить 84 350 долларов в год

Столько стоит MBA (программа Master of Business Administration) в MIT, а также огромное количество времени. Я ничего не плачу и получаю персональные рекомендации по улучшение процессов в моей жизни и моих бизнесах. Ниже расскажу как, но перед этим отзывы:

CTO: "Блин это лучшее обучение которое у меня когда-либо было"
CAIO: "Я занимаюсь уже всю неделю не отрываясь"
Остальная команда: 100/10
Друг-предприниматель: "Сделал себе, то что я получаю пользу в контексте моих проектов сразу зарабатывает мне деньги"
Знакомая, окончившая MBA: "эх если бы такое было в моё время я бы уже в 16 запускала первый проект"
Мой друг 160iq+: не стал пробовать, слишком гигантское эго

TLDR РЕЦЕПТ

0. Открываем любую GPT
1. You will become what you hate about yourself — "Я хочу научиться Х, сделай мне тест моего уровня для оценки навыков, чтобы я смог Y"
2. Context is the king — В настройках персонализации chatgpt / claude / cursorrules пишем 300+ слов о себе, опыте, проблемах, ресурсах, проблеме и цели
3. Make yourself 6-monthly over-detailed, over-personalized, gpt-understandable plan — В несколько промптов создаем себе план обучения на 2000+ уроков, которые погрузят нас в каждую тему
4. Корректируем под себя промпт "плана урока"
5-2004. Follow it, make a schedule — начинаем каждый день со стандартного "план урока"+"промпт-тема"


Try now or forget forever - 100% есть фундаментальные навыки, в котором ты - лох, либо можешь перейти на следующую парадигму:
- management
- product
- sales
- networking
- processes
- your tech domain

Накидайте 10 огонечков и скину свои промпты.
Моей команде: буду благодарен если напишите свой опыт в комментах

@aigov2
🔥189
Коллеги, насколько интересен будет ежедневный дайджест новостей?

Такую подборку каждый может сделать для себя самостоятельно, и проще всего использовать manus или flowith c функцией scheduled tasks. Но возможно, не всем захочется тратить на это свои кредиты на данных платформах.

Пример такой подборки со ссылками на первоисточники ниже.

📊 Дайджест новостей ИИ за 19 августа 2025

🔄 Meta реструктурирует ИИ-подразделение

Meta разделила свое ИИ-подразделение Meta Superintelligence Labs на четыре группы. Новая структура включает исследования, разработку "суперинтеллекта", продукты и инфраструктуру.

Основные изменения:
• Ожидается уход некоторых руководителей
• Рассматривается сокращение штата (сейчас тысячи сотрудников)
• Изучается использование сторонних ИИ-моделей
• Возможен переход к "закрытым" моделям вместо open-source
• Капитальные расходы могут достичь $72 млрд в этом году

The New York Times

📈 Американцы опасаются влияния ИИ на рынок труда

Опрос Reuters/Ipsos среди 4,446 американцев показал:
• 71% обеспокоены массовым вытеснением рабочих мест
• 77% беспокоятся об использовании ИИ для политического хаоса
• 48% против использования ИИ в военном таргетинге
• 61% волнует энергопотребление ИИ-технологий
• 67% опасаются замены человеческих отношений ИИ-компаньонами

Reuters

⚛️ Запуск квантовой ИИ платформы QIDO

В Токио представили QIDO (Quantum-Integrated Discovery Orchestrator) — совместный проект Mitsui, QSimulate и Quantinuum. Платформа объединяет квантовые алгоритмы с классическим ИИ для точного моделирования химических реакций и ускорения разработки лекарств.

HPC Wire | The Quantum Insider

💰 Крупные инвестиции в ИИ-стартапы

1️⃣ Databricks привлекает $1+ млрд при оценке $100+ млрд
2️⃣ EliseAI получила $250 млн от A16z, оценка $2.2 млрд
3️⃣ Eight Sleep привлекла $100 млн для ИИ в умных матрасах
4️⃣ OpenAI готовит продажу акций при оценке ~$500 млрд

Reuters (Databricks) | Reuters (EliseAI) | TechCrunch

🆕 Новые продукты и обновления

Meta AI-дубляж: автоперевод видео с сохранением голоса (английский-испанский)
Adobe Acrobat Studio: ИИ-платформа для анализа до 100 документов
Nvidia B30A: новый ИИ-чип для Китая на архитектуре Blackwell

TechCrunch (Meta) | The Verge (Adobe) | Reuters (Nvidia)

⚠️ "Зомби-стартапы" в Кремниевой долине

Технологические гиганты переманивают основателей ИИ-стартапов, избегая регулятивного контроля при поглощениях. После таких сделок компании становятся "зомби" — формально существуют, но лишены ключевых кадров.

CNBC

🚨 Этические проблемы

• Скандал с Meta AI-чатботами: внутренние документы показали романтические беседы с детьми
• Расовая предвзятость в ИИ-системах распознавания изображений
• Исследование показало быструю зависимость врачей от ИИ-помощников

The Guardian | NPR Illinois

@llm_notes

#ai_news #meta_restructuring #quantum_ai #ai_investments #ai_ethics
5👎4🔥3👍1