Заметки LLM-энтузиаста
572 subscribers
150 photos
18 videos
1 file
181 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
🔍 Как сделать виртуальную примерку очков: полный разбор проекта

Пока лето еще в самом разгаре и теплые деньки надеюсь у нас еще впереди, хотел бы поделиться опытом разработки веб-приложения для виртуальной примерки очков, которое мы делали в июне в рамках курса "Cursor. AI-прототипирование и ИИ-агенты".

Расскажу коротко (насколько позволяет формат заметки) о всех этапах - от исследования до деплоя.

Исследование решений 🔬

Сначала проводим анализ возможных подходов к решению задачи и существующих open-source проектов для AR-примерки, которые можно взять за основу. Как правило, после проведенного ресерча всегда возникает "развилка", которая в данном случае выглядит так:

• Самостоятельная разработка:
Создать решение с нуля, используя комбинацию передовых библиотек: MediaPipe для высокоточного отслеживания лица и Three.js для рендеринга 3D-моделей. Этот подход обеспечивает максимальный контроль, наилучшее качество и гибкость для будущего развития.

• Адаптация готового проекта: Взять за основу существующий open-source проект, например, bensonruan/Virtual-Glasses-Try-on (который демонстрирует связку MediaPipe + Three.js). Это может ускорить начальный этап, но в долгосрочной перспективе может оказаться менее гибким вариантом.

Мы решили пойти путем адаптации готового проекта. И выбирали из следующих вариантов:
jeeliz/jeelizGlassesVTOWidget - 300 ⭐️ Самое популярное решение с готовой базой 3D-моделей
bensonruan/Virtual-Glasses-Try-on - 46 ⭐️
alperenuzun/basic-virtual-tryon-glasses - 30 ⭐️ Базовая реализация без продвинутых функций

Попробовав все три варианта, я выбрал Jeeliz как наиболее зрелое решение (ну и "звездочек" у него больше).

Архитектура финального решения 🏗

• Фронтенд: Lovable.dev - быстрое создание React-интерфейса
• Бэкенд: Яндекс.Облако - Docker-контейнер с nginx и виджетом
• Интеграция: Stripe для платежей + система аутентификации (заодно проверили как lovable.dev справился с "прикруткой" данных функций - все прошло гладко)

Потестировать финальное приложение можно по ссылке (примеры на скриншотах)
На посадочной странице есть подробная информация про архитектуру и внутреннее устройство приложения.

Техническая база проекта ⚡️

Использовали готовую библиотеку Jeeliz VTO Widget:
• WebGL-рендеринг с физически корректным освещением
• Нейросеть для отслеживания лица в реальном времени
• База 3D-моделей очков (Ray-Ban, Oakley, Carrera)
• Поддержка мобильных устройств

Что пришлось решать 🔧

1️⃣ HTTPS-требование - камера работает только через защищенное соединение 2️⃣ Контейнеризация - настроил Docker + Nginx с SSL-сертификатами 3️⃣ Проксирование API - внешние ресурсы Jeeliz через локальный прокси 4️⃣ GPU-совместимость - проверка WebGL на клиенте

Разделение фронт/бэк 📐

Lovable.dev (фронтенд):
• Посадочная страница с описанием
• Система регистрации/авторизации
• Интеграция Stripe для оплаты
• Адаптивный дизайн

Яндекс.Облако (бэкенд):
• Docker-контейнер с Nginx
• Jeeliz VTO Widget
• SSL через Let's Encrypt
• Прокси для внешних API

Практические находки 💡

• GPU нужен только на клиенте, сервер работает без видеокарты
• Обязательно тестировать WebGL-совместимость (например, chrome://gpu)
• Для слабых устройств есть режим пониженной производительности
• Размер приложения всего 2.1MB благодаря оптимизации

Результат работы 📊

Получили полнофункциональное приложение:
• Работающая AR-примерка в браузере (safari/firefox/chrome)
• Каталог с 200+ моделями очков
• Система оплаты и личный кабинет (подписку оформлять не нужно, она сделана для проверки функциональности)
• Готовое к продакшн-деплою решение

Весь процесс занял несколько часов благодаря использованию готовой библиотеки и правильной архитектуре.

О курсе 🎓
• Данный проект был реализован в рамках курса "Cursor. AI-прототипирование и ИИ-агенты"
• Следующий поток стартует 27 августа - отличная возможность освоить современные инструменты разработки с ИИ.
• Примеры реализованных проектов можно найти здесь.

@llm_notes

#webgl #ar #lovable #cursor #yandexcloud #glasses #productuniversity
83
🔧 Полезный инструмент для Claude Code: Claude Code Templates

Для разработчиков, использующих Claude Code, появился полезный ресурс — платформа Claude Code Templates.
Это аналог популярного Playbooks для Cursor/Windsurf (ранее писал про него здесь), но созданный специально для Claude Code.

Что предлагает данный инструмент:

• Готовые AI-агенты (а точнее их полные спецификации с промптами и инструментами) для различных задач разработки
• Настроенные команды для автоматизации рутинных процессов
• Хуки для событийно-ориентированной автоматизации
• MCP интеграции с внешними сервисами
• Шаблоны проектов для разных языков и фреймворков

Основные возможности:

1️⃣ Специализированные агенты — от аудитора безопасности до оптимизатора производительности

2️⃣ Библиотека команд — автоматизация тестирования, рефакторинга, деплоя

3️⃣ Интеграции — подключение к GitHub, базам данных, инструментам автоматизации

4️⃣ Аналитическая панель — мониторинг использования Claude Code в реальном времени

5️⃣ Проверка системы — диагностика конфигурации и производительности

Платформа позволяет быстро найти нужный инструмент через поиск, не тратя время на создание решений с нуля. Все компоненты можно устанавливать как полными шаблонами проектов, так и отдельными модулями.

Инструмент распространяется через NPM и GitHub, имеет открытый исходный код и подробную документацию 📚

Есть красивая интеграция с DeepGraph, доступная прямо из UI, но для поиска нужного инструмента (агента, команды, шаблона, mcp и т.п.) под определенную задачу, по моему опыту, лучше использовать DeepWiki (чуть ранее писал о нем тут).

DeepGraph, например, не смог мне по репозиторию рассматриваемого проекта дать ответ на простой вопрос подскажи, какого агента лучше использовать для ревью кода? , хотя в проекте есть готовый суб-агент для решения такой задачи с говорящим названием code-reviewer
При этом DeepWiki на тот же вопрос сразу и достаточно быстро ответил что:
Рекомендуемый агент
code-reviewer - это специализированный агент для экспертного ревью кода, который проактивно проверяет качество, безопасность и поддерживаемость кода components.json:304 . Агент должен использоваться сразу после написания или модификации кода.


@llm_notes

#claudecode #templates #automation #vibecoding #mcp #agents #hooks
🔥43👍2😐1
GenSpark AI Developer: новый инструмент для создания веб-приложений методом vibecoding 🚀

Компания GenSpark AI представила GenSpark AI Developer — специализированного ИИ-агента, который дополняет функциональность супер-агента Genspark и позволяет создавать веб-сайты и приложения без навыков программирования (про genspark.ai и варианты его использования я писал чуть ранее, вот пример одного из постов)

Основные возможности:

• Работа с несколькими AI-моделями, включая Claude Sonnet 4
• Создание сайтов прямо в браузере или мобильном приложении
• Автоматическая генерация админ-панелей для управления контентом
• Интеграция с GitHub для разработчиков

Примеры использования:

1️⃣ Бизнес-сайты — система бронирования для салона красоты с возможностью выбора времени и подтверждения записей 2️⃣ E-commerce — интернет-магазин с корзиной покупок и каталогом товаров 3️⃣ Личные проекты — трекер домашних дел для детей с системой баллов и наград 4️⃣ Игры — простые игровые приложения по текстовому описанию

Для разработчиков 👨‍💻

Поддерживает работу с существующими GitHub-репозиториями (см. скриншот). Можно модифицировать код, создавать pull request'ы и деплоить изменения через браузер или мобильное приложение.

Технические детали:

• Поддерживаемые модели: Claude Sonnet 4.0, Opus 4.1, GPT-5, Kimi K2
• Модель нельзя изменить в процессе работы над проектом ⚠️
• Интеграция с GenSpark SuperAgent для создания программных продуктов или простых веб-сайтов на основе проведенных исследований (сам пользуюсь с начала этой недели, вот один из примеров)

Варианты публикации приложения: 📤

• Через сам GenSpark (не очень удобно, т.к. требует от пользователя приложения регистрации на самом genspark.ai)
Cloudflare Pages (хороший вариант, т.к. позволяет разместить веб-приложение на хостинге с развитыми инструментами мониторинга и сопровождения, но в РФ опубликованный таким образом сайт будет доступен только через VPN)
• Экспорт кодовой базы для размещения на любом хостинге
GitHub Pages для простых сайтов (бесплатно)

Конкуренты: Genspark AI Developer с моей точки зрения уже сейчас составляет хорошую конкуренцию таким решениям как lovable.dev, bolt.new и v0.app. Основное его преимущество в том, что после проведения подготовительной работы, которой обычно является глубокий ресерч по какой-то тематике, не требуется переключаться на другую платформу.

Чего не хватает: 🔍 Встроенного Security Audit — пока можно использовать внешние инструменты для проверки безопасности кода, такие как https://vibe-eval.com/ например.

Сервис позиционируется как решение для непрограммистов, которым нужно взаимодействовать с командами разработки или создавать простые веб-приложения самостоятельно.

Как я чаще всего использую 📚
Провожу ресерч по интересующей меня теме
Создаю для себя обучающий сайт с проверочными тестами (к слову, и раньше без специализированного ai dev-агента это тоже можно было делать, но с AI developer качество стало значительно выше, думаю, что другим популярным универсальным браузерным ИИ-агентам, таким как manus, flowith, abaqus deep agent и т.д. имеет смысл перенять опыт genspark.ai )
Очень удобно быстро собрать интерактивный материал для изучения новых областей. И все на одной универсальной платформе.

В следующем посте приведу пример подготовки комплексной обучающей программы, которым поделился один из моих коллег на своем тг-канале.

@llm_notes

#genspark #agent #vibecoding #lovable #bolt #replit
👍21
Как и обещал, ниже пример того, как можно создавать учебные курсы под личные потребности самостоятельно. У поста ниже есть продолжение на тг канале автора с шаблонами промптов, которые он использует. Я себе взял на заметку.
1
Forwarded from Applied AI by David
Как сэкономить 84 350 долларов в год

Столько стоит MBA (программа Master of Business Administration) в MIT, а также огромное количество времени. Я ничего не плачу и получаю персональные рекомендации по улучшение процессов в моей жизни и моих бизнесах. Ниже расскажу как, но перед этим отзывы:

CTO: "Блин это лучшее обучение которое у меня когда-либо было"
CAIO: "Я занимаюсь уже всю неделю не отрываясь"
Остальная команда: 100/10
Друг-предприниматель: "Сделал себе, то что я получаю пользу в контексте моих проектов сразу зарабатывает мне деньги"
Знакомая, окончившая MBA: "эх если бы такое было в моё время я бы уже в 16 запускала первый проект"
Мой друг 160iq+: не стал пробовать, слишком гигантское эго

TLDR РЕЦЕПТ

0. Открываем любую GPT
1. You will become what you hate about yourself — "Я хочу научиться Х, сделай мне тест моего уровня для оценки навыков, чтобы я смог Y"
2. Context is the king — В настройках персонализации chatgpt / claude / cursorrules пишем 300+ слов о себе, опыте, проблемах, ресурсах, проблеме и цели
3. Make yourself 6-monthly over-detailed, over-personalized, gpt-understandable plan — В несколько промптов создаем себе план обучения на 2000+ уроков, которые погрузят нас в каждую тему
4. Корректируем под себя промпт "плана урока"
5-2004. Follow it, make a schedule — начинаем каждый день со стандартного "план урока"+"промпт-тема"


Try now or forget forever - 100% есть фундаментальные навыки, в котором ты - лох, либо можешь перейти на следующую парадигму:
- management
- product
- sales
- networking
- processes
- your tech domain

Накидайте 10 огонечков и скину свои промпты.
Моей команде: буду благодарен если напишите свой опыт в комментах

@aigov2
🔥219
Коллеги, насколько интересен будет ежедневный дайджест новостей?

Такую подборку каждый может сделать для себя самостоятельно, и проще всего использовать manus или flowith c функцией scheduled tasks. Но возможно, не всем захочется тратить на это свои кредиты на данных платформах.

Пример такой подборки со ссылками на первоисточники ниже.

📊 Дайджест новостей ИИ за 19 августа 2025

🔄 Meta реструктурирует ИИ-подразделение

Meta разделила свое ИИ-подразделение Meta Superintelligence Labs на четыре группы. Новая структура включает исследования, разработку "суперинтеллекта", продукты и инфраструктуру.

Основные изменения:
• Ожидается уход некоторых руководителей
• Рассматривается сокращение штата (сейчас тысячи сотрудников)
• Изучается использование сторонних ИИ-моделей
• Возможен переход к "закрытым" моделям вместо open-source
• Капитальные расходы могут достичь $72 млрд в этом году

The New York Times

📈 Американцы опасаются влияния ИИ на рынок труда

Опрос Reuters/Ipsos среди 4,446 американцев показал:
• 71% обеспокоены массовым вытеснением рабочих мест
• 77% беспокоятся об использовании ИИ для политического хаоса
• 48% против использования ИИ в военном таргетинге
• 61% волнует энергопотребление ИИ-технологий
• 67% опасаются замены человеческих отношений ИИ-компаньонами

Reuters

⚛️ Запуск квантовой ИИ платформы QIDO

В Токио представили QIDO (Quantum-Integrated Discovery Orchestrator) — совместный проект Mitsui, QSimulate и Quantinuum. Платформа объединяет квантовые алгоритмы с классическим ИИ для точного моделирования химических реакций и ускорения разработки лекарств.

HPC Wire | The Quantum Insider

💰 Крупные инвестиции в ИИ-стартапы

1️⃣ Databricks привлекает $1+ млрд при оценке $100+ млрд
2️⃣ EliseAI получила $250 млн от A16z, оценка $2.2 млрд
3️⃣ Eight Sleep привлекла $100 млн для ИИ в умных матрасах
4️⃣ OpenAI готовит продажу акций при оценке ~$500 млрд

Reuters (Databricks) | Reuters (EliseAI) | TechCrunch

🆕 Новые продукты и обновления

Meta AI-дубляж: автоперевод видео с сохранением голоса (английский-испанский)
Adobe Acrobat Studio: ИИ-платформа для анализа до 100 документов
Nvidia B30A: новый ИИ-чип для Китая на архитектуре Blackwell

TechCrunch (Meta) | The Verge (Adobe) | Reuters (Nvidia)

⚠️ "Зомби-стартапы" в Кремниевой долине

Технологические гиганты переманивают основателей ИИ-стартапов, избегая регулятивного контроля при поглощениях. После таких сделок компании становятся "зомби" — формально существуют, но лишены ключевых кадров.

CNBC

🚨 Этические проблемы

• Скандал с Meta AI-чатботами: внутренние документы показали романтические беседы с детьми
• Расовая предвзятость в ИИ-системах распознавания изображений
• Исследование показало быструю зависимость врачей от ИИ-помощников

The Guardian | NPR Illinois

@llm_notes

#ai_news #meta_restructuring #quantum_ai #ai_investments #ai_ethics
5👎4🔥3👍2
ИИ-новости 20 августа: предупреждения, падения и прорывы 🤖

(6 минутный подкаст можно послушать по ссылке)

Microsoft бьет тревогу: растет число случаев "ИИ-психоза" ⚠️

Мустафа Сулейман из Microsoft предупредил о новой проблеме — люди начинают воспринимать ИИ как живых существ и формируют с ними нездоровые отношения.

Что происходит:
• Пользователи верят в романтические отношения с ИИ
• Убеждены в получении сверхспособностей от чатботов
• Доверяют ИИ в серьезных жизненных решениях

Реальный случай: житель Шотландии поверил ChatGPT о компенсации в £5 млн, что привело к психическому срыву.

А нам то что?
Полезно
помнить, что ИИ — это все-таки программа, а не лучший друг 🤖. Особенно когда речь идет о важных решениях и крупных суммах денег 💰.

Источники: [BBC News]


Технологические акции падают из-за сомнений в ИИ 📉

Инвесторы начинают сомневаться в окупаемости миллиардных вложений в искусственный интеллект.

Цифры падения:
• Nasdaq: -1,5%
• S&P 500: -0,6%
• 95% ИИ-проектов терпят неудачу (исследование MIT)

71% американцев беспокоятся о потере рабочих мест из-за ИИ.

А нам то что?
Пора перестать покупать акции только потому, что в названии компании есть слово "AI" 🤦‍♂️. И да, диверсификация портфеля по-прежнему актуальна, даже в эпоху ИИ 💼.

Источники: [Reuters]


Meta заморозила найм в ИИ-подразделении 🧊

После агрессивной кампании найма (50+ специалистов с пакетами свыше $100 млн) Meta приостановила пополнение команды ИИ.

Причины:
• Реструктуризация подразделения
• Давление инвесторов по окупаемости
• Базовое организационное планирование

А нам то что?
Если вы мечтали о зарплате в $100 млн за работу с ИИ — увы, поезд ушел 🚂💨. Зато теперь можно не переживать о том, что не успели на него запрыгнуть 😅.
А если серьезно: рынок труда в ИИ оказался не таким бесконечно растущим, как казалось 📈. Хорошее время для развития смежных навыков 🎯.

Источники: [Reuters]


Прорывы ИИ в медицине 🏥

🔹 Билл Гейтс запустил конкурс на $1 млн для ИИ-решений против болезни Альцгеймера

🔹 OpenEvidence набрала 100% на медицинском экзамене США (USMLE) — первая в истории

🔹 Epic Systems разрабатывает 200 ИИ-функций для медицинских записей

А нам то что?
Скоро ИИ будет лечить нас лучше врачей 👨‍⚕️, но при этом мы будем сходить с ума от общения с ним 🤪. Ирония судьбы в чистом виде 🎭.
А если серьезно: удивительно, но медицина — одна из немногих сфер, где ИИ действительно показывает впечатляющие результаты 👨‍⚕️. Возможно, именно здесь стоит следить за развитием технологий особенно внимательно 🔬.

Источники: [HIStalk Healthcare AI News]


Выводы дня 🎯

Индустрия ИИ переживает период переосмысления: технология показывает впечатляющие результаты в медицине, но растут опасения о психологических рисках и коммерческой окупаемости. Время эйфории сменяется более взвешенным подходом.

@llm_notes

#ai_news #tech_market #ai_psychology #medical_ai #investment_risks
🆒5😁4👍3👎1
Вчерашний дайджест новостей, на мой взгляд, был не очень интересным. Поэтому не стал его верстать и публиковать. А вот сегодняшний - достаточно любопытный, поэтому приятного чтения!

(13 минутный подкаст можно послушать по ссылке)

AI Дайджест: 22 августа 2025 📰


1. Apple и Google: неожиданный союз для Siri 🤝

Apple ведет переговоры с Google об использовании Gemini AI для модернизации Siri. Компания рассматривает внешнее партнерство после того, как собственная разработка застопорилась.

Основные моменты:
• Решение еще не принято окончательно
• Обновление Siri отложено на год из-за технических проблем
• Apple также общалась с Anthropic и OpenAI
• Акции Alphabet выросли на 3.7% после новости

А нам то что? 🤷‍♂️ Наконец-то Siri может стать умнее чайника! Правда, для этого Apple придется просить помощи у конкурентов.

А если серьезно: пользователи iPhone могут получить более продвинутого голосового помощника, хотя это означает, что даже Apple признает превосходство чужих AI-технологий.

[Источник: Reuters]

3. MIT: 95% корпоративных AI-проектов проваливаются 📉

Исследование MIT показало, что только 5% компаний получают отдачу от AI-инвестиций, несмотря на $30-40 миллиардов трат. Проблема не в качестве моделей, а в "разрыве обучения" (отсутствие культуры использования ИИ в работе).

Ключевые выводы:
• Исследование охватило 150 интервью и 350 опросов
Готовые AI-инструменты работают лучше самодельных
• Наибольший ROI в автоматизации back-office
• Половина бюджетов тратится на продажи и маркетинг

А нам то что? 🎯 Выходит, что AI — это как спортзал: все покупают абонемент, но мало кто ходит 😉

А если серьезно: это отрезвляющая статистика для инвесторов и напоминание, что внедрение AI требует не только денег, но и грамотной стратегии. Про рекомендуемый Mckinsey подход для разрешения "парадокса генеративного ИИ" и о том, что это такое писал здесь.

[Источник: Fortune]


4. Армия США инвестирует $99.5 млн в Scale AI 🎖

Пентагон заключил контракт с Scale AI на исследования и разработки в сфере военного ИИ сроком до 2030 года. Это уже второй подобный контракт компании с армией.

Детали контракта:
• Фиксированная цена $99.5 миллионов
• 11 заявок на тендер
• Предыдущий контракт был на $90.8 млн в 2020 году

А нам то что? 🤖 Теперь ИИ будет не только писать стихи, но и планировать военные операции. Что может пойти не так?

А если серьезно: это показывает стратегическую важность AI-технологий для национальной безопасности США и может ускорить развитие гражданских применений.

[Источник: GovConWire]


5. Экологическая цена AI-революции 🌍

Массовое внедрение ИИ приводит к значительному росту потребления энергии и воды, что вызывает обеспокоенность экологическими последствиями развития технологий.

А нам то что? ⚡️ Оказывается, ChatGPT не только ест наши данные, но и планету заодно.

А если серьезно: это напоминание о том, что технологический прогресс должен учитывать экологические издержки, и, возможно, именно под этим предлогом после того как "борьба за умы" будет закончена и рынок LLM "устаканится", западные провайдеры "внезапно" могут начать повышать цену за токен. И тогда отечественные провайдеры LLM на их фоне станут выглядеть выгодными по цене, и мы станем ими пользоваться не только ради безопасности и соблюдения требований регуляторов.

[Источник: ABC News]


6. Analog Devices на волне AI-оптимизма 📈

Акции компании выросли на 3.61% до $255.87, достигнув годового максимума благодаря успехам в промышленном секторе и превышению ожиданий в Q3.

А нам то что? 💹 Еще одна компания решила прокатиться на AI-хайпе. Инвесторы скупают все, что хоть как-то связано с искусственным интеллектом.

А если серьезно: это показывает, как AI-тренд все еще влияет на весь tech-сектор, создавая возможности для роста даже традиционных полупроводниковых компаний.

[Источник: AInvest]

@llm_notes

#ai_news #tech_industry #corporate_ai #military_ai #ai_investments
22🆒21
🤖 ИИ-дайджест: 23 августа 2025

Пока одни эксперты говорят о замедлении прогресса в ИИ, другие продолжают выпускать новые модели 😉

[5 мин подкаст здесь]

📉 Эксперты: прогресс в ИИ замедлился


Кэл Ньюпорт из Джорджтаунского университета заявил NPR, что развитие больших языковых моделей застопорилось после GPT-4.

Основные тезисы:
• Экспоненциальный рост закончился
• Индустрия переключилась с увеличения размера моделей на улучшение существующих
• Массовая безработица от ИИ в ближайшие 5 лет маловероятна

А нам то что? 🤷‍♂️ Можно перестать паниковать, что завтра нас заменят роботы 😉

[Источник: NPR]


💸 Продолжают расти опасения "пузыря ИИ"


The Guardian предупреждает о возможном крахе рынка ИИ-акций. Nvidia упала на 3%, Palantir — почти на 10%. При этом P/E коэффициент Palantir превышает 500 при норме до 50.

Тревожные сигналы:
• Сэм Альтман назвал некоторые оценки компаний "безумными"
• 95% компаний не видят отдачи от инвестиций в генеративный ИИ (см. вчерашний дайжест)
• ФРС пытается стабилизировать рынки

А нам то что? 📈 Если вы не торгуете ИИ-акциями, можете спокойно наблюдать за их динамикой.

[Источник: The Guardian]

🚀 Новые модели продолжают выходить

Несмотря на озвученный выше пессимизм, многие компании представили несколько интересных релизов:

Cohere Command-R (Reasoning):
• Специализируется на сложных многоэтапных задачах
• Работает на одном GPU
• Открытые веса для исследователей

DeepSeek V3.1:
• Архитектура mixture-of-experts
• Отличные результаты в программировании
Совместима с API Anthropic!

ByteDance SEED-OSS-36B:
• Контекстное окно 512,000 токенов
• Обучена только на несинтетических (!) данных

А нам то что? 🛠 Больше бесплатных инструментов для экспериментов — всегда хорошо. А если серьезно — появляются более специализированные решения, которые могут быть полезнее универсальных гигантов для конкретных задач.

[Источник: AI Daily News]


💰 ServiceNow показывает, как зарабатывать на ИИ


Одна из немногих компаний, которая реально монетизирует ИИ. Успешно переводит клиентов на премиальные лицензии со встроенным генеративным ИИ.

Цифры:
• $10.92 млрд текущих обязательств
• Цель: $1 млрд годовой выручки от ИИ к 2026 году
• Акции выросли на 2.86%

А нам то что? 💼 Наконец-то пример того, как ИИ может приносить реальные деньги, а не только сжигать их. А если серьезно — показывает путь для других компаний: не гнаться за хайпом, а спокойно и методично решать свои конкретные бизнес-задачи.

[Источник: AInvest]


🔥 Корпорации тратят миллиарды впустую

Исследование показало парадокс: инвестиции в ИИ растут на 94% до $61.9 млрд, но 42% компаний отказываются от большинства ИИ-проектов.

Статистика:
• JPMorgan дал доступ к ИИ 200,000 сотрудников
• Половина экономит до 4 часов в неделю
• Но финансовую отдачу считают единицы

А нам то что? 🤦‍♂️ Можно не переживать, что отстаете от трендов — даже большие западные корпорации не знают, что делать с ИИ. И вроде бы хороший повод подумать дважды, прежде чем внедрять ИИ ради ИИ. Но не надо забывать, что ни одна из технологий, которая в итоге перевернула мир, не показала свою эффективность сразу.

Примеры:
Электричество (1880-е - 1920-е)
• 40+ лет потребовалось для полной трансформации промышленности
• Первые фабрики просто заменяли паровые двигатели на электрические, не меняя процессы
• Настоящая революция началась только когда переосмыслили всю организацию производства (ничего не напоминает?)

Персональные компьютеры (1970-е - 1980-е)
• 1977: Кен Олсен (DEC): "Нет причин, по которым кому-то может понадобиться компьютер дома"
• Первые годы: Высокая стоимость, сложность использования, неясные бизнес-модели
• Реальность: Революция произошла через 10-15 лет

Ну и то что мы все с вами помним: Интернет (1990-е - 2000-е)
• 1995: Многие эксперты считали интернет "игрушкой для гиков"
• 1999: Нобелевский лауреат Пол Кругман предсказывал, что влияние интернета на экономику будет не больше, чем у факса
• Реальность: Потребовалось ~15 лет для массового коммерческого успеха

[Источник: The Seattle Times]

@llm_notes

#ai_news
31👍1🔥1
ИИ-дайджест: 25 августа 2025 🤖

[6 мин. подкаст здесь]

1. Microsoft выпустила VibeVoice-1.5B — модель для синтеза длинной речи

Microsoft представила открытую модель VibeVoice-1.5B, которая может генерировать до 90 минут непрерывной речи с четырьмя разными голосами. Модель построена на базе Qwen2.5-1.5B и использует диффузионные алгоритмы. Поддерживает английский и китайский языки, доступна под лицензией MIT.

А нам то что? 🤷‍♂️ Теперь можно создавать подкасты, где ИИ будет болтать сам с собой на английском полтора часа подряд 😉 Технология открывает возможности для создания образовательного контента (пока только для китайцев и англичан), аудиокниг и подкастов на английском/китайском без привлечения дикторов. С нетерпением ждем поддержку русского языка.

[Источник] 🔗


2. Обнаружена масштабная ИИ-пропаганда с китайскими корнями

Исследователи Университета Вандербильта выявили компанию GoLaxy, связанную с китайским правительством, которая использует ИИ для персонализированных пропагандистских кампаний в Гонконге и Тайване. Система создает индивидуальные профили тысяч американских политиков и адаптирует сообщения под каждого получателя.

А нам то что? 🎭 Отлично, теперь даже пропаганда стала персонализированной — скоро ИИ будет знать, какие именно фейки нам больше нравятся 😉

А если серьезно: это сильный сигнал о необходимости развития инструментов детекции ИИ-контента и нашего собственного критического мышления при потреблении информации.

[Источник] 🔗


3. ИИ научился предсказывать погоду на месяцы вперед

В журнале Nature опубликовано исследование о модели ACE2, которая делает сезонные прогнозы погоды на 1-3 месяца. Модель обучена только на исторических данных ERA5 и показывает результаты, сравнимые с физическими моделями климата.

А нам то что? ☔️ Наконец-то можно будет точно знать, что синоптики ошибутся не только на завтра, но и на три месяца вперед 😉

А если серьезно: более точные долгосрочные прогнозы критически важны для сельского хозяйства, энергетики и планирования инфраструктуры.

[Источник] 🔗


4. MIT и Harvard создали тест на "понимание" для ИИ

Исследователи разработали метрику "inductive bias" для оценки того, насколько глубоко языковые модели понимают предметную область. Тестирование показало, что современные модели плохо выводят общие закономерности из частных случаев.

А нам то что? 🧠 Ученые официально подтвердили то, что мы и так знали — ИИ умеет красиво говорить, но не всегда понимает, о чем говорит 🥸

А если серьезно: понимание ограничений ИИ поможет более осознанно применять эти технологии в науке и критически важных областях.

[Источник] 🔗


5. Новый подход к созданию пользовательских симуляторов

В arXiv опубликована работа о фреймворке для создания симуляторов пользователей в рекомендательных системах. Подход использует LLM для генерации процессов принятия решений и дистилляцию данных на основе оценки неопределенности.

А нам то что? 🎯 Теперь ИИ будет еще лучше имитировать наши предпочтения — скоро он будет знать, что мы хотим купить, раньше нас самих.

А если серьезно: более точные пользовательские модели помогут создавать действительно полезные рекомендации вместо навязывания ненужного контента.

[Источник] 🔗


@llm_notes

#ai_news #voice_synthesis #ai_propaganda #weather_prediction #user_modeling
👍63🔥1
Mail Manus: новый способ работы с email через ИИ 📧

Коллеги, всем привет!

Если вдруг пропустили - теперь Manus'у можно ставить не только регулярные задачи (scheduled tasks), но и событийные - прямо по почте.

Появился сервис, который превращает любое письмо в готовую задачу для выполнения. Достаточно переслать email на специальный адрес @manus.bot
И конечно же можно настроить автоматичекий форвард определенных писем на этот специальный адрес в почтовом клиенте.

Как это работает:
• Отправляете новое письмо или пересылаете переписку с вложениями
• Manus анализирует контекст и выполняет задачу
• Результат приходит обратно на вашу почту

Основные возможности:
• Создание задач в один клик ⚡️
• Понимание контекста всей переписки
• Сохранение вложений без ручной загрузки

Практические сценарии использования:

1️⃣ Перевод документов
Руководитель прислал отчет для перевода? Пересылаете письмо — получаете готовый перевод.

2️⃣ Анализ договоров
Отправляете коммерческие предложения или договоры для быстрого анализа рисков и условий.

3️⃣ Обработка резюме
Пересылаете письма от кандидатов — получаете структурированную таблицу с данными.

4️⃣ Управление расходами
Пересылаете счета и инвойсы — система автоматически извлекает и организует данные о расходах.

5️⃣ Саммари переписок
Длинные обсуждения в команде превращаются в краткие выжимки с планом действий.

Настройка:
• Заходите в настройки Manus (см. скриншот)
• Находите уникальный адрес @manus.bot
• Добавляете свои email-адреса в список авторизованных
• Начинаете пересылать письма 📤

@llm_notes

#automation #tools #productivity #manus #workflow
2👍2😱1
Курсор. Айсберг гайдов.

> В мае число платных пользователей Cursor превысило 2 миллиона человек — это только 4.4% от всех разработчиков! На московском митапе опытных платформенных разработчиков задали вопрос к аудитории: "Кто еще не пробовал курсор?" - руки подняло 80-90% зала.
> Каждый месяц все больше профессионалов приходят с вопросом - "Где найти гайд на курсор" и "С чего начать изучать вайбкодинг" - лед постепенно трогается.
> 90% вайб-инженеров быстро достигают теоретического потолка и не знают, где брать новые методологии и как использовать новые фичи.

Поэтому решили вместе с @aigov2 собрать гайды для вайб-инженеров любого уровня:

"Вершина айсберга"
1. Документация от Cursor, чтобы знать какие где настройки
2. Шаблоны хороших промптов: cursor.directory, playbooks.com

"Середина айсберга"
3. Подборка гайдов и видео для "intermediate"
4. Истории использования, хорошие атомарные советы
5. Сабреддиты: ChatGPTCoding, cursor, roocode
6. X: курсора, roocode, # vibecoding

"Низ айсберга"
7. Cursor.fan - best-practices от практиков, пример: How to Handle Big Projects With Cursor
8. Гайды по использованию курсора в профессиональной разработке - approved by Sber/Yandex senior developers

"Подвал"
9. Что делать, если агент не исправляет ошибку
10. Как подключить 1000 MCP
11. Как программировать с учетом вчерашних изменений в любом фреймворке

Вайб-кодинг - это не простой навык, как о нем думает большинство. На его освоение может быть разумно выделить столько же времени, сколько на изучение нового языка программирования. Однако время, вложенное в его изучение, окупится в десятки раз.


Что уже есть по теме на этом канале
Ищите по хэш-тегу #cursor
Хотел бы отметить следующие посты
https://t.me/llm_notes/130 - про Memory Bank, сейчас лучше использовать Cursor Memory Bank совместно с бесплатной версией supercode.sh
https://t.me/llm_notes/136 - про работу с большими кодовыми базами
https://t.me/llm_notes/162 - про решение проблем с контекстом для AI-кодеров
https://t.me/llm_notes/186 - про фоновые агенты в Cursor
https://t.me/llm_notes/188 - про дизайн ПО (кмк очень важная тема в контексте вайб-кодинга)

P.S. ⚡️ Если вы уже готовы перейти от изучения гайдов к реальной практике vibe-кодинга, то можете присоединиться к четвертому обновленному потоку курса по вайб-кодингу и AI-прототипам (https://productuniversity.ru/cursor) — вводное занятие было на этой неделе, но еще не поздно!

@llm_notes

#cursor #vibecoding #guide #course
👍752🎉1
Media is too big
VIEW IN TELEGRAM
🎬 Genspark представил Clip Genius — ИИ для автоматического монтажа видео

Genspark прдолжает радовать и только что представил новый инструмент Clip Genius, который позволяет создавать клипы из любых видео с помощью одного текстового запроса. Разберем основные возможности:

Основные функции:

🔹 Одиночные клипы — ИИ анализирует видео и вырезает нужные моменты по описанию
🔹 Сетка из клипов — создание коллажа из нескольких фрагментов одного видео
🔹 Тематическая нарезка — выделение конкретных моментов (например, только голы одной команды)
🔹 Мэшап из разных видео — объединение фрагментов из нескольких источников

Как это работает:

1️⃣ Загружаете видео в систему (или даете ссылку на youtube)
2️⃣ Пишете текстовый запрос на естественном языке
3️⃣ ИИ анализирует контент и создает нарезку
4️⃣ Получаете готовый клип или набор фрагментов

Дополнительные возможности:

• Встроенный редактор для доработки клипов (доступен только в браузерах Chrome и Edge)
• Экспорт в различных форматах
• Поддержка длинного контента (подкасты, стримы)

Инструмент может быть полезен для создания превью, хайлайтов спортивных матчей, нарезок из подкастов и других задач видеомонтажа 📹

Для примера я сделал видео-нарезку (см. ролик, прикрепленный к заметке) основных тезисов интервью с руководителем инженерного отдела Shopify на тему "Как ИИ меняет разработку программного обеспечения в Shopify" (текстовый конспект можно посмотреть в моей заметке по ссылке). Использовал очень простой промпт:
подготовь нарезку с основными тезисами интервью
https://www.youtube.com/watch?v=u-3IILWQPRM

Далее Clip Genius самостоятельно декомпозировал задачу на отдельные шаги и в процессе их выполнения сохранял промежуточные результаты на Genspark AI Drive. Вот ссылка для иллюстрации всего процесса решения данной задачи с помощью Clip Genius.

@llm_notes

#ai #clip #video #content #genspark
110👍1