Заметки LLM-энтузиаста
642 subscribers
160 photos
21 videos
1 file
194 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
🤖 ИИ-дайджест: 23 августа 2025

Пока одни эксперты говорят о замедлении прогресса в ИИ, другие продолжают выпускать новые модели 😉

[5 мин подкаст здесь]

📉 Эксперты: прогресс в ИИ замедлился


Кэл Ньюпорт из Джорджтаунского университета заявил NPR, что развитие больших языковых моделей застопорилось после GPT-4.

Основные тезисы:
• Экспоненциальный рост закончился
• Индустрия переключилась с увеличения размера моделей на улучшение существующих
• Массовая безработица от ИИ в ближайшие 5 лет маловероятна

А нам то что? 🤷‍♂️ Можно перестать паниковать, что завтра нас заменят роботы 😉

[Источник: NPR]


💸 Продолжают расти опасения "пузыря ИИ"


The Guardian предупреждает о возможном крахе рынка ИИ-акций. Nvidia упала на 3%, Palantir — почти на 10%. При этом P/E коэффициент Palantir превышает 500 при норме до 50.

Тревожные сигналы:
• Сэм Альтман назвал некоторые оценки компаний "безумными"
• 95% компаний не видят отдачи от инвестиций в генеративный ИИ (см. вчерашний дайжест)
• ФРС пытается стабилизировать рынки

А нам то что? 📈 Если вы не торгуете ИИ-акциями, можете спокойно наблюдать за их динамикой.

[Источник: The Guardian]

🚀 Новые модели продолжают выходить

Несмотря на озвученный выше пессимизм, многие компании представили несколько интересных релизов:

Cohere Command-R (Reasoning):
• Специализируется на сложных многоэтапных задачах
• Работает на одном GPU
• Открытые веса для исследователей

DeepSeek V3.1:
• Архитектура mixture-of-experts
• Отличные результаты в программировании
Совместима с API Anthropic!

ByteDance SEED-OSS-36B:
• Контекстное окно 512,000 токенов
• Обучена только на несинтетических (!) данных

А нам то что? 🛠 Больше бесплатных инструментов для экспериментов — всегда хорошо. А если серьезно — появляются более специализированные решения, которые могут быть полезнее универсальных гигантов для конкретных задач.

[Источник: AI Daily News]


💰 ServiceNow показывает, как зарабатывать на ИИ


Одна из немногих компаний, которая реально монетизирует ИИ. Успешно переводит клиентов на премиальные лицензии со встроенным генеративным ИИ.

Цифры:
• $10.92 млрд текущих обязательств
• Цель: $1 млрд годовой выручки от ИИ к 2026 году
• Акции выросли на 2.86%

А нам то что? 💼 Наконец-то пример того, как ИИ может приносить реальные деньги, а не только сжигать их. А если серьезно — показывает путь для других компаний: не гнаться за хайпом, а спокойно и методично решать свои конкретные бизнес-задачи.

[Источник: AInvest]


🔥 Корпорации тратят миллиарды впустую

Исследование показало парадокс: инвестиции в ИИ растут на 94% до $61.9 млрд, но 42% компаний отказываются от большинства ИИ-проектов.

Статистика:
• JPMorgan дал доступ к ИИ 200,000 сотрудников
• Половина экономит до 4 часов в неделю
• Но финансовую отдачу считают единицы

А нам то что? 🤦‍♂️ Можно не переживать, что отстаете от трендов — даже большие западные корпорации не знают, что делать с ИИ. И вроде бы хороший повод подумать дважды, прежде чем внедрять ИИ ради ИИ. Но не надо забывать, что ни одна из технологий, которая в итоге перевернула мир, не показала свою эффективность сразу.

Примеры:
Электричество (1880-е - 1920-е)
• 40+ лет потребовалось для полной трансформации промышленности
• Первые фабрики просто заменяли паровые двигатели на электрические, не меняя процессы
• Настоящая революция началась только когда переосмыслили всю организацию производства (ничего не напоминает?)

Персональные компьютеры (1970-е - 1980-е)
• 1977: Кен Олсен (DEC): "Нет причин, по которым кому-то может понадобиться компьютер дома"
• Первые годы: Высокая стоимость, сложность использования, неясные бизнес-модели
• Реальность: Революция произошла через 10-15 лет

Ну и то что мы все с вами помним: Интернет (1990-е - 2000-е)
• 1995: Многие эксперты считали интернет "игрушкой для гиков"
• 1999: Нобелевский лауреат Пол Кругман предсказывал, что влияние интернета на экономику будет не больше, чем у факса
• Реальность: Потребовалось ~15 лет для массового коммерческого успеха

[Источник: The Seattle Times]

@llm_notes

#ai_news
31👍1🔥1
ИИ-дайджест: 25 августа 2025 🤖

[6 мин. подкаст здесь]

1. Microsoft выпустила VibeVoice-1.5B — модель для синтеза длинной речи

Microsoft представила открытую модель VibeVoice-1.5B, которая может генерировать до 90 минут непрерывной речи с четырьмя разными голосами. Модель построена на базе Qwen2.5-1.5B и использует диффузионные алгоритмы. Поддерживает английский и китайский языки, доступна под лицензией MIT.

А нам то что? 🤷‍♂️ Теперь можно создавать подкасты, где ИИ будет болтать сам с собой на английском полтора часа подряд 😉 Технология открывает возможности для создания образовательного контента (пока только для китайцев и англичан), аудиокниг и подкастов на английском/китайском без привлечения дикторов. С нетерпением ждем поддержку русского языка.

[Источник] 🔗


2. Обнаружена масштабная ИИ-пропаганда с китайскими корнями

Исследователи Университета Вандербильта выявили компанию GoLaxy, связанную с китайским правительством, которая использует ИИ для персонализированных пропагандистских кампаний в Гонконге и Тайване. Система создает индивидуальные профили тысяч американских политиков и адаптирует сообщения под каждого получателя.

А нам то что? 🎭 Отлично, теперь даже пропаганда стала персонализированной — скоро ИИ будет знать, какие именно фейки нам больше нравятся 😉

А если серьезно: это сильный сигнал о необходимости развития инструментов детекции ИИ-контента и нашего собственного критического мышления при потреблении информации.

[Источник] 🔗


3. ИИ научился предсказывать погоду на месяцы вперед

В журнале Nature опубликовано исследование о модели ACE2, которая делает сезонные прогнозы погоды на 1-3 месяца. Модель обучена только на исторических данных ERA5 и показывает результаты, сравнимые с физическими моделями климата.

А нам то что? ☔️ Наконец-то можно будет точно знать, что синоптики ошибутся не только на завтра, но и на три месяца вперед 😉

А если серьезно: более точные долгосрочные прогнозы критически важны для сельского хозяйства, энергетики и планирования инфраструктуры.

[Источник] 🔗


4. MIT и Harvard создали тест на "понимание" для ИИ

Исследователи разработали метрику "inductive bias" для оценки того, насколько глубоко языковые модели понимают предметную область. Тестирование показало, что современные модели плохо выводят общие закономерности из частных случаев.

А нам то что? 🧠 Ученые официально подтвердили то, что мы и так знали — ИИ умеет красиво говорить, но не всегда понимает, о чем говорит 🥸

А если серьезно: понимание ограничений ИИ поможет более осознанно применять эти технологии в науке и критически важных областях.

[Источник] 🔗


5. Новый подход к созданию пользовательских симуляторов

В arXiv опубликована работа о фреймворке для создания симуляторов пользователей в рекомендательных системах. Подход использует LLM для генерации процессов принятия решений и дистилляцию данных на основе оценки неопределенности.

А нам то что? 🎯 Теперь ИИ будет еще лучше имитировать наши предпочтения — скоро он будет знать, что мы хотим купить, раньше нас самих.

А если серьезно: более точные пользовательские модели помогут создавать действительно полезные рекомендации вместо навязывания ненужного контента.

[Источник] 🔗


@llm_notes

#ai_news #voice_synthesis #ai_propaganda #weather_prediction #user_modeling
👍63🔥1
Mail Manus: новый способ работы с email через ИИ 📧

Коллеги, всем привет!

Если вдруг пропустили - теперь Manus'у можно ставить не только регулярные задачи (scheduled tasks), но и событийные - прямо по почте.

Появился сервис, который превращает любое письмо в готовую задачу для выполнения. Достаточно переслать email на специальный адрес @manus.bot
И конечно же можно настроить автоматичекий форвард определенных писем на этот специальный адрес в почтовом клиенте.

Как это работает:
• Отправляете новое письмо или пересылаете переписку с вложениями
• Manus анализирует контекст и выполняет задачу
• Результат приходит обратно на вашу почту

Основные возможности:
• Создание задач в один клик ⚡️
• Понимание контекста всей переписки
• Сохранение вложений без ручной загрузки

Практические сценарии использования:

1️⃣ Перевод документов
Руководитель прислал отчет для перевода? Пересылаете письмо — получаете готовый перевод.

2️⃣ Анализ договоров
Отправляете коммерческие предложения или договоры для быстрого анализа рисков и условий.

3️⃣ Обработка резюме
Пересылаете письма от кандидатов — получаете структурированную таблицу с данными.

4️⃣ Управление расходами
Пересылаете счета и инвойсы — система автоматически извлекает и организует данные о расходах.

5️⃣ Саммари переписок
Длинные обсуждения в команде превращаются в краткие выжимки с планом действий.

Настройка:
• Заходите в настройки Manus (см. скриншот)
• Находите уникальный адрес @manus.bot
• Добавляете свои email-адреса в список авторизованных
• Начинаете пересылать письма 📤

@llm_notes

#automation #tools #productivity #manus #workflow
2👍2😱1
Курсор. Айсберг гайдов.

> В мае число платных пользователей Cursor превысило 2 миллиона человек — это только 4.4% от всех разработчиков! На московском митапе опытных платформенных разработчиков задали вопрос к аудитории: "Кто еще не пробовал курсор?" - руки подняло 80-90% зала.
> Каждый месяц все больше профессионалов приходят с вопросом - "Где найти гайд на курсор" и "С чего начать изучать вайбкодинг" - лед постепенно трогается.
> 90% вайб-инженеров быстро достигают теоретического потолка и не знают, где брать новые методологии и как использовать новые фичи.

Поэтому решили вместе с @aigov2 собрать гайды для вайб-инженеров любого уровня:

"Вершина айсберга"
1. Документация от Cursor, чтобы знать какие где настройки
2. Шаблоны хороших промптов: cursor.directory, playbooks.com

"Середина айсберга"
3. Подборка гайдов и видео для "intermediate"
4. Истории использования, хорошие атомарные советы
5. Сабреддиты: ChatGPTCoding, cursor, roocode
6. X: курсора, roocode, # vibecoding

"Низ айсберга"
7. Cursor.fan - best-practices от практиков, пример: How to Handle Big Projects With Cursor
8. Гайды по использованию курсора в профессиональной разработке - approved by Sber/Yandex senior developers

"Подвал"
9. Что делать, если агент не исправляет ошибку
10. Как подключить 1000 MCP
11. Как программировать с учетом вчерашних изменений в любом фреймворке

Вайб-кодинг - это не простой навык, как о нем думает большинство. На его освоение может быть разумно выделить столько же времени, сколько на изучение нового языка программирования. Однако время, вложенное в его изучение, окупится в десятки раз.


Что уже есть по теме на этом канале
Ищите по хэш-тегу #cursor
Хотел бы отметить следующие посты
https://t.me/llm_notes/130 - про Memory Bank, сейчас лучше использовать Cursor Memory Bank совместно с бесплатной версией supercode.sh
https://t.me/llm_notes/136 - про работу с большими кодовыми базами
https://t.me/llm_notes/162 - про решение проблем с контекстом для AI-кодеров
https://t.me/llm_notes/186 - про фоновые агенты в Cursor
https://t.me/llm_notes/188 - про дизайн ПО (кмк очень важная тема в контексте вайб-кодинга)

P.S. ⚡️ Если вы уже готовы перейти от изучения гайдов к реальной практике vibe-кодинга, то можете присоединиться к четвертому обновленному потоку курса по вайб-кодингу и AI-прототипам (https://productuniversity.ru/cursor) — вводное занятие было на этой неделе, но еще не поздно!

@llm_notes

#cursor #vibecoding #guide #course
👍952🎉1
Media is too big
VIEW IN TELEGRAM
🎬 Genspark представил Clip Genius — ИИ для автоматического монтажа видео

Genspark прдолжает радовать и только что представил новый инструмент Clip Genius, который позволяет создавать клипы из любых видео с помощью одного текстового запроса. Разберем основные возможности:

Основные функции:

🔹 Одиночные клипы — ИИ анализирует видео и вырезает нужные моменты по описанию
🔹 Сетка из клипов — создание коллажа из нескольких фрагментов одного видео
🔹 Тематическая нарезка — выделение конкретных моментов (например, только голы одной команды)
🔹 Мэшап из разных видео — объединение фрагментов из нескольких источников

Как это работает:

1️⃣ Загружаете видео в систему (или даете ссылку на youtube)
2️⃣ Пишете текстовый запрос на естественном языке
3️⃣ ИИ анализирует контент и создает нарезку
4️⃣ Получаете готовый клип или набор фрагментов

Дополнительные возможности:

• Встроенный редактор для доработки клипов (доступен только в браузерах Chrome и Edge)
• Экспорт в различных форматах
• Поддержка длинного контента (подкасты, стримы)

Инструмент может быть полезен для создания превью, хайлайтов спортивных матчей, нарезок из подкастов и других задач видеомонтажа 📹

Для примера я сделал видео-нарезку (см. ролик, прикрепленный к заметке) основных тезисов интервью с руководителем инженерного отдела Shopify на тему "Как ИИ меняет разработку программного обеспечения в Shopify" (текстовый конспект можно посмотреть в моей заметке по ссылке). Использовал очень простой промпт:
подготовь нарезку с основными тезисами интервью
https://www.youtube.com/watch?v=u-3IILWQPRM

Далее Clip Genius самостоятельно декомпозировал задачу на отдельные шаги и в процессе их выполнения сохранял промежуточные результаты на Genspark AI Drive. Вот ссылка для иллюстрации всего процесса решения данной задачи с помощью Clip Genius.

@llm_notes

#ai #clip #video #content #genspark
110👍2
🆕 Новые бесплатные AI-модели с контекстом 2 млн токенов

На openrouter.ai стали доступны две новые модели: Sonoma Dusk Alpha и Sonoma Sky Alpha.

Обе работают бесплатно и поддерживают контекстное окно в 2 миллиона токенов.

Где протестировать:

1️⃣ Через любой бесплатный AI-кодер (Roo/Cline/Kilo/...), где можно указать openrouter в качестве провайдера (на requesty.ai пока нет)

Внутри Kilo есть свой провайдер Kilo Code (но модели все равно в названии имеют openrouter: openrouter/sonoma-sky-alpha и openrouter/sonoma-dusk-alpha)

2️⃣ Напрямую через OpenRouter API

Что известно:

• Некоторые эксперты предполагают, что за моделями стоит xAI
• Другие считают их новыми версиями Gemini 3
• Модели собирают данные промптов для улучшения работы ⚠️

Особенности:

• Бесплатное использование 💰
• Большой контекст (2M токенов) 📊
• Возможны ограничения по скорости запросов ⏱️

Рекомендую самостоятельно протестировать модели и сравнить их качество и производительность с другими моделями, например, такой трендовой как Grok Code Fast 1.

Я тестировал, используя Kilo Code на примере игры в сапера. Результаты можно посмотреть в комментариях.

Я использовал в Kilo Code режимы Architect и Code и один и тот же промпт: Создай, пожалуйста, игру Сапер, используя JS, CSS и HTML.

Мой выбор из трех упомянутых выше моделей: sonoma-dusk-alpha
Она лучше всех показала себя при решении этой простой задачи:
1) Короткий, но по делу "To-Do" лист
2) Быстрое написание кода
3) Рабочий прототип за пару десятков секунд, в котором ничего не надо было исправлять.

@llm_notes

#llm #free #large_context #sonoma #openrouter #kilo
🔥6
828 проектов на базе Nano Banana: обзор хакатона от Google DeepMind

Google DeepMind совместно с FAL и ElevenLabs провели 48-часовой хакатон Nano Banana 🍌

Основные цифры:
🔸 2,723 участника
🔸 828 готовых проектов
🔸 48 часов на разработку

Что доступно для изучения:
🔸 Демо-видео проектов
🔸 Ссылки на Google AI Studio
🔸 Возможность ремикса проектов в собственном AI Studio

Все проекты находятся в открытом доступе на Kaggle. Это хорошая возможность изучить различные подходы к решению задач и найти идеи для собственных разработок 💡

Материалы можно использовать как справочник по практическому применению AI-инструментов в реальных проектах.

Вот здесь интересный пример, как сделать генератор протипов приложений (причем приводится не только ссылка на репозиторий с кодом, но и PRD для создания приложения методом Vibecoding'а)

Ссылка на коллекцию:
👉 https://kaggle.com/competitions/banana/writeups

А какой из проектов вам больше всего понравился?
Поделитесь, пожалуйста, в комментариях!

@llm_notes

#nanobana #hackathon #googleai #aiprojects #kaggle #vibecoding
543🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🛠 GitHub представил Spec Kit — инструмент для спек-ориентированной разработки

GitHub на днях выпустил, с моей точки зрения, очень полезный открытый инструментарий Spec Kit, который помогает разработчикам создавать четкие спецификации и превращать их в исполняемые планы для ИИ-кодеров.

По функциональности решение напоминает приятно поразивший меня летом режим "Code with Spec" в Amazon Kiro или "Quest Mode" в Qoder (а еще ранее различные инструменты управления задачами для vibecoding такие как Task Master и Memory Bank)

Что это такое:
• Открытый набор инструментов для спек-ориентированной (Specification-Driven Development - SDD) разработки
• Интеграция с популярными ИИ-кодерами (Claude Code, GitHub Copilot, Gemini CLI)
• Превращение спецификаций в исполняемый код при помощи ИИ-кодеров по схеме /specify → /plan → /tasks → implement (очень похоже на flow: VAN → PLAN → CREATIVE → IMPLEMENT из Cursor Memory Bank)

Как работает:
1️⃣ Создание спецификации (/specify) - здесь описывается основная продуктовая задача (по сути это PRD)
2️⃣ Генерация плана (/plan) - здесь указываются детали технического стека на базе которых, опираясь на PRD, будет сгенерирован план реализации, который потом будет разбиваться на задачи
3️⃣ Разбивка на задачи (/tasks)
4️⃣ Реализация с помощью ИИ-кодеров

Основные возможности:
• Быстрый старт с готовыми примерами и документацией
• Совместимость с различными редакторами и ИИ-кодерами
• Шаблоны для типовых задач разработки
• Регулярные обновления и исправления

Инструмент направлен на ускорение разработки и снижение количества переписываний кода за счет более структурированного подхода к планированию.

🔗 Репозиторий: https://github.com/github/spec-kit

Deepwiki где можно задать вопросы по проекту здесь

@llm_notes

#github #speckit #oss #vibecoding #sdd
👍531
🌐 Genspark AI Browser: новый браузер с ИИ на устройстве

Компания Genspark выпустила браузер для Windows и Mac с интегрированными возможностями искусственного интеллекта. Основная особенность — работа ИИ-моделей непосредственно на устройстве пользователя (а сам AI-браузер у genspark появился еще 3 месяца назад)

🔧 Ключевые возможности:

169 ИИ-моделей — доступ к различным открытым моделям, включая GPT, Deepseek, Gemma
Автономная работа — функции ИИ работают без подключения к интернету
Приватность — данные не покидают устройство пользователя
Встроенный Super Agent — ИИ-помощник интегрирован в каждую веб-страницу

⚡️ Дополнительные функции:

1️⃣ Режим автопилота — браузер может самостоятельно выполнять задачи по поиску и анализу информации

2️⃣ Поиск лучших цен — автоматическое сравнение стоимости товаров на торговых площадках

3️⃣ Анализ видео — создание саммари и извлечение транскриптов с YouTube

4️⃣ Блокировка рекламы — встроенная защита от баннеров и всплывающих окон

5️⃣ Простая миграция — импорт данных из других браузеров одним кликом

Браузер распространяется бесплатно без ограничений и списков ожидания. Разработчики позиционируют продукт как альтернативу традиционным браузерам с расширенными ИИ-возможностями.

P.S.
У меня Genspark AI-браузер запустился и сразу заработал на Windows, а Mac стал выдавать ошибку в стиле This site can’t be reached login.genspark.ai unexpectedly closed the connection. Try: Checking the connection Checking the proxy and the firewall ERR_CONNECTION_CLOSED. Если у вас такая же проблема, то надо на Mac firewall разрешить входящие подключения для Genspark приложения. Подробная инструкция ниже:
Step 1: Go to System Settings → Network → Firewall Step 2: Temporarily turn OFF the firewall and test the connection Step 3: If it works, turn the firewall back ON and add GenSpark to exceptions:

Click "Firewall Options"
Find GenSpark AI Browser application
Set it to "Allow incoming connections"


@llm_notes

#ai #onprem #privacy #genspark #browser
3👍2
Replit представил Agent 3: новый уровень автономности в разработке 🚀

Компания Replit анонсировала третью версию своего AI-агента для написания программного кода.
Agent 3 получил значительные улучшения в области автономной работы и функциональности.

Ключевые особенности Agent 3:

Увеличенное время работы ⏱️
Агент может работать автономно до 200 минут (против 20 минут в предыдущей версии). Доступен мониторинг прогресса в реальном времени через мобильное приложение.

Автоматическое тестирование 🔧
Agent 3 самостоятельно тестирует и исправляет код, улучшая приложения в фоновом режиме. Система валидации работает в 3 раза быстрее и в 10 раз экономичнее аналогов.

Создание других агентов 🤖
Впервые агент может создавать других агентов и автоматизации. Это позволяет автоматизировать сложные рабочие процессы с помощью естественного языка (например, теперь можно вместо manus/flowith использовать именно Replit Agent 3 для генерации периодической сводки новостей)

Практические применения:

1️⃣ Автоматизация - создание ботов для отправки ежедневных отчетов по электронной почте

2️⃣ Slack-боты - интеграция с внутренними базами данных для запросов о клиентах

3️⃣ Telegram-боты - системы записи на прием для снижения нагрузки на ресепшн

Agent 3 позиционируется как решение для написания софта без знаний программирования.
Сервис доступен с бесплатным тарифным планом.

Источники:
📄 [Официальная страница Agent 3]
🎥 [Видео-презентация]

@llm_notes

#agents #vibecoding #automation #replit #development
4🔥4👍3
Media is too big
VIEW IN TELEGRAM
🧠 Контекст-инжиниринг для AI-агентов: 5 ключевых принципов

На выходных посмотрел очень интересный видео-подкаст с участием Лэнса Мартина из LangChain (автора самой популярной открытой версии Deep Research), в котором обсуждались вопросы управления контекстом в агентах - искусство давать LLM ровно тот контекст, который нужен для следующего агентного шага 🎯 Не обошлось и без сравнения моно- и мульти-агентных подходов (см. заметку)

Ниже привожу краткие тезисы, а на скрепке подготовил видео-нарезку основных тезисов с субтитрами на русском языке (8 минут).
Более полная интерактивная версия конспекта доступна по ссылке (а классический вариант конспекта здесь)

🔧 Пять столпов контекст-инжиниринга:

1️⃣ Offloading (Выгрузка)
• Не тащить всё в контекст — сохранять данные отдельно
• В историю записывать краткие сводки с возможностью подгрузки
• Экономия токенов и денег 💰

2️⃣ Context Isolation (Изоляция)
• Мультиагенты хороши для "чтения", один агент — для "письма"
• Параллельные задачи изолировать, связанные — объединять

3️⃣ Retrieval (Извлечение)
• llm.txt с качественными описаниями часто лучше сложного RAG
• Агентный поиск без индексации может превосходить векторный поиск
• Ключ успеха — хорошие описания файлов 📝

4️⃣ Reducing Context (Сжатие)
• Суммаризация на границах инструментов
• Баланс между экономией токенов и потерей информации
• Сохранять возможность восстановить исходник

5️⃣ Caching (Кеширование)
• Снижает стоимость и задержки
• Не решает проблему "context rot" от длинного контекста ⚠️

🔍 Context rot — деградация качества ответов LLM при слишком длинном контексте. Модель "теряется" в большом объёме информации и хуже понимает, что важно для текущей задачи 📉

💡 Практические инсайты:

Работа с памятью через человека — пользователь явно сохраняет важное, система учится предпочтениям
Горький урок AI — используй структурный подход сегодня, но будь готов отказаться от него завтра
MCP-стандарты снижают когнитивную нагрузку

⚡️ Золотые правила:
• Избегай наивного накопления всего контекста
• Качественная суммаризация лучше агрессивного сжатия
• Простые решения часто превосходят сложные
• Фреймворки должны легко "разбираться"

Философия: "Добавляй структуру, чтобы работало сегодня, и будь готов отказаться от нее завтра" 🚀

P.S. мне также очень понравились ссылки на дополнительные материалы в описании к ролику, некоторые из них я включил в эту заметку

@llm_notes

#context_engineering #agents #langchain #langgraph #llm_optimization
11🔥101
ByteRover 2.0: Git для памяти ИИ-агентов и 15 новых MCP-инструментов 🚀

Команда ByteRover выпустила обновление версии 2.0 своего решения для управления памятью ИИ-агентов по разработке. Систему можно использовать со всеми популярными coding-агентами: Claude Code, Cursor, Codex, GitHub Copilot и т.д. (см. скрин)

Сейчас, например, очень популярна комбинация Codex (планирование и основной кодинг с GPT-5 Codex в режиме High-Reasoning) + Claude Code (Sonnet 4.0 или Opus 4.1 для devops и mcp части кодинга) и данный инструмент позволяет "шарить" контекст между Codex и Claude Code, что очень удобно.

Ключевые нововведения:

🔄 Git для памяти ИИ
• Версионный контроль для памяти агентов
• Полная история изменений с временными метками
• Возможность отката к предыдущим версиям
• Функция форкинга баз памяти для экспериментов
• Детекция конфликтов в памяти при дублировании
• Совместная работа команды с отслеживанием авторства изменений

📝 Context Composer
Новый инструмент для создания контекста агентов:
• Загрузка документов, PDF, изображений
• Чат-интерфейс для взаимодействия с агентом
• Парсинг файлов в переиспользуемые воспоминания
• Интеграция со Slack, Jira, Figma, Google Drive

🛠 15 специализированных MCP-инструментов:

1️⃣ Knowledge Management - хранение паттернов кода и знаний с релевантным скорингом
2️⃣ Onboarding Tools - генерация и обновление справочников проектов
3️⃣ Plan Management - структурированные планы реализации с отслеживанием задач
4️⃣ Module Management - документирование модулей кодовой базы с техническими деталями
5️⃣ Reflection Tools - самооценка качества контекста агентом

Простая настройка ⚙️
• Создание workspace памяти
• Установка расширения в Cursor, Windsurf или другие AI IDE
• Добавление ключа workspace и email
• Автоматическое сохранение и восстановление памяти между сессиями

Альтернатива: Cipher 🔓
Для тех, кто предпочитает open-source решения, доступен Cipher - открытый слой памяти для coding-агентов (про другой oss вариант на базе OpenMemory MCP писал в заметке)

Возможности Cipher:
• Единый слой памяти для всех coding-агентов
• Интеграция через MCP сервер
• Поддержка OpenAI, Anthropic, OpenRouter
• Векторные базы: Milvus, Quadrant
• Ручное создание детализированных воспоминаний для проектов
• Автоматическое извлечение спецификаций и правил проекта

Настройка Cipher:
• Клонирование репозитория с GitHub
• Конфигурация в cipher.yml (MCP серверы, LLM провайдер, API ключи)
• Запуск в MCP режиме (default или aggregator)
• Интеграция с Cursor, Claude Code и другими IDE

Cipher решает ту же проблему потери контекста, но предоставляет полный контроль над данными и возможность кастомизации под специфические нужды команды.

🔗 ByteRover: https://www.byterover.dev/
🔗 Cipher GitHub: https://github.com/cipherdevs/cipher

@llm_notes

#byterover #cipher #memory #agents #mcp
4👍1🔥1
🤖 Google представила протокол AP2 для безопасных платежей через ИИ-агентов

Новость, сравнивая, с моей точки зрения, с анонсом MCP и A2A и является хорошим ответом на проблему, которую обсуждали на этом канале в апреле этого года.

Google анонсировала Agent Payments Protocol (AP2) — открытый протокол, который позволяет ИИ-агентам безопасно совершать покупки от имени пользователей. Инициативу поддержали более 60 крупных финтех и технологических компаний.

🔧 Как это работает:

• AP2 создает цифровые контракты-мандаты, которые подтверждают авторизацию пользователя перед совершением транзакции
• Для покупок в реальном времени требуется двойное подтверждение: "Intent Mandate" для поиска и "Cart Mandate" для оплаты
• Протокол поддерживает традиционные карты, банковские переводы и стейблкоины через партнерство с Coinbase

💳 Основные принципы безопасности:

1️⃣ Авторизация — доказательство того, что пользователь дал агенту право на конкретную покупку
2️⃣ Подлинность — гарантия для продавца, что запрос агента точно отражает намерения пользователя
3️⃣ Подотчетность — четкое определение ответственности при мошеннических операциях

🏢 Среди партнеров:
American Express, Mastercard, PayPal, Salesforce, Intuit, Adobe, Coinbase и другие

🚀 Возможности применения:

• Умный шоппинг с мониторингом цен и автоматическими покупками
• Персонализированные предложения на основе запросов пользователей
• Координированные задачи типа "забронируй рейс и отель в рамках бюджета"

Техническая спецификация и примеры реализации доступны в открытом репозитории GitHub.
Протокол расширяет существующие стандарты A2A и MCP.

📚 Источники:
• [Официальный блог Google Cloud]
• [Видео-презентация AP2]
• [GitHub репозиторий AP2] [DeepWiki]

@llm_notes

#payments #fintech #google #agents #blockchain #ap2
4👍2
Quests: классная open-source альтернатива Bolt и Lovable 🛠

Появилась еще одна интересная альтернатива веб AI-кодерам типа Bolt и Lovable.
И она, на мой взгляд, смотрится гораздо лучше, чем Open Lovable или Bolt.DIY.

Quests — это десктопное приложение с открытым исходным кодом, которое позволяет создавать React-приложения через удобный UI-интерфейс (как в Genspark AI Developer )

Основные особенности:

• Минималистичный интерфейс со вкладками как в браузере
• Поддержка нескольких AI-провайдеров (OpenAI, Anthropic, Gemini, OpenRouter, локальные модели через Ollama и Vercel AI Gateway - благодаря Quests, я узнал, что такой есть :)
• Низкое потребление памяти (~200 МБ)
• Кроссплатформенность
• Локальный запуск приложений

Технический стек:

🔹 Vite для фронтенда
🔹 Hono для бэкенда
🔹 ORPC для API
🔹 Встроенная поддержка Git
🔹 Экспорт готовых приложений

Что умеет:

1️⃣ Создание полноценных веб-приложений по текстовому описанию
2️⃣ Работа с несколькими проектами одновременно
3️⃣ Предварительный просмотр в реальном времени
4️⃣ Открытие проектов в VS Code, Cursor или терминале (очень удобно для решения вопросов по публикации приложения)
5️⃣ Версионирование с возможностью отката

Ограничения:

• Пока нет поддержки переменных окружения
• Отсутствует импорт существующих проектов
Нельзя прикреплять изображения
• Ограниченный выбор технологических стеков

Проект активно развивается и может стать серьезным конкурентом коммерческим решениям.
Особенно привлекает возможность использования бесплатных моделей через OpenRouter, включая Qwen3-coder и DeepSeek V3.1 (см. скриншот). Code-Supernova, к сожалению, пока не поддерживает.

Источники:
🔗 [GitHub репозиторий]
🔗 [Deepwiki на репозиторий]
🔗 [Официальный сайт]


@llm_notes

#opensource #vibecoding #web #react #lovable #bolt #quests
4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Lovable запустили Cloud и AI для автоматического создания приложений

Сегодня вечер крутых новостей!

Платформа Lovable представила две новые функции, которые упрощают разработку полнофункциональных приложений с ИИ.

Lovable Cloud — бэкенд одной командой 💾

Теперь можно создавать приложения с базами данных, авторизацией и файловым хранилищем без технических знаний. Система автоматически настраивает всю серверную инфраструктуру.

Что можно создать:
• Социальные приложения с профилями пользователей
• Платформы сообществ с постами и комментариями
• Системы управления товарами с каталогами
• Инструменты для совместной работы
• Обучающие приложения с отслеживанием прогресса

Lovable AI — ИИ-функции без настройки 🤖

Добавление ИИ-возможностей теперь происходит автоматически — не нужно регистрироваться у провайдеров, получать API-ключи или настраивать биллинг.

Возможности ИИ:
1️⃣ Анализ и обобщение контента
2️⃣ Чат-боты и разговорные интерфейсы
3️⃣ Анализ тональности текста
4️⃣ Поиск по документам и Q&A системы
5️⃣ Генерация контента и копирайтинг
6️⃣ Многоязычный перевод
7️⃣ Автоматизация рабочих процессов

Ценообразование 💰

Бесплатный тариф покрывает использование до $25/месяц. Lovable AI на базе Google Gemini бесплатен первую неделю для всех пользователей.

7-дневный челлендж 📅

С 29 сентября по 6 октября проходит неделя совместной разработки с ежедневными темами и призами.

В демонстрационном видео 10-летний ребенок создал математическое приложение с ИИ-подсказками и сохранением прогресса за несколько минут. Я проделал упражнение из ролика, результат можно посмотреть в комментариях.

Источники:
📖 Блог
🎥 Демо-видео
🌐 Челлендж

@llm_notes

#nocode #ai #vibecoding #lovable #automation
41👍1🆒1
🤖 Anthropic представила Claude Sonnet 4.5

Наконец-то!
Компания Anthropic выпустила новую версию своей языковой модели — Claude Sonnet 4.5. По заявлению разработчиков, это их самая мощная модель на данный момент.

🔧 Основные улучшения:

• Лидирует в бенчмарке SWE-bench Verified для оценки навыков программирования
• Показывает 61.4% на OSWorld (тесты работы с компьютером)
• Может поддерживать фокус на сложных задачах более 30 часов
• Улучшенные способности в математике и логических рассуждениях

💼 Практические возможности:

1️⃣ Генерация и редактирование кода
2️⃣ Работа с браузером и заполнение таблиц (см. здесь демо плагина для google chrome)
3️⃣ Создание файлов (документы, презентации, таблицы)
4️⃣ Выполнение многоэтапных задач

🛡 Безопасность:

Модель прошла дополнительное обучение для снижения нежелательного поведения:
• Уменьшение склонности к лести и обману
• Защита от prompt injection атак
• Соответствие стандартам безопасности ASL-3

💰 Доступность:

• Цена остается прежней: $3/$15 за миллион токенов
• Доступна через Claude API под именем claude-sonnet-4-5
• Обновления Claude Code доступны всем пользователям

🔬 Дополнительно:

Anthropic также выпустила Claude Agent SDK — инфраструктуру для создания AI-агентов, которая используется в их собственных продуктах (отличный ответ Openai Agents SDK)

Временно доступен исследовательский проект "Imagine with Claude" — демонстрация генерации программного обеспечения в реальном времени. Вот ссылка чтоб попробовать: https://claude.ai/imagine/
Я попросил его сделать такое же приложение для детей по изучению математики, что и lovable в предыдущем посте. Результаты можно посмотреть в комментариях.


📚 Источники:
Официальный анонс
System Card
Claude Agent SDK
Документация API

@llm_notes

#claude #anthropic #vibecoding #llm
13🔥2❤‍🔥1🆒1
🤖 OpenAI запустила протокол для покупок через ChatGPT

OpenAI представила Agentic Commerce Protocol (ACP) — открытый стандарт, который позволяет совершать покупки прямо в ChatGPT одним кликом. Протокол разработан совместно со Stripe и уже работает с цифровыми товарами Etsy.

Что такое ACP:
• Определяет взаимодействие между ИИ-агентами, продавцами и платежными системами
• Покрывает весь цикл электронной коммерции: от поиска до оплаты и доставки
• Использует JSON-формат для каталогов, сессий оформления заказов и обновлений
• Агенты не просто перенаправляют на сайт, а напрямую запрашивают цены, доставку и налоги

Ключевые особенности:
🔓 Открытый исходный код (Apache-2.0), но пока в статусе черновика
💳 Интеграция со Stripe "одной строкой кода", поддержка других процессоров через Delegated Payments
🔐 Токены с ограниченным сроком действия и привязкой к продавцу и сумме
📋 Полная история транзакций для аудита
⚡️ Обновление фидов товаров каждые 15 минут для актуальности

ACP vs Google AP2 📊

Фокус:
• ACP — полный цикл коммерции от поиска до доставки
• AP2 — только платежная часть агентской коммерции

Платежи:
• ACP — через Stripe + поддержка других через Delegated Payment
• AP2 — карты, банковские переводы, стейблкоины, криптовалюты

Авторизация:
• ACP — токены с ограничениями по продавцу и сумме
• AP2 — "мандаты" (подписанные пользователем авторизации)

Как это работает:
1️⃣ Фид товаров — продавец предоставляет структурированные данные (TSV, CSV, XML, JSON)
2️⃣ Оформление заказа — ChatGPT собирает данные покупателя и создает сессию
3️⃣ Обработка платежа — продавец валидирует и обрабатывает через свою систему
4️⃣ Вебхуки — система отправляет события о статусе заказа
5️⃣ Завершение — подтверждение или отклонение заказа

Технические детали:
• REST API с 5 обязательными эндпоинтами
• HTTPS и JSON для всех запросов
• Поддержка идемпотентности и подписей запросов
• Статусы заказов: created → manual_review → confirmed → shipped → fulfilled

Ограничения:
⚠️ Пока доступно только одобренным партнерам
⚠️ OpenAI не является продавцом — все транзакции через системы продавцов
⚠️ Требуется прохождение проверок соответствия

Источники:
🔗 [Документация OpenAI]
🔗 [Спецификация Agentic Checkout]
🔗 [Ключевые концепции ACP]

@llm_notes

#agentic_commerce #chatgpt #ecommerce #ai_agents #openai #acp #ap2
1