Заметки LLM-энтузиаста

🚀 DeepSeek представила V3.2-Exp с технологией разреженного внимания

Опенсорс также не остался в стороне от потока позитивных новостей :)
Компания DeepSeek выпустила экспериментальную версию своей модели V3.2-Exp, которая использует новый механизм разреженного внимания (DeepSeek Sparse Attention).

Ключевые особенности:

• Снижение стоимости обработки длинных контекстов на 85%
• Обработка только 2K наиболее важных токенов из 128K
• Сохранение качества на уровне V3.1-Terminus
• Снижение цен API более чем на 50%

Технические характеристики:

🔹 Модель игнорирует нерелевантные токены
🔹 Фокусируется на топ-2K токенах из контекста 128K
🔹 Значительное улучшение эффективности обучения и инференса

Доступность:

1️⃣ Hugging Face
2️⃣ Официальное приложение DeepSeek
3️⃣ Web-интерфейс
4️⃣ API с пониженными ценами (-50%)

Я жду пока появится на openrouter.ai или requesty.ai чтобы потестировать на нескольких задачах AI-кодинга средней сложности как чуть ранее делал для модели code-supernova здесь (тестировал через github codespaces - очень удобно, не нужно загружать свой ПК)

Производительность:
Тестирование показало сопоставимые результаты с V3.1-Terminus по основным бенчмаркам, включая MMLU-Pro, GPQA-Diamond и LiveCodeBench.

Модель доступна под лицензией MIT и поддерживается популярными фреймворками для инференса SGLang и vLLM 📊

Источники:
🔗 [GitHub репозиторий]
🔗 [Hugging Face]

@llm_notes

#deepseek #sparseattention #longcontext #llm #opensource

❤3👍1

469 views16:14

🔬 Paper2Agent: превращение научных статей в интерактивных AI-агентов

Исследователи представили новый подход к работе с научными публикациями. Вместо традиционного формата PDF + код, система Paper2Agent автоматически преобразует статьи в интерактивных AI-агентов.

Как это работает:
• Система анализирует научную статью и связанный код
• Автоматически настраивает рабочую среду
• Извлекает инструменты из репозитория
• Тестирует их до получения корректных результатов
• Упаковывает всё в MCP-сервер для взаимодействия

Основные преимущества:
🎯 Устраняет необходимость ручной настройки окружения
⚡️ Экономит время на воспроизведение результатов
🔧 Позволяет взаимодействовать с методами через естественный язык
📊 Обеспечивает 100% точность воспроизведения результатов

Принцип работы:
1️⃣ Статья преобразуется в MCP-сервер
2️⃣ Сервер объединяет инструменты, данные и инструкции
3️⃣ AI-агент подключается к серверу
4️⃣ Пользователь задаёт вопросы на естественном языке
5️⃣ Система выполняет анализ и возвращает результаты

Технология протестирована на сложных случаях включая AlphaGenome, TISSUE и Scanpy. Все тесты показали полное соответствие оригинальным результатам.

Я проводил свои тесты - результаты в комментариях.

📄 Статья: [Paper2Agent: Reimagining Research Papers As Interactive and Reliable AI Agents]
• Github проекта: https://github.com/jmiao24/Paper2Agent
• DeepWiki: https://deepwiki.com/jmiao24/Paper2Agent

@llm_notes

P.S. если у кого-то есть на примете интересные научные статьи с кодовой базой, которые можно было бы так "превратить" в ИИ-агента и протестировать, то напишите, пожалуйста, в комментариях.

#paper2agent #research #ai #automation #science

arXiv.org

Paper2Agent: Reimagining Research Papers As Interactive and...

We introduce Paper2Agent, an automated framework that converts research papers into AI agents. Paper2Agent transforms research output from passive artifacts into active systems that can accelerate...

❤3

529 viewsedited 11:03

Заметки LLM-энтузиаста

3:06

Media is too big

VIEW IN TELEGRAM

🎥 Lovable провели live-демонстрацию нового Cloud + AI на стриме

В дополнении к недавнему анонсу нового облака команда Lovable провела сегодня прямой эфир (1 час), где в реальном времени показала возможности недавно запущенных Lovable Cloud и Lovable AI.

Что показали на стриме:

🔹 Создание приложения для генерации изображений с нуля
🔹 Автоматическое подключение базы данных и аутентификации
🔹 Интеграцию ИИ без настройки API-ключей
🔹 Добавление системы подписок через Stripe

Демонстрация в цифрах:

1️⃣ Лендинг создан за несколько минут с автогенерацией изображений
2️⃣ Пользовательские аккаунты настроены автоматически
3️⃣ ИИ-генерация изображений работает из коробки
4️⃣ Профили пользователей с галереей изображений
5️⃣ Темы для стилизации (киберпанк, ретро, Studio Ghibli)

Новые возможности Cloud:

• Встроенная панель управления базой данных
• Мониторинг пользователей и активности
• Управление файловым хранилищем
• Отслеживание использования ИИ-моделей
• Логи для отладки

Интересные моменты стрима:

⚡️ Разработчики импровизировали и добавляли функции по запросам зрителей
⚡️ Показали загрузку изображений для контекста ИИ-генерации
⚡️ Продемонстрировали интеграцию с платежными системами
⚡️ Обсудили планы по поддержке других провайдеров платежей

Технические детали:

🔧 Хостинг: преимущественно в ЕС для соответствия GDPR
🔧 Модели: Google Gemini бесплатно до конца недели
🔧 Совместимость: полная поддержка Supabase сохранена
🔧 Производительность: улучшения на 20% с новой Claude 4.5

Ценообразование остается доступным:

💰 $25/месяц включенного использования Cloud
💰 $1/месяц включенного использования AI
💰 Оплата только при превышении лимитов

Стрим показал, насколько упростилось создание полнофункциональных приложений с ИИ — от идеи до работающего продукта за один сеанс без написания кода и настройки инфраструктуры.

• Подробный интерактивный транскрипт стрима (с промптами) здесь.
• Краткая нарезка наиболее интересных моментов (3 мин) - прикреплена к заметке.

@llm_notes

#lovable #livestream #vibecoding #ai #cloud #transcript

👍6❤1

641 viewsedited 19:24

Заметки LLM-энтузиаста

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 GenSpark представил Custom Super Agent

Компания GenSpark AI анонсировала новую функцию Custom Super Agent, которая позволяет создавать персонализированных AI-агентов с помощью одного текстового запроса.

Главная фишка:
Агенты задействуют всю мощь инструментов GenSpark AI. По сути, в таких агентов можно "заворачивать" готовые шаблоны для решения сложных задач и даже мульти-агентные цепочки с deep research, генерацией изображений и видео.

Основные возможности:

• Создание ИИ-агентов для различных задач: еженедельные отчеты (например, по AI-индустрии), ежедневный анализ акций, генерация мемов, генерация обучающих курсов по разным тематикам, анализ CV под вакансию и т.д.
• Простое создание через текстовое описание задачи
• Повторное использование созданных агентов
• Возможность упоминания агентов в любом месте платформы через @

Совместное использование:

📤 Теперь такими супер-агентами пользователи GenSpark могут делиться друг с другом!
🔍 Поиск и использование агентов в Custom Super Agent Store
📌 Добавление понравившихся агентов в закладки
💳 Если используете чужого агента (а по сути автоматизированную мульти-агентную цепочку, опирающуюся на все возможности GenSpark), то он расходует кредиты вашей учетной записи

Хакатон (15-21 октября):
Проходит хакатон по созданию кастомных агентов с призовым фондом в виде кэша ($500 или $1000) или кредитов платформы. Детали есть на скриншоте.

Пример из практики:
Я создал и разместил в Custom Super Agent Store ИИ-агента "MoneyPrinter AI Video Generator", который анализирует трендовые новости по AI, выбирает наиболее виральные, генерирует скрипт и видео-ролик в выбранном формате для соцсетей. Пример работы данного агента я прикрепил к заметке. Cебестоимость 30 сек ролика получилась порядка 5000-6000 кредитов (в следующий раз замерю точнее), это около $5.

В итоге получается мощный инструмент для создания и обмена агентными цепочками между пользователями в рамках платформы Genspark. Не хватает только API или MCP-интерфейса, чтобы созданных ИИ-агентов использовать внутри своих приложений.

@llm_notes

#genspark #agents #custom #multiagent #hackathon

1❤6👍1

544 views18:29

Заметки LLM-энтузиаста

🚀 Manus 1.5: Обновление ИИ-платформы для разработки

Компания Manus выпустила версию 1.5 своей платформы с несколькими значимыми улучшениями.

Основные изменения:

⚡️ Ускоренный движок — задачи выполняются заметно быстрее благодаря оптимизации архитектуры

🎯 Повышенное качество вывода — интерфейсы, переходы и выравнивание стали более профессиональными и точными

📊 Неограниченный контекст — возможность работы с крупными проектами без потери данных и истории, что упрощает командную работу (немного про то, как manus делает context engineering, будет в следующей заметке)

🛠 App Builder — создание полноценных приложений с фронтендом, серверной логикой, базой данных и аутентификацией по одному запросу.

Я с использованием этого App Builder в 1 промпт сделал приложение по генерации картинок при помощи YandexART и Nano Banana (на выбор), результаты можно посмотреть в комментариях. Можно сравнить с приложением от Lovable, которое мной создавалось по тому же промпту чуть ранее.
Мне результат от Manus App Builder очень понравился. Похоже, что у нас есть новый лидер Vibe Coding'а с самым низким порогом входа. Весь предварительный ресерч, подготовка PRD и спецификации на разработку - все делается автоматически. Особенно меня порадовало, что добавить YandexART в этот генератор картинок оказалось предельно просто:

добавь пожалуйста поддержку модели yandexart с необходимостью ввода credentials: folder id и api key (добавь ссылку на инструкцию где их взять https://telegra.ph/Kak-i-otkuda-brat-kredy-dlya-dostupa-k-YandexGPT-10-09)

.
Чуть позже я напишу в комментариях как с добавленим YandexART справился Lovable и Genspark AI Developer.
Пару дней назад я для демонстрации заказчику делал простенького веб-бота на базе yandexart (исходники здесь) , использовал: Github Codespaces, claude code (частично онлайн claude code в рамках бета тестирования), а также поиск рабочих код-снипетов в yandex cloud ml sdk и примерно представляю уровень неудобств. К слову, онлайн Codex так и не смог мне сгенерировать рабочий код такого бота.

🖼 Генерация и поиск изображений — интеграция с пониманием намерений пользователя

Для кого актуально:

1️⃣ Разработчики, работающие с ИИ-инструментами
2️⃣ Команды, создающие веб-приложения
3️⃣ Специалисты по автоматизации процессов
4️⃣ Пользователи, работающие с большими объемами данных

Обновление направлено на повышение производительности и расширение возможностей платформы для решения сложных задач разработки.
Если к этому добавить еще возможность отправки задач в manus по email, интеграцию manus с внешними инструментами и зарождающийся в документации API интерфейс к продукту, то Manus в скором времени может стать самым крутым универсальным ИИ-помощником. Который можно будет использовать и в "личном" общении, и в программном коде.

@llm_notes

#manus #ai #vibecoding #automation #productivity #app

Заметки LLM-энтузиаста Chat

или вот еще вариант приложения - "генератор изображений"
приложение генерируется в "одно касание" без необходимости что-то траблшутить

вот такой исходный промпт:
🚀 Создайте приложение-генератор изображений на базе ИИ с Google Gemini Nano
Используйте новейшую…

❤2

472 viewsedited 08:21

Заметки LLM-энтузиаста

🤖 Claude Skills: новый способ расширения возможностей ИИ

Anthropic представила Claude Skills — систему для добавления специализированных навыков в модель Claude. Это простой, но эффективный подход к созданию ИИ-агентов.

Что такое Skills? 📁
Skills — это папки с инструкциями в формате Markdown, дополнительными скриптами и ресурсами. Claude загружает нужный навык только когда он релевантен задаче.

Как это работает:
• Каждый навык содержит YAML-метаданные с описанием
• Полные инструкции загружаются только при необходимости
• Экономия токенов: каждый навык занимает всего несколько десятков токенов в контексте

Примеры применения: 💡
• Создание документов (PDF, Word, Excel, PowerPoint)
• Генерация анимированных GIF для Slack
• Работа с данными и их визуализация
• Следование корпоративным стандартам

Преимущества перед MCP: ⚡️
• Простота: обычные Markdown-файлы вместо сложного протокола
• Эффективность: не требует тысяч токенов контекста
• Универсальность: работает с любыми моделями, поддерживающими выполнение кода

Технические требования: 🔧
Skills требуют доступа к файловой системе и возможности выполнения команд. Это делает их мощными, но требует безопасной песочницы.

Перспективы развития: 🚀
Простота создания и распространения Skills может привести к быстрому росту экосистемы специализированных навыков для ИИ-агентов.

Документация: docs.claude.com/en/docs/agents-and-tools/agent-skills/overview
Github: https://github.com/anthropics/skills
Статья в инженерном блоге: https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

@llm_notes

#claude #agents #anthropic #skills #tools #mcp

🔥3❤1

422 views11:30

Заметки LLM-энтузиаста

6:48

Media is too big

VIEW IN TELEGRAM

🧠 Контекстная инженерия для AI-агентов: практические уроки от LangChain и Manus

В этот вторник на youtube канале Langchain опубликовали, пожалуй, один из лучших глубоких разборов контекстной инженерии в сети — часовой мастер-класс с реальными инсайтами от LangChain и Manus. Рассматриваются продвинутые техники для AI-агентов: выгрузка, сжатие и изоляция контекста, плюс свежий взгляд на многоуровневые пространства действий. Много практических выводов, никакой воды.
В продолжении темы подкаста про "Контекст-инжиниринг для AI-агентов: 5 ключевых принципов", который я разбирал в заметках ранее, команды LangChain и Manus провели детальный разбор одной из ключевых проблем современных AI-агентов — управления контекстом. Делюсь главными выводами.

🔍 Суть проблемы

AI-агенты накапливают огромное количество контекста через вызовы инструментов. Типичная задача требует ~50 вызовов, продакшн-агенты могут делать сотни ходов. При этом производительность моделей падает с ростом контекста — классический парадокс.

⚙️ Пять основных подходов к решению:

🔸 Выгрузка контекста — перенос данных в файловую систему вместо хранения в истории сообщений

🔸 Сокращение контекста — суммирование или сжатие информации (Claude 4.5 уже поддерживает из коробки)

🔸 Извлечение контекста — индексирование + семантический поиск vs простые файловые инструменты

🔸 Изоляция контекста — разделение между под-агентами с собственными контекстными окнами

🔸 Кэширование контекста — переиспользование вычислений

💡 Практические находки от Manus:

Компактизация vs Суммирование
• Компактизация — обратимое сжатие (убираю данные, которые можно восстановить из файлов)
• Суммирование — необратимое, но с сохранением ключевой информации в файлах

Многоуровневое пространство действий
1️⃣ Вызов функций — базовые атомарные операции
2️⃣ Утилиты песочницы — предустановленные команды Linux
3️⃣ Пакеты и API — Python-скрипты для сложных вычислений

Два паттерна изоляции контекста:
• Коммуникация — под-агент получает только инструкцию
• Разделение памяти — под-агент видит всю историю, но имеет свой промпт

📊 Практические советы:

• Используй структурированные схемы вместо свободного суммирования
• Приоритизируй форматы на основе строк для удобства grep/поиска
• Не превышай ~30 инструментов в контексте
• Тестируй архитектуру переключением между моделями разной силы
• Избегай чрезмерной инженерии — простота часто работает лучше

🎯 Главный вывод

Контекстная инженерия — это баланс между конфликтующими целями. Цель не в создании сложных систем, а в упрощении работы модели. Самые большие улучшения часто приходят от удаления лишнего, а не добавления нового.

📹 Дополнительно

• Оригинальное видео (1 час) по ссылке
• Краткая (7 мин) видео-нарезка основных тезисов обсуждения - прикрепил к заметке
• Интерактивный транскрипт с исходниками презентаций здесь (очень рекомендую хотя бы "пробежаться глазами" если нет времени смотреть оригинальное видео - там много интересных инсайтов)

@llm_notes

#context_engineering #agents #langchain #prompt_engineering #llm_optimization #manus #transcript

❤‍🔥6❤4👍2

533 viewsedited 13:34

Заметки LLM-энтузиаста

GenSpark AI Developer 2.0: создание мобильных приложений одной командой 📱

GenSpark опять вырывается вперед, представляя обновленную версию AI Developer 2.0 — которая содержит встроенные инструменты для разработки нативных мобильных приложений с помощью текстовых запросов (см. скриншот)

Основные возможности:

• Создание игр и бизнес-приложений по текстовому описанию
• Автоматическая интеграция с Firebase для работы с базами данных
• Подключение Google Analytics для отслеживания метрик
• Генерация готовых пакетов для публикации в Google Play

Примеры использования:

1️⃣ Мобильные игры — платформа создает работающую игру за несколько минут по простому описанию

2️⃣ Бизнес-приложения — например, приложение для спортзала с системой бронирования занятий

3️⃣ Интеграция с сервисами — автоматическое подключение баз данных и аналитики

Процесс разработки:
• Выбор типа приложения (нативное)
• Описание идеи в текстовом виде
• Автоматическая генерация кода и интерфейса
• Тестирование и подготовка к публикации

Публикация приложений:
В примере на видео показывается процесс публикации в Google Play — система генерирует готовый пакет для загрузки.
Я подготовил подробную интерактивную инструкцию по ссылке
Для публикации в App Store нужно скачать код, скомпилировать локально и отправить на модерацию. Подробное руководство по App Store будет доступно позже 📲

Инструмент позиционируется как решение для пользователей без опыта программирования, которые хотят создать собственное мобильное приложение 🚀

Для тех, кто хочет повторить примеры из видео
Привожу промпты, которые там использовались:

build a halloween candy catch game

create a modern fitness course booking application using Firebase as the backend

Сейчас из-за наплыва желающих может наблюдаться перегрузка Flutter Sandbox, у меня на момент тестирования не получилось сгенерировать мобильное приложение. Надеюсь, что это временные трудности и разработчики их исправят.

@llm_notes

#mobile #vibecoding #firebase #genspark #app

👍7❤1🔥1

605 views18:40

Заметки LLM-энтузиаста

🚀 Полезные материалы по RAG/GitHub и новый поток курса по ИИ-прототипам и вайб-кодингу!

——————————————————————————
Чтобы не затерялось хотел бы поделиться ссылками на интерактивныe материалы по RAG (в дополнении к заметке) и GitHub-инструментам, которые готовил для разных мероприятий в этом году.

📚 Полезные материалы по RAG:
• https://dzhechko.github.io/yc-rag-lecture-intro/
• https://rag-sandbox-guide.pages.dev

🔧 GitHub инструменты:
• https://github-ecosystem-guide.pages.dev/

🔑 Коды доступа к продвинутому курсу:

`llmnotes2024`
`github-premium`
`advanced-course`
`telegram-llm`

💡 Как использовать код:
• Перейдите к разделу "Продвинутый курс"
• Введите код в поле "Введите код доступа"
• Нажмите "Проверить"
• Откроется доступ к курсу

——————————————————————————

И приглашаю всех желающих 29 октября (в эту среду) на пятый поток курса по "ИИ-прототипам и вайб-кодингу", где за 8 занятий мы будем копировать киллер-фичи успешных стартапов с оценкой свыше $1B! 💰

🎯 Что будем делать:
За 2 часа работы в Cursor/Lovable/Replit/Claude Code воссоздаем основные функции каждой компании-единорога

🦄 Список компаний для копирования:

1️⃣ MindTickle ($1.2B) - ИИ-тренажер для продавцов (делали в прошлом потоке)
2️⃣ Yuanfudao ($15.5B) - ИИ-репетитор
3️⃣ G2 ($1.1B) - Отзовик по B2B-SaaS-сервисам
4️⃣ OnlyFans ($8B) - Платный контент для взрослых
5️⃣ Outreach ($4.4B) - Поиск b2b-лидов и письма им
6️⃣ Whatnot ($5B) - Живые аукционы
7️⃣ BetterUp ($4.7B) - ИИ-коучинг и менторинг в компаниях
8️⃣ Guild ($4.4B) - Корпоративное обучение
9️⃣ DeepL ($2B) - Синхронный перевод

Теперь этим компаниям-единорогам стоит опасаться конкуренции! 😄

📈 Бонус: еще с десяток проектов из прошлых наборов будут доступны в записи!

📝Официальный анонс здесь
📝 Регистрация: https://productuniversity.ru/cursor
🎮 Интерактив: https://quest.productuniversity.ru/
(пройдя интерактив, вы получите ссылку на запись свежего видео-обзора лучших AI-инструментов для Vibe Coding'а)

Отличная возможность запустить свой стартап или внутренний проект! 🚀

@llm_notes

#rag #vibecoding #github #courses #startup

rag-sandbox-guide.pages.dev

RAG Семинар - Retrieval Augmented Generation

Изучите RAG с нуля: архитектура, векторный поиск, практические примеры с Yandex Foundation Models

❤2

545 views16:55

Заметки LLM-энтузиаста

🤖 Microsoft выпустила Agent Lightning — фреймворк для обучения ИИ-агентов с помощью обучения с подкреплением

Многие ИИ-агенты отлично работают в демо, но проваливаются в реальных сценариях с многоэтапными задачами, приватными данными и незнакомыми инструментами. Промпт-инжиниринг не всегда надежен и имеет свои ограничения.

Microsoft представила Agent Lightning — открытый фреймворк, который обучает ИИ-агентов методом обучения с подкреплением практически без изменений в существующем коде.
Хотя, например, авторы Manus считают, что излишнее усложнение агентов путем дообучения моделей - это ловушка, которой следует избегать (см. интерактивный транскрипт из заметки)

🔧 Как это работает:
ИИ-агент работает в обычном режиме, а фреймворк перехватывает поток выполнения. Он фиксирует каждый вызов LLM, обращение к инструментам и сигналы вознаграждения в виде структурированных блоков данных, а затем передает эти данные в алгоритмы оптимизации, которые реально улучшают производительность агента.

⚡️ Основные возможности:

1️⃣ Простая интеграция — добавьте трейсер в существующий код агента и начните собирать данные для обучения. Система автоматически инструментирует вызовы LLM без переписывания под конкретные фреймворки

2️⃣ Множественные методы оптимизации — выбирайте между обучением с подкреплением с интеграцией VERL для файн-тюнинга модели или автоматической оптимизацией промптов

3️⃣ Независимая архитектура масштабирования — запускайте десятки воркеров на CPU-машинах, пока обучение происходит на GPU-кластерах

4️⃣ Мониторинг в продакшене — встроенное логирование отслеживает каждое решение агента, вызов LLM и сигнал вознаграждения через OpenTelemetry

🔗 Совместимость:
Работает с любыми фреймворками для ИИ-агентов: LangChain, OpenAI Agent SDK, AutoGen, CrewAI, Microsoft Agent Framework, или даже без фреймворка (чистый Python OpenAI).

📊 Преимущество RL над обучением с учителем:
Обучение с подкреплением требует только сигналы результата (задача решена/провалена), в то время как обучение с учителем требует детальных аннотаций для каждого шага каждой задачи, что крайне дорого для интерактивных сценариев.

🔬 Подробнее:
• GitHub: https://github.com/microsoft/agent-lightning
• Документация: https://microsoft.github.io/agent-lightning/latest/
• DeepWiki: https://deepwiki.com/microsoft/agent-lightning

@llm_notes

#reinforcement_learning #rl #agents #microsoft #machine_learning #ml #llm

❤2🔥1

651 viewsedited 18:18

Заметки LLM-энтузиаста

🚀 Cursor 2.0: новая версия AI-редактора кода

Только вчера на первом занятии пятого потока курса по "ИИ-прототипам и вайб-кодингу" (который исторически назывался курсом по Cursor) обсуждали, чем Cursor лучше других ИИ-кодеров, и мне ничего кроме возможности работы с ним без VPN (что во время блокировок может быть настоящей killer-фичей) в голову не пришло, а уже сегодня команда Cursor выпустила крупное обновление своего AI-редактора с несколькими значимыми нововведениями.

🤖 Composer — собственная модель для кодирования
Cursor представил новую собственную модель для программирования (если помните, раньше уже была внутри Cursor модель похожего плана, она называлась Cursor, но, судя по всему, ей особо никто не пользовался, я уж точно). По заявлениям разработчиков, новая модель работает в 4 раза быстрее аналогичных решений и выполняет большинство задач менее чем за 30 секунд. Имеет смысл потестировать на реальных проектах.
Собственная модель для написания кода - логичный шаг для любого вендора коммерческих решений по Vibe Coding, иначе с развитием качественных решений такого плана от вендоров LLM (openai/anthropic/google) ценность нишевых решений будет падать.

👥 Мультиагентный интерфейс
• Новый интерфейс, ориентированный на работу с агентами
• Возможность запуска до 8 агентов параллельно
• Изоляция агентов через Git worktrees или удаленные машины
• Возможность сравнения результатов работы разных моделей

🌐 Встроенный браузер
Браузер теперь интегрирован в редактор с инструментами для выбора элементов, полными dev tools и MCP-контролами для агента.
Теперь есть паритет по данной функциональности с Windsurf, которые выпустили встроенный браузер в начале лета этого года (подробнее в заметке по ссылке)
Остается еще добавить удобный деплой, хостинг и мониторинг приложений в облаке, через интеграцию с кем-то из существующих вендоров: cloudflare (как сделали ребята из Genspark), aws/gcp (как сделано в leap.new), netlify (как сделали ребята из Windsurf), можно сделать шаблоны для railway / fly.io / и т.д. или сделать такое "облако" для деплоя самим, как поступили ребята из lovable - и тогда Cursor действительно можно будет считать самым удобным инструментом для вайб-кодинга.

📋 Улучшенный код-ревью
Все изменения агента по кодовой базе теперь отображаются в одном месте, без необходимости переключаться между файлами.

🎙 Голосовой режим
Добавлена поддержка голосового управления с встроенным преобразованием речи в текст.

⚡️ Другие улучшения:
1️⃣ Повышена производительность языковых серверов
2️⃣ Улучшена отрисовка текста
3️⃣ Добавлены deeplink для правил и команд
4️⃣ Режим планирования для фоновых агентов
5️⃣ Новые средства безопасности для корпоративных пользователей

Cursor 2.0 доступен для загрузки на официальном сайте.
Я обновился через уведомление в старой версии.

@llm_notes

Источники:
• https://cursor.com/changelog/2-0
• https://cursor.com/blog/composer

#cursor #vibecoding #development #programming

👍2🔥1

439 views05:25

Заметки LLM-энтузиаста

🚀 Cognition представила SWE-1.5 — новую модель для разработки ПО

Не успели мы порадоваться новой модели для кодинга от Cursor, как компания Cognition (которая этим летом купила Windsurf) анонсировала выпуск SWE-1.5 - специализированной модели для кодинга с сотнями миллиардов параметров.

Модель показывает производительность на уровне GPT-5-high в бенчмарке SWE-Bench Pro, работая при этом в 6 раз быстрее Haiku 4.5 и в 13 раз быстрее Sonnet 4.5.

🔧 Ключевые особенности:

• Скорость до 950 токенов в секунду благодаря партнерству с Cerebras
• Обучение с подкреплением на реальных задачах программирования (именно RL и помог сделать модель такой классной)
• Интеграция в IDE Windsurf
• Обучение на кластере GB200 NVL72 (возможно, первая публичная модель, прошедшая обучение на таком "железе")

📊 Подход к обучению:

1️⃣ Создание собственного датасета, отражающего реальные задачи разработчиков
2️⃣ Три механизма оценки: классические тесты, рубрики качества кода и агентная проверка
3️⃣ Процесс "reward hardening" для предотвращения обхода системы оценки
4️⃣ Совместная оптимизация модели и агентной системы

⚡️ Практическое применение:

• Изучение больших кодовых баз (используется в функциональности Codemaps, которая строит иерархические карты кодовых баз)
• Создание full-stack приложений
• Редактирование конфигураций
• Задачи, которые раньше занимали 20 секунд, теперь выполняются за 5 секунд

Модель доступна в последней версии Windsurf. Разработчики отмечают, что SWE-1.5 устраняет необходимость выбирать между скоростью и качеством работы ИИ-помощника.

🔗 Источники:
• [Официальный блог Cognition]
• [Скачать Windsurf]

@llm_notes

#windsurf #swe15 #cognition #vibecoding #ai #programming

❤2

1.12K viewsedited 13:24

Заметки LLM-энтузиаста

🤖 LangChain запускает свой Agent Builder — конструктор ИИ-агентов без кода

LangChain представил LangSmith Agent Builder в закрытом превью — платформу для создания ИИ-агентов без необходимости писать код. Теперь создавать автономных агентов смогут не только разработчики.

Что отличает от конкурентов:

🔹 Это не визуальный конструктор workflow, а именно агент-билдер
🔹 Агенты принимают решения динамически, а не следуют заранее заданному пути
🔹 Встроенная система памяти — агент запоминает исправления и применяет их в будущем

Ключевые возможности:

1️⃣ Разговорная настройка — описываете задачу простым языком, система задает уточняющие вопросы и автоматически генерирует промпты

2️⃣ Адаптивная память — агенты обновляют свои инструкции на основе ваших корректировок без ручного редактирования

3️⃣ Интеграция с сервисами — подключение к Gmail, Slack, Linear, LinkedIn через OAuth и MCP

4️⃣ Agent Inbox — мониторинг всех потоков агентов с индикаторами статуса и уведомлениями

Архитектура агента включает:

• Промпт — логика и описание задач агента
• Инструменты — подключение к внешним сервисам через MCP
• Триггеры — автоматический запуск по событиям или расписанию
• Субагенты — разделение сложных задач на специализированные модули

Платформа подходит для внутренних задач: email-ассистенты, чат-боты, интеграция с Salesforce. Например, агент может ежедневно присылать сводку встреч или создавать задачи в Linear на основе писем.

В целом, все это можно сделать и в том же manus.im через интеграционную связку "отправка задания по email" в manus, внутри которого предварительно настроены нужные mcp-серверы.
Но если вы хотите влиять на архитектуру agent flow и в дальнейшем мониторить его состояние, то LangSmith Agent Builder подойдет лучше, чем универсальная система вроде manus.im.
Получается, LangSmith Agent Builder - это что-то вроде lovable/replit для построения мульти-агентной системы.
Кстати, вот еще один вариант системы такого плана, но которую можно потестировать и без private preview (я ее использовал в третьем потоке курса по ИИ-прототипированию для быстрого создания мульти-агентных цепочек).

Источники:
📝 [Официальный блог LangChain]
🎥 [Демо на YouTube]

@llm_notes

#agents #langchain #automation #productivity #builder

🔥3❤‍🔥2❤1

627 viewsedited 19:16

Заметки LLM-энтузиаста

🔧 Новый подход к оптимизации MCP-агентов от Anthropic

Команда Anthropic Engineering пару дней назад опубликовала интересную статью, посвященную решению двух основных проблем MCP-агентов: высокой стоимости токенов и задержек.

Суть проблемы:
Все определения инструментов загружаются в контекст заранее, а каждый промежуточный результат требует обращения к модели, даже при простом перемещении данных.

Предложенное решение:
Представить MCP-серверы как код-API в файловой структуре, дать агенту среду выполнения кода и позволить ему писать программы для взаимодействия с инструментами. Так уже некоторое время назад поступает Manus (см. заметку и более подробный интерактивный транскрипт)

Ключевые преимущества:

🔄 Прогрессивная (постепенная) загрузка инструментов
Агент исследует файловое дерево серверов по требованию, загружая только нужные определения инструментов

📊 Фильтрация данных в среде выполнения
Обработка больших датасетов непосредственно в коде. Из 10,000 строк таблицы агент видит только 5 отфильтрованных записей

⚡️ Управление потоком действий без трат токенов
Циклы, условия и обработка ошибок выполняются как код, а не цепочки отдельных вызовов инструментов

🔒 Приватные потоки данных
Промежуточные результаты остаются в среде выполнения, модель видит только то, что явно логируется

💾 Постоянные навыки и состояние
Сохранение рабочего кода как переиспользуемых функций в директории ./skills/

Сравнение с Cloudflare Code Mode:

1️⃣ Обнаружение инструментов:
• Cloudflare: загружает все TypeScript определения заранее
• Anthropic: файловая система с прогрессивным раскрытием

2️⃣ Эффективность контекста:
• Cloudflare: определения типов загружаются изначально
• Anthropic: сокращение токенов на 98.7% за счет загрузки только необходимых определений

3️⃣ Применение:
• Cloudflare: готовая инфраструктура на их платформе
• Anthropic: кастомные архитектуры агентов с акцентом на эффективность

Подход использует сильные стороны LLM (написание кода) для устранения их слабостей (управление контекстным окном).

Источники:
📖 [Оригинальная статья Anthropic]
🔗 [Cloudflare Code Mode]

Также подготовил для вас:
🌐 [Интерактивный гайд на русском языке]

@llm_notes

#mcp #anthropic #ai #agents #optimization #llm_efficiency

👍3❤1

421 views16:55

About

Blog

Apps

Platform