ChatGPT Agent: новый инструмент для автоматизации задач 🤖
OpenAI представила ChatGPT Agent — он объядиняет возможности Operator и Deep Research в единой системе. Логичный шаг, теперь у Openai есть агент, который может самостоятельно выполнять сложные задачи, используя браузер, терминал и различные API.
Небольшое отступление. По сути, все эти задачи можно решить и без ChatGPT Agent, настроив в любом AI-кодере, у которого есть доступ к терминалу, необходимый набор MCP-серверов, но если серверов много - можно наткнуться на лимиты по количеству инструментов (как наример, в Cursor) или же AI-кодер может просто "запутаться" в количесте MCP-инструментов и начать делать что-то не то. Выход из такого положения тоже есть:
1) поместить инструкции по применению MCP-инструментов в системный промпт (rules-файлы)
2) использовать MCP-агрегаторы со встроенным RAG по списку MCP-инструментов наподобие ACI.DEV (отлично справляется в случае с Cursor, когда есть лимиты на количество MCP-tools, и что круто - этот инструмент может быть установлен локально!)
Судя по всему, сам сценарий использования стал настолько популярен, что Openai решили пойти по пути создания pret-a-porter агента, который в данном контексте выигрывает за счет того, что не требует дополнительной "сборки" и настройки под описанный выше класс задач и будет удобнее для обычного пользователя, который далек от AI-программирования и не хочет вдаваться в детали настройки MCP.
Основные возможности:
• Анализ календаря и подготовка брифингов по встречам
• Планирование покупок и составление списков
• Создание презентаций и анализ конкурентов
• Бронирование и планирование поездок
• Работа с таблицами и документами
Технические особенности: ⚙️
🔹 Визуальный браузер для взаимодействия с веб-интерфейсами
🔹 Текстовый браузер для быстрого анализа контента
🔹 Доступ к терминалу для выполнения кода
🔹 Интеграция с Gmail, Google Calendar, GitHub (я полагаю, что в сравнении с MCP-интеграцией здесь преимущество в безопасности системы, за которую теперь отвечает openai, а не дуэт в составе автора MCP-сервера и команды anthropic, которая пишет спецификацию MCP-протокола)
🔹 Возможность создания презентаций и таблиц (это уже относительно давно есть в manus и genspark)
Результаты тестирования: 📊
1️⃣ Humanity's Last Exam: 41.6% (новый рекорд)
2️⃣ FrontierMath: 27.4% точности
3️⃣ SpreadsheetBench: 45.5% при работе с файлами
4️⃣ BrowseComp: 68.9% (+17.4% к предыдущим результатам)
Безопасность и ограничения: ⚠️
Система требует подтверждения для критических действий и защищена от prompt injection атак. Пользователи могут в любой момент прервать выполнение задачи или взять управление на себя.
Доступность:
• Pro пользователи: 400 запросов/месяц
• Plus и Team: 40 запросов/месяц
• Постепенный запуск в течение нескольких дней
Функция пока недоступна в ЕС и Швейцарии.
Я пока тоже доступ не получил.
Разработчики планируют регулярные улучшения системы.
Полезные ссылки для просмотра:
- Введение в ChatGPT Agent
- Кастомизация ChatGPT Agent
@llm_notes
#chatgpt #agents #openai #automation #productivity
OpenAI представила ChatGPT Agent — он объядиняет возможности Operator и Deep Research в единой системе. Логичный шаг, теперь у Openai есть агент, который может самостоятельно выполнять сложные задачи, используя браузер, терминал и различные API.
Небольшое отступление. По сути, все эти задачи можно решить и без ChatGPT Agent, настроив в любом AI-кодере, у которого есть доступ к терминалу, необходимый набор MCP-серверов, но если серверов много - можно наткнуться на лимиты по количеству инструментов (как наример, в Cursor) или же AI-кодер может просто "запутаться" в количесте MCP-инструментов и начать делать что-то не то. Выход из такого положения тоже есть:
1) поместить инструкции по применению MCP-инструментов в системный промпт (rules-файлы)
2) использовать MCP-агрегаторы со встроенным RAG по списку MCP-инструментов наподобие ACI.DEV (отлично справляется в случае с Cursor, когда есть лимиты на количество MCP-tools, и что круто - этот инструмент может быть установлен локально!)
Судя по всему, сам сценарий использования стал настолько популярен, что Openai решили пойти по пути создания pret-a-porter агента, который в данном контексте выигрывает за счет того, что не требует дополнительной "сборки" и настройки под описанный выше класс задач и будет удобнее для обычного пользователя, который далек от AI-программирования и не хочет вдаваться в детали настройки MCP.
Основные возможности:
• Анализ календаря и подготовка брифингов по встречам
• Планирование покупок и составление списков
• Создание презентаций и анализ конкурентов
• Бронирование и планирование поездок
• Работа с таблицами и документами
Технические особенности: ⚙️
🔹 Визуальный браузер для взаимодействия с веб-интерфейсами
🔹 Текстовый браузер для быстрого анализа контента
🔹 Доступ к терминалу для выполнения кода
🔹 Интеграция с Gmail, Google Calendar, GitHub (я полагаю, что в сравнении с MCP-интеграцией здесь преимущество в безопасности системы, за которую теперь отвечает openai, а не дуэт в составе автора MCP-сервера и команды anthropic, которая пишет спецификацию MCP-протокола)
🔹 Возможность создания презентаций и таблиц (это уже относительно давно есть в manus и genspark)
Результаты тестирования: 📊
1️⃣ Humanity's Last Exam: 41.6% (новый рекорд)
2️⃣ FrontierMath: 27.4% точности
3️⃣ SpreadsheetBench: 45.5% при работе с файлами
4️⃣ BrowseComp: 68.9% (+17.4% к предыдущим результатам)
Безопасность и ограничения: ⚠️
Система требует подтверждения для критических действий и защищена от prompt injection атак. Пользователи могут в любой момент прервать выполнение задачи или взять управление на себя.
Доступность:
• Pro пользователи: 400 запросов/месяц
• Plus и Team: 40 запросов/месяц
• Постепенный запуск в течение нескольких дней
Функция пока недоступна в ЕС и Швейцарии.
Я пока тоже доступ не получил.
Разработчики планируют регулярные улучшения системы.
Полезные ссылки для просмотра:
- Введение в ChatGPT Agent
- Кастомизация ChatGPT Agent
@llm_notes
#chatgpt #agents #openai #automation #productivity
🔥2❤1🤔1
🚀 RAG на практике: создаем ИИ-помощников с нуля
На прошлой неделе я проводил занятие по RAG (Retrieval Augmented Generation) на курсе "Менеджер ИИ-продуктов" в Product University.
Специально к занятию собрал небольшой интерактивный курс по RAG, которым хотел бы поделиться с вами 👉 ссылка
К нему также "прикручен" ИИ-ассистент, который может проконсультировать по вопросам построения предметно-ориентированных вопросно-ответных систем (так по-умному называются ИИ-помощники :)
Что делали на практике:
• ИИ-помощники через OpenAI Assistant API
• ИИ-помощник на базе Yandex AI Assistant
• Flowse AI Assistant с векторной БД Pinecone
• Agent Flow Canvas
ИИ-помощник "прикручивался" к клону странички курса по AI-программированию (оригинал здесь) и тестировался вопросами по содержанию курса.
🔥 Приятное открытие: уже созданный OpenAI Assistant API можно просто загрузить во Flowise через OpenAI креды, затем выложить на Chatflow Canvas и опубликовать с крутыми опциями:
▫️ Rate Limit для безопасного инференса
▫️ Контроль адресатов подключения
▫️ Сбор и мониторинг обратной связи
▫️ Генерация лидов
💡 Преимущество Flowise: сразу получаешь рабочий код для виджета, который можно разместить на своем сайте. Именно им я и воспользовался, когда "прикручивал" ИИ-помощника к посадочной странице курса по RAG.
Тестирование AI-кодеров:
1️⃣ Lovable - справился с клонированием сайта по URL, но виджет от Flowise самостоятельно и без ошибок добавить не смог 😅 Пришлось вручную править код.
2️⃣ Bolt.new - выполнил задачу с первого раза! 💪 В bolt, кстати, появился режим "Discussion", который можно использовать для планирования изменений и создания "Implementation Plan", также добавилась встроенная библиотека промптов, в общем, инструмент меня неожиданно порадовал 😄
Именно на bolt.new я собрал финальную версию интерактивного курса по RAG.
К слову, lovable и здесь лажанулся: как я его ни уговаривал, он так и не смог сделать кликабельными ссылки на модули курса, пришлось даже пригрозить, что если он не решит задачу с очередной (пятой по счету) попытки, то я больше не будут им пользоваться - но все равно не помогло 😄
🏆 Yandex AI Assistant показал себя отлично - единственный понял, что в задаваемых вопросах слово "поток" означает "поток курса", остальные ассистенты упрямо писали, что вопрос не относится к курсам 😄
Полезный лайфхак: Flowise теперь можно развернуть из Yandex Cloud Marketplace и использовать YandexGPT через официальный OpenAI-совместимый API ! Так можно получить полностью локализованную в РФ версию ИИ-помощника, данные которого хранятся в инфраструктуре, которая выполняет требования ФЗ-152.
⚠️ Когда будете разворачивать flowise в Яндекс Облаке, то имейте ввиду, что дефолтная группа безопасности не открывает доступ по порту TCP 3000, поэтому применяйте кастомную группу с настройками
@llm_notes
#rag #aiassistants #flowise #yandexgpt #lovable #bolt #openai
На прошлой неделе я проводил занятие по RAG (Retrieval Augmented Generation) на курсе "Менеджер ИИ-продуктов" в Product University.
Специально к занятию собрал небольшой интерактивный курс по RAG, которым хотел бы поделиться с вами 👉 ссылка
К нему также "прикручен" ИИ-ассистент, который может проконсультировать по вопросам построения предметно-ориентированных вопросно-ответных систем (так по-умному называются ИИ-помощники :)
Что делали на практике:
• ИИ-помощники через OpenAI Assistant API
• ИИ-помощник на базе Yandex AI Assistant
• Flowse AI Assistant с векторной БД Pinecone
• Agent Flow Canvas
ИИ-помощник "прикручивался" к клону странички курса по AI-программированию (оригинал здесь) и тестировался вопросами по содержанию курса.
🔥 Приятное открытие: уже созданный OpenAI Assistant API можно просто загрузить во Flowise через OpenAI креды, затем выложить на Chatflow Canvas и опубликовать с крутыми опциями:
▫️ Rate Limit для безопасного инференса
▫️ Контроль адресатов подключения
▫️ Сбор и мониторинг обратной связи
▫️ Генерация лидов
💡 Преимущество Flowise: сразу получаешь рабочий код для виджета, который можно разместить на своем сайте. Именно им я и воспользовался, когда "прикручивал" ИИ-помощника к посадочной странице курса по RAG.
Тестирование AI-кодеров:
1️⃣ Lovable - справился с клонированием сайта по URL, но виджет от Flowise самостоятельно и без ошибок добавить не смог 😅 Пришлось вручную править код.
2️⃣ Bolt.new - выполнил задачу с первого раза! 💪 В bolt, кстати, появился режим "Discussion", который можно использовать для планирования изменений и создания "Implementation Plan", также добавилась встроенная библиотека промптов, в общем, инструмент меня неожиданно порадовал 😄
Именно на bolt.new я собрал финальную версию интерактивного курса по RAG.
К слову, lovable и здесь лажанулся: как я его ни уговаривал, он так и не смог сделать кликабельными ссылки на модули курса, пришлось даже пригрозить, что если он не решит задачу с очередной (пятой по счету) попытки, то я больше не будут им пользоваться - но все равно не помогло 😄
🏆 Yandex AI Assistant показал себя отлично - единственный понял, что в задаваемых вопросах слово "поток" означает "поток курса", остальные ассистенты упрямо писали, что вопрос не относится к курсам 😄
Полезный лайфхак: Flowise теперь можно развернуть из Yandex Cloud Marketplace и использовать YandexGPT через официальный OpenAI-совместимый API ! Так можно получить полностью локализованную в РФ версию ИИ-помощника, данные которого хранятся в инфраструктуре, которая выполняет требования ФЗ-152.
⚠️ Когда будете разворачивать flowise в Яндекс Облаке, то имейте ввиду, что дефолтная группа безопасности не открывает доступ по порту TCP 3000, поэтому применяйте кастомную группу с настройками
permit any any
, иначе не сможете подключиться по веб-интерфейсу к flowise.@llm_notes
#rag #aiassistants #flowise #yandexgpt #lovable #bolt #openai
productuniversity.ru
Менеджер ИИ-продуктов
2-х месячный курс. Делаем ИИ-продукты на базе GPT (ChatGPT и др.)
🔥5❤4
Media is too big
VIEW IN TELEGRAM
Qwen3-Code: новый конкурент Claude Code 🚀
Alibaba выпустила Qwen3-Code — модель для программирования с 480 миллиардами параметров (35 млрд активных). Модель поддерживает контекст до 256K токенов нативно и до 1M через экстраполяцию.
Ключевые особенности:
• Mixture of Experts архитектура
• Обучена на 7.5 триллионах токенов (70% код)
• Поддержка агентных задач: кодирование, браузер, инструменты
• Производительность сравнима с Claude Sonnet 4
Инструменты разработки: 🛠
1️⃣ Qwen Code — CLI инструмент (форк Gemini Code)
2️⃣ Интеграция с Claude Code — через API совместимость (подробности в блоге по ссылке)
3️⃣ Поддержка в Cline
Результаты тестирования:
• SWE-Bench Verified: выше Kimi K2 (которая при в 4-5 раз меньшей стоимости показывает результаты всего лишь немного хуже, чем Claude Sonnet 4), ниже Sonnet 4
• Хорошо справляется с задачами, где требуется использование внешних инструментов (tools)
• Более лаконичные ответы по сравнению с Kimi
Доступность и цены: 💰
✅ Бесплатно: chat.qwen.ai
✅ Дешево: Hyperbolic ($2), Parasail ($2-$3.5) - через openrouter.ai
❌ Дорого: официальный API ($6-60 за 1M токенов) и из РФ не так то просто завести учетку на alibabacloud (нужна не только карточка иностранного банка, но и иностранный мобильный номер при регистрации)
Ограничения:
• Пока доступна только большая модель (480B)
• Контекст 256K (больше, чем у Claude)
• Спорные результаты бенчмарков от разработчиков
Установка Qwen Code:
Модель показывает хорошие результаты в задачах AI-программирования, но требует осторожности при выборе провайдера API из-за разброса цен 📊
Теперь в случае когда Claude Sonnet сбоит (как это было на прошлой неделе), у нас есть неплохая замена: Qwen3-code и Kimi-2 (оба варианта можно использовать в Claude Code)
@llm_notes
#qwen #vibecoding #llm #programming #opensource
Alibaba выпустила Qwen3-Code — модель для программирования с 480 миллиардами параметров (35 млрд активных). Модель поддерживает контекст до 256K токенов нативно и до 1M через экстраполяцию.
Ключевые особенности:
• Mixture of Experts архитектура
• Обучена на 7.5 триллионах токенов (70% код)
• Поддержка агентных задач: кодирование, браузер, инструменты
• Производительность сравнима с Claude Sonnet 4
Инструменты разработки: 🛠
1️⃣ Qwen Code — CLI инструмент (форк Gemini Code)
2️⃣ Интеграция с Claude Code — через API совместимость (подробности в блоге по ссылке)
3️⃣ Поддержка в Cline
Результаты тестирования:
• SWE-Bench Verified: выше Kimi K2 (которая при в 4-5 раз меньшей стоимости показывает результаты всего лишь немного хуже, чем Claude Sonnet 4), ниже Sonnet 4
• Хорошо справляется с задачами, где требуется использование внешних инструментов (tools)
• Более лаконичные ответы по сравнению с Kimi
Доступность и цены: 💰
✅ Бесплатно: chat.qwen.ai
✅ Дешево: Hyperbolic ($2), Parasail ($2-$3.5) - через openrouter.ai
❌ Дорого: официальный API ($6-60 за 1M токенов) и из РФ не так то просто завести учетку на alibabacloud (нужна не только карточка иностранного банка, но и иностранный мобильный номер при регистрации)
Ограничения:
• Пока доступна только большая модель (480B)
• Контекст 256K (больше, чем у Claude)
• Спорные результаты бенчмарков от разработчиков
Установка Qwen Code:
npm i -g @qwen-code/qwen-code
Модель показывает хорошие результаты в задачах AI-программирования, но требует осторожности при выборе провайдера API из-за разброса цен 📊
Теперь в случае когда Claude Sonnet сбоит (как это было на прошлой неделе), у нас есть неплохая замена: Qwen3-code и Kimi-2 (оба варианта можно использовать в Claude Code)
@llm_notes
#qwen #vibecoding #llm #programming #opensource
1👍6
Заметки LLM-энтузиаста
#info #ai #tools Друзья, всем привет! Есть возможность очень сильно сэкономить на AI-инструментах, воспользовавшись вот этим офером https://www.lennysnewsletter.com/p/an-unbelievable-offer-now-get-one $200 за годовую подписку на 10 классных AI-инструментов…
🔥 Скидка на AI-инструменты возвращается!
Коллеги, всем привет! 👋
Для тех кто в апреле пропустил скидку на подписку на AI-инструменты есть возможность воспользоваться ей сейчас (https://www.lennysnewsletter.com/p/productpass)
💰 $200 или $350 за годовую подписку на 16 классных AI-инструментов (как правило, годовая подписка на 1-2 инструмента из списка стоит либо столько же, либо дороже)
Из апрельского списка "ушли" такие инструменты как v0, Cursor, Granola и Notion, но зато добавились такие интересные инструменты как:
🔧 n8n (https://n8n.io/) - самый популярный no-code инструмент для автоматизации процессов (я немного писал про работу с ним здесь и тут)
⚡️ Warp (https://www.warp.dev/) - кросс-платформенная агентная среда разработки, написанная на Rust (аналог Claude Code или Gemini CLI, но со своим UI)
🎨 Magic Patterns (https://www.magicpatterns.com/) - AI-инструмент для быстрого создания UI-прототипов, поддерживает командную работу и позиционируется для продуктовых команд
📋 ChatPRD (https://www.chatprd.ai/) - AI-инструмент для продукт-менеджеров, помогает создавать качественные PRDs (Product Requirement Document). Замечу, что для AI-программирования с моей точки зрения больше подойдет https://www.codeguide.dev/
🎬 Descript (https://www.descript.com/) - комплексная платформа для создания и редактирования видео и подкастов, которая использует AI для упрощения процесса создания контента
📊 Gamma (https://gamma.app/) - AI-инструмент для быстрого создания презентаций, документов и визуального контента
📱 Mobbin (https://mobbin.com/) - крупнейшая онлайн-библиотека UI/UX-паттернов и справочных материалов для дизайнеров и продуктовых команд. Бесплатные аналоги: https://dribbble.com/ и https://21st.dev/home (писал про него здесь)
🎤 Wispr Flow (https://wisprflow.ai/) - классный инструмент для транскрибации голоса в текст для мака, сам регулярно им пользуюсь при работе с AI-кодерами. У него есть бесплатный тир, которого при умеренном использовании может хватить
🔍 Raycast (https://www.raycast.ai/) - как я понял, это такой ИИ-помощник для мака: умный поиск, администрирование (можно дать ему доступ к календарю и файлам/папкам) и тому подобные вещи, похоже на AI-OS плагин. Скачивается только через VPN.
⚠️ Условия такие же: надо быть новым клиентом по выбранному продукту и не мешкать с активацией ключей. Если, конечно, не возьмете insider подписку за $350 - по ней пишут, что доступ к подпискам гарантированный.
Для тех кто уже как я оформлял подписку офер также действует - можно им воспользоваться на новые продукты из списка, но в связи со всплеском трафика соответствующая страничка (https://lennysproductpass.com/) недоступна
⏰ Главное через год не забыть отключить подписку, чтобы не получить продление по полной стоимости.
@llm_notes
#ai #tools #discount #productivity #automation #nocode
Коллеги, всем привет! 👋
Для тех кто в апреле пропустил скидку на подписку на AI-инструменты есть возможность воспользоваться ей сейчас (https://www.lennysnewsletter.com/p/productpass)
💰 $200 или $350 за годовую подписку на 16 классных AI-инструментов (как правило, годовая подписка на 1-2 инструмента из списка стоит либо столько же, либо дороже)
Из апрельского списка "ушли" такие инструменты как v0, Cursor, Granola и Notion, но зато добавились такие интересные инструменты как:
🔧 n8n (https://n8n.io/) - самый популярный no-code инструмент для автоматизации процессов (я немного писал про работу с ним здесь и тут)
⚡️ Warp (https://www.warp.dev/) - кросс-платформенная агентная среда разработки, написанная на Rust (аналог Claude Code или Gemini CLI, но со своим UI)
🎨 Magic Patterns (https://www.magicpatterns.com/) - AI-инструмент для быстрого создания UI-прототипов, поддерживает командную работу и позиционируется для продуктовых команд
📋 ChatPRD (https://www.chatprd.ai/) - AI-инструмент для продукт-менеджеров, помогает создавать качественные PRDs (Product Requirement Document). Замечу, что для AI-программирования с моей точки зрения больше подойдет https://www.codeguide.dev/
🎬 Descript (https://www.descript.com/) - комплексная платформа для создания и редактирования видео и подкастов, которая использует AI для упрощения процесса создания контента
📊 Gamma (https://gamma.app/) - AI-инструмент для быстрого создания презентаций, документов и визуального контента
📱 Mobbin (https://mobbin.com/) - крупнейшая онлайн-библиотека UI/UX-паттернов и справочных материалов для дизайнеров и продуктовых команд. Бесплатные аналоги: https://dribbble.com/ и https://21st.dev/home (писал про него здесь)
🎤 Wispr Flow (https://wisprflow.ai/) - классный инструмент для транскрибации голоса в текст для мака, сам регулярно им пользуюсь при работе с AI-кодерами. У него есть бесплатный тир, которого при умеренном использовании может хватить
🔍 Raycast (https://www.raycast.ai/) - как я понял, это такой ИИ-помощник для мака: умный поиск, администрирование (можно дать ему доступ к календарю и файлам/папкам) и тому подобные вещи, похоже на AI-OS плагин. Скачивается только через VPN.
⚠️ Условия такие же: надо быть новым клиентом по выбранному продукту и не мешкать с активацией ключей. Если, конечно, не возьмете insider подписку за $350 - по ней пишут, что доступ к подпискам гарантированный.
Для тех кто уже как я оформлял подписку офер также действует - можно им воспользоваться на новые продукты из списка, но в связи со всплеском трафика соответствующая страничка (https://lennysproductpass.com/) недоступна
⏰ Главное через год не забыть отключить подписку, чтобы не получить продление по полной стоимости.
@llm_notes
#ai #tools #discount #productivity #automation #nocode
❤2👍2