Заметки LLM-энтузиаста
518 subscribers
144 photos
17 videos
1 file
175 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#news #manus #agent #prompts #opensource

🔍 MANUS: нашумевший ИИ-агент и его секретные промпты

Друзья! Сегодня хочу поделиться интересной находкой.
Один из коллег получил доступ к новому ИИ-инструменту Manus и обнаружил нечто удивительное... 👀

Manus позиционирует себя как "настоящий ИИ-агент, который выполняет задачи". Но самое интересное не это.

Представьте: вы просите ИИ показать файлы из системной директории, и он... просто берет и выдает все свои внутренности! 🤯

🤖 Что такое Manus?
Manus — это не просто чат-бот, а инструмент, который:
• Анализирует проблемы
• Автоматически выполняет задачи
• Предоставляет готовые результаты с визуализацией

Он может:
1. Планировать путешествия с персонализированными маршрутами
2. Анализировать финансовое состояние компаний
3. Оптимизировать онлайн-магазины
4. Обрабатывать и визуализировать данные
5. Создавать образовательный контент
6. Оптимизировать рабочие процессы

🔐 Но вот что произошло...
Когда коллега попросил Manus показать содержимое директории "/opt/.manus/", ИИ просто выдал все свои промпты, инструменты и код песочницы!

Это как если бы вы попросили фокусника показать, как он делает трюк, а он вместо отказа достал подробную инструкцию со всеми секретами. 🎩

📋 Что было обнаружено:
• Полный код среды выполнения
• Детальные инструменты агента
• Системные промпты для различных задач
• Структура взаимодействия с API

🧠 Почему это важно?
Понимание того, как работают такие системы, дает нам представление о:
• Методах обработки запросов
• Ограничениях и возможностях ИИ
• Потенциальных уязвимостях
• Способах оптимизации наших собственных запросов

🔗 Где посмотреть?
Все найденные промпты и инструменты доступны в этом GitHub Gist: https://gist.github.com/jlia0/db0a9695b3ca7609c9b1a08dcbf872c9

💭 Мысли напоследок
Такие "утечки" показывают, насколько молода еще индустрия ИИ-агентов. Системы становятся все сложнее, но базовые принципы безопасности иногда упускаются из виду.

Не удивительно, что опенсорсная версия появилась практически сразу (вот здесь) и уже набрала 28.5к "звездочек".

А вы что думаете об этом? Делитесь в комментариях! 👇

#ИИ #Manus #ИскусственныйИнтеллект #Технологии #Промпты
👍754🔥3
#mcp #thoughts #architecture

🔄 MCP: Текущие проблемы и варианты решения

Коллеги, добрый вечер! 👋

Я думаю, что многие уже успели попробовать подключение внешних инструментов к text2code агентам вроде Cursor/Windsurf/Cline/etc
Это достаточно удобно (даже для Windows уже появились вполне себе рабочие конфигурации на https://smithery.ai/), но в этой заметке я бы хотел подсветить существующие проблемы MCP, о которых стоит знать 🧐

🤔 В чем основная проблема MCP?
MCP — stateful протокол с долгоживущим соединением между клиентом и сервером. Это означает, что:

- 🔌 Требуется постоянное соединение между клиентом и сервером
- 🏗 Нельзя развернуть MCP в бессерверной (serverless) среде
- 🔄 Необходимо поддерживать SSE (Server-Sent Events) или WebSockets

Данный факт может стать серьезным барьером для разработчиков 😱
Вместо того, чтобы быстро развернуть функцию в AWS Lambda (у нас аналогом может выступать Yandex Cloud Functions) или Vercel, приходится разворачивать и настраивать выделенные серверы или кластеры Kubernetes (могут потребоваться DevOps скиллы).

🧩 Почему MCP спроектировали как stateful протокол?
Разработчики MCP выделяют несколько killer фич, ради которых MCP был спроектирован как statefull:

- 📢 Уведомления от сервера в сторону клиента об изменениях ресурсов или инструментов
- 🤖 Возможность сервера инициировать сэмплинг (sampling) в любой момент
- 📝 Передача логов сервера клиенту
- 🔮 Потенциальные будущие возможности

Одна из основных причин — сэмплинг (sampling), который позволяет серверу запрашивать у клиента выполнение запросов к LLM. Однако:

- ⚠️ Это создает потенциальные проблемы безопасности (сторонний MCP сервер, который вы подключили к своему агенту как инструмент, может получить доступ к приватным данным агента, например, к API-ключам)
- 🚫 Скорее всего поэтому сейчас ни один из клиентов MCP не поддерживает сэмплинг (см. здесь)
- 💰 Нет стимула для клиентов тратить свои токены на запросы от сервера

🛠 Возможные решения
В сообществе обсуждаются три основных варианта:

1️⃣ Добавить токены состояния/сессии
- Инкапсулировать состояние в токен, который передается между клиентом и сервером
- Простая эволюция текущего MCP
- Сложно для реализации серверами

2️⃣ Реализовать Stateless и Stateful варианты протокола
- Поддерживать оба варианта, позволяя разработчикам выбирать
- Простые серверы могут быть stateless
- Обратная совместимость
- Усложнение спецификации и SDK

3️⃣ Реализовать только stateless MCP
- Отказаться от функций, требующих режима stateful
- Простота для всех участников
- Потеря возможностей для агентных взаимодействий
- Несовместимость с текущей версией

🌟 Прогрессивное улучшение как компромисс
Интересный подход предложил инженер из Shopify — "MCP Lite" и прогрессивное улучшение:

1. 🔄 Базовый уровень: простой JSON-RPC для вызова инструментов
2. 📡 Опциональные уведомления через SSE/WebSockets для серверов, которые хотят их поддерживать
3. 🔄 Короткоживущие SSE-соединения только на время запуска инструмента

Это позволит:
- 🚀 Упростить внедрение MCP
- 🔧 Поддерживать сложные сценарии для тех, кто в них нуждается
- 📱 Работать в serverless-окружении

🔮 Альтернативы MCP
Существуют и более простые альтернативы, например, agents.json от Wild-Card-AI:

- 📄 Простой JSON поверх OpenAPI-спецификации
- 🔗 Использует существующие технологии
- 🧠 Не требует разворачивания выделенного сервера под AI tools

🔮 Будущее MCP
Для широкого принятия MCP необходимо:

- 🧪 Добавить поддержку stateless взаимодействий
- 🔄 Сделать stateful функции опциональными
- 🔑 Улучшить безопасность двунаправленной коммуникации при использовании sampling
- 📚 Решить проблему перегрузки контекстного окна при большом количестве инструментов

💭 Вывод
MCP имеет потенциал стать стандартом взаимодействия между AI-агентами и их инструментами, но нужно преодолеть существующие ограничения. Будем надеяться, что сообщество найдет компромисс между функциональностью и простотой использования! 🙏

А что вы думаете о том, в каком направлении должен развиваться MCP? Поделитесь в комментариях! 👇

#AI #MCP #ModelContextProtocol #Development
👍5❤‍🔥4
#cursor #updates #model #news

🚀 Cursor's New Claude MAX: Обновление с высокой производительностью и ценой

Коллеги, добрый день!
Делюсь информацией о новом обновлении Cursor.

Cursor представил свою самую мощную версию на данный момент: Claude 3.7 Sonnet MAX.
По сути, это расширенная версия AI-ассистента для кодинга с улучшенными возможностями.

Основные улучшения:
• Контекстное окно увеличено до 200K (было 120K) — возможность работать с более крупными кодовыми базами
• Лимит вызова инструментов поднят до 200 (вместо 25) — упрощает выполнение сложных многоэтапных задач
• Комбинация Claude 3.7 и системы сбора контекста от Cursor обеспечивает функции редактирования, недоступные другим моделям

💰 Стоимость использования:
• $0.05 за каждый запрос
• $0.05 за каждый вызов инструмента
• Разовое полноценное использование может стоить порядка $10 (200 агентных вызовов по $0.05 каждый)

Важно: эта функциональность не включена в стандартную Pro-подписку и оплачивается отдельно за каждое использование.

💡 Примечание:
Если вы периодически пишете несложный код, стандартная версия Claude, скорее всего, будет достаточной для ваших задач.
👍2🔥21
#ocr #pdf #model #opensource

SmolDocling: Опенсорс инструмент для OCR документов 📄

Коллеги, добрый день! 👋

Обычно первым шагом при построении ИИ-ассистентов является обработка/распознавание существующей документации.
Поэтому многие ищут хорошие решения для распознавания PDF-файлов, особенно когда речь идет о больших документах.
В связи с этим хочу поделиться интересной находкой.

SmolDocling — это новая мультимодальная визуально-языковая модель для полноценного OCR документов. Несмотря на компактный размер (всего 256M параметров), она обрабатывает страницу за 0.35 секунды! 🚀

Что умеет? 💪

• Распознает сложные макеты документов
• Корректно обрабатывает код
• Понимает математические формулы
• Распознает графики и диаграммы
• Работает с таблицами
• Классифицирует графические элементы
• Сохраняет структуру заголовков
• Группирует списки

Где пригодится? 📚

• Научные статьи
• Бизнес-документы
• Патенты
• Таблицы и отчеты

Удобные фишки ⚙️

• Пакетная обработка документов
• Экспорт в Markdown, HTML и JSON

Попробовать можно здесь: https://huggingface.co/ds4sd/SmolDocling-256M-preview

Кто уже тестировал? Делитесь впечатлениями в комментариях! 💬
🔥8❤‍🔥3
#v0 #vercel #db #ai #dev #supabase #neon #upstash

Новые интеграции в v0 от Vercel Marketplace 🔄

Теперь в v0 доступны первые интеграции из Vercel Marketplace.
Можно добавить постоянное хранилище данных к вашим проектам буквально в пару кликов 🖱

• Доступны интеграции с Supabase, Neon и Upstash
• Процесс подключения максимально упрощен (см. здесь)
• В ближайшее время ожидаются новые интеграции в области ИИ и мониторинга

Похоже, что v0 вырвался вперед в сравнении с bolt.new и lovable.dev, которые декларируют "коробочную" интеграцию только с Supabase

#cursor #mcp
У cursor есть соответствующие MCP-серверы в каталоге https://cursor.directory/mcp

#windsurf #mcp
У windsurf тоже https://windsurf.run/

#cline - у них свой MCP-маркеплейс появился одним из первых, вот здесь писал об этом
3👍3
#nvidia #news #agents #llm

NVIDIA представляет семейство моделей Llama Nemotron для построения агентных AI-платформ 🚀

🔍 NVIDIA только что выпустила новое семейство моделей с открытым исходным кодом — Llama Nemotron, специально разработанных для создания продвинутых ИИ-агентов, способных решать сложные задачи самостоятельно или в команде.

Что в этом особенного? 🤔
Эти модели поставляются в трех размерах:
• Nano (8B) — идеально для ПК и устройств на периферии
• Super (49B) — лучшая точность и производительность на одном GPU
• Ultra (249B) — максимальная точность на мульти-GPU серверах

🔄 Самая интересная особенность — переключатель режима рассуждений. Можно включать/выключать режим глубокого рассуждения прямо во время работы, в зависимости от задачи!

Впечатляющие результаты 📊
• На 20% выше точность по сравнению с базовыми моделями Llama
• В 5 раз быстрее других открытых моделей рассуждения
• Превосходит Llama 3.3 и DeepSeek R1 в тестах по STEM и использованию инструментов

Кто уже использует? 🏢
Microsoft, SAP, ServiceNow, Accenture и другие технологические гиганты уже интегрируют эти модели в свои платформы.

Что дальше? 🔮
В апреле NVIDIA выпустит фреймворк "AI-Q Blueprint", который поможет компаниям соединить ИИ-агентов с существующими системами и источниками данных. Тулкит уже доступен на github.

Похоже, что NVIDIA строит полноценную экосистему для эры агентного ИИ — от железа до высококачественных reasoning-моделей.

#NVIDIA #LlamaNemotron #ИскусственныйИнтеллект #АгентныйИИ #ГлубокоеОбучение #ТехНовости #AI #MachineLearning
👍4🔥4
#news #anthropic #search #web

Антропик только что объявил, что их ИИ-ассистент Claude теперь умеет искать информацию в Интернете cамостоятельно без необходимости настройки MCP-серверов (например вот такого)

Что это значит? 🤔
Claude теперь без дополнительных "приседаний" с настройкой MCP может:
• Получать доступ к самой свежей информации о текущих событиях 📰
• Предоставлять более точные ответы с актуальными данными 📊
• Цитировать источники для проверки фактов 🔍

Кому это будет особенно полезно:
• Продажи — анализ отраслевых тенденций для более информированных разговоров с клиентами 📈
• Финансовые аналитики — оценка текущих рыночных данных и отчетов о доходах 💹
• Исследователи — создание более сильных грантовых предложений и обзоров литературы 📚
• Покупатели — сравнение характеристик, цен и отзывов о продуктах 🛒

Как начать использовать? 🚀
Пишут, что функция уже доступна для всех платных пользователей Claude в США и скоро появится и в других странах.
Нужно включить "web search" в настройках профиля.
У меня еще данная функция не появилась.
3👍3🔥1
#ai #db #tool #text2sql #opensource

🚀 Chat2DB: AI-помощник для работы с базами данных

Привет, друзья! 👋
Сегодня хочу поделиться находкой, которая может серьезно упростить вашу работу с базами данных — инструмент Chat2DB.

Что это такое?

Chat2DB — это интеллектуальный SQL-клиент с интегрированным AI, который помогает:

💬 Генерировать SQL-запросы через обычный диалог на русском языке
🔄 Подключаться к более чем 16 типам баз данных (MySQL, PostgreSQL, MongoDB, Redis и др.)
📊 Создавать красивые дашборды и визуализации данных
🛠 Управлять структурой БД и синхронизировать таблицы

Что особенно впечатлило:

🧠 Работает с Claude 3.7 Sonnet, GPT-4o, DeepSeek и другими топовыми моделями
🔍 Понимает контекст вашей базы данных и не галлюцинирует
🖥 Есть опенсорсная версия, которую можно скачать бесплатно
🏠 Может работать локально — ваши данные не уходят на сторонние сервера

Вот как это выглядит в действии:

• Подключаешься к своей БД
• Спрашиваешь на обычном языке: "Покажи 10 последних заказов" (или любой интересующий вас запрос, см. скриншот)
• AI генерирует правильный SQL-запрос и сразу выполняет его
• Можно тут же создать график или добавить результат на дашборд

Если вы часто работаете с базами данных и устали писать сложные запросы вручную — однозначно стоит попробовать.
Есть три версии: Community (бесплатная), Local и Pro. На платные версии дается 30 дневный trial.

Короткий видео туториал от разработчиков можно посмотреть здесь. А вот тут шикарное 4х минутное демо именно по v3.0 которая вышла недавно. Очень похоже на Cursor for DB :)

Кто уже пользовался Chat2DB? Делитесь впечатлениями в комментариях! 👇

#БазыДанных #AI #SQL #ИнструментыРазработчика
👍6🔥2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
#windsurf #ai #dev #news

🌊 Wave 6: Новые возможности Windsurf — подробный конспект

Привет, друзья! Вышло новое обновление Windsurf — Wave 6.
Давайте разберемся, что интересного появилось в этой версии 👇

🚀 Основные новшества:

• App Deploys — теперь можно публиковать свои веб-приложения одним кликом!
Windsurf автоматически анализирует проект и загружает его на уникальный поддомен windsurf.build через интеграцию с Netlify (смотрим демо ролик и читаем документацию).
По сути WindSurf сейчас - это первый онпремный text2code агент, который предлагает такой же быстрый и простой деплой приложения в прод, как и облачные решения.
Можно считать, что с появлением App Deploys последняя грань между облачными text2code ИИ-помощниками (bolt.new, lovable.dev, v0.dev и другими из списка) и онпремными стерта (т.к. интеграция с внешними сервисами Supabase/Firebase/Clerk и т.д. у всех онпремных text2code агентов уже появилась некоторое время назад благодаря MCP)

• Доступ к Turbo Mode и MCP для Enterprise — корпоративные пользователи получили полный административный контроль над этими инструментами

• Автоматическая генерация коммит-сообщений — одним кликом можно создать краткое описание ваших изменений прямо в панели управления исходным кодом

• Улучшенная навигация по истории чата — легко просматривайте и возвращайтесь к предыдущим сообщениям с помощью оглавления

💡 Улучшения для разработчиков:

• Tab в Jupyter Notebook — полная поддержка автодополнения, суперкомплита и других функций Tab в ваших ноутбуках
• Контекстный поиск в Tab — результаты поиска по файлам и рабочему пространству теперь используются как контекст
• Ускоренный Tab to Jump — быстрее перемещайтесь по коду, даже если курсор находится далеко

🔍 Дополнительные улучшения:

• Улучшенное управление памятью — легче находить и редактировать воспоминания (memories), включая автоматически созданные Cascade (для того, чтобы их включить в новый контекст работы с windsurf агентом)
• Новые иконки приложения — больше вариантов для персонализации
• Поддержка удаленных серверов для MCP — расширенные возможности подключения
• Редизайн терминала — обновленный интерфейс для более комфортной работы
• Обновления VS Code — интеграция последних изменений из основной ветки

Не забудьте обновиться до последней версии Windsurf, чтобы получить доступ ко всем этим новшествам! 🔄
🔥8👍2
#agents #google #анонс

Google представляет Agent2Agent: новая эра взаимодействия ИИ-агентов 🚀

Друзья, Google только что анонсировал революционный протокол Agent2Agent (A2A), который позволит ИИ-агентам общаться между собой независимо от платформы или разработчика! 🤖↔️🤖

A2A обеспечивает взаимодействие между "клиентскими" и "удаленными" агентами через четыре ключевые возможности:

🔒 Безопасное сотрудничество
📋 Управление задачами
👥 Согласование пользовательского опыта
🔍 Обнаружение возможностей

Всё это построено на популярных стандартах HTTP и JSON-RPC с корпоративной аутентификацией.

Почему это важно? 🤔

Представьте мир, где ваши ИИ-помощники могут:
• Автоматически взаимодействовать с другими системами
• Выполнять сложные задачи без вашего постоянного участия
• Обмениваться информацией безопасно и эффективно

Ключевые принципы A2A: 💡

• Простота: использование существующих стандартов
• Безопасность: корпоративная аутентификация и авторизация
• Асинхронность: поддержка длительных задач и участия человека
• Мультимодальность: работа с текстом, аудио, видео и другими форматами
• Непрозрачное выполнение: агенты не обязаны делиться своими мыслями, планами или инструментами

Реальный пример использования: 👨‍💼

Процесс найма инженера-программиста может быть значительно упрощен с помощью A2A. Менеджер по найму может поручить своему агенту найти кандидатов, соответствующих вакансии, местоположению и набору навыков. Агент взаимодействует с другими специализированными агентами для поиска потенциальных кандидатов, а затем может организовать собеседования и проверку биографии.

Кто поддерживает A2A? 🌐

Более 50 партнеров уже присоединились к инициативе, включая Atlassian, Box, Cohere, Intuit, Langchain, MongoDB, PayPal, Salesforce, SAP, ServiceNow и многих других.

Протокол открыт для всех, и Google активно приглашает сообщество к участию в его развитии.
Полная спецификация и примеры кода уже доступны на GitHub!

Оригинальный блог-пост с анонсом от гугла тут
Подробная техническая документация здесь

Мой конспект с фокусом на сходства/отличия от #mcp можно почитать по ссылке (спойлер: A2A дополняет MCP)

Что думаете о будущем взаимодействия ИИ-агентов? Делитесь в комментариях! 👇

#AI #GoogleCloud #AgentToAgent #ИскусственныйИнтеллект #ТехнологииБудущего
👍3🔥32
#google #ai #dev #firebasestudio #анонс

🚀 Firebase Studio: Онлайн AI-кодер от Гугла

Похоже сегодня день значимых анонсов от гугла.

Вчера Google на конференции Cloud Next представили Firebase Studio. Это облачная среда разработки с поддержкой Gemini, которая объединяет всё необходимое для создания AI-приложений в одном месте.

Очень похоже на lovable + replit + bolt + v0 - всё в одном инструменте. И самое приятное — доступно бесплатно в превью!

Что умеет Firebase Studio:

🧠 Агент-прототипирование — создавайте прототипы приложений с помощью обычного языка, изображений и набросков

💻 Рабочие пространства для кодинга — пишите код с помощью Gemini, который поможет с отладкой, тестированием и документацией

🔄 Полный стек — от AI-моделей и агентов до пользовательского интерфейса, бизнес-логики и базы данных

🛠 Знакомые инструменты — используйте свои конфигурации, расширения и тысячи плагинов из Open VSX Registry

🚀 Гибкое развертывание — запускайте в облаке с интеграцией Firebase или на собственной инфраструктуре
🤖 AI-агенты для всего рабочего процесса:

🔄 Агент миграции — поможет перенести код между версиями Java

🧪 Агент тестирования AI — проверит модели на потенциально вредные выводы

📝 Агент документации — создаст базу знаний о вашем коде

📱 Агент тестирования приложений — симулирует реальные взаимодействия пользователей с вашим приложением
🔥 Что еще нового:

🌐 Расширенная поддержка языков для Genkit — теперь с Python и Go

🖼 Новые модели через Vertex AI — включая Imagen 3 и Gemini 2.0 Multimodal Live API

📊 Firebase Data Connect — надежность Cloud SQL с мгновенными GraphQL API

🏠 Firebase App Hosting — развертывание полного стека приложений через git

Во время превью каждый получает 3 бесплатных рабочих пространства, а участники Google Developer Program — до 30!

Попробовать можно прямо сейчас на https://studio.firebase.google.com/

Официальный анонс здесь
Подробная техническая документация по инструменту тут

Среда разработки выглядит похоже на Github Codespaces, также можно поставить опенсорсные плагины для AI-кодинга (например, Cline или Roo Code) с поддержкой других языковых моделей платных или бесплатных (например, quasar alpha )

Я попробовал сделать трекер расходов из предлагаемых примеров - все прошло успешно, дефолтные цвета для "пирожковой" диаграммы правда были выбраны не очень, но по ходу разработки было только 3 ошибки, которые достаточно быстро gemini сам исправил (см. скриншот)

Кто уже успел заценить? Делитесь впечатлениями в комментариях! 👇
🔥4👍2🙏1
#ai #dev #hestingerhorizon

Еще один веб-кодер для создания full-stack приложений

Инструмент называется — Hostinger Horizons
На вид похож на bolt.new или lovable (см. скриншот)
У него тоже есть интеграция с Supabase

🧠 Генерирует полноценные веб-приложения по текстовому описанию
🗣 Понимает команды на 80+ языках
👁 Принимает изображения как референсы
🖥 Показывает изменения в реальном времени
🌐 Сразу публикует готовый проект

Как это работает:

1️⃣ Описываете идею приложения в чат-интерфейсе
2️⃣ ИИ генерирует первую версию
3️⃣ Корректируете и улучшаете через диалог с ИИ
4️⃣ Тестируете в песочнице
5️⃣ Публикуете одним кликом

Кому может быть полезен инструмент:
💼 Предпринимателям, которым нужно быстро проверить идею
🏢 Компаниям, которые хотят быстро создать свои ИИ-инструменты
🎨 Vibe-кодерам без технических навыков
💡 Всем, кто хочет воплотить идею без найма разработчиков

Что интересно — это решение с хостингом, доменом и почтой в одном месте.

Немного похоже на replit.com тем, что для мониторинга за инфраструктурой хостинга также используется AI Assistant (у них он называется Kodee)

У ребят есть youtube канал с набором небольших обучающих видео https://www.youtube.com/@HostingerAcademy/videos
👍21
#openai #news #update

Обзор GPT-4.1: новая модель OpenAI для разработчиков

OpenAI представила GPT-4.1 — новое семейство моделей, доступное только через API. Релиз включает три варианта: GPT-4.1, GPT-4.1 mini и впервые — GPT-4.1 nano.

Ключевые особенности:

• Контекстное окно 1 миллион токенов для всех трех моделей без дополнительной платы
• Показатель на SWE-bench Verified: 54.6% (+21.4% по сравнению с GPT-4o)
• Улучшение на MultiChallenge: +10.5% • Новый рекорд на Video-MME: 72%
• База знаний обновлена до июня 2024 года

Основные улучшения:

• GPT-4.1 mini превосходит GPT-4o по многим показателям при вдвое меньшей задержке и на 83% дешевле
• GPT-4.1 nano достигает 80.1% на MMLU
• Заметные улучшения в создании фронтенд-кода и работе с дифами
• Повышенная эффективность для создания агентов благодаря лучшему следованию инструкциям

Цены (за 1 млн токенов):

• GPT-4.1: $2.00 ввод / $8.00 вывод (средняя цена $1.84)
• GPT-4.1 mini: $0.40 ввод / $1.60 вывод (средняя цена $0.42)
• GPT-4.1 nano: $0.10 ввод / $0.40 вывод (средняя цена $0.12)

OpenAI объявила о прекращении поддержки GPT-4.5 Preview через 3 месяца (14 июля 2025), поскольку GPT-4.1 предлагает аналогичную или лучшую производительность при меньших затратах.

Результаты тестирования партнеров:

• Windsurf: GPT-4.1 на 60% лучше GPT-4o в их внутреннем тесте кодирования
• Qodo: В 55% случаев GPT-4.1 дает лучшие предложения при анализе pull-запросов
• Thomson Reuters: Улучшение точности анализа нескольких документов на 17%
• Carlyle: На 50% лучше извлекает данные из больших документов

#OpenAI #GPT41 #ИскусственныйИнтеллект #AI
👍2🔥2
#info #ai #tools

Друзья, всем привет!

Есть возможность очень сильно сэкономить на AI-инструментах, воспользовавшись вот этим офером
https://www.lennysnewsletter.com/p/an-unbelievable-offer-now-get-one

$200 за годовую подписку на 10 классных AI-инструментов (обычно 1 такая подписка стоит дороже):

1) 5 самых популярных vibe coding инструментов (Cursor, Replit, Bolt, Lovable, v0)
2) 5 productivity инструментов (в числе которых Perplexity Pro подписка)
подробнее на скрине

Важное дополнение: чтобы воспользоваться офером, надо быть именно новым клиентом по выбранному продукту
В моем случае, например, польза в основном только от части, которая связана с productivity tools. Но все равно сделка выгодная. Главное не забыть через год пользования отключить платеж по карте, если не планируете продлять сервис по оригинальной стоимости.
А тем, у кого еще не было подписки на 5 vibe coding tools, можно только позавидовать - по сути каждый из инструментов получается за 15-20% стоимости.
🔥4❤‍🔥3👍31