Заметки LLM-энтузиаста
520 subscribers
144 photos
17 videos
1 file
175 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#openai #news

🔥 OpenAI выпустила GPT-4.5! 🚀

Привет, друзья!

Этот долгожданный момент настал: OpenAI только что представила GPT-4.5 — их самую мощную и "человечную" модель на данный момент! 🤖

Что в ней особенного:
🧠 Это ОГРОМНАЯ модель с улучшенной эффективностью (в 10 раз лучше, чем GPT-4)
💬 Общение с ней ощущается более естественным и тёплым
🎭 Высокий эмоциональный интеллект (EQ) — понимает нюансы и контекст
📚 Обширная база знаний и меньше галлюцинаций
🎨 Отлично справляется с творческими задачами

Интересно, что это НЕ модель для рассуждений (как o1 или o3-mini), а модель для интуитивного понимания мира! Сэм Альтман говорит, что это "первая модель, общение с которой действительно воспринимается как разговор со вдумчивым человеком" 😮

📱 Доступность:
• Сейчас: для пользователей ChatGPT Pro ($200/месяц)
• На следующей неделе: для ChatGPT Plus ($20/месяц)
• Через две недели: для корпоративных и образовательных пользователей

💸 Цена API просто космическая: $150 за миллион токенов на выходе (для сравнения, GPT-4 стоит $10)!
Источник здесь
В общем, использовать 4.5 в софте пока дороговато.

🔍 Примеры использования GPT-4.5 vs другие модели 📊

Возьму один самый яркий пример из официальной презентации OpenAI:

Эмоциональная поддержка: 👤: "Мне сейчас тяжело после провала на экзамене"

GPT-4.5: "Ох, мне правда жаль это слышать. Провал на экзамене может ощущаться довольно паршиво и обескураживающе, но помни — это всего лишь один момент, а не отражение того, кто ты или на что способен. Хочешь поговорить о том, что случилось, или просто нужно отвлечься? Я здесь в любом случае."

GPT-4o: "Мне очень жаль, что вы переживаете трудные времена. Вот несколько вещей, которые стоит рассмотреть: 1. Проанализируйте, что пошло не так... 2. Обратитесь за поддержкой... 3. Поговорите с преподавателем..." [длинный список советов]

Очень дружеский ответ от GPT-4.5 👏❤️ и "дельный" совет от GPT-4o 📋🤖

🔢 Бенчмарки:
• Точность на SimpleQA: GPT-4.5 (62.5%) vs GPT-4o (38.2%)
• Уровень галлюцинаций: GPT-4.5 (37.1%) vs GPT-4o (61.8%)
• Предпочтения тестировщиков: 56.8-63.2% выбрали GPT-4.5 вместо GPT-4o

🔮 Что дальше?
OpenAI говорит, что будущее за моделями, которые сочетают масштабное предварительное обучение (как у GPT-4.5) с возможностями рассуждения (как у o1). Такие модели будут иметь и "высокий IQ", и "высокий EQ" одновременно!

А вы уже попробовали GPT-4.5? Делитесь впечатлениями в комментариях! 👇

#OpenAI #GPT45 #ИскусственныйИнтеллект #ChatGPT
3🔥2🎉2
Как GPT может строить рабочие процессы в N8N без лишних туториалов 🤖

В качестве продолжения и дополнения к более раннему посту .

Если вы используете N8N для автоматизации бизнес-процессов или создаете решения для клиентов, возможно, стоит обратить внимание на специализированного бота в ChatGPT. Он способен значительно упростить вашу работу. 🧠

Что это такое и как найти

Речь идет о боте "N8N Assistant", который можно найти в разделе GPTs:
1️⃣ Откройте ChatGPT
2️⃣ Нажмите "Explore GPTs" в боковой панели
3️⃣ Введите "N8N" в поиске
4️⃣ Выберите "N8N Assistant" из результатов (самый верхний в представленном списке - см. скриншот)
Или по прямой ссылке

Бот обучен на документации N8N и понимает структуру узлов, типы автоматизаций и особенности масштабирования. Звучит многообещающе, хотя, как обычно с ИИ-инструментами, результаты могут варьироваться. 😏

Полезные способы применения

Есть несколько сценариев использования бота:

📋 Проверка существующих рабочих процессов

• Загрузите JSON-файл вашего рабочего процесса (через три точки → Download в интерфейсе N8N)
• Спросите бота: Do you see any potential problems with this workflow? If I want to run any records at scale, any suggestions for improvements
• Получите анализ потенциальных проблем и рекомендации по оптимизации

💻 Создание JavaScript-выражений
• Просто опишите, что должно делать выражение
• Бот сгенерирует готовый код для вставки в N8N

🔧 Исправление ошибок
• Отправьте боту скриншот ошибки
• Получите рекомендации по исправлению

✍️ Улучшение AI-промптов для N8N
• Поделитесь своим текущим промптом
• Бот предложит улучшенную версию

🆕 Создание рабочих процессов с нуля
• Опишите, что должен делать рабочий процесс
• Бот создаст JSON-файл, который можно импортировать в N8N

Если сравнивать данный инструмент с https://n8nchat.com (подробнее про него писал тут), то данный инструмент хоть и не имеет встроенной браузерной интеграции с n8n, все же может сэкономить время на разработке и отладке автоматизаций. 🕒

#n8n #automation #chatgpt #workflow #productivity
👍4❤‍🔥3🔥1
OpenAI снизила цены на o3 на 80% и представила o3-pro 🚀

OpenAI объявила о значительном снижении стоимости модели o3 и запуске новой версии o3-pro через API.

Новые цены на o3: 💰
• Входящие токены: $2 за миллион
• Исходящие токены: $8 за миллион

Сама модель не изменилась — улучшили только инфраструктуру для более дешевого инференса.

o3-pro — более мощная версия: ⚡️
1️⃣ Входящие токены: $20 за миллион
2️⃣ Исходящие токены: $80 за миллион
3️⃣ На 87% дешевле предыдущей o1-pro
4️⃣ OpenAI советует использовать фоновый режим с o3-pro для долгих задач — это позволяет избежать таймаутов и дает возможность задачам завершаться асинхронно. Получается, это классный кандидат для Cursor Background Agents.

Ключевые особенности o3-pro: 🎯
Превосходит конкурентов в математике и науке на PhD уровне
• Поддерживает веб-поиск и анализ данных (но пока не поддерживает генерацию картинок и Canvas)
• Работает медленнее базовой версии

Доступность: 📅
ChatGPT Pro/Team — уже доступно
• Enterprise и Edu — на следующей неделе

Что говорят тестировщики:
🔍 По словам тестера Бена Хайлака, o3-pro ощущается "намного умнее" предшественника и "очень отличается" от других передовых моделей. Самое удивительное в этом релизе — это ценообразование: модель стоит в разы дешевле старых версий при значительном скачке в интеллекте и возможностях.
Похоже что теперь для стадии планирования в vibecoding это самый подходящий вариант 😁

Кажется, что Windsurf и Cursor обновили цены на o3 сразу после анонса 📊

@llm_notes

#openai #o3pro #pricing #llm #chatgpt
❤‍🔥3👍32
ChatGPT Agent: новый инструмент для автоматизации задач 🤖

OpenAI представила ChatGPT Agent — он объядиняет возможности Operator и Deep Research в единой системе. Логичный шаг, теперь у Openai есть агент, который может самостоятельно выполнять сложные задачи, используя браузер, терминал и различные API.

Небольшое отступление. По сути, все эти задачи можно решить и без ChatGPT Agent, настроив в любом AI-кодере, у которого есть доступ к терминалу, необходимый набор MCP-серверов, но если серверов много - можно наткнуться на лимиты по количеству инструментов (как наример, в Cursor) или же AI-кодер может просто "запутаться" в количесте MCP-инструментов и начать делать что-то не то. Выход из такого положения тоже есть:
1) поместить инструкции по применению MCP-инструментов в системный промпт (rules-файлы)
2) использовать MCP-агрегаторы со встроенным RAG по списку MCP-инструментов наподобие ACI.DEV (отлично справляется в случае с Cursor, когда есть лимиты на количество MCP-tools, и что круто - этот инструмент может быть установлен локально!)

Судя по всему, сам сценарий использования стал настолько популярен, что Openai решили пойти по пути создания pret-a-porter агента, который в данном контексте выигрывает за счет того, что не требует дополнительной "сборки" и настройки под описанный выше класс задач и будет удобнее для обычного пользователя, который далек от AI-программирования и не хочет вдаваться в детали настройки MCP.

Основные возможности:
• Анализ календаря и подготовка брифингов по встречам
• Планирование покупок и составление списков
• Создание презентаций и анализ конкурентов
• Бронирование и планирование поездок
• Работа с таблицами и документами

Технические особенности: ⚙️
🔹 Визуальный браузер для взаимодействия с веб-интерфейсами
🔹 Текстовый браузер для быстрого анализа контента
🔹 Доступ к терминалу для выполнения кода
🔹 Интеграция с Gmail, Google Calendar, GitHub (я полагаю, что в сравнении с MCP-интеграцией здесь преимущество в безопасности системы, за которую теперь отвечает openai, а не дуэт в составе автора MCP-сервера и команды anthropic, которая пишет спецификацию MCP-протокола)
🔹 Возможность создания презентаций и таблиц (это уже относительно давно есть в manus и genspark)

Результаты тестирования: 📊
1️⃣ Humanity's Last Exam: 41.6% (новый рекорд)
2️⃣ FrontierMath: 27.4% точности
3️⃣ SpreadsheetBench: 45.5% при работе с файлами
4️⃣ BrowseComp: 68.9% (+17.4% к предыдущим результатам)

Безопасность и ограничения: ⚠️
Система требует подтверждения для критических действий и защищена от prompt injection атак. Пользователи могут в любой момент прервать выполнение задачи или взять управление на себя.

Доступность:
• Pro пользователи: 400 запросов/месяц
• Plus и Team: 40 запросов/месяц
• Постепенный запуск в течение нескольких дней

Функция пока недоступна в ЕС и Швейцарии.
Я пока тоже доступ не получил.
Разработчики планируют регулярные улучшения системы.

Полезные ссылки для просмотра:
- Введение в ChatGPT Agent
- Кастомизация ChatGPT Agent

@llm_notes

#chatgpt #agents #openai #automation #productivity
🔥21🤔1