OAI выпустила три новые модели для API: GPT-4.1, 4.1 mini и 4.1 nano. Они обгоняют GPT-4o почти во всём — от кодинга до понимания инструкций и работы с длинными текстами.
Если кратко:
– GPT-4.1 теперь топ по коду. SWE-bench – 54,6%, против 33% у GPT-4o
– 4.1 mini и nano – дешевле и быстрее, причем 4.1 mini очень близко подбирается по показателям к полной версии
– Бенчмарки – всюду победы: лучше в кодинге, следовании инструкциям, эрудиции, мультимодальности и даже понимании видео
Мне в этом релизе больше все нравится пункт про следование инстуркциям. OAI делат фокус на том, что модель тренировали точно слушаться промпта, а значит выдавать ответы в строгой последовательности, формате, учитывая негативные инструкции и тд.
Думаю, подход к промтингу этой модели будет отличаться, благо компания выпустила промт-гайд с лучшими практиками и особеностями работы с 4.1
Как пробовать? В чате нет. Только в АПИ на https://platform.openai.com, а еще виндсерф дает бесплатный доступ к модели на недельку для всех пользователей.
Нужен обзор релиза на туб?
👍 – да
💩 – нет
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍190💩12🔥5😨1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19❤5🔥5❤🔥1
уже на канале – https://youtu.be/d88xR0GAlNE
Короткий вывод – нравится. Отлично слушается промпта и хорошо пишет. В кодинге есть задачи, на которых вывозит лучше остальных моделей, но где-то первенство все равно у клода.
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Во первых, Антропик запускает Research – поиск в интернете. Это не похоже на Deep Research и агентский поиск, а скорее что-то вроде перплексити в стандартном режиме.
Ну а в качестве анаболика к этой фиче идет интеграция с Google Workspace. Клод может искать в имейлах, просматривать документы и следить за событями в календаре
А вот вам промпт от команды антропика. Развлекайтесь. Или нет.
"Reflect on my calendar as if I was 100 years old looking back at this time.”
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤5🤣5🐳2
Модели могут использовать и комбинировать все инструменты ChatGPT, включая веб-поиск, Python, анализ изображений, интерпретацию файлов и генерацию изображений. Модели специально тренировали на использование тулзов и агентские функции.
o3 и o4-mini - первые модели, которые интегрируют загруженные изображения непосредственно в цепочку своих мыслей. Это значит, что они не просто видят изображение - они думают с его помощью
По бенчмаркам, конечно, полный разрыв. Блог-пост тут.
Уже доступны в ChatGPT и для разработчиков в API. о3 pro появится в ближайшие несколько недель для про подписичиков.
Параллельно с моделями выпускают аналог Claude Code – агента для кодинга c доступом через терминал.
@how2ai #gpt #игорян
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍15👏3❤2😁1
Закинул в о3 кроссворд. За 13 минут разгадала, но с парой ошибок.
И не без читтерства - какие-то ответы искала конкретно на сайтах решебниках
Модель умеет кропать изображения, чтобы лучше понять или разглядеть.
Ранее НИ ОДНА модель не справлялась с такой задачей.
Отгадывает "Ластоногая хозяйка озера Байкал" – это уже AGI?
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27🤯8❤🔥3👍1😁1
a-practical-guide-to-building-agents.pdf
7 MB
От Антропика уже видели. Спасибо. Полезно. Теперь OpenAI
32‑страничный «Practical Guide to Building Agents» – практический метод создания AI‑агентов для выполнения сложных задач с использованием Agents SDK.
Основу составляют три концепции – модели, инструменты и инструкции. Показано, где автономия агентов выгодна, как масштабировать архитектуру от одного цикла к мультиагентной экосистеме и как встраивать гардрейлы.
Чтоб не скучали на выходных 🙂
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29❤8
Я просто искал IDE, где нет ИИ-агентов, но есть чат с нейронкой, которой можно быстро скормить контекст.
Получился обзор ИИ-агентов на пол часа 🥸
тут – https://www.youtube.com/watch?v=I88olg5UBEg
@how2ai #дядя_д
Получился обзор ИИ-агентов на пол часа 🥸
тут – https://www.youtube.com/watch?v=I88olg5UBEg
@how2ai #дядя_д
👍22🔥5❤3💩3
Все мы когда-то начинали с нуля. Главное — начать.
И если вы ждали знак от Вселенной — вот он 💫 Только сегодня в нашем боте-хранителе знаний все курсы с огромными скидками.
💬 Промптинг в ChatGPT – база общения с LLM
🎨 ИИ-графика – создание профессиональных визуалов с нейросетями
💻 Промптграмминг – кодинг с помощью ИИ
⏳ Всё и навсегда – Все наши обучающие материалы и все их будущие обновления навсегда!
Учитесь создавать, вдохновлять и быть впереди.
👉 Скидки доступны по этой ссылке
И если вы ждали знак от Вселенной — вот он 💫 Только сегодня в нашем боте-хранителе знаний все курсы с огромными скидками.
💬 Промптинг в ChatGPT – база общения с LLM
🎨 ИИ-графика – создание профессиональных визуалов с нейросетями
💻 Промптграмминг – кодинг с помощью ИИ
⏳ Всё и навсегда – Все наши обучающие материалы и все их будущие обновления навсегда!
Учитесь создавать, вдохновлять и быть впереди.
👉 Скидки доступны по этой ссылке
👍12😁5💩5
На o4-mini. В курсоре модель бесплатная на "какое-то время".
o3 отдают по 0,3 бакса за запрос. Не бюджетно(
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍4❤3🦄1