Заметки LLM-энтузиаста
520 subscribers
145 photos
17 videos
1 file
176 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#openai #news #update

Обзор GPT-4.1: новая модель OpenAI для разработчиков

OpenAI представила GPT-4.1 — новое семейство моделей, доступное только через API. Релиз включает три варианта: GPT-4.1, GPT-4.1 mini и впервые — GPT-4.1 nano.

Ключевые особенности:

• Контекстное окно 1 миллион токенов для всех трех моделей без дополнительной платы
• Показатель на SWE-bench Verified: 54.6% (+21.4% по сравнению с GPT-4o)
• Улучшение на MultiChallenge: +10.5% • Новый рекорд на Video-MME: 72%
• База знаний обновлена до июня 2024 года

Основные улучшения:

• GPT-4.1 mini превосходит GPT-4o по многим показателям при вдвое меньшей задержке и на 83% дешевле
• GPT-4.1 nano достигает 80.1% на MMLU
• Заметные улучшения в создании фронтенд-кода и работе с дифами
• Повышенная эффективность для создания агентов благодаря лучшему следованию инструкциям

Цены (за 1 млн токенов):

• GPT-4.1: $2.00 ввод / $8.00 вывод (средняя цена $1.84)
• GPT-4.1 mini: $0.40 ввод / $1.60 вывод (средняя цена $0.42)
• GPT-4.1 nano: $0.10 ввод / $0.40 вывод (средняя цена $0.12)

OpenAI объявила о прекращении поддержки GPT-4.5 Preview через 3 месяца (14 июля 2025), поскольку GPT-4.1 предлагает аналогичную или лучшую производительность при меньших затратах.

Результаты тестирования партнеров:

• Windsurf: GPT-4.1 на 60% лучше GPT-4o в их внутреннем тесте кодирования
• Qodo: В 55% случаев GPT-4.1 дает лучшие предложения при анализе pull-запросов
• Thomson Reuters: Улучшение точности анализа нескольких документов на 17%
• Carlyle: На 50% лучше извлекает данные из больших документов

#OpenAI #GPT41 #ИскусственныйИнтеллект #AI
👍2🔥2