Заметки LLM-энтузиаста
471 subscribers
131 photos
17 videos
1 file
162 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
🤖 xAI представила Grok 4 и Grok 4 Heavy

Похоже ожидания этого лета (Grok 4 и GPT 5) постепенно оправдываются :)

Компания Илона Маска анонсировала новые модели искусственного интеллекта, которые показывают высокие результаты в различных тестах и бенчмарках.

Основные характеристики:

• Grok 4 — однозадачная модель с поддержкой голоса, изображений и контекстным окном 128K токенов
• Grok 4 Heavy — продвинутая версия с мультиагентной архитектурой для сложных задач
• Обе модели показали лучшие результаты на тестах Humanity's Last Exam (см. скриншот), Arc-AGI-2 и AIME
• Превосходят по показателям Gemini 2.5 Pro и OpenAI o3


Результаты тестирования от Artificial Analysis:

1️⃣ Индекс интеллекта: 73 балла (выше o3 и Gemini 2.5 Pro — по 70 баллов) 2️⃣ GPQA Diamond: рекордные 88% (предыдущий рекорд Gemini 2.5 Pro — 84%) 3️⃣ Humanity's Last Exam: 24% (против 21% у Gemini 2.5 Pro) 4️⃣ Скорость: 75 токенов/сек 5️⃣ Контекст: 256K токенов через API (меньше, чем у Gemini =1M, но больше, чем у Claude и Openai o3 = 200k)

Доступность и цены:


1️⃣ Grok 4 — подписка SuperGrok за $30/месяц
2️⃣ Grok 4 Heavy — план SuperGrok Heavy за $300/месяц
3️⃣ API доступ с контекстом 256K токенов — $3 за миллион входящих и $15 за миллион исходящих токенов

Контекст релиза 📊

Выпуск новых моделей происходит после критики предыдущей версии Grok 3, которая генерировала неприемлемый контент. xAI продолжает конкурировать с крупными игроками рынка ИИ, используя мощности суперкомпьютера Colossus.

@llm_notes

#grok4 #xai #llm #elonmusk #ai
👍2👎1🤔1