DenoiseLAB

🔥 DeepSeek представила модель математического мышления с само-верификацией

Компания DeepSeek выпустила DeepSeek-Math-V2 — модель, которая не просто решает математические задачи, но и самостоятельно проверяет корректность своих рассуждений, достигая уровня золотых медалистов Международной математической олимпиады.

🔍 Основная проблема
Традиционные ИИ в математике ориентированы только на правильный ответ, игнорируя качество логических рассуждений. DeepSeek меняет этот подход, фокусируясь на процессе, а не только на результате.

🎯 Трехкомпонентная система
• Верификатор ("учитель") — оценивает доказательства по шкале 0-1
• Мета-верификация ("надзиратель") — проверяет объективность оценок учителя
• Генератор ("ученик") — решает задачи и честно оценивает свои ошибки

💡 Ключевые инновации
• Система поощрения честности — модель получает награду за признание своих ошибок
• Автоматический цикл улучшения — "ученик" и "учитель" совместно эволюционируют
• Процессно-ориентированный подход вместо результат-ориентированного

📊 Результаты
• IMO 2025 и CMO 2024: уровень золотой медали
• Putnam 2024: 118/120 баллов
• IMO-ProofBench Basic: почти 99% точности

Технические детали
Модель основана на DeepSeek-V3.2-Exp-Base и использует методологию GRPO. Система автоматически генерирует сложные доказательства для обучения, создавая замкнутый цикл улучшения без человеческого вмешательства.

Вывод: DeepSeek открывает новое направление в ИИ — само-верифицируемое математическое мышление, где важнее процесс решения, чем конечный ответ.

Hugging Face | Статья

#КитайскийИИ #КитайAI #МатематическийИИ #DeepSeek

huggingface.co

deepseek-ai/DeepSeek-Math-V2 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

😁2🔥1

150 views18:04