روش تازهای برای مدلهای زبانی بزرگ معرفی شده که توانسته به دقت خارقالعادهی ۹۹.۹٪ در آزمون AIME 2025 برسد ✨
✅این روش با نام DeepConf شناخته میشود و ایدهی آن این است که مدل در حین تولید متن، خودش میزان «اعتماد» به هر توکن را محاسبه میکند و اگر در بخشی ضعف ببیند، همانجا زنجیرهی استدلال را قطع میکند.
---
📌 تفاوت با روشهای مرسوم
در حالت معمول برای افزایش دقت از «تفکر موازی» استفاده میشود: صدها پاسخ تولید و سپس با رأیگیری بهترین انتخاب میشود. این کار درست است ولی توکن زیادی مصرف میکند.
اما DeepConf مسیر دیگری میرود:
♻️اعتماد هر توکن سنجیده میشود.
♻️بخشهای ضعیف همان ابتدا کنار گذاشته میشوند.
♻️تنها مسیرهای قوی ادامه پیدا میکنند.
♻️نتیجه: هم دقت بالاتر و هم کاهش مصرف توکن تا ۸۴.۷٪.
---
🔎 معیارهای اعتماد
♻️معیار Token confidence: اعتماد در هر مرحله
♻️معیار Group confidence: میانگین اعتماد در بازهها، برای کشف افتهای محلی
♻️معیار Tail confidence: اعتماد در انتهای استدلال، جایی که خطا بیشتر رخ میدهد
♻️معیار Lowest group confidence: پایینترین نقطه اعتماد، علامتی برای حذف زنجیره
---
⚡ حالتهای اجرا
♻️حالت Offline: چند پاسخ تولید میشود، سپس گزینههای با اعتماد بالا باقی میمانند.
♻️حالت Online: مدل در لحظه، اگر اعتماد پایین برود، تولید متن را متوقف میکند.
---
✅ نتیجهگیری
♻️مدل DeepConf یک افزونهی زمان اجراست؛ بدون نیاز به بازآموزی یا تغییر معماری.
♻️ترکیب عالی از دقت بیشتر و هزینه کمتر.
لینک
#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #DeepConf #کارایی
@rss_ai_ir
✅این روش با نام DeepConf شناخته میشود و ایدهی آن این است که مدل در حین تولید متن، خودش میزان «اعتماد» به هر توکن را محاسبه میکند و اگر در بخشی ضعف ببیند، همانجا زنجیرهی استدلال را قطع میکند.
---
📌 تفاوت با روشهای مرسوم
در حالت معمول برای افزایش دقت از «تفکر موازی» استفاده میشود: صدها پاسخ تولید و سپس با رأیگیری بهترین انتخاب میشود. این کار درست است ولی توکن زیادی مصرف میکند.
اما DeepConf مسیر دیگری میرود:
♻️اعتماد هر توکن سنجیده میشود.
♻️بخشهای ضعیف همان ابتدا کنار گذاشته میشوند.
♻️تنها مسیرهای قوی ادامه پیدا میکنند.
♻️نتیجه: هم دقت بالاتر و هم کاهش مصرف توکن تا ۸۴.۷٪.
---
🔎 معیارهای اعتماد
♻️معیار Token confidence: اعتماد در هر مرحله
♻️معیار Group confidence: میانگین اعتماد در بازهها، برای کشف افتهای محلی
♻️معیار Tail confidence: اعتماد در انتهای استدلال، جایی که خطا بیشتر رخ میدهد
♻️معیار Lowest group confidence: پایینترین نقطه اعتماد، علامتی برای حذف زنجیره
---
⚡ حالتهای اجرا
♻️حالت Offline: چند پاسخ تولید میشود، سپس گزینههای با اعتماد بالا باقی میمانند.
♻️حالت Online: مدل در لحظه، اگر اعتماد پایین برود، تولید متن را متوقف میکند.
---
✅ نتیجهگیری
♻️مدل DeepConf یک افزونهی زمان اجراست؛ بدون نیاز به بازآموزی یا تغییر معماری.
♻️ترکیب عالی از دقت بیشتر و هزینه کمتر.
لینک
#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #DeepConf #کارایی
@rss_ai_ir
👍10❤7🎉4🔥3😁3👏1🙏1