Forwarded from Digiato | دیجیاتو
🔸دیپسیک درحال آمادهسازی برای ایجاد تحولی جدید در حوزه هوش مصنوعی با مدلهای خودبهبوددهنده (Self-improving) است. چند ماه پیش، وقتی دیپسیک وارد عرصه شد، شرطبندی بزرگ وال استریت بر روی شرکتهای سازنده هوش مصنوعی مولد با چالشی جدی روبهرو شد. حالا شاید موجی تازه در راه باشد.
🔸مدل متنباز دیپسیک با وجود محدودیتهای فراوانی که داشت، نشان داد یک مدل هوش مصنوعی پیشرفته برای استدلال نیازی به میلیاردها دلار هزینه ندارد و با منابع نسبتا محدود هم میتوان آن را به اجرا درآورد.
🔸در مقالهای که بهتازگی منتشر شده، محققان دیپ سیک و دانشگاه چینهوا چین رویکردی جدید معرفی کردهاند که میتواند هوش مصنوعی را بهطور هوشمندتر و کارآمدتر بهبود بخشد. این فناوری به نام تنظیم نقادانه خوداصولمند (SPCT) شناخته میشود و از لحاظ فنی به نام مدلسازی پاداش مولد (GRM) معروف است.
🔸به زبان ساده، این روش بهنوعی شبیه ایجاد یک حلقه بازخورد لحظهای است. به عبارت دیگر، یک مدل هوش مصنوعی با افزایش اندازه در هنگام آموزش بهطور مداوم بهبود مییابد که البته این کار نیازمند منابع زیاد است.
🔸دیپسیک سیستمی معرفی کرده است که در آن یک «داور» داخلی، با استفاده از مجموعهای از نقدها و اصول مشخص، به مدل هوش مصنوعی کمک میکند تا پاسخهای دقیقتری به پرسشهای کاربران ارائه دهد. این نقدها سپس با قوانین ثابت مدل مقایسه میشوند و در صورت وجود تطابق بالا، سیگنال پاداش صادر میشود که باعث هدایت مدل به سوی عملکرد بهینهتر در مراحل بعدی میشود.
جزئیات بیشتر
Please open Telegram to view this post
VIEW IN TELEGRAM
از ChatGPT سوال کردم که آیا او قوی تر است یا Grok, Gemini, Copilot, Deep seek و پاسخش را ببینید 👇
مقایسه chatgpt, deep seek
مقایسه chatgpt , gemeni