کانال یادگیری عمیق؛ کلان داده؛ هوش مصنوعی AI; Deep leaarning, Big data

⏺

دیپ‌سیک برای نسل بعدی هوش مصنوعی آماده می‌شود: مدل‌های خودبهبوددهنده

🔸دیپ‌‌سیک درحال آماده‌سازی برای ایجاد تحولی جدید در حوزه هوش مصنوعی با مدل‌های خودبهبوددهنده (Self-improving) است. چند ماه پیش، وقتی دیپ‌‌سیک وارد عرصه شد، شرط‌بندی بزرگ وال استریت بر روی شرکت‌های سازنده هوش مصنوعی مولد با چالشی جدی روبه‌رو شد. حالا شاید موجی تازه در راه باشد.

🔸مدل متن‌باز دیپ‌سیک با وجود محدودیت‌های فراوانی که داشت، نشان داد یک مدل هوش مصنوعی پیشرفته برای استدلال نیازی به میلیاردها دلار هزینه ندارد و با منابع نسبتا محدود هم می‌توان آن را به اجرا درآورد.

🔸در مقاله‌ای که به‌تازگی منتشر شده، محققان دیپ‌ سیک و دانشگاه چینهوا چین رویکردی جدید معرفی کرده‌اند که می‌تواند هوش مصنوعی را به‌طور هوشمندتر و کارآمدتر بهبود بخشد. این فناوری به نام تنظیم نقادانه خوداصول‌مند (SPCT) شناخته می‌شود و از لحاظ فنی به نام مدل‌سازی پاداش مولد (GRM) معروف است.

🔸به زبان ساده، این روش به‌نوعی شبیه ایجاد یک حلقه بازخورد لحظه‌ای است. به عبارت دیگر، یک مدل هوش مصنوعی با افزایش اندازه در هنگام آموزش به‌طور مداوم بهبود می‌یابد که البته این کار نیازمند منابع زیاد است.

🔸دیپ‌سیک سیستمی معرفی کرده است که در آن یک «داور» داخلی، با استفاده از مجموعه‌ای از نقدها و اصول مشخص، به مدل هوش مصنوعی کمک می‌کند تا پاسخ‌های دقیق‌تری به پرسش‌های کاربران ارائه دهد. این نقدها سپس با قوانین ثابت مدل مقایسه می‌شوند و در صورت وجود تطابق بالا، سیگنال پاداش صادر می‌شود که باعث هدایت مدل به سوی عملکرد بهینه‌تر در مراحل بعدی می‌شود.

جزئیات بیشتر

🔸

🟣

Digiato

🎞

Digiatoofficial

🤖

Digiato

💭

@Digiato

Please open Telegram to view this post

VIEW IN TELEGRAM

287 views13:32