خبرنامه هوش مصنوعی دومان

دستاورد NVIDIA در آموزش ربات با استفاده از LLM و RL

در مقاله جدید منتشر شده توسط NVIDIA روشی به نام Eureka برای آموزش ربات معرفی شد. این روش با استفاده از GPT-4 کد تابع پاداش را برای ربات در محیط یادگیری می‌نویسد. در یادگیری تقویتی تابع پاداش (Reward Function) سازوکاری برای یادگیری ربات از فعالیت‌های خود را فراهم می‌کند به طوری که ربات می‌تواند با دریافت فیدبک از محیط به مرور رفتار مناسب را برای دریافت بیشترین پاداش یاد بگیرد. این پروژه در شبیه‌ساز فیزیک NVIDIA برای یادگیری تقویتی موسوم به Isaac Gym انجام شده است. برای مطالعه جزئیات فنی به اینجا مراجعه کنید.

#nvidia
#eureka

@dumannewsletter

395 viewsedited 18:46

About

Blog

Apps

Platform