This media is not supported in your browser
VIEW IN TELEGRAM
دستاورد NVIDIA در آموزش ربات با استفاده از LLM و RL
در مقاله جدید منتشر شده توسط NVIDIA روشی به نام Eureka برای آموزش ربات معرفی شد. این روش با استفاده از GPT-4 کد تابع پاداش را برای ربات در محیط یادگیری مینویسد. در یادگیری تقویتی تابع پاداش (Reward Function) سازوکاری برای یادگیری ربات از فعالیتهای خود را فراهم میکند به طوری که ربات میتواند با دریافت فیدبک از محیط به مرور رفتار مناسب را برای دریافت بیشترین پاداش یاد بگیرد. این پروژه در شبیهساز فیزیک NVIDIA برای یادگیری تقویتی موسوم به Isaac Gym انجام شده است. برای مطالعه جزئیات فنی به اینجا مراجعه کنید.
#nvidia
#eureka
@dumannewsletter
در مقاله جدید منتشر شده توسط NVIDIA روشی به نام Eureka برای آموزش ربات معرفی شد. این روش با استفاده از GPT-4 کد تابع پاداش را برای ربات در محیط یادگیری مینویسد. در یادگیری تقویتی تابع پاداش (Reward Function) سازوکاری برای یادگیری ربات از فعالیتهای خود را فراهم میکند به طوری که ربات میتواند با دریافت فیدبک از محیط به مرور رفتار مناسب را برای دریافت بیشترین پاداش یاد بگیرد. این پروژه در شبیهساز فیزیک NVIDIA برای یادگیری تقویتی موسوم به Isaac Gym انجام شده است. برای مطالعه جزئیات فنی به اینجا مراجعه کنید.
#nvidia
#eureka
@dumannewsletter