BME DOC📚

رباتیک
دکتر طالبی

Craig_J_J_Introduction_to_Robotics_Mechanics_and_Control_3ed_PH.pdf

4.1 MB

رباتیک
کریگ

Beginning_Robotics_with_Raspberry_Pi_and_Arduino_Using_Python_and.pdf

7.9 MB

رباتیک مقدماتی با رزبری پای و اردوینو

Make_an_Arduino_Controlled_Robot_Michael_Margolis_Z_Library.pdf

19.2 MB

رباتیک با اردوینو

3.88K views19:24

BME DOC📚

یادگیری عمیق نوعی از هوش مصنوعی (AI) است که به رایانه‌ها یاد می‌دهد که با مثال یاد بگیرند، مشابه آنچه که انسان‌ها از تجربه یاد می‌گیرند. در قلب یادگیری عمیق شبکه های عصبی مصنوعی قرار دارند که از ساختار و عملکرد مغز انسان الهام گرفته شده اند. این شبکه ها از لایه هایی از گره های به هم پیوسته به نام نورون ها تشکیل شده اند که برای پردازش اطلاعات و تصمیم گیری با هم کار می کنند.

یک شبکه عصبی را به عنوان مجموعه ای از اتاق های به هم پیوسته تصور کنید که در آن هر اتاق نمایانگر لایه ای از نورون ها است. وقتی وارد اتاق اول می شوید، با یک کار یا یک سوال روبرو می شوید. هر نورون در این اتاق قسمت کوچکی از اطلاعات را تجزیه و تحلیل می کند و یافته های خود را برای نورون های اتاق بعدی ارسال می کند. این روند در هر اتاق تا اتاق نهایی ادامه می یابد، جایی که نتایج با هم ترکیب می شوند و یک تصمیم یا پاسخ تولید می شود.

برای آموزش مدل یادگیری عمیق به حجم زیادی داده نیاز دارید که به آن داده های آموزشی گفته می شود که به ورودی و خروجی تقسیم می شوند. ورودی ها اطلاعات خام هستند و خروجی ها نتایج یا تصمیمات مورد نظر هستند. مدل نمونه هایی از داده های آموزشی نشان داده می شود و اتصالات بین نورون های خود را تنظیم می کند تا تفاوت بین پیش بینی های خود و خروجی های صحیح را به حداقل برساند. این training process نامیده می شود و ممکن است هزاران یا میلیون ها مثال طول بکشد تا مدل الگوها یا رفتار مورد نظر را بیاموزد.

هنگامی که مدل یادگیری عمیق آموزش داده شد، می توان از آن برای پیش بینی یا تصمیم گیری بر اساس داده های جدید و قبلاً دیده نشده استفاده کرد. این توانایی تعمیم از تجربیات گذشته چیزی است که مدل‌های یادگیری عمیق را بسیار قدرتمند و به طور گسترده در کاربردهای مختلف مانند تشخیص تصویر، NLP استفاده می‌کند.

2.44K views19:24

BME DOC📚

یادگیری تقویتی یا Reinforcement learning نوعی هوش مصنوعی (AI) است که به رایانه‌ها یاد می‌دهد تا با تعامل با محیط خود و کشف بهترین اقدامات بر اساس آزمون و خطا، یاد بگیرند. مانند آموزش دوچرخه سواری به کودک است، جایی که از اشتباهات خود درس می گیرد و به مرور زمان مهارت های خود را بهبود می بخشد.

در Reinforcement learning، یک عامل (یادگیرنده) وجود دارد که با یک محیط تعامل دارد. عامل تصمیم می گیرد یا اقداماتی را انجام می دهد و محیط با ارائه بازخورد در قالب پاداش یا مجازات به این اقدامات پاسخ می دهد. هدف نماینده این است که بهترین توالی اقدامات را بیاموزد تا مجموع پاداش‌هایی را که در طول زمان دریافت می‌کند به حداکثر برساند.

رباتی را تصور کنید که سعی دارد در یک پیچ و خم حرکت کند. ربات عامل است و پیچ و خم محیط است. ربات می تواند اقدامات مختلفی مانند حرکت به جلو، چرخش به چپ یا چرخش به راست انجام دهد. هنگامی که ربات حرکت می کند، ممکن است به دیوار برخورد کند و جریمه کوچکی دریافت کند، یا ممکن است خروجی را پیدا کند و پاداش بزرگی دریافت کند. هدف ربات یادگیری بهترین مسیر برای رسیدن به خروجی در سریع ترین زمان ممکن و با کمترین تعداد پنالتی است.

برای رسیدن به این هدف، عامل از استراتژی به نام سیاست استفاده می کند که مجموعه ای از قوانین یا دستورالعمل ها برای انتخاب اقدامات بر اساس وضعیت فعلی است. در ابتدا، سیاست عامل ممکن است تصادفی یا ناآگاه باشد، به این معنی که اقدامات مختلفی را بدون اطلاع از عواقب آنها امتحان می کند. همانطور که عامل با محیط تعامل می کند و تجربیات بیشتری را جمع آوری می کند، خط مشی خود را به روز می کند تا اقداماتی را انتخاب کند که به احتمال زیاد منجر به پاداش بیشتر شود.

یادگیری تقویتی در کاربردهای مختلفی مانند روباتیک، بازی کردن و سیستم های توصیه استفاده شده است. این یک راه قدرتمند برای آموزش کامپیوترها برای یادگیری از تجربیاتشان، انطباق با محیط های متغیر و تصمیم گیری هوشمندانه است که شانس موفقیت آنها را به حداکثر می رساند.

ویدوی زیر رو ببینید که شرکت deep mind برای روبات بازیکنش پخش کرده:
بر مبنای تعریف RL بهترین ماری که ربات می‌تونه انجام بده که بتونه با خیال راحت گل بزنه اینه که یه لگد به آدمه بزنه و بگه «میذاری با خیال راحت بازیمون رو بکنیم یا نه؟عههههه»

1.9K views19:24