BME DOC📚
10.1K subscribers
645 photos
793 videos
1.89K files
903 links
کانالی برای جزوه...کلاس درسی...کتاب و هر چیز اموزشی مربوط به مهندسی
@BMEDOC_ADMIN
Support Our Mission 🤝🏻 Donate:
www.coffeete.ir/BMEDOC
Download Telegram
یادگیری عمیق نوعی از هوش مصنوعی (AI) است که به رایانه‌ها یاد می‌دهد که با مثال یاد بگیرند، مشابه آنچه که انسان‌ها از تجربه یاد می‌گیرند. در قلب یادگیری عمیق شبکه های عصبی مصنوعی قرار دارند که از ساختار و عملکرد مغز انسان الهام گرفته شده اند. این شبکه ها از لایه هایی از گره های به هم پیوسته به نام نورون ها تشکیل شده اند که برای پردازش اطلاعات و تصمیم گیری با هم کار می کنند.

یک شبکه عصبی را به عنوان مجموعه ای از اتاق های به هم پیوسته تصور کنید که در آن هر اتاق نمایانگر لایه ای از نورون ها است. وقتی وارد اتاق اول می شوید، با یک کار یا یک سوال روبرو می شوید. هر نورون در این اتاق قسمت کوچکی از اطلاعات را تجزیه و تحلیل می کند و یافته های خود را برای نورون های اتاق بعدی ارسال می کند. این روند در هر اتاق تا اتاق نهایی ادامه می یابد، جایی که نتایج با هم ترکیب می شوند و یک تصمیم یا پاسخ تولید می شود.

برای آموزش مدل یادگیری عمیق به حجم زیادی داده نیاز دارید که به آن داده های آموزشی گفته می شود که به ورودی و خروجی تقسیم می شوند. ورودی ها اطلاعات خام هستند و خروجی ها نتایج یا تصمیمات مورد نظر هستند. مدل نمونه هایی از داده های آموزشی نشان داده می شود و اتصالات بین نورون های خود را تنظیم می کند تا تفاوت بین پیش بینی های خود و خروجی های صحیح را به حداقل برساند. این training process نامیده می شود و ممکن است هزاران یا میلیون ها مثال طول بکشد تا مدل الگوها یا رفتار مورد نظر را بیاموزد.

هنگامی که مدل یادگیری عمیق آموزش داده شد، می توان از آن برای پیش بینی یا تصمیم گیری بر اساس داده های جدید و قبلاً دیده نشده استفاده کرد. این توانایی تعمیم از تجربیات گذشته چیزی است که مدل‌های یادگیری عمیق را بسیار قدرتمند و به طور گسترده در کاربردهای مختلف مانند تشخیص تصویر، NLP استفاده می‌کند.
یادگیری تقویتی یا Reinforcement learning نوعی هوش مصنوعی (AI) است که به رایانه‌ها یاد می‌دهد تا با تعامل با محیط خود و کشف بهترین اقدامات بر اساس آزمون و خطا، یاد بگیرند. مانند آموزش دوچرخه سواری به کودک است، جایی که از اشتباهات خود درس می گیرد و به مرور زمان مهارت های خود را بهبود می بخشد.

در Reinforcement learning، یک عامل (یادگیرنده) وجود دارد که با یک محیط تعامل دارد. عامل تصمیم می گیرد یا اقداماتی را انجام می دهد و محیط با ارائه بازخورد در قالب پاداش یا مجازات به این اقدامات پاسخ می دهد. هدف نماینده این است که بهترین توالی اقدامات را بیاموزد تا مجموع پاداش‌هایی را که در طول زمان دریافت می‌کند به حداکثر برساند.

رباتی را تصور کنید که سعی دارد در یک پیچ و خم حرکت کند. ربات عامل است و پیچ و خم محیط است. ربات می تواند اقدامات مختلفی مانند حرکت به جلو، چرخش به چپ یا چرخش به راست انجام دهد. هنگامی که ربات حرکت می کند، ممکن است به دیوار برخورد کند و جریمه کوچکی دریافت کند، یا ممکن است خروجی را پیدا کند و پاداش بزرگی دریافت کند. هدف ربات یادگیری بهترین مسیر برای رسیدن به خروجی در سریع ترین زمان ممکن و با کمترین تعداد پنالتی است.

برای رسیدن به این هدف، عامل از استراتژی به نام سیاست استفاده می کند که مجموعه ای از قوانین یا دستورالعمل ها برای انتخاب اقدامات بر اساس وضعیت فعلی است. در ابتدا، سیاست عامل ممکن است تصادفی یا ناآگاه باشد، به این معنی که اقدامات مختلفی را بدون اطلاع از عواقب آنها امتحان می کند. همانطور که عامل با محیط تعامل می کند و تجربیات بیشتری را جمع آوری می کند، خط مشی خود را به روز می کند تا اقداماتی را انتخاب کند که به احتمال زیاد منجر به پاداش بیشتر شود.

یادگیری تقویتی در کاربردهای مختلفی مانند روباتیک، بازی کردن و سیستم های توصیه استفاده شده است. این یک راه قدرتمند برای آموزش کامپیوترها برای یادگیری از تجربیاتشان، انطباق با محیط های متغیر و تصمیم گیری هوشمندانه است که شانس موفقیت آنها را به حداکثر می رساند.

ویدوی زیر رو ببینید که شرکت deep mind برای روبات بازیکنش پخش کرده:
بر مبنای تعریف RL بهترین ماری که ربات می‌تونه انجام بده که بتونه با خیال راحت گل بزنه اینه که یه لگد به آدمه بزنه و بگه «میذاری با خیال راحت بازیمون رو بکنیم یا نه؟عههههه»
This media is not supported in your browser
VIEW IN TELEGRAM
ویدوی مربوط به یادگیری تقویتی یا
Reinforcement learning😂😂😂😂
Robotic - Final (00-01) .pdf
231.6 KB
فاینالترم رباتیک 1
Final-exam.pdf
411.1 KB
فاینالترم رباتیک 2
مدار منطقی.pdf
48 MB
جزوه مدار منطقی دکتر راعی-دانشگاه صنعتی امیرکبیر
08f44ad1-9e12-4ce2-95cc-594f56c12383.pdf
14.1 MB
جزوه دکتر شاه منصوری دانشگاه تهران
computer_sharif_digital circuit.rar
17.9 MB
جزوه مدار منطقی دانشکده کامپیوتر دانشگاه صنعتی شریف
midsamples.rar
7 MB
نمونه سوالات میان ترم دکتر تابنده دانشگاه صنعتی شریف
👍1
پایانترم ها.rar
11 MB
نمونه سوالات پایان ترم دکتر تابنده دانشگاه صنعتی شریف
تمرین_و_جزوات_دانشگاه_تهران_و_شریف.rar
1.1 MB
نمونه تمرین دانشگاه صنعتی شریف و تهران
تمرین های دکتر تابنده.rar
6.3 MB
نمونه تمرین های دکتر تابنده-دانشگاه شریف
midterm.rar
1.3 MB
نمونه سوالات میان دکتر حسابی، همت یار و ارشدی دانشکده کامپیوتر دانشگاه صنعتی شریف
نمونه_تمرین_های_دانشگده_کامپیوتر_دانشگاه_صنعتی_شریف.rar
3.3 MB
نمونه تمرین های دانشکده کامپیوتر دانشگاه صنعتی شریف
نمونه_سوالات_میان_ترم_مدار_منطقی_دانشکده_برق_دانشگاه_صنعتی_شریف.rar
2 MB
نمونه سوالات میان ترم مدار منطقی دانشکده برق دانشگاه صنعتی شریف
نمونه_سوالات_مدار_منطقی_دانشکده_برق_دانشگاه_صنعتی_شریف.rar
4.3 MB
نمونه سوالات مدار منطقی دانشکده برق دانشگاه صنعتی شریف