ReinforcementLearning-@Computer_IT_Engineering.pdf
3.2 MB
کتاب آموزش یادگیری عمیق (انگلیسی) 334 صفحه، سال 2012
#کتاب #آموزش #یادگیری_تقویتی
#ReinforcementLearning #Reinforcement_Learning
@Computer_IT_Engineering
#کتاب #آموزش #یادگیری_تقویتی
#ReinforcementLearning #Reinforcement_Learning
@Computer_IT_Engineering
سی و سه مقاله به زبان انگلیسی در ارتباط یادگیری تقویتی با عناوین زیر:
1- Asynchronous Methods for Deep Reinforcement Learning (2016)
2- A Reinforcement Learning Approach for Dynamic Selection of Virtual Machines in Cloud Data Centres (2016)
3- Reinforcement learning approach for train rescheduling on a single-track railway (2016)
4-Dimensionality Reduced Reinforcement Learning for Assistive Robots (2016)
5- Reinforcement-Based Learning for Process Classification Task (2016)
6- In-Hand Robotic Manipulation via Deep Reinforcement Learning (2016)
7-Deep Reinforcement Learning with Double Q-Learning (2016)
8- Cooperative Inverse Reinforcement Learning (2016)
9- An Reinforcement Learning Algorithm for the Recognition of Unstructured Road (2016)
10- Deep Reinforcement Learning for Dialogue Generation (2016)
11- Dialogue manager domain adaptation using Gaussian process reinforcement learning (2016)
12- Safe and efficient off-policy reinforcement learning (2016)
13- Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning (2016)
14- Learning to Communicate with Deep Multi-Agent Reinforcement Learning (2016)
15- Reinforcement Learning with unsupervised Auxiliary tasks (2016)
16- Resource Management with Deep Reinforcement Learning (2016)
17- Multi-Focus Attention Network for Efficient Deep Reinforcement Learning (2017)
18- Guiding Reinforcement Learning Exploration Using Natural Language (2017)
19- Averaged-DQN: Variance Reduction and Stabilization for Deep Reinforcement Learning (2017)
20- Imagination-Augmented Agents for Deep Reinforcement Learning (2017)
21- FeUdal Networks for Hierarchical Reinforcement Learning (2017)
22- Bellman Gradient Iteration for Inverse Reinforcement Learning (2017)
23- Knowledge Sharing for Reinforcement Learning (2017)
24-Neural Network Based Reinforcement Learning Acceleration on FPGA Platforms (2017)
25-Enhanced Experience Replay Generation for Efficient Reinforcement Learning (2017)
26- Neural Architecture Search With Reinforcement Learning (2017)
27- Emotion in Reinforcement Learning Agents and Robots: A Survey. (2017)
28- A Survey on Reinforcement Learning Models and Algorithms for Traffic Signal Control (2017)
29- Survey of Model-Based Reinforcement Learning: Applications on Robotics (2017)
30- Reinforcement Learning for Visual Object Detection (2017)
31- Universal Reinforcement Learning Algorithms: Survey and Experiments (2017)
32- Fairness in Reinforcement Learning (2017)
33- A Brief Survey of Deep Reinforcement Learning (2017)
#مقاله #یادگیری_تقویتی #یادگیری_تقویتی_عمیق
#Paper #ReinforcementLearning #Reinforcement_Learning #DeepReinforcementLearning
@Computer_IT_Engineering
1- Asynchronous Methods for Deep Reinforcement Learning (2016)
2- A Reinforcement Learning Approach for Dynamic Selection of Virtual Machines in Cloud Data Centres (2016)
3- Reinforcement learning approach for train rescheduling on a single-track railway (2016)
4-Dimensionality Reduced Reinforcement Learning for Assistive Robots (2016)
5- Reinforcement-Based Learning for Process Classification Task (2016)
6- In-Hand Robotic Manipulation via Deep Reinforcement Learning (2016)
7-Deep Reinforcement Learning with Double Q-Learning (2016)
8- Cooperative Inverse Reinforcement Learning (2016)
9- An Reinforcement Learning Algorithm for the Recognition of Unstructured Road (2016)
10- Deep Reinforcement Learning for Dialogue Generation (2016)
11- Dialogue manager domain adaptation using Gaussian process reinforcement learning (2016)
12- Safe and efficient off-policy reinforcement learning (2016)
13- Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning (2016)
14- Learning to Communicate with Deep Multi-Agent Reinforcement Learning (2016)
15- Reinforcement Learning with unsupervised Auxiliary tasks (2016)
16- Resource Management with Deep Reinforcement Learning (2016)
17- Multi-Focus Attention Network for Efficient Deep Reinforcement Learning (2017)
18- Guiding Reinforcement Learning Exploration Using Natural Language (2017)
19- Averaged-DQN: Variance Reduction and Stabilization for Deep Reinforcement Learning (2017)
20- Imagination-Augmented Agents for Deep Reinforcement Learning (2017)
21- FeUdal Networks for Hierarchical Reinforcement Learning (2017)
22- Bellman Gradient Iteration for Inverse Reinforcement Learning (2017)
23- Knowledge Sharing for Reinforcement Learning (2017)
24-Neural Network Based Reinforcement Learning Acceleration on FPGA Platforms (2017)
25-Enhanced Experience Replay Generation for Efficient Reinforcement Learning (2017)
26- Neural Architecture Search With Reinforcement Learning (2017)
27- Emotion in Reinforcement Learning Agents and Robots: A Survey. (2017)
28- A Survey on Reinforcement Learning Models and Algorithms for Traffic Signal Control (2017)
29- Survey of Model-Based Reinforcement Learning: Applications on Robotics (2017)
30- Reinforcement Learning for Visual Object Detection (2017)
31- Universal Reinforcement Learning Algorithms: Survey and Experiments (2017)
32- Fairness in Reinforcement Learning (2017)
33- A Brief Survey of Deep Reinforcement Learning (2017)
#مقاله #یادگیری_تقویتی #یادگیری_تقویتی_عمیق
#Paper #ReinforcementLearning #Reinforcement_Learning #DeepReinforcementLearning
@Computer_IT_Engineering
Reinforcement.Learning-@Computer_IT_Engineering.rar
44.6 MB
سی و سه مقاله در ارتباط با یادگیری تقویتی (انگلیسی) سال های 2016 و2017
#مقاله #یادگیری_تقویتی
#Paper #ReinforcementLearning #Reinforcement_Learning #DeepReinforcementLearning
@Computer_IT_Engineering
#مقاله #یادگیری_تقویتی
#Paper #ReinforcementLearning #Reinforcement_Learning #DeepReinforcementLearning
@Computer_IT_Engineering
فیلم های آموزشی هوش مصنوعی (فارسی) دکتر مهدیه سلیمانی از مکتبخانه، 25 قسمت، کیفیت خوب، همه با حجم 5.3GB
لیست وسرفصل های 25 جلسه:
✅جلسه اول - مقدمه، سرفصل مطالب و تاریخچه
✅جلسه دوم - آشنایی با عامل های هوشمند و خواص محیط
✅جلسه سوم - ادامه بحث عامل های هوشمند، شروع بحث حل مساله با جستجو (search)
جلسه چهارم - روش های جستجوی ناآگاهانه (uninformed)
✅جلسه پنجم - ادامه روش های جستجوی ناآگاهانه (uninformded) و معرفی اولیه A*
✅جلسه ششم - الگوریتم *A، اثبات بهینگی و خواص تابع اکتشافی (heuristic function)
✅جلسه هفتم - طراحی تابع اکتشافی و شروع بحث جستجوی محلی (local search)
جلسه هشتم - روشهای جستجوی محلی (local search)
✅جلسه نهم - جستجو در محیط های نيمه مشاهدهپذير (partially observable) و و غير قطعی (non-deterministic)
✅جلسه دهم - جستجوی برخط (online search)
✅جلسه یازدهم - - جستجوی در مقابل حریف (adversarial search)
✅جلسه دوازدهم - ادامه بحث جستجوی در مقابل حریف، شروع بحث معرفی مسایل ارضا محدودیت (csp)
✅جلسه سیزدهم - حل مسایل ارضای محدودیت (csp) (1)
✅جلسه چهاردهم - حل مسایل ارضای محدودیت (csp) (2)
✅جلسه پانزدهم - نکاتی در حل مسایل ارضای محدودیت (csp) و شروع بحث عاملهای منطقی و منطق گزارهای
✅جلسه شانزدهم - استنتاج در منطق گزارهای
✅جلسه هفدهم - عامل منطقی و منطق مرتبه اول
✅جلسه هجدهم - منطق مرتبه اول و استنتاج در منطق مرتبه اول
✅جلسه نوزدهم - استنتاج در منطق مرتبه اول
✅جلسه بیستم - برنامه ریزی
✅جلسه بیست و یکم - گراف برنامه ریزی
✅جلسه بیست ودوم - برنامه ریزSAT Plan و pop
✅جلسه بیست و سوم - نمایش دانش احتمالی و استنتاج در دانش احتمالی
✅جلسه بیست و چهارم
✅جلسه بیست و پنجم - تصمیم گیری در محیط های غیر قطعی(یادگیری تقویتی)
#ویدئو #فیلم #هوش_مصنوعی #هوش_مصنوعی #عامل_هوشمند #جستجو_مکاشفه_ای #جستجو_محلی #عامل_منطقی #یادگیری_تقویتی
#Video #Artificial_Intelligence #ArtificialIntelligence #AI #Intelligen_Agent #Heuristics #local_Search #ConstraintSatisfactionProblems #CSP #logicalAgent #ReinforcementLearning #Reinforcement_Learning
@Computer_IT_Engineering
لیست وسرفصل های 25 جلسه:
✅جلسه اول - مقدمه، سرفصل مطالب و تاریخچه
✅جلسه دوم - آشنایی با عامل های هوشمند و خواص محیط
✅جلسه سوم - ادامه بحث عامل های هوشمند، شروع بحث حل مساله با جستجو (search)
جلسه چهارم - روش های جستجوی ناآگاهانه (uninformed)
✅جلسه پنجم - ادامه روش های جستجوی ناآگاهانه (uninformded) و معرفی اولیه A*
✅جلسه ششم - الگوریتم *A، اثبات بهینگی و خواص تابع اکتشافی (heuristic function)
✅جلسه هفتم - طراحی تابع اکتشافی و شروع بحث جستجوی محلی (local search)
جلسه هشتم - روشهای جستجوی محلی (local search)
✅جلسه نهم - جستجو در محیط های نيمه مشاهدهپذير (partially observable) و و غير قطعی (non-deterministic)
✅جلسه دهم - جستجوی برخط (online search)
✅جلسه یازدهم - - جستجوی در مقابل حریف (adversarial search)
✅جلسه دوازدهم - ادامه بحث جستجوی در مقابل حریف، شروع بحث معرفی مسایل ارضا محدودیت (csp)
✅جلسه سیزدهم - حل مسایل ارضای محدودیت (csp) (1)
✅جلسه چهاردهم - حل مسایل ارضای محدودیت (csp) (2)
✅جلسه پانزدهم - نکاتی در حل مسایل ارضای محدودیت (csp) و شروع بحث عاملهای منطقی و منطق گزارهای
✅جلسه شانزدهم - استنتاج در منطق گزارهای
✅جلسه هفدهم - عامل منطقی و منطق مرتبه اول
✅جلسه هجدهم - منطق مرتبه اول و استنتاج در منطق مرتبه اول
✅جلسه نوزدهم - استنتاج در منطق مرتبه اول
✅جلسه بیستم - برنامه ریزی
✅جلسه بیست و یکم - گراف برنامه ریزی
✅جلسه بیست ودوم - برنامه ریزSAT Plan و pop
✅جلسه بیست و سوم - نمایش دانش احتمالی و استنتاج در دانش احتمالی
✅جلسه بیست و چهارم
✅جلسه بیست و پنجم - تصمیم گیری در محیط های غیر قطعی(یادگیری تقویتی)
#ویدئو #فیلم #هوش_مصنوعی #هوش_مصنوعی #عامل_هوشمند #جستجو_مکاشفه_ای #جستجو_محلی #عامل_منطقی #یادگیری_تقویتی
#Video #Artificial_Intelligence #ArtificialIntelligence #AI #Intelligen_Agent #Heuristics #local_Search #ConstraintSatisfactionProblems #CSP #logicalAgent #ReinforcementLearning #Reinforcement_Learning
@Computer_IT_Engineering