Tensorflow(@CVision)
DeepMindNature14236Paper.pdf
احتمالا قبلا در مورد هوش مصنوعی ای که بازی شطرنج بازی میکرد و اکثر بازیکنان حرفه ای شطرنج را برده شنیده اید! اما حقیقت این است که آن هوش مصنوعی تنها قادر بود شطرنج بازی کند و در واقع فقط برای آن بازی آموزش دیده بود و توانایی هیچ کار دیگری نداشت!
محققان گوگل در مقاله ی سال 2015 نیچر با استفاده از ایده ی #یادگیری_تقویتی شبکه عصبی طراحی کردند که قادر بود که خودش بازی ها را یاد بگیرد!
این هوش مصنوعی که به عنوان ورودی صفحه RGB بازی و به عنوان پاداش امتیاز کسب شده از بازی را دریافت میکرد، با 50 بازی آتاری تست شد و نتایج اعجاب انگیزی داشت!
نکته ی جالب این بود یک ساختار شبکه، توانسته بود خودش هر یک از بازی های آتاری را بیاموزد و در بسیاری از بازی ها از بهترین بازیکن ها ی این بازی ها بهتر بازی کند.
ویدیو نتایج بازی منتشر شده توسط google deepmind:
https://youtu.be/TmPfTpjtdgg
یا
http://deepnn.ir/tensorflow-telegram-files/DQN%20Breakout.mp4
با استفاده از ایدهی #یادگیری_تقویتی، نیاز به داده هایی که انسان در آن دست برده کم تر شده و مدل یا ربات میتواند خودش از دنیای پیرامون اطلاعات کسب کند. در این نوع یادگیری در نهایت تنها پاداش به مدل داده میشود.
#reinforcement_learning #rl #deepmind #atari
محققان گوگل در مقاله ی سال 2015 نیچر با استفاده از ایده ی #یادگیری_تقویتی شبکه عصبی طراحی کردند که قادر بود که خودش بازی ها را یاد بگیرد!
این هوش مصنوعی که به عنوان ورودی صفحه RGB بازی و به عنوان پاداش امتیاز کسب شده از بازی را دریافت میکرد، با 50 بازی آتاری تست شد و نتایج اعجاب انگیزی داشت!
نکته ی جالب این بود یک ساختار شبکه، توانسته بود خودش هر یک از بازی های آتاری را بیاموزد و در بسیاری از بازی ها از بهترین بازیکن ها ی این بازی ها بهتر بازی کند.
ویدیو نتایج بازی منتشر شده توسط google deepmind:
https://youtu.be/TmPfTpjtdgg
یا
http://deepnn.ir/tensorflow-telegram-files/DQN%20Breakout.mp4
با استفاده از ایدهی #یادگیری_تقویتی، نیاز به داده هایی که انسان در آن دست برده کم تر شده و مدل یا ربات میتواند خودش از دنیای پیرامون اطلاعات کسب کند. در این نوع یادگیری در نهایت تنها پاداش به مدل داده میشود.
#reinforcement_learning #rl #deepmind #atari
YouTube
DQN Breakout
This video illustrates the improvement in the performance of DQN over training (i.e. after 100, 200, 400 and 600 episodes). After 600 episodes DQN finds and exploits the optimal strategy in this game, which is to make a tunnel around the side, and then allow…
#آموزش #سورس_کد
مرتبط با تصویر
https://t.me/cvision/593
وقتی که گوگل کروم شما آفلاین است، یک بازی دایناسور روی صفحه میاد که با کلیک روش میتونید بازی را شروع کنید،
یکی با تنسرفلو، هوش مصنوعی نوشته که به خوبی این بازی را انجام میدهد،
ود هیچ محیط شبیه سازی نمیخواهد و مستقیم با اجرای مرورگرتان بازی را انجام میدهد.
https://vdutor.github.io/blog/2018/05/07/TF-rex.html
https://github.com/vdutor/tf-rex
#rl #reinforcement_learning #q_learning
مرتبط با تصویر
https://t.me/cvision/593
وقتی که گوگل کروم شما آفلاین است، یک بازی دایناسور روی صفحه میاد که با کلیک روش میتونید بازی را شروع کنید،
یکی با تنسرفلو، هوش مصنوعی نوشته که به خوبی این بازی را انجام میدهد،
ود هیچ محیط شبیه سازی نمیخواهد و مستقیم با اجرای مرورگرتان بازی را انجام میدهد.
https://vdutor.github.io/blog/2018/05/07/TF-rex.html
https://github.com/vdutor/tf-rex
#rl #reinforcement_learning #q_learning
Telegram
Tensorflow
https://t.me/cvision/592
انجام بازی دایناسور ،گوگل کروم با تنسرفلو
انجام بازی دایناسور ،گوگل کروم با تنسرفلو
This media is not supported in your browser
VIEW IN TELEGRAM
ویژگی های جدید تنسرفلو 2 برای پیاده سازی deep #RL
Good tutorial on showcasing the upcoming TensorFlow 2.0 features by implementing a deep #reinforcement learning example. The code looks really clean now especially with the way how you will create TF models in the future with tf.keras.Model.
http://inoryy.com/post/tensorflow2-deep-reinforcement-learning/
#tensorflow
Good tutorial on showcasing the upcoming TensorFlow 2.0 features by implementing a deep #reinforcement learning example. The code looks really clean now especially with the way how you will create TF models in the future with tf.keras.Model.
http://inoryy.com/post/tensorflow2-deep-reinforcement-learning/
#tensorflow