Deep Learning 2016: The Year in Review
http://www.deeplearningweekly.com/blog/deep-learning-2016-the-year-in-review
✔️ #Unsupervised and #Reinforcement Learning
✔️ Deep Reinforcement Learning
✔️ #Generative Models
✔️ Continued Openness in AI development
✔️ Partnerships & Acquisitions
✔️ Hardware & Chips
(by Jan Bussieck on December 31, 2016)
In order to understand trends in the field, I find it helpful to think of developments in #deep_learning as being driven by three major frontiers that limit the success of #artificial_intelligence in general and deep learning in particular. Firstly, there is the available #computing power and #infrastructure, such as fast #GPUs, cloud services providers (have you checked out Amazon's new #EC2 P2 instance ?) and tools (#Tensorflow, #Torch, #Keras etc), secondly, there is the amount and quality of the training data and thirdly, the algorithms (#CNN, #LSTM, #SGD) using the training data and running on the hardware. Invariably behind every new development or advancement, lies an expansion of one of these frontiers.
...
http://www.deeplearningweekly.com/blog/deep-learning-2016-the-year-in-review
✔️ #Unsupervised and #Reinforcement Learning
✔️ Deep Reinforcement Learning
✔️ #Generative Models
✔️ Continued Openness in AI development
✔️ Partnerships & Acquisitions
✔️ Hardware & Chips
(by Jan Bussieck on December 31, 2016)
In order to understand trends in the field, I find it helpful to think of developments in #deep_learning as being driven by three major frontiers that limit the success of #artificial_intelligence in general and deep learning in particular. Firstly, there is the available #computing power and #infrastructure, such as fast #GPUs, cloud services providers (have you checked out Amazon's new #EC2 P2 instance ?) and tools (#Tensorflow, #Torch, #Keras etc), secondly, there is the amount and quality of the training data and thirdly, the algorithms (#CNN, #LSTM, #SGD) using the training data and running on the hardware. Invariably behind every new development or advancement, lies an expansion of one of these frontiers.
...
Deeplearningweekly
Deep Learning 2016: The Year in Review | Deep Learning Weekly
A weekly newsletter about the latest developments in Deep Learning
Tensorflow(@CVision)
DeepMindNature14236Paper.pdf
احتمالا قبلا در مورد هوش مصنوعی ای که بازی شطرنج بازی میکرد و اکثر بازیکنان حرفه ای شطرنج را برده شنیده اید! اما حقیقت این است که آن هوش مصنوعی تنها قادر بود شطرنج بازی کند و در واقع فقط برای آن بازی آموزش دیده بود و توانایی هیچ کار دیگری نداشت!
محققان گوگل در مقاله ی سال 2015 نیچر با استفاده از ایده ی #یادگیری_تقویتی شبکه عصبی طراحی کردند که قادر بود که خودش بازی ها را یاد بگیرد!
این هوش مصنوعی که به عنوان ورودی صفحه RGB بازی و به عنوان پاداش امتیاز کسب شده از بازی را دریافت میکرد، با 50 بازی آتاری تست شد و نتایج اعجاب انگیزی داشت!
نکته ی جالب این بود یک ساختار شبکه، توانسته بود خودش هر یک از بازی های آتاری را بیاموزد و در بسیاری از بازی ها از بهترین بازیکن ها ی این بازی ها بهتر بازی کند.
ویدیو نتایج بازی منتشر شده توسط google deepmind:
https://youtu.be/TmPfTpjtdgg
یا
http://deepnn.ir/tensorflow-telegram-files/DQN%20Breakout.mp4
با استفاده از ایدهی #یادگیری_تقویتی، نیاز به داده هایی که انسان در آن دست برده کم تر شده و مدل یا ربات میتواند خودش از دنیای پیرامون اطلاعات کسب کند. در این نوع یادگیری در نهایت تنها پاداش به مدل داده میشود.
#reinforcement_learning #rl #deepmind #atari
محققان گوگل در مقاله ی سال 2015 نیچر با استفاده از ایده ی #یادگیری_تقویتی شبکه عصبی طراحی کردند که قادر بود که خودش بازی ها را یاد بگیرد!
این هوش مصنوعی که به عنوان ورودی صفحه RGB بازی و به عنوان پاداش امتیاز کسب شده از بازی را دریافت میکرد، با 50 بازی آتاری تست شد و نتایج اعجاب انگیزی داشت!
نکته ی جالب این بود یک ساختار شبکه، توانسته بود خودش هر یک از بازی های آتاری را بیاموزد و در بسیاری از بازی ها از بهترین بازیکن ها ی این بازی ها بهتر بازی کند.
ویدیو نتایج بازی منتشر شده توسط google deepmind:
https://youtu.be/TmPfTpjtdgg
یا
http://deepnn.ir/tensorflow-telegram-files/DQN%20Breakout.mp4
با استفاده از ایدهی #یادگیری_تقویتی، نیاز به داده هایی که انسان در آن دست برده کم تر شده و مدل یا ربات میتواند خودش از دنیای پیرامون اطلاعات کسب کند. در این نوع یادگیری در نهایت تنها پاداش به مدل داده میشود.
#reinforcement_learning #rl #deepmind #atari
YouTube
DQN Breakout
This video illustrates the improvement in the performance of DQN over training (i.e. after 100, 200, 400 and 600 episodes). After 600 episodes DQN finds and exploits the optimal strategy in this game, which is to make a tunnel around the side, and then allow…
منابع مفید برای شروع #یادگیری_تقویتی
#مسیر_یادگیری، #منابع، #کورس
⭕️Resources for #Reinforcement_Learning:
Wikipedia Article for General Info on Reinforcement Learning
https://stackoverflow.com/questions/43288550/iopub-data-rate-exceeded-when-viewing-image-in-jupyter-notebook
Simpler Reinforcement Learning API with #Keras. It's a lot easier to play with this than manually implement techniques in #TensorFlow.
https://github.com/matthiasplappert/keras-rl
Huge Repo of Implemented RL Algos:
https://github.com/dennybritz/reinforcement-learning
#Berkeley #Course on RL and DL:
http://rll.berkeley.edu/deeprlcourse/
Nice Series of Articles on RL:
https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part-0-q-learning-with-tables-and-neural-networks-d195264329d0
Some great books on RL:
* Richard S. Sutton and Andrew G. Barto. Reinforcement Learning.
* Stuart J. Russell and Peter Norvig. Artificial Intelligence. A Modern Approach.
* Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning.
#مسیر_یادگیری، #منابع، #کورس
⭕️Resources for #Reinforcement_Learning:
Wikipedia Article for General Info on Reinforcement Learning
https://stackoverflow.com/questions/43288550/iopub-data-rate-exceeded-when-viewing-image-in-jupyter-notebook
Simpler Reinforcement Learning API with #Keras. It's a lot easier to play with this than manually implement techniques in #TensorFlow.
https://github.com/matthiasplappert/keras-rl
Huge Repo of Implemented RL Algos:
https://github.com/dennybritz/reinforcement-learning
#Berkeley #Course on RL and DL:
http://rll.berkeley.edu/deeprlcourse/
Nice Series of Articles on RL:
https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part-0-q-learning-with-tables-and-neural-networks-d195264329d0
Some great books on RL:
* Richard S. Sutton and Andrew G. Barto. Reinforcement Learning.
* Stuart J. Russell and Peter Norvig. Artificial Intelligence. A Modern Approach.
* Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning.
Stack Overflow
IOPub data rate exceeded in Jupyter notebook (when viewing image)
I want to view an image in Jupyter notebook. It's a 9.9MB .png file.
from IPython.display import Image
Image(filename='path_to_image/image.png')
I get the below error:
IOPub data rate exceeded.
...
from IPython.display import Image
Image(filename='path_to_image/image.png')
I get the below error:
IOPub data rate exceeded.
...
This media is not supported in your browser
VIEW IN TELEGRAM
آموزش راه رفتن توسط هوش مصنوعی با یادگیری تقویتی
Teaching Artificial Intelligence to Run (#NIPS2017)
#deep_learning #Reinforcement_Learning
@CVision
Teaching Artificial Intelligence to Run (#NIPS2017)
#deep_learning #Reinforcement_Learning
@CVision
حرکات فضایی آلفا زیرو، قدرت هوش مصنوعی و یادگیری ماشینی رو به رخ شطرنج بازها - و بقیه - میکشه
برنامه جدید دیپ مایند نه فقط فوق العاده و قابل تطابقه، که کمی هم عجیبتر از اون چیزی شده که انتظارش رو داشتیم. گروه دیپ مایند توی مقاله جدیدشون برنامه جدید یادگیرنده بازی ای رو که توسعه کردن توضیح می دن، این برنامه تونسته شطرنج و یک بازی ژاپنی رو بعد از یاد گرفتن بازی گو یاد بگیره.
دمیس حسابیس که مدیر دیپ مایند (و البته موسس) است و خودش هم شطرنج باز است می گه برنامه حرکاتی انجام می ده که برای یک شطرنج باز انسانی قابل درک نیستن.
> سبک بازی ای که یاد گرفته نه شبیه آدم است و نه شبیه برنامه های قبلی. این سیستم به یک شیوه سوم و شاید شیوه ای بیگانه بازی می کنه.
برنامه آلفا زیرو نسخه جهانشمولتر برنامه آلفا گو گوگل است که مخصوص بازی گو طراحی شده بود و با فقط ۲۴ ساعت زمان و بررسی بازی و بازی کردن با خودش تونسته یاد بگیره برنامه استاک فیش که یکی از قوی ترین موتورهای کامپیوتری جهان برای شطرنج است رو نه فقط با اختلاف زیاد، که بدون حتی یک شکست،ِ در هم بکوبه. لازم به ذکر نیست که هیچ انسانی نمی تونه در مقابل استاک فیش برنده بشه. عکس العمل قهرمانان شطرنج جهان به این پیروزی همراه با شوک،
اما اینجا مساله «یک موتور شطرنج قوی تر» نیست بلکه یک موتور شطرنج است که قربانی های عجیب می کنه. مثلا حاضر می شه فیل و وزیر رو بده تا موقعیت برتر به دست بیاره و با اون موقعیت، ببره. چنین بازی ای در بین انسان ها تقریبا دیده نمی شه. یا مثلا در جایی دیگه موتور شطرنج جدید وزیر رو به گوشه صفحه می بره که در شطرنج حرکتی کمیابه. حسابیس می گه نگاه کردن به شطرنج بازی کردن این موتور مانند نگاه کردن به شطرنج از بعدی دیگه است.
این «آموزش به خود» باعث شده موتور آلفازیرو طبق الگوهای مرسوم ما و ارزشهایی که به مهره ها می دیم بازی نکنه و از خوردن مهره هاش نگرانی ای نداشته باشه. ممکنه اصولا درک ما از شطرنج خیلی محدود و مبتنی بر به دست آوردن برتری نسبی از نظر ارزش مهرهها و تبدیل اون به پیروزی بوده. شاید این برنامه یکبار دیگه شطرنج هیجان انگیز رمانتیک که همراه با قربانی دادن و کارهای پر هیجان و عجیب بود رو به بازی برگردونه و البته شاید این برنامه شروعی باشه برای ما که کم کم قبول کنیم کامپیوترها دارن دنیا رو بهتر از ما می فهمن.
🙏Thanks to: @jadinet
🔗 https://jadi.net/2017/12/alphazero/
#deep_learning #Reinforcement_Learning
برنامه جدید دیپ مایند نه فقط فوق العاده و قابل تطابقه، که کمی هم عجیبتر از اون چیزی شده که انتظارش رو داشتیم. گروه دیپ مایند توی مقاله جدیدشون برنامه جدید یادگیرنده بازی ای رو که توسعه کردن توضیح می دن، این برنامه تونسته شطرنج و یک بازی ژاپنی رو بعد از یاد گرفتن بازی گو یاد بگیره.
دمیس حسابیس که مدیر دیپ مایند (و البته موسس) است و خودش هم شطرنج باز است می گه برنامه حرکاتی انجام می ده که برای یک شطرنج باز انسانی قابل درک نیستن.
> سبک بازی ای که یاد گرفته نه شبیه آدم است و نه شبیه برنامه های قبلی. این سیستم به یک شیوه سوم و شاید شیوه ای بیگانه بازی می کنه.
برنامه آلفا زیرو نسخه جهانشمولتر برنامه آلفا گو گوگل است که مخصوص بازی گو طراحی شده بود و با فقط ۲۴ ساعت زمان و بررسی بازی و بازی کردن با خودش تونسته یاد بگیره برنامه استاک فیش که یکی از قوی ترین موتورهای کامپیوتری جهان برای شطرنج است رو نه فقط با اختلاف زیاد، که بدون حتی یک شکست،ِ در هم بکوبه. لازم به ذکر نیست که هیچ انسانی نمی تونه در مقابل استاک فیش برنده بشه. عکس العمل قهرمانان شطرنج جهان به این پیروزی همراه با شوک،
اما اینجا مساله «یک موتور شطرنج قوی تر» نیست بلکه یک موتور شطرنج است که قربانی های عجیب می کنه. مثلا حاضر می شه فیل و وزیر رو بده تا موقعیت برتر به دست بیاره و با اون موقعیت، ببره. چنین بازی ای در بین انسان ها تقریبا دیده نمی شه. یا مثلا در جایی دیگه موتور شطرنج جدید وزیر رو به گوشه صفحه می بره که در شطرنج حرکتی کمیابه. حسابیس می گه نگاه کردن به شطرنج بازی کردن این موتور مانند نگاه کردن به شطرنج از بعدی دیگه است.
این «آموزش به خود» باعث شده موتور آلفازیرو طبق الگوهای مرسوم ما و ارزشهایی که به مهره ها می دیم بازی نکنه و از خوردن مهره هاش نگرانی ای نداشته باشه. ممکنه اصولا درک ما از شطرنج خیلی محدود و مبتنی بر به دست آوردن برتری نسبی از نظر ارزش مهرهها و تبدیل اون به پیروزی بوده. شاید این برنامه یکبار دیگه شطرنج هیجان انگیز رمانتیک که همراه با قربانی دادن و کارهای پر هیجان و عجیب بود رو به بازی برگردونه و البته شاید این برنامه شروعی باشه برای ما که کم کم قبول کنیم کامپیوترها دارن دنیا رو بهتر از ما می فهمن.
🙏Thanks to: @jadinet
🔗 https://jadi.net/2017/12/alphazero/
#deep_learning #Reinforcement_Learning
جادی دات نت | کیبرد آزاد
حرکات فضایی آلفا زیرو، قدرت هوش مصنوعی و یادگیری ماشینی رو به رخ شطرنج بازها – و بقیه – میکشه
برنامه جدید دیپ مایند نه فقط فوق العاده و قابل تطابقه، که کمی هم عجیبتر از اون چیزی شده که انتظارش رو داشتیم. گروه دیپ مایند توی مقاله جدیدشون برنامه جدید یادگیرنده بازی ای رو که توسعه کردن توضیح می دن، این برنامه تونسته شطرنج و یک بازی ژاپنی رو بعد از یاد…
معرفی #کورس
https://t.me/cvision/515
برنامه رایگان یادگیری عمیق ماکروسافت شامل 10 کورس
لینک دوره:
https://academy.microsoft.com/en-us/tracks/artificial-intelligence/
توضیحات:
سرفصل ها...
Get Started with AI
Use #Python to Work with Data
Use #Math and #Statistics Techniques
Consider Ethics for #AI
Plan and Conduct a Data Study
Build #Machine_Learning Models
Build #Deep_Learning Models
Build #Reinforcement_Learning Models
Develop Applied AI Solutions
Final Project
Microsoft Professional Program Certificate in Artificial Intelligence
از اکانت ماکروسافت شما به سایت edx متصل شده و کورس ها را رایگان در ادکس میگذرانید. در پایان در سایت ماکروسافت گواهی اتمام دوره را دریافت خواهید کرد.
https://t.me/cvision/515
برنامه رایگان یادگیری عمیق ماکروسافت شامل 10 کورس
لینک دوره:
https://academy.microsoft.com/en-us/tracks/artificial-intelligence/
توضیحات:
سرفصل ها...
Get Started with AI
Use #Python to Work with Data
Use #Math and #Statistics Techniques
Consider Ethics for #AI
Plan and Conduct a Data Study
Build #Machine_Learning Models
Build #Deep_Learning Models
Build #Reinforcement_Learning Models
Develop Applied AI Solutions
Final Project
Microsoft Professional Program Certificate in Artificial Intelligence
از اکانت ماکروسافت شما به سایت edx متصل شده و کورس ها را رایگان در ادکس میگذرانید. در پایان در سایت ماکروسافت گواهی اتمام دوره را دریافت خواهید کرد.
Telegram
Tensorflow(@CVision)
معرفی #کورس
برنامه رایگان یادگیری عمیق ماکروسافت شامل 10 کورس
Microsoft Professional Program for Artificial Intelligence track
REQUIRED COURSES: 10
HOURS PER COURSE: 16-32
SKILLS: 8
برنامه رایگان یادگیری عمیق ماکروسافت شامل 10 کورس
Microsoft Professional Program for Artificial Intelligence track
REQUIRED COURSES: 10
HOURS PER COURSE: 16-32
SKILLS: 8
#آموزش
Hallucinogenic Deep Reinforcement Learning Using #Python and #Keras
https://medium.com/applied-data-science/how-to-build-your-own-world-model-using-python-and-keras-64fb388ba459
#Reinforcement_Learning
Hallucinogenic Deep Reinforcement Learning Using #Python and #Keras
https://medium.com/applied-data-science/how-to-build-your-own-world-model-using-python-and-keras-64fb388ba459
#Reinforcement_Learning
Medium
Hallucinogenic Deep Reinforcement Learning Using Python and Keras
Teaching a machine to master car racing and fireball avoidance through “World Models”
#آموزش #سورس_کد
مرتبط با تصویر
https://t.me/cvision/593
وقتی که گوگل کروم شما آفلاین است، یک بازی دایناسور روی صفحه میاد که با کلیک روش میتونید بازی را شروع کنید،
یکی با تنسرفلو، هوش مصنوعی نوشته که به خوبی این بازی را انجام میدهد،
ود هیچ محیط شبیه سازی نمیخواهد و مستقیم با اجرای مرورگرتان بازی را انجام میدهد.
https://vdutor.github.io/blog/2018/05/07/TF-rex.html
https://github.com/vdutor/tf-rex
#rl #reinforcement_learning #q_learning
مرتبط با تصویر
https://t.me/cvision/593
وقتی که گوگل کروم شما آفلاین است، یک بازی دایناسور روی صفحه میاد که با کلیک روش میتونید بازی را شروع کنید،
یکی با تنسرفلو، هوش مصنوعی نوشته که به خوبی این بازی را انجام میدهد،
ود هیچ محیط شبیه سازی نمیخواهد و مستقیم با اجرای مرورگرتان بازی را انجام میدهد.
https://vdutor.github.io/blog/2018/05/07/TF-rex.html
https://github.com/vdutor/tf-rex
#rl #reinforcement_learning #q_learning
Telegram
Tensorflow
https://t.me/cvision/592
انجام بازی دایناسور ،گوگل کروم با تنسرفلو
انجام بازی دایناسور ،گوگل کروم با تنسرفلو
This media is not supported in your browser
VIEW IN TELEGRAM
ویژگی های جدید تنسرفلو 2 برای پیاده سازی deep #RL
Good tutorial on showcasing the upcoming TensorFlow 2.0 features by implementing a deep #reinforcement learning example. The code looks really clean now especially with the way how you will create TF models in the future with tf.keras.Model.
http://inoryy.com/post/tensorflow2-deep-reinforcement-learning/
#tensorflow
Good tutorial on showcasing the upcoming TensorFlow 2.0 features by implementing a deep #reinforcement learning example. The code looks really clean now especially with the way how you will create TF models in the future with tf.keras.Model.
http://inoryy.com/post/tensorflow2-deep-reinforcement-learning/
#tensorflow