http://technews.tw/2018/08/02/scalable-deep-reinforcement-learning-for-robotic-manipulation/
結合深度學習與強化學習,Google 訓練機器手臂的長期推理能力