https://hackershare.dev/en/bookmarks/690592
训练GPT-3,为什么原有的深度学习框架吃不消?