2021年10月18日

产品设计深度学习

25. 强化学习的应⽤场景

强化学习⽬前还不够成熟，应⽤场景也⽐较局限。最⼤的应⽤场景就是游戏了。

游戏

2016年：AlphaGo Master 击败李世⽯，使⽤强化学习的 AlphaGo Zero 仅花了40天时间，就击败了⾃⼰的前辈 AlphaGo Master。《被科学家誉为「世界壮举」的AlphaGo Zero, 对普通⼈意味着什么？》
2019年1⽉25⽇：AlphaStar 在《星际争霸2》中以 10：1 击败了⼈类顶级职业玩家。《星际争霸2⼈类1:10输给AI！DeepMind “AlphaStar”进化神速》
2019年4⽉13⽇：OpenAI 在《Dota2》的⽐赛中战胜了⼈类世界冠军。《2:0！Dota2世界冠军OG，被OpenAI按在地上摩擦》

机器⼈

机器⼈很像强化学习⾥的「代理」，在机器⼈领域，强化学习也可以发挥巨⼤的作⽤。
强化学习在推荐系统，对话系统，教育培训，⼴告，⾦融等领域也有⼀些应⽤：

作品《深度学习 - 让PM全面理解深度学习 - 25. 强化学习的应⽤场景》由产品不打折发布于匠果，转载请注明出处及链接地址： http://www.jiangguo.net/c/glz/nqo.html