强化学习⽬前还不够成熟,应⽤场景也⽐较局限。最⼤的应⽤场景就是游戏了。
游戏
- 2016年:AlphaGo Master 击败李世⽯,使⽤强化学习的 AlphaGo Zero 仅花了40天时间,就击败了⾃⼰的前辈 AlphaGo Master。《被科学家誉为「世界壮举」的AlphaGo Zero, 对普通⼈意味着什么?》
- 2019年1⽉25⽇:AlphaStar 在《星际争霸2》中以 10:1 击败了⼈类顶级职业玩家。《星际争霸2⼈类1:10输给AI!DeepMind “AlphaStar”进化神速》
- 2019年4⽉13⽇:OpenAI 在《Dota2》的⽐赛中战胜了⼈类世界冠军。《2:0!Dota2世界冠军OG,被OpenAI按在地上摩擦》
机器⼈
- 机器⼈很像强化学习⾥的「代理」,在机器⼈领域,强化学习也可以发挥巨⼤的作⽤。
- 强化学习在推荐系统,对话系统,教育培训,⼴告,⾦融等领域也有⼀些应⽤: