对话|王者荣耀职业选手输给AI对话团队负责人：战胜人类，意味着什么？( 二 ) 腾讯|游戏|逆水寒

近日，“王者绝悟”技术负责人杨光——这支AI“梦之队”的总教练，在比赛结束后，面对媒体表示，AI的学习能力于人类而言是碾压级的，AI一天的训练量相当于人类440年的训练量。而且，AI不受情绪、性格影响，配合障碍更低。那么，“王者绝悟”是否真的已经完全超越人类？
7月14日，红星新闻采访人员联系到腾讯“王者绝悟”团队。对于这个问题，团队认为，“‘王者绝悟’经过了多次迭代，如今已经进化成全英雄职业电竞水平的‘完全体’。”
从模仿人类的监督学习，到自我博弈的强化学习，“王者绝悟”实力发展，可以通过以下几个重要里程碑全面了解到：
2018年12月，“王者绝悟”在KPL总决赛首次登场。这一版本通过监督学习方法，模拟学习了KPL职业选手的操作，达到了顶尖业余水平；2019年，随着团队在深度强化学习、多智能体决策课题上的研究不断深入，“王者绝悟”不再需要模仿人类数据，而是通过自己和自己对战，进一步提升微操水平和大局观，达到了王者荣耀职业电竞水平；2020年，“王者绝悟”通过课程学习方式，学会了更多英雄玩法；同年5月份，它用40个英雄首次接受玩家们的挑战。
目前，在“王者绝悟”的最新版本中，团队进一步引入了多轮组合博弈和层次化的强化学习算法。也就是在竞技比赛的局前和局内，都做了针对性优化，提升它的整体能力和战术对抗水平。
『独具优势？』
人类玩露娜等英雄会比AI更秀
在局前，也就是大家熟悉的BP环节（就是BAN/PICK，指的是排位赛的时候禁选英雄的阶段），“王者绝悟”既会考虑当前对局双方阵容的胜率，也会更长远地为后续对局“留招”，最大化多轮比赛的胜率。
在局内，通过自我博弈学习同时提升宏观战术策略和具体微操水平。在保持高强度微操能力的情况下，对不同的敌方战术策略，如五人抱团、四一分推、gank入侵等战术，做出更加合理的应对。
不过，虽然已经进化成全英雄职业电竞水平的“完全体”，但团队认为，数值和操作上，“王者绝悟”并没有独特的优势。
一方面，在英雄的自身状态参数上，AI并没有额外的加成，与人类玩家相同；另一方面，AI在视野观测上与人类玩家保持一致，对于战争迷雾中的不可见单位，AI同样也看不到；最后，AI的操作反应也做了客观限制，其反应分布和均值与KPL职业选手是相接近的。根据实际观察，人类玩露娜等英雄会比AI更秀。
『不同于“阿尔法狗”』
“王者绝悟”算法挑战更大
大家常说的阿尔法围棋（AlphaGo阿尔法狗），是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。它由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发，其主要工作原理是“深度学习”。同是AI，“王者绝悟”和“阿尔法狗”，甚至其他游戏中的人工智能的差别在哪里呢？

【精彩生活】jing111.com小编为您精选以下内容，希望对您有所帮助：