近日,“王者绝悟”技术负责人杨光——这支AI“梦之队”的总教练,在比赛结束后,面对媒体表示,AI的学习能力于人类而言是碾压级的,AI一天的训练量相当于人类440年的训练量。而且,AI不受情绪、性格影响,配合障碍更低。那么,“王者绝悟”是否真的已经完全超越人类?
7月14日,红星新闻采访人员联系到腾讯“王者绝悟”团队。对于这个问题,团队认为,“‘王者绝悟’经过了多次迭代,如今已经进化成全英雄职业电竞水平的‘完全体’。”
从模仿人类的监督学习,到自我博弈的强化学习,“王者绝悟”实力发展,可以通过以下几个重要里程碑全面了解到:
2018年12月,“王者绝悟”在KPL总决赛首次登场。这一版本通过监督学习方法,模拟学习了KPL职业选手的操作,达到了顶尖业余水平;2019年,随着团队在深度强化学习、多智能体决策课题上的研究不断深入,“王者绝悟”不再需要模仿人类数据,而是通过自己和自己对战,进一步提升微操水平和大局观,达到了王者荣耀职业电竞水平;2020年,“王者绝悟”通过课程学习方式,学会了更多英雄玩法;同年5月份,它用40个英雄首次接受玩家们的挑战。
目前,在“王者绝悟”的最新版本中,团队进一步引入了多轮组合博弈和层次化的强化学习算法。也就是在竞技比赛的局前和局内,都做了针对性优化,提升它的整体能力和战术对抗水平。
『独具优势?』
人类玩露娜等英雄会比AI更秀
在局前,也就是大家熟悉的BP环节(就是BAN/PICK,指的是排位赛的时候禁选英雄的阶段),“王者绝悟”既会考虑当前对局双方阵容的胜率,也会更长远地为后续对局“留招”,最大化多轮比赛的胜率。
在局内,通过自我博弈学习同时提升宏观战术策略和具体微操水平。在保持高强度微操能力的情况下,对不同的敌方战术策略,如五人抱团、四一分推、gank入侵等战术,做出更加合理的应对。
不过,虽然已经进化成全英雄职业电竞水平的“完全体”,但团队认为,数值和操作上,“王者绝悟”并没有独特的优势。
一方面,在英雄的自身状态参数上,AI并没有额外的加成,与人类玩家相同;另一方面,AI在视野观测上与人类玩家保持一致,对于战争迷雾中的不可见单位,AI同样也看不到;最后,AI的操作反应也做了客观限制,其反应分布和均值与KPL职业选手是相接近的。根据实际观察,人类玩露娜等英雄会比AI更秀。
『不同于“阿尔法狗”』
“王者绝悟”算法挑战更大
大家常说的阿尔法围棋(AlphaGo阿尔法狗),是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。它由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发,其主要工作原理是“深度学习”。同是AI,“王者绝悟”和“阿尔法狗”,甚至其他游戏中的人工智能的差别在哪里呢?
- 亚瑟王|王者荣耀:猫神连撞亚瑟王青帝,接连2局被骂!青帝崩溃大叫
- 防沉迷|游戏被批“精神鸦片”,王者荣耀做出表率,再度升级防沉迷系统
- 斗鱼|LOLM首位千分王者!斗鱼叶秋mvp率高达33%,赵信螳螂都是国服第一
- 王者荣耀|嫦娥芭比粉“拒霜思”皮肤曝光,孙尚香双皮肤亮相,活动专属5选1
- 五个人|王者荣耀被永久删除的五个技能,如果它还在,没人能守住水晶!
- 反杀率|王者宣布丝血反杀率,火舞67%,妲己93%,他的反杀率近100%
- 18888金币|攒够18888买谁青铜买宫本,钻石买猴子,大神买他王者51星起步
- 亚运会|王者荣耀入选亚运会,登录即送多重好礼,牛魔制霸全明星限时返场
- 打野|常用打野暴露段位,新手:赵云,高手:李白,用她起码王者起步!
- 王者荣耀?世界|游戏行业一周要闻:腾讯这两场官司或将改变一个行业