在热门手机游戏《王者荣耀》里,玩家排位打不过的时候,总想找人机出出气。但是,真正有智慧勤训练的人机几乎是无敌的存在。
在最近刚刚结束的2018KPL秋季赛总决赛上,腾讯AI Lab与王者荣耀及王者荣耀职业联赛共同探索的前沿研究项目——策略协作型AI“绝悟”首次露面,接受前KPL职业选手和职业解说组成的人类战队(其中不少段位在王者50星以上,平均水平超过99%玩家)的5V5水平测试,并取得胜利。
在这场比赛中AI战队使用了达摩、阿轲、干将莫邪、典韦、张飞对阵人类战队的花木兰、赵云、小乔、项羽、牛魔。
比赛前期,AI战队的表现和人类战队相比确实缺少了几分灵动,被打出0-5的劣势,让很多观众一度产生“人工智能也不过如此的感觉”。但接下来AI战队的表现是真的惊艳到了大家。
比如AI达摩在红buff处的一次漂亮的蹲点,直接用大招跟闪现将赵云秒杀,再比如AI干将莫邪配合AI达摩精准秒杀,同时被敌方项羽牛魔两人近身竟有条不紊逃生,极其亮眼。
最让人惊讶的是,AI真的超级会打团,依靠着优秀的团队协作配合最终一点一点扳回劣势,逆风翻盘赢得了比赛。
据官方介绍,“绝悟”首先通过监督学习方法,深度模仿KPL职业玩家的数据;其次,会进行大量自我对战,每天的训练强度最高能达到人类150年的训练量。
算法上,模仿人类的决策方法,综合考虑小地图信息、己方视野和英雄属性等多个维度特征,让它兼具大局观与微操,决定在游戏的什么时间该去哪里(去上、中、下路或野区等、单人或配合队友站位),要做什么(游走杀人Gank、带兵线、支援或反野),及具体微操怎么做(确定各自站位和角色、组合技能并释放)。
对战中,在庞大且有不完备信息的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,形成了极为复杂的局面,预计有高达10的20000次方种操作可能性。