在2021世界人工智能大会上,一场别开生面的PK表演赛,腾讯AI Lab与王者荣耀的联合产品——“王者绝悟”AI战队在大会亮相,并与KPL人气选手在现场展开了一场精彩的表演赛。
记者在现场看到,此次亮相的“王者绝悟”是掌握游戏中全部100多个英雄玩法的AI“团队”。要精通王者荣耀这款游戏,其背后是天文数字级的计算量。一方面,100多个英雄组成5人队伍,就有多达10的15次方种可能性;另一方面,AI要操作不同技能、装备的不同英雄,在对局中面临策略规划、目标选择、技能应用、路径探索及团队协作等大量即时的选择,其操作可能性预计高达10的20000次方。
在对局中,AI的动作状态空间远远大于围棋及其他简单游戏,甚至超过整个宇宙的原子总数(10的80次方)。如此庞大的运算空间里,要做高效准确的决策,对算法的挑战巨大。
让AI学习像人一样决策
这支AI战队并非首次露面。记者了解到,“绝悟”名字寓意绝佳领悟力,其技术研发始于2017年,并在2018年12月通过了顶尖业余水平测试。
2019年8月2日在吉隆坡举办的王者荣耀冠军杯半决赛的特设环节中,“绝悟”在职业选手赛区联队带来的5v5水平测试中获胜,升级至王者荣耀电竞职业水平。
专业描述AI打王者荣耀的场景为——非完全信息多智能体协同零和即时博弈。通俗的讲就是,AI要在不完全信息、高度复杂度的情况作出复杂快速的决策。
和电竞选手想比,“绝悟”的厉害之处在于,可以无需人类数据,从白板学习开始,自己与自己对战。更惊喜的是,在训练后期AI甚至探索出了不同于人类常规做法的全新策略。
据介绍,目前在游戏过程中,玩家可以在限时开放的“绝悟”挑战中体验AI的能力,而当遭遇队友掉线时,也可以将掉线队友委托给AI托管,但AI不能主导比赛,胜负的决定权还是在各位玩家手中,除此之外,“绝悟”仅在实验室环境中投入使用。
在新英雄设计与游戏数值调整中,“绝悟”也发挥了重要作用,提供AI最终探索出的游戏打法和胜率作为参考,辅助策划优化游戏设计。
在游戏中做前沿AI研究
但“绝悟”诞生的初衷远非游戏陪练那么简单。
多智能体系统(大量的能够自主决策的AI共同协作,达成同一个目标)作为前沿人工智能技术的核心研究领域,经过多年的研究,已经广泛应用于各个行业。比如无人仓储,多智能体机器人完成庞大的仓储管理;智慧交通中的车路协同系统,无人驾驶;智能工业机器人、物联网等领域。多智能体技术都能够很好的应用下来提高生产效率。
王者荣耀团队在游戏研发过程中,发现MOBA游戏机制具有很强的多人协作性、在不对称信息下博弈空间极大、协作竞技性很强,非常适合使用多智能体人工智能技术来提高生产和测试效率。若AI技术能在王者荣耀这款游戏中如此复杂的环境中,学会人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。
在这样的背景之下,基于王者荣耀游戏的特点,王者荣耀团队与腾讯AI Lab一起合作,在王者持续进行人工智能相关的技术研究和应用实践,研究并开发出了这款多智能体产品。
在经过实践验证后,王者荣耀与腾讯AI Lab团队将在做多智能体研究的过程中所沉淀的技术资产开放出来,建设开悟开放平台,打造利用王者的核心技术构建的,对使用者低成本的多智能体人工智能算法研究、教学和验证的科研教学平台。
“我们开放了王者的核心机制,提供标准接口、核心算法、脱敏的训练数据、评估工具和计算集群等,给老师和同学们进行多智能体的机器学习算法研究、学习成果交流、对算法成果反复迭代升级。未来也可以提供给其他有需求的研究机构进行更贴近工业化场景的研究。”王者荣耀执行制作人,腾讯天美L1工作室总经理黄蓝枭表示。
2020年,王者荣耀联合腾讯AI Lab、腾讯高校合作、腾讯游戏学院举行了首次‘王者荣耀·开悟AI+游戏大赛’,邀请了中科院、清华大学、北京大学、中国科技大学、电子科技大学、哈工大、国防科大、浙大等18所头部高校的老师和同学们,在开悟平台上进行学术研究和交流,并提供全方位资源支持。
经过一年时间的实践,活动得到很好的成果,验证了王者荣耀游戏环境对人工智能技术的赋能思路。
AI技术下一里程碑或在游戏中产生
“通过王者荣耀国民级的影响力,我们也希望可以借此去推动和普及AI研究相关的成果和走到真正的产品和落地中去,也可以希望在这个过程中有各种的一些新的技术突出可以反哺整个游戏行业的健康发展和深入的发展。”腾讯公司副总裁张立军在群访回答记者问时指出。
他认为AI技术接下去的发展里程碑很可能就会在这样的复杂策略游戏中产生。“因为其实你可以看到人工智能最被广泛的理解或者大家觉得里程碑的产品就是当年AlphaDog的出现,再往后日常更多的语音识别技术、图象识别技术,大家很难看到有里程碑式的出现,而我们认为很可能这样的复杂策略中游戏中AI与人脑之间的对抗会是这样里程碑的事情。”
随着王者荣耀不断投入,让AI从0到1去学习进化,并发展出一套合理的行为模式,张立军表示,这中间的经验、方法与结论,短期看,可以给游戏行业、电竞行业带来直接的推动和帮助,有望在大范围内,如医疗、制造、无人驾驶、农业到智慧城市等领域带来更深远影响。长期来看,AI+游戏的研究,会推进AI的终极目标——通用人工智能问题的探索和发展。