王者荣耀职业选手输给AI 对话团队负责人:战胜人类,意味着什么
第一局,职业选手出其不意,选择了两名“法师”角色——干将莫邪和嬴政(常规比赛中多只有一名“法师”)。不过“王者绝悟”并不惧怕,不费吹灰之力就赢下第一局。
第二局,职业选手们谨慎了些,选择的阵容回归保守。但这依然无法阻挡“王者绝悟”的气势,在AI面前,职业选手仿若人机。“王者绝悟”又赢了。
第三局,职业选手再次改变阵容,针对性地优化了英雄阵容。这一尝试非常管用,AI强大的算力没跟上节奏,人类战队终于扳回一局。
由于游戏阵容不允许与上局相同,第四局比赛因此进行得极其艰难。时间慢慢流逝,职业选手的状态逐渐疲惫,但AI依旧精神抖擞。第四局,“王者绝悟”再次获胜。
至此,五局三胜的赛事,AI最终以3∶1提前结束了该赛事。
一边是全国排名前10的5名职业选手,一边是空无一人的五张椅子。AI的胜利,像极了2017年“阿尔法狗”战胜柯洁。“AI确实太猛了。”落败后,职业选手辰鬼道出了内心的“绝望”。
↑5名人气职业选手(图据王者荣耀团队)
『“王者绝悟”是谁?』
2018年首次登场后一直在进化
腾讯的“王者绝悟”产品是由腾讯AILab与王者荣耀联合推出,展现了AI在人类生活场景的想象力。据报道,在2019年,“王者绝悟”团队曾在接受媒体采访时表示,和业内所有研究机构一样,他们追求的目标都是“通用人工智能”。
腾讯的“王者绝悟”产品是由腾讯AILab与王者荣耀联合推出,展现了AI在人类生活场景的想象力。据报道,在2019年,“王者绝悟”团队曾在接受媒体采访时表示,和业内所有研究机构一样,他们追求的目标都是“通用人工智能”。
近日,“王者绝悟”技术负责人杨光——这支AI“梦之队”的总教练,在比赛结束后,面对媒体表示,AI的学习能力于人类而言是碾压级的,AI一天的训练量相当于人类440年的训练量。而且,AI不受情绪、性格影响,配合障碍更低。那么,“王者绝悟”是否真的已经完全超越人类?
7月14日,红星新闻记者联系到腾讯“王者绝悟”团队。对于这个问题,团队认为,“‘王者绝悟’经过了多次迭代,如今已经进化成全英雄职业电竞水平的‘完全体’。”
从模仿人类的监督学习,到自我博弈的强化学习,“王者绝悟”实力发展,可以通过以下几个重要里程碑全面了解到:
2018年12月,“王者绝悟”在KPL总决赛首次登场。这一版本通过监督学习方法,模拟学习了KPL职业选手的操作,达到了顶尖业余水平;2019年,随着团队在深度强化学习、多智能体决策课题上的研究不断深入,“王者绝悟”不再需要模仿人类数据,而是通过自己和自己对战,进一步提升微操水平和大局观,达到了王者荣耀职业电竞水平;2020年,“王者绝悟”通过课程学习方式,学会了更多英雄玩法;同年5月份,它用40个英雄首次接受玩家们的挑战。
目前,在“王者绝悟”的最新版本中,团队进一步引入了多轮组合博弈和层次化的强化学习算法。也就是在竞技比赛的局前和局内,都做了针对性优化,提升它的整体能力和战术对抗水平。
『独具优势?』
人类玩露娜等英雄会比AI更秀
在局前,也就是大家熟悉的BP环节(就是BAN/PICK,指的是排位赛的时候禁选英雄的阶段),“王者绝悟”既会考虑当前对局双方阵容的胜率,也会更长远地为后续对局“留招”,最大化多轮比赛的胜率。
在局内,通过自我博弈学习同时提升宏观战术策略和具体微操水平。在保持高强度微操能力的情况下,对不同的敌方战术策略,如五人抱团、四一分推、gank入侵等战术,做出更加合理的应对。
不过,虽然已经进化成全英雄职业电竞水平的“完全体”,但团队认为,数值和操作上,“王者绝悟”并没有独特的优势。
一方面,在英雄的自身状态参数上,AI并没有额外的加成,与人类玩家相同;另一方面,AI在视野观测上与人类玩家保持一致,对于战争迷雾中的不可见单位,AI同样也看不到;最后,AI的操作反应也做了客观限制,其反应分布和均值与KPL职业选手是相接近的。根据实际观察,人类玩露娜等英雄会比AI更秀。
『不同于“阿尔法狗”』
“王者绝悟”算法挑战更大
大家常说的阿尔法围棋(AlphaGo阿尔法狗),是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。它由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发,其主要工作原理是“深度学习”。同是AI,“王者绝悟”和“阿尔法狗”,甚至其他游戏中的人工智能的差别在哪里呢?
↑比赛现场(图据王者荣耀团队)
“王者绝悟”团队认为,和其它游戏不同,王者荣耀是个不完全信息的复杂游戏。“比如像围棋这样的游戏,大家一眼就能看到全局,就是完全信息游戏。而在王者荣耀里面,玩家视角只能看到地图的一部分,还有草丛这样的隐藏空间。在这样的前提下,‘王者绝悟’要快速而准确地做出一系列复杂的决策操作,本身就是更加困难的一件事。”
直观来说,王者荣耀的对局有多复杂?一是王者英雄非常多,有100多个,阵容组合爆炸,达到10-15种可能性,而且不同组合在能力和打法上有很大差异。二是游戏中的状态、动作空间复杂,AI在策略规划、目标选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择。“我们预计AI在一局里有高达10的20000次方种操作可能性。而整个宇宙原子总数也只是10的80次方。”该团队介绍,如此庞大的运算空间里,要做高效准确的决策,对算法的挑战非常大。
『超越人类?』
职业玩家不服:下次,干翻AI!
回到比赛的那一幕,在赛后采访环节,职业选手也感受到了AI“王者绝悟”的强大,“AI确实太猛了,总能做出异于常人的反应,让我们招架不住。”已是第二次对战“王者绝悟”的选手辰鬼觉得,AI的配合较上一次更为默契。
那么,“如果还有下次,你们愿意‘复仇’吗?”现场解说员问。
职业选手们答道:“下次,干翻AI!”
除了职业选手,AI“王者绝悟”也引起了众多游戏玩家的关注。有人觉得AI就是人机,没什么可怕的,不过,在看过比赛以后,不少玩家的态度发生了转变。
正如王者荣耀五年玩家小曾觉得,AI的技能把控准确度和超强的计算血量、躲技能,以及不受心态影响,是职业选手很难达到的。同时,AI思想是统一的,就像AI是一个人控制5个人,而职业选手有5个人的思想,思想不一致,怎么能够对付思想完全一致的“绝悟”呢?并且,AI记录了大量高手比赛对局到数据库里,从而不断重复学习,强化自己。小曾认为:“今后,随着AI技术的完善,学习的深入,完全超过人类是必然的。”
↑比赛现场(图据王者荣耀团队)
『未来的价值?』
不是战胜人类而是应用于生活
归根到底,人类还是喜欢和人类玩耍的,有人甚至觉得,和AI的游戏无异于单机游戏。那么,“王者绝悟”的存在到底有哪些价值?
团队从玩家角度出发认为,“王者绝悟”过去在重要节点以活动的方式出现在游戏中,确实让广大用户体验到了AI的最新进展和魅力。
从更长远的角度来看,“王者绝悟”的研究是希望在王者这种复杂状态策略博弈的环境下,让AI学会类似人的长期策略规划和多智能体协作决策。随着团队对相关课题不断深入的研究和积累,将把“王者绝悟”的能力迁移到其他类型的游戏。如今,“王者绝悟”已经有了几个兄弟,可以应用于足球、FPS、RTS游戏,并且都达到了国际领先水平。
“王者绝悟”能够从0到1去学习进化,并发展出一套合理的行为模型。这中间的经验、方法与结论,长期来看,团队希望它能在更多的不同场景,如医疗、制造、无人驾驶、农业以及智慧城市管理等领域带来更加深远的影响。
同时,科研、科教价值也不可忽视。据介绍,腾讯AILab和王者荣耀还联手打造了“开悟”AI+游戏开放平台,为学术研究人员和算法开发者开放腾讯在算法、脱敏数据、算力方面的优势能力。去年腾讯举办了第一届开悟AI学术交流赛,18所国内名校的同学们参赛,并取得了不错的成绩。今年下半年即将举办第二届赛事,希望能为人工智能教学、科研提供帮助。
事实上,AI的目的并不是要在游戏里战胜人类,而是通过越来越复杂的游戏训练,最终解决现实生活中的问题。
红星新闻记者戴佳佳
编辑于曼歌
(下载红星新闻,报料有奖!)返回搜狐,查看更多
《王者荣耀》的精神时光屋,赢过职业选手的AI当陪练
“绝悟”,它是真的悟了。
如今这个时代,AI已经不是什么新鲜事物。从围棋“阿法尔狗”、象棋“元萝卜”,再到现在遍地的AI绘图、AI小说,虽然还有许多不足,但也证明了AI技术已经能让AI学习更复杂抽象的“思考”能力。
比如腾讯就研发了AI“绝悟”,训练它如何打好王者荣耀,王者荣耀近期推出的绝悟系统就是以“AI绝悟”为基础,构建的全新玩法。
让AI打王者,乍听之下有点无厘头,但细想要做到这一点并不容易,或许AI的操作能更胜一筹,但时机、战术、运营等AI的短板,才是MOBA的制胜关键。
不过,在2021年的世界人工智能大会上,“绝悟”在被限制了反应速度,平均操作APM低于对手的情况下,成功击败了一支五人职业战队,证明“绝悟”,它是真的悟了。
当然,对于王者玩家来说,与“绝悟”的见面应该更早一些。在20年11月,《王者荣耀》就曾推出过“挑战王者绝悟”的限时玩法,其高绝的游戏难度与极低的通关率,给玩家留下了深刻的影响。
不过,当时“绝悟”的英雄池并不深,只有固定阵容对抗,依然还在成长阶段。可即使如此,“绝悟”已经有蹲草丛、越塔强杀、反野、控龙等战术意识,只是偶尔会有发呆、转圈圈之类的迷之行为,但也足够让众多玩家头痛。
与大多数AI一样,“绝悟”是通过深度学习逐步成长的。从2017年诞生起,“绝悟”就在学习职业选手的训练数据,后被开发了自我对战的学习模式,能通过自我对局、自我总结游戏的经验,归纳战术打法。
它不像超级人机,靠开全图、透视或无限CD之类的外挂碾压玩家,只是纯粹在对局经验上,太丰富了。无论是运营、反野、逼团都是其在学习过程中,认为能有效提高胜率的做法。
因而,与“绝悟”的对决体验就像是五个身经百战甚至有些猥琐的高玩对抗,自然难以取胜。
不过,“绝悟”并不只是玩家的敌人,也可以成为玩家的良师益友。今年《王者荣耀》推出的绝悟系统比之前更加成熟,玩家可以通过不同玩法模式来体验“绝悟”带来的乐趣。
比如全新模式“王者练习场”,玩家可以从单个英雄的技能连招、出装思路,学到手法进阶、对局意识,不断淬炼自己的技术与手法。当然,“绝悟”老师的教学非常到位,除了语音讲解外,还有视频演示,多种技能连招还配合按键QTE提示,让操作过程都变得通俗易懂。
最后玩家还再来一局模拟的AI实战,英雄练习场能模拟出各个段位的游戏对战环境。甚至,有时候对面AI玩自己喜欢的英雄,还可以反过来偷师AI的战术与打法,从入门到出师一应俱全。
此外,具有职业水平的“绝悟”与其说是传统的人机,更像是一个技术成熟带点狡黠的虚拟真人,基本没办法卡“bug”,想要套路对方,大概率会被其套路,是没办法取巧的。
某种角度看,英雄练习场更像是智能AI应用的尝试,间接窥见了AI技术的未来发展趋势。
不过,对玩家来说,王者练习场就是一个能系统性练英雄,并清晰判断自己的技术水平的“精神时光屋”,是快速修炼的最佳选择。但很可惜,由于种种原因受限,绝悟系统必然暂时无法常驻《王者荣耀》,只能说未来可期,建议在其上线的这段时间,大家去多多体验试玩。