人工智能的2017——AI几乎在所有的游戏领域都战胜了人类玩家
图|1997年卡斯帕罗夫负于电脑“深蓝”
AI——永不停息的步伐
上世纪90年代末,在一台机器终于最终击败国际象棋大师之后,一位来自普林斯顿的天体物理学家预测道:“可能要等上一百年,电脑才能在围棋中打败人类——甚至可能更长。“
面对种种人工智能发展的挑战,计算机科学家们把开始把注意力转向了一个古老的中国游戏,它既简单又复杂——它就是围棋。
在过去的10年里,机器学习能力的发展造就了真正有竞争力的人工智能围棋选手。2014年,谷歌开始研究一个叫做AlphaGo的深度学习神经网络。经过几年里对Al研究成功的案例,开发团队尝试了一些不同的东西。
图|AlphaGo将深度学习方法引入到蒙特卡洛树搜索中,主要设计了两个深度学习网络,一个为策略网络,用于评估可能的下子点。另一个为估值网络,可以对给定的棋局进行估值,在模拟过程中,不需要模拟到棋局结束就可以利用估值网络判断棋局是否有利
在2016年年底,一个名为“Master”的神秘在线围棋玩家出现在了热门的亚洲游戏服务器Tygem上。在接下来的几天里,这个神秘的玩家横扫世界范围内的许多一流玩家。2016年1月4日,jig项目启动,正式确认“Master”实际上是DeepMind系列中AIAlphaGo的最新版本。
2017年5月,AlphaGo“Master”在对战世界排名最高的围棋选手柯洁中屡屡得分。在三场比赛中,这台机器稳操胜券,但最令人吃惊的是,在十月的揭幕仪式上,谷歌已经开发出了比“Master”还好的AlphaGo更复杂的迭代产品。
图|2017年中国围棋高手柯洁与AlphaGo上演“人机大战”。
AlphaGoZero团队在《自然》杂志的一篇文章中透露,它们所开发的是一种革命性的算法——让AI在与自己的对抗中学习。在这个系统中,AlphaGoZero只是简单地与自己对抗,不断地学习如何掌握人类给它编程的任何游戏。在21天的学习之后,AlphaGoZero就能达到大师级水平,到第40天,它就能超越所有之前出现过的版本。
2017年12月,DeepMind发布了一个更新版本的系统。这款名为“AlphaZero”的新人工智能可以在短短几个小时内掌握各种游戏。经过仅仅8个小时的自我训练,这个系统不仅能打败AlphaGoZero的早期版本,而且还可以成为象棋大师和将棋(shogi,又称日本象棋,一种流行于日本的棋盘游戏)的冠军。
诡骗技术的改良
尽管围棋非常复杂,但对于人工智能来说,掌握扑克技术仍是另一个完全不同的挑战性命题。要想在扑克中取胜,人工智能必须掌握欺骗的艺术。在这个“臭名昭著”的纸牌游戏中,必须具备一定的识别技术和诡骗技术,这也就意味着人工智能必须具有至关重要的动态能力。
在经历了长达10年的尝试之后,人工智能终于打败了众多一流的扑克专业人士。来自阿尔伯塔大学的DeepStack推出了一个人工智能系统,它可以通过人工智能的“直觉”来战胜人类扑克玩家。
图|Libratus的AI系统与专业人士竞技“扑克”
2017年1月,来自卡内基梅隆大学的一个团队举办了一场公开活动,当时,这个名为Libratus的AI系统花了20天的时间,玩了12万把自由德州扑克。尽管专业人士们每天晚上都在讨论在人工智能中发现的其可能存在的弱点,但这台机器每天都在进行自我校正,修补游戏中的漏洞,并改进其牌技和策略。
事实上,人类的大脑并不是机器的对手,经过近一个月的游戏学习过程,Libratus公司赢得了170万美元的筹码,而与之对战的每四位专业选手中的一位都损失了数千美元的虚拟货币。一名失去职业资格的选手说:“在比赛进行到一半的时候,我感觉我在和一个作弊的人比赛,就像对方能看到我的牌一样。我不是在指责它作弊,正相反,这种人工智能的开发很棒。“
埃隆•马斯克的AI实验
2015年,埃隆•马斯克(ElonMusk)和一小群投资者成立了一个名为OpenAI的项目。该项目旨在探索人工智能系统的发展,它们的开发焦点在于强化人工智能的学习系统。在这种学习系统中,机器将学会如何在特定的任务中进行自我学习。
2017年8月,OpenAI团队将目光投向了在Dota2中获胜,这是一个国际大型电子竞技比赛的核心游戏。Dota2是一款非常流行的、复杂的多人在线对战竞技场游戏,在竞技游戏领域中,这是一项非常严肃的比赛。
图|Dota2游戏比赛现场
仅仅在两个星期的学习之后,OpenAI机器人便参与了这场锦标赛,随后击败了几名世界顶级的游戏竞技者。虽然,目前为止,人工智能系统只能对战简单的一对一的游戏,但是OpenAI团队正在研究如何在5对5的游戏中进行“团战“。
分而治之——挑战“吃豆人”游戏
几年前,谷歌DeepMind在49台Atari2600游戏上设置了人工智能。他们为这49台人工智能配备了与人类玩家相同的装备,在这种自我学习下,AI在大多数游戏中都“想”出了如何玩这些游戏并取得胜利。然而,有些游戏比其他游戏更难掌握,如经典的80年代视频游戏——吃豆人(MsPac-Man),这是最具有挑战性的游戏之一。
2017年,一家名为Maluuba的人工智能深度学习初创公司被谷歌收购,并入DeepMind集团。Maluuba的新机器学习方法被称为“混合奖励体系结构”(HRA)。他们将这种方法应用到MSPac-Man系统中,系统创建了超过150个“代理”,每个代理都有特定的任务——比如找到一个特定的豆子,或者避免幽灵。
最终,HRA方法会生成一个顶级代理,类似于高级经理。这个高级经理在做出个体移动的最终决定之前,会对下级代理的所有建议进行评估。这种方法被委婉地称为“分治法”,即把复杂的任务分解成更小的部分。
图|HRA学习方法在MSPac-Man系统中的应用
在将该方法应用于吃豆人之后,人工智能很快就找到了如何达到999,990最高分数的方法,这是此前人类或其他人工智能都无法做到的。
人工智能在游戏领域中大获全胜
如果人工智能在几乎所有的游戏中都能打败我们,那么,按照这个发展逻辑,接下来应该怎么做呢?
最近,法尔茅斯大学的一名研究人员开发了一种新的机器深度学习算法,他声称,这种算法可以为我们设计出自己的游戏,让我们从游戏中失败的地方重新开始玩。这个人工智能系统被称为“Angelina”,它每天都在不断改进,现在,它可以利用从维基共享网站到在线报纸和社交媒体等多种来源的数据来制作游戏。
那么这一切意味着什么呢?
2017年的发展可能是人工智能发展阶段中最重要的一年,同时,它也暗藏危机,因为,这是强化学习系统中的巨大进步。这些程序能够高效地教会自己掌握新技能。例如,最近的AlphaZero迭代可以在几天的自主学习之后,在一些游戏中获得超人类的技能。
在对350多个人工智能进行的一项大型调查中表明,人工智能将在短时间内全面超过人类。根据该调查,研究人员预测到,到2027年,人工智能的驾驶技术将全面超过人类,到2049年,它就能写出一本畅销小说,到2053年,它写的小说就能超过人类。事实上,根据这项调查,研究人员得出的结论是,到2060年,有50%的可能性,人工智能将能够做我们能做的每一件事,甚至能做得更好。
毫无疑问,2017年是人工智能在日益复杂的游戏中击败人类的一个里程碑,尽管在现在看起来微不足道,但其影响却是巨大的。许多发展中国家的公司正迅速将目光投向现实世界中的应用。
谷歌DeepMind已经将AlphaGoZero系统的研究目标从游戏中转移,开始对蛋白质折叠进行全面的研究,希望能开发出对抗阿尔茨海默症和帕金森氏症等疾病的疗法。
图|人工智能在某些方面能力确实已远超人类,将在我们实际生活中发挥无法意料的巨大作用。
DeepMind的联合创始人兼首席执行官戴米斯•哈萨比斯表示:“这些研究的最终目标乃是,利用这些人工智能的算法上的新突破,帮助我们解决各种现实世界中存在的迫切需要解决的问题。如果类似的技术可以被应用到其他问题上,比如蛋白质折叠、减少能源消耗或者寻找革命性的新材料,那么这些重大人工智能进展就有可能促进人类认知能力的突破,并对我们的生活产生积极的影响。”
有些人可能会对人工智能的发展持怀疑态度,担心人工智能将会威胁到人类的生存与发展,但有如FacebookCEO扎克伯格所说:“人类制造机器就是为了让机器在某些方面强于人类,但是机器在某些方面超越人类并不意味着机器具有能力学习其他方面的能力,或者将不同的信息联系起来而做超越人类的事情,而这一点非常重要”。
只要我们秉持为人类谋福祉的初衷,将人工智能成功运用到各方各面,发展前景势必一片光明。
对于人工智能的未来,究竟是利大于弊,还是弊大于利?欢迎各位读者在评论区给吃你的真知灼见。
编辑|谭冰玥
审校|大浪淘沙
TechPower科技力
热爱因科技而发生返回搜狐,查看更多
人工智能在游戏中的应用与未来展望
人工智能在游戏中的应用与未来展望摘要:人工智能是全球科技发展的一个热点,其在多个领域都有突出的应用。本文主要介绍了人工智能在游戏中的三大应用,并对其发展趋势和前景进行了相关讨论。
关键词:人工智能,游戏,发展应用,前景
一.人工智能概述人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,在游戏中的应用也极为广泛,对玩家而言,游戏在玩法和开发上的拓展,能带来众多更有趣更精良的游戏;也会让体验变得更特别、更个性化、更令人回味。于整个产业来说,更多的创新和技术进步将推动产业的蓬勃发展,更加良性。
二.人工智能在游戏中的三类应用1.AI智能游戏引擎游戏AI引擎可以绕过算法,提供“傻瓜式”的创作平台和工具:帮助开发者简化游戏制作流程,降低制作难度,塑造随机地图和创造NPC等等。目前主流的游戏AI引擎有三类:AI渲染引擎、NPC制作引擎和游戏创作引擎。
常见的有3D游戏需要提高游戏画面的表现力度,不断提升3D图形技术的功能,游戏画面在设计时除了重视美术设计质量外,在游戏表现的各个环节需要编辑较多的数据,这个程序员带来较大的挑战,这些问题的解决归根到底是完善游戏引擎。游戏画面设计在引擎中一般采用层次的设计方式,需要不断明确人工智能技术在各个环节的作用。游戏引擎的主要结构包括三个:高层接口、中层接口和低层接口,具体来说,高层接口的作用是能够让用户使用人功智能技术调控中层接口,通过改变算法控制游戏中游戏角色的战术动作、攻击活动等进行操作,中层接口可以通过与底层接口相结合,控制底层接口中的动画和运动等变换速度快的画面,保证游戏中的角色能够做一些高难度的动作,为用户提供高质量的服务,底层接口的作用在于控制角色的动画与基本动作,并提供物理计算与3D渲染等功能,但是底层接口的功能只能操作角色的朝向和位置,不能进行跳跃的动作,这些动作需要由中层接口完成。
2.神经网络算法要让NPC更聪明一点,目前这方面的AI解决方案主要有这四种:
有限状态机、蒙特卡洛决策树、神经网络、遗传算法。在传统游戏中,最为广泛使用是有限状态自动机(FSM),这是一种专家型的预编程算法。与FSM相比,蒙特卡洛决策树(MCST)会多步联想做决策,而非只就当前形势。这种多元化的行为能带来玩家更强大的个性化交互游戏体验,但其难度和成本也更大,且无学习能力。MCST模式下的NPC最大的缺陷在于学习能力。他们不能从玩家那里学习任何东西,不会根据玩家的习惯性操作做出相应的变化。
而人工神经网络(ANN)和遗传算法则可以解决机器学习的问题。**但是,神经网络下的NPC是“不可控的”(“非线性”和“非常定性”特征导致),这给游戏的运营与维护带来不少的风险,NPC的行为将在不断学习中变得难以预测,游戏后期的调试变得异常困难,有可能出现脱轨的问题。**另一种技术——遗传算法(GeneticAlgorithm)创造了一个不可击败的敌人。**遗传算法是基于达尔文进化论提出的一种决策计算模型,计算机在模拟自然进化过程中寻求最优解。**体现在游戏上,NPC会根据以往的经验去优化策略,新一轮的进攻的“敌人”会接收“牺牲者”的意志,并针对玩家的过往策略逐个击破。这意味着越强大的玩家将面临越强大的敌人,并且没有尽头。主机游戏SHMUP中,游戏开发者就为玩家置入了运用遗传算法的敌人。他们让玩家反抗经过多代进化敌人的AI,当这一代又被击败时,遗传算法对AI进行排名并使用它们创造新一代的敌人来对抗玩家。在著名进化策略类游戏孢子和怪物系列都在遗传算法上有所突破。
3.AI操作系统人工智能操作系统的理论前身为20世纪60年代末由斯坦福大学提出的机器人操作系统,应具有通用操作系统所具备的所有功能,并且包括语音识别、机器视觉、执行器系统、和认知行为系统。在游戏中,相对于游戏引擎和算法开发方向而言,它可以直接识别玩家操作,使游戏产业第一次从间接的数字控制转向更自然的模拟控制。人工智能在游戏中的运用甚至帮助现实世界的进步。因为游戏能够为现实世界提供准确数据和测试平台,例如赛车游戏为自动驾驶提供数据支持等等。
三.对人工智能游戏的未来展望在过去的20年里,AI在游戏中取得了显着的进步。对于今天的游戏开发者来说,创造一个高效的A.I.系统与创造优质游戏和美妙的图像同样重要。每个工作室都开始为A.I.分配一个专门的编程团队。在游戏开发的早期阶段设计游戏。他们花费更多的资源和时间来建立多样化,称职和表现良好的非玩家角色(NPC)。更多的开发人员使用高品质的A.I.设计使他们的游戏在竞争日益激烈的市场中脱颖而出。
理想的目标是让玩家始终沉浸在游戏中。NPC应该让人觉得是活生生会呼吸的人,而且这种错觉在游戏中不会以任何方式被打破。人类的行为很有趣,像对话这种微妙的互动行为,在未来AI可能会实现。如果能在诸如此类的互动上有所突破,那么游戏中更多的部分将有更强的互动性。说不定会产生全新类型的游戏。
四.总结通过游戏展我们可以看到游戏AI正在向更高的质量,更适应玩家的需求,给玩家带来非凡体验的方向迅猛发展。也许我们所期待的、理想中的、极大拟人化的游戏AI将会很快得以实现,并且给我们的生活增添更多的快乐与色彩。而游戏AI也将为人类在人工智能方面的研究上添上非常重要的一笔!