博舍

人工智能击败人类围棋大师:但远称不上超级智能 最强人工智能围棋大师是谁

人工智能击败人类围棋大师:但远称不上超级智能

新浪科技讯北京时间1月29日消息,人工智能近日取得了重大突破。谷歌在英国的研究人员研发的一款计算机系统在围棋比赛中击败了一名顶尖棋手。作为一种古老的东方策略类游戏,在过去的几十年间,围棋曾无数次使人工智能败下阵来。

在大多数用来考察人类智慧的游戏中,如国际象棋、拼字游戏、奥赛罗棋、甚至《绝境边缘》(Jeopardy,一个益智问答游戏节目)中,机器都能毫不费力地击败人类。但围棋是一个例外。这款游戏有着2500年的历史,比国际象棋要艰深复杂得多,即使是最机敏的计算机系统,也比人类围棋大师要差了一大截。就在本月初,一些业内顶尖的人工智能专家还质疑近期内我们能否在这方面取得突破。去年更有很多人认为,还要再过十年,机器才可能在围棋比赛中取得上风。

但谷歌已经成功了。“这比我想象的要快得多。”法国研究人员雷米?科隆(RémiCoulom)说道。他研发的人工智能系统曾是世界上最出色的机器围棋选手。

谷歌DeepMind团队自称“人工智能领域的阿波罗计划”。2015年10月,他们在伦敦组织了一场机器与人类之间的对决。该团队研发的系统名叫AlphaGo,它要对付的人类选手是欧洲围棋冠军樊麾。在《自然》杂志的一名编辑和英国围棋联合会(BritishGoFederation)的一名权威人士的监督下,他们连续进行了五轮较量,AlphaGo均取得了胜利。“无论是作为一名研究人员还是编辑,这都算是我职业生涯中最令人激动的时刻之一。”《自然》杂志编辑唐吉?肖尔德博士(TanguyChouard)在本周二的一次记者会上说道。

英国时间1月27日早晨,《自然》杂志发表了一篇论文,详细介绍了DeepMind团队研发的系统。该系统采用了一种名叫“深度学习”(deeplearning)的人工智能技术,这种技术在该领域的地位正变得越来越重要。DeepMind的研究人员从专业棋手那里收集了大量走棋方法,总步数多达3000万次,并利用这些数据对AlphaGo系统进行了训练。但这还只是第一步而已。从理论上来说,这样的训练方式顶多能让计算机系统和最优秀的人类选手达到同等水平,不可能超越人类。因此研究人员先让该系统自己和自己比赛,在这一过程中产生更多的走棋方法,然后再用这些方法训练新的人工智能系统,逐步提高其围棋水平。

“最重要的是,AlphaGo不仅仅是一个出色的人工智能系统,只知道实行人工植入的规则”,负责监管DeepMind团队的德米斯?哈萨比斯(DemisHassabis)说道,“它还采用了目前普遍使用的机器学习技术,从而在围棋比赛中取胜。”

这次胜利其实并没有那么新奇。谷歌、Facebook和微软等线上服务提供商已经使用了深度学习技术,用于辨认图像、识别语音、以及理解自然语言等。DeepMind将深度学习与一种名为“增强学习”的技术和其它方法结合起来,说明在未来的世界中,机器人能够学会执行各种动作,还能对周围环境做出反应。“对于机器人来说,这是顺理成章的事情。”哈萨比斯说道。

他还认为这些手段能加速科学研究的进展。在他的想象中,科学家有一天会和人工智能系统一起工作,而这些人工智能系统将会被运用到可能取得丰硕成果的研究领域中去。“计算机系统能够处理大量数据,揭露数据结构特征,工作效率远比人类专家要高——有些事情人类甚至根本做不到。”哈萨比斯解释道,“这些计算机系统甚至能为人类专家指明研究方向,引领他们取得突破。”

但就目前来看,围棋仍然是哈萨比斯最关注的领域。在让AlphaGo在办公室中打败人类选手之后,哈萨比斯及其团队希望能在公开的竞技场上,和世界顶级围棋选手一决高下。今年三月中旬,AlphaGo将挑战韩国棋手李世乭,后者赢得的国际大奖数居世界第二,是过去十年中获胜次数最多的棋手。哈萨比斯将他视为“围棋世界中的费德勒”。

以“貌”取胜

2014年年初,科隆研发的围棋软件Crazystone在日本的一次锦标赛中向围棋大师依田纪基(NorimotoYoda)发起了挑战,并取得了胜利。但这次对决并不公平,因为机器可以先走四步,占据了巨大的优势。当时科隆预言称,人工智能至少要再过十年才能在无让子的围棋比赛中取胜。

这项挑战的难度是由围棋本身的特点决定的。即使是最强大的超级计算机,也缺乏在合理的时间内、分析出每种走法可能的结果的能力。1997年,“深蓝”击败了世界顶级象棋棋手加里?卡斯帕罗夫,它使用的算法名叫“蛮力穷举法”。它分析了每一种可能的走法将产生的结果,而人类是不可能考虑这么多的。但这种方法对围棋就无效了。在国际象棋中,平均每回合有35种走棋方式。而围棋每回合有250种可能的走棋方式,250种中的每一种又有250种,以此类推。哈萨比斯指出,围棋棋盘上可能的布棋方式总和比宇宙中所有原子的数量还多。

利用一种名叫蒙特卡洛树的搜索算法,像Crazystone这样的程序可以提前算出很多步走棋结果。再配合其它技术,它们还可以逐步去除需要分析的走法。这样一来,它们迟早会打败一些出色的棋手——但无法击败最出色的棋手。对于棋类大师来说,走棋很多时候靠的都是直觉。棋手会根据棋子的整体分布来选择走法,而不会细致地分析每一步的结果。“好的位置看起来就很好,”哈萨比斯说道,他本身就是一名围棋棋手,“围棋似乎也遵循一定的审美原则,所以这种游戏才得以延续数千年。”

但在2014、15年之交,一些人工智能专家,包括爱丁堡大学、Facebook、以及DeepMind团队的研究人员,开始采用深度学习法解决围棋问题。他们的想法是,这种技术能模拟人类的直觉,而直觉正是下围棋时必不可少的东西。“围棋是一种含蓄的游戏,讲究图案的配合,”哈萨比斯说道,“而那正是深度学习法所擅长的领域。”

自我增强

深度学习需要依赖所谓的“神经网络”,即由硬件和软件组成的、模拟人类大脑中神经网的网络。这些网络采用的不是蛮力穷举法,也不依靠人工植入的行动准则。它们会对大量数据进行分析,试图“学会”执行某个特定的任务。如果让神经网络看大量的袋鼠照片,它就能学会认出一只袋鼠。如果让它听大量的单词,你再读出这个单词时,它就能听出来你说的是什么。如果让它了解大量的围棋走棋方法,它就能学会下围棋。

DeepMind团队、爱丁堡大学和Facebook的研究人员希望,神经网络能够通过“观察”棋子位置掌握下围棋的方法,和人类差不多。Facebook近日在一篇论文中指出,这一技术使用起来相当不错。他们将深度学习法和蒙特卡洛树搜索方法结合起来,成功让计算机打败了一些人类围棋棋手。不过他们还没有击败Crazystone和其它顶尖的人工智能系统。

但DeepMind成功将这一概念向前推动了一大步。在接受了3000万步人类的围棋走法训练之后,DeepMind神经网络能够以57%的成功率预测人类下一步的走棋方法。这个成功率可谓十分惊人(此前的记录是44%)。接下来,哈萨比斯及其团队采用增强学习法,让这个神经网络和另一个与之稍有不同的网络进行比拼。在两个神经网络比赛的同时,系统会追踪哪种走法带来的效益最大。利用这种方法,该系统越来越能够识别出哪种走法能够取得成功,哪种走法则会导致失败。

“AlphaGo的神经网络和自己比赛了上百万次,在这一过程中不断改进,全靠自己学会了新的走棋策略。”DeepMind团队的一名研究人员戴维?希尔佛(DavidSilver)说道。

据希尔佛称,这种方法使AlphaGo在众多会下围棋的人工智能系统中脱颖而出,其中也包括Crazystone系统。然后研究人员将上一步得到的结果输入二级神经网络中。该网络使用一级网络建议的走棋方法,使用了很多相同的方法来预测每一步的结果。这和“深蓝”下象棋时的方法类似,只不过AlphaGo系统会边下边学,分析更多数据,而不是通过蛮力穷举法探索每种可能的结果。利用这种方法,AlphaGo不仅学会了如何打败现有的人工智能系统,还击败了顶级的人类棋手。

精密芯片

和大多数先进神经网络一样,DeepMind系统使用的机器也配备了图形处理器(GPU)。这些芯片最初是用来为游戏和其它对图形敏感的程序处理图像的,但研究人员发现,GPU也很适合用来开展深度学习。哈萨比斯表示,只需要用一台装配了大量GPU芯片的计算机,DeepMind就能够运行得很好。但在与樊麾对战时,研究人员使用了规模更大的计算机网,共装载了170枚GPU芯片和1200台标准处理器(CPU)。该系统在训练时和实际作战时,使用的都是这一大规模计算机网。

等AlphaGo前往韩国挑战世界冠军李世乭时,哈萨比斯的团队将使用同样的装置,不过他们会对其进行不断改进。这意味着,他们需要联网才能和李世乭作战。“我们正在铺设自己需要的网络光纤。”哈萨比斯说道。

据科隆和其他专家称,打败世界冠军李世乭比打败樊麾要难得多。但科隆对DeepMind团队寄予厚望。在过去的十年中,他一直在努力打造能击败世界顶级棋手的围棋系统,而他现在认为,这样的系统已经被研发出来了。“我现在买GPU买得不亦乐乎。”他说道。

更进一步

AlphaGo具有极其重要的意义。它采用的技术不仅能用于机器人和科研领域,从类似Siri的移动数码助手,到进行金融投资,这一技术在很多任务中都能助人一臂之力。“你可以用它来解决各种棘手的问题,处理任何需要用到策略的、类似于游戏的事情。”深度学习初创公司Skymind的创始人克里斯?尼克尔森(ChrisNicholson)说道,“比如战争或商业(金融)交易等。”

有些人对此感到有些担忧,尤其是当他们想到DeepMind系统是通过自学学会围棋的时候。该系统不仅仅是通过人类提供的数据来学习的,它还会产生自己的数据,做到自己教自己。就在前几个月,特斯拉创始人伊隆?马斯克和其他人纷纷表达了自己的担忧,认为这样的人工智能系统迟早会超越人类,并脱离我们的掌控。

但DeepMind系统还处在哈萨比斯等研究人员的严密控制之下。虽然他们正在使用该系统破解一款极为复杂的游戏,但游戏到底只是游戏而已。的确,要想媲美真正的人类智慧,AlphaGo还有很长的一段路要走,还远称不上超级智能。“眼下的情况非常规范,”人工智能法律教授、华盛顿大学的技术政策实验室创始人雷恩?卡罗(RyanCalo)说道,“该系统的理解能力并未真正达到人类的水平。”但该系统指明的方向的确如此。如果DeepMind的人工智能系统能理解围棋的玩法,也许它迟早会明白更多的东西。“会不会整个宇宙都仅仅是一盘巨大的围棋呢?”卡罗问道。(叶子)

相关专题谷歌人工智能破解围棋比赛专题

标签:人工智能围棋大师

推荐阅读聚焦应用中心新浪公益新浪游戏新浪视频新浪科技小咖秀带你飙戏带你飞湖南卫视全网热播内容在手机中玩百变大咖秀正统续作全球狂热来袭击溃贱萌可爱的小怪物童话人物也能杀气爆棚一站式的生活服务平台发挥演技做最佳的主角总能发现你想听的音乐煎饼侠带您拯救不开心帮吧唧猫吃到美味的鱼领先同名电影抢先发布全中国最大的宠物社区用有趣的图案把脸遮住看看谁是白吃和冤大头十年辉煌体会梦想乐趣帮呆萌的小可爱闯关卡开始段美妙的糖果之旅沈阳遭遇六级重度雾霾2万大妈齐跳小苹果禁烟范冰冰传递社会正能量未富先老养老金吃紧益调查:慈善需立法么反虐待动物法制化呼声高涨如何看待广州拟奖拾金不昧环保部即将解决红顶中介明星婚礼上的“善”姿“百名春蕾之星”评选舞剧《画皮》关注孤独症女孩患尿毒症自筹药费互联网发展基金会成立林青霞为慈善参加节目全面实施城乡大病保险儿童安全座椅强制认证办养老院真的是机会么志愿者慰问抗战老兵战舰世界新浪特权礼包乱斗西游2暑假畅玩卡倩女幽魂2夏日特权卡功夫熊猫新手高级礼包梦幻西游2挑战特权卡狩龙战纪新浪白金礼包我是大主宰新浪荣耀礼包大话西游2免费版礼包天谕有约版测试礼包火瀑新浪战神宝箱完美国际2新浪血战卡西游降魔篇3D独家礼包古剑奇谭新浪独家礼包大战神新浪独家礼包热血传奇手机版大礼包NBA梦之队2公测豪华礼包魔域盛夏冰爽新手礼包星际传奇新浪独家礼包极限Girl美与野性结合让萌宠当一天司机亲千万不要手贱啊超级屌的视觉错觉运动地球上最美丽的天堂鸟新一代武林最萌小道士神奇的PS造钱术大开眼界的泡面新吃法让宝宝嘴馋的菠萝炒饭经典电影镜头神级剪辑亲手教你范爷经典妆容盘点全球最糟糕山寨品恶搞:当一骷髅在开车健身是把整容刀三分钟看尽十年成长和TFBOYS一起过暑假不用去医院的牙美白术一分钟识别面试潜台词Windows10升级秘籍净水器的水有多深?识趣毕业季户外特辑用户关注手机哪些功能有曰:国内外展会吐槽三十年经典Moto手机ChinaJoy2015大看点东芝虚增利润财务丑闻紫光集团收购美光科技诺基亚为未来电影造球全球APP开发创意大赛享说第四期主持人李晨猎豹靠近捕食熟睡疣猪非洲血腥动物标本加工相机拍泡腾片遇水冒泡冰岛令人窒息美景懒惰青蛙蜗牛背搭便车美摄影师拍奇怪毛毛虫

又一次,人工智能战胜人类……

美国麻省理工学院科研团队19日宣布,其开发的人工智能程序“深度角色”(DeepRole)在一个类似“杀人游戏”或“狼人杀”的在线游戏中胜过人类,成为首个在玩家角色和动机不明的的多玩家游戏中战胜人类玩家的人工智能程序。

研究人员让“深度角色”参与了超过4000轮在线桌游“抵抗组织:阿瓦隆”。在这个游戏中,玩家通过游戏进程推测出其他玩家的身份,同时掩藏自己的身份。结果,不论作为“好人”还是“坏人”,“深度角色”都比人类玩家表现更加出色。

研究显示,通过在算法中使用“演绎推理”,“深度角色”根据观察到的部分行为,推断某一玩家是敌是友,快速学习应该与谁结盟从而获得胜利。

这不是人工智能第一次在游戏中战胜人类。

早在2016年3月,谷歌旗下公司“深层思维”公司开发的人工智能程序“阿尔法围棋”就与围棋世界冠军李世石对弈,并以4比1战胜李世石。

去年12月至今年1月,“深层思维”的另一个人工智能程序“阿尔法星”在经典即时战略电脑游戏《星际争霸2》中,与高水平人类职业选手先后举行了11场比赛,以10比1击败人类选手。

只有在1月24日举行的现场比赛中,“阿尔法星”由于游戏视角受限,人类选手才勉强赢下一场。

与围棋棋盘上所有棋子都对双方可见不同,《星际争霸2》中有“战争迷雾”,一方需要猜测和侦察对方的行动,属于“不完美信息博弈”,并且要求人工智能必须实时做出反应。

“深层思维”公司表示,“阿尔法星”获胜,一个重要基础是它使用了深度神经网络,研究人员通过监督学习和强化学习的方式,直接利用游戏的原始数据来训练,以模仿学习的思路,让模型快速学到高水平人类玩家在游戏中使用的策略和操作。

今年7月,美国卡内基-梅隆大学宣布,该校和脸书公司合作开发的人工智能Pluribus在六人桌德州扑克比赛中击败多名世界顶尖选手,突破了人工智能仅能在国际象棋和围棋等二人游戏中战胜人类的局限。

当时,Pluribus与13名德州扑克高手进行了1万手不限注对局的六人桌比赛,每次比赛中由机器对5名人类选手,结果机器取得胜利。

在比赛中,Pluribus会让自己变得难以预测。例如常规打法是在牌最好的时候押注,但这很快会被对手识破,因此它会“耍点心眼”,不按常理出牌。分析显示,它会做出一些多数人类玩家都认为不好的决策,这在客观上也迷惑了对手。

不过,以前的这些游戏中,人工智能从一开始就知道“谁是敌人、谁是朋友”。相比之下,“深度角色”所面对的情况更为复杂,需要根据观察作出自己的判断。

目前,人工智能的技能仍有提升空间,语言能力将是下一个前沿。在游戏中,人类玩家会说谎,这需要更复杂的交流技巧。只有掌握表达技巧后,人工智能才能参与那些需要对其他玩家进行劝说的复杂社交推理游戏。

下赢围棋、打赢游戏,能给人工智能的发展带来什么呢?

研究人员说,在游戏中训练人工智能,有助于人类积累更多经验,最终设计出能够应对现实生活中复杂问题的程序,从而帮助机器人更好理解人类、向人类学习并与人类共事。

-END-

为什么谷歌人工智能击败围棋冠军这事如此重要

AlphaGo击败围棋冠军的消息在朋友圈刷屏了。

从昨天夜里到今天,你的朋友圈是不是被谷歌的人工智能击败围棋冠军这条消息刷屏了?就在谷歌发表《自然》杂志的封面文章后,Facebook人工智能实验室相关人员随即呛声:恭喜谷歌,但这是我们先做到的。

从两个科技巨头对人工智能击败围棋冠军的重视程度上,可以判断,这是人工智能发展史上了不起的挑战。那么人工智能在人机对战中赢得胜利究竟有多重要,可能得从人工智能的发展说起了。

AlphaGo是如何做到战胜欧洲冠军的?

先来看看谷歌的人工智能是怎么击败围棋冠军的。根据1月28日《自然》杂志的封面文章介绍,谷歌DeepMind公司设计的AlphaGo在没有任何让子的情况下以5:0完胜欧洲冠军、职业围棋二段樊麾。

DeepMind团队表示,AlphaGo的关键在于使用人工智能中的深度神经网络。在AlphaGo中有两种不同的神经网络,第一种叫做政策网络(policynetwork),用来预测下一步;第二种叫做价值网络(valuenetwork),用来预测棋盘上不同的分布会带来什么不同的结果。

“简单来说,DeepMind是通过让机器学习做到的。按照以往的方法,人工智能是外界输入一个信息,计算机通过输入信息与已有的信息联系,得出一个结论,是一种递归的方式。但现在DeepMind的做法是,我不告诉机器哪种算法能得到高分,而是训练它,通过学习和分析结果来判断最优策略。这个过程已经开始类似小孩子学习知识的一种方式了。”复旦大学计算机与工程学院副教授邱锡鹏告诉澎湃新闻(www.thepaper.cn)。

再通俗一点的说法就是,DeepMind先用已有的围棋技巧来训练AI,称为监督学习(supervisedlearning),然后让AI和自己对弈,通过深度学习让其掌握如何赢得围棋比赛的技巧。

英国围棋协会财务主管,也是樊麾与AlphaGo比赛的裁判托比·曼宁(TobyManning)目睹了整个对弈过程。在接受国外媒体采访时,他表示:“你甚至很难区分哪一方是人类,哪一方是计算机。在之前的很多软件中,计算机下的很多步可能都很理性,但突然就会变得毫无头绪,而在这场比赛中,几乎看不到计算机与人类的区别。一个区别是时间的分配方式:樊麾下每一步所花的时间都要比AlphaGo更久,而AlphaGo的棋路也不像人类棋手那样富有进攻性。它会非常冷静地落子,而非积极地侵略领地或提子。”

地平线机器人公司CEO余凯在自己的朋友圈称,深度学习领域里的各种进步,让其兴奋不已。因为从简单多层神经网络在语音识别的突破(2011),到对空间展开的卷积神经网络在图像识别领域的突破(2012),再到递归神经网络在序列学习领域(OCR,语音,机器翻译,NLP)的进展(2014),再到基于深度神经网络的增强学习在计算机博弈和控制领域的突破性进展(2016),这个过程人类只用了5年时间。

人工智能战胜围棋冠军是一件里程碑式的事件。

为什么这事如此重要?

理解了AlphaGo的人工智能后,再来看看为什么战胜围棋冠军是一件里程碑式的事件。

棋类游戏一直被视为顶级人类智力的试金石。人工智能与人类棋手的对抗一直在上演。1989年开始,IBM的“深蓝”(deepblue)就常常能击败国际象棋大师了,8年后的1997年,深蓝首次打败世界第一的国际象棋棋手加里·卡斯帕罗夫,开始统治国际象棋领域。2006年,成为了人类在国际象棋的绝唱,因为自此之后,人类再没有战胜过最顶尖的人工智能国际象棋选手。

不同于国际象棋,围棋每回合的可能性更多,共有250种可能,一盘棋可以长达150回合。同时,围棋有3^361种局面,而可观测到的宇宙,原子数量才10^80。用人工智能战胜围棋专业选手,按照技术的发展速度,一般认为至少需要10年才能实现。

“为什么我们要致力计算机围棋?因为这是一个需要学习、模式识别、问题解决和规划等技能组合在一起的技能。也是一个测试新的想法,机器学习、推理和规划的好方法。”Facebook人工智能实验室主任YannLeCun在自己的Facebook账号上表示。

Facebook人工智能研究所研究员田渊栋在其知乎账号上指出,围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。这两点加起来,迫使目前计算机只能用穷举法并且因此进展缓慢。

目前,田渊栋在Facebook负责黑暗森林(DarkForest)项目,也是一个围棋对弈项目。这个程序已更新到第三个版本,并在KGS服务器上运营了一个多月,并取得了成人组第五的排名。这个排名意味着它已经成为全美国最好的前100名选手之一,也步入了世界最顶尖围棋机器人之列。

赢了欧洲冠军樊麾后,AlphaGo下一步的目标是在3月份挑战围棋世界冠军李世石。

对于这场世纪大对决,DeepMind公司创立者之一德米斯·哈萨比斯(DemisHassabis)表示很有信心。他在接受《自然》杂志采访时称:“AlphaGo很可能在围棋这一领域超越最顶尖的人类,我非常期待看到它在围棋的规则之内创造出新的东西。这是我亲手打造的系统,自然对它怀有很深的感情,尤其考虑到我们打造它的方式——它会不断学习,从某种意义上说我们是在不断‘训练’它,它下棋的方式也很像人类。你在写一段普通的程序时,可能对所有细节都了如指掌,事先安排好了一切,但AlphaGo不一样,它会自己学习提高,这种能力是很了不起的。”

关于AlphaGo的未来应用,哈萨比斯说:“最终,我们想要将这些技术应用到真实世界的重要问题中。因为我们用的方法是通用的,我们希望有一天,它们能延伸得更广,帮助解决最紧迫的社会问题,从医药诊断到环境模型。”

按照哈萨比斯的描述,这项技术在Google的首个用途将是开发更好的个人助理软件。这样的个人助理能够从用户在线行为中学习用户偏好,并对产品和事件作出更符合直觉的建议。利用人工智能来做私人助理,这与Facebook首席执行官马克 · 扎克伯格之前的想法又不谋而合了。

围棋,与人工智能同行

核心阅读

从2016年的“人机大战”至今,人工智能对围棋界的影响可谓史无前例。打破定式、研习布局、解读走势、辅助训练……人工智能在围棋领域参与度越来越高。选手棋力普遍提升,培训师资因势补强,办赛推广走上云端,观赛讲解更为直观……广泛应用新技术,围棋与人工智能携手弈出新局面。

9月1日,2020年中国男子围棋甲级联赛第一阶段结束。8轮比赛,没有一位棋手、一支队伍保持不败。格局不再强弱分明,比拼更富悬念,这背后是棋手实力的整体提升。“没有全胜是好现象,比赛非常激烈,水平也很接近。”“棋圣”聂卫平赛后如此点评。

这样的变化,与近几年围棋人工智能(AI)的助力不无关系。打破定式、研习布局、解读走势、辅助训练……随着人工智能在围棋领域的参与度越来越高,人脑与电脑不断教学相长。据业内人士介绍,比起人工智能融入围棋领域之前,职业棋手的实力普遍长进了不少。

人工智能广泛应用于辅助训练

围甲第七轮,分列中国、韩国围棋积分第一的两位棋手同时输棋。中国“七冠王”柯洁的正式比赛十五连胜戛然而止;韩国“00后”世界冠军申真谞的围甲五连胜也宣告终结。而就在几天前,这两位棋手在Goratings世界围棋等级分榜单上刚刚刷新纪录——申真谞达到史无前例的3800分,柯洁的3723分也创造了个人新高。

从2016年李世石与“阿尔法围棋”的人机大战开始,人工智能对围棋界的冲击可谓史无前例。电脑的精密计算、学习能力、布局招法,让人瞠目结舌。当今的围棋AI软件甚至能让两子与人类顶尖高手较量。“深深的无力感”一度弥漫在职业棋坛。

使用AI复盘做技术指导,研究不同的“解题思路”,早已成为职业棋手的必修课。中国围棋队与腾讯智能围棋“绝艺”续约到2022年,通过提供拆棋、胜率、吻合度、局面分析等辅助功能,专用训练AI承担了教练、陪练、棋友等多重角色。大赛前,棋手们也经常借助AI做针对性准备。

“90后”棋手是第一批通过“网棋”成长起来的,现在时间来到AI的新节点。训练资源的均等化,使得新、老棋手之间的差距逐渐缩小。初入职业棋坛的年轻人也不缺少和高手过招的机会,“00后”棋手的成长速度进一步加快。“现在每一盘棋都变得不好下,坐在棋盘前,大家掌握的东西都差不多,胜负就看临场发挥和调整了。”中国棋手陈耀烨说。

在棋手普遍从人工智能获益的趋势下,谁能汲取更多养分,谁更容易脱颖而出。柯洁在乌镇“人机大战”失利后,对围棋有了重新思考,全局观、判断力等核心能力又上了个台阶;申真谞作为韩国接受AI最快的棋手之一,一年与AI切磋上千局,改善布局短板后,战绩有了质的飞跃。

AI与职业围棋愈加密不可分,借助这个跳板,以往棋手的集体摆棋更多转向集体与AI拆招。“大家集体研究,有助于更快消化AI的思路,反过来也能帮助更多人接受新变化。”中国围棋队领队华学明说。

棋手对围棋的理解不断更新和拓展

人工智能,被围棋界视为从未有过的大变局。从最初的不服、震惊,到完败后的沮丧、迷茫,再到深入了解后的研究、请教,大多数棋手都经历了复杂的情感变化。柯洁曾感叹:“看AI下棋就像神仙打架,我们只能欣赏、学习。”

日本围棋大师藤泽秀行曾言,棋道一百,我只知七。当人工智能浪潮袭来,大家越发意识到这并非谦辞。以前的招法定式,在AI天马行空的思路下经常被推翻,棋手对围棋的理解不断更新和拓展,在棋盘上发现更多可能。“比如AI的很多招法是按全局来考虑的,在一个局部下没有固定的招,这是一种棋理上的提升。”中国棋手时越说。

从对手到朋友,职业棋手与AI找到更长久的相处模式。柯洁就经常通过AI分析自己的判断和理解,而AI的数据反馈,也帮助他有选择性地吸收、消化。“对AI甚至有点依赖的感觉,这是几年前不敢想的事情。”

以往多年,棋手们常常困扰于一盘棋究竟输赢在哪里,AI的精准分析可以帮助接近正确答案,让人少走很多弯路。与此同时,随着AI的神秘面纱被慢慢揭下,棋手们也愈加发现,围棋没有绝对的正解,电脑也不可能把所有变化都解析出来,最终比拼的依然是各人对棋的不同理解。

当AI攻向人类“最后一块智慧高地”的硝烟散尽,技术上的变革、理念上的冲击并没有折损围棋项目的魅力,反倒带来推广项目的契机。毕竟,人与人之间的博弈,双方情绪与心理的斗智斗勇,仍是现阶段AI满足不了的。换言之,人工智能不过是让我们用更智慧的方式来对待围棋。

新技术融入围棋运动各环节

在本赛季男子围甲开赛前,中国围棋协会举办了史上首次网络热身赛。AI练棋、“云端”练兵,传承千年的面对面“手谈”在科技的助力下,呈现着不同以往的面貌。

而AI改变的,不只是赛场内的职业高手。以前大赛讲棋,一些普通棋迷并不了解棋盘上的复杂计算,如今有了人工智能讲解和辅助观赛系统,就算“外行”也可以通过AI反馈的数据和判断,对局势和胜负一目了然,观赛变得更为直观。

在“阿尔法围棋”横空出世后很长一段时间,AI围棋软件只是大公司的科研项目。如今,AI已然是普通棋迷也能驾驭的工具。民间研发的各类对弈软件中,既有公开售卖的,也有不少开源软件,谁都能下载使用,甚至还有一部分“技术流”棋迷亲自上手改编软件。

曾困扰围棋培训行业的师资难题,也借助AI作为教学工具而得到一定缓解。这两年出现的“人工智能特色课程体系”,充分激发青少年学棋的兴趣,能在较短期内提升棋力。比赛、学习、培训、训练、研究、讲解……围棋的各个环节都出现了人工智能的影子,成为“激发人类潜能”的工具。

当然,人工智能的渗透也带来一些“副作用”。今年受疫情影响,大量围棋比赛转移到线上。随手可得的对弈软件、无法实时监管的对弈环境、难以清晰界定的AI支招,使得线上作弊的门槛越来越低。业内人士坦言,目前虽有一定的技术防火墙,但仍存在有死角和漏洞,有些“疑似作弊”无法及时抓到“实锤”。中国围棋协会透露,未来将在正式比赛中,通过信息阻断、空间监控、使用留痕、吻合度分析、失信惩戒来完善防AI作弊手段,净化赛场环境。

纵使人工智能是把“双刃剑”,但落下的棋子,终究掌握在人类自己手中。只要新技术“由人掌控并服务于人”,就没理由不去尝试学习和应用。与人工智能同行,博大精深的围棋世界并没有失色,反而打开了一方新局面,更有机会绽放灿烂光华。

《人民日报》(2020年09月07日15版)

(责编:牛镛、杨磊)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇