围棋人机大战,与人工智能的对弈
围棋人机大战是传统围棋和现代人工智能的博弈,我在观看之后,深有感触。人工智能的兴起,终于是取得了对人类棋类技术的领先,这也以为着人类终于要走向人工智能时代,全民人工智能并不遥远。棋类智力对战游戏,历来是计算机“智能”水平的试金石之一。但随着人工智能技术的进步,近年来,人类在棋盘上的阵地也不断“失守”:1997年,美国IBM公司超级计算机“深蓝”依仗强大的计算能力,“暴力碾压”当时世界排名第一的国际象棋大师卡斯帕罗夫。2006年,中国超算“浪潮天梭”同时对战5位中国象棋特级大师,最终以总比分险胜,取胜关键被认为是不知疲倦的稳定性和超强的计算能力。围棋被视为人机对决的“最后一块棋盘”,但人工智能技术的发展似乎超出了多数人的想象。2016年3月15日,谷歌人工智能程序“阿尔法围棋”(AlphaGo,被中国棋迷戏称为“阿尔法狗”)与韩国棋手李世石九段的最后一轮较量以前者获胜结束。最终,这场轰动全球的“人机大战”的总比分定格在了4:1,阿尔法围棋轻松战胜了代表人类出战的李世石。此次比赛后,阿尔法围棋的世界排名跃升至第二名,仅次于中国棋手柯洁九段。被誉为人类“智慧堡垒”的围棋被人工智能攻克,这个结果为人类留下了一连串的兴奋和担忧。阿尔法围棋的获胜,反映出了人工智能的新进步。这些进步的总和可能意味着人工智能正在走向“指数式发展的下半场”,也意味着人工智能培训的兴起,引领新一轮产业创新与变革的到来。其实,对于“电脑超越人脑”的担忧,倒也大可不必。人工智能作为人类的发明创造之一,本身就是人脑非凡能力的产物,人工智能技术的发展,也正是由人类智慧所推动。而且,尽管人工智能发展的趋势是“更像人”,但本质上它仍是服务于人类的机器。人工智能属于人类的尖端前沿科技,尽管从现在的发展水平来看,我们还不用担心人工智能会超越人类、反制人类,但是未来会如何发展,确实很难说。至于说好莱坞科幻电影中,人类发明机器人,结果反被机器人所控制、所迫害的情节会不会发生,至少在目前还没有人敢做出一个明确的结论。而经验或者教训告诉我们,对这种处在高速发展当中、但是发展前景尚未明了的新生事物,我们最起码要保持一颗敬畏之心。机器在各类智力游戏中击败人类本就是迟早问题。但正如德国乌尔姆大学教授弗朗茨·约瑟夫·拉德马赫尔所说,这并不意味着机器与人拥有同样形式的智能,而只能说明在某些功能上,机器做到了类似、甚至超过了人类。与其在胜负上纠结,不如发挥智慧提前设计好“路线图”和“安全阀”,让技术更好地推动社会文明发展。而人机大战首回合较量结果出来以后,国内却传出了一些过于“轻敌”、也过于轻视的声音来。比如有国内计算机方面的专家表示,不必对人类失利大惊小怪,人工智能的“智力”水平还不如一个小孩。这样的结论未免有些过于托大了。还有素有“中国围棋第一人”之称的棋手柯洁九段,他在围观人机大战之后,一方面说挛世石是自己的手下败将,要是他迎战,肯定不会输给人工智能;但另一方面又表示不会迎战人工智能,因为不想自己的思路被人工智能复制学习。这不就像是与人过招,结果还没出招,就说对方打不过自己,所以自己不会打,因为自己一旦打了,对方就会把自己的招数学去,这还真是一种神逻辑。人类的大脑进化了几万年才进化到现在的样子,但是人工智能才多少年呢?所以不管人机大战的最终结局如何,我们保持一份起码的敬畏之心,还是很有必要的。“阿尔法围棋”在围棋人机大战中战胜世界冠军李世石,将飞速发展的人工智能带到了人类社会的聚光灯下。有人说这是一个时代的开始,有人说这就是场秀,有人说这是场不公平的比赛,也有人说这是命中注定。“阿尔法围棋”战李世石,从一开始,就注定议论不断,人类和机器谁更聪明的讨论,甚至盖过了对比赛本身的关注。如果人们更多纠缠于人机迥异的特点,探讨人机到底谁更聪明,那往往会忽略更重要的意义:这就是一场跨时代的比赛,其内涵早已超越胜负本身。首先,这是一种对速度的诠释,“阿尔法围棋”获胜,意味着人工智能发展速度前所未有。它比任何人所预料的都要快得多,甚至让众多科技界大咖纷纷猜错。不过探其究竟,到底是人工智能自身进步速度可畏,还是背后的科学家令人生畏?答案耐人寻味。毕竟,围棋这种源自中国的古老游戏,其难度之高毋庸置疑:361个交叉点可让棋盘变幻无穷,千古不同局。传统人工智能难以“故技重施”,用击败国际象棋大师卡斯帕罗夫和中国象棋大师的“穷举法”来取胜。许多专家原以为,计算机战胜围棋职业棋手,至少还需要10年。而现在,一群程序员已经让它成为了事实,爱与不爱,成果就在那儿。其次,这是一场人工智能发展新局面的全面诠释,对抗中的新技术应用前所未有。当年,IBM“深蓝”战胜卡斯帕罗夫,更多使用了硬件加速、暴力计算等计算机运算特长。而这次对抗则更多地体现了“软”的一面,神经网络、深度学习、蒙特卡洛树搜索法等人工智能新技术的应用,使“阿尔法围棋”与以往的同类不可同日而语,实力早有了实质性飞跃。不怕电脑记性好,就怕电脑爱学习。学会自主学习的“阿尔法围棋”,掌握了全球各种对局,两年里和自己对弈3000万盘,不断寻找“碾压”人类智商的各种棋路,所呈现出的能力已经到了让人叹为观止的地步。第三,这是一场近乎引发文化共鸣现象的技术与哲学诠释。一些深奥的技术通过几盘围棋变得如此深入人心,实在是前所未有。人类对人工智能的追问声从未如此响亮,人工智能技术发展受到了无比强烈的关注。当下世界,人类已依赖于机器的计算与“算计”。从购物网站的精准推送,到电视剧的剧情设计,再到无人驾驶汽车中的识别技术,优化计算在生活中无处不在,人工智能也可谓无处不在。事实上,“阿尔法围棋”所应用的技术已被应用在包括图像识别、文本翻译、音频及文本处理、脸部识别、强化学习以及机器人等领域。人工智能的水平恰恰折射出入类自身的科技发展能力,人类在前进,人工智能也在前进。人类将会带领着人工智能前进。或许若干年后的某一天,人们回想起这次“人机大战”仍会记忆犹新,或耿耿于怀,或从容淡定。而有一点是肯定的:人类会一直把这场超越简单输赢的大棋局继续下去。人们的好胜心终将会战胜人工智能,人们孜孜不倦的精神是机器所无法拥有的。毕竟,人工智能也是由人们创造出来的。
为什么谷歌人工智能击败围棋冠军这事如此重要
AlphaGo击败围棋冠军的消息在朋友圈刷屏了。从昨天夜里到今天,你的朋友圈是不是被谷歌的人工智能击败围棋冠军这条消息刷屏了?就在谷歌发表《自然》杂志的封面文章后,Facebook人工智能实验室相关人员随即呛声:恭喜谷歌,但这是我们先做到的。
从两个科技巨头对人工智能击败围棋冠军的重视程度上,可以判断,这是人工智能发展史上了不起的挑战。那么人工智能在人机对战中赢得胜利究竟有多重要,可能得从人工智能的发展说起了。
AlphaGo是如何做到战胜欧洲冠军的?
先来看看谷歌的人工智能是怎么击败围棋冠军的。根据1月28日《自然》杂志的封面文章介绍,谷歌DeepMind公司设计的AlphaGo在没有任何让子的情况下以5:0完胜欧洲冠军、职业围棋二段樊麾。
DeepMind团队表示,AlphaGo的关键在于使用人工智能中的深度神经网络。在AlphaGo中有两种不同的神经网络,第一种叫做政策网络(policynetwork),用来预测下一步;第二种叫做价值网络(valuenetwork),用来预测棋盘上不同的分布会带来什么不同的结果。
“简单来说,DeepMind是通过让机器学习做到的。按照以往的方法,人工智能是外界输入一个信息,计算机通过输入信息与已有的信息联系,得出一个结论,是一种递归的方式。但现在DeepMind的做法是,我不告诉机器哪种算法能得到高分,而是训练它,通过学习和分析结果来判断最优策略。这个过程已经开始类似小孩子学习知识的一种方式了。”复旦大学计算机与工程学院副教授邱锡鹏告诉澎湃新闻(www.thepaper.cn)。
再通俗一点的说法就是,DeepMind先用已有的围棋技巧来训练AI,称为监督学习(supervisedlearning),然后让AI和自己对弈,通过深度学习让其掌握如何赢得围棋比赛的技巧。
英国围棋协会财务主管,也是樊麾与AlphaGo比赛的裁判托比·曼宁(TobyManning)目睹了整个对弈过程。在接受国外媒体采访时,他表示:“你甚至很难区分哪一方是人类,哪一方是计算机。在之前的很多软件中,计算机下的很多步可能都很理性,但突然就会变得毫无头绪,而在这场比赛中,几乎看不到计算机与人类的区别。一个区别是时间的分配方式:樊麾下每一步所花的时间都要比AlphaGo更久,而AlphaGo的棋路也不像人类棋手那样富有进攻性。它会非常冷静地落子,而非积极地侵略领地或提子。”
地平线机器人公司CEO余凯在自己的朋友圈称,深度学习领域里的各种进步,让其兴奋不已。因为从简单多层神经网络在语音识别的突破(2011),到对空间展开的卷积神经网络在图像识别领域的突破(2012),再到递归神经网络在序列学习领域(OCR,语音,机器翻译,NLP)的进展(2014),再到基于深度神经网络的增强学习在计算机博弈和控制领域的突破性进展(2016),这个过程人类只用了5年时间。
人工智能战胜围棋冠军是一件里程碑式的事件。为什么这事如此重要?
理解了AlphaGo的人工智能后,再来看看为什么战胜围棋冠军是一件里程碑式的事件。
棋类游戏一直被视为顶级人类智力的试金石。人工智能与人类棋手的对抗一直在上演。1989年开始,IBM的“深蓝”(deepblue)就常常能击败国际象棋大师了,8年后的1997年,深蓝首次打败世界第一的国际象棋棋手加里·卡斯帕罗夫,开始统治国际象棋领域。2006年,成为了人类在国际象棋的绝唱,因为自此之后,人类再没有战胜过最顶尖的人工智能国际象棋选手。
不同于国际象棋,围棋每回合的可能性更多,共有250种可能,一盘棋可以长达150回合。同时,围棋有3^361种局面,而可观测到的宇宙,原子数量才10^80。用人工智能战胜围棋专业选手,按照技术的发展速度,一般认为至少需要10年才能实现。
“为什么我们要致力计算机围棋?因为这是一个需要学习、模式识别、问题解决和规划等技能组合在一起的技能。也是一个测试新的想法,机器学习、推理和规划的好方法。”Facebook人工智能实验室主任YannLeCun在自己的Facebook账号上表示。
Facebook人工智能研究所研究员田渊栋在其知乎账号上指出,围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。这两点加起来,迫使目前计算机只能用穷举法并且因此进展缓慢。
目前,田渊栋在Facebook负责黑暗森林(DarkForest)项目,也是一个围棋对弈项目。这个程序已更新到第三个版本,并在KGS服务器上运营了一个多月,并取得了成人组第五的排名。这个排名意味着它已经成为全美国最好的前100名选手之一,也步入了世界最顶尖围棋机器人之列。
赢了欧洲冠军樊麾后,AlphaGo下一步的目标是在3月份挑战围棋世界冠军李世石。
对于这场世纪大对决,DeepMind公司创立者之一德米斯·哈萨比斯(DemisHassabis)表示很有信心。他在接受《自然》杂志采访时称:“AlphaGo很可能在围棋这一领域超越最顶尖的人类,我非常期待看到它在围棋的规则之内创造出新的东西。这是我亲手打造的系统,自然对它怀有很深的感情,尤其考虑到我们打造它的方式——它会不断学习,从某种意义上说我们是在不断‘训练’它,它下棋的方式也很像人类。你在写一段普通的程序时,可能对所有细节都了如指掌,事先安排好了一切,但AlphaGo不一样,它会自己学习提高,这种能力是很了不起的。”
关于AlphaGo的未来应用,哈萨比斯说:“最终,我们想要将这些技术应用到真实世界的重要问题中。因为我们用的方法是通用的,我们希望有一天,它们能延伸得更广,帮助解决最紧迫的社会问题,从医药诊断到环境模型。”
按照哈萨比斯的描述,这项技术在Google的首个用途将是开发更好的个人助理软件。这样的个人助理能够从用户在线行为中学习用户偏好,并对产品和事件作出更符合直觉的建议。利用人工智能来做私人助理,这与Facebook首席执行官马克 · 扎克伯格之前的想法又不谋而合了。