解析人工智能五大流派
AI的方法有许多,除了我们较为熟悉的“五大流派”,本文作者对AI的各流派进行细分,梳理了起码17种方法,并用一张图直观地展现。作者说,各种AI方法并不平等,站错队可能导致自取灭亡。“人工智能”是一个非常含糊的术语。这是因为人工智能(AI)是1955年在一种非常傲慢的情境下被创造出来的一个术语:我们建议于1956年夏天在新罕布什尔汉诺威的达特茅斯学院进行一个为期2个月控制工程网版权所有,10个人参加的人工智能研讨会。该研讨会将基于如下设想进行:学习的每个方面或有关智能的其他特征原则上可以非常精确地进行描述,以至于能被机器模拟。我们将尝试找到让机器使用语言、形式抽象和概念的方式,解决现在只能由人类解决的问题,并提升人类智能。AI经历了半个多世纪,也带上了太多其他学科的印记。在很长一段时间里,AI被符号主义者统治。符号主义是一种基于规则的系统,具有“零学习”(ZeroLearning)特点。20世纪80年代,一种新的AI方法开始出现,我们称之为机器学习。最后,还有“简单学习”(SimpleLearning)。然而,在最近十年里,最大的变化是我们偶然发现了“深度学习”,而且它杀伤力极强,似乎无所不能。当然,这是一个非常简化的AI历史。实际上,AI领域有许多不同的方法和流派。PedroDomingo在《终极算法》一书中描述了5个不同的AI“学派”。一位名为solidrocketfuel的YCombinator用户不甘示弱,发了条帖子,说AI至少有“21个不同的流派”。对于任何计划搞AI的人来说,一个非常重要的事情是了解AI的这些不同学派和方法之间之间的差异。AI不是一个同质的领域,而是不断发生不同学派之间的争议的领域。下图是一个概况:
符号学派(Symbolists):是使用基于规则的符号系统做推理的人。大部分AI都围绕着这种方法。使用Lisp和Prolog的方法属于这一派,使用SemanticWeb,RDF和OWL的方法也属于这一派。其中一个最雄心勃勃的尝试是DougLenat在80年代开发的Cyc,试图用逻辑规则将我们对这个世界的理解编码。这种方法主要的缺陷在于其脆弱性,因为在边缘情况下,一个僵化的知识库似乎总是不适用。但在现实中存在这种模糊性和不确定性是不可避免的。进化学派(Evolutionists):是应用进化的过程,例如交叉和突变以达到一种初期的智能行为的一派。这种方法通常被称为遗传算法(GeneticAlgorithm,GA)。在深度学习中,GA确实有被用来替代梯度下降法,所以它不是一种孤立的方法。这个学派的人也研究细胞自动机(cellularautomata),例如Conway的“生命游戏”和复杂自适应系统(GAS)。贝叶斯学派(Bayesians):是使用概率规则及其依赖关系进行推理的一派。概率图模型(PGM)是这一派通用的方法,主要的计算机制是用于抽样分布的蒙特卡罗方法。这种方法与符号学方法的相似之处在于,可以以某种方式得到对结果的解释。这种方法的另一个优点是存在可以在结果中表示的不确定性的量度。Edward是一个将这种方法与深度学习相结合的库。核保守派(KernelConservatives):在深度学习之前,最成功的方法之一是SVM。YannLeCun曾称这种方法为模板匹配方法。该方法有一个被称为核的技巧,可以使非线性分离问题变成线性问题。这一派的研究者喜欢他们的方法所具有的数学美感。他们认为深度学习派只不过是炼金术士,在没有对后果有所了解的情况下就念起咒语。TreeHuggers:是使用基于树的模型的人,例如随机森林和梯度提升决策树。这些本质上都是逻辑规则树CONTROLENGINEERINGChina版权所有,它们递归地分割域以构建分类器。这种方法实际上在许多Kaggle比赛中都相当有效。微软提出的一种方法是将基于树的模型与深度学习结合起来。联结学派(Connectionists):这一派的研究者相信智能起源于高度互联的简单机制。这种方法的第一个具体形式是出现于1959年的感知器。自那以后,这种方法消亡又复活了好几次。其最新的形式是深度学习。深度学习中包含许多子方法。包括:TheCanadianConspirators:HintonCONTROLENGINEERINGChina版权所有,LeCun,Bengio等人,推崇无需人工进行特征工程的端到端深度学习。SwissPosse:基本上是LSTM,以及两种结合的RNN解决知觉的问题。根据LeCun的说法,GAN是“最近20世纪最酷的东西”,也被声称是这帮人发明的。BritishAlphaGoist:这帮人相信,AI=深度学习+强化学习,尽管LeCun称强化学习只是蛋糕上的樱桃。DeepMind是这一派的主要支持者。PredictiveLearners:这个词是YannLeCun用来形容无监督学习的,这是AI主要的一个未解决的领域。然而,我倾向于相信解决方案在于“元学习”(Meta-Learning)。除了上面描述的主流方法外,还有一些不是特别主流的方法:Compressionists:认为认知和学习就是压缩(compression),这实际上也是其他学派共同的观点。信息理论起源于关于压缩的论证。这是一个普遍的概念,比所有经常被滥用的集合统计工具更强大。ComplexityTheorists:这一派的人采用来自物理学www.cechina.cn,基于能量的模型,复杂性理论,混沌理论和统计力学的方法。SwarmAI可以说属于这一派。如果任何团队称他们能找到深度学习为什么能起效的很好的解释,那么他们可能是这一派的。FuzzyLogicians:这种方法曾经很受欢迎CONTROLENGINEERINGChina版权所有,但最近比较少见。最近有一个使用模糊规则在mockdogfight中打败一个战斗机飞行员的研究。BiologicalInspirationalists:这一派倾向于创造更接近于生物学中的神经元的模型。例子是Numenta,pike-and-Integrate,以及IBM的TrueNorth芯片。Connectomeist:这些人相信大脑的互连(即:Connectome)是智能的来源。有一个项目试图复制一个虚拟的蠕虫,也有一些得到雄厚资助的研究,试图以这种方式映射大脑。InformationIntegrationTheorists:认为意识来源于机器的内部想象,反映了现实的因果关系。这一派的动机是,如果我们想要理解意识,那么我们至少需要开始思考意识。然而,我没法在他们的方法中找到学习和意识的关系。在他们认为,这两者可能是不相关的。PACTheorists:这一派的人并不是真的想讨论人工智能,而只是喜欢研究智能,因为至少他们承认智能的存在。他们的整体思想是自适应系统可以方便地执行计算,其结果都能大致正确。简言之,在他们看来智能不需要大规模的计算。总而言之,这些AI的方法令人眼花缭乱。而且我确信还有我没发现的别的方法。有些方法彼此水火不容,而另一些方法可以结合使用。但是,写这篇文章我想指出的是,对这些眼花缭乱的方法都了解一点,有助于让你在这个领域找到路径。最后,让我们看看ShivonZilis制作的《机器学习生态全景图》:
机器学习生态全景图3.0(来源:Oreilly)
有很多公司声称自己是AI公司,在搞AI研究。你需要向他们提一个直截了当的问题。就是这些公司都在使用什么AI方法?因为这里面的一个严峻的现实是,并不是所有的AI都是平等的。换句话说,“有些AI比其他AI更平等”。我们的提议是,现在与深度学习相关的方法势头正猛。很简单,因为它与学习有关。如果你的AI方法没有一个强大的学习机制,那么注定是DougLenat那般的命运,也就是必须人工编写所有规则!其他的方法往往都是死胡同。最好的方法之一是将深度学习与其他算法相结合。AlphaGo便是这样,使用了蒙特卡洛树搜索技术和深度学习的结合。考虑到符号学的方法与深度学习具有互补的优势和弱点,它们的结合也是非常有前途的。展望未来,将是深度学习一统AI之天下。不过,深度学习与其他AI方法相结合同样有前途。不要忽视这个现实,否则只会自取灭亡。
与AI共生:从人工智能的三大流派到What
AlphaGo打败李世石已经有两年多的时间了,在这两年中,人工智能从各个角度入侵我们的生活,从各种语音助手到智能音箱,从智能手表到智能家电,从机器翻译到刷脸支付。落地应用一波未平一波又起,人们接触得多了,了解了人工智能有多智障,便也不再担心是否会被人工智能抢去饭碗了。
但,真的是这样吗?人工智能走什么时候能走出智障的圈子?
这还要从人工智能的三大流派说起。
三大流派符号学派1956年,在达特茅斯学院,香农(ClaudeShannon,信息论创始人)和其他几个年轻学者,一起讨论了如何用机器来模仿人类在各个方面的智能,并在讨论中提出“人工智能”一词,这年就是人工智能的元年。此后的40年间,人工智能所取得的辉煌成绩都与符号学派密不可分。
当时人们认为“机器要像人一样思考才能获得智能”,而人类的认知都是基于符号的,思维只是在符号表示上的一种运算。所以应该先研究清楚人类的认知系统,进而用机器模仿人类的认知过程,并将代表认知的符号输入这些机器,来达到模拟人类智能的目的。
符号学派认为人的物理能力和心智能力是分开的,而人工智能就是要用计算机程序来模拟心智能力,而不是物理能力。正因此,智能应该是一种特殊的软件,与实现它的硬件并没有太大关系。这就好比一个会开车的人,他不能让一个没有轮子的车跑起来,但你不能因此说他不会开车。这个人具有的开车的能力,就是智能(软件),与车能不能开(硬件)无关。
基于这些理念,符号学派在经历了一些波折后,在国际象棋上(1997年)和《危险》(2011年)中战胜了人类(《危险》是一个美国电视节目,主持人会给参赛者一系列线索,参赛者要用最短的时间猜出主持人描述的人或事物)。
连接学派智力活动在符号学派看来是一款软件,这款软件的运作需要从外界获得大量的知识输入,这样的输入在20世纪80年代相当的费时费力,成为了制约符号学派发展的瓶颈。另外一群人认为,把智力看成是一款软件是远远不够的。
人类智力是在大脑的活动下产生的,而大脑是由上百亿个神经元细胞通过错综复杂的连接构成的。所以人们很自然的想到,我们是不是可以模拟大量神经元的信号传输方式来模拟大脑的智力呢?
连接学派通过算法模拟神经元,并把这样一个单元叫做感知机,将多个感知机组成一层网络,多层这样的网络互相连接最终得到神经网络。我们可以根据要解决的实际问题来构建神经网络,进而用数据不断训练这一网络,调整连接权重来模拟智能。
现在炙手可热的深度学习,可以看做是连接学派的延伸,已经在语音识别、图片处理、模式识别等领域取得突破性进展。
行为学派与上面两个学派不同的是,行为学派把目标聚焦在相对低等的生物身上,他们发现即便是昆虫这种比人类简单得多的生物,也表现出了非凡的智能,比如可以灵活地行走并躲避障碍物,快速精准地捕食猎物。从这点出发,行为学派模仿动物的身体,在不需要大脑干预的情况下,仅凭四肢和关节的协调来适应环境。
另一方面,生命体在演化的过程中会不断变异,而环境会对这些变异进行选择,让更适应环境的变异繁衍下去,同时淘汰不适应环境的变异。在这一变异和选择的过程中生物逐渐从简单走向复杂,从低级走向高级。
基于此,霍兰(JohnHolland)提出了遗传算法:在计算机中,用一堆二进制串来模拟自然界的生物体,改变这些二进制串来模拟基因突变,用适应度函数来模拟大自然的优胜劣汰,最终找到最优解。
这一学派在机器人领域成果卓著,例如美国波士顿动力公司研发的“bigdog”,“开门机器人”
What-How-Why:“是什么”、“该怎么”、“为什么”举一个医疗诊断的例子有一种癌症,叫黑色素瘤,这是皮肤肿瘤中恶性程度最高的瘤种,容易出现远处转移,可以致死,所以早期的诊断非常重要。但是,它的初期表现,跟皮肤上长了一个普通的“色素痣”一样。想要在早期诊断黑色素瘤,最稳妥的方式是做活组织切片检查,可你总不能每长一个痣就去动刀。
好在黑色素瘤和普通色素痣的外观还是有区别的,总结说来,有以下四个特征:
1.一般都非对称
2.边缘不规则
3.颜色可能不统一,更富于变化
4.直径通常大于6毫米
一个皮肤科医生,要学习上面四个规则,来给患者进行诊断。那计算机不是也可以学习这些规则,然后取代人类吗?
“是什么”和“该怎么”1945年,英国心理学家吉尔伯特·赖尔(GilbertRyle)在演讲中提到了这两种知识:
一个孩子知道自行车有两个轮子,轮子里面都是空气,转动把手就可以拐弯……他只是知道了“是什么”,但还是不会骑车;如果一个孩子在几次摔倒之后学会了骑车,这时候,他就知道了“该怎么”。知道“是什么”是基于事实和概念;而知道“该怎么”是基于技能和经验。知道“该怎么”,可不一定知道“是什么”,你让一个会骑车的人讲解一下他是怎么骑车的,可能他根本说不清楚。
我们要把一件事物“是什么”告诉计算机,一种方法是把这个事物方方面面的描述都告诉计算机,它就知道了“是什么”,至少理论上是这样的。比如,你要让计算机来判断这是一个色素痣还是一个黑色素瘤,你只要把那几个特征告诉计算机就可以了。
可事实远比这复杂得多,因为把上面的四个特征翻译成算法语言,本身就不太容易——到底多不对称才叫“不对称”?怎么不规则才算“不规则”?而且符合那四个特征的也未必是黑色素瘤,不符合的也可能是。所以最后算下来,计算机的准确度还是不如人类专家。
还有第二种方法,就是深度学习。通过深度学习,我们甚至不用去制定规则,只要找出一套合适的模型,然后用大量的数据进行训练,模型自己就能学会判断。事实上,这种方式训练出的神经网络,已经在黑色素瘤的识别准确率上远高于人类专家。
这样说来,在“是什么”这一块,计算机已经可以超越人类了;而像骑自行车这类“该怎么”就是行为学派擅长的东西,可能未来也会超越人类。但人工智能有个致命的问题,就是不知道“为什么”。
“为什么”神经网络可以在黑色素瘤的识别这件事上做得比人类好,但只不过是依靠算法给出输入和输出之间的对应关系,它本身根本不理解病变。人类医生不仅仅会告诉你这里有一个病变,他还会告诉你用药的时候要注意周围的危险区域,他还会发现没有症状、但是已经产生的肿瘤……因为人类能理解病变。
人类比计算机更厉害的地方在于,我们不仅能理解,我们还会问“为什么”。
为什么会有这些病变?为什么黑色素瘤边缘是不规则的?为什么会变颜色?为什么容易出现远处转移?正是因为我们能问出为什么,我们才能不断深入研究,不断获得新的知识,不断找到新的治疗方法,不断地知道新的“是什么”和“该怎么”。
人工智能只能解决一个问题,但是不能创造一个问题。
共生尽管AlphaGoZero可以在自我对弈的前提下战胜所有人类,但AlphaGoZero还是在有限的棋盘上,在有限的规则下计算。它只知道“该怎么”,而不知道围棋“是什么”,更不知道“为什么”。
更何况真实的世界有无限多的自由度,没有明确规则,你沿着任何一个方向深入下去都会碰到各种各样新的可能性。这些新的东西,才更有价值。
我们目前并不需要过多担心被人工智能抢走饭碗,更应该考虑的是:如何运用人工智能帮助我们更高效的工作?我们是否需要更多的人工智能训练师,而不是医生、工程师?如果人工智能预测错误,谁来承担责任……
我们需要人工智能,但拓展知识的边界,还得靠我们自己。
参考文献:
[1]《科学的极致:漫谈人工智能》.集智俱乐部.
[2]Thealgorithmwillseeyounow.SiddharthaMurherjee.TheNewYorker.April3,2017.(https://www.newyorker.com/magazine/2017/04/03/ai-versus-md)