脑科学和人工智能的思考
作者:曹钰链接:https://zhuanlan.zhihu.com/p/129673481
一、脑科学人工智能是AI的未来很多人认为通用人工智能没有头绪,是遥不可及的事。但是我的观点是脑科学已经有足够多的积累,给我们指引了正确的方向。我们需要做的就是理解大脑工作的本质,将各种零散的科学发现系统地整合起来,实现具有大脑处理信息功能的系统。
1.1什么是智能?人工智能的终极目标是实现通用人工智能。大脑是非常神奇的,它是目前已知的可以实现这种“智能”的结构。这就是为什么我们需要借鉴大脑的工作原理来实现通用人工智能。
智能是经常被误解和滥用的概念。“智能”不是快速计算的能力,不是会处理统计的能力,不是会打游戏或下棋的能力,也不是记忆力强的能力。它是大脑处理自然界非标准化信息的过程中的外在体现,也就是说大脑在处理信息的过程中让人觉得“它是有智能的”。大脑的本质就是处理内外部的输入信息,对输入信号进行识别,然后做出相应的反应或输出。处理非标准化信息的能力才体现了个体适应自然界的能力。
1.2为什么火爆的深度学习并不是真正的AI?深度学习取得了巨大的成功,但是它并不是真正的“智能”。它取得的成功是有限的,并且正在快速达到了瓶颈。GaryMarcus说道“深度学习只是一个对样本数据做分类的统计方法”。他在一篇文章中列举了深度学习的10大缺点,我们这里主要关注其中的两点。
1、数据依赖深度学习需要大量的数据。数据处理占据了一般项目投入的50%以上。即使采用了pre-trained的模型,还是需要上万的样本数据。在现实生活中,这是非常有问题的。如果一个生物需要重复百万次才能学习一项能力,那么它早就会灭亡了。
2、黑匣子深度学习网络的参数有超过百万,甚至上亿个,这就导致了几乎没有办法debug这个系统。深度学习系统有时候会给出一些奇怪的结果:比如在停车标志上贴个小的标签,系统就会误认为是一个限速标志;有些奇怪条纹状的图案会被系统认为是企鹅。在关键的应用场景,如自动驾驶、医学影像,我们需要理解系统结论的原因以防止事故的发生。如果我们不知道系统的决策机制,就很难纠正这个问题。
深度学习没有坚实的理论基础。注定了它很难有长期发展,就好像没有坚实的地基,就不可能建造摩天大楼一样。从脑科学的角度来看,深度学习还根本没有触及智能的表面。基于深度学习的AI走得是一条和真正的人工智能背离的路,一条通向死胡同的路。
1.3什么是脑科学人工智能?我始终相信现在的深度学习只是一盘小菜,真正有潜力的是基于脑科学的人工智能。什么是“脑科学人工智能”?它指的是将大脑的工作原理应用到AI系统的设计。在这个过程中,我们需要关注的是大脑在信息处理过程中各环节输出的效果,而不是什么特定的神经网络结构。
脑科学人工智能的核心不在于用什么神经网络,而在于信号是如何一步一步处理的:神经网络只是表象,不过是实现信息处理的一种方式。只要我们知道了信息处理的效果,有多种方式都可以实现。大脑的构造已经足够复杂了,关注它的表象只能让事情变得更加复杂。举例来说,在怀特兄弟发明飞机以前,大家都在模仿鸟的解剖结构。但是怀特兄弟抓住了飞行的本质,利用空气动力学实现了飞行的效果。
脑科学人工智能也不是学术界的计算神经生物学(computationalneuroscience)。学术界的人通常只是关注某个孤立的问题,主要用途是发文章,实用价值有限。而我们关注的是如何系统范围内将各个脑科学发现有机整合在一起,实现大脑处理信息的效果。
二、正确的科学观:抓住现象的本质这篇文章的本意是要介绍如何实现人工智能的,但是考虑到这是一个新兴领域,市面上各种观点横飞,鱼龙混杂,伪科学大行其道,很多人都处于懵逼状态。我觉得有必要先从科学方法论方面谈一下自己的观点。
2.1要有独立的思考在脑科学人工智能领域,现在还没有一个专家,所谓的专家基本上都是处于盲人摸象状态。那些具有光鲜亮丽,炫目头衔的,不管是JeffHinton,DemisHassabis,或者是Google,facebookorBAT,在这个领域都是门外汉。
大脑的决策机制决定了人通常是具有思维定式的。每个人都有自己的专长,以游戏起家的即使做AI也会从游戏模拟的角度来做,以社交媒体起家的会从社交媒体的角度来做AI。不要指望他们能够跨界做出什么突破性的东西。真正的创新不是靠砸钱和拼人力来实现的,否则排名第一的公司就永远会保持第一。优秀的公司如GE和Intel也在走下坡路,疲态尽显。
创新分0→1和1→10。1→10创新可以靠投入人力和财力实现,是资源型玩家的游戏,他们适合拿来主义;而0→1才是真正的创新,对所有人都是平等的,它只会光顾某类有创新精神的人。
经常看到专家们今天在这个论坛,明天那个论坛高谈阔论,畅谈人工智能的趋势,对人类的威胁。这纯粹是杞人忧天,连怎么实现都搞不清楚,以什么样的形态存在都不知道,说得都是些虚头巴脑的东西,没有任何凭据的讨论是没有意义的。
那些认为大脑太复杂需要用量子力学来解释的专家,可以说他们和古代的巫师基本上没有什么两样。
2.2如何判断一个新生事物首先要抓住事物的本质,只有从本质的角度才能简单直观又准确地对新事物做出判断。只有抓住了本质,我们才能区分什么是魔术,什么是科学。RayDalio提到的“原则”其实就是在经济领域的本质。不仅如此,在科技和社会领域都存在相应的原则。
我们存在的物质世界充满了神奇,暂且不管自然界的各种法则是怎么产生的,人类存在的一个很重要的目的就是要探索这些法则并加以利用,这样才会越来越接近自然界的本质。人类社会在科技、社会方面不断的进步就是建立在掌握这些法则的基础上的。在脑科学领域,我们也会找到它的法则。
懂了事物的本质,就会有融会贯通,旁触类通的感觉,对事物有更透彻的理解。事情会变得越来越简单,越容易理解,而不是越来越复杂。没有抓住本质,就可能会穷其一生,也找不到门槛。不但将自己引到死胡同,另外还误人子弟,浪费社会资源,成为一个“寻章摘句老雕虫”。
举例来说,如果我们要判断小狗和人类婴儿谁的神经系统更好,要从本质上去判断。从表象来看,小狗出生1个月后就能走路。而人的孩子到1年后才能勉强站立,蹒跚学步,那我们能说小狗比人强吗?
类似的在AI领域,现在大家衡量模型的好坏,就是看它们处理大数据的速度,用统计学的方法来看谁的准确率高;或者看谁的游戏得分高。这是非常奇怪的现象,这个体现了专家们连什么是智能都搞不清楚,不能从本质上进行鉴别,只能从肤浅的表象来判断。深度学习本质上更接近统计方法,是与智能没有什么关系的,就以统计的指标来衡量一个人工智能系统的性能,就像是将小狗和人类小孩进行对比一样荒唐。
2.3大脑的本质关于大脑,人们一直存在很多疑问:大脑是如何做决策的?什么是意识?为什么会有创新?为什么有不同的性格?为什么天才通常在精神方面显得有些“缺陷”?为什么会有宗教信仰?为什么有喜恶爱憎各种情感?为什么我们会对艺术产生美感?理解了大脑的工作原理,这些都会有答案。
理解大脑本质的意义远不止与此。除了可以用于开发AI系统,从更宏观层面来说,人类社会所有的各项活动都是大脑运作的结果,了解大脑的本质和决策机制后,我们甚至可以洞察人类社会各项活动的规律,可以将一个国家的实力提升几个数量级。
大脑是物质的,并没有什么神秘的力量在后面。我们所体验的一切感知和思考都是可以物化成一堆神经元的连接和活动。但是需要注意的是,大脑的本质不是神经网络,而在于信息处理的方式。当某人说他的模型采用了神经网络,我都持保留态度。现在主流的思路提到大脑就大谈什么神经网络,SNN等,这些只是停留在神经结构的表象,其实重要的是功能层面对信号的处理方式。
三、脑科学到AI的转化3.1脑科学向AI的转化的挑战实现脑科学人工智能存在巨大挑战,因为在脑科学和人工智能之间存在很大的鸿沟:一方面,在神经生物学领域积累越来越多的科学发现,人们对大脑有更多的了解;另一方面,这些科学发现通常是碎片化的,如何将这些发现整合起来,对大脑的运作机制形成统一的理解,并将这种理解应用到人工智能基本上是没有任何进展。
从脑科学到人工智能,有很多种流派,每个人都坚信自己的方法是对的。但是在真正的人工智能实现之前,一般人是没有办法判断到底谁对谁错的。Deepmind、Vicarious的初衷就是做基于脑科学的AI,但是他们还是走偏了。Vicarious早在2013年就发表了他们的方法,到现在还没有实用的产品开发出来,反而退回到做工业机器人的老路上。他们的方法没有延展性,在现实世界应用价值不大。HTM的创始人Jeffhawking也是花了大半辈子研究大脑的工作原理,可惜还是停留在非常肤浅的理解,可能也不会做出什么名堂。不少人以为抓住了某个科学发现,就可以做出什么大的成就,这在脑科学是不存在的,因为这是一个系统工程,需要将多个科学发现有机的整合在一起。
从神经生物学到人工智能的难点在于:针对同一种现象,不同的人会有不同的理解和不同的解释,不同的实现方式。大部分人只是停留在形态结构的表面层次,比如弄个神经网络。我们的方法则是关注大脑处理信息的本质,而不是解剖结构。就好像莱特兄弟在发明飞机时,不是模仿鸟的结构,而是通过研究空气动力学来了解飞行的本质。
只有从信息处理的功能来理解才是接近大脑工作本质的方法,才是简单有效的,才能将零散的科学发现整合起来,设计一个协调统一的人工智能。这是一个需要长期积累、沉淀的过程。例如,大脑里的定位细胞,主流的思路是用这种技术来开发定位功能SLAM,如室内导航的扫地机器人,但是这只是粗浅的理解,在我们的系统里,对这种特征有更巧妙的应用,它会承担更重要的角色。
基于对大脑工作机制的理解,我们认为实现脑科学人工智能的合理路径是先实现基础感官模块的设计如视觉或语音识别,然后再开发更高级功能如语言、逻辑思维等。
为什么需要这样分阶段来实现?简单的来说,很低等的动物就具备完善的视觉/听觉感官功能了,而语言思维只在极少数高等动物才具备。这个至少说明了语言思维功能的复杂程度更高。现在有人用深度学习用来做语言,做逻辑推理的应用,直接略过了基础感官模块。虽然给人的感觉好像是具有语言功能,但是做出来的东西最多就像鹦鹉学舌,不能真正理解语言的含义。如果用来做客服的话,是会有很高投诉率的。
从脑科学的角度来看,语言、决策、逻辑、推理功能是建立在理解基础感官的信息基础上的,越过基础环节只能做出一个没有根基的噱头,是空中楼阁,只能在人为设定的狭窄环境下运行,没有延展性,没有在真实场景下的应用价值。
3.2案例介绍-视觉识别系统做人工智能不能脱离应用场景,否则就是耍流氓。我们的目标是打造基于脑科学的人工智能,一种采用和大脑运作原理一样的人工智能。短期目标是开发出智能的视觉识别系统,和现有主流的深度学习算法相比,具有不依赖数据,结果可解释的优点。在医学影像和自动驾驶方面有优势。从长远趋势来看,这项技术具有非常深远的意义,因为它搭建了从脑科学到人工智能的桥梁。
基于脑科学的视觉识别系统的方案以及演示可参考下面链接:https://www.http://bilibili.com/video/BV1cJ41117hq/https://www.http://bilibili.com/video/BV1yE41177d4/
这里演示的是一种基于脑科学原理设计的视觉识别系统。就目前来说,主要集中在1D特征的处理,能够进行简单的字符识别和符号识别。但是这个系统具有延展性,通过对这个系统进行基础特征的升级,就可以扩展到处理2D特征以及3D特征,从而实现更完善的功能,在医学影像分析和自动驾驶方面有巨大的潜力。
这个视觉系统是借鉴了大脑在信息处理时遵循的原则来设计的,它的算法在某些方面和传统的CV算法有相似的地方,也就是说得到了传统CV算法的印证。比如算法里包含了类似HOG、template、shapeprior、bagoffeatures的设计。但是它们又有本质的区别,传统CV算法有符合脑科学原理的地方,也有不符合的地方,并且这些算法之间是比较孤立的。这样不可避免的存在缺陷,很难应用于实际场景。而我们的算法在整体设计上借鉴了大脑在处理视觉信息时的设计,实现了各个功能算法之间的有机组合,弥补了传统算法本身存在的缺陷。
举例说明,传统CV算法中,“template”在做分割时效果很好,但是没有延展性。这是因为它们的template通常是手工打造的,这样限制了算法的通用性和延展性,开发出来的应用只能应用到预先设定的应用场景。如果每个应用场景都需要进行手工打造的话,需要的投入的很大的,不太现实。在我们的系统里,”template”是自动产生的,我们需要手工设定的只是产生template的规则,这些规则是基于脑科学发现,有生理意义的,并且数量很少的,从而适用于几乎所有的应用场景,增加了系统的泛化性。
另外,视觉系统的信号通路分成“what”和“where”通路,视觉信息的流向包括“Top-down”和“Bottom–up”。这些规则在我们的系统都有实现。通过对系统的优化设计,我们发现这些大脑采用的视觉算法不仅有效,而且是必需的。当然其他人应该也尝试过Topdown和bottomup的设计,但是没有取得良好的效果。主要原因是他们没有从系统整体的角度将其它信息处理模块有机的整合起来。除了Topdown和bottomup外,还有其它的信息处理原则,缺了任一部分都可能达不到效果。这也是脑科学转化成人工智能的挑战,学术界的人通常只是关注在事物局部,很难获得全局的理解。
通过对视觉识别系统的设计,更加坚定了我们打造脑科学人工智能的信心,因为这个过程就是将各种相关的信息处理原则整合在一起的过程。采用类似方法,我们以后也可以开发其它功能模块。等各功能模块都开发完成后,将它们组合起来就可以形成通用人工智能了。脑科学提供了搭建这个系统的蓝图,我们只需要根据脑科学的原理一步一步的完成这个系统。
3.3脑科学视觉识别系统的优势我们的视觉系统原则上是依据脑科学的原理来设计的。具有如下显著优势。
1、对数据没有依赖性:系统从图片提取基础特征以及产生物体内部表征的方法都是根据生物学意义设计的,需要的样本量极少。
2、可解释性:这个系统的每个决策环节都是可追溯的。
3、普适性和可扩展性:现在这个系统主要关注的是形状信息,可以应用于简单的物体识别。但是我们知道识别一个物体需要结合形状和外观方面的信息。如果需要这个系统在复杂情况下完成任务,只需要将更多的基础特征以及相应的处理流程包括进来就可以了。而总体的框架不变。
系统的这些优势在需要做关键决策或者数据量小的应用场景尤为重要。它是非常适合数据量小,同时对决策结果要求严格的场景的:比如自动驾驶,医学影像,工厂验损。
脑科学人工智能基于大脑的工作原理,有扎实的理论基础。它的另外一个很重要的优势就是可以用更少的投入,更短的时间开发出具有商业应用价值的产品。
四、结语脑科学人工智能的壁垒在于对大脑运作机制本质上的理解以及将这种理解转换成可执行的系统设计。这个系统不是依赖某个单一的技术,而是设计出来的,从整体的框架到某个具体模块的信息处理都借鉴了大脑的运作机制。
当大家一窝蜂的扎堆追求短期利益的时候,他们离成功就会越来越远。大自然给人类布置了各种谜题,解决了它们就会让我们获得新的力量,会越来越接近自然或宇宙的真理,从而实现人类的演化。
神经科学会成为 人工智能“超进化”的关键吗
人工智能会取代人类吗?这个问题一度引发全民热议。虽然目前人工智能正在快速提“智”,但是这不代表它真的很聪明。相反,很多时候它还很傻很天真,仍然需要向人脑学习。
近日,以色列魏茨曼科学研究学院计算机科学系教授希蒙·厄尔曼发文表示,相信神经科学能为人工智能发展提供进一步的助力。那么,人工智能和神经科学究竟有什么关系?神经科学到底如何进一步助力人工智能发展?深度融合神经科学的人工智能将发生哪些变化?
神经科学和人工智能本属同源
谈到人工智能和神经科学之间的关系,中国科学院上海生命科学研究院副研究员王小理用两句话来概括:同源分流、学科独立;交叉融合、分久必合。
最初,人工智能与神经科学是两门各自独立的学科,有着不太一样的研究对象、研究方法体系。从学科起源的时间原点来看,人工智能学科以1956年美国达特茅斯学院夏季讨论班为缘起;而神经科学诞生的标志可以回溯到1891年的神经元学说。这样看神经科学算是人工智能学科的“前辈”。
神经科学更多地侧重于生物学意义上的神经活动的规律,解析包括思维、情感、智能等在内的高级神经活动的发生机制,而意识起源问题,则是神经科学的终极目标,研究方法上神经科学是以自然现象归纳为主的“实验科学”。而人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究对象不是智能而是智能操控,现阶段研究方法上是侧重于对复杂现象进行模拟仿真的“计算科学”。
“但可以将神经科学和人工智能的关系简单理解为源和流。”王小理告诉科技日报记者,人工智能的兴起和发展离不开神经科学成果的滋养。
正如希蒙·厄尔曼文章所述,早期人工智能领域的科学家将生物神经系统作为参照对象,创造出了近年来盛行的“深度网络”脑启发架构,这是一个非常鲜明的“源流”案例,也一直为神经科学家和人工智能领域科学家所津津乐道。但有些人工智能领域的专家,认为深度网络前期是仿脑,后期发展了独立的方法,因此认为,人工智能有自己的方法体系,基本可以抛开脑科学。这样的观点其实是值得深入讨论的。
中国科学院神经科学研究所蒲慕明院士曾向记者表示,近年来,脑与神经科学、认知科学的进展使得人们在脑区、神经微环路、神经元等不同尺度观测的各种认知任务中,获取脑组织的部分活动数据已成为可能,获知人脑信息处理过程不再仅凭猜测,通过多学科交叉和实验研究获得的人脑工作机制更具可靠性。因此,脑科学有望为机器学习、类脑计算的突破提供借鉴。
但是,人工智能对神经科学发展的反哺或反馈作用也是客观存在的。在神经科学基础研究阶段,人工智能可以辅助研究人员解析复杂的脑神经信号、脑神经图谱实验数据,构建和模拟大脑模型系统等。在转化应用阶段,人工智能还能加速脑科学成果的应用,例如大脑疾病诊断与新疗法成果的临床转化等。
打开人工智能“黑箱”的几条通路
事实上,没有神经科学大的理论突破,没有对智能生物本原的认识,人工智能中的“智能”概念很可能就一直是个“黑箱”,而智能模拟与扩展就可能一直在“外围”打转。比如,美国国家工程院《21世纪人类面临的14大科技挑战》报告就认为,人工智能目前存在的部分问题是源于设计中并没有充分考虑真实的大脑情况。而通过对人脑的逆向工程来揭示大脑的秘密,可以更好地设计出能同时处理多重信息流的计算设备。
目前神经科学在助力人工智能发展上有几条通路。王小理介绍,具体路径上,可以延续认知经验主义思路的人工智能发展方向。例如,对于人工智能而言,目前总是用一个特定的任务去训练它,而忽略了它接触其他事物的过程。如果给智能体一个类似成长环境和成长过程,是不是会让它更智能呢?人类的智慧是建立在沟通之上的,目前的人工智能体还没有自主沟通能力,这也是目前的人工智能水平与强人工智能的差距所在,也是未来的发展方向。
但也可能,希蒙·厄尔曼提出的借鉴人类先天认知系统更具有意义。深入理解大脑的原始能力,从而实现高级的机器逻辑能力。人类具备学习如何学习的能力,如果让智能体学习如何学习,那么这种二阶学习的关系也许会让它学得更快,如果未来智能体有了想象力和计划能力,那么它也许真的可以创造出一些我们人类很难创造出的东西。
此外,神经科学助力人工智能,在人工智能重大技术领域也有几个方向。例如,构建统计关联与特征关联相结合的新型学习理论,实现“知识驱动”与“语义驱动”关联统一;构建融合深度学习与强化学习、演化计算、主动学习、毕生学习等仿生和自然计算理论的新型理论框架;实现大规模并行神经网络、进化算法和其他复杂理论计算;具有自主学习能力的通用性人工智能系统等。
未来两者深度融合大有可为
那么,深度融合神经科学的人工智能将会发生什么变化呢?
对此,王小理认为,目前神经科学与人工智能的融合,只占生物大脑计算原理的冰山一角。准确预见未来人工智能将如何发展很难,但如果洞察神经科学、人工智能的学科发展规律和人类经济社会发展大趋势,粗略勾勒未来发展阶段还是可能的,这对于找准创新突破口,明确创新主攻方向非常关键。这也是包括我国在内开展相关脑科学预测和技术预见的初衷之一。
从当前到2025年,神经科学继续保持高速发展态势,但颠覆性的理论成果还不多,在这一时期,人工智能和大数据技术是神经科学发展的“加速器”。而到2030—2035年,神经科学将迎来第一轮重大突破,在神经感知和神经认知理解方面出现颠覆性成果,从而反哺、革新人工智能的原有算法基础和元器件基础,人类社会进入实质性类脑智能研究阶段。
到2050年,神经科学将迎来第二轮重大突破,在情感、意识理解方面出现颠覆性成果,开发出一个多尺度、整合、可验证的大脑模型理论,类脑智能进入升级版,并将推动人脑的超生物进化,神经科学和类脑智能学科融为一体,人类社会全面进入强人工智能时代。当然,围绕神经科学和人工智能特别是强人工智能,还有许多科学理论和社会与伦理方面的问题。
“我们相信,未来神经科学领域大有可为、未来神经科学与人工智能融合大有可为。”王小理说,从人类科技文明长河来看,神经科学和人工智能是同一枚硬币的两个面,虽然相互独立,但都有共同的指向:为人类的生存和意识演化提供新可能。