神经网络与人工智能的关系
人工智能(ArtificialIntelligence),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
机器学习是人工智能的核心,是使计算机拥有智能的根本途径。机器通过学习模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。这其中涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
人工神经网络(ArtificialNeuralNetworks)是早期机器学习中的一个重要的算法,神经网络的原理是受我们大脑的生理结构——互相交叉相连的神经元启发。但与大脑中一个神经元可以连接一定距离内的任意神经元不同,人工神经网络具有离散的层、连接和数据传播的方向。
深度学习(DeepLearning)是机器学习领域中一个新的研究方向,是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特点是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉(CV)和自然语言处理(NLP)领域。相比于机器学习更强大,学习速度更快。同时,深度学习比机器学习需要的数据和运算量更大,所以效果相对更好,更加准确可靠。
受脑认知和神经科学启发的人工智能
人工智能渗透到了人类社会各个领域,但目前来看,无论是深度学习还是其它方法,解决的都是单一问题。人类大脑是一个多问题求解的结构,怎么从脑认知和神经科学中得到构造健壮的人工智能的启示,国内外都做了非常多有成效的研究。
一、实现健壮的人工智能的方法
人类面临的许多问题具有不确定性、脆弱性和开放性。今天人工智能的理论框架,建立在演绎逻辑和语义描述的基础方法之上,但我们不可能对人类社会的所有问题建模,因为这中间存在着条件问题,我们不可能把一个行为的所有条件都模拟出,这是传统人工智能的局限性。
这个局限性主要表现在几个方面:
1、需要对问题本身抽象出一个精确数学意义上的解析式的数学模型(抽象不出,即归纳为不可解问题);
2、需要为已建立的数据模型设计出确定的算法(容易产生诸如NPC等问题);
3、处理的结果无法表现现实世界所固有的不确定性;
4、图灵意义下的可计算问题都是可递归的(“可递归的”都是有序的);
5、用“度量”来区分模式,只能处理可向量化的数据。
我们要构造一种更加健壮的人工智能,需要脑认知和神经科学的启发。计算机和人类大脑是对问题求解的物质基础。在智力和计算能力方面,计算机远远超过了人类,但是人类面对的大部分问题都是开放的、动态的、复杂的,大脑在处理这种问题时表现出的想象和创造,还有对复杂问题的分析和描述,是传统人工智能的方法所不能企及的,我们只能够从人类大脑的神经网络结构中去获得构造新的人工智能的因素。
人类大脑非常奇妙,也正是在这个物质基础之上,才演绎出人类世界的发展和对问题求解的各种方法。在神经元的结构模型中,神经元的连接并不是像我们一般理解的物理方式,而是靠突触,神经元之间突触间隙产生的反应,构成了大脑中奇妙的演进。人类大脑中的思维或学习都是发生在突触这个层面上的。实际上在大脑的神经网络连接中,不同空间对应不同功能,不同功能在自身内部产生着不同的成本函数。
人出生之后,大脑会不断发展,发展到一定程度,神经元增长到一定数量,又会递减,把不需要的神经元删掉。大脑是慢性记忆神经元,它需要具有高度的容错性。
实际上,人出生时大脑是一样的,如三字经所提到的“性相近,习相远”,6岁以前,大脑在发育,到6岁左右,从生物学角度上讲,这种发育就完成了,大家的记忆力、智商等都是教育上的反应。教育的基础就是大脑。所以,大脑不是通过一个统一的没有分化的神经网络来实现单一的全景优化学习的,不同的功能和区域会生成不同的成本函数。它是模块化的,同时具有独特的系统来支撑注意、记忆、语言等功能。因此,我们可以从脑认知和神经科学中去获得发展新的人工智能的灵感。
二、脑认知与人工智能的结合
人类大脑有800亿个神经元的容量,它主要有三种研究方式:结构研究、功能研究和有效研究。
大脑的结构连接是静态的,功能连接和有效研究则具有时空动态演化的特性。在视觉和听觉神经网络的区域空间中,功能连接和有效连接是不一样的。
有效连接是针对具体任务的,在同一个视觉功能连接空间中,当我们执行不同视觉任务时,它所形成的神经网络的有效连接是不一样的。有效连接描述了神经元之间的因果与相互影响关系。
从这种结构化的观点来看,我们构造的神经网络还没办法模拟同时具有结构连接、功能连接、有效连接的方式。我们可以通过获取某一区域的活跃程度,或活跃状态,辨别大脑正在执行什么样的视觉任务。知道它在执行什么样的视觉任务,我们就得到了它有效连接的状态,也可以求出它的有效连接在时空演化中的特性。如果能够求出其中的规律,我们就可以设计相应的人工智能方式去实现。也就是说,我们可以采用可触的、动态的、非线性的关系网络进行认知任务的输入。
再对它的科学问题做一个总结,我们要回答出三点:1、大脑是如何实现优化的;2、脑网络的监督训练信号从哪里来;3、在不同的神经功能研究区域中,存在什么样的有效连接的约束和优化。
前面讲了概念,在概念基础上我们要抽象出科学问题,这样才能指导我们进一步的研究,找到解决问题的方法。那么这个方法如何和现在的方法结合?
去年,谷歌和MIT联合发表了一篇文章,文章的中心思想是怎么利用神经科学构造健壮的人工智能系统。我们现在深度学习的基本框架,是通过多层神经网络输入,根据误差来调整连接,这建立在大量数据标注的基础上,通过标记数据得到网络优化的成本函数。
我要强调一点,我们通常讲深度学习是从机器学习发展来的,要构造一个学习机器,关键是在不同区域、不同任务下,怎么去构造一个成本函数。
三、大脑的认知活动
大脑的认知活动分为三个不同层次:一是哲学,二是形象思维和逻辑思维,三是敏感性。
直觉和敏感都属于创造性思维,警察在破案中,靠的是多年积累和实践,形成的直觉判断。灵感、顿悟与直觉的区别是,直觉是对当前环境的反应,它在现在人工智能的发展中扮演着十分重要的角色。我们需要一种基于直觉的人工智能,也可以将它看成一种基于直觉的推理。
人的直觉反应实际上是寻找全局最优解。要构造直觉推理,需要两个关键因素:一是需要构造一个成本函数;二是需要给出一个决策结构,而这个决策结构就建立在记忆基础上。
人在观察事物时,一定会形成一种与时间相关的影像。如果把直觉推理和数学归纳演绎推理两类机制组合,就可以实现基于认知计算或受神经科学启发的人工智能。
我们把认知推理称为直观、朴素的物理推理。物理层面的认知推理可以化解时间与空间,追踪事物的发展轨迹。认知推理的另一个要素在心理层面,简而言之就是学习方向受心理状态的引导。我们需要把物理层面和心理层面的推理嵌入到推理的人工智能系统中。
在直觉和认知推理中,我们还需要构造一种模型,其中因果模型是基础。认知计算框架下的因果模型既要满足物理因果关系所产生的物理约束,同时又要让机器理解当前认知任务下的因果关系。
直觉推理、认知推理和因果模型是构建健壮的人工智能必须考虑的基本因素。那么如何来构造一个具体的系统?构造机器人需要三个基本要素:1、对环境中的所有对象进行特征识别,并且进行长期记忆;2、理出对象间的关系,并对它们相互间的作用进行描述;3、基于想象力的行为模型,人在进行具体行动之前,会想象其带来的后果,但机器就需要分析物体之间的各种关系。
这三种要素是让机器像人一样理解物理世界的基础。具有想象力的人工智能,就需要:1、行动之前预想到结果;2、构造一个位置模型;3、给出环境模型,提取有用信息;4、规划想象行为,最大化任务效果。
四、认知如何解决实际问题
我们在2000年初就开始做无人驾驶,有人说要把无人驾驶汽车和城市真实场景的车融合,我们还面临非常艰难的挑战,有相当长的路要走。在这种局部、动态的场景中,我们怎样让自动驾驶跟环境融合,确实是一个很大的问题。
无人驾驶的挑战存在于:
1、必须准确感知周围环境,在所有条件下安全行驶;
2、自动驾驶必须能够抽象,要完成一种交互情境中的记忆计算;
3、自动驾驶必须能够理解预行为。
现在绝大多数自动驾驶采取了场景感知与定位,决策规划与控制,这是一种简单的ADAS形式,但我们要如何通过新的方法来解决这个问题?
场景是某个交互场合在特定时间和空间中的具体情境和影象,它可以定义为一种实体。情境是指这种实体随着时间和空间变化而产生的关联。情境计算是对场景各个关联的对象做解释,可以定义为一个行为相关体。
这里的问题就是,第一,要让自动驾驶汽车像人一样理解和记忆,就要具有记忆推理和经验分析的技术;第二,进化发展的自动驾驶,其学习过程要像人类一样熟能生巧。
人类视觉关注的基本机制是选择、组织、整合、编码。人对变化是非常敏感的,可以提取交通场景中的显著性变化。比如你在开车时,如果右前方突然来了一个骑自行车的人,你的注意力会转移到骑车人的身上。在自动驾驶汽车上,我们要构造一个选择性的注意机制网络,对数种图像进行理解,并根据内部状态的表示,忽略不相关的对象,选择下一步要采取的动作。
把场景感知和情景认知结合起来,需要我们构建一个模型,融合先进知识概念,实现记忆学习。
场景感知是将通过各种不同属性的传感器获得的不同数据,提供到深度学习中,之后再根据长短期记忆和定位网络,进行情境计算。在这种框架中,我们可以把场景感知和情境计算融合在一起。
一个高效的情景计算要运用实际情境的因果关联,在最前端的数据层面进行有效计算,这就需要把数据驱动变成事件驱动。人在开车时,根据情境判断前方可不可以行驶,这就是把数据驱动变成事件驱动。
怎么构造事件驱动?就是把可见光和激光点云数据融合在一起,把三维数据转化成二维图像数据。点云数据给出了每一个生物体的明确的点,二维图像没有深度信息,它是图像的几何形状变化。把人的数据和激光点云的数据融合,用数据驱动转变为事件驱动,就得出了可行驶数据和不可行驶数据大的划分。
人开车的时候,他在注意什么,我们就来构建一个类似的选择性基础,把同样的场景输入到一个深度学习网络中,通过深度学习网络提取特征和人的注意力。
(来源:《网信军民融合》2017年11月刊)
神经科学与人工智能:融合与未来
本周,上海纽约大学一连参与举办了三场包括讲座与论坛在内的重磅学术活动。神经科学和人工智能领域的顶尖学者专家,纵论如何抓住未来科技发展的机遇,为数百位听众带来一场展望前沿科技的盛宴。3月22日,在华东师范大学举行的“突触、神经回路与行为”讲座中,纽约大学神经科学钱永佑教授展示了自己的长期研究成果。这也是华东师范大学-纽约大学脑与认知科学联合研究中心(上海纽约大学)举办的神经科学系列讲座之一。
钱永佑教授说,目前神经科学领域的研究兴趣,主要集中在探索大脑如何进行计算和决策。“大脑拥有高度发展的构造,具备强大、高效的计算能力,这对进一步发展人工智能提供了极有价值的参考。”
不过,钱永佑教授认为,在某种程度上,由于受其物理特性的限制,神经元比不上微处理器。所以,人工智能在很多方面超过了大脑。
3月23日,在“神经科学与人工智能:融合与未来”论坛上,钱永佑教授进一步阐述了神经科学与人工智能两大领域未来的交融前景。纽约大学的J.AnthonyMovshon教授,哥伦比亚大学的LarryAbbott教授,纽约大学终身教授、Facebook人工智能实验室首席官YannLeCun,以及上海纽约大学科研副校长、纽约大学教授汪小京都出席论坛,并发表演讲。
论坛由上海纽约大学和华东师范大学联合举办,探讨了计算神经科学与机器学习等交叉领域的多个议题,吸引了来自各地的科技精英与上纽大众多师生。汪小京教授说,“此次论坛为神经科学与人工智能领域的顶尖学者,提供了一个交流探索的绝好机会。该领域的研究与教学,是上海纽约大学的强项与重点。”
3月24日,LeCun教授的公开讲座“预测学习与人工智能的未来”,为本周系列活动完美收官。活动由上海纽约大学数据科学研究中心举办。
LeCun教授认为,机器学习“预测模型”的能力,将是人工智能未来取得重大发展的关键因素。“人工智能领域未来几年的挑战,就是让机器识别,例如视频和文本等在内的原始的、未经标记的数据。这意味着机器具有了‘预测学习’的能力。主要的技术挑战在于,这个世界只能被部分认识与预测。”
上海纽约大学工程与计算机科学部主任、数据科学研究中心联合主任KeithRoss主持了演讲。他表示,在过去四年来,得益于机器学习的新进展,人工智能在物体识别、面部识别、语音识别,以及自然语言翻译几个方面取得了显著进步。“接下来的四年里,将在自动驾驶汽车、医疗保健及个人数字助理等领域取得突破。”
LeCun教授讲话后,张峥教授主持了小组讨论,参加小组讨论的多位学者与业界领袖,包括复旦大学、普林斯顿大学教授范剑青,上海科技大学教授马毅,IBM大中华区首席技术官沈晓卫,以及汪小京教授。各位学者专家也回答了观众提问。