人工智能的诞生与寒冬
“人工智能”一词正式诞生于1956年的达特茅斯会议。
会议的组织者约翰.麦卡锡,是个雄心勃勃才三十岁的青年才俊,一直致力于有限自动机的研究,会议前一年,还和著名的信息论之父香农合著了《自动化研究》一书,鉴于让计算机具备的推理能力和智能行为的研究成果,他欢欣鼓舞,决定召开一次大规模的会议,希望借此将各地计算机智能的研究者们汇聚在一起,让思想的火花碰撞,激化出新的灵感,“人工智能”是这次会议的正式命名,是麦卡锡灵光闪现的结果。
麦卡锡被称为人工智能之父,但在一些学者看来,这顶桂冠更应该归属图灵,因为图灵早在1947年就写了《智能机器》的文章,设想人类的大脑是一台精密的机器,是可以用一种人造大脑来模拟的,不过图灵没有正式提过“人工智能”一词,也不知晓这个词的出现,因为两年前,他咬着毒苹果自杀了。
这次会议大师云集,盛况空前,得到了信息论之父克劳德.香农、神经网络之父马文.明斯基,IBM公司计算机设计专家奈特.罗彻斯特的大力襄助,也获得洛克菲勒基金7500美元的资助。
艾伦.纽厄尔和赫伯特.西蒙展示的逻辑理论机器(LTM)成为这次会议最大的亮点,LTM能够证明部分数学命题,正好搔到与会者们的痒处,满足了他们关于“智能”的期盼。
大会确立了今后的研究目标,即“沿着之前的信念继续钻研下去,就是人类智能的各种特点和学习的各个方面都能够在机器中得以体现,人们有能力将这种推测转化为现实。”
这一目标在人工智能领域具有开创性意义,如领航灯,引领了后来二十多年的研究方向,但随着八十年代“人工智能寒冬”的出现,用事实证明这个目标过于宏大,不切实际,究其原因有三:
1. 人工智能研究的基础工具是计算机,计算机技术的特性决定了智能模拟的局限性
2. 人工智能研究依据的理论模型不是真正意义上人类大脑的思维模式
3. 人工智能研究目标的固步自封。
计算机最初来自图灵机,图灵机是图灵在1936年发表的论文《关于可计算性》中提出的机器模型,图灵在论文中证明凡是具备可计算性的数学问题都可以通过有限步骤的机械运算来解决。
机械运算,有限的步骤,这说明计算机程序无论多么复杂和智能,都是有限步骤的机械运算,如果把人工智能比作孙悟空,这有限步骤机械运算的计算机堪当孙猴子手中的如意金箍棒吗?
不能!这是第一个跳出来怀疑人工智能的哲学家休伯特.德莱弗斯的回答。
按照德莱弗斯的理解,大多数人工智能的研究工作是建立在这样一个理论基础上的,即思维中包含一种模型,模型中含有“物理符号”,而信息加工技术可以对这些“物理符号”进行操作和加工。
仔细琢磨,这不正是图灵理论的窠臼吗?
问题是这是人类的思维模式吗?早在计算机发明之前,哲学家们就试图解释大脑思维的奥妙了,德莱弗斯给我们列出了两个哲学流派的观点:
一个是理性主义哲学流派,以康德和笛卡尔为代表,他们采用了形式主义的研究方法,并试图用专门化的规则来解释这些认知过程,坚定的认为大脑就是复杂的机器,当然要比一般意义上的机器灵活精密,如果这一观念成立,倒让图灵麦卡锡们松一口气。
二个是现象学派,二十世纪才兴起,以维特根斯坦、海德格尔、和梅洛-庞蒂为代表,用整体论的研究方法来看待这个复杂的问题,他们认为,人类的身体状态、情绪以及各种体验是交织在一起的,并在此基础上产生了不同个体对于这个世界的不同知觉情况,果如此,机械论者提到的规则说就不成立了,因为没有什么规则是能够和特定个体的具体生活经历相提并论的。
德莱弗斯显然是后者的拥趸,他认为那种灵活多样,充满自主性并能够稳定地勾勒出人类思维的仿真智能是永远无法通过过程系统来实现的,因为无论从生理层面,还是心理层面,人类大脑并不像人工智能研究者们在计算机中模拟的那个样子。
他给人工智能研究者们一个通俗的比喻,那就是他们最终的结局会和炼金师一样,是不可能找到梦想中的石头的。
有心栽花花不开无心插柳柳成荫,外国的炼金师没找到梦想的石头,中国的方士也没有练出长生不老药,可是,他们都在化学领域开花结果了。
同样地,人工智能者们并没有研制出他们心目中类似人脑的电脑,却发明了多种计算机语言,促进了工具化电脑(个人计算机)的普及和应用。
但是,他们并没有被现实唤醒,不仅痴心不改,还批评那些改弦更张的追随者,嘲弄具有实用价值的研究成果(如专家系统)是伪人工智能,直到雄心勃勃的日本第五代智能计算机项目,十年的研发归于失败,结结实实撞了个头破血流。
人工智能研究者们在概念上的固步自封,扼杀了人工智能的发展,预示着人工智能寒冬的来临,标志是各国政府大量削减对人工智能项目的经费支持,而另一方面,个人PC机,计算机网络却欣欣向荣了。
作者观点:如同复杂的计算机软件最终都有01代码构成,万物皆由基本粒子构成一样,人脑亦然,意识由物质决定,物质由基本粒子构成,大脑是基本粒子构建的机器,虽复杂精密,总有规律可循,意识是大脑机器的功能反应,同样有规律可循,这样说来,或许那些一意孤行的人工智能研究者们没错,理性主义的哲学家也没错,唯有德莱弗斯错了,既如此,人工智能为何来了寒冬呢?皆因人类对自己大脑及其运作机制认识不足罢了。
人工神经网络—第一次寒冬
人工神经网络的第一次寒冬1.回顾2.感知器算法的局限性及证明2.1计算机中图像的存储形式2.2连通图非线性可分的证明2.3人工神经网络的第一次寒冬3.结尾参考资料1.回顾在1957年,Rosenblatt提出了感知器算法,尽管前面一讲中,我们讲到了感知器算法有那么多的历史意义,但是在当时并没有引起轰动。虽然大家觉得将神经元数学模型引入到机器学习领域的尝试是非常新颖的,但是这个算法没有实际的应用。
2.感知器算法的局限性及证明以我们今天的观点来看,问题出在感知器算法只能解决线性可分数据集的分类,对于线性不可分的数据集感知器算法无能为力,但现实生活中大多数分类问题却都是线性不可分的。第一次明确说出上述这些话的人是MarvinMinsky,他是人工智能的先驱之一。在1969年,MarvinMinsky写了一本书《感知器》(Perceptrons),在书中,他明确的定义了线性可分与非线性可分的概念,并指出感知器只能处理线性可分问题,同时,他用大量实际的例子论证了生活中很多分类问题是线性不可分的。
图1MarvinMinsky(1927-2016)下面我们看其中的一个例子,Minsky指出,识别一幅二值图像是不是连通图,这个问题是线性不可分的问题。
什么是连通图呢?它的意思是图中任意两个黑色的点都能找到一组黑色的点将他们连起来。例如下面的图2,图一、图二是连通图,图三、图四是非连通图。Minsky用数学严格地证明了识别一幅二值图像是不是连通图,是一个线性不可分的问题。
图2二值图像连通图或非连通图2.1计算机中图像的存储形式在讲述这个证明之前,我们需要先了解一下图像在计算机中的存储。在计算机中,图像是以矩阵的形式存储的。下图3(a)是一幅512×512512×512512×512的灰度图像,即这幅图像长有512512512个像素,宽也有512512512个像素,这些像素的点规则均匀的排布在图3(b)512×5123(b)512×5123(b)512×512的矩阵中,而矩阵中的每一个数是像素值,这幅图是8bit8bit8bit的灰度图。在这幅图中,像素值是0−2550-2550−255的整数,其中000代表纯黑色,255255255代表纯白色,而中间值代表各种不同的灰度。如果是彩色图,那么将会得到三个矩阵,每个矩阵分别代表红色(R)(R)(R)、绿色(G)(G)(G)、蓝色(B)(B)(B)三个颜色分量,而这三种分量的值也是在0−2550-2550−255之间。
图3(a)Lenna灰度图像图3(b)Lenna灰度图像在计算机中的矩阵存储形式图3(c)Lenna彩色图像图3(d)Lenna彩色图像在计算机中的矩阵存储形式我们这里提到二值图是指每个像素要么是白色,要么是黑色。我们用000代表白色,111代表黑色,那么二值图也可以表示为一个值为000或111的矩阵。我们可以把这些像素值从左至右、从上至下逐一的抄下来,这样就可以形成一个列向量XXX。
图3(c)Lenna二值图像2.2连通图非线性可分的证明假设原图长为MMM宽为NNN,那么这个列向量X的维度将会是M∗NM*NM∗N,而标签YYY仍然取两个值,Y=+1Y=+1Y=+1表示X是连通图,Y=−1Y=-1Y=−1表示XXX是非连通图。
接下来我们要证明识别连通图的问题是非线性可分的,我们用反证法。假设:这个问题是线性可分的,那么一定存在(w,b)(w,b)(w,b),使得当 当Y=+1Y=+1Y=+1时,WTX+b>0W^TX+b>0WTX+b>0 当Y=−1Y=-1Y=−1时,WTX+b0其中,①①①代表的是①①①那条边上的像素值分别乘以WWW的相应分量然后再求和的结果。其他编号定义类似。
同样的道理,由于图二是连通的,可以推出①+②+③+④+⑦+b>0①+②+③+④+⑦+b>0①+②+③+④+⑦+b>0
由于图三是非连通的,则有①+②+③+④+⑤+b0①+②+③+④+⑦+b>0得到:2∗[①+②+③+b]+④+⑤+⑥+⑦>02*[①+②+③+b]+④+⑤+⑥+⑦>02∗[①+②+③+b]+④+⑤+⑥+⑦>0现在我们将公式3加上公式4:公式3:①+②+③+④+⑤+b