人工智能–它是什么,它为什么重要
人工智能历史人工智能一词始创于1956年,而如今,由于数据量的增加、先进算法的出现以及计算能力和存储能力的提高,人工智能变得越来越流行。
20世纪50年代早期的AI研究探索了诸如问题解决和符号方法之类的主题。20世纪60年代,美国国防部对这种工作产生了兴趣,并开始训练计算机来模仿基本的人类推理。例如,美国国防部高级研究计划局(DARPA)在20世纪70年代完成了街道测绘项目。远在Siri、Alexa或Cortana成为家喻户晓的名字之前,DARPA就于2003年创造了智能个人助理。
这项早期工作为我们如今在计算机中看到的自动化和形式推理铺平了道路,其中包括可以对其进行设计以用来补充和增强人类能力的决策支持系统和智能搜索系统。
尽管好莱坞电影和科幻小说将AI描绘成占领世界的类人机器人,但当前的AI技术发展并没有那么可怕,或者说,还没有那么聪明。相反,AI已经发展到可以为各个行业提供许多特定利益。继续阅读有关医疗保健、零售业等行业中人工智能的现代示例。
人工智能的几个概念
人工智能
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
简介
“人工智能”一词最初是在1956年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。例如繁重的科学和工程计算本来是要人脑来承担的,现在计算机不但能完成这种计算,而且能够比人脑做得更快、更准确,因之当代人已不再把这种计算看作是“需要人类智能才能完成的复杂任务”,可见复杂工作的定义是随着时代的发展和技术的进步而变化的,人工智能这门科学的具体目标也自然随着时代的变化而发展。它一方面不断获得新的进展,一方面又转向更有意义、更加困难的目标。目前能够用来研究人工智能的主要物质手段以及能够实现人工智能技术的机器就是计算机,人工智能的发展历史是和计算机科学与技术的发展史联系在一起的。除了计算机科学以外,人工智能还涉及信息论、控制论、自动化、仿生学、生物学、心理学、数理逻辑、语言学、医学和哲学等多门学科。人工智能学科研究的主要内容包括:知识表示、自动推理和搜索方法、机器学习和知识获取、知识处理系统、自然语言理解、计算机视觉、智能机器人、自动程序设计等方面。
实际应用机器视觉:指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,智能搜索,定理证明,博弈,自动程序设计,还有航天应用等。
学科范畴人工智能是一门边沿学科,属于自然科学和社会科学的交叉。
涉及学科哲学和认知科学,数学,神经生理学,心理学,计算机科学,信息论,控制论,不定性论,仿生学,
研究范畴自然语言处理,知识表现,智能搜索,推理,规划,机器学习,知识获取,组合调度问题,感知问题,模式识别,逻辑程序设计,软计算,不精确和不确定的管理,人工生命,神经网络,复杂系统,遗传算法人类思维方式
应用领域智能控制,机器人学,语言和图像理解,遗传编程机器人工厂
安全问题
目前人工智能还在研究中,但有学者认为让计算机拥有智商是很危险的,它可能会反抗人类。这种隐患也在多部电影中发生过。
机器学习
机器学习(MachineLearning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
学习能力是智能行为的一个非常重要的特征,但至今对学习的机理尚不清楚。人们曾对机器学习给出各种定义。H.A.Simon认为,学习是系统所作的适应性变化,使得系统在下一次完成同样或类似的任务时更为有效。R.s.Michalski认为,学习是构造或修改对于所经历事物的表示。从事专家系统研制的人们则认为学习是知识的获取。这些观点各有侧重,第一种观点强调学习的外部行为效果,第二种则强调学习的内部过程,而第三种主要是从知识工程的实用性角度出发的。
机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。例如,它们遇到错误时不能自我校正;不会通过经验改善自身的性能;不会自动获取和发现所需要的知识。它们的推理仅限于演绎而缺少归纳,因此至多只能够证明已存在事实、定理,而不能发现新的定理、定律和规则等。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中尤其典型的是专家系统中的知识获取瓶颈问题,人们一直在努力试图采用机器学习的方法加以克服。
机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。
自从1980年在卡内基-梅隆大学召开第一届机器学术研讨会以来,机器学习的研究工作发展很快,已成为中心课题之一。
模式识别
模式识别(PatternRecognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机
的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。
模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。
模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。
模式识别所分类的类别数目由特定的识别问题决定。有时,开始时无法得知实际的类别数,需要识别系统反复观测被识别对象以后确定。
模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。
人工神经网络
人工神经网络(ArtificialNeuralNetworks,ANN),一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入-输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果,这种学习分析的过程被称为“训练”。(引自《环球科学》2007年第一期《神经语言:老鼠胡须下的秘密》)
概念
由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。
人工神经网络具有四个基本特征:
(1)非线性非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性关系。具有阈值的神经元构成的网络具有更好的性能,可以提高容错性和存储容量。
(2)非局限性一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。
(3)非常定性人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。
(4)非凸性一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性。
人工神经网络中,神经元处理单元可表示不同的对象,例如特征、字母、概念,或者一些有意义的抽象模式。网络中处理单元的类型分为三类:输入单元、输出单元和隐单元。输入单元接受外部世界的信号与数据;输出单元实现系统处理结果的输出;隐单元是处在输入和输出单元之间,不能由系统外部观察的单元。神经元间的连接权值反映了单元间的连接强度,信息的表示和处理体现在网络处理单元的连接关系中。人工神经网络是一种非程序化、适应性、大脑风格的信息处理,其本质是通过网络的变换和动力学行为得到一种并行分布式的信息处理功能,并在不同程度和层次上模仿人脑神经系统的信息处理功能。它是涉及神经科学、思维科学、人工智能、计算机科学等多个领域的交叉学科。
人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点。
知识工程(KBE)knowledgebasedengineering
在计算机上建立专家系统的技术。知识工程这个术语最早由美国人工智能专家E.A.费根鲍姆提出。由于在建立专家系统时所要处理的主要是专家的或书本上的知识,正像在数据处理中数据是处理对象一样,所以它又称知识处理学。其研究内容主要包括知识的获取、知识的表示以及知识的运用和处理等三大方面。
费根鲍姆及其研究小组在20世纪70年代中期研究了人类专家们(而不是万能博士们)解决其专门领域问题时的方式和方法,注意到专家解题的4个特点:①为了解决特定领域的一个具体问题,除了需要一些公共的知识,例如哲学思想、思维方法和一般的数学知识等之外,更需要应用大量与所解问题领域密切相关的知识,即所谓领域知识。②采用启发式的解题方法或称试探性的解题方法。为了解一个问题,特别是一些问题本身就很难用严格的数学方法描述的问题,往往不可能借助一种预先设计好的固定程式或算法来解决它们,而必须采用一种不确定的试探性解题方法。③解题中除了运用演绎方法外,必须求助于归纳的方法和抽象的方法。因为只有运用归纳和抽象才能创立新概念,推出新知识,并使知识逐步深化。④必须处理问题的模糊性、不确定性和不完全性。因为现实世界就是充满模糊性、不确定性和不完全性的,所以决定解决这些问题的方式和方法也必须是模糊的和不确定的,并应能处理不完全的知识。总之,人们在解题的过程中,首先运用已有的知识开始进行启发式的解题,并在解题中不断修正旧知识,获取新知识,从而丰富和深化已有的知识,然后再在一个更高的层次上运用这些知识求解问题,如此循环往复,螺旋式上升,直到把问题解决为止。由上面的分析可见,在这种解题的过程中,人们所运用和操作的对象主要是各种知识(当然也包括各种有关的数据),因此也就是一个知识处理的过程。
专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题,简而言之,专家系统是一种模拟人类专家解决领域问题的计算机程序系统。
专家系统
专家系统(expertsystem)是人工智能应用研究最活跃和最广泛的课题之一。
运用特定领域的专门知识,通过推理来模拟通常由人类专家才能解决的各种复杂的、具体的问题,达到与专家具有同等解决问题能力的计算机智能程序系统。它能对决策的过程作出解释,并有学习功能,即能自动增长解决问题所需的知识。
发展简况专家系统是人工智能中最重要的也是最活跃的一个应用领域,它实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。20世纪60年代初,出现了运用逻辑学和模拟心理活动的一些通用问题求解程序,它们可以证明定理和进行逻辑推理。但是这些通用方法无法解决大的实际问题,很难把实际问题改造成适合于计算机解决的形式,并且对于解题所需的巨大的搜索空间也难于处理。1965年,f.a.费根鲍姆等人在总结通用问题求解系统的成功与失败经验的基础上,结合化学领域的专门知识,研制了世界上第一个专家系统dendral,可以推断化学分子结构。20多年来,知识工程的研究,专家系统的理论和技术不断发展,应用渗透到几乎各个领域,包括化学、数学、物理、生物、医学、农业、气象、地质勘探、军事、工程技术、法律、商业、空间技术、自动控制、计算机设计和制造等众多领域,开发了几千个的专家系统,其中不少在功能上已达到,甚至超过同领域中人类专家的水平,并在实际应用中产生了巨大的经济效益。
专家系统的发展已经历了3个阶段,正向第四代过渡和发展。第一代专家系统(dendral、macsyma等)以高度专业化、求解专门问题的能力强为特点。但在体系结构的完整性、可移植性等方面存在缺陷,求解问题的能力弱。第二代专家系统(mycin、casnet、prospector、hearsay等)属单学科专业型、应用型系统,其体系结构较完整,移植性方面也有所改善,而且在系统的人机接口、解释机制、知识获取技术、不确定推理技术、增强专家系统的知识表示和推理方法的启发性、通用性等方面都有所改进。第三代专家系统属多学科综合型系统,采用多种人工智能语言,综合采用各种知识表示方法和多种推理机制及控制策略,并开始运用各种知识工程语言、骨架系统及专家系统开发工具和环境来研制大型综合专家系统。在总结前三代专家系统的设计方法和实现技术的基础上,已开始采用大型多专家协作系统、多种知识表示、综合知识库、自组织解题机制、多学科协同解题与并行推理、专家系统工具与环境、人工神经网络知识获取及学习机制等最新人工智能技术来实现具有多知识库、多主体的第四代专家系统。
类型对专家系统可以按不同的方法分类。通常,可以按应用领域、知识表示方法、控制策略、任务类型等分类。如按任务类型来划分,常见的有解释型、预测型、诊断型、调试型、维护型、规划型、设计型、监督型、控制型、教育型等。
体系结构专家系统与传统的计算机程序系统有着完全不同的体系结构,通常它由知识库、推理机、综合数据库、知识获取机制、解释机制和人机接口等几个基本的、独立的部分所组成,其中尤以知识库与推理机相互分离而别具特色。专家系统的体系结构随专家系统的类型、功能和规模的不同,而有所差异。
为了使计算机能运用专家的领域知识,必须要采用一定的方式表示知识。目前常用的知识表示方式有产生式规则、语义网络、框架、状态空间、逻辑模式、脚本、过程、面向对象等。基于规则的产生式系统是目前实现知识运用最基本的方法。产生式系统由综合数据库、知识库和推理机3个主要部分组成,综合数据库包含求解问题的世界范围内的事实和断言。知识库包含所有用“如果:〈前提〉,于是:〈结果〉”形式表达的知识规则。推理机(又称规则解释器)的任务是运用控制策略找到可以应用的规则。正向链的策略是寻找出前提可以同数据库中的事实或断言相匹配的那些规则,并运用冲突的消除策略,从这些都可满足的规则中挑选出一个执行,从而改变原来数据库的内容。这样反复地进行寻找,直到数据库的事实与目标一致即找到解答,或者到没有规则可以与之匹配时才停止。逆向链的策略是从选定的目标出发,寻找执行后果可以达到目标的规则;如果这条规则的前提与数据库中的事实相匹配,问题就得到解决;否则把这条规则的前提作为新的子目标,并对新的子目标寻找可以运用的规则,执行逆向序列的前提,直到最后运用的规则的前提可以与数据库中的事实相匹配,或者直到没有规则再可以应用时,系统便以对话形式请求用户回答并输入必需的事实。
早期的专家系统采用通用的程序设计语言(如fortran、pascal、basic等)和人工智能语言(如lisp、prolog、smalltalk等),通过人工智能专家与领域专家的合作,直接编程来实现的。其研制周期长,难度大,但灵活实用,至今尚为人工智能专家所使用。大部分专家系统研制工作已采用专家系统开发环境或专家系统开发工具来实现,领域专家可以选用合适的工具开发自己的专家系统,大大缩短了专家系统的研制周期,从而为专家系统在各领域的广泛应用提供条件。
图灵测试
【简介】
图灵测试(又称“图灵判断”)是图灵提出的一个关于机器人的著名判断原则。一种测试机器是不是具备人类智能的方法。如果说现在有一台电脑,其运算速度非常快、记亿容量和逻揖单元的数目也超过了人脑,而且还为这台电脑编写了许多智能化的程序,并提供了合适种类的大量数据,使这台电脑能够做一些人性化的事情,如简单地听或说。回答某些问题等。那么,我们是否就能说这台机器具有思维能力了呢?或者说,我们怎样才能判断一台机器是否具存了思维能力呢?
为了检验一台机器是否能合情理地被说成在思想,人工智能的始祖艾伦•图灵提出了一种称作图灵试验的方法。此原则说:被测试的有一个人,另一个是声称自己有人类智力的机器。测试时,测试人与被测试人是分开的,测试人只有通过一些装置(如键盘)向被测试人问一些问题,这些问题随便是什么问题都可以。问过一些问题后,如果测试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试,如果测试人没有分出谁是机器谁是人,那这个机器就是有人类智能的。目前还没有一台机器能够通过图灵测试,也就是说,计算机的智力与人类相比还差得远呢。比如自动聊天机器人。同时图灵试验还存在一个问题,如果一个机器具备了“类智能”运算能力,那么通过图灵试验的时间会延长,那么多长时间合适呢,这也是后继科研人员正在研究的问题。
【图灵测试的提出】
1950年,图灵来到曼彻斯特大学任教,同时还担任该大学自动计算机项目的负责人。就在这一年的十月,他又发表了另一篇题为《机器能思考吗?》的论文,成为划时代之作。也正是这篇文章,为图灵赢得了一顶桂冠——“人工智能之父”。在这篇论文里,图灵第一次提出“机器思维”的概念。他逐条反驳了机器不能思维的论调,做出了肯定的回答。他还对智能问题从行为主义的角度给出了定义,由此提出一假想:即一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(TuringTesting)。当时全世界只有几台电脑,其他几乎所有计算机根本无法通过这一测试。但图灵预言,在20世纪末,一定会有电脑通过“图灵测试”。目前为止还没有电脑通过图灵测试。美国科学家兼慈善家休·勒布纳20世纪90年代初设立人工智能年度比赛,把图灵的设想付诸实践.比赛分为金、银、铜三等奖.
【示范性问题】
图灵采用“问”与“答”模式,即观察者通过控制打字机向两个测试对象通话,其中一个是人,另一个是机器。要求观察者不断提出各种问题,从而辨别回答者是人还是机器。图灵还为这项测试亲自拟定了几个示范性问题:
问:请给我写出有关“第四号桥”主题的十四行诗。
答:不要问我这道题,我从来不会写诗。
问:34957加70764等于多少?
答:(停30秒后)105721
问:你会下国际象棋吗?
答:是的。
问:我在我的K1处有棋子K;你仅在K6处有棋子K,在R1处有棋子R。现在轮到你走,你应该下那步棋?
答:(停15秒钟后)棋子R走到R8处,将军!
图灵指出:“如果机器在某些现实的条件下,能够非常好地模仿人回答问题,以至提问者在相当长时间里误认它不是机器,那么机器就可以被认为是能够思维的。”
从表面上看,要使机器回答按一定范围提出的问题似乎没有什么困难,可以通过编制特殊的程序来实现。然而,如果提问者并不遵循常规标准,编制回答的程序是极其困难的事情。例如,提问与回答呈现出下列状况:
问:你会下国际象棋吗?
答:是的。
问:你会下国际象棋吗?
答:是的。
问:请再次回答,你会下国际象棋吗?
答:是的。
你多半会想到,面前的这位是一部笨机器。如果提问与回答呈现出另一种状态:
问:你会下国际象棋吗?
答:是的。
问:你会下国际象棋吗?
答:是的,我不是已经说过了吗?
问:请再次回答,你会下国际象棋吗?
答:你烦不烦,干嘛老提同样的问题。
那么,你面前的这位,大概是人而不是机器。上述两种对话的区别在于,第一种可明显地感到回答者是从知识库里提取简单的答案,第二种则具有分析综合的能力,回答者知道观察者在反复提出同样的问题。“图灵测试”没有规定问题的范围和提问的标准,如果想要制造出能通过试验的机器,以我们现在的技术水平,必须在电脑中储存人类所有可以想到的问题,储存对这些问题的所有合乎常理的回答,并且还需要理智地作出选择。
科多大数据感谢您的阅读
人工智能的几种定义
原标题:人工智能的几种定义人工智能就在我们身边,但并非所有人都能留意到它的存在。许多人只是将它视作寻常科技的一种,这就牵涉到一个如何定义人工智能的问题了。
历史上,人工智能的定义历经多次转变,一些肤浅的、未能揭示内在的规律的定义很早就被研究者抛弃,但是直到今天,被广泛接爱的定义仍有很多种,具体使用哪一种定义,通常取决于我们讨论问题的语境和关注的焦点。
下面我们就在简要列举几种历史上有影响的,或目前还流行的人工智能的定义。
一:AI就是让人觉得不可思议的计算机程序。
人工智能就是机器可以完成人们不认为机器能胜任的事——这个定义非常主观,但是也非常有趣;一个计算机程序是不是人工智能,完全由这个程序的所作所为是不是能让人目瞪口呆来界定,这种唯经验的定义显然缺乏一致性,会因时代不同,背景不同、评判者的经验不同而套用不同的标准。但这一定义往往反映的是一个时代里大多数的普通人对人工智能的认知方式,每当一个新的人工智能热点出现时,新闻媒体和大众总是用自己的经验来判定人工智能技术价值高低,而不管这种技术在本质上究竟有没有“智能”。
二:AI就是与人类思考方式相似的计算机程序。
这是人工智能发展早期非常流行的一种定义方式,另一种类似的是,同样从思考方式本源出发的定义是:AI就是能遵照思维里的逻辑规律进行思考的计算机程序。
从根本上讲,这是一种类似仿生学的直观思路,既然叫人工智能,那用程序来模拟人的智慧就是最直截了当的做法;但是历史经验证明,仿生学的思路在科技发展中不一定可行,一个最好也是最著名的例子就是飞机的发明,在几千年的时间里,人类一直梦想着按照鸟类扑打翅膀的方式飞上天空,但反讽的是,真正带着人类在长空翱翔,并打破鸟类的飞行速度、飞行高度记录的是飞行原理与鸟类差别极大的固定翼飞机。
展开全文三:AI就是与人类行为相似的计算机程序。
和仿生学派强调对人脑的研究与模仿不同,实用主义者从不觉得人工智能的实现必须遵循什么规则或理论框架;黑猫白猫,能逮住耗子就是好猫,在人工智能的语境下,这句话可以被改成:简单程序,复杂程序,聪明管用的就是好程序。
也就是说,无论计算机以何种方式实现某一种功能,只要该功能表现得与人在类似环境下的行为相似,就可以说,这个计算机程序拥有了在该领域内的人工智能,这一定义从近似于人类行为的最终结果出发,忽视达到这一结果的手段。另一种对人工智能的近似定义则更强调人工智能的实用色彩:AI就是可以解决问题并获得最大收益的计算机程序。
四:AI就是会学习的计算机程序。
没有哪个完美主义者会喜欢这个定义,这一定义几乎将人工智能与机器学习同了起来,但这的确是最近这拨人工智能热潮里,人工智能在许多人眼中的真实模样,谁让深度学习一枝独秀,几乎垄断了人工智能领域里所有的流行的技术方向。
”无学习,不AI“,这几乎成了人工智能研究在今天的核心指导思想,许多研究者更愿意将自己称为机器学习专家,而非泛泛的人工智能专家。谷歌的AlphaGo因为学习了大量专业棋手棋谱,然后又从自我对弈中持续学习和提高,才有了战胜人类世界冠军的本钱;微软的小冰因为学习了大量互联网上流行语料,才能用既时尚、又活泼的聊天方式与用户交流。
五:AI就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序。
针对人工智能,不同定义将人们导向不同的研究或认知方向,不同的理解分别适用于不同的人群和语境,如果非要调和所有看上去合理的定义,我们得到的也许就只是一个全面但过于笼统、模糊的概念。
人工智能是有关”智能主体的研究与设计“的学问,而智能主体是指一个可以观察周围环境并做出行动以达成目标的系统。
以上,我们列举了一种常见的人工智能的定义,基本涵盖了目前的所认知人工智能的理解,希望对大家再次认知人工智能有所帮助。返回搜狐,查看更多
责任编辑:什么是人工智能
什么是人工智能
人工智能(ArtificialIntelligence,简称“AI”)自诞生之日起,其定义与内涵就一直存在争议。从字面上看,AI由“人工”和“智能”两词构成,其核心是智能。因此,人工智能首先是智能的一种。但是人工智能是人造的,而非自然形成的智能(如我们人类的智能就是经过长期的进化而形成的一种生物智能)。进一步理解人工智能的关键,在于理解“智能是什么”,这其实是一个难以回答的问题。一个普遍的认识是“智能是利用知识解决问题的能力”。作为“万物之灵长”的人类,其智能很大程度上就体现在人类能够发现知识并利用知识解决各类问题。人工智能的研究与实践的一个重要目标就是回答“智能是什么”这一问题。对这个问题的回答,将成为我们这代人甚至后面几代人共同努力的方向与目标。
如果需要给人工智能下一个定义,可以表述为:人工智能是通过智能机器延伸、增强人类改造自然和治理社会能力的科学与技术。人工智能首先是一门科学,因为我们需要解释智能的本质,需要回答智能能否计算、如何计算等科学问题。人工智能更是一项工程,因为我们需要让机器实现对于人类智能的模拟,从而解决需要人类智能才能解决的问题。因此,人工智能兼有科学与工程的属性。也正是这个原因,决定了人工智能的跨学科和综合特性。人工智能涉及哲学、心理学、数学、语言学、计算机等多个学科。人工智能的最终目标不是发展自主的机器智能,而是借助人工智能增强人类认识世界、改造世界的能力。拓展和延伸人类的智能,并最终造福人类社会,是发展人工智能的根本使命,也是唯一使命。人工智能是以人类智能为模板进行拓印与塑形的,理解与模拟人类智能是人工智能实现的基本路径。人类智能,外观体现为行为,内察体现为思维。人工智能的研究与实践不论其形式如何不同,其最终落脚点要么是让机器具备人类身体的智能行为能力,要么是让机器具备人类心灵的复杂思维能力。
人类的智能行为能力体现在其身体的感知与运动能力。我们的身体具有五官与四肢。我们通过五官识音辨声、识图辨形、辨别气味等,通过四肢操纵物体、运动身体,从而实现身体与环境的复杂交互。机器实现这些能力需要具备模式识别与反馈控制能力。比如,为了识别一个手写字是不是“0”,机器必须能够从手写体输入数据中识别出“0”所对应的书写模式。模式识别能力是我们五官所具备的基本能力。我们人类的四肢能够十分柔韧、灵活地做出各类动作,实现各类物体操纵,这背后体现的是人类四肢与环境的强大交互能力。比如机械手臂在抓举物品时,需要实时感知物品的位置以及抓举的力度,从而及时调整抓举的动作与姿态,最终完成抓举动作。近年来,机器在模式识别与运动控制等能力上飞速发展,已经初步达到人类水平。以感知数据中的模式、物理世界的状态为主,让机器具备人类的智能行为为主要目标的人工智能研究和实践,我们称之为“感知派”。
人类的智能更为鲜明地体现在人类的复杂心智上。人类的心智活动十分多样,包括语言理解、场景理解、调度规划、智能检索、学习归纳、推理决策等。塑造人类心智能力的器官是我们的大脑。理解大脑的运作机制,从而实现类脑智能,一直以来是科学家们持之以恒为之奋斗的目标之一。随着人工智能的发展,让机器具有一颗聪慧的大脑,已被迫切地提上议事日程。有身无心的机器就好比没有灵魂的“僵尸”,虽然也能解决很多问题,但是难以进入人类社会,成为人类有趣的“伙伴”。如果人工智能的发展仅是停留在感知与运动阶段,机器只是达到了一般动物的智能水平,而真正意义上使得人类从动物本性中脱胎而出的是人类独有的心智能力。虽然动物也有大脑,也有一定的心智水平,但是人类心智与动物心智的根本差别在于人类的认知能力。认知能力是指人脑接受外界信息,经过加工处理,转换成内在的心理活动,从而形成对世界的认知体验的过程。它包括时空认知、因果认知、语言认知、文化认知等方面。很显然,目前只有人类具有认知能力,以“认知”为基础的人工智能研究和实践,被称为“认知派”,将是未来人工智能研究与实践的焦点。
值得注意的是,虽然人类是实现人工智能的模板,但是人工智能在当下的实践已经不单单以“类人”为目标,很多时候是远超人类水平的。人类的特定智能很多情况下是有局限的。比如,我们在决定买哪本人工智能教材时,其决策要素一般不超过5—7个,而机器则可以同时考虑数以百万计的决策要素进行判断。人类感知的物理范围是十分有限的,而机器视觉可以识别数千米范围内的目标。因此,在很多单项智能上,人类被机器超越只是时间问题,如计算、下棋、识图、辨声等。人工智能的发展进程必定是我们见证人类单项智能被机器逐步超越的过程。但是有一个至关重要的奖项,智能的“全能冠军”,却是机器难以从人类手中夺走的。无数个智能的单项冠军也难以企及这一“全能冠军”的智能水平。这就引出了人工智能的强弱之分的话题。
人工智能除了有“感知”与“认知”之分,亦有“强”“弱”之分。任何一台普通的计算器在数值运算方面的能力远超我们人类最聪明的头脑,但是不会有人觉得他比3岁的儿童更智能。其背后的根本原因在于,计算器只能胜任数值计算这一单项任务,而3岁儿童却能胜任几乎无法穷举的任务,如识别父母、寻找奶瓶、辨别声音等。因此,智能的强弱很大程度上体现在其通用或单一的程度。强的智能是能够胜任任何任务求解所需要的智能,而弱的智能仅限于解决某个特定任务,强人工智能的实现显然远远难于弱人工智能。当前取得实际应用效果的仍以弱人工智能为主。实现强人工智能任重道远,但却不可回避。因为强人工智能解决的是人工智能的根本难题:现实世界的开放性。现实世界是复杂的,真实任务是多样的,而我们的计算机当前只能胜任预定义的任务与场景,一旦碰到从未见过的案例、样本、场景,就显得无能为力。努力提升机器智能的适应性,以及对于开放性的应对能力,已经成为人工智能最为重要的研究课题之一。
值得注意的是,人工智能仍然是个不断发展中的学科,其内涵仍在不断丰富与完善,一些新的研究视角在为人工智能持续增添新的内涵,如AI的安全性与可控性、AI的黑盒化与可解释、AI与人文学科、AI与社会发展、AI与脑科学等,这些新的研究视角在持续推动AI概念的发展与完善。
人工智能发展的历程
“理想很丰满,现实很骨感”,“柳暗花明又一村”,用这两句话来表达人工智能的发展历程是再恰当不过的了。纵观人工智能的发展历程,大体可分为三次高潮和两个低谷期。
1. 人工智能发展的第一次高潮
20世纪40至50年代,来自不同领域的一批科学家开始探讨制造人工大脑的可能性,这是人工智能问题的雏形。1943年,美国麻省理工学院的两位科学家沃伦·麦卡洛克(WarrenMcCulloch)和沃尔特·皮茨(WalterPitts)提出了一种生物神经元的数学模型,使得利用计算机模拟的人工神经元成为可能。多个人工神经元连接在一起可以形成一个类似生物神经网络的网络结构(参见图引-1)。1957年,弗兰克·罗森勃拉特(FrankRosenblatt)提出了感知器模型,将神经网络研究推向工程实现。
1950年,英国计算机专家艾伦·图灵(AlanTuring)提出了著名的图灵测试,用来判断一台机器是否具有人类智能。它更像一场有趣的“模仿游戏”:由测试者向被测试者提出多个问题,根据被测试者的回答判断被测试者是人还是机器。如果有超过30%的测试者不能确定被测试者是人还是机器,那么就可以说这台机器具有人类智能(参见图引-2)。由于图灵测试只能测试机器是否具有智能的外在表现,随着人工智能的发展,它日益暴露出局限性。设想一下,如果将对话任务换成下围棋,我们现在显然无法再根据机器的围棋水平来判断对方是人还是机器。因为众所周知,机器在围棋游戏方面已经远超人类冠军水平。随着机器语音和对话能力的提升,我们也越来越难以判断为你服务的电话客服到底是机器还是人类。
[[358677]]
1956年,在美国汉诺威小镇的达特茅斯学院召开的一次研讨会上,一批各有所长的科学家聚在一起,讨论着一个当时被认为不切实际的主题——让逐渐成熟的计算机代替人类解决一些感知、认知乃至决策的问题。会议整整开了2个月,科学家们各执一词,谁都说服不了谁,最后有人提出了“人工智能”的说法。这次会议被公认为人工智能诞生的标志。同年,人工智能被确立为一门学科。
这一新兴学科的产生,很快就引起学术界的广泛关注,研究者纷至沓来,新课题层出不穷。从20世纪50年代后期到60年代,涌现出了一大批成功的AI程序和新的研究方向。有人开发了程序STUDENT,它能够解决高中程度的代数应用题,被认为是人工智能在自然语言处理领域早期的应用成果。有人创建了全世界最早的聊天机器人ELIZA,它可以使用英语和用户交流。ELIZA是一个早期的自然语言处理程序,它通过模式匹配和替代的方式来实现人机对话(其实只是按固定套路作答,机器并不理解语言的意义,实际上距离真正的人工智能还有很长的距离要走)。
20世纪60年代中期,人工智能研究在资金方面得到了大量资助,并且在世界各地建立了实验室。当时人工智能的研究人员们对未来充满信心,著名的科学家赫伯特·西蒙(HerbertSimon)甚至预言:“机器将能够在20年内完成人类可以做的任何工作。”还有的科学家认为“在一代人之内……创造‘人工智能’的问题将基本解决”。人工智能研究迎来了第一个“黄金”发展时期。
然而,现实并不像人们预期的那样乐观,人工智能的发展遭遇了瓶颈。主要的原因是:当时计算机的运算能力和数据处理能力较低,数据也相对匮乏,不能满足解决复杂问题的需要。人工智能步入第一次低谷期。
2. 人工智能发展的第二次高潮
进入20世纪80年代早期后,随着新兴的工业、商业、金融等行业的发展,人工智能研究作为附属于其他行业的辅助性手段与工具得到了一定的恢复。
这一时期比较有代表性的研究进展包括:
一是“专家系统”的出现。这是一种模拟人类专家知识和分析技能的人工智能系统,通过知识表示和知识推理技术,来模拟领域专家解决问题的过程。专家系统以知识库和推理机为核心,利用知识得到一个满意的解是系统的求解目标。著名的专家系统包括:ExSys(第一个商用的专家系统)、Mycin(一个诊断系统)等。
二是神经网络模型的再次兴起。大卫·鲁姆哈特(DavidRumelhart)等人于20世纪80年代提出的多层感知器及反向传播算法,优化了神经网络的训练方法。
这一时期比较有影响力的人工智能应用是日本的“第五代计算机项目”。20世纪80年代,日本提出了“第五代计算机项目”。它的主要目标之一是突破所谓的“冯·诺依曼瓶颈”(冯·诺依曼架构是以存储程序为核心思想的主流计算机体系结构,当时的日本学者认为这一体系结构只能实现有限的运算和信息处理,因此称之为“冯·诺依曼瓶颈”),实现具有推理以及知识处理能力的人工智能计算机。在第五代计算机项目的激励下,人工智能领域的研究项目得到推进。1985年,人工智能市场规模已超过十亿美元。
然而,好景不长。受限于当时有限的数据和算力,机器仍然难以应对复杂情形。比如,专家系统中的if-then规则在描述复杂问题时呈指数增长,有限的算力难以支撑这类复杂问题的解决。从1987年Lisp(人工智能程序设计的主要语言)机市场崩溃开始,人们对专家系统和人工智能失去信任,人工智能进入第二次低谷期。
3. 人工智能发展的第三次高潮
始于20世纪90年代末和本世纪初,人工智能再一次悄然崛起。2006年,加拿大多伦多大学的杰弗里·辛顿(GeoffreyHinton)教授及其学生提出了深度学习,并迅速在图像识别、语音识别、游戏和搜索引擎等领域获得显著效果。除了以深度学习为代表算法的这一原因之外,这一阶段的成功还得益于计算机计算能力的提升以及各行各业海量数据的累积。
这一波人工智能浪潮仍在发展,已发生的比较具有代表性的事件有:
一是计算机与人类的棋坛博弈。1997年5月11日,深蓝成为第一个击败卫冕国际象棋世界冠军加里·卡斯帕罗夫的计算机国际象棋系统。2016年3月,阿尔法围棋(AlphaGo)以4∶1击败李世石,成为第一个击败职业围棋世界冠军的电脑围棋程序。2017年5月,阿尔法围棋在中国乌镇围棋峰会的三局比赛中,击败了当时世界排名第一的中国棋手柯洁。在这个基础上,经过强化学习训练后,阿法元(AlphaGoZero)无需人类经验,通过自我博弈,以100∶0击败阿尔法围棋。
二是机器在图像识别与语音识别等任务中达到人类水平。图像处理任务中的错误率自2011年以来显著下降。在计算机视觉领域,如手写数字体识别数据集上,神经网络的准确率已经超过人类的平均准确率。在语音识别方面,科大讯飞等公司的语音识别率高达98%(2018年的水平),语音识别水平在2016年就已经达到了人类水平。
三是机器在语言理解等相关任务上取得长足的进步。让机器具备理解人类自然语言的能力是人工智能发展历程中具有里程碑意义的任务。更有专家认为,语言理解是人工智能桂冠上的明珠。近年来,得益于深度学习模型和大规模语料,机器在一系列语言理解任务中攻城略地。比如在斯坦福问答数据集(StanfordQuestionAnsweringDataset,简称“SQuAD”)文本理解挑战赛上,早在2018年年初,来自阿里的研究团队所提出的机器阅读理解模型就取得超过人类水平的准确率。在2018年的谷歌I/O大会上,谷歌展示了一段谷歌助理(谷歌的一个应用软件)与人类长达数分钟的电话,现场观众几乎无法分辨出谁是机器,谁是人类。此后,各类客服电话大量由机器代替,智能客服的成功应用大幅降低了人工客服成本。
这些事件的发生,让人们充分认识到人工智能技术所蕴含的经济价值与社会潜能。人们对人工智能技术的认识由此上升到了一个前所未有的高度,从而极大地推动了人工智能技术的发展。
人工智能研究的不同视角
人工智能是个庞杂的学科,不同的视角对人工智能的理解不尽相同。让我们来了解一下人工智能研究中主要学术流派的看法吧!
1. 符号主义流派是这样认为的
符号主义流派认为人工智能源于数理逻辑,又称“逻辑主义流派”。数理逻辑从19世纪末起获得迅速发展,到20世纪30年代开始用于描述智能行为。计算机出现后,又在计算机上实现了逻辑演绎系统,其代表性成果为启发式程序LT(逻辑理论家),证明了38条数学定理,表明应用计算机研究人的思维过程,可以模拟人类智能活动。
符号主义认为人类的认知过程是符号操作与运算的过程,主张用公理和逻辑体系搭建一套人工智能系统。符号主义认为,知识表示、知识推理和知识应用是人工智能的核心。知识可以用符号来表示,认知是符号加工的过程,推理是使用理智从某些前提产生结论的行动。符号主义者致力于用计算机的符号操作来模拟人的认知过程,其实质就是模拟人的左脑抽象逻辑思维。符号主义者最早采用了“人工智能”这个术语,后来又发展了专家系统、知识工程理论与技术,并在20世纪80年代取得了很大发展。
符号主义流派曾长期一枝独秀,为人工智能的发展作出重要贡献,尤其是专家系统的成功开发与应用,为人工智能走向工程应用、实现理论联系实际具有重要意义。在人工智能的其他学派出现之后,符号主义仍然是人工智能的主流学派之一。
2. 联结主义流派是这样认为的
联结主义学派,又称“仿生学派”或“生理学派”,其主要关注神经网络及神经网络间的联结机制和学习算法。联结主义认为,人工智能源于仿生学,特别是人脑模型的研究。联结主义从神经元开始,进而研究神经网络模型和脑模型,开辟了人工智能的又一发展道路。联结主义学派从神经生理学和认知科学的研究成果出发,把人的智能归结为人脑的高层活动的结果,强调智能活动是由大量简单的单元通过复杂的相互联结后并行运行的结果,其中人工神经网络就是其代表性技术。
联结主义发端于1943年,诞生了生物神经元的计算模型“M-P模型”,其后经历了1957年“感知器”模型,1982年Hopfield模型以及1986年提出的反向传播算法等代表性事件。联结主义在近期的代表性进展就是深度学习。2012年,在ImageNet大型视觉识别挑战赛中,深度学习模型以绝对领先的成绩拔得头筹。随着硬件技术的发展,深度学习成为当下实现人工智能的主流技术之一。
符号主义与联结主义的发展呈现出此起彼落的态势。事实上,两者各有其价值与意义,对于人工智能的发展都是不可或缺的,应该协同并进、共同促进人工智能的发展。符号主义从宏观上(人类的思维过程)模拟人类的认知过程,而联结主义则从微观上(神经网络的结构与参数)实现对于人脑功能的模拟。从当前人工智能发展趋势来看,由联结主义实现模式识别等初步感知任务,进而将相关结果输入符号主义的相关系统中,实现深度的推理与解释,是未来人工智能发展的基本模式。
3. 行为主义流派是这样认为的
行为主义流派,又称“进化主义流派”或“控制论学派”。行为主义流派认为人工智能源于控制论,研究内容包括生命现象的仿生系统、人工建模与仿真、进化动力学、人工生命的计算理论、进化与学习综合系统以及人工生命的应用等。行为主义认为,人工智能可以像人类智能一样逐步进化,智能体的智能行为只能通过其与现实世界及周围环境的交互而表现出来。
控制论思想早在20世纪四五十年代就成为时代思潮的重要部分,影响了早期的人工智能研究者。美国数学家诺伯特·维纳(NorbertWiener)等人提出的控制论和自组织系统以及我国科学家钱学森等人提出的工程控制论和生物控制论,影响了许多领域。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,如对自寻优、自适应、自校正、自镇定、自组织和自学习等控制论系统的研究,并进行“控制论动物”的研制。到20世纪六七十年代,上述这些控制论系统的研究取得一定进展,播下智能控制和智能机器人的种子,并在八十年代诞生了智能控制和智能机器人系统。
直到20世纪末,行为主义流派才以人工智能新学派的面孔出现,引起许多人的关注。这一学派的代表作首推美国麻省理工学院的罗德尼·布鲁克斯(RodneyBrooks)所研发的六足行走机器人,它被看作新一代的“控制论动物”,是一个基于感知—动作模式的模拟昆虫行为的控制系统。事实上,这种通过与环境自适应交互所形成的智能,是一种“没有推理的智能”。近期,在深度强化学习等技术的推动下,机器人的环境交互能力得到显著提升,能跑会跳、满世界“溜达”的机器人已经逐步变成现实。
人工智能三要素
人工智能在近期的飞速发展,主要得益于数据的快速积累、计算能力的不断提升以及算法的改进优化。因此,人们把数据、算力和算法称为人工智能三要素。
1. 人工智能与大数据
什么是大数据?一般地说,大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据一般具有大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)、真实性(Veracity)五个特点,也称其为大数据的5V特点。“大量”指数据体量极大,数据量从TB级别到PB级别;“高速”指数据产生和处理的速度非常快,如工业大数据应用中部署的各种传感器能够以每秒数个G的采集频率采集数据;“多样”指数据类型很多,如语音、文字、图片和视频等,不同类型的数据往往需要不同的处理手段;“低价值密度”指大量的数据中有价值的只有极少数,如监控视频中最有价值的数据往往只有几秒;“真实性”指追求高质量的数据,因为数据的规模并不能为决策提供帮助,数据的真实性和质量才是制定正确决策的关键。
大数据在现实的生产与生活中有着大量的实际应用。例如,天气预报就是基于大数据而对未来天气作出的预测。这些数据可以是一年前的,也可以是几年、几十年甚至更长时间的数据积累。又如,在智能商业、工业4.0、互联网服务、智慧金融等领域,大数据的运用使得这些领域发生了翻天覆地的变化和进步。
大数据所具有的海量数据的特质促进了计算机科学、信息科学、统计学等应用学科的飞速发展。与此同时,随着数据量的爆炸式增长,非结构化的数据和残缺的数据也随之增加,用传统的方式处理大数据会极大地损失数据中蕴含的价值。
当前,人工智能的发展集中体现在机器学习上。机器学习的两种重要方式——监督学习和无监督学习——均需要大数据的“喂养”。监督学习是机器学习的有效手段之一。监督学习过程中需要把有标注的样本“喂”给机器,而有标注的样本来自大数据,从这个意义来看,人工智能需要大数据。以深度学习为例,数据量越多,效果就越好。无监督学习则从海量数据中学习统计模式来解决问题,同样离不开大数据。
那么,是否数据越多,是否有标注的样本越多,效果就越好呢?有学者在图像的目标检测任务上进行了相关研究(参见图引-4),得到的结论是:一方面,随着训练数据的扩展,任务性能呈对数增长,即使训练图片规模达到3亿张,性能的上升也没有出现停滞;而另一方面,对数增长也意味着当数据量达到一定程度后,模型性能的提升效果就不再显著。
当前人工智能发展的另一个重要体现是大规模知识工程技术。知识工程是以构建专家系统为核心内容的学科,旨在利用专家知识解决问题。进入互联网时代之后,大规模开放性应用需要大规模的简单知识表示。知识图谱就是这样的知识表示,其本质是一个大规模语义网络,包含实体、概念及其之间的各类语义关系。
知识图谱的诞生使得知识工程迈入了大数据时代。传统工程依赖专家进行知识获取所导致的瓶颈被突破了,前所未有的算力、算法和数据的“汇聚”,使得大规模自动化知识获取成为可能。从互联网数十亿文本当中,利用自动抽取模型,可以自动获取数亿计的结构化知识。互联网时代的高质量UGC(用户贡献内容),比如问答、论坛、维基等为自动化知识获取提供了大量优质的数据来源。与大数据共生的众包平台,使得我们可以更有效地利用闲散的人力资源。正是在这些机会的合力作用下,人类从小规模知识时代迈进了大规模知识时代。知识图谱有望引领知识工程的复兴。更多的知识表示形式会在大数据的赋能下,解决更多的实际问题(参见图引-5,这是与一位足球明星有关的知识图谱)。
人工智能的第三次发展浪潮很大程度上是由大数据推动的,没有大数据的滋养,人工智能很难在当下取得突飞猛进的进步。当前人工智能的很多成功应用都发生在数据丰富的场景,如图像识别在准确率上的突破得益于大量普及的摄像头所采集的海量图像数据等。
2. 人工智能与算力
算力即计算能力。算力的显著增长,体现在计算机的数据存储容量和数据处理速度的快速提升(参见图引-6、图引-7),均呈现出指数增长的趋势。我国的超级计算机“神威·太湖之光”的持续性能为9.3亿亿次/秒,峰值性能可以达到12.5亿亿次/秒。算力的快速增长,一方面是由于摩尔定律(计算机硬件每隔一段时间便会翻倍升级)持续发挥作用,使得单体计算元器件的计算性能在增长。另一方面,以云计算为代表的性能扩容等技术也在持续发展。云计算能够将大规模廉价机器组织成高性能计算集群,提供匹配甚至远超大型机的计算能力。
人工智能的飞速发展离不开强大的算力。在人工智能概念刚刚被提出的时候,由于其计算能力的受限,当时并不能完成大规模并行计算与处理,人工智能系统能力比较薄弱。但是随着深度学习的流行,人工智能技术的发展对高性能算力提出了日益迫切的需求。深度学习主要以深度神经网络模型为学习模型,深度神经网络是从浅层神经网络发展而来的。深度学习模型的训练是个典型的高维参数优化问题。深度神经网络模型具有多层结构,这种多层结构带来了参数的指数增长。以BERT(BidirectionalEncoderRepresentationfromTransformers)为代表的语言模型多达3亿参数,最新的世界纪录是Nvidia训练出包含83亿参数的语言模型(2019年8月)。以BERT的3亿参数的模型训练为例,研发团队共消耗了16块云TPU(张量处理单元)近4天时间才能训练完成,其中每块云TPU能提供180TFLOPs(1TFLOPs意味着每秒1万亿次的浮点运算能力)算力和64GB内存。
国家间的人工智能之争已经在很大程度上演变为算力之争。华为公司推出的一系列AI计算芯片在一定程度上推动了我国人工智能发展的算力的提升。
3. 人工智能与算法
算法是计算机解决问题或者执行计算的指令序列。很多数学模型在具体运行时往往需要实现相应的算法,算法与模型已经成为人工智能发展的重要支撑。人工智能的相关算法类型众多,涉及搜索、规划、演化、协同与优化等一系列任务。当下,人工智能领域的快速发展尤为明显地体现在一系列新颖算法和模型的发展,特别是以深度学习为代表的机器学习算法的快速发展。机器学习是一种从观测数据(样本)中寻找规律,并利用学习到的规律(模型)对未知或无法观测的数据进行预测的方法。随着数据量的急剧增加,从大数据中发现统计规律,进而利用这些统计规律解决实际问题变得日益普遍。
当前大多数机器学习的本质是统计学习,即通过历史标注数据来拟合构建学习模型。以经典的线性回归为例,线性回归旨在从样本习得一个合适的线性映射f,使得对于输入变量x,经过
后能够得到正确的输出变量y。假设我们有房屋面积与价格之间的历史数据(比如表引-1所示,第一列表示60米2的房屋价格为300万,其他列以此类推)。这里的每一对房屋面积和价格数据(
)就是一个样本,所有样本的集合为(
),(
),…,(
)。显然我们关心的是根据房屋面积预测房屋价格。房屋面积
就是输入变量或者解释变量,房屋价格
是我们需要预测的变量,是输出变量,或称响应变量。从这些样本数据学习到的房价与房屋面积之间的关系,可以表示为一个函数f(每个输入产生确定的唯一的输出)。f接收某个房屋面积作为输入,预测相应的价格作为输出。例如,对于表格中不存在的85平方米的房屋,通过f函数我们就可以预测其价格。
为了学习房屋面积与房屋价格之间的函数关系,一种常见的学习方法是最小二乘法。首先假定f是简单的线性函数形式,也就是f(x)=a+bx,其中a,b是参数。所谓确定f的函数形式,就是确定a和b两个参数的具体值。因此对f的学习,就转换为对a和b两个参数的学习问题。很显然,如果f是一个好的函数,就应该尽可能与当前已经观测到的样本一致,也就是f(60)应该尽可能接近300万的真实价格。将这一期望推广到所有已观测样本,就有了如下的误差函数:
直观的理解是希望求得的线性函数(红色的直线)所预测的价格与实际价格累计平方误差最小。可以通过偏导数求得上述误差函数最小化时的参数a与b。根据求得的参数a与b,就可以完全确定函数f,从而可以根据任意面积进行房价预测(参见图引-8)。机器学习有着很多任务,上述线性回归只是最简单的一类。如果f是非线性函数,那么就是非线性回归问题。房价是一个连续数值,在有些任务中要预测的是一个离散量。例如,根据体温、血液指标等预测病人是否得了感冒(只需要判断是否感冒这两种情况),此时的机器学习问题就变成了分类问题。此外,我们经常需要对数据进行聚类,比如将客户自动聚类,从而分为不同人群。除了这些具体的问题模型外,机器学习还涉及众多算法,完成不同的任务,比如K近邻分类算法、基于“决策树”的分类算法、基于“支持向量机”的分类算法、K均值聚类算法、基于PCA的降维算法、基于梯度下降和进化算法的参数学习算法(如线性回归中的参数最优化学习)等。