人工智能导论——人工智能学科研究的基本内容及主要研究领域
一、人工智能研究的基本内容
(1)知识表示
人工智能研究的目的是要建立一个能模拟人类智能行为的系统,但知识是一切智能行为的基础,因此首先要研究知识表示方法。只有这样才能把只是存储到计算机中去,供求解现实问题使用。知识表示方法可分为两类:符号表示法(用各种包含具体含义的符号以各种不同的方式和顺序组合起来表示知识的方法)和连接机制表示法(用神经网络表示知识)。
(2)机器感知
所谓机器感知就是使机器(计算机)具有类似于人的感知能力,其中以机器视觉和机器听觉为主。机器感知是机器获取外部信息的基本途径。
(3)机器思维
所谓机器思维是指通过感知得来的外部信息及机器内部的各种工作信息进行有目的的处理。
(4)机器学习
机器学习就是研究如何使计算机具有类似于人的学习能力,使它能通过学习自动的获取知识。
(5)机器行为
机器行为主要是指计算机的表达能力,即“说”、“写”、“画”等能力。对于智能机器人,它还应具有人的四肢功能,即能走路、能取物、能操作等。
二、人工智能的主要研究领域
目前,随着智能科学和技术的发展和计算机网络技术的广泛应用,人工智能技术应用到越来越多的领域。下面简要介绍几个主要领域:
(1)自动定理证明
自动定理证明是人工智能中最先进行研究并得到成功应用的一个研究领域,同时它也为人工智能的发展起到了重要的推动作用。实际上,除了数学定理证明以外,医疗诊断、信息检索、问题求解等许多非数学领域问题,都可以转化为定理证明问题。
(2)博弈
诸如下棋、打牌、战争等一类竞争性的智能活动称为博弈(gameplaying)。人工智能研究博弈的目的并不是为了让计算机与人进行下棋、打牌之类的游戏,而是通过对博弈的研究来检验某些人工智能技术是否能实现对人类智慧的模拟,促进人工智能技术的深入研究。
(3)模式识别
模式识别(patternrecognition)是一门研究对象描述和分类方法的学科。分析和识别的模式可以是信号、图象或者普通数据。模式是对一个物体或者某些其他感兴趣实体定量的或者结构的描述,而模式类是指具有某些共同属性的模式集合。
模式识别方法有统计模式识别、结构模式识别、模糊模式识别、神经网络模式识别等。
(4)机器视觉
机器视觉(machinevision)或者计算机视觉(computervision)是用机器代替人眼进行测量和判断,是模式识别研究的一个重要方面。计算机视觉通常分为低层视觉和高层视觉两类。
(5)自然语言理解
自然语言理解(naturallanguageunderstanding)就是研究如何让计算机理解人类自然语言,是人工智能中十分重要的一个研究领域。它是研究能够实现人与计算机之间用自然语言进行通讯的理论与方法。
(6)智能信息检索
数据库系统是存储大量信息的计算机系统。随着计算机应用的发展,存储的信息量越来越大,研究智能信息检索系统具有重要的理论意义和实际应用价值。智能信息检索系统应具有下述功能:能理解自然语言、具有推理能力、系统拥有一定的常识性知识。
(7)数据挖掘与知识发现
知识发现系统通过各种学习方法,自动处理数据库中大量的原始数据,提炼出具有必然性的、有有意义的知识,从而揭示出蕴涵在这些数据背后的内在联系和本质规律,实现知识的自动获取。知识发现是从数据库中发现知识的全过程,而数据挖掘则是这个全过程的一个特定的、关键的步骤,数据挖掘的目的是从数据库中找出有意义的模式。
(8)专家系统
专家系统是一个智能的计算机程序,运用知识和推理步骤来解决只有专家才能解决的疑难问题,是目前人工智能最活跃、最有成效的一个研究领域。可以这样定义,专家系统是一种具有特定领域内大量知识和经验的程序系统,它应用人工智能技术模拟人类专家求解问题的思维过程求解领域内的各种问题,其水平可以达到甚至超过人类专家的水平。
(9)自动程序设计
自动程序设计是将自然语言描述的程序自动转换可执行程序的技术,包括程序综合和程序正确性验证两个方面的内容。
(10)机器人
机器人是指可模拟人类行为的机器。它可分为三代:程序控制机器人(第一代)、自适应机器人(第二代)、智能机器人(第三代)。
(11)组合优化问题
组合优化问题一般是NP完全问题。NP完全问题是指:用目前知道的最好的方法求解,问题求解需要花费的时间(称为问题求解的复杂性)是随问题规模增大以指数关系增长。组合优化问题的求解方法已经应用于生产计划与调度、通信路由调度、交通运输调度等。
(12)人工神经网络
人工神经网络是一个用大量简单处理但愿经广泛连接而组成的人工网络,用来模拟大脑神经系统的结构与功能。
(13)分布式人工智能与多智能体
分布式人工智能(DAI)是分布式计算与人工智能结合的结果。分布式人工智能的研究目标是要建立一种描述自然系统和社会系统的模型。
(14)智能控制
智能控制就是把人工智能技术引入控制领域,建立智能控制系统。
(15)智能仿真
智能仿真就是将人工智能技术引入仿真领域,建立智能仿真系统。
(16)智能CAD
智能CAD就是将人工智能技术引入计算机辅助设计领域,建立智能CAD系统。
(17)智能CAI
智能CAI就是将人工智能技术引入计算机辅助教学领域,简历智能CAI系统即ICAI。
(18)智能管理与智能决策
智能管理就是将人工智能技术引入管理领域,建立智能管理系统,研究如何提高计算机管理系统的智能水平,以及智能管理系统的设计理论、方法和实现方法。智能决策就是将人工智能技术引入决策过程,建立智能决策支持系统。
(19)智能多媒体系统
智能多媒体实际上是人工智能与多媒体技术的有机结合。
(20)智能操作系统
智能操作系统就是将人工智能技术引入计算机的操作系统之中,从质上提高操作系统的性能和效率。
(21)智能计算机系统
智能计算机系统就是人们正在研制的新一代计算机系统,它将全面支持智能应用开发,且自身就具有智能。
(22)智能通信
智能通信就是将人工智能技术引入通信领域,建立智能通信系统,在通信系统的各个层次和环节上实现智能化。
(23)智能网络系统
智能网络系统就是将人工智能技术引入计算机网络系统。
(24)人工生命
人工生命是以计算机为研究工具,模拟自然界的生命现象,生成表现自然生命系统行为特点的仿真系统。
----内容来自于《人工智能导论(第四版)》
实现人工智能的三要素
人工智能,一个熟悉又陌生的名词。对于外行人员来说,人工智能就是所看到的应用产品,比如人脸识别、智能语音、智能机器人等,但是对于业内人员来讲,人工智能的本质是数据、算力、算法这些必须的元素所构成的。数据、算力、算法已经构成了目前实现人工智能的三要素,并且缺一不可。接下来,我们就来逐一分析构成人工智能的这三个要素。
数据——人工智能的粮食
实现人工智能的首要因素是数据,数据是一切智慧物体的学习资源,没有了数据,任何智慧体都很难学习到知识。自从有记录以来,人类社会发展了数千年,在这期间,人类社会不断发展变化,从最早的原始社会到奴隶社会,再到封建社会、资本主义社会、社会主义社会,未来还会发展到共产主义社会,在这漫长的发展过程中,都少不了数据做为人类社会发展的动力。
人类社会之所以发展的越来越高级文明,离不开学习知识,而知识的传播流传越快,则社会发展也越快,在封建社会以前,知识的传播从口口相传到甲骨文,再到竹简记录,就算是封建社会后期的纸质记录,其知识的传播速度也无法和今天的互联网知识的传播速度相提并论。
一般来说,知识的获取来自两种途径,一种是通过他人的经验而获得的知识,也就是他人将知识整理成册,然后供大家学习,这也是目前的主流学习方式;另一种就是通过自己的探索而获得的知识,这种学习方式目前只存在高精尖领域的知识学习,由于在已有的开放社会资源中,找不到可以学习的知识,只有自我探索获取。
无论哪种学习方式,都要通过学习载体来传播知识,无论是面对面讲述,实践操作,还是书本记录,或是电子刊物,亦或者影像资料等,这些都是学习载体,我们都可以称其为数据,学习数据的质量从根本上影响了学习的效果,所以对于人类学习而言,找一个好的老师,有一本好的书籍都是非常重要的学习选择。
既然人类的学习非常依赖于数据的质量,那么AI学习知识的时候,是否也会存在同样的问题呢?答案当然是肯定的,不仅如此,而且AI学习知识的时候对于数据的依赖还要高于人类。人类相比目前的AI而言,是具有推理能力的,在学习某些具有关联性知识的时候,通过推理联想可以获得更多的知识。从另一角度来讲,在某种特定场景下,即使数据不够完整全面,对于人类的学习影响也不会太大,因为人类会利用推理和想象来完成缺失的知识。而目前AI的推理能力还处于初级研究阶段,更多的难题还等着业内技术人员来攻克。
由此可见,目前AI学习知识大部分基本都是依赖于数据的质量的,在这种情况下,连人工智能专家吴恩达都发出人工智能=80%数据+20%算法模型的感慨,可见人工智能的“粮食安全”问题还是非常紧迫的,如果“粮食”出现了质量安全问题,那么最终将会导致人工智能“生病”。可见数据的好坏基本上大概率的决定了智能化的高低,有人会说,我可以通过提高算法模型来提高效果啊,不幸的是,在数据上稍微不注意造成了质量问题,需要在算法上历尽千辛万苦来提高效果,而且还不一定弥补得上,数据对于人工智能最终的发展结构可见一斑。
算力——人工智能的身体
算力是实现人工智能的另一个重要因素,算力在一定程度上体现了人工智能的速度和效率。一般来说算力越大,则实现更高级人工智能的可能性也更大。算力是依附于设备上的,所以一般谈论算力,都是在说具体的设备,比如CPU、GPU、DPU、TPU、NPU、BPU等,都是属于算力设备,只是他们有各自不同的能力而已。具体介绍可以阅读上一篇文章:CPU、GPU、DPU、TPU、NPU...傻傻分不清楚?实力扫盲——安排!一文,介绍相当全面,从APU到ZPU,各种PU全部介绍完了,扫盲是够了。
算力设备除了上面的各种PU之外,每一种设备下面还会分不同的系列,比如英伟达的GPU在PC端有消费级的GeForce系列,专业制图的Quadro 系列、专业计算的Tesla系列等,而GeForce系列细分还可以分为GT、GTX、RTX等,当然每种子系列下还可以继续细分,比如GTX下面有GTX1050、GTX1050Ti......GTX1080、GTX1080Ti,还有GTXTitan等更强大的系列,RTX下面也一样包括了更详细的等级划分,具体选择哪个系列要看具体使用场景而定,当然还和自身的消费实力相关,算力性能越强大也意味着更多的真金白银。
下面是RTX20系列的各种显卡的性能对比:
RTX30系列的各种显卡的对比:
此外,英伟达还有嵌入式端的各种显卡系列,比如适用于自主机器AI平台的JetSon系列、DRIVEAGX系列、ClaraAGX系列等,以及云端的一些计算资源。同样每种系列还是做了进一步的细分,比如Jetson下面就根据其算力核心数就分成了JetsonNano、JetsonTX2、JetsonXavierNX、JetsonAGXXavier等四款设备。
对于厂家而言,产品分的越细,越利于宣传和推广,对于消费者而言,可选择性也大大增加,但是也对消费者的基本知识也有了要求,如果不清楚各种产品的差异,那么就很容易选择错误,而现在的显卡市场就是如此,需要一些专业的知识才能够选对自己所需的显卡类型。希望大家经过科普后都能够选对自己的显卡型号,是打游戏、制图、还是计算,心里要有一个对应的系列型号才行,不然可要陷入选择困难症中了。
以目前人工智能主流技术深度学习为例,它的学习过程就是将需要学习的数据放在在算力设备上运行,经过神经网络亿万次的计算和调整,得到一个最优解的过程。如果把数据当成人工智能的“粮食”,那么算力就是撑起人工智能的“身体”,所有的吃进去的“粮食”都需要“身体”来消化,提取“营养”帮助成长。同样,人工智能的数据也是需要经过算力来逐一运算,从而提取数据的特征来作为智能化程度的标志的。
算法——人工智能的大脑
算法是人工智能程序与非人工智能程序的核心区别,可以这么理解,就算有了数据、有了算力,但是如果没有核心算力,也只能算是一个看起来比较高大上的资源库而已,由于没有算法的设计,相当于把一大堆的资源堆积了起来,而没有有效的应用。而算法就是使得这对资源有效利用的思想和灵魂。
算法和前两者比起来,算法更加的依赖于个人的思想,在同一家公司里,公司可以给每个算法工程师配备同样的数据资料和算力资源,但是无法要求每个算法工程师设计出来的算法程序的一致性。而算法程序的不一致性,也导致了最终智能化的程度千差万别。
相对于数据是依赖于大众的贡献,算力是依赖于机构组织的能力,而算法更加的依赖于个人,虽然很多公司是算法团队,但是真正提出核算算法思想的也就是那么一两个人,毫不夸张的说其他人都是帮助搬砖的,只是这种算法层面的搬砖相对纯软件工程的搬砖,技能要求要更高而已。这点和建筑设计一样,很多著名的建筑设计,其思想都是来自于一个人或者两个人,很少见到一个著名的设计其思想是由七八个人想出来的。
由于算法设计的独特性,和数据与算力相比,在人工智能的三个要素中,算法对人工智能的影响更大,这是因为在平时的工作当中,只要大家花上时间和费用,基本都可以找到好一些的数据和算力设备,但是算法由于其独特性,很多的算法是有专利或者没有向外界开源的,这个时候的差异就要在算法上体现出来了。
现在的大学和培训机构的人工智能专业,其学习方向也主要是以算法为主。因为数据是由大众产生,又由一些互联网大厂存储的,一般个人很少会去做这一块;而算力设备是由芯片公司控制着的;做为独立的个人最能够发挥效力的就在人工智能的算法方向了。培养优秀的算法人才对于人工智能的发展至关重要。目前市场上关于图像视觉、语音信号、自然语言、自动化等方向的算法工程师供不应求,薪资水平也是远超其他互联网软件行业的岗位。
后记:
当前,国内人工智能发展正处于高速成长期,未来将会进入爆发期,无论从业者是处于人工智能的数据处理方向,还是人工智能的算力设备研发方向,或者是人工智能的算法研发方向,都将会迎来巨大的行业红利和丰厚的回报。而人工智能算法方向又是学习回报比最高的一个方向,做为没有背景的个人,是进入人工智能行业的最佳选择。
最后希望想进入人工智能的朋友都能愿望成真,关注微信公众号深度人工智能学院,我们长期致力于人工智能的技术传播和人才发展计划。
关注微信公众号:深度人工智能学院,获取更多人工智能方面的知识!
官方公众号 官方微信号