人工智能的三次浪潮与三种模式
■史爱武
谈到人工智能,人工智能的定义到底是什么?
达特茅斯会议上对人工智能的定义是:使一部机器的反应方式就像是一个人在行动时所依据的智能。
百度百科上对人工智能的定义是:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
尽管人工智能现在还没有非常严格准确或者所有人都接受的定义,但是有一些约定俗成的说法。通常人工智能是指机器智能,让机器达到人智能所实现的一些功能。人工智能既然是机器智能,就不是机械智能,那么这个机器是指什么呢?是指计算机,用计算机仿真出来的人的智能行为就可以叫作人工智能。
2017年7月,国务院印发了《新一代人工智能发展规划》。2017年12月,人工智能入选“2017年度中国媒体十大流行语”。这一国家级战略和社会流行趋势标志着,人工智能发展进入了新阶段,我国要抢抓人工智能发展的重大战略机遇,构筑人工智能发展的先发优势,加快建设创新型国家和世界科技强国。
人工智能的三次浪潮
自1956年开始,人工智能经历了三起三落,出现了几次浪潮,现在人工智能已经是处于第三次浪潮了。
第一次浪潮(1956-1976年,20年),最核心的是逻辑主义
逻辑主义主要是用机器证明的办法去证明和推理一些知识,比如用机器证明一个数学定理。要想证明这些问题,需要把原来的条件和定义从形式化变成逻辑表达,然后用逻辑的方法去证明最后的结论是对的还是错的,也叫做逻辑证明。
早期的计算机人工智能实际上都是沿着这条路在走。当时很多专家系统,比如医学专家系统,用语言文字输入一些症状,在机器里面变换成逻辑表达,用符号演算的办法推理出大概得了什么病。所以当时的主要研究都集中在逻辑抽象、逻辑运算和逻辑表达等方面。
在第一次浪潮中,数学定理证明实际上是实现效果最好的,当时有很多数学家用定理思路证明了数学定理。为了更好地完成定理证明工作,当时出了很多和逻辑证明相关的逻辑程序语言,比如很有名的Prolog。
虽然当时的成果已经能够解开拼图或实现简单的游戏,却几乎无法解决任何实用的问题。
第二次浪潮(1976—2006年,30年),联结主义盛行
在第一次浪潮期间,逻辑主义和以人工神经网络为代表的联结主义相比,逻辑主义是完全占上风的,联结主义那时候不太吃香。然而逻辑主义最后无法解决实用的问题,达不到人们对它的期望,引起了大家的反思,这时候人工神经网络(也就是联结主义)就慢慢占了上风。
在70年代末,整个神经元联结网络、模型都有突飞猛进的进步,最重要的是BP前馈神经网络。1986年BP前馈神经网络刚出来的时候解决了不少问题,后来大家往更大的领域应用,实现了比较大的成果。在很多模式识别的领域、手写文字的识别、字符识别、简单的人脸识别也开始用起来,这个领域一下子就热起来,一时之间,人们感觉人工智能大有可为。随后十几年人们发现神经网络可以解决一些单一问题,解决复杂问题却有些力不从心。训练学习的时候,数据量太大,有很多结果到一定程度就不再往上升了。
这时期所进行的研究,是以灌输“专家知识”作为规则,来协助解决特定问题的“专家系统”为主。虽然有一些实际的商业应用案例,应用范畴却很有限,第二次热潮也就慢慢趋于消退。
第三次浪潮(2006—现在),基于互联网大数据的深度学习的突破
如果按照技术分类来讲,第二次和第三次浪潮都是神经网络技术的发展,不同的是,第三次浪潮是多层神经网络的成功,也就是深度学习取得突破。这里既有硬件的进步,也有卷积神经网络模型与参数训练技巧的进步。
若观察脑的内部,会发现有大量称为“神经元”的神经细胞彼此相连。一个神经元从其他神经元那里接收的电气信号量达某一定值以上,就会兴奋(神经冲动);在某一定值以下,就不会兴奋。兴奋起来的神经元,会将电气信号传送给下一个相连的神经元。下一个神经元同样会因此兴奋或不兴奋。简单来说,彼此相连的神经元,会形成联合传递行为。我们透过将这种相连的结构来数学模型化,便形成了人工神经网络。
经模型化的人工神经网络,是由“输入层”“隐藏层”及“输出层”等三层构成。深度学习往往意味着有多个隐藏层,也就是多层神经网络。另外,学习数据则是由输入数据以及相对应的正确解答来组成。
为了让输出层的值跟各个输入数据所对应的正解数据相等,会对各个神经元的输入计算出适当的“权重”值。通过神经网络,深度学习便成为了“只要将数据输入神经网络,它就能自行抽出特征”的人工智能。
伴随着高性能计算机、云计算、大数据、传感器的普及,以及计算成本的下降,“深度学习”随之兴起。它通过模仿人脑的“神经网络”来学习大量数据的方法,使它可以像人类一样辨识声音及影像,或是针对问题做出合适的判断。在第三次浪潮中,人工智能技术及应用有了很大的提高,深度学习算法的突破居功至伟。
深度学习最擅长的是能辨识图像数据或波形数据这类无法符号化的数据。自2010年以来,Apple、Microsoft及Google等国际知名IT企业,都投入大量人力物力财力开展深度学习的研究。例如AppleSiri的语音识别,Microsoft搜索引擎Bing的影像搜寻等等,而Google的深度学习项目也已超过1500项。
深度学习如此快速的成长和应用,也要归功于硬件设备的提升。图形处理器(GPU)大厂英伟达(NVIDIA)利用该公司的图形适配器、连接库(Library)和框架(Frame⁃work)产品来提升深度学习的性能,并积极开设研讨课程。另外,Google也公开了框架TensorFlow,可以将深度学习应用于大数据分析。
人工智能的3种模式
人工智能的概念很宽泛,根据人工智能的实力可以分成3大类,也称为3种模式。
(1)弱人工智能:擅长于单个方面的人工智能,也叫专业人工智能。比如战胜世界围棋冠军的人工智能AlphaGo,它只会下围棋,如果让它下国际象棋或分辨一下人脸,它可能就会犯迷糊,就不知道怎么做了。当前我们实现的几乎全是弱人工智能。
(2)强人工智能:是指在各方面都能和人类比肩的人工智能,这是类似人类级别的人工智能,也叫通用人工智能。人类能干的脑力活,它都能干,创造强人工智能比创造弱人工智能难得多,目前我们还做不到。
(3)超人工智能:知名人工智能思想家NickBostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能”。超人工智能可以是各方面都比人类强点,也可以是各方面都比人类强很多倍。超人工智能现在还不存在,很多人也希望它永远不要存在。否则,可能像好莱坞大片里面的超级智能机器一样,对人类也会带来一些威胁或者颠覆。
我们现在处于一个充满弱人工智能的世界。比如,垃圾邮件分类系统是个帮助我们筛选垃圾邮件的弱人工智能;Google翻译是可以帮助我们翻译英文的弱人工智能等等。这些弱人工智能算法不断地加强创新,每一个弱人工智能的创新,都是迈向强人工智能和超人工智能的进步。正如人工智能科学家AaronSaenz所说,现在的弱人工智能就像地球早期软泥中的氨基酸,可能突然之间就形成了生命。如世界发展的规律看来,超人工智能也是未来可期的!
人工智能的12个典型案例
但以亚马逊的推荐系统为例,它是一个交易性人工智能平台的强大引擎。人们可能已经观察到它的能力,这个系统可以不断学习。本质上,大批购物者正在“教导”亚马逊人工智能系统,以便更好地展示可能出售的商品。也就是说,将一件商品与过去展示的另一件商品相匹配将促进销售,可以将半关联的概念联系起来(例如灯架与摄影设备)。
另一方面,这种高端的人工智能系统需要庞大的计算平台来处理所有这些数据。对于使用小型服务器的用户来说很难为此类系统提供支持。显然,亚马逊网络服务公司拥有世界领先的计算平台。
3.Pandora
对于那些认为人工智能将会取代人类工作的人们来说,Pandora人工智能系统就是一个与人类合作的例子。首先,Pandora通过音乐专业人员的帮助来分析和分类歌曲。Pandora着眼于歌曲的450种属性进行分类,从声乐风格到节奏感。
当其人工智能算法工作时,根据大量用户对其歌曲库的响应,结合了来自用户的大量推荐。然后,人工智能系统可以批量分组和呈现对于用户具有意义的歌曲。
4.Cogito
这无疑是人工智能最活跃的领域之一:在销售和客服电话中使用人工智能,可以增强与客户的情感联系。具体地说,使用人工智能互动比人类更具移情能力。当然,这是人工智能使用的一个前沿。
Cogito(拉丁语的意思是“自我意识”)使用了人类互动的关键真理:它不仅仅是词语的表达意义,而且是词语的表达方式、情绪、节奏和感觉。
Cogito软件可以实时分析对话,提供有关正确和错误的线索和提示。也许对话者可能切入太多主题,或者反应不够快。应用程序提供基于颜色的警告和更新。该软件可以分析数百条线索,以确定对话的情感质量。
5.Nest
推动人工智能增长的关键因素之一是资金雄厚的厂商之间的竞争,希望在早期获得市场份额。以谷歌公司旗下的家用恒温器Nest为例,其部分目标是将谷歌公司的人工智能构建到设备中,用来应对苹果Siri和亚马逊Alexa的不断增长。
Nest使用人工智能来适应人类的行为模式,获得恒定的输入线索,并在家中工作时做出更准确的反应。在业主设置系统一段时间之后,Nest可以自己整合输入。
无论如何,智能家庭设备(物联网设备)无疑是争夺人工智能市场支配地位的关键战场。让一整组智能家庭设备协同行动,它们可以响应家庭成员的指令,并根据其行为学习,这显然是人工智能在家庭应用中的未来。
6.Boxever
总部位于爱尔兰的Boxever公司推出其Boxever“个性化平台”,其主要目标是旅游业。其基于云计算的平台允许旅游公司创建一个单一的客户视图,从而为客户提供更有效的营销。它的目标是通过单独针对客户来改进销售过程。如果人工智能可以在一对一的基础上定制交互过程,理论上它可以更有效地服务(并销售给)客户。
Boxever公司的方法承认竞争的关键部门是客户体验。如果零售商更加谨慎地满足客户的需求,将会在电子商务竞争中获胜。而使用智能软件比人工销售代表的成本要低得多。
7.AIRobotics、Humanoid和其他
人工智能为机器人的应用提供动力,其中包括加州大学伯克利分校的BRETT和麻省理工学院的MITdog。Sophia就是一个受到媒体热捧的人工智能机器人的例子,它和NBC电视台主持人JimmyFallon在“今夜秀”上聊天和唱歌。
除了流行文化的喧嚣之外,还有各种规格和大小的人工智能机器人。例如iRobot公司的RoomBA980吸尘器采用了人工智能技术,可以在家中完成各种清扫工作。该公司声称,Roombas公司已售出1000多万台RoomBA980吸尘器。
8.垃圾邮件过滤器
人工智能的核心就是学习。而使用机器学习和其他人工智能技术,软件系统将变得更智能,无需人工协助。
当然,采用人工智能防止垃圾邮件是一个迫切需要机器学习的领域。工作人员(甚至是团队)难以跟上垃圾邮件的增长。例如,Gmail会部署机器学习算法来过滤(大部分)垃圾邮件。
为此,垃圾邮件过滤器试图更快地跟上垃圾邮件发送者的工作,他们不断采用创造性的方法来欺骗收件人。垃圾邮件过滤器中的人工智能会持续扫描元数据,例如发件人的位置或主题行中的关键字。如果无法学习,垃圾邮件过滤器将在几天之后无法运行。
人工智能技术是使用来自人类的输入:因为对于一个用户具有价值的优惠券对于另一个用户来说则是垃圾邮件。特定用户如何对邮件流进行分类必须是垃圾邮件过滤器学习的一部分。
9.网上银行业务
银行为用户提供方便的优惠:扫描其支票并将其金额存入移动设备中,无需去实际的分支机构存款。其问题是:这样做需要机器来阅读用户的签名,这是一项既混乱又令人困惑的工作——甚至对工作人员来说也是如此。
在其他供应商中,MitekSystems公司采用专门从事基于软件的身份验证。其人工智能技术利用计算机视觉和机器学习使移动到银行的交易安全。
例如,Mitek公司采用视觉算法对银行交易中的无数ID格式进行分类。其核心是光学字符识别(OCR)软件,它扫描文档并将数据转换为可编辑的格式。可以使用人工智能调整OCR软件以准确提取个人签名或指纹。
10.贷款和信用卡处理
当消费者申请信用卡或贷款时,消费者信用评分(FICO)(通常在300到850分之间)将起到至关重要的作用。在过去,贷款工作人员审查了这些贷款和信用卡申请。虽然仍有很多工作人员,但许多关于信用卡的决定或者是否接受消费者的申请,都是由机器学习系统做出的。
同样,学习是这个过程的核心部分。银行管理人员可以设置他们希望当前信贷标准是宽松还是紧缩的参数。但他们希望银行的机器学习系统能够随着时间的推移而学习,以便更密切地确定哪些申请人是安全的借贷者。
11.Lyft和Uber
没有人工智能和机器学习技术,共享单车是不可能存在的。具体来说,票价、预计到达时间以及它将要走的路线:这些都是人工智能计算出来的。
人工智能即时进行大量计算。如果没有一个分析情况的机器学习系统,然后将结果数据路由到用户和驱动程序的应用程序,这些计算的数量和复杂性将是不可能的。当然,Lyft和Uber公司将其记录在自己的系统上,这两家公司拥有关于用户模式的大量数据。
在未来,这些服务预计将出现无人驾驶汽车的时代(尽管这种情况发生时最多仍然模糊不清)。如果没有人类驱动程序的元素,运行系统的过程将成为更纯粹的逻辑机器学习计算。从理论上说,这将导致共享乘车服务的成本下降,甚至可以节省雇佣驾驶员的成本。
12.社交网络
主要的社交媒体网络是人工智能发展的核心驱动力。特别是Facebook公司似乎采用了人工智能的各方面功能。例如,其算法定义了用户的时间轴,决定是否在其时间轴上显示或不显示其朋友的某些帖子。Facebook公司知道,如果某个用户的每位朋友都被展示出来,那么时间表就将变得很混乱,以至于它会让人感到厌烦。因此,时间轴算法可以了解用户与谁进行交互以及其通常忽略的对象。
对于Facebook而言,最重要的是,社交网络使用人工智能来帮助个性化为用户提供广告的方式,因此它具有一定程度的广告显示相关性。需要注意,Facebook允许用户评论广告与时间线的相关性;每个用户评论都有助于系统学习并变得更精细。由于他们使用人工智能微调显示系统的方式,Facebook和谷歌在整个网络广告市场的比例非常高。
此外,Facebook使用图像识别人工智能技术来识别照片中的人脸,因此它可以邀请用户为其添加标签。毫不奇怪,考虑到照片对Facebook的重要性,Facebook在面部识别技术上投入了大量资金。采用机器“读取”照片是当今人工智能时代最为显著的进步之一。返回搜狐,查看更多
人工智能(AI)的三大流派
原标题:人工智能(AI)的三大流派OFweek机器人网讯:人工智能(AI)是最近非常火的一个领域,很多公司都想趁着这个机会绑上AI的概念火一把。于是在业界也经常会听到各种各样AI相关的术语,比如:智能机器(smartmachine),机器智能(machineintelligence),机器学习(machinelearning),深度学习(deeplearning)等等。
为了更好地理解这些术语,需要了解当前AI领域落地的三大流派,这三大流派被Numenta公司总结得很好了,我理解和归纳如下:
1.经典人工智能
这类人工智能的落地方案是通过积累大量的领域知识来让机器变聪明。计算机利用领域专家总结提供的规则(也就是“专家系统”)来解决某个具体的问题。比如通过向病人询问一系列的问题来做疾病诊断就是属于这一类。
经典人工智能一般都只能解决某类非常的具体问题,其中对专家知识库的精妙构造是主要门槛,不足地方主要有两点:一是需要清楚要解决的问题能怎么解决,二是系统不能“自主学习”。IBM的Watson在本质上也属于这一类。
2.简单神经网络
简单神经网络相比经典人工智能方法更加优越,它可以从(文字、图像、音频、视频)数据中学习,不依赖于专家提供任何的“专家知识”,所以极大地拓展了其应用领域。现在流行的深度学习框架多是基于简单神经网络的实现,这里的深度学习其实是更广义的机器学习的一部分。
深度学习通过海量标记数据(labeleddata)的训练,已经成功应用在了图像识别,文字翻译,垃圾邮件处理等领域。回到本质上,简单神经网络依然是一个(高级)数学方法,其弱点就是不适用于小数据训练集场景,另外也不适用于数据规律经常变化的场景。Google的TensorFlow就是深度学习的一个框架。
3.生物神经网络
前面说的经典人工智能和简单神经网络在生物神经面前都算不上真正意义上的机器智能,生物神经网络的基础是SDR(SparsedistributedRepresentation),SDR对神经元的模拟与深度学习对神经元的模拟是完全不同的。
比如HTM(HierarchicalTemporalMemory)就是生物神经网络的一个实现,这种神经网络拥有抽象泛化和想象的能力,它的优势在于能够从无标记数据中学习,不依赖于海量数据训练集,这极有可能扩大了生物神经网络的应用场景,因为现实中很多待解决的长尾问题都是无标记数据和小数量级的。比如Vicarious公司当年通过小数据集破解Captcha就是一个很好的例子。返回搜狐,查看更多
责任编辑: