一台人工智能(一个人工智能诞生)
导读一个人工智能诞生人工智能的诞生时间是1956年的夏天,地点是美国达特茅斯学院,在这里举办了人类第一次人工智能的研讨会,会议上麦卡锡提出人工智能,并且产生…一个人工智能诞生人工智能的诞生时间是1956年的夏天,地点是美国达特茅斯学院,在这里举办了人类第一次人工智能的研讨会,会议上麦卡锡提出人工智能,并且产生人工智能的逻辑理论机器。之后的人工智能经历了几个发展阶段,其中20世纪50-70年代是黄金时代,之后10年是低谷,稍后又进入到繁荣时代。
一个人工智能诞生于哪一年1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,约翰·麦卡锡(JohnMcCarthy),马文·闵斯基(MarvinMinsky,人工智能与认知学专家),克劳德·香农(ClaudeShannon,信息论的创始人),艾伦·纽厄尔(AllenNewell,计算机科学家),赫伯特·西蒙(HerbertSimon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:“人工智能”,因此,1956年也就成为了人工智能元年。
一个人工智能诞生于多少年超级人工智能出现的时间现在没有人知道,因为超级人工智能指的是虚拟网络世界完全或者几乎代替现实社会,而在我们当今21世纪,人工智能虽然已经得到了快速发展,随着机器学习神经网络的兴起,一系列自然语言处理,翻译,自动驾驶,人工智能客服机器人,人脸识别等虽然已经得到了发展,但是由于科学技术网络的限制和数据的缺乏,超级人工智能的出现还遥遥无期,因此什么时候出现超级人工智能,根据目前的情况,只能说还很遥远。
人工智能诞生于1956年正确的。
达特茅斯会议被广泛认为是人工智能诞生的标志。1956年,在由达特茅斯学院举办的一次会议上,计算机专家约翰·麦卡锡提出了“人工智能”一词。后来,这被人们看作是人工智能正式诞生的标志,从此人工智能走上了快速发展的道路。
人工智能是需要人力、脑力、开发、高等技术与不断的研究和尝试等等一系列超高难度的作业才能完成的科技产品。当然这种研究是得到国家和人们大力支持的发展。它的发展对国际影响力是非常大的。人工智能也可以定义为高仿人类,虽然不可能会像人一样具有灵敏的反应和思考能力,但人工知能是按照人类的思想结构等等的探索而开发的研究。
一个人工智能的诞生软件下载人工智能的诞生(20世纪40~50年代)
1950年:图灵测试
1950年,著名的图灵测试诞生,按照“人工智能之父”艾伦·图灵的定义:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。同一年,图灵还预言会创造出具有真正智能的机器的可能性。
1954年:第一台可编程机器人诞生
1954年美国人乔治·戴沃尔设计了世界上第一台可编程机器人。
1956年:人工智能诞生
1956年夏天,美国达特茅斯学院举行了历史上第一次人工智能研讨会,被认为是人工智能诞生的标志。会上,麦卡锡首次提出了“人工智能”这个概念,纽厄尔和西蒙则展示了编写的逻辑理论机器。
人工智能诞生于一次历史性的聚会提到人工智能,稍对其有所研究的人不会不知道1956年的达特茅斯会议,因为正是这场会议提出了“人工智能”的概念。
1955年的时候,在洛杉矶召开的美国西部计算机联合大会有这样一个小插曲。在会议上塞弗里奇发表了一篇关于模式识别的文章,而纽厄尔则对计算机下棋的事情发表了自己的观点。
两个人发完言后,当时正在研究神经网络的皮茨主持会议时将这个过程总结为:一个企图模拟神经系统,另一个企图模拟心智,方向不同但是殊途同归。这两位发言者也是达特茅斯会议中极其重要的两个人物。
相比于图灵等人,塞弗里奇在人工智能的历史中并没有多大的名头,但他也是人工智能科学的先驱。他是模式识别的奠基人,也是第一个写出可以工作的人工智能程序的人。
后来塞弗里奇又到麻省理工学院参与并领导了MAC项目,这个项目就是现在著名的MITCSAIL,其中文名称是“麻省理工学院计算科学与人工智能实验室”。利用3D打印制造人工心脏的技术就是这个实验室研发出来的。
这下你知道了吧,我们熟知的“人工智能”这一概念就是这么来的。
一个人工智能诞生的标志“人工智能之父”艾伦·图灵。
1、人工智能的诞生(20世纪40~50年代)
1950年:图灵测试
1950年,著名的图灵测试诞生,按照“人工智能之父”艾伦·图灵的定义:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。同一年,图灵还预言会创造出具有真正智能的机器的可能性。
1954年:第一台可编程机器人诞生
1954年美国人乔治·戴沃尔设计了世界上第一台可编程机器人。
1956年:人工智能诞生
1956年夏天,美国达特茅斯学院举行了历史上第一次人工智能研讨会,被认为是人工智能诞生的标志。会上,麦卡锡首次提出了“人工智能”这个概念,纽厄尔和西蒙则展示了编写的逻辑理论机器。
2、人工智能的黄金时代(20世纪50~70年代)
1966年~1972年:首台人工智能机器人Shakey诞生
1966年~1972年期间,美国斯坦福国际研究所研制出机器人Shakey,这是首台采用人工智能的移动机器人。
1966年:世界上第一个聊天机器人ELIZA发布
美国麻省理工学院(MIT)的魏泽鲍姆发布了世界上第一个聊天机器人ELIZA。ELIZA的智能之处在于她能通过脚本理解简单的自然语言,并能产生类似人类的互动。
1968年:计算机鼠标发明
1968年12月9日,美国加州斯坦福研究所的道格·恩格勒巴特发明计算机鼠标,构想出了超文本链接概念,它在几十年后成了现代互联网的根基。
3、人工智能的低谷(20世纪70~80年代)
20世纪70年代初,人工智能遭遇了瓶颈。当时的计算机有限的内存和处理速度不足以解决任何实际的人工智能问题。要求程序对这个世界具有儿童水平的认识,研究者们很快发现这个要求太高了:1970年没人能够做出如此巨大的数据库,也没人知道一个程序怎样才能学到如此丰富的信息。由于缺乏进展,对人工智能提供资助的机构(如英国政府、美国国防部高级研究计划局和美国国家科学委员会)对无方向的人工智能研究逐渐停止了资助。美国国家科学委员会(NRC)在拨款二千万美元后停止资助
一个人工智能的诞生是的,达特茅斯会议被广泛认为是人工智能诞生的标志。
1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,约翰·麦卡锡(JohnMcCarthy)、马文·闵斯基(MarvinMinsky,人工智能与认知学专家)、克劳德·香农(ClaudeShannon,信息论的创始人)、艾伦·纽厄尔(AllenNewell,计算机科学家)、赫伯特·西蒙(HerbertSimon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能。因此,1956年也就成为了人工智能元年。
《一个人工智能的诞生》人工智能技术实际上是一个很大的概念。大到像科幻片里的智能机器人,小到我们经常用到的智能手机的指纹识别,都是人工智能技术的。如果要想知道如今人工智能发展到什么程度了?那必须要先了解人工智能的起源。
起源
早96年代初人工智能技术的概念被提出后,也研究出一下刮目相看的产品,如机器定理证明、跳棋程序等,掀起人工智能发展的高潮。主要的核心就是希望让一台机器能像人一样思考,让计算机能帮助完成人类进行一些决策性问题。
言音上的突破
小米电视推出了全球首款人工智能语音电视小米电视4A,可用于实现关键词搜索,热门排名和开放应用游戏,并非巧合。
图像处理
在不久,每个人都可以使用人工智能来处理图片或复杂的视频。列,SmileVector是一个Twitter机器人,可以产生任何明星照片的微笑。如果您输入面部图像,它可以通过深度学习神经网络生成他们的微笑表达。
自然语言
通过互联网搜索引擎,探索并建立语音信息数据库,并利用云计算,大数据,自然语义分析,机器学习和深度神经网络技术对语音信息进行聚类。
智能语音平台
它指的是语音识别,语义理解,自然语言处理,语音合成和其他解决方案的组合,为开发人员提供具有识别,理解和反馈能力的开放平台技术。该技术可以实现对话服务场景中机器与人之间的自然交互,并有望在未来广泛应用于智能可穿戴设备,智能家居,智能车等众多领域。
情感智能
它指的是使用人工智能来模拟人形情绪反应,如表情,情绪和情绪,从而创建具有情感属性的虚拟图像。未来它将更频繁,更深入地应用于智能机器人和智能虚拟助手领域。
人工智能发起人一、起源
提到人工智能的历史,所有书都会提到1956年度的达特茅斯会议,在这次会上人工智能的鼻祖Johnmcarthy是发起人,minsky也积极参与其中,包括我们课本上非常著名的提出信息论的香农本人。
曾经麦卡锡和明斯基都曾经在贝尔实验室为香农打工,当时他们研究的核心就是图灵机,并将此作为智能活动的理论基础。
后来麦卡锡到IBM打工,遇到了研究神经网络的罗切斯特并得到了洛克菲勒基金会的资助,决定在第二年达特茅斯召开人工智能夏季研讨会,这便是人工智能名字的由来。
从1955年到1965年,人工智能进入快速发展时期,在机器学习领域,出现了“跳棋程序”并在1959年实现了人工智能战胜人类的事件打败了当时设计他的设计师Samuel,并在1962年,打败了州跳棋冠军。
在模式识别领域,1956年Oliverselfridge研发了第一个字符识别程序,并在1963年发明了符号积分程序SAINT,在1967年SAINT的升级版SIN就达到了专家级的水准。
同时美国政府也投入了2000万美元资金作为机器翻译的科研经费。当年参加达特茅斯的专家们纷纷发表言论,不出十年,计算机将成为世界象棋冠军、可以证明数学定理、谱写优美的音乐,并且在2000年就可以超过人类。
二、第一次寒冬
但在1965年人工智能迎来一个小高潮之后,质疑的声音也随之到来,Samuel设计的跳棋程序停留在了战胜周冠军,机器翻译领域因为一直无法突破自然语言理解(NLP),1966年的美国公布了一份名为“语言与机器”的报告全盘否定了机器翻译的可行性。
1969年,发起人之一的minsky发表言论,第一代神经网络(感知机perceptron)并不能学习任何问题,美国政府和美国自然基金会大幅削减了人工智能领域的研究经费。在20世纪70年代人工智能经历了将近10年左右的寒冬时期。
三、第二次高潮与寒冬
直到80年代,人工智能进入第二次发展高潮,卡耐基梅隆大学为日本DEC公司设计的XCON专家规则系统(专注于解决某一限定领域的问题,具备2500条规则,专门用于选配计算机配件,因此避免了常识问题)可以为该公司一年节省数千万美金。
同期日本政府拨款8.5亿美元支持人工智能领域科研工作,主要目标包括能够与人交流、翻译语言、理解图像、像人一样进行推理演绎的机器。
但是随后人们发现,专家系统通用性较差,未与概率论、神经网络进行整合,不具备自学能力,且维护专家系统的规则越来越复杂,且日本政府设定的目标也并未实现,人工智能研究领域再次遭遇了财政苦难,随之人工智能发展进入第二次寒冬。
四、第一次算力与算法爆发
上世纪90年代,计算机在摩尔定律下的计算机算力性能不断突破,英特尔的处理器每18-24个月晶体管体积可以缩小一倍,同样体积上的集成电路密集度增长一倍、同样计算机的处理运算能力可以翻一倍。
1989年,还在贝尔实验室的杨立坤通过CNN实现了人工智能识别手写文字编码数字图像。
1992年,还在苹果任职的李开复利用统计学方法,设计了可支持连续语音识别的Casper语音助理(Siri的前身),在1997年IBM的国际象棋机器人深蓝战胜国际象棋冠军卡斯帕罗夫(不再止步于州冠军,第一次真正意义上的战胜人类),同年两位德国科学家提出了LSTM网络可用于语音识别和手写文字识别的递归神经网络。
五、算力+算法+数据三驾马车聚齐:发展进入快车道
直到2006年,也就是我们身处的这不到20年的时间是当代人工智能快速发展的阶段,同年杰弗里辛顿发表了《learningofmultiplelayersofrepresentation》奠定了当代的神经网络的全新架构。
2007年还在Stanford任教的华裔女科学家李飞飞教授,发起了ImageNet项目,开源了世界上最大的图像识别数据集(超过1400万、2万多标注类别的图像数据集)。
在2006年亚马逊的AWS的云计算平台发布,进一步大幅提升了人工智能网络模型计算所需要的算力。
同时,随着2014年4G时代的到来与智能手机大规模普及,移动互联网的极速发展,催生了覆盖人起居生活工作的方方面面的各色应用,带来了神经网络训练迭代所需的养料“海量的数据”,同时随着IoT物联网的兴起、支持分布式计算(边缘计算)的传感器时序(temporal)数据指数级生成。
六、技术发展离不开政府支持,我国将人工智能列入国家战略
2017年我国政府也引发了《新一代人工智能发展规划》明确了我国新一代人工智能发展的战略目标:到2020年,人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径。
到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为我国产业升级和经济转型的主要动力,智能社会建设取得积极进展;到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
人工智能发展简史–符合事物发展本质-螺旋式上升
回顾人工智能历史发展的60多年间,有上升期、有瓶颈期、有寒冬期,但却一直不断的演进进步,正如恩格斯在《自然辩证法》所说,一切事物都是由螺旋形上升运动是由事物内部矛盾引起的,矛盾双方经过反复斗争,引起对立面的两次否定,两次转化,事物的发展从肯定到否定再到否定之否定,形成一个周期性,每一周期的终点同时又是下一周期的开端。
一个周期接着一个周期,每一周期完成时出现仿佛向出发点的复归,形成由无数“圆圈”衔接起来的无限链条,呈现出螺旋形的上升运动。
而如今的我们,正处在一个人工智能高速发展时代,且已经渗透到人们日常生产、生活、工作的方方面面,大家可能会问,为什么不是10年前、20年前而是现在?
这就不得不提人工智能三要素,分别是:算法、算力和数据,三者缺一不可。而人工智能早期发展的瓶颈,很多都是因为你三要素的一种或者多种要素的缺乏,导致人工智能产业陷入短暂的困境,如下图所示。
而如今,随着4G、5G基础网络通讯设施的快速发展,使万物互联成为可能,全球有天文数字级别的人、设备、传感器被连接,产生海量的数据,而这些数据正是人工智能算法模型迭代的充足养料。
而为什么我国有建设成为人工智能创新中心的底气?因为我们国家在网络基础设施建设方面在全球最为领先,移动互动联网渗透人们生产生活最为彻底,“配送下乡”的电商平台淘宝、拼多多、京东,美团等互联网“买菜”服务下沉到社区,村子里在直播玩短视频的大爷大妈,每个人都不知不觉的在享受着“人工智能”科技发展所带来的红利,同时也被“算法”支配着时间。
困在算法里的外卖小哥、内容平台利用推荐算法向你定向投喂的“猪食内容”、“人脸”信息被滥用,“算法”的偏见与歧视,正如一切事物的两面性一样、技术的发展同时一定会带来负面的影响,引发社会舆论的挑战。
如何更好的保护人们的隐私的同时,让算法更好的为人们服务?如何让人工智能将来不会“觉醒”,失去控制甚至伤害人类?如何让深度学习这个相对黑盒更具可解释性,更安全、更鲁棒?
相信诸位也跟我刚接触这个领域一样带着许多困惑。这些学界和工业界都已经有一些尝试与探讨,我希望在这本书的有限章节中向你尽可能简要但清晰的分享。
七、人工智能的未来在哪?
未来人工智能又将去向何从,会像是科幻电影里人工智能终将觉醒、他们因为不具备”人性”可以更加理智的不会错的进化统治甚至“奴役”人类?
还是由于人类生存活动使地球的生态环境不断恶化,“病毒”不断肆虐,人类无法外出,只能沉陷于由人工智能创造的虚拟环境中,像是”头号玩家”所描述的世界,在虚幻世界中实现”自我”价值?
虽然无法先知,但是可以预见的是,人工智能未来一定会具备以下趋势:
从专家系统转向通用型的认知智能,像是我们上文提到的早期只能针对问题解决问题的某个细分领域的人工智能,未来的人工智能是更加通用型的、在感知能力的基础上具备像人一样具备认知智能,除了分类、归纳、检测、识别具备推演、预测的能力;
深度学习模型从过去的黑盒不可解释,变得更加具备“可解释性”,从而通过算法模型更公平、更安全、更鲁棒;
深度学习向多模态发展,正如人类文明进行学习不仅仅是通过眼睛观看,还有“口眼耳鼻舌身意、色相声香味触法”,因此深度学习需要多传感器的信息融合进行模型学习训练与判断;
由于高级任务的带标签训练数据十分匮乏,这会促使人们进一步研究稀疏数据环境中的学习技术,比如,小样本学习和自我监督学习以及如何提升学习的效率以及如何让学习的进度追赶上数据产生的进度,增量学习也是一个解决当前现状的实用方向。
数据隐私和数据安全引起社会广泛关注,如何保护隐私的前提下同时进行模型训练迭代,联邦学习已经被大多公司和组织广泛使用。
人工智能发展现状及应用
导读:人工智能(ArtificialIntelligence),英文缩写为AI。人工智能被认为是第四次科技革命的核心驱动力,目前许多领域都在探索AI技术的应用,可谓方兴未艾。那么什么是人工智能,它经历了怎样的发展历程,现阶段发展状况如何,它有哪些应用。本篇文章就为大家做个简单分享。同时也会为大家详细介绍一下百度的AI技术体系。
本文主要内容:
1.人工智能概念
①智能
②人工智能
2.人工智能的发展
①人工智能的发展历程
②AI是中国的机遇
3.AI与百度
①百度AI的发展历程
②百度AI的技术体系
③百度AI的场景化应用
1.人工智能概念
1.1智能
谈到人工智能,需要首先理解“智能”一词的具体含义。智能是指人类才具有的一些技能。人在进行各种活动的过程中,从感觉到记忆再到思维产生了智慧,智慧产生了人类本身的行为和语言,行为和语言统称为能力;智慧和能力结合在一起就是人工智能中的智能一词。
比如,人类的语言表达能力就是一种智能(语言智能);人类进行复杂数学运算的能力也是一种智能(数字逻辑智能);人类的交往能力也是一种智能(人际智能),人们对音调、旋律、节奏、音色的感知能力,也是一种智能(音乐智能)。他们都属于智能的范畴。
1.2人工智能
把智能的概念与人的逻辑理解相结合,并应用到机器中,让机器能更好的模拟人的相关职能,这就是人工智能。人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。
人工智能概念,最早可以追溯到上世纪90年代初,这个时候需要提到一位科学家:图灵。
艾伦·麦席森·图灵(英语:AlanMathisonTuring,1912年6月23日—1954年6月7日),英国数学家、逻辑学家,被称为计算机科学之父,人工智能之父。
图灵最早定义了什么是人工智能,怎样去界定一个机器(或一个设备)是否具备智能。他最早提出了图灵测试(即:一个人在不接触对方的情况下,经过某种特殊的方式和对方进行一系列的问答,如果在某些时间之内,他无法根据这些问题判断对方是人还是计算机,那么我们就认为这台机器具备智能化的思维)。直到2000年左右,才真正有计算机通过了图灵测试,才实现了一个突破。在2014年图灵测试大会上,出现了一个通过图灵测试的机器(或者称为智能聊天的机器人)。这两年人工智能的高速发展,也印证了最早的图灵测试,这也让我们反向看到了图灵在人工智能定义方面做出的突出贡献。
现今,在做图灵测试时,判断这个设备是否具备人工智能,更多的还是从模拟人的角度来考量。但在当前科技背景下,人工智能需要涵盖更广的内容,它不仅仅要模拟人本身的职能,还需要具备一些扩展、替代甚至延伸的职能。
举个例子,在医疗领域,需要经常在实验室进行病毒化验,人处这样的实验环境下会比较危险,经常会出现一些事故,如果能够用机器替代人来做这些实验,这些事故就可以避免。此时,这台机器就不仅仅是在模拟人,而是在替代人,机器本身就具备了替代人的能力。
当前,很多人在担忧:人工智能的发展会不会对人类造成威胁。其实,目前人工智能还处于早期的阶段(或者称之为婴幼儿阶段),我们还处于弱人工智能时代。
当然,随着时间的推移,将来我们可能会把弱人工智能时代推进到强人工智能,甚至再往前推进到超人工智能和智能爆炸时代。但至少目前,我们离这样的时代还有非常远的距离,要实现这样的目标,需要非常多的时间积累,可能要通过几代人甚至十几代人的努力。所以大家不要有过多的担心,人工智能现在更多的还是用于服务人类,用来提高人们的工作效率。
上图引自MIT大学一位教授。
针对人工智能所覆盖的领域,这位教授提出一个观点:“我们要尽可能避免做这些容易“进水”的工作,以免被日后所淘汰掉”。
这张图水平面以下的工作,如存储,计算、甚至象棋活动等,已经被海平面淹没。在海平面边缘的工作,如翻译、驾驶、视觉和音频等,很有可能在未来的一段时间,随着技术的进步也会被淹没。再来看图上高海拔地区的工作,如艺术创新、科学研究,文学创作等,让人工智能替代人类去做这些工作,在现阶段是比较困难的。要让人工智能实现像人一样具备主观能动性,还需要比较长的时间。我们在选择工作,或者在做技术探索的时候,应该从更高的层面布局,而把那些可以被人工智能替代的工作交给计算机去做,这样我们就可以从一些重复性、冗余性的工作中抽离出来,去专门从事创造性的工作(比如艺术创作等)。
2.人工智能的发展2.1人工智能的发展历程我们回顾一下人工智能发展的历程。
人工智能并不是特别新鲜的词,在计算机出现后不久,大家就已经开始探索人工智能的发展了。
1943到1956年这段时间,为人工智能的诞生期,期间有很多人尝试用计算机进行智能化的应用,当然此时不能称为人工智能,只是有类似的概念。
人工智能的分水岭是1956年达特茅斯会议,在本次会议上正式提出了AI这个词。
1956到1974年这段时间,是人工智能发展的黄金时代,是人工智能的第1个高速发展期,通常把这段时间称之为人工智能大发现时代。
1974到1980年这6年的时间里,进入了人工智能发展的第1个低谷,在这个低谷期,出现了非常多的问题,比如计算上的问题、存储上的问题、数据量的问题,这些问题限制了人工智能的发展。
1980到1987年这段时间是人工智能的第2个繁荣期。期间诞生了大量的算法,推动了神经网络的高速发展,同时出现了许多专业的科研人员,发表了许多创造性的论文。
1987到1993年这段时间是人工智能的第2个低谷期,期间有个词叫“AI之冬”。有大量的资本从AI领域撤出,整个AI科研遇到了非常大的财政问题,这是导致”AI之冬”的主要原因。
1993年之后,人工智能又进入到高速发展期,期间出现了许多经典案例,比如1997年IBM公司的深蓝案例,2001年IBM的沃森案例,2016年谷歌AlphaGo案例。这些案例是人工智能在应用层面的体现。
上图概括了人工智能的发展历程。
可以看到,从1956年达特茅斯会议AI这个词诞生,一直发展到现在,人工智能共经历了60多年的跌宕起伏,并不是仅在2016、2017这两年间才出现了人工智能这个概念。
从宏观上看,AI的发展历程经历了三次比较大的起伏。
第1次起伏是从1943年到1956年,首次出现了神经网络这个词,把人工智能推到一个高峰,期间出现了许多大发现。而第1次低谷使人工智能进入到了反思的阶段,人们开始探讨人工智能的应用。
第2次起伏是在上世纪80年代,期间BP算法的出现,神经网络新概念的普及,推动了人工智能又进入第2次高峰和发展。然而从1987年到1993年又进入到了了第2次低谷,这主要因为一些财政原因导致。
第3次起伏从2006年开始,由辛顿提出了深度学习的概念,把神经网络往前推动了一大步,也把人工智能推到了高速发展阶段,尤其是近几年在非结构化领域取得了许多突破(例如在语音与视觉方面),给人工智能进入商业化应用带来许多的基础性技术沉淀。
人工智能为什么会在前面的发展过程里遇到了那么多的坎坷?为什么在最近这几年会进入一个高速发展期?
我们归结了近几年人工智能高速发展的三点原因:
①算力飞跃
人工智能(尤其是深度学习),对底层计算能力的要求非常高。早期的计算受到了极大限制,从CPU发展到了GPU,使得算力几乎能达到几倍甚至十几倍量级的增长。再从GPU到TPU,计算速度能达到15~30倍的增长,使得在算力层面不断取得突破。此外,大量云资源的出现将我们计算的成本压到了最低,我们在处理海量计算的同时,也可以享受比较低的成本。再者,芯片技术的发展,使得端处理能力持续提高,这些都帮助我们在算力层面取得了很大的突破。
②数据井喷
从PC互联网时代到移动互联网时代,再到可穿戴设备的应用,都产生了大量的数据。这两年,每年产生的数据量可以达到50%左右的增长。2017年到2018年,这段时间内基本上每个月产生的数据量可以达到几十个亿的量级,数据量已经非常高。物联网的连接,能帮助我们把更多的数据采集回来,帮助我们在数据层面做更多的积累,这是数据井喷带来的积极影响。
③算法突破
近几年来,从机器学习到深度学习,算法不断取得突破。使得我们可以处理更多的大规模、无监督、多层次等复杂业务。
算法、算力、数据是人工智能的三要素,算力是骨骼,数据是血液和食物,算法就是大脑,三者不断取得突破,才能促进人工智能高速发展。
2.3AI是中国的机遇
人工智能技术的发展也促进了很多产业的发展。中国目前有非常好的历史机遇,不仅仅是在技术上有大量的积累,同时,国家也为人工智能的发展提供了非常好的政策环境。此外,市场空间、资金支持、人才储备,也都为人工智能的发展提供了非常好的条件。
通过上图可以看到,人工智能的研发人才目前还比较短缺。图上数据来源于领英在2017年所做的全球AI人才报告。以2017年的数据来看,全球人工智能专业的人才数量超过190万,在这190万人才中,美国处于第一梯队,有85万+;而中国在人工智能领域的人才积累比较少,从数据上来看,目前国内人工智能方面的专业技术人才可能只有5万+,当然这是2017年的数据,现在可能会有一些增长,但是量级也没有达到我们想象的那么大。
所以从国内目前来看,这约5-10万的AI技术人才,对比AI产业的高速发展需求,两者之间有巨大矛盾。那怎样更好的用这些人才作为突破,把人工智能方面的技术人才储备提高到百万级别。这正是整个百度(包括百度的教育合作与共建,包括百度所有对外输出的体系,包括我们今天所做的课程)所努力的方向,我们期望通过百度的技术赋能,真正的帮助人工智能取得更好的人才积累,真正培养一些在未来对人工智能行业有巨大贡献的专业人才,这是百度现在的定位目标。
AI浪潮已然到来,行业人工智能时代已经到来。目前,人工智能已经大量应用在2c和2b领域,怎么让人工智能跟具体行业有更好的接触,产生更多的积累,是我们正在重点探索的方向。
比如百度的搜索引擎,已经融入了很多AI元素。模糊匹配、拍照识图、深度挖掘检索等都应用到了大量的人工智能技术。
再如推荐系统,他会基于个人的一些喜好和历史阅读习惯来给用户做一些内容的推荐和匹配,这是很典型的结合大数据做的精准应用,实际上也属于人工智能的范畴。
再如人脸识别技术、语音技术、智慧交通和无人驾驶等,都是AI技术与行业应用的融合,并且这些技术正在不断取得突破。百度现在L4级别的无人驾驶车已经初步实现了一些小规模的量产,未来会有更多的人将真正的体会到无人驾驶给生活带来的便利。
3.AI与百度3.1百度AI的发展历程
上图为百度在人工智能领域的发展轨迹,早在2009年,百度就开始尝试探索人工智能相关技术,直到2019年,百度用了近十年的时间布局人工智能。
2009年尝试性布局人工智能,2013年发布IDL,2014年成立硅谷实验室以及百度研究院,2015年首次发布DuerOS,2016年发布百度大脑1.0版本,同年,百度的自动驾驶技术进入试运营状态,2017年是百度人工智能技术高速发展的一年,不仅成立了深度学习国家实验室,同时也成立了硅谷第二实验室以及西雅图实验室,并且Apollo平台开始运行并对外推广,在2018年到2019年,DuerOS和Apollo平台发展到3.0版本,百度大脑发展到5.0版本。经过近十年的发展和积累,百度的人工智能技术目前处于相对领先的位置。
百度在人工智能领域领域取得的进展有目共睹,比如,百度成立了首个国家级AI实验室;2016年被美国《财富》杂志评选为深度学习领域四大巨头之一;百度的刷脸支付、强化学习、自动驾驶等技术入选MIT2017年全球十大突破性技术;在AI领域,百度的中国专利申请超过2000项。
3.2百度AI的技术体系
百度的技术体系非常全面,覆盖了计算体系、大数据技术体系以及人工智能技术体系等,在机器学习、深度学习、区块链、知识图谱、自然语言处理、量子计算等领域均有雄厚的技术积累。这些技术可以按内容划分成三个板块,第一是A板块(即AI技术板块),第二是B板块(即大数据板块),第三是C板块(即云计算板块)。这就是百度在2016年提出的ABC概念。从一开始的1.0版本,发展到如今的3.0版本,代表着百度在人工智能领域的整体布局。在人工智能领域的布局中,百度的探索不仅停留在最核心的技术上,也同时将核心技术与更多的领域相结合,如边缘计算、物联网(InternetofThings,IoT)和区块链等,得到了如ABC+区块链、ABC+DuerOS、ABC+Apollo等对外输出模式,向各行各业提供解决方案。
在A板块中,将百度大脑分成了不同的层次。最底层是算法层,包含机器学习和深度学习算法,使用百度的PaddlePaddle深度学习框架提供算法层的基础支撑;算法层之上为感知层,感知层可分为对声音的感知和对光的感知,其中,对声音的感知主要是语音技术板块,对光的感知主要是图像技术、视频技术、AR/VR等技术板块;在感知层之上是认知层,认知层更多的是处理人类听到和看到的内容,对其进行深度理解,深度理解需要自然语言处理(NLP/NLU)、知识图谱等技术作为支撑,同时也需要积累大量用户画像数据,这些技术能帮助人们快速的理解和分析人类听到和看到的内容,并对内容进行有效的反馈,这是认知层面的技术;在认知层之上是平台层,平台层将底层的内容进行融合、封装,对外提供开放、完整的AI技术,并引入大量的生态合作伙伴,共同探讨人工智能产业的布局。
百度人工智能整体技术体系,最底层是深度学习框架飞桨PaddlePaddle,作为底层计算框架,飞桨PaddlePaddle支撑着上层场景化能力与平台中的全部板块。在场景化能力与平台中,包含了诸多场景大板块,每个大板块下又细分为多个技术板块,比如语音板块包含了语音合成以及语音唤醒等技术板块;计算机视觉技术中的OCR技术,包括传统通用OCR识别,以及垂直领域OCR的识别,可以对30多个OCR识别领域进行精准识别,比如票据识别、证件识别以及文字识别等;在人脸/人体识别板块,同时也会引入图像审核以及图像识别方面的技术;在视频板块,有视频比对技术,视频分类和标注技术,以及视频审核技术;在自然语言处理板块,有机器翻译技术;知识图谱板块,有AR/VR技术。这些板块构成了人工智能体系的技术蓝图。
近两年来,人工智能技术在各行各业中的应用不断加深,实践证明,单一的技术在落地时会受到诸多限制,所以现在人工智能在落地时可能不仅仅用到某一个单独的技术板块,而是需要先把这些板块进行融合,然后再进行实际应用,比如在拍照翻译的应用场景下,既需要用到OCR技术,同时也用到NLP技术。因此在实际应用中,需要综合各个板块的技术,把不同的技术体系和技术内容有机地融合起来,再去解决行业中面临的痛点。
3.3百度AI的场景化应用
2014年到2015年期间,在计算机视觉领域的部分场景下,计算机视觉识别准确率已经超过了人眼识别。而利用深度学习技术的计算机听觉识别,在2017年左右也已经超过人耳听力极限。
人工智能业务场景化不仅依赖底层的硬件资源,也需要超大规模的标注数据,这是监督学习的特点,所以在人工智能早期研究中,有评论说“有多少人工就有多少智能”,这句话在特定角度来看是具有一定意义的。在监督学习中,训练模型需要庞大的标注数据,再结合GPU强大的数据处理能力去训练特定模型,也就是从算法的层面去做更多的工作,在训练模型的过程中需要发挥人的主观能动性,更好的解决在行业应用中出现的一些痛点,构建出行业专属的模型。
比如,将人体分析技术应用到实际行业场景中时,需要结合人脸识别技术和人体识别技术。可以通过基础手势识别,识别一个人在开车时有没有系安全带、是不是在打电话等。
利用人体分析技术,可以做到行为识别,首先设定特定区域,然后对区域内的人员行为进行识别,比如人群过密、区域越界、人员逆行、徘徊以及吸烟等,在特定场景下,行为识别能够帮助用户避免安全隐患。
自然语言处理有很多相关技术,比如说词法分析、词向量表示、语义相似度、短文本相似度、情感相似度分析等。这些技术用在不同的应用场景下。
在公检法系统应用中,为了避免出现非常严重的问题,如同案不同判,具体解决方案是当诉讼呈递给法官时,根据当前诉讼内容在公检法系统中寻找历史上类似的案件,参考历史类似案件的判决,给法官提供判案依据。
在媒体领域应用中,对基础的财经类新闻,可以由机器进行新闻文章的编写,即机器写作。这些技术都是基于NLP在相应领域做的智能化应用,可以让编辑或记者从重复性的工作中解脱出来。
人工智能从广义上来看,也包括大数据及云计算相关技术,这些技术也都涵盖在百度AI技术体系中。在大数据领域,主要包括数据采集、数据存储、数据分析以及数据可视化等,利用这些技术,我们在进行模型训练的时候,对数据进行科学的管理可以帮助我们提高模型训练效率。
百度AI技术体系也提供算力层面的支持,通过GPU服务器以及FPGA服务器提供的算力,更好的解决应用层面的问题。
百度AI就是这样一个从基础层,到感知层、认知层的完整体系,为多行业、多场景提供“一站式解决方案”,力求实现“多行业、多场景全面赋能”。
回顾本篇文章,我们和大家分享了人工智能的相关概念,人工智能的发展历程,从中也可以看出AI是我们的历史机遇。同时本文也为大家详细介绍了百度的AI技术体系,经过10余年的努力,百度AI已经形成从基础层,到感知层、认知层的完整技术体系,为多行业、多场景提供“一站式解决方案”,力求实现“多行业、多场景全面赋能”。