读《人工智能狂潮——机器人会超越人类吗》笔记
松尾丰,作者简介:东京大学院工学系研究科副教授,1997年毕业于东京大学工学部电子信息工学科。2002年完成了该大学的博士课程,成为工程博士。同年任产业技术综合研究所研究员。2005年起任斯坦福大学客座研究员。2007起至今任工学系研究科副教授,兼任新加坡国立大学客座副教授。专业领域为人工智能、网络信息挖掘、大数据分析。日本人工智能专家之一,曾获人工智能学会颁发“论文奖”(2002年)、“创立20周年纪念事业奖”(2006年)、“现场创新奖”(2011年)、“功劳奖”(2013年)等奖项。先后在人工智能学会任多职;2012年起任编辑委员长、理事;2014年任伦理委员长。编著有《大智能时代套装》(机器人的未来、机器人新时代、机器人革命、数字法则、大智能时代)。
书中对人工智能的三次人工智能的浪潮进行阐述,对三次人工智能浪潮的主要技术进行了介绍,还有各大科技公司面对人工智能浪潮采取的应对措施。当第三次人工智能浪潮来临时,我们的生活会变成什么样,如果都想人工智能专家想像中的那样,90%的事情都可以交给带有人工智能机器去完成,那我们人类剩余出来的时间又该做什么?以及针对人工智能是否会有情感,带有情感的人工智能是否意味着人类的灭亡,作者都进行了详细的分析。
首先我们要摆平我们的心态:人工智能并未实现,但是没理由不实现!探索人类智能的原理,并通过工程学的方法对其进行实现和利用,这样的人工智能还没有实现。人类对于物理世界的研究从微观的原子到浩瀚的宇宙都有的较为本质上的认识,大型的强子碰撞机,宇宙飞船都是对物理世界认识的产物。然而,人类的大脑能力深奥无比、遥不可及,科学家对其探索的脚步从未停止,然而利用计算机对其进行的模型也未能实现。
人工智能是什么?一下是专家给出的定义;
1.人工智能是“采用人工方法制作的、具有智能的实体,或者是以创造智能为目的的、对智能本身进项研究的领域”。
2.把类似我们很自然地接触宠物或者其他人的那种充满感情和幽默的相互作用,在与物理定律无关或者相逆的条件下,用人工方法制造出来的系统,定义为“人工智能”,这种系统采用的不是分析性的理解方法,而是通过对话等交流方式进行的交谈性理解。这就是人工智能。
3.以模仿、支持、超越人类的智能行为为目的的建构性(通过制作来进行理解)系统。与建构性对应的词是分析性,举个例子,从事体育运动的是运动员从事的是建构性理解,而体育评论家则是分析性理解。
4.采用人工方法制造的类人智能,以及其制造技术,类人指的是具有“发现和察觉功能”的计算机,即能够从数据中生成特征量。
对于我们非人工智能研究着而言,人工智能分为四个级别:
1.把单纯的控制程序称作“人工智能”,比如:空调,全自动洗衣机等;
2.传统人工智能(引入了推理及搜索,或者知识库),比如可以下棋的程序,智力问题求解等;
3.引入机器学习的人工智能,机器学习以样本数据为基础、对规则和知识的自学习;
·4.引入深度学习的人工智能,能够对机器学习时的数据表示所用变量(特征量)本身进行学习的人工智能。
强人工智能:具备正确的输入与输出、被施与合理程序化的计算机,与拥有心智的人是没有任何区别的,即它也是有心智的。
弱人工智能:计算机没有必要拥有心智,只要能够通过其有限的智能解决一些智力问题即可。
第一次人工智能浪潮:
时间:20世纪50年代------20世纪60年代
概括:第一次人工智能浪潮是推理和搜索的时代
代表事件:
1.用搜索树搜索迷宫
方法:搜索树
宽度优先搜索,能够找到距离目标最短的路径,但是需要的存储量大;
深度优先搜索,需要的存储量小,但是搜索时间不定,可能会很小,也可能会很大;
2.梵塔问题
方法:搜索树
3.机器人行动过程规划
方法:搜索树
4.博弈(棋类游戏)
棋类游戏的组合是非常大的,对目前的计算机来说,如果采用直接搜索的方法无疑是很难满足需求的。那现在的计算机可以战胜人类的秘诀又是在哪里呢?
1.能够发现更好的特征量
2.“蒙特卡洛法”改变评估机制
第二次人工智能浪潮:
时间:20世纪80年代------1995年左右
概括:第一次人工智能浪潮是知识(“专家系统”)的时代
“专家系统”本身是一种程序,通过引入某个专业领域的知识,在经过推理,计算机便能够像该领域的专家一样出色地开展工作。
什么是“知识表示”?
对于我们每个人都熟知的知识,怎样表达才能让计算机易于处理?在这方面的基础性研究,被称为“知识表示”研究。
本体研究?
“本体“相当于撰写知识时的规格说明书。本体研究分为“重量级本体”和“轻量级本体”两个派别,重量级本体的支持者认为研究者需要认真考虑该怎么描述知识,并研究为此应该怎么做;轻量级本体的支持者认为,把数据输进计算机里面,并让计算机自己寻找概念之间的相关性。轻量级本体的一个极致例子就是由IBM开发的“沃森”。
作者在此提到了“机器翻译”、“框架问题”和“符号接地问题”三个问题。利用导入知识的人工智能进行机器翻译,但是导入知识的机器翻译尽管可以较好地理解语言的语法,但是,精确地从语法分析往往会产生语义上的歧义,而语义的理解正是机器翻译的难点所在。“框架问题”,就是在执行某项任务时“仅仅提取出与它相关的知识并对其加以运用”,这对人类来讲很简单,但是对机器来说非常困难。“符号问题”,是否能将符号(词句、语言)与它表示的意义连接起来的问题,计算机以为不懂得符号的意义,所以不能把符号与其所表示的意义结合起来。
第三次人工智能浪潮:
时间:2000年以后至今
概括:第一次人工智能浪潮是机器学习与特征表示学习的时代
什么是机器学习?机器学习指人工智能程序自身进行自身学习的机理。那怎样才算是学到东西呢?学习的主要工作是进行“区分”,对某一事物进行判断和识别,就可以理解它,还能根据对该事物的判断而采取相应的行动。机器学习分为“有监督学习”和“无监督学习”,有监督学习,指的是事先需要准备好输入与正确输出想配套的训练数据,让计算机进行学习,以便当它被输入某个数据时能够得到正确的输出;无监督学习,指仅提供输入用数据、需要计算机自己找出数据内在结构的场合,目的是让计算机从数据中抽取出其中所包含的模式及规则。
常用的五种“分类”方法:
1.最近邻分类算法
2.朴素贝叶斯算法
3.决策树
4.支持向量机
5.人工神经网络
机器学习的难点(弱点)是特征工程,即特征量的设计。计算机并不能做出选取特征量的判断。提高机器学习的精确度的关键在于“输入何种特征量”,然而这只有靠人用大脑思维来解决。到目前为止人工智能之所以尚未实现,就是因为人工智能在“从这个世界里面应该关注何种特征并提取信息”这点上,还必须借助人的力量。如果计算机能够从被导入的数据里面找出应该关注的特征,并得到表示这种特征程度的特征量,那么机器学习的“特征量设计”问题也将被解决。深度学习,恰好可以解决这个问题。
深度学习
深度学习以数据为基础,由计算机自动生成特征量,它不需要由人来设计特征量,而是由计算机自动获取高层特征量。
自动编码器:输入与输出相同
深度学习与之前的机器学习相比有两个较大的不同点:一是需要一层一层地逐层学习;二是深度学习使用一种被称为“自动编码器”的“信息压缩器”。自动编码器所执行的处理与众不同,它将“输出”和“输入”做成相同的数据,与“主成分分析”具有同样的工作原理,但是自动编码可以进行“深层”即多层次操作,可以提取出主成分分析无法提取出的高层特征量。下图为深度学习结构,
从数据里面找出并生成概念,本身是不需要“教师数据”的无监督学习,深度学习在进行无监督学习的时候采用的是有监督学习的方法。自动编码器,在本来应该有教师提供正解的地方输入原来的数据,以此对输入数据本身进行预测,再生成各种各样的特征量,这就是通过有监督学习的方式进行无监督学习。Google的“猫脸识别”研究,处理1000万张图像,使用的神经元之间的链接超过100亿个的巨型神经网络,用1000台计算机(16000个处理器)连续运行3天,就是通过“采用有监督的学习方法实现无监督学习”生成特征量,即提取出“猫脸”的概念,此时,再赋予“猫脸”的名称,即完成了符号(名称和概念的结合)接地的问题,在最后区分的时候采用有监督的学习的分类方法。
深度学习的关键------“鲁棒性”
实际上,提取特征量或者概念需要相当长时间的“打造和提炼”过程,只有这样,才能使所获取的特征量或者概念具有鲁棒性(“健壮性”)。如何做到深度神经网络的“鲁棒性”呢?其实是需要在输入型号里面加入“噪声”,通过反复加入噪声后获取的概念,就不会因为一点风吹草动就摇摆不定。(听起来有些矛盾,但又何尝不是这样呢)。鲁邦性的提高与计算机的处理性能有较大的关系。
增加鲁棒性的方法
1.加入噪声制作“略微不同的过去”的做法;
2.dropout方法,让神经网络的一部分神经元停止工作,即让隐层50%的神经元出现任意性缺损。对特征项目进行最优化处理,以便让某个特征量能够覆盖其他特征量,这样,特征表示就不会出现过度依赖某一个特征量的情况。过度依赖仅有的某一特征量是非常危险的,让一部分特征量不能使用,对于发现恰当的特征表示是很有帮助的。
除此之外,还有很多专家在研究各种各样的针对神经网络鲁棒性的方法,因为如果不使劲“折磨”它,就无法获取存在于数据背后的“本质特征量”。
深度学习之后的技术发展
1.能够对图像特征进行抽象化处理的人工智能,能够实现多模态抽象化的人工智能,图像处理相当于人类的视觉,还有听觉、触觉等信息待处理;
2.能够对行动与结果进行抽象化的人工智能,目前人工智能还是停留在对外界事物进行观察的地步,如何与外界进行交互也是未来的研究方向;
3.能够通过行动获取特征量的人工智能,通过与外界的交互作用获取新的特征量,类似于,人们根据多次的实验突然间意识到的某个特征量或者窍门,下次遇到同样的事情就会想到这个窍门;
4.能够进行语言理解和自动翻译的人工智能,解决符号落地问题;
5.能够获取知识的人工智能,使人工智能具有想像力;
讨论了人工智能的技术问题以及未来的发展,就得说说人工智能的社会性问题了。
人工智能是否具有本能?
人工智能是否具有创造力?
人工智能的社会性意义?人类具有群居性的动物,那人工之能呢?
奇点会发生吗?奇点,指的是人工智能能够自动地制造出超越自身能力的人工智能的那个时点。
如果人工智能妄想征服分类,有哪些方式?
对于这些问题作者也进行了论述,总结一句话,人工智能必须造福于人类。
人工智能在对人类生产生活的影响:
1.广告、图像诊断、网络企业;
2.个人机器人、安全防范、大数据运用企业;
3.汽车制造、交通、物流、农业;
4.家政、医疗护理、接待及呼叫中心;
5.翻译及全球化;
6.教学、秘书、白领工作辅助;
人工智能的历史、现状和未来
如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇,就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见,在这场关乎前途命运的大赛场上,我们必须抢抓机遇、奋起直追、力争超越。
概念与历程
了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。
人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。
人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:
一是起步发展期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
二是反思发展期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。
三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
五是稳步发展期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。
六是蓬勃发展期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。
现状与影响
对于人工智能的发展现状,社会上存在一些“炒作”。比如说,认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶,等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此,制定人工智能发展的战略、方针和政策,首先要准确把握人工智能技术和产业发展的现状。
专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定任务(比如下围棋)的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,人工智能系统诊断皮肤癌达到专业医生水平。
通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著,但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。
人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”,微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出,2016年全球人工智能研发投入超300亿美元并处于高速增长阶段;全球知名风投调研机构CBInsights报告显示,2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。
创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史,就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如,传统信息产业代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能相关产业的制高点。
人工智能的社会影响日益凸显。一方面,人工智能作为新一轮科技革命和产业变革的核心力量,正在推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来,需要抓紧提供解决方案。
趋势与展望
经过60多年的发展,人工智能在算法、算力(计算能力)和算料(数据)等“三算”方面取得了重要突破,正处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来,人工智能发展将会出现怎样的趋势与特征呢?
从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的重大挑战。2016年10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室,众多感知、学习、推理、自然语言理解等方面的科学家参与其中。
从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中,人机混合智能都是重要的研发方向。
从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习,但是深度学习的局限是需要大量人工干预,比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等,非常费时费力。因此,科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低人员成本。
人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。
人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来10年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,可在现有基础上将劳动生产率提高40%;到2035年,美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测,到2030年,约70%的公司将采用至少一种形式的人工智能,人工智能新增经济规模将达到13万亿美元。
人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出,未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。
人工智能领域的国际竞争将日益激烈。当前,人工智能领域的国际竞赛已经拉开帷幕,并且将日趋白热化。2018年4月,欧盟委员会计划2018—2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。
人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展,使其发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,制定完善人工智能法律法规,规避可能的风险。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构,旨在“以有利于整个人类的方式促进和发展友好的人工智能”。
态势与思考
当前,我国人工智能发展的总体态势良好。但是我们也要清醒看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。
高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月,国务院发布《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。
态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成为全球人工智能投融资规模最大的国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果,我国在人工智能领域发表的论文数量已居世界第一。近两年,中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院,2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说,我国人工智能领域的创新创业、教育科研活动非常活跃。
差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中,中国虽然入选人数名列第二,但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析,制定完善人工智能相关法律法规的进程需要加快。
前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。
当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等,需要深入思考。
树立理性务实的发展理念。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。实现机器在任意现实环境的自主智能和通用智能,仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此,发展人工智能要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。
重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。
构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强。我们要以问题为导向,主攻关键核心技术,加快建立新一代人工智能关键共性技术体系,全面增强人工智能科技创新能力,确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。同时,我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过实施标准加速人工智能驱动经济社会转型升级的进程。
推动共担共享的全球治理。目前看,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中,我国有望成为全球人工智能竞争中的领跑者,应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合“一带一路”建设,让“智能红利”助推共建人类命运共同体。
(作者:中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士)
人工智能会取代人类的艺术创造力吗
中央美术学院2019届硕士毕业生中,有一位叫夏语冰。毕业前夕,夏语冰的画作同其他同学的作品一道,参加了中央美院研究生毕业作品展。
夏语冰的作品,获得了中央美院老师们的高度肯定。该校的邱志杰教授专门为她的作品写下一大段褒扬的评语。另一位教授,受夏语冰作品的启发,还专门为她创作了一段音乐。
6月15日,夏语冰将赴杭州参加跨界艺术展览;7月5日,夏语冰将以画家身份在中央美术学院举办个人作品展。
不过,夏语冰并非现实中的真人。她是微软研发的一款人工智能机器人。这款在微软内部被叫作“小冰”的人工智能机器人,被培养学习绘画已经22个月。从刚开始画得很丑,到慢慢提升,小冰作为一个“画家”成长的过程,就像追求艺术的人类一样,经历了一个漫长、痛苦、艰辛的过程。经过22个月的学习培养,小冰的绘画作品,达到了一定的艺术水准,才被破格批准化名“夏语冰”参加中央美院研究生的毕业画展。
人工智能会取代人类的艺术创造力吗
人工智能机器人“小冰”创作并出版的诗集《阳光失了玻璃窗》。资料图片
在过去两年的人工智能的风潮下,人们除了目睹小冰作的画,欣赏了小冰写的诗,听到了谷歌开发的人工智能机器人Magenta创作的歌曲……艺术,这块传统上被认为是人类智慧金字塔尖的领域也要被AI(人工智能)占领了吗?
1.写诗绘画样样精通
“孤陈的城市在长夜中埋葬/他们记忆着最美丽的皇后/飘零在西落的太阳下/要先做一场梦”,这是机器人小冰写的一首诗。发布于两年前的人工智能“少女诗人”小冰,经过不断的深度“学习”,如今已具备强大的“创作”能力。只需上传一张图片,给几个关键词,小冰就能在10秒内替你创作出诗歌初稿。
在研发过程中,工程师们曾用27个化名,在报刊、豆瓣、贴吧和天涯等多个网络社区的诗歌讨论区中发布小冰的作品,在此过程中,没有人发现作者是个机器人。后来,小冰研发团队从小冰写成的数万余首诗中挑出139首结集出版,取名《阳光失了玻璃窗》。
“少女诗人”小冰“出道”后,引起人们的极大关注和讨论,因为这跟AlphaGo打败柯洁还不一样。下棋本质上就是一个通过海量大数据和超强计算能力求落子最优解的过程,还属于“弱人工智能”范畴,但文艺创作完全是一个创造性的工作,而是否具备创造性思维,一向被视为由“弱人工智能”到“强人工智能”的分水岭。
据微软(亚洲)互联网工程院副院长、微软小冰项目负责人李笛介绍,为了达成写诗技能,小冰学习了1920年以来519位诗人的现代诗,被训练了超过10000次。一开始,小冰写出的诗句毫不通顺,后来慢慢形成“独特的风格、偏好和行文技巧。不过,诗歌界对此并未给出好评。比如,诗人于坚就认为小冰的所谓写作只是个语言游戏,“无论输出多少句子都算不得真诗,因为真诗是有灵性的”。
如果说“诗人”小冰的创作仍是基于对海量文字的统计和计算,那“画家”小冰的模型已开始基于情感计算框架。换句话说,“画家”小冰不仅具有IQ(智商),还开始具有EQ(情商),并且其“创作”开始基于情感激发。这个模型有两个非常鲜明的特点:会大量使用诱发源,不是让机器把一种已有的视觉元素,进行复制、拼接,再转成另外一种风格重新生成,而是要求在诱发源的帮助下,激发人工智能进行新的创作。该模型通过对过往400年艺术史上236位人类画家画作的学习,已能独立完成100%原创的绘画作品。
此前世界上大多数人工智能的开发都是围绕着任务驱动型、知识型的路线来架构。但近些年,各大科技公司越来越重视对人工智能EQ(情商)的开发。除了微软的小冰,亚马逊开始希望Alexa能够有同理心,百度也提出“智能体”的概念,要求人工智能更加有个性,更加有“人设”。人工智能的构建已经从单纯的IQ开始向“IQ+EQ”演变。长此以往,人工智能将不仅具备人类的智慧,或许还将拥有人类的情感。艺术是人类情感符号化的表现形式,当人工智能拥有情感,并且能够依靠情感激发来进行文艺创作,那人类独有的文艺创作能力的确会受到极大的挑战。
2.离人类的水平还有点远
不可否认,无论是专家学者,还是艺术家,大部分人都不认可人工智能机器人写的诗、画的画、作的曲是艺术品。因为艺术被认为是创作者对客观世界的认识,是其主观情感的呈现,而艺术活动更多是一种创造的过程,它充满感性色彩,人类艺术创造最大的特征就是情感化。而人工智能是理性的,它整套艺术生产逻辑基于数据,即便人工智能的文艺创作开始加入情感激发和随机化模块,但创作的内容仍然是从大量作品中提取、分解、组合而成,这种重组方式不能称为情感化的艺术创作。国外也有学者认为,人工智能目前没有可能创造与人类智力相当或者超过人类智力的作品,因为极具个人色彩的创造性活动是无法复制的。
人类对人工智能文艺创作能力的抗拒和排斥,一方面基于主观情感上的“一时难以接受”,因为在人工智能时代,文学艺术可能会是人工智能机器人留给人类的最后一片施展才华的乐园;另一方面,人工智能在文艺方面的“造诣”,尚处在“低幼”阶段,离人类的文艺创作水平还差很远,并且在相当长一段时间内,仍然难以跟人类匹敌。
以小冰的绘画作品为例,乍一看,颇具“艺术色彩”,但仔细观察会发现,那些作品仍然难以摆脱元素堆砌的痕迹。就像“中国的城市化进程”这个主题,小冰所画的内容基本上都在“建筑”“人”“家具”这几个模棱两可的元素上来回重复。而即便是输入“城市”这个关键词,小冰依旧会把城市跟椅子、时钟这类元素联系到一起,画作也不算完整,甚至过于抽象。
目前来看,人工智能对人类艺术的冲击,大部分还是体现在心理层面。在未来相当长一段时间里,人工智能还是很难接替艺术家的创作,即便这些智能机器人创造出一些被人类认可的“艺术品”,那也是基于人的参与设计。人们需要通过了解创作者的人生经历、社会背景、内心情感,才能试图揣测一件艺术作品的深意,而人工智能机器人的“文艺创作”,整体上还难以使其“作品”充满这种感性的色彩。
面对争议以及种种“不看好”,人工智能的开发者们显得有些无奈。“无论是‘少女诗人’小冰,还是‘画家’小冰,从一开始,我们就把它当作一款产品看待,我们从未想过,要让人工智能与人类的顶级艺术家进行PK,以证明谁的水平更高。”微软(亚洲)互联网工程院人工智能创造及商业事业部总经理徐元春坦言,现在人工智能的文艺创作能力,仍存在较大局限性,但他也呼吁人们不要带着“有色眼镜”去看人工智能创作,希望“让子弹飞一会”,多给人工智能一些成长的空间。
3.艺术家不应一味排斥而应加以利用
人工智能对于人类生存现实基础的改变,迫使人们不得不重新思考艺术与现实的关系、作家和艺术家在艺术活动中的地位、艺术存在的意义及其终极走向等一系列问题。正如艺术批评家李心沫所言,当人类的绘画作品和运用人工智能程序绘制的作品,已经很难被人进行区分的今天,我们已经无法对人工智能视而不见,一味地唯我独尊或排斥是没有意义的。
在人工智能与经济社会同频共振的趋势下,艺术世界将会发生巨大改变,并重塑艺术的边界,其未来是否会影响到艺术家的主体性身份?是否原本只有人类可以胜任的艺术工作,将被人工智能所取代?这些问题,只有交给时间来回答。
从积极的角度看,人工智能的迅速发展,虽然给文学艺术的发展带来了空前的挑战,但也带来了前所未有的机遇,人类从现在开始就可以很好地利用人工智能,来丰富自己的文艺创作。李开复在《人工智能》一书中就指出,人工智能时代,程式化的、重复性的、仅依靠记忆与练习就可以掌握的技能将是最没有价值的,几乎一定可以由机器完成。最体现人的综合素质的技能,比如人对于复杂系统的综合分析、决策能力,对于艺术和文化的审美和创造性思维,基于爱、恨等情感与他人互动的能力,则在人工智能时代最有价值,也是最不容易被替代的。
对文艺家而言,人工智能技术可以助其一臂之力,帮助他们提高学习效率,在极短的时间内阅遍人间所有的艺术精华,达到青出于蓝而胜于蓝的效果。人工智能机器人还可以为艺术家锦上添花,分析素材,增强和丰富艺术表现手法,让他们的艺术创作更上一层楼,给人类多彩的文学艺术世界增添更加绚丽的色彩,让文化消费者能体味更为赏心悦目的艺术之美。
比如,小冰的绘画能力所瞄准的落地场景是服装面料的图案设计。李笛介绍,以小冰人工智能框架为基础,微软已经同中国纺织工业联合会以及几家最大的纺织面料企业合作开发了人工智能纺织服装面料图案设计平台。该平台可以不重样设计出1026种服装面料纹样和插画。另外,小冰也参与到了广播电视节目的制作中,截至目前小冰已经为63家电台和电视台生产了2800多小时的节目。
无论是今天的被动输出,还是未来通过持续深度学习实现主动表达,人工智能为人类的文艺创作都提供了多种可能性。尽管对人工智能介入文艺创作褒贬不一,但无论文艺家还是人工智能的开发者,在一点上是有共识的,那就是:艺术家要保存人类的创造力。(光明日报记者韩业庭)