情感交互 ——移动应用产品交互趋势
人与人进行交流时,是通过人脸表情、语音情感、带有感情的肢体动作、文本情感信息等来感知对方的感情。因此情感交互可以从人脸表情交互、语音情感交互、肢体行为情感交互、生理信号情感识别、文本信息情感交互等方面进行探索。另外人与人的交流可以通过表情、语音、眼神、手势等方式进行,而机器没有人脸和躯体,那么仿生代理(lifelikeagent)将是实现情感交互的重要媒介。
1人脸表情交互人脸表情交互是情感交互的一个重要方向,交互模型为:识别人脸表情既而感知人的情感和意图,再生成与之对应的表情与人进行交互。现在对于识别人脸表情既而感知人的情感和意图的技术探究愈发活跃,目前已经有诸多的人脸表情数据库及表情特征提取技术供设计参照。人脸表情的自然生成也在向着智能化的方向发展,将通过社交环境、上下文语境的来智能生成。
表情数据库
表情特征提取
现阶段人脸表情交互在移动应用产品设计中应用举例:
1)“twika^o^”一款由TakutoOnishi开发的iOS应用程序“twika^o^”,可以帮用户把人物面部真实表情转化成“kaomoji”,即文字符号表情。
打开应用,用户可以通过该应用读取自己或是朋友们的照片,或者干脆通过手机直接对着某人的脸咔嚓一张面部特写照,接下来它就能实时转化为有趣的颜文字表情。再通过电邮、推特或者信短信share给朋友们。
2)Avatar卡梅隆用顶尖的CG和3D技术创造了天神下凡似的巨作《Avatar》,顿时红遍全球,英特尔则紧跟时代潮流,与时俱进,研究出“Avatar人脸表情模拟”这一最新技术成果。当用户面对摄像头的时候,可以看到用户的真实头像,通过Vedio算法,可以将人脸表情抽象化,呈现出一个虚拟的头像,当你紧皱眉头的时候,你的虚拟头像也在紧皱眉头,当你微笑的时候,她也在微笑,总之你的喜怒哀乐都可以在虚拟头像上展现的淋漓尽致。这项技术对应的情感交互比如视频聊天的时候,某种时候不太想让对方看到自己的真实长相,可以通过这项技术,更好的保护隐私。联想K800手机应用了这项最新的Avatar技术。
2语音情感交互语音中的情感信息可以影响人们的交流状态。所谓“听话听音”,说话人利用不同情感表达某语句时,听者可能会有不同的反应。语音情感交互就是通过语音情感识别技术对人类的情感进行获取、识别和响应,可以使用户在自然和谐的交互模式下高效地完成任务。
语音情感交互的支撑技术是语音情感识别和情感语音合成。语音情感识别必须以一个高质量的情感语音数据库为基础,获取情感语料,进行情感特征参数的提取。情感语音合成是情感计算与语音合成的交叉课题,目前也取得了一定的研究成果。
现阶段语音情感交互在移动应用产品设计中应用:
1) 信息查询类产品通过语音输入来查询信息的产品如交通票务查询、话费查询等,是语音情感交互应用的重要领域。比如根据用户查询时的情感状态来决策用户服务的优先级做出合适的反应。比如,在票务查询产品中,如果用户的语气非常着急,那么可以适当的提前为其服务。
2) 辅助教学类产品一些朗读类或者表达技巧类的学习产品中可以应用语音情感交互。比如教幼儿说话类的产品可以教儿童如何讲话,甚至可以教他们如何把话讲的自然而富有感情。
3) 电子商务产品利用语音情感交互可以让购物网站摒弃繁琐的用户问卷调查,利用用户语音输入时的情感因素的提示自动调整流量,甚至可以根据用户对不同产品的喜好程度来调整商品的进货比例。
4) 社交、娱乐目前大部分社交产品和娱乐游戏中的人机对话界面采用文本指令输入的方式,这种方式所能传递的信息非常有限,而且操作费时费力。部分产品加入了语音输入功能,但也是淡出的录音传话,无法判断社交对象的情感。如果在这些产品的设计中应用语音情感交互就能构筑更加拟人化的风格和更加逼真的场景,给用户更全面的感官享受。
5) 虚拟人物对话虚拟人物对话如siri等产品已经开始尝试,但尚未加入情感因素。由于大多数情况下是口语化的交流,因此虚拟的人物对话应该根据用户的情感状态来调整产品本身的语音输出,以适应对话环境。
案例:
Emotion 电话本
根据分析通话人之间语音交流的情感信息,来智能将电话簿中的人进行情感化分类:哪些是亲密好友、哪些是较为疏远的关系。结合通话频率可以分析出哪些亲密的好友应该联络了,可以发出提醒,提醒用户注重对好友的联络。
3 肢体行为情感交互姿势运动不仅可以由物理上的时间、空间、加速度等描述,还可以由属于心理学范畴的维度描述。比如从手势的挠头、擦眼、捏鼻子、触唇、托下巴等,能够预测情感状态包括思考、回忆、疲劳、满意等。
肢体行为情感交互是重要的情感非语言交流方式,目前得到了越来越多的研究者的关注,并取得了一定的研究成果,但人的肢体行为在特征提取及情感分类方面仍面临较大困难,需要结合上下文才能获得较为准确的识别结果,且移动终端受本身硬件条件限制,肢体行为的提取本身就存在操作不便。因此目前应用较少。
4生理信号情感识别生理变化由人的自主神经系统和内分泌系统支配,很少受人的主观控制,因而应用生理信号的情感识别更具客观性。生理信号感知情感一般通过皮肤电反应、肌电反应、呼吸信号、心电信号等,需要借助物理设备。虽然生理信号可以客观地反映人的情感状态,但是仅对不同唤醒度的情感具有较好的识别效果,若要进行多种情感的分类,则需要将生理信号同表情、语音等其他通道进行融合,实现多模情感识别。
现阶段生理信号情感识别在移动应用产品设计中应用案例:
HeartFitness
HeartFitness利用iPhone背后的补光灯感应皮下毛细血管的跳动来测心率,同时也能感知用户此时的情绪,非常有意思。
5文本信息中的情感随着互联网的飞速发展,文本信息已经成为人们最常用的交互方法之一。自然语言是人特有的交流手段,其中包含了大量的情感信息。研究文本中蕴含的情感信息已成为人机交互领域的研究热点。
文本情感分析研究可以分为词语的情感分析、句子的情感分析、篇章的情感研究、海量信息的整体情感预测四个维度。
现阶段文本信息情感交互在移动应用产品设计中应用:
1) 电子商务产品通过文本信息情感提取,分析用户在电子商务网站中针对产品、服务的反馈评论,向其他用户推荐受到好评的产品、服务。同时可以帮助商家高效地利用用户的反馈信息
2) 网络搜索产品的个性化检索目前的搜索引擎对互联网信息进行检索时,主要方式是查找与用户提交的查询主题词相关的网页,而在其中加入文本情感分类,则可以个性化展示根据网页内容褒贬性分类这个能力的搜索结果,提升用户体验及搜索结果的信息价值。
3) 网络社区或游戏产品的用户兴趣挖掘根据网络社区中的用户言论,对个体的喜好进行发掘,将有助于整个社会关系网络的分析,具有潜在的应用价值。
案例:
苹果专利,文本消息过滤
这一专利功能可以用来过滤和控制所有基于文本的iPhone通信,比如发出或接收的短信、彩信、电子邮件和即时通讯等。它可以用来防止垃圾广告,或者屏蔽那些你讨厌的词汇。也可以为未成年人创造相应的网络环境,比如父母可以选择相应的年龄模式,一屏蔽不同等级的词汇。
6情感仿生代理在情感交互中,用户可以使用自然的交互方式,如语音、表情、眼神、手势等与机器进行交互。然而,机器没有人脸和躯体,无法用上述方式交流。目前的解决办法是通过仿生代理实现人机的情感交互。仿生代理是完全由计算生成的图形,用来模拟现实世界中真实的人或其他有生命物体的行为和动作。仿生代理具有人脸和躯体,并能通过多种交流方式与人进行信息传递。在基于仿生代理的人机交互中,仿生代理被赋予情感能力。仿生代理能够通过各种传感器获取由人的情感所引起的生理及行为特征信号,从而感知、识别和理解人类情感,针对人类的情感做出智能、灵敏、友好的反应。
现阶段情感仿生代理在移动应用产品设计中应用案例:
双双
是一款社交应用,有一个非常独特的全3D仿生代理”小双”,帮助用户实时沟通、传情达意!“小双”在苹果appstore中是这样被描述的:
拥有双双后,你会发现生活充满了乐趣
“像木头一样的老公居然懂得浪漫和贴心了,常常有惊喜给我”
·贴心提醒:起床、约会、记得想你…爱的提醒就用“闹闹”
·情绪传递:随时唤出小双,让她把你的情绪表演给最亲密的人
·偷偷问:不懂彼此的小心思?匿名打听一下,然后给Ta惊喜
“工作都很忙,闺蜜之间都很少联系,双双提醒我和她们定期保持联络,真好”
·变声趣聊:在聊天时小双能把你们的话变成有趣的声音,各种卖萌,各种欢乐
·永久群组:姐妹淘、球队哥们…在这里建立你和兄弟/闺蜜的小圈子,随身携带
移动设备填充了人们几乎所有的生活时间,人们对于和移动设备进行情感交互的需求也与日俱增,情感交互必定成为移动应用产品交互趋势之一。随着人工智能、情感计算等技术领域的发展,情感交互的技术支撑也日趋完善,情感交互模型将更加多样化,我们在移动应用产品设计中应该逐渐考虑情感因素的影响,设计情感交互,让产品具有活动灵魂。
参考文献[1]毛峡.人机情感交互.科学出版社.2011
来源:百度MUX
人与机器的情感交互
问题概述:随着近年来智能设备的普及,纯粹的命令式操作及其机械性的响应逐渐无法满足自然人机交互的需要,人们开始追求更高层次的人机交互技术。脑电能够在人与外部设备之间建立直连通路,不通过直接的语言和动作向外界传达大脑的思想,使机器像人一样自然地进行“感知”交互。脑电的发展不由地引发了人们的思考,人与人间的交流自然且富有感情,如何使与人交互的机器具有类似的观察、理解和生成情感特征的能力,是待解决的科学问题。人机情感交互使计算机以自然的方式识别用户传达的情绪信息,旨在改善人机交互,使其变得更加自然舒适。随着情感计算等技术的不断发展,情感交互已经成为未来超信息时代人机交互的主要发展趋势。目前情感交互已经成为人工智能领域中的热点方向,国内外众多团队企业已经开始人机情感交互技术的研发工作。情感交互是一个交叉学科,涉及神经系统科学、心理学、计算机科学和语言学等学科。在计算机领域,情感交互也是研究的重点,在该领域情感交互又被称为情感识别、情感计算或自动情绪识别等。为了对情感进行量化的研究,首先需要量化定义人类的基本情感,这些工作在心理学和计算机等领域已经被深入研究[1][2]。在情感交互方式上,早期的情感交互多以单一方式判别用户的情感信息,这些交互方法包括语言[3]、人脸表情[4][5][6]和肢体姿态[7][8][9]等。但是这些基于单一模式的交互方法存在局限性,如应用场景特定、无法充分利用多种语义线索和交互系统性能低等。随着机器学算法的进步、运动采集设备的普及与发展,基于多模式的情感交互方法的优势逐渐显现,一些有代表性的工作如Wollmer等人[10]使用双向长短期记忆网络的方法,从语音和人脸视频两种数据中对用户的情感进行识别;Kahou等人[11]利用递归-卷积神经网络(CNN-RNN)对面部表情进行建模,并采用支持向量机(SVM)的方法处理音频特征,提出了一种基于神经网络的特征融合技术,用于对视频中人物进行情感预测。但是目前基于多模式的人机情感交互方式的研究依然处于起步阶段,相关研究方法和成果较少[12][13]。未来的发展方向是将多模式交互方式与机器学习方法更紧密地结合,并通过互联网众包等方式收集海量数据,以更好地挖掘各种模式与情感之间潜在相关关系。虽然情感交互在研究领域已经取得可喜的成果,但在未来的发展中还面临如下关键问题和挑战:首先,目前人机情感交互的物理交互方式单一,理想的人机情感交互应结合表情、语音、眼神、手势等多种交互方式,并使用具有脸部和躯体的仿生机器人作为情感交互的物理媒介。此外,目前人机情感交互软件较为简单,在未来需要借助更高级的算法完成情感感知与传达。如何调整交互模式来更好地为用户提供服务、如何将用户的反馈与计算机的操作相关联、如何以舒适可靠的方式感知和识别用户传达的情感信息,是人机情感交互软件面临的挑战。最后,目前人机情感交互中信息处理方式多种多样,其中情感表达方式、情感描述方式、情感获取方法和处理流程等均缺乏统—的标准,未来应在物理和软件层面制定统一标准,为情感交互的技术研发和产业发展提供良好的环境。情感交互致力于使机器尝试感知与传递情感信息,给数字世界带来了情感智慧,这将是人机交互领域乃至电子信息领域上一次里程碑式的革新,也将引领多个行业产生革命性进步。在消费和服务领域,具有情感交互功能的新型客服机器未来可能完全取代人工客服;在工业领域,具有情感交互功能的机器人将明显提升生产和工作效率。目前绝大部分设备仍通过纯命令或简单的肢体运动进行交互。情感交互问题的解决可以提供智能舒适的情感交互接口,带来更加人性化的交互体验,这不仅是人机交互领域的一次重大革新,更会极大促进传感器技术、运动捕获技术、人工智能和生产制造等领域的发展。情感交互技术革命式的更新,将为各类产业带来不可估量的经济效益。例如,在服务业中,情感交互技术可以通过智能服务系统为人类提供便捷和精准的服务,如医院及养老院的护理机器人;在广告业和商业中,情感计算机器人通过观测记录人的情感变化、测试人类的兴奋点,来分析人类对某些产品或事物的看法和态度,以推动商业指向性的发展等。同时,情感交互技术对未来社会生活的影响也不容小觑。比如,应用该技术检测驾驶员在行车中的情绪和行为状态,预防疲劳驾驶等危险状况,从而在一定程度上减少交通事故;甚至在医疗领域,对自闭症等病人的情绪进行监测和康复治疗,可以减少社会负担。因此拥有“情商”的智能系统的出现及应用,将为经济发展和社会生活带来更加美好的明天。
人工智能的历史、现状和未来
如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇,就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见,在这场关乎前途命运的大赛场上,我们必须抢抓机遇、奋起直追、力争超越。
概念与历程
了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。
人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。
人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:
一是起步发展期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
二是反思发展期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。
三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
五是稳步发展期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。
六是蓬勃发展期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。
现状与影响
对于人工智能的发展现状,社会上存在一些“炒作”。比如说,认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶,等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此,制定人工智能发展的战略、方针和政策,首先要准确把握人工智能技术和产业发展的现状。
专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定任务(比如下围棋)的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,人工智能系统诊断皮肤癌达到专业医生水平。
通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著,但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。
人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”,微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出,2016年全球人工智能研发投入超300亿美元并处于高速增长阶段;全球知名风投调研机构CBInsights报告显示,2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。
创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史,就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如,传统信息产业代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能相关产业的制高点。
人工智能的社会影响日益凸显。一方面,人工智能作为新一轮科技革命和产业变革的核心力量,正在推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来,需要抓紧提供解决方案。
趋势与展望
经过60多年的发展,人工智能在算法、算力(计算能力)和算料(数据)等“三算”方面取得了重要突破,正处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来,人工智能发展将会出现怎样的趋势与特征呢?
从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的重大挑战。2016年10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室,众多感知、学习、推理、自然语言理解等方面的科学家参与其中。
从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中,人机混合智能都是重要的研发方向。
从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习,但是深度学习的局限是需要大量人工干预,比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等,非常费时费力。因此,科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低人员成本。
人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。
人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来10年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,可在现有基础上将劳动生产率提高40%;到2035年,美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测,到2030年,约70%的公司将采用至少一种形式的人工智能,人工智能新增经济规模将达到13万亿美元。
人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出,未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。
人工智能领域的国际竞争将日益激烈。当前,人工智能领域的国际竞赛已经拉开帷幕,并且将日趋白热化。2018年4月,欧盟委员会计划2018—2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。
人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展,使其发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,制定完善人工智能法律法规,规避可能的风险。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构,旨在“以有利于整个人类的方式促进和发展友好的人工智能”。
态势与思考
当前,我国人工智能发展的总体态势良好。但是我们也要清醒看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。
高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月,国务院发布《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。
态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成为全球人工智能投融资规模最大的国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果,我国在人工智能领域发表的论文数量已居世界第一。近两年,中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院,2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说,我国人工智能领域的创新创业、教育科研活动非常活跃。
差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中,中国虽然入选人数名列第二,但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析,制定完善人工智能相关法律法规的进程需要加快。
前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。
当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等,需要深入思考。
树立理性务实的发展理念。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。实现机器在任意现实环境的自主智能和通用智能,仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此,发展人工智能要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。
重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。
构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强。我们要以问题为导向,主攻关键核心技术,加快建立新一代人工智能关键共性技术体系,全面增强人工智能科技创新能力,确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。同时,我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过实施标准加速人工智能驱动经济社会转型升级的进程。
推动共担共享的全球治理。目前看,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中,我国有望成为全球人工智能竞争中的领跑者,应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合“一带一路”建设,让“智能红利”助推共建人类命运共同体。
(作者:中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士)