AI时代,人与机器的沟通方式
编辑导语:AI,也就是人工智能,随着科技的发展,越来越多的人工智能出现在我们的生活中,比如手机里的对话工具,物流公司、餐馆也出现了工作机器人;本文作者分享了关于AI时代人与机器的沟通方式,我们一起来看一下。
随着度晓晓以虚拟形象在百度世界2020⼤会上的⾸次亮相,引发了人们对人与机器的沟通⽅式的思考。
图1–度晓晓是百度公司推出的⼿机虚拟AI助⼿
度晓晓⽬前具备视觉识别能⼒,⽀持最⾃然的交流⽅式,更接近人与人的沟通过程,那么未来人机沟通⽅式⼜会是怎么样的呢?
为了详细探究人机沟通⽅式的变化和趋势,我们要从最早的人机沟通⽅式说起。
一、人适应机器1.最早的人机沟通方式图灵测试:
问:你会唱歌吗?
答:是的。
问:请再次回答,你会唱歌吗?
答:是的。
你多半会想到,与你对话的是一台机器,因为正常人对再次回答会多多少少显得不耐烦;早在1950年,艾伦·图灵发表了一篇划时代的论文,预言了创造出具有真正智能的机器的可能性。
由于智能这一概念很难确切定义,他提出了著名的图灵测试——如果一台机器能与人类展开对话而不被辨别出其机器身份,那么称这台机器具有智能;可见半个世纪前,人类期望的人机沟通方式就是自然的方式,即人与人对话的方式。
1)第一台语音交互机器
在人与机器沟通的方式方向上,人类做了很多尝试;1952年,贝尔实验室开发的Audrey语音识别系统是其主要标志;Audrey约180cm高,可以识别阿拉伯数字0–9的英文发音,对熟人的准确度高达90%以上。
图2–1952年贝尔实验室开发的Audrey语音识别系统
1962年,IBM发明了第一台可以用语音进行简单数学计算的机器Shoebox;即便如此,人类至今还没有发明出使用人与人的沟通方式的、通过图灵测试的机器。
2018年5月,谷歌Duplex人工智能语音技术也只是部分通过了图灵测试;因此,在半个世纪前,人机无法使用自然的沟通方式的原因是技术的限制;那时候互联网还没有出现,语音识别、自然语言处理技术只是在萌芽阶段。
2)第一个鼠标
正是由于技术的限制,人类只能使用其他的方式与机器沟通。
1968年12月9日,美国斯坦福大学博士道格拉斯·恩格尔巴特展示了世界上第一个鼠标;它的外形是一只小木头盒子,其工作原理是由它底部的小球带动枢轴转动,继而带动变阻器改变阻值来产生位移信号,并将信号传至主机。
总的来说,人类当时可以使用的材料是有限的,技术也只有变阻器等有限的技术;在这个前提下,人类只能适应机器,从而创造了鼠标这种相对体验好的方式与机器沟通。我们称这种沟通方式为“人适应机器”。
图3–世界上第一个鼠标|引用artimachines.com
2.人适应机器的特征1)技术的限制
人适应机器的根本原因是技术的限制,因为机器作为产品的一种形式,它的产生包括三大要素:需求、市场和技术。
技术是产品的核心驱动力;需求是产品落地的基础;市场是产品成长的环境。人类使用技术打造产品,用产品试探市场,满足用户的需求,让新的产品发挥出商业价值。
50年前,技术还没有成熟,即便我们的需求、我们的想象力、我们期望的是用最自然的方式沟通;也只能适应机器,使用键盘、鼠标等来与机器沟通。
图4–需求、市场和技术
2)设计创造更好的体验
设计是沟通的桥梁,连接着用户的需求和技术的能力;虽然有技术的限制,但设计师可以让人适应机器的体验变得更好。
以百度翻译APP的取词翻译为例,直到现在5G还没有完全普及,光学字符识别(OCR)技术在全世界200多语种的表现也达到不了毫秒级的全文精准识别。
面临着网速等技术的限制,设计师采用矩形的取词框与机器沟通,让用户瞄准书本中的单词去翻译;瞄准哪里、翻译哪里的这一行为,既降低了技术实现的难度,也让人适应机器的过程不再这么生硬,让翻译的体验变得更好。
图5–百度翻译APP取词翻译
总的来说,半个世纪前“人适应机器”的沟通方式是必然,不可否认这种沟通方式在下一个革命性技术突破前还会长期存在,但设计可以帮助我们在这过程中创造更好的体验。
二、机器适应人1.机器适应人的时代随着AI时代的来临,加速了5G、面部识别等一系列新技术的进步;虽然还未完全成熟或普及,但是机器主动适应人的条件似乎已经具备,机器开始主动适应人的表达方式和生活方式。
图6–一系列新技术的进步
2.机器适应人的方式对话是人与人之间最自然的沟通方式之一,当技术达到了一定的水平,语音对话逐步进入了大众的视野;该方式不仅提高了信息传递的效率,还帮助用户解放双手和双眼;而且帮助对文字识别有障碍的群体更好的使用产品。
当人们逐步适应了对话作为与机器沟通的方式时,也对沟通舒适度有了更高的憧憬和需求。
1)百度地图APP
借助语音技术,百度语言助手“小度”大幅提升了用户的沟通舒适度,除了对驾车这一用户群体双手的释放之外;当用户说出“小度小度,回家”这样简单的指令时,通过算法和数据的积累,百度地图会根据用户习惯,自动规划出从当前位置回家的最优路线。
甚至当用户每天在特定时间打开百度地图时,会预算出当前时段你是否想去这里?使沟通更加高效。
图7–百度地图APP
2)百度翻译APP
百度翻译APP通过人工智能技术帮助用户打破语言的界限,支持全世界200+语言互译,提升全世界的沟通体验。
图8–百度翻译APP
不仅如此,百度翻译APP还帮助用户解决学习、商务、旅游等不同场景下的语言问题,比如:百度翻译同传通过领先行业的同传技术与服务,大幅降低信息交流成本,驱动企业持续发展。
3)百度翻译同传
图9–百度翻译同传
在2020百度全球人工智能技术大会上,百度翻译同传搭建了大会不同语种之间沟通的桥梁。
同声传译本是一项困难且专业的工作,翻译官除了对语言有深厚的储备,还需要极强的反应能力和应变能力;注意力需要高度集中,对脑力和体力都具有极高等要求。
同传通过搭载百度语言自研的SMLTA声学建模技术,提升识别的准确性;同时,通过对音频信号的加强处理,提升了识别的“鲁棒性(Robustness)”。
在该场景下,百度翻译同传做到了全场景多模态,即时的沉浸式体验——这也进一步体现了机器适应人的沟通方式。
三、人和机器相互适应1.机器更像人的诞生当机器开始逐步适应人,一系列新的问题也被大家所关注,人类到底因该如何与之相处成为了大众所热议的话题。
1992年,雷波特与他人一同创办了波士顿动力;波士顿动力每出一款机器人都及其引人注目,甚至会掀起一阵阵机器人要逆天的伦理性大讨论。
图10–波斯顿机器人引用|BostonDynamics
2015年4月19日,索菲亚被激活。她以女演员奥黛丽·赫本为模型,与以前的各种型号机器人相比,她更具与人类相似外观和行为方式。
她的发明者汉森说:“它的目标就是像任何人类那样,拥有同样的意识、创造性和其他能力。”
图11–索菲亚|引用极客公园
人类从开始对于机器的期望是它能够帮助我们带来意想不到的便利,但随着技术的进步,类似像大白这样具有温度的机器人走进我们的视线,它采用了更具有温度的方式与人沟通。
图12-大白|引用超能陆战队
2.不同场景下的情感沟通由此,伴随着技术的发展不断发酵,关于机器更像人的讨论也越演越烈。
给技术产品赋予人类的性格特征似乎已经成为趋势,被赋予的不同“人格”的机器所引发的话题也不尽相同;比如仿真机器人带来的恐慌,和大白的爆红。
但事实是:即使有了深度学习的加持,现阶段的机器还远没有到达真正“智能体”的标准;既然如此,引发恐慌的究竟机器人的技术,还是它过强“人格”所触犯到的人类的存在感边界?
原因是多方面的——比如从心理学的角度,由于在外形设计的层面,若机器依旧停留在工具的外形纬度,人类下意识本能的判断也就将其归为了工具的类别;从发明的角度,被人类发明的机器/工具,除了本身具备特定的功能之外,还取决于被如何使用或如何定义。
简单来说,同样一把剪刀,可以是工具也可以是凶器——计算机或是智能机器也是同样的道理。
因此,将机器”人格”化的方向,不是赋予机器所谓独立的“人格”;而是让机器拥有更有情感、更人格化的设计,让人类和机器能够产生情感上的沟通交流甚至共鸣,能够更好的相互适应。
1)多样化场景
正如上文提到的,用语音回复的方式,赋予机器情绪和性格只是人类和机器沟通的开始。
现实的情况是:自然语言处理、知识图谱、图像识别、人脸识别等越来越多的细分技术早已被运用到不同产品中,为人类解决不同场景下的问题;只是随着需求的增多,被直接展示的越来越多罢了;由此,在不同产品的使用场景下,我们需要给予其更精准的“人格”定位,营造更恰当的沟通场景。
所以,作为翻译技术赋能的学习类产品;结合产品功能和用户需求,在设立IP形象时,百度翻译APP将其“人格”定位为“智能助手”。
图13–百度翻译APPIP形象DODO
在保留其机器属性的同时,强调陪伴和可依赖的沟通方式‘强化情感温度,塑造区别于其他冰冷机器的愉悦感。
图14–百度翻译APPIP形象DODO
除此之外,顺应不同场景的情感沟通方案,UNIT的个性化定制功能则满足了人类在行为水平层面的多方面诉求。
图15–百度翻译UNIT智能
2)个性化反馈
其实,人与机器沟通边界探索与机器本身情绪的反应、分析模型的准确性是直接关联的;且在现有的技术中,AI对情绪的情感分析还停留在封闭场景中的阶段。
通俗来说,它也许能理解你的表情、语音,但猜不到你表情背后的内心活动到底是什么。
梅罗维茨在《消失的地域》中曾提出“新媒介-新场景-新行为”的关系模型,认为新媒体的应用可能重建大范围的场景和行为,甚至人类的社交角色与规则也随之产生影响;确实,线上线下、虚拟现实的场景重叠,个体人类也已开始追求更具有个性化的细致表达。
例如Emoji,表情包作为信息时代的传播沟通符号,火遍全球;在ios12中,借助人脸识别技术,苹果公司推出了可定制的Memoji。
图16–AppleMemoji|引用JeremyHorwitz
度晓晓的诞生也是如此,基于语音、图像、语言等技术的支持赋能,度晓晓具备答疑解惑、情感陪伴等能力,可以帮用户解决生活中的各种问题;在沟通方式上,度晓晓也不再局限于语音的互动方式,还加入了视频聊天、触碰闲聊等功能。
图17–百度手机虚拟AI助手度晓晓
更重要的是,度晓晓还会随着用户的使用而形成不同的性格,是一个典型的养成型助理;且随着用数据的积累,最终能够实现千人千面的效果,每个人的度晓晓都会因各自主人而不一样。
图18–百度手机虚拟AI助手度晓晓
3.未来至此,关于机器与人类沟通的方式讨论似乎还没有一个确切的答案。
未来的机器到底是否会真实的感情?我们无法论证,但可以肯定随着人工智能时代的到来,机器已经在改变人类的生活,且引发了人类不同的情感需求和反应。
脑机接口技术的爆发,神经形态芯片的日趋成熟;科技的不断进步,似乎为人和机器的沟通方式带来无限的可能;也许未来的某天,机器能够完全使用人类的沟通方式与我们沟通,甚至不被察觉。
那么对你而言,人机沟通方式的边界在哪?未来可能又会诞生哪些技术,为人机沟通带来意想不到的可能?
参考资料:
《百度百科:度晓晓》
《百度百科:图灵测试》
《ABriefHistoryofASR:AutomaticSpeechRecognition》
《鼠标诞生49周年!世界上第一个鼠标就长这样》
《AI与情感》
《未来搜索还能这样玩!养成类虚拟助理“度晓晓”亮相百度世界2020》
作者:周子轩、李俞锋、石静雯
本文由@DuDesign原创发布于人人都是产品经理。未经许可,禁止转载
题图来自unsplash,基于CC0协议
中科院软件所戴国忠:智能时代人机交互的一些思考
从人机交互相关的文章数量来看,从1980年的74篇增长到了2014年的11165篇。其中专注于人机交互的会议有100个,期刊有25个.参与研究的单位包括了国内外的许多知名大学和研究机构,例如MassachusettsInstituteofTechnology、CarnegieMellonUniversity、StanfordUniversity、北京大学、清华大学、Microsoft研究院、Google研究院、中国科学院软件研究所等。
计算机发展的过程,也是人机交互发展的过程。计算机与人的交互方式从无交互到命令语言交互,再发展到现在占据主流的图形交互,已经具有直接操作和“所见即所得”的特点。图形用户界面的产生使得计算机成为人人可以操作的工具,使BillGates“每个人有一台电脑”的理想成为现实。因此,可以说是图形用户界面造就了个人计算机时代的辉煌。
在图形用户界面时代,人机交互系统的研究可以简约看作是模型、范式和开发平台的研究,在近三十年的发展中取得了不菲的成就。但是这些技术的核心思想和方法大都是在20世纪六七十年代提出和发展的。在多媒体、多通道、虚拟现实、移动计算和人工智能迅速发展的智能时代,计算机的处理速度和性能仍然在迅猛地提升。虽然计算机硬件技术已经不是障碍,但是用户使用计算机的交互能力并没有得到相应的提高,其中一个重要原因就是缺少与新交互需求相适应的、高效自然的人机交互界面,缺少成熟统一的能满足当代人机交互需求的交互技术。同时,要完成智能时代对人机交互提出的要求和挑战,一些阻碍当代人机交互发展的理论问题和技术问题需要得到根本性的解决。其中理论问题包括认知模型、分布式认知理论、基于场景上下文的知识表示、人机交互中新的理论模型研究、全球知识经济中的人机交互等,技术问题包括用户界面工具、无处不在的交互式计算、社会半透明的人机交互、人机协同设计的交互技术、支持创新工程的交互技术等。
人机交互核心问题
对一个领域中知识的掌握蕴含着对该领域中历史的理解和认同。通过对人机交互发展历史和研究成果的总结,归纳出人机交互发展的若干核心问题,包括:发展模式、心理学模型、交互界面和研究框架。
心理学模型
研究框架
发展模式
人机交互的新思想理论
人机交互是一个不断变化的领域,这种变化是为了响应技术革新以及满足随之而来的、新用户的需求。从应用场景来看,人机交互从图形用户界面过渡到自然用户界面,发展更人性化的交互界面成为人机交互进一步发展迫在眉睫的任务;从研究层面来看,人机交互从微观上升到宏观,使用计算机技术使个人参与到社会管理活动中的方法成为人机交互关注的重点;从研究重心来看,人机交互从交互导向转移到实践导向,其分析单元由个体交互行为上升到日常的社会实践活动;从研究范围来看,人机交互由人类、计算机的二元空间扩展到人类、计算机和环境组成的三元空间,人类自身所在的环境也成为了人机交互研究重点关注的一部分。
(1)自然用户界面。它是人机交互界面的新兴范式转变。通过研究现实世界环境和情况,利用新兴的技术能力和感知解决方案实现物理和数字对象之间更准确和最优化的交互,从而达到用户界面不可见或者交互的学习过程不可见的目的,其重点关注是传统的人类能力(如触摸、视觉、言语、手写、动作)和更重要、更高层次的过程(如认知、创造力和探索)。
(2)基于现实的交互。它是对新一代人机交互方式的概括,如自然用户界面、虚拟现实技术、增强现实技术、上下文感知计算、手持或移动交互、感知和情感计算、语音交互及多模态界面等。
(3)技术媒介的社会参与。随着互联网技术的迅速发展以及互联网在全球范围内快速普及,越来越多的公众开始接触、熟悉和运用网络平台这一高效沟通工具。他们通过各种表达方式在网络平台上发表对于公共事务及公共话题的意见和建议,从而促使网络成为一种重要的民意表达方式。
(4)实践导向的方法。相比于传统的面向交互的方法,面向实践的方法(practice-orientedapproaches,POA)把视角从交互转移到实践活动上,其分析单元由个体行动转变为人的日常实践,关注点从个人行为或者社会规范上升到日常活动的组织和重组。
(5)人机共生系统。计算机在我们生活的各个方面都发挥越来越大的作用,社会和信息技术在复杂的过程中不断相互渗透和相互影响。在这种情况下,人机共生系统(CHS)由人机交互、以人为中心的计算、通用接入、数字社会与技术等发展而来,并进一步扩展到数字政府、信息隐私、人与机器人交流等概念,其目的是探索潜在的变革和颠覆性的思想,以及基本理论和技术的创新,研究人与计算机之间日益增加的关系,并提出增进人类能力的广泛目标。
智能时代人机交互的思考
1997年,电脑“深蓝”战胜国际象棋冠军。这场“人机大战”是人机竞争的序幕,展现了一个新时代的来临,一个我们称之为“智能时代”的时代。随着深度学习方法成功应用于多个领域,人工智能迎来了第3个发展高潮。在最新的一场的“人机大战”中,Google的人工智能AlphaGo打败了曾获得多项世界冠军的围棋高手李世石,再次揭开人们对“智能革命”的关注。另一方面,可穿戴设备等新的交互设备的出现使得人机交互空间发生了极大变化,与此同时,语音分析、手势识别、运动跟踪、凝视控制等技术不断进步,使用心电图、声音、面部特征等独特个人特征的安全认证技术的发展,都在引导着人机交互技术的发展轨迹和范围。在计算机技术迅速发展之际,人机交互却没有取得应有的成果,因此需要从计算机科学角度,探讨人机交互的发展。
人机交互的新定义
在智能时代背景下,人工智能和传感器技术迅猛发展。新技术的发展对人机交互提出了新的要求,人机交互研究内容从微观到宏观、从交互转向实践、从虚拟转向现实、从心理学层面转到社会学层面。传统的交互定义已经无法满足人机交互发展的需求。因此,从定义上对人机交互进行重新审视显得十分必要。
未来的人机交互,将会演变成“交互人”和“智能机”在物理空间、数字空间及社会空间等不同空间上的交互。这里的“交互人”指的是能和计算机自然交互的人类,“智能机”指的是具有人的意图表达和感知能力的智能计算机。未来人机交互技术的发展,除从各类不同角度上对人机交互的各类因素进行研究外,人作为人机交互的核心,也将随着技术的发展与交互设备融为一体。因此,未来的人机交互将趋同于“感知”,计算机的主要交互行为将变成感知行为、感知自然现象、感知人的现象、感知人类行为,从而实现为人类服务。
从人机交互到人机共生
如果说电脑改变了人们的工作方式,那么目前正以前所未有的方式快速发展的智能手机、可穿戴设备等正在改变人们的生活方式。由于对这些移动设备的依赖,某种程度上人与计算机已经在一定程度上形成了一种“共生”关系。
人机交互发展的总体趋势是持续向着以用户为中心、交互方式更加直观的方向发展。在发展过程中,首先是侧重于交互的人机交互(HCI),然后到以人为中心的计算(HCC),最终走向去中心化的人机共生系统(CHS)。
人机交互与人工智能
随着人工智能的突破性发展,体现出超越人类智力、带动产业变革和深入社会生活的趋势。人工智能迅猛发展的势头给人类社会的进步带来了美好的憧憬,同时也带来了关于人类未来的隐忧,甚至不少著名的专家学者发出人工智能有可能威胁人类自身生存的警告。有些专家则认为,人工智能发展的未来是人机合作。智能时代下的社会是人的智能和人工智能共同创造的,智能社会是人机共生的社会。人工智能能放大人的智能,使人的智能不依赖于自然的进化而得到迅速的发展;人的智能发展人工智能,人工智能的进步依赖于人的智能进步。人的智能和人工智能是彼此互补、相互促进的。
Lighthill报告标志着人工智能的第1次低潮;20世纪80年代末,随着各国政府停止对人工智能的经费资助,人工智能进入第2次低潮。回首历史,人工智能历史发展中的两次低潮,却伴随着人机交互的高速发展。在这一时期出现了包括WIMP范式、图形用户界面在内的很多人机交互的基础理论与实践成果。然而,人机交互与人工智能并非是此消彼长的。人机交互是人工智能的一个研究途径,在人工智能发展遇到瓶颈之时人机交互往往能够提供新的研究思路。而人工智能则给人机交互带来突破,驱动人机交互的发展,并把人机交互提升到一个新的发展空间。
从人工智能的角度看,人机交互是人工智能的一个研究途径。机器学习先驱MichaelJordan提出人工智能最先获得突破的领域是人机对话,更进一步的成果则是能帮人类处理日常事务甚至做出决策的家庭机器人。正是由于人机对话的需求推动了人工智能的发展。
从人机交互的角度看,人工智能为人机交互带来突破。鼠标键盘、触屏等传统的人机交互技术难以使人与计算机实现如同人与人之间那样高效自然的交互,而语音识别、图像分析、手势识别、语义理解、大数据分析等人工智能技术能帮助计算机更好地感知人类意图,完成人类无法完成的任务,驱动着人机交互的发展。
从人类的角度看,人工智能的发展是计算机技术的发展,而计算机技术发展的最终目的是为人类服务。人工智能要为人类服务,就不可避免需要研究人工智能的特性,研究人的特性,以及研究人和人工智能交互过程中遇到的问题,这也正是人机交互所研究的问题。
因此,人工智能和人机交互是相辅相成,相互促进的关系。理性认识人机交互与人工智能的关系,在未来人机交互的发展中将具有指导性意义。
来源:《中国科学:信息科学》
转自:智能巅峰
C2
4月·北京个人会员:返回搜狐,查看更多
人机交互技术,主要分为哪几类
增强现实系统的目标是构建虚实融合的增强世界,使用户能够在现实世界中感受到近乎真实的虚拟物体,并提供人与这一增强的世界交互。在这一过程中,人机交互方式的好坏很大程度上影响了用户的体验。一般来说,传统的交互方式主要有键盘、鼠标、触控设备、麦克风等,近年来还出现了一些更自然的基于语音、触控、眼动、手势和体感的交互方式。1)基于传统的硬件设备的交互技术
鼠标、键盘、手柄等是增强现实系统中常见的交互工具,用户可以通过鼠标或键盘选中图像中的某个点或区域,完成对该点或区域处虚拟物体的缩放、拖拽等操作。这类方法简单易于操作,但需要外部输入设备的支持,不能为用户提供自然的交互体验,降低了增强现实系统的沉没感。
2)基于语音识别的交互技术
语言是人类最直接的沟通交流方式。语言交互信息量大,效率高。因此,语音识别也成为了增强现实系统中重要的人机交互方式之一。近年来,人工智能的发展及计算机处理能力的增强,使得语音识别技术日趋成熟并被广泛应用于智能终端上,其中最具代表性的是苹果公司推出的Siri和微软公司推出的Cortana,它们均支持自然语言输入,通过语音识别获取指令,根据用户需求返回最匹配的结果,实现自然的人机交互,很大程度上提升了用户的工作效率。
3)基于触控的交互技术
基于触控的交互技术是一种以人手为主的输入方式,它较传统的键盘鼠标输入更为人性化。智能移动设备的普及使得基于触控的交互技术发展迅速,同时更容易被用户认可。近年来,基于触控的交互技术从单点触控发展到多点触控,实现了从单一手指点击到多点或多用户的交互的转变,用户可以使用双手进行单点触控,也可以通过识别不同的手势实现单击、双击等操作。
4)基于动作识别的交互技术
基于动作识别的交互技术通过对动作捕获系统获得的关键部位的位置进行计算、处理,分析出用户的动作行为并将其转化为输入指令,实现用户与计算机之间的交互。微软公司的Hololens采用深度摄像头获取用户的手势信息,通过手部追踪技术操作交互界面上的虚拟物体。Meta公司的Meta2与MagicLeap公司的MagicLeapOne同样允许用户使用手势进行交互。这类交互方式不但降低人机交互的成本,而且更符合人类的自然习惯,较传统的交互方式更为自然、直观,是目前人机交互领域关注的热点。
5)基于眼动追踪的交互技术
基于眼动追踪的交互技术通过捕获人眼在注视不同方向时眼部周围的细微变化,分析确定人眼的注视点,并将其转化为电信号发送给计算机,实现人与计算机之间的互动,这一过程中无需手动输入。MagicLeap公司的MagicLeapOne在眼镜内部专门配备了用户追踪眼球动作的传感器,以实现通过跟踪眼睛控制计算机的目的。
1.模式识别应用于哪些领域,模式识别技术的发展趋势http://www.duozhishidai.com/article-15389-1.html2.计算机视觉与图像处理、模式识别和机器学习,之间有什么关系?http://www.duozhishidai.com/article-4119-1.html3.语音的识别过程主要分哪几步,常用的识别方法是什么?http://www.duozhishidai.com/article-1739-1.html
多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站
《研究简报》第147期 人工智能时代的人机交互(上)——人机合作的效率与平等问题
在日新月异的企业数字化浪潮中,大数据、机器学习、人工智能等技术正在不断提升、颠覆各大行业。各大行业可借助算法,改进工作流程,提升工作效率。例如,制造业企业用人工智能替代车间主任去完成机器和工人的调度工作,零售业企业用人工智能辅助店长预测下一个爆品,医院用人工智能为医生推荐诊疗方案。人工智能对劳动力市场的冲击,主要是替代重复性的、基于大量数据分析的任务。而在更复杂的任务中,探索人类决策和算法如何相互结合,利用人工智能技术辅助而不是完全替代人类,是未来人工智能应用中关键的课题。
笔者团队在研究中关注以下问题:人类决策、机器决策和人机合作这三种决策模式在效率上有哪些差异?引入人工智能对劳动力市场的平等性有何影响?本研究得出两点发现:
第一,人类-人工智能合作决策相比于人类决策有非常可观的效率提升。
第二,人工智能辅助可以提升劳动力表现的平等程度,基础表现较差的劳动力可以从人工智能辅助中获得更大的提升。考虑到人工智能完全替代劳动力会带来劳动力市场更大的不平等,“人工智能辅助劳动力”模式是稳定劳动力市场和促进社会公平的优选模式。
一、人工智能的发展趋势是人机合作
目前,人工智能在各行各业的商业应用方兴未艾。现有研究和案例总结得出,在部分应用场景下,人工智能可直接替代人工,而在更多复杂的场景中则以辅助人类决策的形式出现。
现有的实践经验表明,简单任务场景下人工智能直接替代人工可极大提升生产率。例如,零售业企业可以用刷脸支付替代收银员。某零售商的数据显示,一台刷脸支付机器相当于1.5个收银柜台,按早晚班计算,可以减少3个收银员的人力成本,集团每年可节省1344万元。又如,制造业企业可以利用算法替代人工做筹划工作,提升生产效率。管理者可以无死角地实时查看设备和工人的工作状态,并利用算法优化安排工人排班和机器。某重型机械企业听从人工智能的建议,没有增加设备,只是略微增加工人的劳动时间,就实现了两倍的产能提升。
随着人工智能在业界应用的兴起,很多学者开始关注其对劳动力市场的影响。学术研究通过比照真实的人工决策和人工智能决策数据,更为具体地衡量了在不同任务下人工智能与人类决策质量的差距。例如,对比人工智能和法官对被逮捕的犯罪嫌疑人是否可以保释的决策,人工智能可以很大程度上超越人类法官的决策水平,在审前羁押率不变的情况下,让犯罪率下降24.7%。人工智能在心脏病诊疗方面也可以超越医生的判断水平,这主要是因为医生会过分看重人口学特征而不是实际症状,并系统性低估得过肺炎的病人患心脏病的概率。人工智能也同样可以在预测公司营收方面超越研究员。[1]
在更为复杂的、尤其是涉及大量人际交互的场景中,人工智能更多以辅助人类决策的角色出现。例如,在互联网金融中,贷款催收的痛点之一在于单笔额度较低,回款成本较高。借助人工智能技术,互联网金融公司可以依托大数据和机器学习建模,对客户的还款意愿进行分层打分,并提供相应的催收手段和策略。对于还款意愿高的客户,采用提醒版催收话术;对于还款意愿中等的客户,前期使用催收机器人,后期根据催收机器人反馈结果转人工处理;对于还款意愿低的客户,直接转人工处理。据某互联网金融公司统计,通过这一方式,综合回收率可提升5%以上,并且能节省40%的人力成本。又如,以往在线教育的短板之一是教师不能及时观察学生学习反馈、对教学做出调整。而今天,语音识别技术、自适应技术和图像识别技术等人工智能技术都为提升学生学习效果提供了强有力的支持。某在线教育公司还通过收集大量学习行为数据(如观看视频过程中的暂停、拖拽、回放,练习过程中的犹豫时间、看解析等行为),更好地分析学生的学习效果,不断完善教学视频。这些精细提取的学习数据,可能比现场教学分析更加细致,大大节省了教师的精力,可以专心于提升教学内容的质量。在人工智能辅助员工培训方面,有研究表明,在培训员工的三种方式中(人类教练单独培训、人工智能教练单独培训和人类-人工智能教练合作培训),最有效的是人类与人工智能相结合的方式,这主要是因为人类教练可将人工智能总结的内容以更好的沟通方式向员工传达。[2]
本研究集中在探索人工智能辅助人类决策时对效率和公平的影响。
二、人类-人工智能合作决策相比于人类决策有非常可观的效率提升
本研究希望进一步理解引入人工智能辅助人类决策的过程中对劳动力市场效率和平等的影响。研究团队基于某公司的历史现金贷实际数据,研究以下三种情形的贷款审批决策的效果:人类单独决策、人类-人工智能合作决策、人工智能单独决策。在人类决策组,决策者看到贷款者的人脸照片和背景信息,并独立做出贷款决策。在人类-人工智能合作决策组,人工智能为决策者提供贷款者基于人脸照片判定的还款倾向(下称“还款分”[3]),决策者根据贷款者的还款分和其他背景信息,综合做出贷款决策。在人工智能决策组,贷款决策完全由人工智能完成。然后我们用贷款者的真实历史表现衡量贷款决策质量,并分析其中的决策机制。
我们首先分析人工智能以不同形式引入决策对于决策质量的影响。如图1最左侧所示,人类决策组、人类-人工智能合作决策组、人工智能决策组的准确率分别是62.4%、70.6%和84.7%,并在统计上有显著差异。人类-人工智能合作决策组相比于人类决策组,准确率提高了13.3%,提升程度非常可观。
图1人类决策组、人类-人工智能决策组、人工智能决策组对比
决策错误可以进一步分为“错误地拒绝了实际还款的人”和“错误地接受了实际未还款的人”两类错误。图1中间和右侧两列展示了这两类决策错误的占比。人类-人工智能合作决策组相比于人类决策组,在两类错误方面都有所降低。有趣的是,人类-人工智能合作决策组相比于人工智能决策组,仅仅在“错误地拒绝了实际还款的人”方面落了下风(人工智能决策组仅为3.5%),而在“错误地接受了实际未还款的人”比人工智能单独决策表现更好(人工智能决策组为11.7%)。这意味着,人类做最终决策时更注重避免错误地放贷给实际不会还款的人。人类与人工智能的目标不尽一致,可能是造成人们不愿意采纳人工智能辅助的原因。
课题组成员:陈泽阳、刘玉珍、孟涓涓、王曾
作者单位:北京大学光华管理学院