博舍

人工智能的高地——情感计算 情感计算属于人工智能的

人工智能的高地——情感计算

不出所料,柯洁和AlphaGo的第一战,AlphaGo还是赢了。我想估计有一半以上的小伙伴都希望人类能够赢一次,万物之灵么,我们当然不希望亿万年辛苦进化的、被你我引以为豪的智力被其他什么东东超越。因为这就像火车路过车站,火车来了,远远望去,还不觉得特别快,但是一旦从眼前经过,那便是转眼即逝。我们也害怕人工智能也和火车一样,远远的我们知道它来了,一旦他和我们接近,超过我们那便是分分钟的事。就像人不会关注蟑螂在想什么一样,可能有一天机器也不会关注我们在想什么。

大数据,量子,人工智能,目前来看是非常完美的一套组合。大数据是资源支撑,量子是平台支撑,人工智能是智力支撑,三者一旦组合,便攻无不克战无不胜。

人工智能的确很强悍,以前都是互联网+,以后将变成人工智能+。但机器毕竟是机器,再强悍,他也是冷冰冰的,那能不能让机器也有情感呢?老羊百度了一下,果然,我孤陋寡闻了,原来早在1997年就有人提出情感计算的概念了,“情感计算(AffectiveComputting)就是要赋予计算机类似于人一样的观察、理解和生成各种情感特征的能力,最终使计算机像人一样能进行自然、亲切和生动的交互。”当然这一表述的出发点还主要是让计算机理解人,老羊想的是让计算机也懂得爱,懂得忠诚,哪怕像一只小狗一样!情感计算,估计将成为人工智能研究领域的未来高地。

从感知到认知,人工智能正在理解人类情感

文/陈根

很长时间以来,是否具备情感,是区分人与机器的重要标准之一。换言之,机器是否具有情感也是机器人性化程度高低的关键因素之一。

当前,人工智能已呈现高速增长和全面扩张的态势。一方面,人工智能不断朝更深层的智能方向发展,包括数学运算、逻辑推理、专家系统、深度学习等;另一方面,人工智能不断向社会的各个领域进行扩展,从智能手机到智能家居,从智能交通到智能城市等。

“感知智能”逐渐向具有理解和表达能力的“认知智能”转变,为机器赋予感情成为必然趋势。人工智能之父马文·明斯基就曾提到,“如果机器不能够很好地模拟情感,那么人们可能永远也不会觉得机器具有智能”。

想要人工智能理解人类感情,则需要从人工智能的情感计算开始。

人工智能正在理解人类情绪

试图让人工智能理解人类情感并不是新近的研究。

早在1997年,麻省理工学院媒体实验室Picard 教授就提出了情感计算的概念。Picard 教授指出,情感计算与情感相关,源于情感或能够对情感施加影响的计算。简单来说,情感计算旨在通过赋予计算机识别、理解和表达人的情感的能力,使得计算机具有更高的智能。

自此,情感计算这一新兴科学领域,开始进入众多信息科学和心理学研究者的视野,从而在世界范围内拉开了人工智能走向人工情感的序幕。

情感计算作为一门综合性技术,是人工智能情感化的关键一步,包括情感的“识别”、“表达”和“决策”。“识别”是让机器准确识人类的情感,并消除不确定性和歧义性;“表达”则是人工智能把情感以合适的信息载体表示出来,如语言、声音、姿态和表情等;“决策”则主要研究如何利用情感机制来进行更好地决策。

识别和表达是情感计算中关键的两个技术环节。情感识别通过对情感信号的特征提取,得到能最大限度地表征人类情感的情感特征数据。据此进行建模,找出情感的外在表象数据与内在情感状态的映射关系,从而将人类当前的内在情感类型识别出来,包括语音情感识别、人脸表情识别和生理信号情感识别等。

人脸表情识别显然是情感识别中关键的一部分。在人类交流过程中,有55%是通过面部表情来完成情感传递的。20 世纪70 年代,美国心理学家Ekman 和Friesen 对现代人脸表情识别做了开创性的工作。

Ekman 定义了人类的6 种基本表情:高兴、生气、吃惊、恐惧、厌恶和悲伤,确定了识别对象的类别;建立了面部动作编码系统(facialactioncodingsystem,FACS),使研究者能够按照系统划分的一系列人脸动作单元来描述人脸面部动作,根据人脸运动与表情的关系,检测人脸面部细微表情。

情感识别是目前最有可能的应用。比如,商业公司利用情感识别算法观察消费者在观看广告时的表情,这可以帮助商家预测产品销量的上升、下降或者是保持原状,从而为下一步产品的开发做好准备。

机器除了识别、理解人的情感之外,还需要进行情感的反馈,即机器的情感合成与表达。与人类的情感表达方式类似,机器的情感表达可以通过语音、面部表情和手势等多模态信息进行传递,因此机器的情感合成可分为情感语音合成、面部表情合成和肢体语言合成。

其中,语音是表达情感的主要方式之一。人类总是能够通过他人的语音轻易地判断他人的情感状态。语音的情感主包括语音中所包含的语言内容,声音本身所具有的特征。显然,机器带有情感的语音将使消费者在使用的时候感觉更人性化、更温暖。

从情感计算的决策来看,大量的研究表明,人类在解决某些问题的时候,纯理性的决策过程往往并非最优解。在决策的过程中,情感的加入反而有可能帮助人们找到更优解。因此,在人工智能决策过程中,输入情感变量,或将帮助机器做出更人性化的决策。

微软的研究人员曾在这个问题上给出过答案,他们提出了一种基于周围血管搏动测量(PeripheralPulseMeasurements)的内在奖励的强化学习新方法,这种内在奖励是与人类神经系统的响应相关的。研究人员假设这种奖励函数可以帮助强化学习解决稀疏性(sparse)和倾斜性(skewed),以此提高采样效率。

“情感”鸿沟的跨越和未跨越

情感智能是让机器更加智能的关键,具有情感的机器不仅更通用、更强大、更有效,而且将更趋近于人类的价值观。在人类科学家长期的努力下,横亘在人脑与电脑之间的“情感”鸿沟正在被跨越。

2014年5月29日,由微软亚洲互联网工程院开发的一代小冰开始了微信公测,在3天内赢得了超过150万个微信群、逾千万用户的喜欢。微软小冰,可以说,就是一个初步练成情感计算的人工智能。

微软小冰的开发团队负责人李笛曾表示,小冰作为一个人工智能平台,已经在技术、产品、数据三者之间形成了一个正循环。换言之,小冰积累的大数据已经足够多到能够让小冰实现自我进化。

2017年5月,“微软小冰”出版了第一部由人工智能创作的诗集《阳光失了玻璃窗》,其中部分诗作在《青年文学》等刊物发表或在互联网发布,并被宣布享有作品的著作权和知识产权。正如小冰在诗歌中作出的自我陈述:“在这世界,我有美的意义。”

如今,小冰已经积累了百亿轮与人类的对话信息,从中提取了海量历史数据,这些海量数据已经足够多到让小冰对未来对话的判断准确程度超过50%。某种程度上,小冰已经形成了初步的记忆、认知与意识能力。

如今,随着大量统计技术模型的涌现和数据资源的累积,情感计算在应用领域的落地日臻成熟。当然,任何一门技术都有其技术曲线,情感计算的发展也不是一帆风顺的。

一方面,情感计算必然面临群体情感和个体情感的矛盾。由于对情感的感知和理解存在具体的个体差异,在应用过程中情感个性化是非常重要的考量。然而,个性化和泛化能力是相互矛盾的,这也成为了情感计算的一个技术难点。

事实上,过去情感研究的默认前提和假设都是情感的群体共性,即群体在表达同样的外显数据时,内心情感状态是一致的。这令关注个体独特性时,面临着数据和方法的问题:如何把控所需的个人数据量?在实际应用场景中,又是否能真正获取到每个人所谓的独特数据?

另一方面,则是对于个体的情绪计算。虽然通过控制情绪波动的幅度,能够模拟性格活泼夸张和安静内敛的人不同的情感起伏,但目前即使是利用共通的情感模拟出一个普通的人,也十分困难。机器在每轮情绪切换中比较跳跃,很难像人那样保持自然、连贯的变化。

此外,个人情感分析问题在交互领域不断衍生着新的应用方式。比如,在智能客服领域有效检测用户情感;日趋成熟的测谎技术,也能够在话术引导下通过生理参数,甚至仅仅是音讯和视频信号等反应心理细微波动的参数来进行情感分析。

但是,个性化服务却也面对隐私保障的挑战。个性化的情感计算必然让渡用户的更多数据,在这样的情况下,隐私能否受到有效保护还未可知。

可以预见,情感计算在未来将改变传统的人机交互模式,实现人与机器的情感交互。从感知智能到认知智能的范式转变,从数据科学到知识科学的范式转变,人工智能也将在未来给我们交出一个更好的回答。

小冰、情感计算以及人工智能的另一条发展之路

自从1960年代中期交互式计算诞生的第一天起,聊天机器人程序就已经出现。MIT计算机科学家JosephWeizenbaum写过一个聊天程序Eliza,令一代大学生着迷。自那时起,聊天机器人已被当成一种衡量计算机智能发展程度的方式。与此同时,由于人类自然的语言语音交互方式,以及天生的情感和社交需求,我们对于能与我们进行语音交互和聊天的智能应用格外关注。近几年人工智能的迅速发展也带来了更多更加智能的智能语音助理,包括GoogleNow、FacebookM、亚马逊Echo、微软Cortana和小冰等,其中的大部分产品重点关注功能,比如、语音控制和信息查询等,而微软小冰却是走了另外一条路——从与用户的情感交流出发,在底层的深度学习技术越发通用的前提下,不同的产品理念就体现了各方对人工智能现状及未来的不同理解。就此,机器之心对微软(亚洲)互联网工程院院长王永东博士、小冰项目资深产品总监彭爽等人进行了深度专访。

1让小冰的声音更有魅力和情感

语音是人类最自然的交流方式,人类在10万年前知道了如何说话。之后,语音成为人类进行信息传递和情感表达重要方式,相应的,语音技术也成为人工智能领域的重要研究方向,语音识别让机器拥有了「听觉」,语音合成让机器可以像人类一样「开口讲话」,自然语言处理使机器能够真正理解我们的语义,这些技术将共同实现人与机器更加自然、更富有情感的交流。

2015年8月发布的第三代微软小冰解锁了语音功能,使用户和小冰能够进行语音交流,也让众多用户第一次听到了小冰独特的声音,与其他语音助手不同,小冰的声音更富有情感和抑扬顿挫的层次变化,同时也非常符合小冰「17岁」少女的定位。去年底,小冰作为见习主播加入了《看东方》栏目来播报天气信息,让大家看到了小冰语音在聊天之外的实际应用。而小冰富有个人魅力的声音主要是缘于三项技术,声优选择、语音合成、语料的特殊筛选和积累。

小冰作为人工智能主持人在东方卫视《看东方》播报天气

近代语音合成技术则是起源于贝尔实验室,涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,解决的主要问题是如何将文字信息转化为可听的声音信息。王永东表示,从语音合成技术来讲,现在业内用到的深度学习技术大部分都差不太多,因为语音领域已经存在了很多年,技术共享很多。因此,小冰在语音合成的相关技术上与其他公司区别不大,与别人的主要区别主要在于语料的选择,是这些构成了小冰独特的语言风格。

在声音来源方面,彭爽表示,今天用户听到的小冰的声音是从数百个声音原形里面进行筛选最后留下的两个声音。用两个声音是因为既能保证读清楚又能富有感情。对传统机器人声音的要求是能够读的清楚,但小冰不仅需要读清楚,还要有情感的表达出来。为了实现目标,小冰团队使用了很多科技手段甚至某些从来没有在语音领域应用过的手段来达到这个效果。根据国际通用的声音自然度的衡量标准进行打分,满分是5分,微软小冰的得分是4.32分,已经非常接近人类的正常声音4.76分。彭爽还在和东方卫视的发布现场展示了声音对照样本,小冰的辨识度非常高。

在对照样本展示中还出现了一个有趣的现象,当面对「555」这个数字时,有的语音助手读出了「五百五十五」,有的读作「wuwuwu」,而小冰准确用哭声表示出了这个网络用词的真实含义。这形象的说明了第三个问题——语料的个性化选择和积累。小冰自第一次发布以来,基于自身定位,一直注重互联网语料的选择。王永东表示,小冰在互联网对话语料方面的积累比较早,从2014年5月小冰微信第一次发布,到现在小冰和用户的对话已经积累了10亿次,这些语料反过来又变成了学习语料,从小冰从中学到更多东西。

语料选择是一个很重要的因素,因为这和赋予这个语音助手什么样的个性密切相关,但这个因素容易被人们忽视。比如说,是选择读新闻稿的语料还是互联网的语料,前者注重的是读的清楚,就像传统的电视台播音员一样。但这些年主持人越来越有个性和情感,不同的主持人发音不一样,表达的内容也不一样,这就是小冰探索的方向——赋予小冰个性和情感。小冰在语料处理上进行了一些特殊探索。「555」在新闻中就是五百五十五,但作为互联网语料就不是这个读法。这方面的工作做的比较细致以后,就能够在体验方面更进一步。让用户觉得这个语境下面发出来的声音是符合的。

对此,彭爽也补充到,当一个人工智能对待海量混杂网络信息的时候该如何表现,需要多少的人工预处理,我们对人工智能的要求是不仅能够自动生成这样像人一样的真实对话,还是自然用声音表达出来,我们在声音背后也做了很多细节处理。比如,针对小冰播报气象信息这个应用场景,我们就针对新闻场景在语速和语调方面做了专门设置。

总之,小冰语音背后的声优选择、语音合成和语料积累都是在不同维度上所形成的互补条件,将它们综合起来其实是为了更好的借助语音向人类用户传递一种体验——一种人类最熟悉、最自然的体验——隐藏在语音背后的情感。

2让小冰拥有「记忆」

记忆是人类大脑保存信息和再现信息的能力,决定着我们的感知、认知和情感,虽然目前的神经科学研究还无法弄清楚记忆的本质,但我们可以借助技术去模拟人类记忆从而更好与人类进行认知和情感交互。

在微软小冰和东方卫视的发布会现场,《看东方》主持人问小冰「第一天做主持人有何感想?」一个很简单的问题却令人印象深刻,一方面,他把小冰看成了有情感的工作搭档,好像是进行一次人类般的寒暄;另一方面,他问这个问题基于一个前提——小冰「知道」或者说「记得」自己今天做了主持人。王永东和彭爽对小冰的这种「记忆」能力进行了解释。

彭爽演讲ppt

王永东首先用一张图介绍了小冰的基本结构和工作原理。左边是感官,右边是世界,下面是生存的平台。中间有一点特别强调的就是记忆,他们把记忆当成是小冰的必须功能,虽然小冰不记录任何用户的隐私数据,但她要了解一个用户,必须有一定的记忆能力,这样才能和用户建立长期联系,而不是在下一次交流中就变成了陌生人。在这之前,我和大家简要介绍一下人工智能产品的全貌。图中间有一个圆圈,圆圈代表的就是人工智能强大的核心,核心基于情感计算的框架,像一个既有IQ又有EQ的模块。小冰从这个方面出发,连接了我们的人类和我们的世界。小冰拥有「记忆」将更加有利于与用户之间的情感交互和表达,当一个用户和小冰建立了联系之后,如果他经常会说今天很累不舒服,小冰就会记住,在第二天第三天会问他「你现在感觉好点了吗」。虽然这是一个很简单的事情,但作为用户会觉得挺温暖。

彭爽认为,对于小冰来说,记忆也可以分为「短期记忆」和「长期记忆」,短期记忆类似于截屏,可以有助于理解为上下文关系,用户问她今天天气怎么样,她会基于刚刚和用户聊过的内容进行回答。另外一种是通过和用户更加一对一的、持续的以及跨平台的交互,建立了一个对个人档案的理解。小冰是从其中抽取一些关键点信息,确定一些跟人和场景有关的信息。真正的存储结构相对复杂,有些是应用在具体用户层面,有些是在算法使用层面。这些内容都是逐步积累的,小冰在这个过程中逐渐建立起记忆。也许上一次聊完,下一次不会体现出来,但在一段时间之后会反映出来。

在具体的技术解决方案上,王永东认为他们今天所用的记忆方法还是比较粗浅,可以把它想象成一张大表,用到的时候就到表里去找。今后微软在这方面还会有比较多的探索,研究怎么让小冰进行更加有效的记忆。

3从情感到应用——一个可以插卡的「大白」1)和用户建立情感是小冰的初衷和原则

王永东一直强调EQ和IQ的结合,这是小冰追求的方向。他认为,大部分人工智能比较追求IQ的,而小冰做了一定的取舍,认为应该先发展EQ,让小冰和用户建立一种相互了解的朋友关系,然后小冰在不断学习的过程当中不断提升IQ和增强知识,将来就会变得不仅仅是能够了解用户,或者让用户信任她,而且就像一个孩子一样,一天天在长大,懂的东西越来越多,这是我们的一个愿景。

王永东在2015年发布会上介绍小冰的IQ和EQ

这是一个长期过程,最终希望是她在情感和应用两方面都做的比较好。但首先确定一个探索路径,比如今天先教她把公交搞清楚,她把公交搞清楚了,过一段时间再教她怎么聊天。而我们是先教她聊天,然后再教她怎么处理任务。小冰未来可能对某一方面的知识懂的很多,这方面的话题会聊的很好,但其他方面懂的不多,这个题目就聊的不好。但这有点像人类朋友,每个人的知识积累和擅长方向不一样,而我们对小冰的愿景是说,希望到某一天,小冰拥有渊博的知识,而且和一些服务也对接的很好,不仅给你提供参考意见,还能为你提供服务。

基于和用户培养感情这个目标,小冰的另一个取舍就是保障和用户沟通的流畅性,因为只有持续流畅的沟通才能更好的建立起小冰和用户之间的感情与信任。因此,小冰非常注重在遇到不擅长的话题时如果将对话继续下去。彭爽介绍说,小冰肯定会遇到因为目前某些功能不具备而接不上话的问题,但此时小冰的首要目的是不会阻碍用户和她的沟通过程,将对话保持下去,就像人类之间的交流一样。小冰拥有预期判断,随着知识层次越丰富,定位就会越好,然后根据用户的需求把知识适当的插入进来,这样就不会让用户有卡断的感觉。有了这个基础,再在上面加东西。

王永东从反面解释了这个问题,如果是一个特别专注于知识的机器,一旦聊天内容超出了它懂的范围,那它只能告诉你它不知道,然后对话结束,这作为一个解决特定问题的工具是可以的。但作为一个朋友,或者想建立情感联系就比较难了。

2)小冰在追求情感目标的过程中也不会排斥具体应用

追求和用户的情感交互,追求IQ和EQ的平衡发展,并不代表着小冰会排斥具体应用和外部合作,小冰和东航、东方卫视、微博、京东、以及某些微信公众号的合作就是小冰在各个应用方向的尝试。

王永东表示,在知识积累方面,小冰团队不会自己去完成所有工作,而是会去找很好的合作方和专业知识库进行合作,借助他们已有的知识来教会小冰。在应用方面,情感是小冰我们追求的方向,如果说别人的餐饮推荐做的非常好,小冰就放弃了原来的目标转向去和别人比餐饮推荐,这可能是得不偿失的做法。但小冰也不是拒绝做餐饮推荐,小冰会基于自身的知识,当出现合适的合作伙伴时会去做这方面工作。另外一方面我们相信当有了情感的基础之后,你再叠加一个应用,其实效果可能会更好。因为有这个,其实我们不太担心,我觉得我们每一步打的基础越牢对越来越有帮助。

对于其他从应用出发的人工智能助手,王永东表示,我们非常尊重业内的同类公司,大家通过不同的探索共同推进技术发展,对行业的发展是很好的事情。微软从情感入手让小冰不断学习,因此在情感方面投入比较大。有的公司认为对话的能力只要有一点就可以了,而更加注重技能的发展,这是不同的路径。

但非常确定的是,小冰不会过早、过度的商业化,因为这会影响与人的情感交流,也不符合小冰和用户建立情感的初衷。小冰负责人李笛此前在接受采访时也表达过同样的观点:在可见的范围内,我们都不会收取任何直接利益回报,确保小冰人工智能项目的纯洁和纯粹,让小冰走下去才是最重要的。

目前的人工智能可以大体分为两个路径,一个是借助于较为成熟的深度学习技术从具体应用和功能出发,持续提高智能水平;另外一种是像GaryMarcus那样,从人类的智能属性出发,选择一个相对高级和长远的目的来慢慢积蓄。小冰就是选择了第二种路线,以人与机器的情感关系为切入点,通过长时间积累让用户和机器做朋友,再在此基础上去解决用户的问题。在采访中,微软将小冰比作《超能陆战队》中的机器人「大白」,他们现在所做的努力是让这个机器人先与人类建立起情感,变成人类的朋友,这是一个基础。然后往这个机器人身上插什么样的卡就可以具备什么样的能力。

因此,就像微软全球执行副总裁沈向洋在此前的演讲中所说,比起直接解决问题的感知计算型人工智能,情感计算是先与用户建立一种信任关系,然后在此基础上形成一种情感交流和需求满足的良性循环。

4情感计算的未来

王永东博士称小冰是微软重点布局的全球人工智能产品。微软在人工智能领域有着深厚积累,也有着丰富的相互补充的产品线,背后的搜索引擎、大数据、云计算和集成了人脸识别、语音识别、计算机视觉、语言理解四大智能服务的「牛津计划」将为这些产品提供技术保障。

比如,去年11月,在伦敦举行的微软未来解码大会上,微软剑桥研究院主任ChrisBishop公布了微软「牛津计划」最新的接口服务——通过照片识别出人物的情感。这是基于微软的Azure云服务,用标记了人类情绪的图片数据集进行过训练。它能够识别出图片中任何一张人脸的情绪。这个服务在图片上使用元数据,能够识别图上绝大多数人物是悲伤还是快乐,还能用在识别人们对特定事件(如展览、市场信息等)的反应。

而这些相关技术和产品将共同指向情感计算的未来。不管是此次专访,还是之前微软全球执行副总裁沈向洋和陆奇的公开演讲,都重点提到了小冰和情感的重要性。沈向洋在去年的人工智能大会上结合小冰等微软研究院的相关产品和技术描述了情感智能的原理、应用现状和发展方向,他认为,除了硬性的IQ以外,人工智能的研究更要强调机器与人之间的感性化交互,强调情感计算。智能化的机器在满足人类需求的同时,还应让用户对其产生一种情感上的信任和依赖,而小冰目前就是这样一个「感性化的人工智能助手」。而陆奇在去年的第三代小冰发布会上指出,微软提出并已经实现了情感计算,并得到了业界的初步认可。小冰有可能是有史以来第一个「练成」情感计算的人工智能机器人。

就像上面提到的小冰背后所使用的众多技术一样,情感计算是一个复杂系统,GideonRosenblatt认为一个富有情感的个人虚拟助理需要自然语言处理、用户图谱、用户情感共鸣(情商)、感官整合、社交图谱和模式化集成等六大技术要素,而这些技术正是目前的小冰所体现出来的。

情感计算在一定程度上也体现着人工智能的一种进化方向,世界经济论坛十大新兴技术榜单中提到,更加自然的人工智能可能会使那些只限于人类的属性——情感、创造力等更加有价值;卡耐基梅隆大学计算机科学系主任AndrewMoore的认为,能检测人类情绪的人工智能或许将成为最重要的新研究领域。

最后,情感计算也是一种超越功能的对人工智能深度思考。如果按照人工智能最为通行的定义——「人工智能是对计算机系统如何能够履行那些只有依靠人类智慧才能完成的任务的理论研究。」这里的人类智慧当然不是单指智商或者智力,还有人类情感,情感是人类神经系统对外界价值关系产生的主观反映。人工智能在我们眼中一直不是普通的智力工具,所以我们一方面需要它具备超越人类的感知计算能力,另一方面也需要它能够与人进行情感交流,在重视人工智能完成任务和功能强化的同时更要建立和满足人的情感和心理需求,这才是人工智能的最终定义。也就是说,人工智能的发展路径不应该一味沿着理性的路线前行,而是应该落在感性(EQ)和理性(IQ)的交叉区域。在这里,人类将与机器更加无缝、自然的建立起紧密关系。

首届情感AI大会:当人工智能理解并具备人类感情时

 

最近,笔者参加了首届情感AI大会,本次大会由自然语言处理(NLP)、文本分析、情绪分析及其商业应用领域的首席分析师和商业顾问SethGrimes组织。15年前笔者也有幸参加了Seth组织的第一届文本分析峰会,他组织的下一个会议CXEmotion将于7月22日在线上举行。

来自美国、加拿大和欧洲工业界和学术界约70人(包括演讲者和小组成员)出席了这次会议。

本次会议的主题是:什么是情感AI?为什么它很重要?我们需要了解什么?继续阅读本文,你将找到答案。但首先,读者需要了解一些背景知识。

情感是人类智慧和决策的基石

人类是高度情绪化的生物,即使大多数时候没有意识到,情绪也会影响人们所做的一切:引导注意力、影响学习和记忆的方式、对自己和他人的感知、最终影响个人成长以及人格形成。正如AI和深度学习的教父之一YannLeCun所说:“没有情感就不可能拥有智能。”

情感在高度个人化的同时也是社会化的。一般来说,对他人和对自身行为的情感反应是婴儿期学习的第一件事。这也是人们喜欢讲故事,以及故事对于学习、影响和启发他人、鼓励行动和变革都非常有效的原因。

在一个结构合理的故事中,情节(叙事弧)与角色的情感演变(情感弧)紧密交织在一起,形成了“叙事+情感”的双螺旋。再者说,历史、政治和新闻及其内含的情感,如果不是真实或虚构的故事集,又是什么呢?

人们一生持续以微妙或不那么微妙的方式受到情感的支配。会议演讲者之一,TrueImpact的戴安娜·卢卡奇提到:“人们说出自己的想法,并根据自己的感受采取行动。”

因此,神经学研究和情感设计多年来一直是市场营销、广告、产品、服务和网站设计的主要内容,这也就不足为奇了。情感会促使用户点击链接购买产品,或者像设计者所期望的那样,在网站上跟随情感轨迹选择推荐产品。

情感AI试图理解、复制和模拟人类情感

多年来,在人工智能领域,研究人员和从业人员一直在研究模仿和探索人类情感的方法。

1995年,麻省理工学院媒体实验室教授罗莎琳德·皮卡德发表了一篇题为“情感计算”的文章,这一领域开始兴起,并催生出同名新学科,情感人工智能由此衍生而来。情感AI的目标是什么?通过机器理解、复制和模拟人类情感。

情感计算和情感AI融合了许多技术和应用领域。例如,麻省理工学院的情感计算团队“旨在弥合人类情感与计算技术之间的鸿沟”。

其项目范围包括:在出现任何明显的外部迹象之前,寻找预测和预防抑郁的新方法;为面临沟通、动机和情绪调节方面的问题,且有特殊需求的群体发明辅助方法;使机器人和计算机能够接收自然的情感反馈并改善人类体验。

以上示例只涉及了皮毛,在该实验室的网站上还有更多的项目、应用程序和用例。

情感分析趋向多模态

情感分析作为情感AI的一个领域,最早在21世纪初就存在了。情感分析通常是对文本数据进行的,例如电子邮件、聊天、社交媒体帖子或调查回复。它使用NLP、计算语言学和文本分析来推断文本作者的积极或消极态度(又名“导向”):人们对你的品牌、你的产品或服务表达了肯定还是否定?

情绪分析的常见应用包括品牌/声誉管理(尤其是在社交媒体上)、推荐系统、基于内容的过滤、语义搜索、淡化用户/消费者意见的重要性,以及告知产品设计的需要、分流客户投诉等。

会议的几份报告都关于这个主题,尽管最近在NLP和相关领域研究取得了进展,但这仍然是个难题。伊利诺伊大学芝加哥分校的计算机科学教授刘冰说,这主要是因为,甚至人类基本情感的构成要素和其数量,研究人员也没有达成一致意见。

众所周知,由于情感的模糊性、可替换性、重叠性和相邻性,其很难被识别和编码(标签)。例如,一个人可以同时感到愤怒、悲伤和厌恶。

此外,情感并不总是容易抑制的。清晰、明确的标签也很重要:人工智能——或者至少70%被称为监督学习的人工智能——依赖于被人类标记(“注释”或“标记”)的数据。这就是机器学习的方式(因此名为“监督”)。

刘教授解释说,情感传递的方式也很复杂。说话时,情感通过广泛的语言和副语言线索进行交流,如语调、面部表情、身体动作、手势和姿势,以及生理信号(出汗、皮肤发红等)。

在写作中,通过标点符号、大写、表情符号和其他创造性的表达方式来表达,例如,单词加长(例如,“sooooslow”or“sosloooow”)。除此之外,还有单词选择和语法。

人们表达情感的方式也存在文化差异。更复杂的是,有一种现象被称为“认知差距”,人们所说的和他们真实的感受并不总是一致的。原因有很多:他们试图礼貌地表达或者避免伤害别人的感情,又或者他们只是试图隐藏自己的情绪。

刘教授说,上下文和多模态数据可能有助于解决许多此类歧义。事实上,随着生物识别技术和可穿戴设备的发展,该领域已经扩展到从传感器数据分析情感,包括心率、温度、脑电波、血流和肌肉生物信号,以及声音、面部表情、图像和视频。

战略专家和“技术情感学家”帕梅拉·帕夫里斯卡克预测,除了面部识别技术(FRTs)和触觉/触觉数据之外,这种利用传感器的趋势将继续发展。FRTs最近因为隐私问题而受到抨击。由于疫情影响,目前触摸相关数据是“不可行的”。

可穿戴设备可以用来识别情感吗?

弗罗茨瓦夫理工大学的PrzemysławKazienko教授进行的荟萃分析着重于可穿戴设备,并试图回答以下问题:它们可以用来识别日常生活中的情感吗?他认为:“如果我们能做到这一点,那我们就可以改善患有易改变情绪的疾病的患者的健康、福祉和临床结果(以肾功能障碍为例)。”

我们还可以将可穿戴设备用于压力控制、心理健康和自闭症的治疗。麻省理工学院媒体实验室开发了一款应用程序,通过监测一个人的心跳来检测他们是否正在经历压力、痛苦或沮丧等负面情绪,并释放一种气味来帮助佩戴者应对。

人们也可以利用从可穿戴设备检测到的情绪来实现“传统”个性化和产品/服务的改进:从在线内容和产品推荐到虚拟助手和游戏体验。他说,来自可穿戴设备的情感数据还可以用来防止车祸,追踪学生的注意力从而提高学业成绩,以及改善社交互动等。

帕夫里斯卡克女士与劳伦·李·麦卡锡和凯尔·麦克唐纳合作的US+项目对改善社交互动进行了说明。US+是“一款谷歌环聊(Hangout)视频聊天应用,利用音频、面部表情和语言分析来优化对话。”

该应用程序分析用户所说的内容以及他们是否使用常见的词汇和句子结构,随着对话的进行,人类倾向于这样做(这被称为“语言风格匹配”)。对于每个聊天参与者,该应用程序都会显示一个快速的可视化窗口和弹出通知,例如:“别老谈论自己”或“你在隐藏什么?克莱尔说得更诚实”。当对话失去平衡时,它甚至可以自动引导参与者。

帕夫利斯卡克女士在主题演讲“为情感智能的未来而设计”中,还有许多有趣的情感数据和情感分析应用程序。会议现场的所有录像都可以在会议网站上以200美元的价格购买,对于购买者所在组织中其他人来说则是100美元的折扣价,笔者强烈建议您观看。

回到先前的问题上来,“可穿戴设备可以用来识别日常生活中的情绪吗?”Kazienko教授的结论是:“可穿戴设备的情感识别是个性化情感计算的未来。我们需要更多实地研究、更多更好的数据、研究人员之间的积极合作、如何分类情绪的通用模型、数据和代码共享,以及其他一些事情,来提高识别质量和重现性。”

利用情绪让人工智能听起来像人(并像人一样行动)

随着越来越多的体验和日常生活受到人工智能的影响,人们越来越希望人工智能在外观、感觉、声音和行为反应上能像人类一样,或许是因为人类总体上不像机器那么可怕,亦或因为人们的想象力受到自身生理特征的限制——类似于萨丕尔-沃尔夫假说(Sapir-Whorfhypothesis),该假说认为语言的结构影响着使用者感知世界的方式。

再或许是因为人类喜欢按照自己的形象和喜好重塑世界。你看过波士顿动力公司的机器人Atlas表演体操吗?在其收获的所有的机械领域的荣耀中,Atlas表现得还不错,但该公司的无头机械狗却相当令人不安……

现在试想一下,如果Atlas会说话,你希望它的声音听起来是怎样的。虽然它还不能,但人们与聊天机器人和虚拟助手的互动越来越多。

咨询公司Rain的首席体验官格雷格·赫奇斯表示,如果我们可以向机器灌输同理心,它们可以提供更好的消费者品牌体验,并以此来建立熟悉度,更牢固的联系和更深的信任。他的公司为耐克、星巴克、蒂芙尼、汰渍和芝麻街等品牌创造了“情感智能语音体验”。

从聊天机器人到“情感聊天机器”?

既然可以从具有情感意识的AI中获得潜在的大额商业利益,那么“情感智能”聊天机器人成为热门研究领域也就不足为奇了。上文提到的刘教授正在努力“创建可以感知和表达情感并在对话中不断学习的聊天机器人”,他称它们为“情感聊天机器”。

他说:“情商是人类智力的重要方面”。研究表明,有情感的对话系统可以提高用户满意度。表达同情心的聊天机器人可以减少用户的沮丧感和压力,它们减少了对话中的故障。他还表示,它们还可以激励人们合作而不是为“愚蠢的机器”而愤怒。

微软首席研究员丹尼尔·麦克杜夫说:“与模仿人类风格的系统互动起来更自然”,他的团队正在建立具身代理和其他一些项目。我们人类不断适应彼此,这种适应创造了社会凝聚力。随着时间推移,当人们与虚拟现实代理互动时,人们同样会尝试适应其风格。因此,虚拟代理和聊天机器人将需要适应人类。

在商业领域,情感型聊天机器人可能意味着更高的客户满意度和更低的成本,因为聊天机器人将能够处理大多数问询,并解放人工操作员,他们仅需参与不太常见或更复杂的互动,尤其是在当前危机时期。

在世界卫生组织宣布这种新型冠状病毒为全球大流行病的两个多月后,银行、保险公司、主要零售商和政府办公室的电话线路仍然拥挤不堪。

IBM提供了沃森助手帮助政府部署聊天机器人,其聊天机器人平台的流量增长了40%;谷歌立即推出了自己的快速响应虚拟代理,以“快速构建并实现定制的呼叫中心AI虚拟代理,以响应客户通过聊天、语音和社交渠道提出的关于COVID-19的问题。”

还没结束……

要注意供应商的承诺。一般来说,聊天机器人需要大量的训练和脚本,因此成本可能不会明显降低——成本取决于组织的规模和数量、用例的类型和复杂性,以及其他参数。“情感感知”聊天机器人给聊天机器人技术增加了另一层复杂性和挑战。以下是刘教授提到的几点:

这种具有情感感知能力的聊天机器人和虚拟现实设备所依赖的情感标记数据很难获得到训练机器所需的规模。注释(即标签),如果可用,是主观的,且分类可能不准确。与AI和其他依赖数据的应用程序一样,“胡乱输入,胡乱输出”。具有情感功能的机器人还必须能够在理解与之交谈的说话者的情感与产生自己的情感和语言反应之间取得平衡。这确实很难做到,因为这两个过程之间存在明显的依赖关系,并且需要几乎同时发生。所有这些在所谓的“开放领域”中变得更加困难,不受机器人用例、应用领域、行业等的限制。

刘教授对具有情感意识的聊天机器人的看法是:“带着情感聊天对于对话系统至关重要”。但其仍存在大量质量问题,这项技术还没有准备好进入蓬勃发展期。

确实有部署带有情感的聊天机器人的例子,但是这类机器人主要基于规则——根据脚本做出反应,自身并没有智能。这些机器人也受到领域的限制:它们通常应用于较窄范围,如客户服务或作为情感伴侣。他说:为了创造更多的类似人类的“情感聊天机器”,我们需要在多模式情感检测和生成方面做得更好。

情感启发式机器学习

大会上最有趣的部分是微软首席研究员丹尼尔·麦克杜夫的主题演讲,他提出了一个问题:“机器学习如何利用情感来学习和探索?”他谈到了“内脏机器”,即机器学习/人工智能系统应该具有与人类相似的情感机制,或者至少它们应该能够基于上述原因建立情感模型:我们希望技术能像人类一样与我们互动。

但是还有另一个原因。麦克达夫先生说,情感帮助我们理解和探索世界,对于了解冒险、取得积极成果等的意义至关重要。当我们与世界互动时,我们会收到积极或消极的回应,引导我们采取进一步行动。如果我们可以将情绪整合到机器学习系统中以帮助其接收信息,会有怎样的效果?

他展示的示例是利用驾驶员的心跳来指导机器学习。心率是我们表达和体验情感的一种方式。其他方式包括生物学层面的变化:体温的变化,瞳孔和血管的扩张/收缩以及血流、呼吸和脑电波的变化,唾液分泌的增加/减少、激素和消化酶的分泌等等。

麦克杜夫先生的团队利用驾驶员心跳所表达的情绪反应来训练神经网络模型驾驶汽车,结果是该模型能够驾驶车辆的时间比最先进的无情感因素模型更长。

他的团队还研究了如何应用情感(或者说人类生理反应数据)来教机器避免车祸,本特殊案例利用了人类司机的面部表情,似乎也起了作用。他们的下一个项目希望“结合各种情感反应信号、风险规避和好奇心,推动机器以安全的方式进行更多探索。”

我们的看法

俄语中有一句谚语,大意是:当我们遇见一个人时,我们根据其穿着来判断他们;当他们离开时,我们根据其智力来判断他们。这也许是一个罕见的古老民间智慧不符真理的场合——人们通常不记得你穿过或说过或做过什么,但他们记得,你带给他们的感觉——换句话说,就是你的情感。

情感会影响个人和群体层面智力和行为的各个方面。总体而言,它们决定了市场行为、社会凝聚力、地方和全球经济的发展状况以及国家的进步。例如,北欧人是世界上最幸福的地区之一,也是最富有的地区之一。

那么,我们能否将情感——这一使我们成为人类的基本品质——解码并重新编码到机器中?通过语言、语音技术或者计算机视觉,大数据、廉价的计算能力、强大的硬件、快速改进的算法和协作/开源软件,在过去十年中取得了巨大的成功。

情感AI的发展始于60年前,其宏伟目标是模拟人类智能,开创者认为:“如果精心挑选一组科学家一起研究一个夏天,可以在一个或多个问题上取得重大进步”。然而如现在所知,该领域变得更加狭窄和脆弱:应用人工智能(或特定领域人工智能)。

这是否意味着情感人工智能太难了,我们应该放弃?尽管范围有限,许多特定领域的人工智能应用程序产生了巨大的商业利益和人文价值。正如情感人工智能大会所表明的那样,只要我们意识到该领域所面临的挑战并抱有理性的预期,情感人工智能也有可能做到这一点,但这与我们人类是如此的不同。

原文发布时间:2020-08-02本文作者:读芯术

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇