在线智能客服机器人的需求与定位运营(1):AI训练师/AI产品经理
导语:在智能服务产品的多样性,有不同的服务产品、同一个服务产品在训练任务和内容上存在些许差异,那么该如何从0到1构建出一条清晰明了、通畅且能够上升到通用层正面启发其他小型智能服务产品运营的体系思路呢?想要回答这个问题,需要先聚焦于客服域智能服务产品的定位。
一、智能服务产品需求研究很多训练师尤其是刚刚入行的训练师都会有这样一个困扰:训练师的工作内容繁杂,通常都是一专多能的状态,到底怎样沿着一条主线逻辑完成训练工作、实现个人成长和突破呢?
电影《教父》中有这么一句话:“花半秒钟就看透事物本质的人,和一生都看不清事物本质的人,注定是截然不同的命运。”
这句话对于训练工作来说同样适用,看清事物本质能力的高低是训练师业务能力强弱的最佳体现。“事物的本质”就是事物发展变化中的关键要素和主要矛盾。
关于事物的本质有一个非常著名的案例:福特在最开始造汽车时,他咨询了许多人:“你对交通出行的最大诉求是什么?”大家的回答都是“我想要一匹最快的马。”
人们的回答本质上是对交通出行耗费时间太长的不满,如果没有抓到本质而只是沉迷于用户说的话,可能福特就会去养马,但福特观察到的却是当时人们内心深处对于交通出行速度的追求,从而创造出了汽车。
那么在线机器人的本质是什么呢?
在线机器人在与客户交流的过程中,首先需要明白客户的语言,这些语音有的是通用领域的,如“帮我查下天气”:还有些是特定领域的,如“什么是基金?”训练师们需要在训练的过程中不断提升机器人“听懂”或“读懂”的能力。
因此无论是哪种类型的机器人,使用什么样的技术,都是为了实现客户的语言识别、企业预设知识内容的推送,提升客户体验。智能服务产品也好,在线机器人也好,本质上就是满足客户的服务诉求,并且超过客户的预期。
所以,我们可以得到这样一个推导过程:
首先:智能服务产品的出现是为了提高客户在服务过程中的体验。
其中,客户体验是服务产品与客户服务诉求之间的差值,且在线机器人提供的服务与客户服务诉求是一个包含关系,如客户A想要开发票、客户B想要退换货,如果服务都是由人工来提供,就一定能够满足提供的服务完全包含客户的服务诉求。
这本身没有问题,但同时我们还需要考虑企业的成本,企业存在的本身是一种商业活动,是为了盈利而出现的组织,所以采用智能服务的方式,才有可能在成本控制的情况下给客户更加优异的服务体验。
其次:好的体验就是尽可能使在线机器人提供的服务包含客户的服务诉求,并且在服务感知上超过客户的预期;机器人是满足客户的服务诉求的载体和产品企业通过在线机器人提供的服务满足了客户需求,从而使得客户更加愿意使用企业的其他产品,也为企业创造其他的附加价值。
由以上推导可知,在线机器人训练的本质就是使其在最大限度上满足客户的需求。优秀的训练师首先就需要将目光聚焦在客户的需求上面。
二、需求调研指导在明确需求产生的干系对象后,训练师们需要通过调研的手段获取需求。
对于智能服务训练团队负责人来说,要想知道什么样的机器人才是企业最需要的,只能通过调研。调研是最重要的事情,如果不进行详细调研就直接进行智能服务产品的采购或者研制非常容易导致需求短视症。
产生需求短视症的原因在于市面上的智能服务厂家五花八门,各家提供的产品侧重点不同,其核心技术优势也都各不相同。如果盲目跟从,不进行业务匹配、不进行智能服务需求调研而直接采用,智能服务的效果可能不但没有提高,甚至还会降低原有服务水平。
1.智能服务调研方法智能服务的调研需要从智能服务的价值链切入,需求调研包括纵向、横向、内部、外部。
纵向调研是从智能服务产品诞生到成熟的流转,包括智能服务产品研发、智能服务产品运营;横向调研包括同行业类智能服务产品;内部调研是智能服务产品在客户中心或者企业内部的流转,包括与在线机器人有关的各个岗位与部门;外部调研是在线机器人在外部服务的流转,即使用在线机器人或者智能服务产品的客户。
2.智能服务调研原则1)实地调查(场景还原)
在现实中,遇到不能解决的问题就需要调研这个问题的现状和它的历史,当完全调查明白后,就会找到问题的解决办法。不进行调查,而只是凭空想象,多半会做出错误的决策。
很多训练师不喜欢做调研,而是凭着自己的理解创造需求。他们经常会认为,客户应该跟着我设定好的规则走,只要我的规则设计得够好,所有客户都将成为在线机器人服务流水线的产品,跟着流水往前问题就能解决,这类训练师大多都不屑于找用户求证其真正的需求是什么。
也就是说,许多情况下用户也并不清楚自己的真正需求是什么。就像在线机器人诞生之前,笔者会针对用户调研:“你觉得现在服务最大的问题是什么?”
很多用户会回答:“我买了东西在线上咨询物流信息要排很久的队。”通过实地调研,将客户反馈的“人工咨询物流信息慢”转化成研究一个能够7×24小时不排队为客户提供物流信息查询的机器人,这才是最为正确的做法。
实地调研对上线后的机器人训练工作影响重大,如在线机器人上线后,客户往往一进线直接就进行了转人工的操作,不给机器人提供服务的机会。
这个时候就需要实地去找到这些真正转人工的客户,实际调研到底是因为什么原因导致客户不愿意选择使用在线机器人,而不是武断地认定是因为在线机器人识别能力不强,导致客户转人工。
因为这里我们强调的是客户进线后看到是机器人提供服务就转人工,而不是说客户在接受了机器人的服务后,发现答非所问,或者回答的内容过于冗长,前者说明客户不信任在线机器人,后者则是因为机器人的服务能力不够。
2)加强思辨
加强思辨能力是为了避免掉入思维陷阱当中,最好的案例就是在机器人诞生之初,有很多人都认为人工智能未来将会彻底的颠覆人工服务,是在线机器人诞生之初,很多人都认为人工智能未来将会彻底颠覆人工服务,为自动化流水线的加工确实导致很多企业用在线机器人完全替代掉人工。
但时至今日,我们才发现人工是不能够被完全替代的,人机耦合才是最佳的解决方案,人工智能的出现是给企业在成本和服务体验二者之间平衡点找到的新的契机而已;同时,加强思辨也体现在在线机器人的训练过程中,因为当我们在训练过程中受到阻碍时,调研尤其是实地调研才是解决疑惑的最佳方案。
三、调研框架调研的框架设计可以借鉴5W1H的模型来思考,具体方法如下:
what:用户的问题和需求是什么?when:用户什么时候会遇到这样的问题?why:用户为什么会遇到这样的问题?where:用户一般在什么地方遇到这样的问题?who:遇到这个问题的用户是谁?用户群体有什么特征?how:用户当前是怎么解决这个问题的?四、需求调研流程为客户提供优异服务体验的在线机器人一定是调研出来的,调研的方式有很多种,最先需要考虑的是拟订一份详细的调研目标清单,还要准备一份如何使用数据的分析计划。
根据调研目标进行拆解,设计具体的调研过程大纲,再基于调研大纲设计调研脚本。
调研流程设计:
1.确认目的和内容2.搜集资料搜集有关资料的目的主要有三个:
帮助训练师加深对所调查研究问题的认识为调研设计提供丰富的素材形成对目标总体清楚的概念在搜集资料时对个别调查对象进行访问,可以帮助了解受访者的经历、习惯、文化水平,以及对问卷中所含问题的意见等。例如:年龄段研究和分析,很多中老年用户尤其不习惯长篇大段的应答内容,这往往也是他们不选择机器人而选择人工客服的首要因素。
3.确定调研方式不同的调研方式对于问卷设计是有一定的影响的:
面谈:在面谈中,被调查者可以看到问题并可以与调研人员面对面地交谈,因此可以询问较长的、复杂的和各种类型;电话:在电话调研中,训练师可以与被调研人员交谈,但是看不到调研内容,这就决定了只能问一些短的和比较简单的问题;在线问卷:调查者独自填写的,训练师与被调研者没有直接的交流。因此问题也应简单些并要给出详细的填写指导,方便收集数据进行分析。4.确定内容一旦决定了调研方法的类型,下一步就是确定每个问答题的内容。
例如:问答题应包括什么,以及由此组成的问卷应该问什么,是否全面与切中要害。针对每个问题,应该遵循两个原则,即必要性和信息反馈的充足性。设计问题时,调研人员要时刻反问自己:
这个问题有必要吗?是需要几个问答题还是只需要一个就够了?问卷中的每一个问答题都应对所需的信息有所贡献,或服务于某些特定的目的。如果从一个问答题中得不到满意的使用数据,那么这个题目就应该取消。
5.决定结构根据调研的目的和要求,决定采用封闭式、开放式、量表评分式的构成组合,确定问卷结构。
6.测评调优要设计出好的调研方案,必须考虑这样几个问题:
1)调研是否能提供必要的训练决策信息,即训练师需要解决问题的信息。任何调研的目的和主要作用都是为管理者提供决策所需的信息,任何不能提供管理或决策重要信息的调研都应被放弃或修改。
2)调研是否考虑到被调研者的情况。考虑到被调研者,调研表应该简洁、有趣、具有逻辑性并且方式明确,调研不仅要考虑主题和受访者的类型,还要考虑受访的环境和调研问卷的长度。
3)调研是否满足从调研信息中获取信息数据、信息背后反馈的决策内容化的要求,即调研结果的编辑和信息处理。一旦调研信息收集完毕,就要进行编纽,以固定的格式和要求将调研结果进行转化。例如:调研问卷是以评分形式反馈(请您用0-5分来评价您对在线机器人服务的满意程度)。
五、总结优秀的在线服务机器人的核心价值就在于“智能链接客户,重塑客户体验”即通过智能化打造更加精准的服务,重塑服务价值。
价值是需求背后的核心,优秀的训练师需要通过实地调研的方式,深入在线机器人服务的干系对象当中去,获取用户需求;同时应该避免被需求的表象所迷惑,重点关注需求背后的真正诉求,看透事物的本质,加强思辨能力,在训练过程中不断思考、不断迭代,唯有如此才能保证需求的正确性。
本文由@F原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自pexels,基于CC0协议
美团智能客服核心技术与实践
客服是在用户服务体验不完美的情况下,尽可能帮助体验顺畅进行下去的一种解决办法,是问题发生后的一种兜底方案。而智能客服能让大部分简单的问题得以快速自助解决,让复杂问题有机会被人工高效解决。在用户服务的全旅程中,美团平台/搜索与NLP部提供了问题推荐、问题理解、对话管理、答案供给、话术推荐和会话摘要等六大智能客服核心能力,以期达到低成本、高效率、高质量地与用户进行沟通的目的。本文主要介绍了美团智能客服核心技术以及在美团的实践。
1背景目前,美团的年交易用户量为6.3亿,服务了770万生活服务类商家。此外,在美团优选业务中还有一个很大的团长群体。美团平台涵盖吃、住、行、游、购、娱等200多个生活服务品类,在平台服务的售前、售中、售后各个环节,都有大量信息咨询、订单状态获取以及申诉投诉等沟通诉求。另外,作为一家拥有几万名员工的上市企业,员工之间亦有大量的沟通诉求。面对以上这些需求,如果都是通过人力进行实现,显然不符合公司长远发展的目标,这就需要引入智能客服。
1.1面对不同场景的智能客服落地首先,我们看看日常生活中几种最为常见的客服场景。
售前场景:比如消费者在平台选择入住酒店,对房型价格、酒店设施、入退房政策等,下单前都有很强的信息咨询诉求。售中场景:比如外卖催单还没到,添加备注不要辣、加开发票等咨询等等,售前和售中场景主要发生在消费者和商家或平台之间。售后场景:比如外卖场景投诉菜品少送、骑手送餐超时、要求退款等,酒店场景投诉酒店到店无法入住等,售后往往涉及到客服座席、消费者、骑手和商家,需要多方协同解决。办公场景:比如IT、人力资源、财务、法务等咨询,产运研对提供的接口产品的咨询答疑,产品对销售顾问的答疑,以及销售顾问对商家的答疑等等。1.2面对不同人群的智能客服落地沟通是人类的一项基本需求,在绝大多数场景下,我们对沟通的追求都是以低成本、高效率和高质量为目标,而对话机器人也需要同时满足这三点要求。目前我们按照服务的群体进行划分,智能客服落地场景大体可以分为以下四类:
面向用户:提供智能客服机器人,来帮助他们自助解决大部分的问题。面向座席:用话术推荐或者会话摘要等能力来提升人工座席的工作效率,改善人工座席的工作体验。面向商家:打造商家助手来降低商家回复的费力度,改善消费者和商家的沟通体验。面向员工:通过对话机器人,可以自助给员工进行答疑,从而提升办公效率。1.3智能客服是什么要回答智能客服是什么,可以先看看客服是什么。我们的理解是,客服是在用户服务体验不完美的时候,来帮助体验顺畅进行下去的一种解决办法,是问题发生后的一种兜底方案。而智能客服能让大部分简单的问题得以快速自助解决,让复杂问题有机会被人工高效解决。
上图展示的是用户服务旅程。首先,用户会通过在线打字或者拨打热线电话的方式进线寻求服务,其中在线咨询流量占比在85%以上。当用户进入到服务门户后,先是用户表达需求,然后是智能机器人响应需求,过程中机器人先要理解问题,比如是追加备注或是修改地址,还是申请退款等等,继而机器人尝试自助解决。如果解决不了,再及时地流转到人工进行兜底服务。最后,当用户离开服务时,系统会发送调查问卷,期待用户对本次服务进行评价。
2智能客服核心技术2.1对话交互技术概述智能客服背后的技术主要是以对话交互技术为核心。常见的对话任务可分为闲聊型、任务型和问答型:
闲聊型:通常是不关注某项特定任务,它的主要的目标是和人进行开放领域的对话,关注点是生成流畅、合理且自然的回复。任务型:通常是帮助用户完成某项任务指令,如查找酒店、查询订单状态、解决用户的退款申请等等。用户的需求通常比较复杂,需要通过多轮交互来不断收集任务所需的必要信息,进而根据信息进行决策,执行不同的动作,最终完成用户的指令。问答型:侧重于一问一答,即直接根据用户的问题给出精准答案。问答型和任务型最本质的区别在于,系统是否需要维护一个用户目标状态的表示和是否需要一个决策过程来完成任务。在技术实现上,通常又可以划分为检索式、生成式和任务式:
检索式:主要思路是从对话语料库中找出与输入语句最匹配的回复,这些回复通常是预先存储的数据。生成式:主要思路是基于深度学习的Encoder-Decoder架构,从大量语料中习得语言能力,根据问题内容及相关实时状态信息直接生成回答话术。任务式:就是任务型对话,通常要维护一个对话状态,根据不同的对话状态决策下一步动作,是查询数据库还是回复用户等等。闲聊、问答、任务型对话本质都是在被动地响应用户需求。在具体业务中还会有问题推荐、商品推荐等来主动引导用户交互。在美团的业务场景里主要是任务型和问答型,中间也会穿插一些闲聊,闲聊主要是打招呼或者简单情绪安抚,起到润滑人机对话的作用。
如前面用户服务流程所介绍的那样,用户的沟通对象可能有两个,除了跟机器人沟通外,还可能跟人工沟通。如果是找客服场景人工就是客服座席,如果是找商家场景人工就是商家。机器人的能力主要包括问题推荐、问题理解、对话管理以及答案供给。
目前,衡量机器人能力好坏的核心输出指标是不满意度和转人工率,分别衡量问题解决的好坏,以及能帮人工处理多少问题。而在人工辅助方面,我们提供了话术推荐和会话摘要等能力,核心指标是ATT和ACW的降低,ATT是人工和用户的平均沟通时长,ACW是人工沟通后的其它处理时长。
2.2智能机器人——多轮对话这是一个真实的多轮对话的例子。当用户进入到服务门户后,先选择了一个推荐的问题“如何联系骑手”,机器人给出了联系方式致电骑手。同时为了进一步厘清场景,询问用户是否收到了餐品,当用户选择“还没有收到”的时候,结合预计送达时间和当前时间,发现还未超时,给出的方案是“好的,帮用户催一下”,或者是“我再等等吧”,这时候用户选择了“我再等等吧”。
这个例子背后的机器人是怎么工作的呢?首先当用户输入“如何联系骑手”的时候,问题理解模块将它与知识库中的拓展问进行匹配,进而得到对应的标准问即意图“如何联系骑手”。然后对话管理模块根据意图“如何联系骑手”触发相应的任务流程,先查询订单接口,获取骑手电话号码,进而输出对话状态给到答案生成模块,根据模板生成最终结果,如右边的红框内容所示。在这个过程中涉及到要先有意图体系、定义好Task流程,以及订单的查询接口,这些都是业务强相关的,主要由各业务的运营团队来维护。那么,对话系统要做的是什么呢?一是将用户的输入与意图体系中的标准问进行匹配,二是完成多轮交互里面的调度。
问题理解是将用户问题与意图体系进行匹配,匹配到的拓展问所对应的标准问即用户意图。机器人的工作过程实际是要做召回和精排两件事情。召回更多地是用现有检索引擎实现,技术上更多地关注精排。
美团自研的智能客服系统是从2018年开始搭建的,在建设的过程中,我们不断地将业界最先进的技术引入到我们的系统中来,同时根据美团业务的特点,以及问题理解这个任务的特点,对这些技术进行适配。
比如说,当2018年底BERT(参见《美团BERT的探索和实践》一文)出现的时候,我们很快全量使用BERT替换原来的DSSM模型。后面,又根据美团客服对话的特点,我们将BERT进行了二次训练及在线学习改造,同时为了避免业务之间的干扰,以及通过增加知识区分性降低噪音的干扰,我们还做了多任务学习(各业务在上层为独立任务)以及多域学习(Query与拓展问匹配,改为与拓展问、标准问和答案的整体匹配),最终我们的模型为OnlineLearningbasedMulti-taskMulti-FieldRoBERTa。经过这样一系列技术迭代,我们的识别准确率也从最初不到80%到现在接近90%的水平。
理解了用户意图后,有些问题是可以直接给出答案解决的,而有些问题则需要进一步厘清。比如说“如何申请餐损”这个例子,不是直接告诉申请的方法,而是先厘清是哪一个订单,是否影响食用,进而厘清一些用户的诉求是部分退款还是想安排补送,从而给出不同的解决方案。这样的一个流程是跟业务强相关的,需要由业务的运营团队来进行定义。如右边任务流程树所示,我们首先提供了可视化的TaskFlow编辑工具,并且把外呼、地图以及API等都组件化,然后业务运营人员可以通过拖拽的方式来完成Task流程设计。
对话引擎在与用户的真实交互中,要完成Task内各步骤的匹配调度。比如这个例子里用户如果不是点选”可以但影响就餐了…”这条,而是自己输入说“还行,我要部分退款”,怎么办?这个意图也没有提前定义,这就需要对话引擎支持Task内各步骤的模糊匹配。我们基于BayesNetwork搭建的TaskFlowEngine恰好能支持规则和概率的结合,这里的模糊匹配算法复用了问题理解模型的语义匹配能力。
这是另外一个例子,在用户问完“会员能否退订”后,机器人回复的是“无法退回”,虽然回答了这个问题,但这个时候用户很容易不满意,转而去寻找人工服务。如果这个时候我们除了给出答案外,还去厘清问题背后的真实原因,引导询问用户是“外卖红包无法使用”或者是“因换绑手机导致的问题”,基于顺承关系建模,用户大概率是这些情况,用户很有可能会选择,从而会话可以进一步进行,并给出更加精细的解决方案,也减少了用户直接转人工服务的行为。
这个引导任务称为多轮话题引导,具体做法是对会话日志中的事件共现关系以及顺承关系进行建模。如右边图所示,这里原本是要建模句子级之间的引导,考虑到句子稀疏性,我们是将其抽象到事件之间的引导,共现关系我们用的是经典的协同过滤方式建模。另外,考虑到事件之间的方向性,我们对事件之间的顺承关系进行建模,公式如下:
并通过多目标学习,同时考虑点击指标和任务指标,如在非转人工客服数据和非不满意数据上分别建模顺承关系,公式如下:
最终,我们在点击率、不满意度、转人工率层面,都取得了非常正向的收益。
美团平台涵盖吃、住、行、游、购、娱等200多个生活服务品类,当用户是从美团App或点评App等综合服务门户入口进入服务时,需要先行确定用户要咨询的是哪个业务,这里的一个任务是“判断用户Query是属于哪个业务”,该任务我们叫做领域识别。若能明确判断领域时,则直接用该领域知识来解答;当不能明确判断时,则还需要多轮对话交互与用户进行澄清。比如用户输入“我要退款”,在多个业务里都存在退款意图,这个时候就需要我们先判断是哪个业务的退款意图,如果判断置信度不高,则给出业务列表让用户自行选择来进行澄清。
领域识别模型主要是对三类数据建模:各领域知识库的有标数据、各领域大量弱监督无标数据和个性化数据。
依据从各领域知识库的有标数据中学习得到的问题理解模型信号,可以判断用户输入属于各业务各意图的可能性。我们注意到除了美团App、点评App等综合服务入口涉及多个业务外,还有大量能够明确业务的入口,比如说订单入口,从商品详情页进来的入口,这些入口进来的对话数据是有明确业务标签信息的。因此,我们可以得到大量的弱监督的各业务领域的数据,基于这些数据我们可以训练一个一级分类模型。同时,有些问题是需要结合用户订单状态等个性化数据才能进一步明确的。比如“我要退款”,多个业务里都会有。因此,又要结合用户状态特征一起来训练一个二级模型,最终来判断用户的输入属于哪个业务。最终,该二级领域识别模型在满意度、转人工率以及成功转接率指标上都取得了非常不错的收益。
2.3智能机器人——问题推荐在介绍完多轮对话基础模块问题理解和对话管理后,接下来我们介绍一下智能机器人的另外两个模块:问题推荐和答案供给。如前面多轮对话的例子所示,当用户进入服务门户后,机器人首先是要如何引导用户精准地表达需求,这样即可降低用户迷失或者直接转人工服务,也降低了若机器人不能正确理解时带来的多轮澄清等无效交互。
该问题是一个标准的曝光点击问题,它的本质是推荐问题。我们采用了CTR预估任务经典的FM模型来作为基础模型,同时结合业务目标,期望用户点击的问题的解决方案能够解决用户问题,该问题最终定义为“曝光、点击、解决”问题,最终的模型是结合多目标学习的ESSM-FM,对有效交互的转化率、转人工率和不满意度等指标上都带来了提升。
2.4智能机器人——答案供给售后客服场景通常问题较集中,且问题的解决多依赖业务内部系统数据及规则,通常是业务部门维护知识库,包括意图体系、Task流程和答案等。但在售前场景,知识多来自于商户或商品本身、用户体验及评价信息等,具有用户问题开放、知识密度高、人工难以整理答案等特点。比如去哪个城市哪个景点游玩,附近有哪些酒店,酒店是否有浴缸,酒店地址在哪里等,都需要咨询”决策”,针对这些诉求,我们通过智能问答来解决咨询以及答案供给问题。
智能问答就是从美团数据中习得答案供给,来快速回答用户的问题,基于不同的数据源,我们建设了不同的问答技术。
针对商家基础信息,比如问营业时间、地址、价格等,我们通过图谱问答(KBQA)来解决。利用商家基础信息构建图谱,通过问题理解模型来理解问题,进而查询图谱获取准确的答案。针对社区数据,即商户详情页中“问大家”模块的用户问用户答的社区数据,构建社区问答(CommunityQA)能力,通过对用户问题与问大家中的”问答对”的相似度建模,选择相似度最高的作为答案,来回答用户的一些开放性问题。针对UGC评论数据以及商户政策等无结构化数据,构建文档问答(DocumentQA)能力,针对用户问题利用机器阅读理解技术从文档中抽取答案,类似我们小时候语文考试中的阅读理解题,进一步回答用户的一些开放性问题。最后,针对多个问答模块给出的答案,进行多答案来源的答案融合排序,来挑选最终的答案,此外这里还考察了答案真实性,即对“相信多数认为正确的则正确”建模。这部分的详细介绍大家可以参考《美团智能问答技术探索与实践》一文。
3人工辅助核心技术3.1人工辅助——话术推荐前文介绍的都是智能机器人技术,用户除了跟机器人沟通外,还可能是跟人工沟通。我们在客服座席职场调研过程中发现,座席在与用户的对话聊天中经常回复相似甚至相同的话术,他们一致期望提供话术推荐的能力来提高效率。此外,除了请求客服座席帮助外,很多情况下用户与商家直接沟通会使得解决问题更高效,而沟通效率不仅影响到消费者的体验,也影响到了商家的经营。比如在外卖业务中,消费者的下单率和商家的回复时长有较为明显的反比关系,无论是客服座席还是商家,都有很强的话术推荐诉求。
那么,话术推荐具体要怎么做呢?常见的做法是先准备好常用通用话术库,部分座席或商家也会准备个人常见话术库,然后系统根据用户的Query及上下文来检索最合适的话术来推荐。我们根据调查发现,这部分知识库维护得很不好,既有业务知识变更频繁导致已维护的知识很快不可用因素,也有座席或商家本身意愿不强的因素等。另外,针对新客服座席或者新商家,可用的经验更少。因此我们采用了自动记忆每个座席及其同技能组的历史聊天话术,商家及其同品类商家的历史聊天话术,根据当前输入及上下文,预测接下来可能的回复话术,无需人工进行整理,大大提升了效率。
我们将历史聊天记录构建成“N+1”QA问答对的形式建模,前N句看作问题Q,后1句作为回复话术A,整个框架就可以转化成检索式的问答模型。在召回阶段,除了文本信息召回外,我们还加入了上文多轮槽位标签,Topic标签等召回优化,排序为基于BERT的模型,加入角色信息建模,角色为用户、商家或者座席。
整个架构如上图所示,分为离线和在线两部分。另外上线后我们也加入了一层CTR预估模型来提升采纳率。当前多个业务的话术推荐平均采纳率在24%左右,覆盖率在85%左右。话术推荐特别是对新座席员工价值更大,新员工通常难以组织话术,通过采纳推荐的话术可以来缩减熟练周期,观测发现,3个月内座席员工的平均采纳率是3个月以上座席员工的3倍。
3.2人工辅助——会话摘要在客服场景座席跟用户沟通完后,还需要对一些必要信息进行工单纪要,包括是什么事件,事件发生的背景是什么,用户的诉求是什么,最后的处理结果是什么等等。而填写这些内容对座席来说其实是很不友好,通常需进行总结归纳,特别是有些沟通进行的时间还比较长,需要来回翻看对话历史才能正确总结。另外,为了持续对于服务产品进行改善,也需要对会话日志进行相应事件抽取及打上标签,从而方便经营分析。
这里有些问题是选择题,有些问题是填空题,比如这通会话具体聊的是哪个事件,我们提前整理有比较完整的事件体系,可以看成是个选择题,可以用分类或者语义相似度计算模型来解决。又比如说事件发生的背景,如外卖退款的背景是因餐撒了、酒店退款的背景是到店没有房间等,是个开放性问题,分析发现可以很好地从对话内容中抽取,可以用摘要抽取模型来解决。而对于处理结果,不仅仅依赖对话内容,还包括是否外呼,外呼了是否商家接通了,后续是否需要回访等等,我们实验发现生成模型更有效。具体使用的模型如上图所示,这里事件选择考虑到经常有新事件的添加,我们转成了双塔的相似度计算任务,背景抽取采用的是BERT-Sum模型,处理结果采用的是谷歌的PEGASUS模型。
04小结与下一步计划4.1小结——交互立方前面介绍了美团智能客服实践中的一些核心技术,过程中也穿插着介绍了客服座席与消费者/商家/骑手/团长等之间的沟通提效,以及消费者与商家之间的沟通提效。除了这两部分之外,在企业办公场景,其实还有员工之间、销售顾问与商家之间的大量沟通。如果一个个去做,成本高且效率低,解决方案是把智能客服中沉淀的能力进行平台化,最好“一揽子”进行解决,以固定成本来支持更多的业务需求。于是我们搭建了美团的对话平台-摩西对话平台,用“一揽子”方案以固定成本来解决各业务的智能客服需求。
4.2小结——对话平台“摩西”构建一个怎么样的对话平台,才能提供期望的没有NLP能力的团队也能拥有很好的对话机器人呢?首先是把对话能力工具化和流程化。如上图所示,系统可分为四层:应用场景层、解决方案层、对话能力层、平台功能层。
应用场景层:在售前应用场景,一类需求是商家助手,如图中所列的美团闪购IM助手和到综IM助手,需要辅助商家输入和机器人部分接管高频问题能力;还有一类需求是在没有商家IM的场景需要智能问答来填补咨询空缺,比如图中所列的酒店问一问和景点问答搜索;另外售中、售后以及企业办公场景,各自需求也不尽相同。解决方案层:这就要求我们有几套解决方案,大概可以分为智能机器人、智能问答、商家辅助、座席辅助等。每个解决方案的对话能力要求也有所不同,这些解决方案是需要很方便地对基础对话能力进行组装,对使用方是透明的,可以拿来即用。对话能力层:前面也进行了相应的介绍,六大核心能力包括问题推荐、问题理解、对话管理、答案供给、话术推荐和会话摘要。平台功能层:此外,我们需要提供配套的运营能力,提供给业务方的运营人员来日常维护知识库、数据分析等等。其次,提供“一揽子”的解决方案,还需要针对处在不同阶段的业务提供不同阶段的解决方案。
有些业务只希望维护好常用的问答,能回答高频的问题就好,那么他们只需要维护一个入门级的机器人,只需要在意图管理模块来维护它的意图,意图的常见说法以及答案就可以了。而对于有运营资源的团队,他们希望不断地去丰富知识库来提升问答能力,这个时候可以使用知识发现模块,可以自动地从每天的日志里面发现新意图及意图的新说法,运营人员只需要每天花一点时间来确认添加及维护答案即可,这是一个进阶的业务方。还有一些高级的业务方希望调用他们业务中的API来完成复杂问题的求解。这个时候他们可以使用TaskFlow编辑引擎,在平台上直接注册业务的API,通过可视化拖拽的方式来完成Task编辑。此外,为了进一步方便更多的业务介入,我们也提供了一些闲聊、通用指令、地区查询等官方技能包,业务方可以直接勾选使用。另外,随着我们不断在业务中沉淀,也会有越来越多的官方行业技能包。整体方向上是逐步让业务方使用的门槛变得越来越低。
4.3下一步计划前文所介绍的对话系统是一种Pipeline式对话系统,按照功能划分为不同的模块,各个模块单独建模,依次串联。这种方式的好处是可以做到不同团队职责的有效分工,比如研发同学专注于建设好问题推荐模型、问题理解模型和Task引擎等;业务运营同学专注于意图体系维护、Task流程设计以及答案设计等等。它的劣势也很明显,模块耦合,误差累积,很难联合优化,进而各模块负责的同学可能会去修修补补,容易导致动作变形。
另一类建模方式是End-to-End,将Pipeline式对话系统的各个模块联合建模成一个模型,直接实现语言到语言的转变,此类方法最初应用在闲聊式对话系统里面,近期随着大规模预训练模型的快速发展,学术上也逐渐开始研究基于预训练模型的端到端任务型对话系统。它的优点是模型可以充分利用无监督人人会话,用数据驱动可以快速迭代;缺点是模型的可控性差,不易解释且缺乏干预能力。目前主要以学术研究为主,未见成熟的应用案例。
除了使用这种大量无监督的人人会话日志外,还有一种思路是基于Rule-BasedTaskFlow构建规则的用户模拟器,进行交互以生成大量的对话数据,进而训练对话模型。为了保证对话系统的鲁棒性,也可使用类似对抗攻击的方法优化,可以模拟HardUser的行为,不按顺序执行TaskFlow,随机打断、跳转某个对话节点等等。
此外,通过对比分析人机对话日志和人人对话日志,人机对话比较僵硬死板,无法有效捕捉用户的情绪,而人就很擅长这方面。这在客服场景非常重要,用户往往进来就是带着负面情绪的,机器人需要有共情能力。而端到端数据驱动的对话和对话共情能力建设,也将是接下来一段时间我们尝试的重点方向。
智能客服机器人的衡量指标体系
编辑导读:智能客服机器人已经成为了很多企业售后的标配产品,它能在一定程度上减轻客服人员的压力。如何衡量一个智能客服机器人是否好用,这就需要制定系统化的指标和优化方案。本文将从数据指标和如何细化两个方面,对智能客服机器人的衡量指标体系展开分析,与你分享。
智能客服机器人慢慢成为了很多企业售后环节的标配产品,同时市面上智能客服供应商也如雨后春笋般涌现,大家都宣称自己的机器人多么智能。但很多时候,上线后要让机器人发挥作用,不是“多么智能”几个字就能达到目标。里面需要团队中的产品、运营、算法等人一起努力。当然,很多团队由于没有经验,这个过程会像丈二的和尚摸不着头脑,需要进行多次摸索才能知道该如何优化。
所以,今天要讨论的,就是如何系统化去衡量机器人的效果,从而帮助团队针对性高效优化机器人。
说明:本次讨论的范围限于售后服务的文本机器人。
一、数据指标1.北极星指标说到衡量效果,就需要提到数据指标。
每款产品都有很多数据指标,而我们要找的应该是最核心的指标,即业界说的【北极星指标】。这个指标一定是最能体现业务目标的。
比如闲聊机器人是为了陪伴用户度过每个无聊的日子,北极星指标应该是活跃度和留存率;营销机器人是为了让用户下单,北极星指标应该是营销转化率。同样的客服机器人是为了解决用户疑惑,不用转人工从而降低成本,所以北极星指标应该是【独立接待率】,与其相反的就是【转人工率】。维护客服机器人,其实就是不断提高独立接待率,降低转人工率。
找到这个核心指标不是完事,毕竟这个指标可能连我不怎么用网络的舅舅都知道。这只是一个开始,接下来还得知道哪些因素会影响该指标,才能从这些方向针对性地优化机器人。
2.客服业务流要想降低转人工率,也就是机器人能帮客户解决更多问题,那就要求机器人能像人工客服一样,甚至做得比人工客服更好,才能让客户认可。我们回想下,客服在解答用户问题时,都做了哪些事?
小七总结了一下,客服的核心业务流分为三部分:
了解用户的问题:知道用户问的是什么问题,如果用户表达不清楚,还需要跟用户确认了解问题的解法:知道该问题如何解决,考验客服对业务的熟悉程度解答用户的问题:利用用户听得懂的表达来解答用户问题,且需要适时安抚3.机器人业务目标了解了客服的核心业务流之后,我们需要让机器人也能完成这个流程,从而让客户愿意接受机器人的答案,降低转人工率。对于机器人来说,要满足核心业务要求,需要其达到对应的能力。那具体对应是哪些能力,这里我根据以往的经验,做了一层映射。
了解用户的问题:准确知道用户问题的意图,若意图缺失,还需要与用户确认了解问题的解法:知道大部分业务问题的答案,能够在识别到用户意图之后给出解法解答用户的问题:回复话术需要让用户听得懂,听得舒服,保持人性化根据以上内容,我总结了降低机器人转人工率的三个方向以及对应指标,接下来我们就一个个方向进行细化。
二、细化1.识别得多不多识别得多不多,也就是机器人能不能理解用户更多意图,并给出相应回复。这里就要求机器人知识库能够覆盖更多业务问题,当业务覆盖率越高,机器人就能识别更多意图,解答更多业务问题。
业务问题可以通过聚类历史数据筛选出来,那如何从更细化的指标体现业务覆盖率呢?
一般来说,知识库覆盖的业务问题越多,机器人不知道的问题就越少,也就是无法识别的比例越低;对应能够识别且回复的问题越多,也就是直接回复比例越高。在这两者之间,还有一类间接回答的场景,也就是机器人大概知道但又不大确定的问题,就会推荐几个类似问题让用户确认。
总的来说,要衡量机器人识别得多不多,可以通过机器人回复类型来判断,目标就是:机器人回复的所有消息中,直接回答比例不断提升,间接回复和无法识别的比例不断降低。
2.识别得准不准我们想观察机器人识别得准不准,实际上就是在分析机器人自信认为理解了用户的意图,而事实上到底对不对。
机器人自信认为对的问题,也就是我们前面说的直接回答场景,也就是机器人直推且正确的消息数与机器人直推的消息数比例,可以归纳为【直推准确率】。当然,判断机器人直接回复准不准确,需要机器人训练师做人工质检,才能得到确切的数据。
另一方面,我们也可以考核机器人给出所有反馈的准确率,包括了直接回答和间接回答。虽然间接回答是机器人不大自信,没有给出直接答案,从而给出了推荐问题;但如果推荐问题都是错的,那就没有任何意义,甚至大大降低了用户体验,所以还是需要保证其准确性。
因此我们可以归纳为【综合准确率】,公式可以总结为:(机器人直推且正确的消息数+机器人间接回答且正确的消息数)/机器人直接+间接回答的总消息数。
当然,或许有人会有疑惑,机器人间接回答到底正不正确很难衡量,甚至人为质检都存在很大不确定性。确实,这个指标比较模糊,但我们可以从用户反馈动作来观察,也就是看机器人间接推荐了问题且用户采纳问题去查询答案的场景,我们就理解为机器人间接回答是正确的。从这个定义出发的话,我们也不需要进行人工质检,由系统根据用户反馈来进行统计。
3.回答得好不好业务覆盖也做了,准确性也保障了,最后就是要给出答案。衡量机器人回答得好不好,很大程度上跟AI能力无关,而是运营效果的衡量。运营人员给每条知识库问题配了答案之后,这个答案需要能够解决用户问题,安抚用户情绪,从而让用户不转人工。所以要看回答得好不好,一方面我们需要细化到每个FAQ的效果来看,另一方面这是一个非常主观的问题,所以我们需要将主观变为客观,也就是看针对每个答案,用户的反馈。
用户对机器人的反馈一般有两种,一种是转不转人工,另一种就是评价,对应的指标就是【答案解决率】和【答案的满意度】
答案解决率就是机器人给出了答案后,用户是否转人工,若是转人工了,说明答案无法解决用户问题,如果没有转人工,一定程度上可以理解为解答了用户问题。所以运营可以通过这个指标,筛选出答案转人工率最高的问题,进行针对性优化,提升答案解决率。
答案满意度是通过用户对机器人答案的点赞或者点踩来进行分析,我们可以分为整体点赞/点踩率和单个答案的点赞/点踩率,从整体和局部去分析机器人回答的好坏。例如某个答案的点踩率特别高,我们就需要进行策略调整,是不是换个回复内容,甚至牺牲转人工率,让其进入人工,从而保证用户体验。
三、总结好了,有了以上细化的衡量方向,我们就可以清晰地看出影响智能客服北极星指标的因素有哪些,总结如下图;同时我们通过具体数据,也能巩固知道应该往哪些方向去优化。
比如直接推荐比例很低,那就需要训练师覆盖更多的业务业务场景;直推准确率很低,就需要训练师增加相似问法,算法工程师调优模型;答案点踩率很高,就需要运营优化答案及回复策略。
作者:七侠 微信号:steseven 公众号:小七侠 欢迎交流!
本文由@steseven原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
阿里达摩院设计师分享:智能客服对话机器人的设计全流程
随着智能技术的不断发展与深入,对话机器人的应用越来越普遍,展现了高效、24小时在线沟通等效果,一定程度上弥补了人工客服的不足。那么,对设计师来说,这类智能客服对话机器人又是如何设计出来的呢?它的设计流程又是怎样的呢?笔者以阿里客服小蜜的对话机器人为例,向我们展现了系统设计的全流程。
一、背景随着智能技术的发展,越来越多的客服咨询都开始交由对话机器人解决。
就在最近,冠状病毒疫情爆发,大量民众通过手机或电脑咨询政府以了解最新的疫情信息和防控措施。在这特殊情况下,原本的人工客服是无法承接这么多咨询的,而客服对话机器人就解了燃眉之急。
比如阿里巴巴推出的客服对话机器人与多个政府的卫健委合作,提供了“在线疫情知识问答”功能,为急切的用户提供7天24小时无停歇的准确回答,大大缓解了政府的服务压力。
这次阿里疫情客服对话机器人的方案源于集团在电商智能客服领域的沉淀,产品技术和设计都在双十一活动以及日常的咨询场景中积累了相关的经验。而我作为设计师,也想分享一下在设计客服对话机器人过程中的一些思考。希望能抛砖引玉,让更多的设计师参与或关注。
二、什么是对话机器人首先想和大家分享一下对话机器人的概念。对话机器人是模拟人类对话聊天形式并提供服务的程序。对话机器人之所以被广泛应用,是因为名称中的“对话”和“机器人”分别为用户和服务提供方提供了价值。
先说说“对话”,对于寻求服务的用户,不同于查看网站或阅读,对话机器人模拟了自然的交互方式。
不管是钉钉、微信这样的即时聊天工具,还是天猫精灵的语音交互硬件,都在模拟一种有对话感的沟通。而这种沟通学习成本很低,效率却很高。并且聊天工具所保留的聊天记录也让信息的追溯更加方便。
再说说“机器人”,对于服务提供方,对话机器人能“以一敌百”永不停歇地替代人工完成了部分咨询的工作,这能大大降低咨询排队的现象,并缓解服务压力。同时还可以在人工下班的时候延续服务。
还有一点,在人工成本越来越高的今天,对话机器人真的可以为服务提供方省下大量的成本。
三、对话机器人的分类对话机器人有不同的分类方式:
如果按行业区分的话,就包含了:客服机器人(阿里客服小蜜)、助理机器人(天猫精灵)、情感陪聊机器人(微软小冰)、理财机器人(支付宝智能助理小钻风)、以及企业前台机器人和企业内部机器人(钉钉智能工作助理)等等。
按对话的交互方式看,包含了:文字交互、语音交互、甚至还有线下大屏这种集合了文字、语音、触控等的复合型交互。
按对话的类型来看,对话服务一般包含了:问答、闲聊、和任务三种类型。
四、对话机器人的交互流程接下来咱们了解一下对话机器人的交互过程:
首先用户需要通过文字或语音向对话机器人的用户界面输入一段信息。紧接着机器人会识别并理解这段信息,判断这个由信息开启的对话是问答、闲聊还是任务,并给出相应的回应方案。
接下来,智能调度会判断机器人是否有解决能力:
如果机器人无法解决且有人工客服资源,就会转给人工。如果机器人自身能解决或没有人工客服,那么机器人会生成回复内容通过文字或语音在用户界面反馈给用户。这就完成了一次对话流程,以此往复。
五、对话机器人的设计方法在了解了对话机器人的概念、分类和交互流程后,咱们就可以进入下一步:对话机器人的设计流程。
因为我所在的设计团队主要研究客服对话机器人,所以我将会以阿里客服小蜜为例向大家介绍。
阿里客服小蜜是阿里巴巴为服务集团消费者而提供的平台咨询对话机器人。机器人的业务目标是提升客服效率和体验,把简单问题交给机器,复杂问题或需要情感安抚的问题交给人工。
那设计一款类似阿里客服小蜜的对话机器人会主要经历那些步骤呢?我经过梳理,我觉得大致有4步:
确认对话机器人的基础建设建立机器人的人设设计对话洞察用户提升对话体验1.确认对话机器人的基础建设在真正开始设计之前,我们要依次确认不同的基础环节,以便为之后的设计打好基础。
(1)领域
我们先要确认机器人服务的行业领域以及在该领域内服务方和用户的特点和诉求,以便为之后的人设设计、对话设计做参考。比如客服对话机器人,服务方是阿里巴巴客服部门,用户就是焦急要解决问题的用户。
(2)对话类型
确认对话是否包含了问答、任务、闲聊三种对话类型。
偏重是什么?优先级是什么?
比如客服小蜜主打问答和任务的对话类型,设计目标应该是迅速地解答用户问题。而微软小冰是闲聊为主,设计目标可能是不断引导新的对话,产生更多的对话轮次。
(3)对话基础能力
我们需要了解算法能力以及机器人回答调用的知识库是否已经完备、是否有专门的训练师标注优化。
因为了解算法能力和知识库的边界可以帮助设计师短时间聚焦设计范围,不在暂时无法实现的对话流程上花太多精力。
当然,算法能力的进步是飞速的,需要设计师不断与算法同学对焦以获得最新输入,设计出与时俱进的最优方案。
(4)交互方式
文字交互、语音交互或是语音大屏的复合交互在体验策略上肯定会有不同,因此要在设计之前明确交互形式并做好调研。如果方案包含多种交互方式,设计师也是要确认优先的交互手段,因为这会影响你在交互引导上的设计。
(5)设计对象
这里的设计对象指的是载体和渠道。载体是指展示对话的硬件,如手机、平板、大屏还是智能音箱无界面。不同的载体会对界面的设计产生很大的影响。
此外渠道也比较重要,指的是软件系统或平台,比如自行研发H5版的对话机器人,那限制较少。但如果你要集成到别人的对话聊天APP,你就得遵守对方平台的设计规范了。
2.建立机器人的人设(1)名称
一个完整的机器人名称包含了母品牌名称、领域、昵称、交互方式,服务形式几大元素,以便内外部用户精准了解产品的定位和重要信息。
比如“阿里客服小蜜对话机器人”:
“阿里”表明产品来源的公司,同时也暗示了它的服务领域大部分是阿里系的产品。“客服”表明产品要解决的是客户服务领域的问题,比如售前售后的咨询。“小蜜”是产品定位,非常核心。在这个案例中,小蜜谐音同小秘,有秘书助理的含义,同时小蜜又寓意了蜜蜂不辞辛苦的精神,与机器人永不停歇的服务理念相当吻合。“对话机器人”则明确了产品是以对话为主要交互形式,以机器人形象和界面呈现作为服务形式。当然,为了更方便品牌传播,品牌名称往往需要简单好记,于是我们往往会从完整名称删减部分内容保留最重要的部分,于是有了“阿里小蜜”“天猫精灵”这样的品牌名。
(2)形象
对话必然需要对象,而对话对象往往是需要形象呈现的。一般形象会有三种方向:人物、动物、机器人。
1)人物形象
又分真人,抽象人物两大类。真人是指真人照片或3D高拟似形象。抽象人物一般指在身材比例和五官头部大小做调整的卡通类形象,这些形象具有更强的亲和力。
需要注意的是,因为对话能力整体还不成熟,因此需要明确告诉用户和它对话的不是真人。
在对话聊天界面用真人照片表示聊天对象,会让用户以为机器人就是真人,提升了对服务品质的期待,但用户往往最终因机器人能力不完善未能满足期待而倍感失望。
在客服领域,有人工和机器人交接的时候,用真人照片就会让用户无法区分在服务他的是机器人还是真人,最终导致用户会对真人客服有不准确的评价。
而抽象人物形象,因为明确能感受到不是真人,所以不会造成误解。同时它又可以较好地规避恐怖谷的现象,比较推荐。
2)动物形象
因为在设定上往往比较拟人,所以也有很强的亲近性。比如天猫精灵,通过可爱的身材比例以及丰富的表情,可以生动地传达信息。因此,动物形象比较适合轻松一些的服务场景。
3)机器形象
首先它比较明确地告诉用户自己是一个机器人,在能力上可能有不足,能适当调整用户对服务品质的预期。
其次,由于在形象上的拟人性较低,能表达的情感却相对克制,所以就特别适合一些相对正式的场景,比如客服场景。这也是客服小蜜最终选用机器人形象的原因之一。
(3)个性
贴切的个性可以更好地传达服务。
首先个性会在机器人的服务形象上体现,所以在设计形象外观的时候需要参考个性。同时在服务过程中,个性会影响在不同的用户场景和意图下机器人回应的方式。
这些回应方式包含了机器人的对话剧本、话术、形象上的表情动作等等。这些都是设计师可以精心设计的地方。篇幅的关系,回应方式的设计先不展开描述。
那一开始如何定义服务形象的个性呢?
目前比较常用的方法有两种,一个是标杆分析法,一个是16型人格推导法。
1)标杆分析法
简单来说就是从已有的成功服务人员身上吸取特质。
在客服小蜜的案例中,我们通过和金牌客服人员沟通讨论,了解了他们在服务的时候会透露出谦卑、耐心、笃定的气质,并且面对不同类型的用户,他们也会有不同的表达方式。这在初期定义形象和话术设计上起到了比较大的帮助。
2)16型人格理论(MBTI)
为了更系统地归纳个性,后期我们还考虑参照了16型人格理论做补充。
16型人格是基于荣格的心理类型理论推演的理论,目前已经成为主流的性格测试工具的理论参考。
我们通过代入用户场景和特征,以服务机器人的身份判断“驱动力的的来源”,“接受信息的方式”,“决策的方式”“对外在世界的态度”的倾向。最终得出了我们客服服务机器人的个性,是“督导者型”。
大家可以测试一下自己要设计的机器人人格,并参照人格的行为特征为机器人设计回应方式。MBTI的测试地址:http://www.welefen.com/lab/mbti/
上面所提到的定义个性的方法肯定不是百分比科学严谨的。比如标杆分析法受限于样本量可能有偏颇,而16型人格的理论在学术界也存在一定的争议。但我们可以通过这些方法降低个性定义的不准确性,从而最大程度准确地建立最符合场景的服务个性。
3.设计对话当我们完成人设设计后,就可以设计对话的流程了。
文章开头有介绍对话交互的流程,而设计师就是要针对流程中的所有环节进行设计帮助用户完成对话。
特别是几个核心步骤:对话的开启,对话的互动,对话结果的展示,以及在客服场景会出现的机器人转入人工的环节。
由于笔者较熟悉基于即时聊天的对话形式,因此这里主要介绍此类对话的设计过程。(不包含语音相互,但部分原理相通)
(1)对话的开启
对于大部分用户,都是带着问题进入对话界面的,引入眼帘的必然是对话界面的首页。要在首页促成用户的有效点击进入对话,那么首页布局和引导就显得格外重要了。经过多年的沉淀,对话机器人首页布局相对比较成熟,主要遵从的原则是:
点击替代输入合理排序推荐模块有效空间展示更多内容1)点击替代文字输入
由于在描述问题时用文字输入成本相对高,所以在开启对话的时候,我还是尽量通过卡片组件和输入框上的快捷短语方式点击替代文字输入。
2)合理排序推荐模块
首先要和算法和产品充分沟通确认要展示的必要推荐模块,模块一般会分为两类:
与该用户强相关的问题平台用户最关注的问题所以考虑到用户进入首页由上往下的浏览习惯,设计上会根据用户问题的命中可能性由高到低进行排布,将用户待办事项和算法根据他订单状况猜测的问题放在页面较上侧,将基于平台所有用户分析的共性问题和需求放于稍下侧。这样用户可以更快地点击到想要的问题。
3)有效空间展示更多内容
由于屏幕空间有限,所以设计师需要思考如何有效利用交互展示较多的内容。常用的方法比如卡片的横向滑动、卡片内的tab切换,换一批更新以及点击展开完整卡片等形式。
这一部分的内容可以详细参看团队小伙伴CM的文章,地址:《如何优化人机对话对引导,促成用户满意度增长?》
(2)对话的互动
当我们从首页点击想咨询的内容后,就进入了对话流程。为保证对话的顺利完成,我们需要通过设计防止用户在对话流程中的流失。
第一,我们需要明确对话目标
因为在例如咨询和闲聊这样不同的场景,对话目标是不同的。在客服咨询的过程中,用户希望以最高效的方式解决用户的问题,然后离开。于是高效快速完结是对话目标。
但在闲聊的场景中,用户的目的可是解闷聊天,那对话目标应该是尽可能地回应和引导对话。因此不同的对话目标会影响设计对话的流程和引导强度。
第二,了解不同的表达习惯,罗列所有可能的提问逻辑
不同的人说话方式都不相同,比如:
有些人可以一句话表达自己的诉求;而有些人会说话吞吞吐吐,不能一次说清所有的要点,需要反复追问;有些人频繁改变主意,机器人需要不断更改意图;有些人压根没有主意,希望你给建议;或者有些人就是无聊打一些乱码挑逗机器人。情况真的比较纷繁复杂,设计师得为不同的表达习惯和提问逻辑设计机器人回应的方式。
第三,可返回退出
在对话的过程中难免会有误操作导致对话方向有误或无法进行下去的情况。别忘了提供回到上一步或退出整个对话的入口。
第四,降低输入成本
如果机器人可以通过调取记录的方式获取如用户的身份,用户的订单,用户的手机号等,那应该直接显示,让用户做简单的确认就好,这样就免去了复杂的输入操作。
如果一定要用户输入的内容的话,还是可以通过快捷短语的方式用点击替代输入提升效率。同时基于业务的判断你还可以将要确认的信息进行合并组合,让用户一次确认多个要点信息。
(3)对话结果的展示
在用户与机器人有效对话之后,机器人最终会将结果信息展示给用户。而结果的展示形式会非常影响用户理解结果信息的费力程度。所以设计师需要在展现形式上多做尝试。
1)文字展示
通常结果是一段文字,但文字的展现不一定要平铺直叙,有很多更好的展现可能。比如将较长的文字结构化成多段,并配有段落标题;或者将文字中最重要的信息通过颜色或加粗突出显示;添加EMOJI表情帮助指引阅读等等方法。
2)多模展示
针对不同的知识类型和用户特性,设计上可以采用不同模态的展示方式。
当单纯的图片文字不能方便理解的时候,可以考虑视频知识;当某些用户不方便阅读的时候,可以通过读播的方式朗读答案给用户;在展示和时间进度有关的知识时可以加入时间轴的概念,让用户对全局有感知。还有些知识适合沉浸式展现,比如天气信息可以通过页面皮肤的天气动画展现。
3)知识推荐
有时候机器人不确定自己命中的答案是否正确,因此需要推荐一些相似问题以防用户还有疑问。
(4)进入人工
虽然并不是每个对话机器人都有人工客服配合。但是对于客服咨询类的机器人产品,人工是不可或缺的。在设计上首先需要明确区分机器人和人工的区别。比如在进入人工的时候需要有明显的头像和内容上的提示,表明对话对象已经由机器人转化为人工了。
其次,要考虑在人工繁忙的时候,等待人工排队在所难免,是否可以通过安排一些互动内容降低用户在排队时的焦虑。
最后,当人工要断线切换回机器人的时候,是一种服务降级,也需要提前提示给到用户。
4. 洞察用户提升对话体验没错,完成前三步其实一个对话机器人就已经基本设计完成。但如果需要进一步提升用户体验,则少不了设计师对用户的仔细洞察。
(1)识别世界观和用户标志性行为
代入用户和世界观信息,以精细化服务;识别用户的标志性动作或情绪,以提升服务应变能力。
比如:机器人识别了用户身份、登录时间日期后为其展示合适的打招呼话术和界面皮肤。
又比如当用户在对话过程中有一段时间无操作的时候,说明可能遇到了操作上的困难,机器人需要主动询问或推荐新的服务。
又或者当识别了用户在对话中的负面情绪表达,则需要添加安抚或帮其升级服务的操作,诸如此类。
(2)挖掘用户的潜在需求
推导用户当前需求的下一步诉求和平级诉求,试图主动满足用户。比如:当用户咨询了津贴如何使用,说明用户有用津贴购物的意愿,因此可以推荐用户关注的并且可以使用津贴的商品。当用户建立了某一类日程提醒,说明他是一个愿意用提醒管理日程的人,机器人也可以推荐其他的提醒服务。
六、总结以上比较系统地介绍了我对话机器人设计流程的思考,希望给感兴趣的朋友一些帮助。
其实我们阿里巴巴达摩院设计团队一直在思考如何将我们沉淀的能力复用到更多的场景。因此我们和集团的前端团队共同将对话机器人里常用的组件进行了整理和代码化,沉淀了对话机器人场景的UI组件系统:ChatUI。
目前我们已经支持阿里集团除客服小蜜以外的飞猪、盒马、虾米、大麦、饿了么、优酷等80多个部门了,希望未来可以开放给更多外部的用户。也期待和各位感兴趣的朋友有更多的交流。
作者:夏晨曦(由夏),阿里巴巴智能产品设计部达摩院设计团队成员
本文由@夏晨曦Hans原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
智能客服在2023:从成本中心奔向价值中心
智能客服二十年,体现的不仅仅是技术、服务的演进,更是其从成本中心奔向价值中心行业价值重构。
作者|斗斗
编辑|皮爷
出品|产业家
智能客服正在迎来新的风口。
随着AI、5G等新兴技术的普及,以及新冠疫情的爆发,智能客服市场需求增加,人工客服接待、办公场所都暂停的时候,线上咨询渐多,潜力逐渐显现。
资本市场侧面印证了这一点。
据《2021年中国智能客服市场报告》显示,2020年中国智能客服行业投融资事件有23件,投资总金额为34.4亿元,同比增长123%。
另外,2021年上半年,中国智能客服投融资事件有13件,投资金额达23.4亿元,C轮至D轮融资事件占比高达50%。从投融资轮次来看,2021年上半年C轮至D轮投融资事件最为活跃,可见各细分赛道企业渐趋成熟。
其中,智齿科技、来也科技、乐言科技、Udesk、晓多科技、小能科技等智能客服厂商,颇受资本市场青睐。
从市场规模来看,2020年中国智能客服行业市场规模为30.1亿元,预计2025年中国智能客服行业市场规模或将突破百亿达102.5亿元。
另外,根据T研究和容联七陌《智能客服预见未来&智能客服趋势发展白皮书》具体数据来看,国内市场88.6%的企业拥有客服业务,22.1%的企业基于云的方式构建了智能客服。
虽然行业飞速地发展以及企业飞速地增长,让智能客服站上风口,智能服务厂商进入发展成熟期,但一个更真实的事实是:中国智能客服行业整体发展方面与欧美发达国家,仍然有着较大差距。
例如,在欧美,公有云企业智能客服市场规模2020年就已达到2000亿美元。
另外,根据CanamResearch调查数据显示,美国78%的客户联络中心在未来三年内部署人工智能,46%的客户服务互动已经实现自动化,预计到2023年将增长至59%。
中国智能客服市场还刚刚起步,正站在起点。
一、中国智能客服的一体化新阶段
一些微妙的变化正在发生。
上世纪90年代,互联网尚未普及,客服主要以电话沟通为主,呼叫中心主要是硬交换技术。进入千禧年,互联网开始普及,传统客服软件进入大型企业,基于软交换技术的呼叫中心出现。
2010年左右,移动互联网、云计算、大数据等技术开始应用,基于SaaS的云呼叫中心和云客服软件出现。
在新一代人工智能技术赋能下,客服系统与互联网交融,创新的智能化服务模式被引入客服中心。
值得注意的是,近几年,新生代客户对服务体验的需求升级,让客户联络从单一的售后服务,前置到品牌建设乃至客户生命周期的全链路节点。
另外一个层面,对企业而言,企业需要理解客户在各环节、场景的心智和行为,通过精准策略在各个触点增强与客户的互动。营销阶段前置服务、服务阶段叠加营销,服务与营销行为界限日渐模糊。
于是,随着客服的边界不断拓宽拓深,新的增长空间显现。智能客服在服务企业提供客服基础上,开始切入更多业务场景。换言之,企业与客户做沟通的所有环节,即售前、售中、售后全流程都成为智能客服厂商的布局范围。
例如,智能客服系统中融入了CRM系统,企业可以基于CRM系统开展客户分析和数据挖掘,以极大地提高成交签约概率,缩短营销开发周期。
针对已沟通、有成交意向的好友,可对其个人详细信息(行业、职业、文化程度、收入水平等)、消费信息(消费标准、消费习惯、品牌倾向等)、朋友圈特征(喜好、活跃时间等)、需求进行精准备注管理,并可自由设置标签,客户的个性化需求一目了然。
因此,客服人员可随时查看客户背景和需求,帮助回忆话题和关键信息。在最大程度做到挖掘更多意向客户,提取客户核心价值。
企业组织架构划分多为:市场部负责获客,销售部负责运营转化,客服部门负责服务。服务+营销是从客户生命周期出发,既对接好运营和销售部门做好营销客户的转化,还对接好了客服部门,做好了服务的交付。
基于此,服务环节不再需要采购单独的在线客服、CRM、OA等独立的产品,内部服务打破孤岛,实现数据串联。
然而对于智能客服厂商来说,“单兵作战”很难获得成功。
就拿CRM而言,其赛道已经逐渐进入寡头时代,形成强者愈强、弱者愈弱的马太效应。所以只靠单一产品,智能客服厂商很难在固有格局下抢到蛋糕。
在此背景下,从单模块化产品,奔向“服务+营销+协作+管理”全场景的功能覆盖一体化模式,成为当下智能客服厂商的“逐鹿之地”。
随着这一发展路径逐渐清晰,身处智能客服赛道的玩家们,也纷纷布局。
二、智能客服,中游排位赛
中游是当下智能客服赛道玩家的主要“竞技场”
在客服产业链中,上游为基础设施与智能技术厂商,中游客服厂商通过SaaS和人工智能技术,逐渐向产业链上下游延展,不断地拓宽下游应用领域边界。
其中,中游智能客服厂商从业务提供上可分为综合解决方案厂商、云客服厂商、客服机器人厂商以及传统客服转型厂商,各厂商加速AI技术沉淀推出客服机器人以及行业解决方案,跻身智能客服市场竞争。
首先是综合解决方案厂商,该厂商以大型企业客户、本地化部署为主。提供智能应用、通讯产品、与智能客服业务深度融合的综合性服务商,如腾讯企点依托腾讯云、网易七鱼、百度智能云等。具备生态能力和获客、定制化服务优势。劣势是客单价较高。
可见,这类厂商以互联网巨头为主领导力,对于这类厂商来说,布局智能客服,更多地是为B端企业提供平台和工具,从而更好服务高流量的C端用户。目前主要服务于自身生态体系,竞争意愿不强。
其次是客服机器人厂商,其依托人工智能技术的沉淀,围绕客服机器人延展全链条客服产品。如云问科技、小i机器人、微洱科技等。优势在于技术特色,劣势是研发周期较长。
此类厂商在AI技术上有较强的话语权,但相比提供全套产品的云客服厂商又相对较弱。
另外就是云客服厂商,其以中小型客户为主,提供SaaS产品的服务商,其中部分供应厂商具备上游云通讯能力,该类厂商具备较强的PaaS能力。优势在于部署成本较低,但这也带来了客单价较低的劣势。
例如智齿科技,其以软件+BPO,公域+私域、服务+营销,三个“一体化”的业务框架,打造了新的增长曲线。
值得注意的是,云客服厂商为了摆脱对客服机器人厂商的技术依赖,纷纷自研AI技术,同时整合产品和服务经验,正在通过提供行业解决方案,不断向下延伸。
最后是以大型客户、本地化部署为主的传统客服转型厂商。主要从传统呼叫中心及客服软件转型云客服解决方案,如小能科技从传统客服软件迈向智慧云客服解决方案服务商,专注服务于大型企业,拥有大量传统行业客户。
其优势在于大客户资源较为丰富,虽然此类厂商依靠稳固的大客户以及丰富的行业经验,在产业链上有较强的话语权,但由于转型较为迟缓,如果不能迅速转身,拥抱技术,未来的话语权获奖逐渐减弱。
在产业家看来,各类型厂商在短期内各有聚焦,但以客服SaaS为主的云客服厂商,对于当下企业数字化大环境来说,发展空间或许更大。
但长远来看,互联网巨头为主导的综合解决方案厂商,随着其业务规模不断扩大,构建生态体系,以客服SaaS为主导的云客服厂商难免不会出现“大鱼吃小鱼”的局面。
例如,早在此前,金蝶就战略投资了逸创,作为自己的生态体系的一部分;用友拟以合计20302.5万元获取智齿博创32.3661%的股份,成为智齿博创最大股东;中国保险行业最大的软件供应商中科软件,战略投资企业级软件服务商环信等。
然而,没有哪个赛道是轻而易举定性的,智能客服市场亦是如此。
未来,无论是多家寡头垄断亦或是独家垄断,对于智能客服厂商来说,找准客户,保证现有的现金流是上上之策。
三、一体化之后,下半场的垂直故事
破局需找准“刚需”,精准发力。
“智能客服火了,但手机屏幕那头血压却升高了。”一位知乎网友调侃道。
相关调查数据显示,80%的用户对智能客服的服务并不是很满意。沙利文公司《2021年中国智能客服市场报告》中也显示,仅30%企业使用智能客服感受整体服务效率提升。
另外,在中国青年报社社会调查中心对2018名受访者进行的一项调查结果显示,95.7%的受访者使用过智能客服,但其中仅有41.3%的受访者觉得智能客服好用。对此,《人民日报》也发表评论称,“智能客服不智能,AI反倒成障碍”。
虽然,某些智能客服头部厂商,旗下产品已经摘下“智障”的帽子,但商品是标准化的,服务往往却是个性化的。与其他智能产品不同的是,智能客服更加注重服务。
一个事实是,当下智能客服的仍有诸多的痛点,最为明显地一个便是“答非所问”的尴尬。
智能客服能被称为“智能”的主要原因,就是智能客服可以像人一样具有“交互能力”。所谓交互能力,至少要能做到一问一答,并且能够自动联系上下文。所以对于智能客服厂商来说,首先需要具备交互能力。
而交互能力需要极强的底层支撑。
例如专注于母婴领域的客服SaaS厂商,必然会比京东、淘宝等电商领域的客服SaaS厂商更为“智能”。那是因为前者专注于母婴领域,收集大量行业数据,打造了较为完善的知识图谱。所以,只要问题集中在母婴、珠宝等领域,自然会得到准确率较高的回答。
作为电商的京东,淘宝等,由于其覆盖面太广,细分领域的知识图谱并没有建立完善,再加上用户的问题五花八门、多种多样,就导致其陷入了什么都能答,却什么都答不准的尴尬境地。
智能客服需要源源不断的知识信息“喂养”和“训练”,许多传统资深的客服,已开始转岗为“客服AI”训练师,甚至创业向行业输出“解决方案”。
智能客服系统,不仅需要较高的AI技术实力,更需要背后有较深积累的“精算师”进行相关行业知识图谱的建立。在特定的行业领域做深,必然会成为智能客服的主要发展方向。
精细化发展时代,广撒网、多捕鱼、狂烧钱的经营策略已经不再适用,只有深挖井、广积粮,即深耕垂直行业、积累语料资源。
四、成本中心奔向价值中心
AI正在重塑客服中心的价值。
过去,客服除了售后投诉,就是售前问询;此外,很难为客服再找到更多有价值的用途了。
一个事实是,人工客服行业经过了多年发展,自身的演进却有限,从使用电话开始到现在,基本没有颠覆式创新。主要原因是大多人工客服系统在价值设计上并不帮助用户解决具体问题,只是为用户提供业务规则的解答。
“智能客服仅提供QA,只关注识别率,那么降本增效的对象就是只负责不停说话的基础客服。这个部分其实我不太关心,因为产品玩不出什么花样,而且商业价值低。”在这位业内人士看来,如果智能客服定位只在于基础客服的降本增效,抢的是传统客服外包行业的盘子。
换言之,智能客服降本增效的对象,应该是核心业务的操盘人员,致力于整个用户生命周期的全流程,强调专业服务端到端的自动完成。
随着客服中心智能化程度的纵深化发展,智能客服串联各个系统、各渠道企业数据,覆盖多元应用场景,拓展营销新职能,客服有望奔向价值中心。
过去,传统客服记录用户数据,理论上实现了海量数据的集合,但实际上,各类数据之间并未连接互通,数据无法转为企业的核心资产。
如今,智能客服可以打通全渠道数据,实现对市场的精准洞察,构建价值闭环,与企业、行业生态联动,推动企业营收增长。
另外,随着客服的功能向营销方向拓展,边界不断被突破,继而成为企业营收的直接推动力。
营销功能的完善,建立在智能客服对全域数据的整合、计算与分析的基础上。透过数据标签,实现消费行为与趋势的预判,从而进行更为精准的营销。
事实上,我国部分智能客服供应商已经在客服营销智能上进行了探索。比如在电商英语,智能导购功能模块的优化与完善,推动兴趣商品的精准触达,提升用户的转化与留存。
全域整合与营销功能的拓展实现联动后,构成了智能客服厂商的价值闭环,即透过数据,企业实现对市场及行业的精准洞察,推动精准营销的实现;而营销积累的客户群体,又为企业输送新鲜的数据,如此形成良性循环。
三十年来,客服系统因技术和外部环境变化,从形态到职责上都经历非常大的变迁。随着AI在行业领域的应用,客服系统向着高效率化、高品质化、高服务化迈进。
智能客服二十年,体现的不仅仅是技术、服务的演进,更是其从成本中心奔向价值中心行业价值重构。