博舍

智能外呼机器人核心技术:ASR 智能外呼机器人是什么

智能外呼机器人核心技术:ASR

原标题:智能外呼机器人核心技术:ASR

随着人工智能科技的发展,市场上也出现了越来越多的应用,光是人工智能语音识别系列的产品就非常多了,例如外呼机器人、早教机器人、智能音响等等。其中大部分应用产品都是陪伴或者娱乐性质为主,而智能外呼机器人是一款营销类产品,可以用于电销企业节约大量人力成本,提升工作效率。

智能外呼机器人是基于ASR、NLP、TTS等技术开发的一款人机交互的语音系统,可以智能得与客户交流,回答客户的问题,声音也是真人语音。如此强大的功能归功于人工智能的发展及技术的支持,今天小编就给大家介绍一下其中一项核心技术:ASR。

什么是ASR?

ASR全称是AutomaticSpeechRecognition,翻译为中文是语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与自然语言处理技术及语音合成技术相结合,可以构建出更加复杂的应用,例如智能外呼机器人。

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

展开全文

哪些公司拥有ASR技术?

国外智能语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audrey系统,它是第一个可以识别十个英文数字的语音识别系统。

国内语音识别研究工作起步于五十年代,从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项。国内语音识别技术的发展也非常迅速,现在的技术能力基本和国外差不多,其中BAT、科大讯飞、同花顺等互联网公司都拥有自主研发的语音识别技术。

目前市场上外呼机器人公司有很多,但是真正拥有自主研发的ASR技术公司几乎没有,因为中小型规模公司根本养不起这么一个技术团队,而外呼机器人公司恰恰都是刚成立的初创型企业。

自研ASR和外购ASR有何区别?

自主研发的ASR技术和外接采购的ASR技术区别大吗?从理论角度上来说,语音识别的准确率是差别不大的。但是从实际应用来说,因为识别引擎并不在本地服务器上,所以语音识别的准确率及稳定性都是差了一大截的,例如会因为网络的原因导致识别延迟、部分识别缺失、识别错误等等。

从费用角度来说,外购智能语音识别技术的费用在整个外呼机器人软件成本中占比不低,比如科大讯飞语音识别技术,一台机器人一年的费用估计在2000元左右;当然市场上也有免费的开源技术,科大讯飞、百度、阿里都有提供,识别效果可想而知。

从技术角度来说,产品的核心技术都不能掌握在自己手中,未来的发展是否能长远呢?返回搜狐,查看更多

责任编辑:

什么是智能外呼机器人

原标题:什么是智能外呼机器人?

AI智能语音机器人外呼系统

智能外呼机器人是人工智能在语音识别方面的典型应用,它能够自动发起电话外呼,以语音合成的自然人声形式,主动向用户群体介绍产品。

在外呼期间,它可以利用语音识别和自然语言处理技术获取客户意图,而后采用针对性话术与用户进行多轮交互会话,最后对用户进行目标分类,并自动记录每通电话的关键点,以成功完成外呼工作。我们云商AI智能语音系统采取真人语音,支持用户沟通打断,实现智能话语音对话,帮助客户有效筛选意向客户,提高工作效率

从2018年年初开始,智能外呼机器人呈现出喷井式兴起状态,它能够在互动过程中不带有情绪波动,并且自动完成应答、分类、记录和追踪,助力企业完成一些烦琐、重复和耗时的操作,从而解放人工,减少大量的人力成本和重复劳动力,让员工着力于目标客群,进而创造更高的商业价值。有效的解决穷电销企业培训难,人员流失大,工作效率不高等企业痛点,使用智能外呼系统普遍可以有效提高工作效率将近80%,是现在电销行业的不二选择。则当然智能外呼机器人也带来了另一面,即会对用户造成频繁的打扰。

基于维护用户的合法权益,促进语音呼叫服务端健康发展,2020年8月31日国家工信部下发了《通信短信息和语音呼叫服务管理规定(征求意见稿)》,意味着未来的外呼服务,无论人工还是人工智能,都需要持证上岗,而且还要在监管的监视下进行,这也对智能外呼机器人的用户体验和服务质量提出了更高的要求。我们云商AI不管是在哪一方面砺砺前行,把做好的服务带给用户!

想要了解更多外呼机器人的相关信息就关注我们“栩成云商”微信公众号吧!返回搜狐,查看更多

责任编辑:

优秀AI外呼机器人的核心能力与指标是什么

随着人工智能技术的发展,AI在越来越多的应用场景中落地生根,为经济社会的发展提升提供助力。基于深度神经学算法和卷积神经网络算法的AI外呼机器人就是其中之一,它是融合自动语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等多个门类的前沿技术集成的产品,这些技术保障了外呼机器人的精准、高效、稳定运行,是人工智能在语音识别方面的典型应用。

在实际应用中,AI外呼机器人不仅能自主与企业客户沟通,还能根据设定的专业用语描述业务和回答问题,并按照企业所制定的标准化流程,精准、快速地做出数据统计和业务反馈,大幅释放人工压力,全面提升企业效率。海量企业客服通话数据分析表明,客户提出的问题绝大部分是重复的,企业完全可以将这些问题建立成一个庞大的数据库,并借助AI机器人高效解决。为此,沃丰科技AI场景落地专家GaussMind打造了语音交互典型产品AI外呼机器人,成为越来越多企业的首选销售和服务工具,也正在不同的应用场景中广泛融入各行各业。

两大核心AI能力——自主交互·自动外呼

外呼机器人的AI特性,体现在能够实现和用户的自主交互以及有目的自动外呼。其最大的价值,在于通过即时性的拟人对话,实现快速理解用户意图、快速产生交互、快速给出解决方案并进行数据存储,将缓慢推进的工作转为全流程自动化处理。

自主交互主要通过三个步骤来实现,以沃丰科技的AI外呼机器人为例,在实际应用中,当用户与机器人产生对话和问询后,机器人首先需要依托ASR技术,将用户传过来的语音信息转换成文本信息,完成“接收用户信息”;其次通过NLP技术,将文本转化为系统能够识别的信号,实现“理解用户表达的意思”。最后机器人将会从数据库中寻找并提取出匹配的答案,但此时该答案仍然是文本形式,机器人便会通过TTS技术,将文本信息转化为语音信息播出,与用户完成最终的“交谈”。

借助于自动外呼技术,语音机器人可以主动触发外呼触达用户,用户接通后,机器人即可与用户互动,达成企业的业务目标。企业可以自主选择工作时间,来设置机器人的工作节奏,以求业务效果最大化。

三大核心指标——触达率·业务目标达成率·识别率

触达率(接通率)、业务目标达成率、识别率是体现外呼机器人落地到业务端的价值的重要数据。触达率(接通率)往往跟外呼时间、重呼策略等都有关系,为此沃丰科技外呼机器人提供完善的业务报表,可根据外呼时间、外呼主叫进行外呼接通率统计,用户可针对性分析,调整外呼配置信息,保证最终用户触达率。

对于外呼机器人来说业务目标达成率往往与交互体验直接相关,例如机器人说话是否“好听”,语感是否生硬等等。这就需要机器人能够提供比较真实有情绪的表达,让客户感受到沟通的温度。为此,沃丰科技一方面支持多种多样的合成音色,另一方面也提供真人录音的服务,保证外呼机器人与客户沟通的自然、亲和力。此外,话术引导也是达成较高触达率的重要部分,沃丰科技的数据显示,通过多套话术对比外呼,进行A/B测试最终选择实际外呼话术方案,能极大促进业务目标达成。

外呼机器人的识别率包含ASR识别准确率与NLP识别准确率,这两个数据在通用场景下都会有较高的表现,但在涉及行业特有词汇时,就需要单独做针对性优化。沃丰科技GaussMind的AI外呼模型覆盖不同的行业,技术团队会针对行业特有词汇或关联词汇进行特殊配置,例如家电行业配送或上门维修服务,就需要对地名做精准识别,而知识库中往往有很多同音字和词汇,GaussMind能够在提升适配准确率的同时,生成结果统计,输出业务分析报告,实现循环优化。

相比传统的触达方式,AI外呼机器人的优势是能够在未见面的前提下,为企业和客户之间建立联系,并在了解问题和应答话术之后,在一定程度上代替电销人员的工作,例如销售或者回访等。

沃丰科技作为中国人工智能与营销服务解决方案提供商,能够提供具有高度行业适配性的AI机器人为企业降低用人成本,有效避免员工每天从事重复性的工作,在管理端大幅提升员工效率,在业务端为企业实现高业务目标达成率,最终从根本上为企业实现营销效果、服务水平双提升。

如何从零搭建智能外呼场景

本文梳理了搭建智能外呼场景时,具体的5个操作阶段以及4个注意点。

一、前言

智能AI的快速发展,传统呼叫中心也在进行智能化改造,智能外呼本身可以理解为是传统呼叫中心外接了智能AI系统,多了3个模块,智能语音、智能机器人、智能外呼控制台,相较于传统外呼有以下3点优势:

降低人力成本,提升营销效率自动记录交互信息,各环节数据统计话术标准统一,避免营销不规范二、搭建流程

现在市面上也有不少语音机器人,各有特点,那么我们在搭建智能外呼场景时,具体要怎么去操作呢?我将其分为5个阶段:

注:默认系统全部搭建完毕并且已经对接完成,软硬件性能本文中暂不考虑,如延迟、并发等。

1.业务梳理

(1)业务流程:业务专家、机器人训练师、一线客服一起梳理业务流程,根据历史交互信息、客服的工作记录等内容梳理最合适的业务流程。

(2)业务系统交互场景:我们是否需要对接用户系统、付费系统、营销系统等,因为在用户的交互过程中可能需要去查询信息或者直接下单更改业务系统数据,这些都是在进行业务梳理时需要考虑的。

(3)呼叫中心指令:这里主要指的是字段对接,每个字段涉及到一些特殊指令,呼叫中心收到这个指令时就会进行相应的动作,例如放音、挂断、打断、进IVR、转人工等,这个需要双方进行对接测试。

(4)文档输出:目的就是为了方便机器人训练师和开发人员进行机器人配置:流程文档,接口文档,业务知识文档(一问一答、常用业务词、兜底话术等)。

2.构建对话机器人(对话流)

(1)主流程

就是指业务流程,根据梳理的业务流程图进行设计。做的比较不错的外呼厂家可以做到大部分场景界面化配置,无需开发能力,部分特殊场景可能需要代码来控制。

(2)全局流程

可以理解为用户在主流程中可以随时跳到全局流程中,全局流程交互完毕后还能回到主流程中进行之前没有完成的交互。跳回时需要给每个流程配置衔接词,做的比较好的话还可以设置次数和每次跳回回复不同的内容,用不同的话术去引导用户进行回答,而不是同样的内容在重复。

a.知识库设计:最简单的一问一答的形式,无特殊处理,支持跳回主流程。b.特殊流程:根据用户所在的环节,和提问的内容进行特殊处理的流程,主要涉及到放音、挂断、打断、进IVR、转人工。

例如用户说:我要转人工,这个时候就可以播放语音“正在为您转接人工,请稍后”,然后将线路切到人工坐席进行服务。

办理业务需要输入密码时,机器人就可以将这个特殊指令传给呼叫中心,呼叫中心收到这个指令就会转IVR,放音让用户进行按键,完成密码校验后重新回到机器人服务。

(3)话术

包括触发意图和回复内容设置。

a.触发意图设置:没啥好说的,正常的厂家就是穷举或者按照LGF规则去设置,有自己的算法去计算匹配度,达到对应的匹配度就会命中意图走流程。b.回复内容设置:用户听到的标准回复内容,不同的话术可能会带来不同的转化率,这个需要在上线后进行阶段性的规模测试调优,找出最佳话术,或者根据人群进行不同的话术设置。c.特殊指令设置,这个根据实际需要确定,包括和呼叫中心或者业务系统的对接构建的特殊指令。

(4)代码

这块根据实际业务和各个厂家的机器人确定,通过代码控制一些复杂流程。

3.测试

(1)内部测试

构建测试脚本,根据脚本邀请工作人员参与测试。

测试标准:识别率达到***,意图准确率达到***。

a.意图测试:每个意图节点都用意图测试脚本去测试意图是否正常命中b.流程测试:意图命中后,是否正常走流程c.ASR测试:测试识别情况是否达到预期d.TTS测试:测试放音情况是否有错误或者不自然之处

(2)预上线测试

参考内部测试内容,只不过这个测试面向的是批量的用户群,例如每天拨打小几百个,测试1周看效果是否可以达到上线条件。

4.问题分析及优化(循环)

(1)智能部分

1)语音识别

a.发音无问题,音对字不对。那么可以认为其是正确的,只不过要对同音字进行强化处理,简单的来说可以这么去理解,初始的识别模型“衣”和“医”都是相同的权重1,如果是在医学领域,更多情况下翻译成“医”,那么就可以去修改其权重,在出现同样的音时,优先翻译成“医生”。b.发音无问题,对了一部分或者完全不对:可以通过修改需要识别的词汇的权重或者语言模型优化实现,具体操作方式各家的ASR产品有所不同。正常简单的可以界面化训练,复杂的需要开发人员介入。c.发音问题:方言和口语,这种情况可以有2种处理办法,一种是将识别的内容强行配置在意图中(少量内容可以这么处理),如果是大范围的问题,就需要去进行声学模型的定制优化。

2)意图识别

标准问法:

a.看是否串了意图,其他对话流是否出现了这个意图,导致无法走到对应的流程,需要对重合的意图进行修改,尽量不要有重叠。b.出了bug,请联系厂家。

非标准问法:串意图,并且匹配度低,可以通过修改意图的形式去匹配。

3)回复内容

a.有答案,意图未命中:修改意图以匹配话术。b.无答案:新增意图和对应的答案

4)语音播放

TTS产品都会有很多音库的,如果觉得不合适可以选择真人录音,发音比较自然,就是没那么灵活,录音工作量较大。看发音效果关注下面4点:

a.合成准确率:正常不会出错b.音调、声音、感情等因素:感知问题c.变量衔接:真人+合成音搭配的情况下,需要注意,这块可能引起衔接不顺畅。d.真人和合成音的筛选

(2)业务部分

1)流程转化率

参考漏斗模型,分析全流程转化率异常节点,看是流程设置问题还是其他原因。

2)用户交互内容

根据用户交互的内容分析用户感兴趣或者有问题的地方,通过这些内容数据来优化话术

5.上线

这里就不仅仅是关注智能和业务指标了,还要注意软硬件的性能,看是否能顶住上线的大规模并发,之后就是不断训练优化的过程了。

三、注意点1.智能外呼机器人定位

中上等电销业务员,能够按照固定标准去和用户交互,不会有优秀的业务员那样灵活变通,智能按照设置的内容去回复用户,无法实现自主的思考学习。

2.业务场景

适合简单语音交互,不适合复杂的业务流程,例如多种意图判断,复杂的语言理解,现在的技术水平还达不到或者付出的代价较高,往往用户没有这么多的预算。

3.训练优化

智能的背后一定有N倍的人工,现在还没达不到无监督学习的地步,好的智能外呼机器人是不断训练优化出来的。

4.只能用于外呼吗?

适合语音交互的流程,包括呼入(智能语音导航)和呼出(智能外呼)。

四、总结

智能外呼只是一个辅助工具,并不能直接带来业务效果提升,我们要根据交互的业务数据去不断训练机器人,优化场景,这样才能达到提升业务的目的。

 

作者:赵洲,南京打杂运营。

本文由@赵洲原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自PEXELS,基于CC0协议

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇