案例:广发银行—呼叫中心语音大数据分析系统建设
2015年4月成功签订合同,产品同时正式上线,每月或每两月进行版本更新维护,为客户增加新的使用功能,提高工作效率,增强客户使用体验!提升企业敏捷性!
客户名称/所属分类
大数据技术服务:广发银行大数据语音分析技术服务
任务/目标
广发银行信用卡中心希望针对目前呼叫中心数据量大,一旦出现历史录音调听,需要先找到磁带,导入系统中然后员工再一一听取核对,工作量大且效率非常低,往往找一通电话需要数天甚至几周时间,而且质检覆盖范围小,无法根据客户反馈的问题,及时有效的将相关信息进行结合,更难提及获取语音数据中的潜在市场价值。
广发银行信用卡中心希望通过使用相关解决方案,解决上述所面临的问题。并且实现语音服务系统的高效录音管理,解决语音文件的存储、调听问题,加强人工服务质检功能,同时对海量数据中的信息进行分析和挖掘,从而更加深入地了解客户、发掘市场、改善服务。
挑战
随着国内通信服务及电商行业的发展,录音质检管理日益为行业管理人员和智能语音质检系统提供商所重视,大量埋藏在海量电话录音中的客户需求和重要市场信息,如果都通过传统的人工监听无疑是一个巨大的工程,必将消耗大量的人力物力。同时这项支出还将会随着企业的发展而持续增长。
所以银行金融业呼叫中心未来的快速稳步发展,尤其是广发银行这种日通话量在100万通的大体量语音数据,迫切需要构筑适合企业的智能语音分析质检系统。
银行业呼叫中心质量监控管理是对坐席电话营销过程实施全程监控的过程。也是通过对营销代表服务质量的检测和监控,确保公司依法合规经营,防范企业经营风险,同时提升电话营销代表的营销技能和服务水平,保障这一高水平服务的持续实现的过程。另外对客户的需求、客户感受、客户建议等进行分类搜集,实现质量监控工作的综合运维。
质量监控工作强化电话营销坐席电话销售过程的合规性、完整性、准确性、规范性。所以质检系统要保证录音信息与客户投保信息准确对应。同时为了实现公司电商业务的依法合规经营,广发银行信用卡中心要求录音质检系统还应具备违规风险点报警、服务禁语筛选的功能。
传统质检质量监控人员每天面对大量的录音,一般是通过听录音进行合规性检查,对于批量录音中其它的重要信息则无法识别、筛选。比如关于客户投诉,有多少来电是投诉服务质量,有多少是不满意产品价格。又如面对突然上升或下滑的业务量,管理者是否能在第一时间作出原因判断,及时提供应对策略?
所以广发银行信用卡中心要求录音质量管理系统还要有客户感受、客户期望内容搜集,以利于形成客户需求信息积累和产能转化的需求,这对于当时IT技术运维提出了一个不小的难度!
通过与广发银行信用卡中心项目团队及时沟通,全面掌握客户对语音质检的需求后中金数据为广发银行提供了如下基础服务:
1.实现语音全量在线存储,可以通过指定内容实现对全量语音的实时检索、调听;
2.提高质检覆盖率,通过系统实现100%录音质检;
3.通过系统和人工结合的质检方式提升质检效率;
4.对电销录音相关数据进行统计和主题分析,针对话术、客户反馈、电销周期、成功情况等综合分析后,优化电销策略;
针对于客户要求的后期语音分析内容,中金数据利用自有大数据平台,创建大数据语音分析云。将客户整理好的数据统一放到大数据平台进行存储,根据广发银行的需求研发工程师搭建不同的数据模型,定制更详细的语义规则来匹配后期对数据的分析,以及挖掘客户意见和对风险的把控。
直至现在中金数据仍然每月或每两个月对系统进行巡检,检查系统的运行状况,并在广发银行现场进行支持性的工作,查看数据运行情况以及补充需要更新的数据。在处理事务的过程中广发银行也会提出一些新的需求,当下月再次去现场巡检时,中金数据会将更新后的系统功能带给客户使用。
经过一次次反复的产品功能更新迭代。目前,中金数据可以为广发银行提供提供每日通话量120万通的语音数据,合计通话时长3万小时,也是业内唯一一家可以提供如此大体量语音数据分析的供应商。同时,系统可以为广发银行信用卡客服中心提供如下基于大数据的语音分析,成功解决了一直困扰广发银行业务开发的难题。
1.通过数据分析统计,挖掘客户意见和风险,及时调整服务策略,提高客户满意度;
2.对呼叫中心海量的语音进行价值提取,为产品设计、营销发现并提供有价值信息线索。
生机存在于困难中,广发银行信用卡呼叫中心,从“成本中心”转变成“价值中心”,再转变为“利润中心”,承担起了更多、更重要的企业战略级任务!我们相信未来就诞生于这种转变过程中。通过我们的方案可以让广发银行从“听得到”到“听得懂”客户心声的有效转变
实施过程/解决方案
在经过将近为期一年的严格考察后,广发银行信用卡中心正式与中金数据签订大数据基础平台项目合作协议。为帮助客户中心客户解决上述问题,中金数据以语音数据分析作为项目首期内容。
中金数据自主研发的“语音大数据分析平台”,依托先进的大数据平台技术,采用语音识别技术对金融机构海量语音内容进行分析识别,以较高的准确率还原出每段录音的具体内容。
可通过关键词输入实现快速检索,通过语义分析和情绪分析技术,实现语音全覆盖自动质检;通过对大量通话记录和内容进行识别、统计、分析,可在最短时间内了解不同业务的话务结构,定位导致客户投诉、流失、话务异常等问题原因、并预测业务热点趋势,发现潜在客户。利用数据为业务全流程带来新的活力。
在双方团队的高效协同下,于2015年4月顺利按计划实现广发信用卡中心“语音大数据分析平台”上线。迄今为止项目一二期已经顺利上线,运行状况良好,系统目前实现了主要三大功能模块:录音存管、智能质检、主题分析。
系统实施的主要架构如下
系统技术关键点
1.语音识别。用于建立文本索引,将非结构化的语音文件转换为结构化的索引信息的过程。语音识别引擎具有语法识别、自由说识别、关键词检出和语音质检分析四种识别能力,能够正确识别语音文件从而形成对应的文本内容,并提供静音检测、情绪检测、关键词(服务忌语和业务术语等)和话者分离的识别结果。
2.智能质检。提供基于角色区分、全文识别、关键词识别、语速检测、静音检测、叠音检测结果等组合的多维度质检;根据业务需要,可对所有的在线录音进行百分之百覆盖的全量自动质检。
基于说话人区分结果,用户可定义针对坐席或客户的通话内容进行自动质检;
基于全文识别和关键词识别结果,用户可进行针对坐席通话出现服务禁语、缺少规范用语等通话内容的自动质检;
基于语速检测结果,用户可进行针对通话人语速过快的自动质检;基于静音检测结果,用户可进行针对通话中长时静音的自动质检;
基于叠音检测结果,用户进行针对通话人抢插话的自动质检;基于情绪检测结果,用户可进行针对通话中情绪异常自动质检;
3.文本分析。对电销和客服录音内容及相关数据进行统计和主题分析,针对话术、客户反馈、电销周期、成功情况等综合分析后,优化电销策略和客户服务话术;通过数据分析统计,挖掘客户意见和风险,即使调整服务策略,提高客户满意度;
系统调听功能界面截图:
结果/效果总结
“以前,我们呼叫中心质检都是通过人工抽查的方式来进行的。这种质检方法效率太低且缺乏统一的质检标准,在很大程度上制约了我们质检工作在数量和质量上的突破。另外我们之前的质检大多停留在质检最终结果上,并没有找到导致出现这种结果的导火索。
譬如导致这种质检结果的坐席客服近期的心理变化,我们不仅在于对质检结果获取和处理方面无从下手外,对于导致质检结果的原因同样不知所措。
但是使用语音分析云解决方案后,极大提高了在呼叫服务中心在语音转换、存储、调听和质检方面的效率,实现日处理数据时长3万小时,在线数据总量200T,以及年数据量增长率30%的应用结果。
通过这种方式,我们也可以将近期坐席客服反馈的信息,进行有效的转化,给销售人员提供提供有价值的客户信息,有效节约时间成本,自我价值都有所提高!”——广发银行信用卡中心宣钢炜经理。
此外,语音大数据分析云作为一种大数据分析产品,可以为广发银行提供一定的业务统计和分析。可实现信用卡中心语音数据的自动化采集与分布式存储,完成语音数据智能统计分析,自动提取有价值的客户信息,因而后续可挖掘的潜力较大。在二期以及后续项目中,双方将基于现有基础,深入探讨如何在数据价值挖掘领域实现更为多元化的合作。
企业介绍:
中金数据系统有限公司(中金数据)成立于2005年,是国家高新技术企业,总部设于北京、在烟台、武汉、苏州设有子公司。
中金数据是业界领先的数据中心与信息系统外包、云计算与大数据应用、灾难备份与业务连续性管理的信息技术基础设施和IT综合服务提供商,致力于社会服务信息化,专注于信息服务的社会化,帮助客户提高信息技术系统和业务运作管理的安全性和效益,提升客户核心竞争力。
目前,中金数据在北京、烟台、武汉、苏州均已建设高可用性,高安全等级、绿色节能数据中心,且全部为自主投资、自主建设、自主管理、自主运营。十余年来,中金数据以数据中心为基础,以符合国际和国家规范标准体现,在大健康、文化产业、金融行业、出版发行、公共安全及产业互联网领域,与云计算、大数据、移动互联网的应用为增值服务,发展成为业界领先的数据中心外包服务及IT应用综合提供商,客户主要覆盖政府、金融、央企、跨国公司等领域。
欢迎更多大数据企业、大数据爱好者投稿数据猿,来稿请直接投递至:tougao@datayuan.cn返回搜狐,查看更多
业务要的“多维度数据分析”到底是什么
数据分析的同学是否遇到过这种情况——辛辛苦苦做的数据永远不是业务想要的?到底是业务吹毛求疵过分挑剔,还是你做的数据不是业务想要的呢?本文将层层分析为你解答,快来看看吧。
做数据分析的同学们都遇到过这个问题:从多维度分析问题,提出对业务有意义的建议。这个题目看起来很简单,可很多同学辛辛苦苦跑了一堆报表,结果只落得业务一堆抱怨:
“你这一堆说明了啥!”“你的重点在哪里?”“你的维度太单一了!”好!冤!枉!
明明出了那么多组数据,为什么还被说“分析维度不够多?”今天我们系统解答一下。问题的本质是:业务口中的“多维度”,完全不是你想的那个“多维度”。
一、数据分析眼中的多维度对数据分析师而言,多维度,往往指的是数据指标的拆分维度。
举个简单的例子:3月份销售额3个亿。这就是一个指标,没有拆分维度。如果加了分类维度,就是下边的效果:
注意:比起只看总数,用多维度拆解数据,是能更精确的定位数据的。
常见的方法有两种:
添加过程指标按业务管理方式添加分类维度比如只看总销售金额,我们发现差3000万达标,可我们并不知道为什么不达标。这时候如果拆解细一点,比如:
1.添加分类维度:看到哪个业务线没做好(如下图)
2.添加过程指标:看到从用户意向到付费,哪个环节出了问题(如下图)
增加过程指标+分类维度,就能更精准的定位问题。甚至一些简单的结论已经呼之欲出了。
正因如此,很多数据分析师把业务口中的“多维度”,直接理解成了“维度多”。一听到要做分析,振臂高呼“拆!拆!拆!”层层叠叠做了一大堆交叉表,把各个分类维度的数据都做了出来(如下图)。
然而,仅仅“多”,就足够了吗?
二、业务眼中的多维度业务口中的“多维度”,完全不是这个意思。
业务脑子里装的是不是数据库里的表结构,而是一个个具体的问题。当业务看到“3月份销售没有达标”脑子里想的多维度是这样的:
是不是看傻眼了……
你会发现,单纯的拆解数据根本无法回答上边的问题。
是滴,一个都回答不了。甚至单靠看数据都没法回答这些问题。
即使把问题定位到:“3月业绩不达标是因为A大区3个分公司的客户意向签约太少”,定位到这么细的程度,也不能回答上边的问题。
因为到底意向太少,是因为对手发力了、产品没做好、活动没跟上、用户需求有变化……还是没解释清。具体的业务问题,一个都没有回答。自然业务看了一脸懵逼了。
三、真正的多维度分析,这么做从本质上看,真正的多维度分析,其实考的不是数据计算能力,而是策略能力。具体来说是三个方面:
把业务上理由,转化为数据上论证。堵住借口:业务不要总试图甩锅,集中精力想能干点啥。找到症结:在一堆影响因素里,找到最关键的那个,集中发力。注意,这三件事是有顺序的:
先把数据论证方式列清楚,避免大家放空炮(数据不能论证的理由就闭嘴,是个非常好的议事规则)。之后先堵借口,找借口并不能解决问题,因此先把各种逃跑路线堵上。最后再集中想办法,想办法的时候,从大到小,从粗到细,先搞大问题。综上,这个事可以分六步做。
第一步,要先对业务明里、暗里提出的说法做分类对每一类问题,构建分析假设,把业务理由转化为数据逻辑,拿数据说话(如下图)。
第二步,优先排除借口让大家把精力集中在——往往借口产生于:宏观因素、外部因素、队友因素。所以在这里,关键是证伪。只要能推翻他们的逃跑借口就行。
证伪最好用的办法就是举例法,同样是下雨,为什么别人就抗的住。同样是流量难搞,为啥别的业务线能持续增长?(如下图)。
举例法还有个好处,就是在反驳借口的同时,也指出了解决问题的出路。业务最讨厌光讲问题不讲方法的人,因为喷人人人都会,解决问题可就难了。给出具体的学习对象,可以极大的激发业务思考对策,从而达到双赢的效果。
第三步,解决白犀牛,剔除明显的重大影响比如监管政策、公司战略、重大外部环境等等因素,确实会对企业经营起到重大作用,并且这些因素是普通小员工只能接受,不能改变的。但是!这种重大因素表现在数据上,有严格的要求(如下图)。
因此如果有人想推脱给这些因素,要看:
事实上有没有发生这个事数据上符合不合符走势以此敲警钟:不要事事都怪大环境不好。你丫走到哪里都是大环境不好,你是影响大环境的人呐!先排除这种大因素的影响(或干扰)再聚焦看我们能做什么事情。
第四步,解决黑天鹅,剔除明显突发事件如果发生的真是突发事件,很容易找到问题源头:
正向的:促销活动,某群体用户骚动,新产品上线……负向的:恶劣天气,突发事件,系统宕机……因此先排除单次突发问题,找清楚一点原因以后,再追溯之前的情况,就容易说清楚。
第五步:按分工锁定问题点再谈细节解决了大问题以后,想讨论更细节的问题就得锁定部门,先定人再谈计划。之前已有分享,这里就不赘述了。
第六步:锁定细节问题请注意,即使聚焦到一个部门的一个行动,还是很难扯清楚:到底是什么业务上原因导致的问题。因为本身业务上的事就是各种因素相互交织很难扯清,比如:
内容运营:传播渠道、主题、调性、风格、图片,发送时间,差一个都可能扑街活动运营:目标群体、活动门槛、奖励内容、参与规则,差一个都可能扑街用户运营:新人进猛做留存就差,留存猛做新人进费用就少,两头都做两头投入都不够商品运营:选款时候看100个维度,可一天不上线一天不知道真实表现,你上了,他扑了……可能做数据的同学本能反应是:能做ABtest呀。
实际上大部分业务是没有时间、空间做ABtest的,而且有些东西(比如选品、文案)影响维度太多,得做无数组ABtest才能测清楚。
而且对已经发生的事,也没法再做ABtest了。所以想区分相互交织的因素,还得有更多辅助方法配合。
#专栏作家#接地气的陈老师,微信公众号:接地气学堂,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相关经验。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
呼叫中心数据分析杂谈
一般呼叫中心的各个指标值大概在什么范围?同时了解各个指标在节假日会是什么情况?营销活动时期会是什么情况?
一般呼叫中心会包含接通率、平均通话时长、事后处理时长、重复呼叫量、在线利用率、一次解决率等指标,当一次解决率明显提高时客户的重复呼叫量就会随之降低,从而在相同的人员配备情况下接通率也会明显提高,但是在线利用率会有所降低,最终导致人员成本过高。
2.呼叫中心的范围
需要了解各行业、各地区以及国外一些呼叫中心的指标情况,知道各个指标在不同行业、不同地区的不同特征分别是什么,从而不断提高对数据的敏感性以便及时发现统计分析中的问题。
用平均通话时长来举例,假如某呼叫中心该月平均通话时长为90秒,有A、B两个呼叫中心,他们的管理人员看完后得出这样的结论:A:90秒的平均通话时长比上个月高出了10秒,需要降低;B:这个月平均通话时长从100秒降到了90秒,客服代表的销售能力有了明显提升。
很明显呼叫中心A一定是成本型呼叫中心,而呼叫中心B则是利润型呼叫中心(如图2)。
三、提高对数据统计分析的准确性
数据的准确性可以说是关乎呼叫中心成败的关键因素,一个统计上的错误就有可能误导管理者做出错误决策,所以我们从以下几个方面说明如何提高数据统计分析的准确性。
1.准确认识数据
各个统计数据(指标)分别是什么?分别是怎么定义的?计算公式是什么?例如前面提到的在线利用率——座席人员登入系统后与客户通话及事后处理时长占总登陆时长的比例;公式:(客服代表实际通话时长+事后处理时长)/签入系统时长。
统计的是哪些业务的、哪个时间范围、哪些客户群的、哪些地区?在对呼叫中心数据有了整体了解的基础上,接下来的工作就是对数据的整理。
2.准确整理数据
应该先将原始数据进行备份,以备不时之需;
整理过程中将数据粘贴为数值格式,剔除冗余数据、公式、批注等(如图3);
整理过程中各个表格中数据需要有一个关键字段,这样可以将数据进行必要的关联。尽量将所有数据汇总到一个工作簿中,方便数据分析时做关联分析;
整理过程中所用到的公式需要保存,不要粘贴为数值格式,以备分析中发现问题及时改正。
3.准确分析数据
分析前需要做出整体的分析框架,分析过程中发现不合理的地方及时调整;
分析前应该把整理好的数据表格单独拿出来,不要在原有的整理数据表中做分析;
分析过程中指标的名称、各维度的名称要保持统一;
采用合适的分析方法,数据的描述统计、相关性分析、回归分析、80/20法则等;
用合适的图表进行结果的展现,柱状图、折线图、雷达图、饼图等,需标注清楚图表的名称、数据的统计范围、单位等(如图4);
给出正确的分析结论及相应的改善或者是应对措施;
形成分析报告。
4.对分析后的过程及结果进行核查
检查分析中所用到的数据是否正确,避免分析此项而错用到其他项数据的情况;
检查分析中用到的公式是否正确,看公式涉及的数据单元格是否正确(包括单元格是否完整、单元格引用是否正确);
检查数据明显高于或者低于平时水平的异常点(或者说是不符合日常规律的点)是否正确,此时需要查看是否是整理的数据中有错误,包括时间、地点、业务、客户群等(如图5);
检查分析结论是否正确,查看结论是否和分析的结果相一致;
检查分析报告中是否有语句不通、语句歧义、字体格式(字号、颜色等)不统一、使用链接错误的地方。
5.以上内容需在日常分析工作中不断完善,以保证数据分析的正确性、客观性、严谨性和时效性。
想要做一个优秀的数据分析人员必须具备以上谈到的基本素质,要是问到哪个是最重要的,只能说没有谁重谁轻,都很重要。为了做好数据分析工作、成为更好的数据分析人员,那就让我们从“三个提高”开始吧。返回搜狐,查看更多
数据分析行业案例:呼叫中心中的数据分析
数据分析对于任何一个呼叫中心都是非常重要的,刚刚开始做数据分析的人员总会提出类似这样的问题:应该怎么做数据分析呢?如何才能够做好数据分析工作呢?本文将从提高对数据重要性的认识、提高对数据的敏感性以及对数据统计分析的准确性三个方面让数据分析初学人员对数据分析有个总体认识。
一、提高对数据重要性的认识
1.很多隐藏的问题是我们只能通过数据挖掘出来的,我们可以看到在哪些时间、哪些地点、哪些客户群、出现了哪些异常状况?同时通过数据深层次挖掘问题背后的真正原因并做出及时有效的应对措施。例如某呼叫中心的接通率3月份达到了93.70%,但是其人员的在线利用率(座席人员登入系统后与客户通话及事后处理时长占总登陆时长的比例)只达到了53.92%,说明座席人员的工作强度比较小、排班时安排的人员过剩,付出的代价就是人员成本过高(如图1)。