博舍

深度解析AI人脸识别技术发展到什么程度了它的能力极限是什么样子你会不会因为天网而感到害怕 智能机器人发展到什么程度了呢视频讲解下载

深度解析AI人脸识别技术发展到什么程度了它的能力极限是什么样子你会不会因为天网而感到害怕

1.人脸识别技术现状

在日常生活中,每一个自然人基本都经历过过人脸识别,主要分如下两大类:

1.1.生活中

坐火车,进站需要刷脸和刷身份证

APP的实名认证,打开手机刷脸

支付宝用手机扫描自己“花呗”支付

在商店,面对商家的支付平板设备,扫脸支付(如华联)

去售楼处买房子,被房间角落的摄像头识别出身份

进出办公大楼,需要人脸闸机核验,自动开门

1.2.其它等不可言说的

部分城市的交通卡口,增加了闯红灯人脸识别(如济南,会大屏幕播报闯红灯的人脸和身份证号)

遍布城市、乡村各个角落的部分摄像头,接入天网(强大的情报系统)

媒体内容合规性审查(如出现境外敏感人物)

(瞭望塔媒体内容合规性审查系统)

看上去,人脸识别技术,已经成功的渗透到了我们的工作、生活以及社会稳定治理方面了。

2.从技术角度对上述场景做归类

这个章节,会带有一些技术专业术语,笔者尽可能说的通俗化,该章节比较重要,不建议跳过阅读。

2.1.识别类型归类

从识别类型上,分为1:1对比和1:N对比。

1:1对比,解释起来比较简单。意思是,首先设备知道想要识别的对象是谁,设备只需要鉴别出现在镜头里的人脸,是否是设备想要的对象即可。典型场景是:进火车站,同时刷脸又刷身份证。如张三将身份证放到设备上,设备首先知道,预期出现在镜头里的人,应该是张三。设备只需要将身份证上的张三头像,和镜头里出现的人脸,做1:1比较即可。(同理,APP实名认证、支付宝用手机扫描自己“花呗”支付,均属于1:1对比)

1:N对比,意思是镜头里的一个人脸,和数据库里N个人脸做比对识别。典型场景:在商店,面对商家的支付平板设备,扫脸支付(如华联);去售楼处买房子,被房间角落的摄像头识别出身份;进出办公大楼,需要人脸闸机核验,自动开门。

显而易见的,1:N的技术难度要更高一些。为什么?从一个人里挑出来目标人物,和从一堆人里挑出目标人物,当然是后者难度更大。

表格统计如下:

1:1和1:N的区别,就在于人脸的大小。1:1可以认为,人脸库是1,1:N可以认为,人脸库是N。如进出办公楼人脸闸机场景,加入该办公楼办公人员是100,那么人脸底库数量就是100,也就是N=100.

2.2.识别技术归类

从识别技术上,分为瞳孔间距测量法、深度学习128/256/512点法。

基本所有的人脸识别技术,会采用上述两种方法做交叉验证。

2.3.距离限制归类

短距离,也就是1m以内。

远距离,普通的4mm焦距摄像头(也就是市面上最常见的),有效距离不超过8m,且识别准确率大大低于短距离。

显而易见,远距离识别的难度,大大高于短距离识别。

2.4.其它-活体检测

我们在手机app做人员身份认证的时候,通常会要求“张张嘴、摇摇头”,是检测被测人脸是否是活体状态。据说,著名的“北大吴谢宇杀母案件”,就是在吴谢宇同学使用其母亲静态的尸体,做app现金交易活体验证的时候,被AI算法发现异常的。

2.5.其它-佩戴配饰

佩戴口罩:能够增加识别难度,一般不影响识别精确度。特殊场景,影响较大

佩戴墨镜:不可以。眼睛是重要特征,佩戴墨镜之后,人脸识别的意义较小

佩戴耳环、鼻环等:不影响人脸识别

3.困难点拆解分析

通过上述描述,可以得出结论:1:1场景、短距离(1m以内),是最容易的,几乎可以认为是100%准确率(业界基本可以做到99.9999999%,即使用1亿次,会有1次出错,基本可忽略)。这也是人脸识别技术,最可靠的落地方案。生活中,绝大部分的使用场景,均是该类型。

任何非1:1、短距离场景的人脸识别技术应用,都有极大的准确率风险,需要人工二次核验。

我们拆开分解一下(一共就俩变量,一个是人脸库大小,一个是距离。高中学过的“控制变量法”,大家回忆一下):

3.1.从1:1到1:N(距离限制在1m以内)

也就是人脸库的人脸数量从1,逐渐变大。那么人脸识别的准确率,是逐步下降的,对应的曲线如下:

(注1:上图中的N,我把它意为,底库人脸量增加到某一个值,算法的准确率开始显著下降。笔者认为,这个N,也是衡量各个人脸识别技术服务商的技术能力重要指标。有的厂商,可以将N做到5亿,有的厂商,只能做到10万。)

(注2:所以,恳请各位业主老总们,千万不要听你们的供应商瞎吹牛,什么准确率99.99%,其实一定要看使用场景的)

也就是随着底库人脸数量的逐渐变大,人脸识别的准确率,也会逐渐变低。我们把上述1:N、1米以内的场景,按照难度大小,排列一下,如下:

下面解释下,各个得分的评分依据:

进出办公大楼,需要人脸闸机核验,自动开门。难度分,1分,为什么?因为这个底库人脸量,说破大天,也就10万,而且是1m的距离(即便是中国铁路这种员工最多的,100万人,也不是问题)。这对人脸识别场景,是小case。=====>所以,这个难度分是1分,你要问我,进入火车站的人&证比对(1:1)技术,得几分?不好意思,0分。

在商店,面对商家的支付平板设备,扫脸支付。难度分90分,为什么?(首先大家要注意,该过程是不通过个人手机的,仅仅是用商家的设备,扫描自己的脸),首先,我们看下,为什么扣了10分?扣了10分主要在于,并不是每个人每次支付,都能100%不借助二次确认,如扫脸后,偶尔会二次确认手机尾号等。所以,====>扣10分。其次,我们看下,为什么得了足足90分,因为,底库的人脸量,确实太大了。以支付宝平板支付为例,我们一次支付,支付宝后台,会比对8亿人脸库。这个数量,已经要求人脸识别技术质变的飞越。有的同学会问,会不会和城市有关,如支付宝后台,仅比对常驻地的底库,也就可以把8亿底库缩减为1000万。为此,笔者特地出差去外地,实地验证过,答案是,底库就是8亿。

哦!赞美它!支付宝平板人脸支付!太方便了!

不过,笔者要吐槽一下微信平板支付,真的是一言难尽。。。。

(小道消息:支付宝的平板支付,采用的xxx公司的人脸识别技术,它的达摩院,干不了这活;

而微信的平板支付,采用的是自研技术,啧啧啧,再加把力,你一定可以的!)

3.2.从1米到8米(1:N场景)

我们将定量控制在1:N场景,但是将识别距离拉远。废话不多说,开头咱们先来一个难度评分:

显而易见,远距离1:N场景,难度普遍较高。

下面解释各个项的评分依据:

去售楼处买房子和城市的交通卡口难度分分别是50分和60分,首先拍摄场景比较单一,其次所涉及到的人脸底库通常不会太大(通常在500万以内,而售楼处场景,人脸底库则更小)。为什么交通卡口场景比售楼处场景更难一些呢?因为售楼处通常是室内,光线的影响相对要小一些。

天网场景,难度分直接突破上限。为什么?因为目前尚不具备(未来也不会具备)真正意义上的天网人脸识别。首先是场景多样化,直接影响AI算法的准确率,其次是距离,其次是所涉及的人脸底库是海量的。当前的人脸识别技术,只能完成一定约束条件下的天网人脸识别,无法达到普通人认知的那么可怕。需要辅以大量的人工二次核验工作。

在媒体内容合规性审查领域,需要对更多场景的人员做识别,包含会议、室外、酒店、娱乐场所、古装等我们人类可认知的所有场景。其次,该领域的审查,是要求务必严格的,哪怕人员出现在图像中一个非常小的像素区域,也要求被识别,这在技术领域,是非常困难突破的。

上述文字,已经初步的对不同条件下的人脸识别技术做了分析,我相信即便如此,还有很多同学,无法非常感同身受的理解相关细节,欢迎留言提问。

4.写在最后

在人脸识别技术的应用当中,其实还有一些其它的相关名词概念,比如活体检测、toF相机等,这些对最终的识别效果没有本质的影响,所以本文并未讨论。

最后,也是最重要的一点:

其实AI算法没有想象中的那么强大,人脸识别技术的上限,就是人的肉眼的分辨能力。而大多数场景,该技术没有办法达到上限。

所以,如何判断当你暴露在一张照片或者摄像头之下,会不是被人脸识别算法识别出来呢?要么遮挡住你的眼睛&戴上口罩&低头,要么保证自己人脸出现在画面中的像素足够少(长宽低于20个像素)。总而言之一句话,当目标的亲妈,看着图片中的脸,都认不出是自己儿子,那么人脸识别算法,也一定识别不出来。

国内的智能客服发展到哪一步了这里有份追踪报告

机器之心原创

机器之心编辑部

智能客服市场有多大?有哪些优秀玩家?这些玩家提供了哪些解决方案?解决了什么痛点?在这份报告中,我们进行了详细解读。

近年来,以神经网络、深度学习为基础的新一代自然语言处理技术推动了AI交互的突破式发展,以对话式AI技术为核心的新一代智能客服逐步走向成熟。

全球知名市场调研机构Prescient&StrategicIntelligence指出,全球范围内基于人工智能技术的智能客服相关服务营收有望在2024年底突破29亿美元,并可实现近22.6%的年复合增长率,以中国为主的亚太将成为智能客服营收增速最快的区域。

根据中投顾问数据,中国传统客服全职坐席数在230万左右,以年平均工资6万计算,再加上基础设施与硬交换设备费用,可以预测中国国内客服市场的规模约为2000亿人民币左右。假设智能客服将替代40-50%的人工坐席,并排除设施、设备以及预算等其他因素,智能客服市场将接近250-400亿人民币。当然,智能客服的出现也将促使因成本、技术等因素未能部署客服业务的企业步入市场,这种需求的激增也将在一定程度上扩张现有市场。保守估计智能客服的市场将会扩展近20%左右,有望达到300-500亿人民币。

这一预测一方面基于市场对于智能客服的强烈需求,另一方面也基于NLP等AI技术对智能客服发展的推动和支撑作用。在各种技术的加持下,如今的智能客服技术有着语义识别更准确、问法更灵活、对话更连贯、知识更全面以及学习更主动几个先进特点。

在这篇文章中,我们将从传统客服流程存在的痛点入手,分析当前智能客服在多个方向实现的改进和突破。此外,我们还总结了当前国内智能客服的主要玩家及其解决方案。

为什么市场需要智能客服?

智能客服是为了克服传统客服中心存在的痛点而出现的。下面两幅图展示了传统客服中心的服务场景和营销场景客服流程。服务场景的一般流程是在渠道用户接入后,进行客户资料检索、工单生成、排队处理、线路分配等多个环节,还要配套通话数据储存、会话记录监控、周期性报表制作以及系统数据监控等多项操作。营销场景的流程一般都会从业务工单与需求出发建立呼出任务,并涵盖批量外呼、客户资料与销售线索整理、知识库建立、坐席转接等多个环节。

这类客服中心的痛点主要集中在从业者团队运营与管理、按量数据处理两个方面。

从业者团队方面,根据不完全统计,传统客服的从业者对相关工作的不满意程度高达51%,不满意原因集中于工作强度大(夜班、轮岗、加班等)、工作内容枯燥、重复性机械劳作(重复性问题多、耗费精力时间长)、心理压力负面情绪积累(投诉、刁难等)等。企业团队运营也备受煎熬,坐席离职率高、成本受限、质检业绩不合格、表单填写粗略等都是显而易见的问题。

另一方面,因为数据相关技术的不成熟,客户交互数据价值挖掘问题也是传统客服需解决的核心问题。根据调研结果,目前大多数传统呼叫中心无法统计一天内用户到底问了多少问题、问题占比多少、哪些任务存在失调。

而这些痛点正是智能客服的机遇。

智能客服智能在哪儿?

智能客服在服务与营销两大传统场景的优化主要集中于人机协同、机器人问答、人力服务以及数据与服务运营监管四大方向。

人机协同的优化聚焦于呼入的智能路径规划、工单填写、客户数据与知识库查询辅助、批量外呼建议以及语音文字自动录入等多个维度。而机器人应答则在于语音接听、文字回答、无缝转接、批量处理等多个领域。人力服务方面主要是针对坐席排队管理、预接入、转接、互联网通话的保障。最后的数据与资源统筹则是在全流程方面进行介入从而实现客户服务质检、实时监控、大数据分析等多项功能。

在深度学习算法广泛应用之前,大多数智能客服使用「检索+NLP技术处理」的技术方案。随着人工智能与深度学习技术的发展与突破,智能客服背后的技术栈不断演进,能处理的问题数量越来越多,职能边界也随之拓宽。具体的技术演进阶段大致如下:

第一阶段:基于关键词匹配的「检索式机器人」;

第二阶段:运用一定模板,支持多个词匹配,并具有模糊查询能力;

第三阶段:在关键词匹配的基础上引入搜索技术,根据文本相关性进行排序;

第四阶段:以神经网络为基础,用深度学习理解用户意图。

以腾讯云小微为例,看对话式AI智能客服的特点

语义识别更准确

无论是自然语言处理还是语音技术,基于深度学习的机器模型均是目前最主流的技术实现方法。得益于优秀的准确度和可迁移性,以Transformer模型架构为基础的类BERT大规模语料预训练模型是目前业内的主要技术框架。腾讯云小微基于BERT基线模型,利用自身数据和业务优势,通过任务优化、模型优化、领域优化、模型融合等步骤,迁移训练出符合自身特定需求的智能客服模型。

从语义识别和理解方面来看,腾讯云小微基于此流程训练出的CXW-MRC模型在2019年法研杯阅读理解赛道上以83.4的F1值取得第一,超越BERT基线模型6个百分点。2020年又更进一步,其基于ALBERT开发的预训练语言模型在权威阅读理解任务benchmark数据集RACE上取得了91.4%(集成模型)和90.7%(单模型)的高准确率,分列排行榜第一和第三名,整体表现均优于英伟达的Megatron-BERT和谷歌的ALBERT,非常接近人类表现参照的准确率(94.5%)。

RACE阅读理解任务最佳模型表现排行

问法更灵活

对于重复度较高的结构性问题,智能客服通常都可以轻松应对,而当用户的提问方式或问句结构与主流常见问法存在较大偏差时,智能客服往往不容易精准理解问题的真正含义,从而影响用户体验。

腾讯云小微首创的业界LARQ技术提供问法扩展能力,以适配多种问法,语义理解更加丰富全面,其客服准确率能够达到95%左右。

腾讯云小微新一代对话引擎情况技术简介。

对话更连贯

在具体到对话系统技术任务方面,腾讯云小微技术团队在今年的第八届国际对话系统技术挑战赛(DSTC-8)上参与了三个赛道的七项相关任务,包括多领域对话系统、端到端问答预测、对话状态追踪等,取得其中四项指标世界第一、两项指标第二的优秀成绩。

面向多领域端到端的对话系统主要研究如何将已有的对话生成模型快速迁移到一个数据量有限的新领域场景中,腾讯云小微使用混合微调训练技术取得了第一名。在端到端的问答预测问题上,涉及到“多轮对话回复选择问题”、“基于聊天室(IRC)的回复选择问题”以及“定位多轮对话中的问题是否得到解决”三个不同子任务,腾讯云小微在BERT模型的基础上使用数据增强技术来解决特定领域的数据稀疏问题,同时利用迁移学习将BERT模型进一步适配到特定的任务领域中,以句子级别的上下文建模方法来捕捉整个对话中各部分之间的细微联系,从而使得生成的回复更加准确。

云小微基于Taskspecificpost-trainingonBERT模型架构。

基于此,腾讯云小微在多轮人机对话和IRC聊天室对话任务中分别达到了97.7%和95.7%的高准确率,体现了其技术在行业中的领先水平。

知识更全面

知识库是问答系统的基础之一,越丰富的知识库可以带来更好的问答效果。半结构的「问题-答案」对结构化的知识图谱,以及无结构的知识文档是最常见的三种问答依靠的主要知识类型,分别对应检索式问答(IRQA)、图谱问答(KBQA)以及文档问答(DocQA)三个具体的技术任务。

腾讯云小微凭借其自身全栈AI语音能力以及腾讯本身内外部丰富的内容和服务生态,积攒了诸多垂直行业(如教育、法务、金融、文旅、政务等)的知识、数据,以及完整的AI解决方案,并不断渗透到诸如智能机器人、车联网等新型场景。在丰富知识库的基础上,腾讯云小微通过对用户意图的高精度识别,针对不同场景切换使用不同类型的知识库,从而达到更优秀准确的智能对话目标。

学习更主动

没有任何一项技术是完美的,智能客服目前的主要技术解决方案是基于深度学习的预训练语言模型框架+特定领域数据的模型微调(finetune)和迁移学习。基于对数据的逻辑分析,智能agent是具备一定程度的自我学习能力的。在智能客服系统的使用过程中,人工运营、统计监控以及配置平台缺一不可,它们共同组成了一个发现并解决问题的流程(参见下图),从而推动模型自主学习,快速迭代优化,以适应数字化时代的商业发展需求。

云小微发现问题&解决问题流程图。

总之,腾讯云小微具备以下技术优势:

EEQA:云小微首创EEQA能力,利用全自动化的端到端问答对生成算法,实现志秒级别从文档/人工服务日志中转换和抽取到问答对数据。

在线机器人AI应答引擎:运用最新的bert框架的核心模型算法,强化专业知识领域的训练,同时提供多种技术手段降低模型对训练语料规模的依赖,能准确理解用户问题,提髙智能客服的服务效率。

冷启动知识库扩容能力:在知识库冷启动阶段,利用腾讯大数据和AI强大的算法能力,对知识库进行相似问法快速扩充,几分钟完成知识库数量的十倍增长。

自不满意问题评价标注体系:用户点评不满意的回答系统会记录在后台,供客服进行标注调优,算法根据标注回答优化问答引擎,提升相似问题答案满意度。

以腾讯云小微为例,看对话式AI智能客服在多个场景中的应用

智能客服解决方案在在线教育、线上会议、智慧导览等多种场景中得到应用。该报告选取了多个重点案例,例如云小微助力腾讯企点打造线上大会智能客服。

2020年腾讯全球数字生态大会于9月9日-11日举办。大会围绕「未来经济,数字优先」的主题,邀请400+行业专家,覆盖38个大会专场,42个展区。

但受疫情影响,该届数字生态大会首次由传统的线下模式改为在线上举办。在大会筹备阶段,由于大会不曾设立长期的客服团队和固定的客服人员,主办方预见其有限的人工客服席位将无法支撑来自数百名参会者的咨询需求。因此,主办方需要架设一套线上客服机制,并采用智能客服机器人来负责参会者的引导与咨询工作。然而,由于大会不曾为线上运营准备过专门的知识库,同时大会举办周期仅有三天,导致客服机器人的部署与运营工作面临极大的挑战。

于是云小微与腾讯企点合作打造了线上大会智能客服解决方案。方案以「腾讯企点客服」为运营平台,采用「云小微对话机器人」作为客服自动问答功能的核心,为参会者提供全面且智能的引导与咨询服务。

其中,腾讯云小微的对话机器人(ConversationalRobot,ICR)是基于人工智能技术、面向企业场景的AI服务。产品适用于客服、资讯、业务办理等场景,旨在帮助企业快速构建满足自身业务诉求的对话机器人,从而减少企业人力成本或解决服务不及时问题。

案例落地流程及使用技术

针对腾讯数字生态大会因首次在线上举办所面临的知识库无储备、活动周期短等挑战,云小微以其对话机器人产品为核心,结合自身多项智能技术来实现客服系统的部署工作。

大会知识库扩容:由于大会初次在线上举办,未曾设立线上客服系统的语料数据和知识库。即便项目团队临时收集相关语料,其数据量仍然不足以支持机器人的训练工作。为此,云小微采用「冷启动知识库扩容能力」,结合腾讯在大数据和AI算法上的储备,基于有限的标准问答语料迅速生成近似的问题,快速填充语料库。相较于常规以人力来为问答信息扩充相似问题的模式,云小微所采用的新型算法能够数秒内自动完成1条问答对1:10或1:15的近似问题扩张,为短期完成部署并上线客服机器人的目标带来可能。

模型训练:云小微对话机器人内置的「在线机器人AI应答引擎」运用最新的BERT框架所打造的核心模型算法,可强化机器人在围绕大会相关专业知识领域的训练,并通过多种技术手段降低模型对训练语料规模的依赖。AI应答引擎设有检索型问答(IRQA)模块,可结合扩容后的知识库为机器人设置常用问答数据的检索匹配功能,支持用户解决普通查询类需求。

短周期客服问答优化:云小微使用了「自不满意问题评价标注体系」来支持客服机器人上线后的优化工作。系统会自动将用户点评不满意的回答记录在后台,供人工客服进行标注调优。随后由算法根据标注内容优化问答引擎,快速提升相似问题答案的满意度。在此基础上,经过标注的对话语料同样会接受扩容,补充知识库储备。由此,即便大会周期只有3天,该方案依然能够实现客服问答效果的提升。

应用效果

在腾讯企服和云小微共同打造的客服解决方案上线后,其智能客服机器人在腾讯全球数字生态大会中实现了3日破万咨询量。机器人客服问题匹配准确率高达91.5%,客服机器人满意度99.05%,机器人接待占比高达60%。

当然,除了腾讯云小微之外,中国智能客服市场还涌现了很多其他类型的解决方案,我们在报告中对这些解决方案进行了分析。

市场主流七大类别智能客服解决方案分析

中国智能客服市场头部厂商从宏观层面可简单分为四大类型。

一是互联网巨头扶持的智能客服厂商,如腾讯云企点客服、网易七鱼、阿里小蜜等,它们往往已在互联网巨头核心业务中落地应用,并在获客方面具备明显资源优势。

二是云通讯服务下的智能客服厂商,如环信与容联七陌,它们基本是从传统云服务起家,开始准备进入语音智能客服机器人,或人工智能交互机器人领域,并在云端构建能力上有相对优势。

三是传统行业智能客服厂商,它们往往是硬交换时代的硬件或软件供应商,近年来随着互联网与人工智能技术的成熟,踏入智能客服市场,如快商通、小能科技都是该类型的公司,较其他类型公司,它们具备大量的传统企业服务行业客户资源。

四是新锐智能客服或机器人创业公司,如小i机器人、云问等,它们以核心人机交互、自然语言处理等技术切入市场,所以技术领先性可能是它们的优势所在。

无论是哪个种类的智能客服厂商,都需要面对客户的个性化与多元化需求。纵观市面上成熟的解决方案,报告整理了市场主流的七大类别智能客服解决方案。

上述市场主流解决方案的成功落地,让智能客服成为企业在数据化运营层面能力提升的幕后推手。

除了以上内容之外,报告还介绍了智能客服的发展趋势及价值体现等内容,欢迎阅读报告完整版。

报告如何获取?

PC访问,体验更佳

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇