博舍

语音识别人工智能技术的分类应用有哪些 语音识别的具体应用场景

语音识别人工智能技术的分类应用有哪些

语音识别人工智能技术的分类应用有哪些?语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolatedwordrecogniTIon),关键词识别(或称关键词检出,keywordspotTIng)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。

根据针对的发音人,可以把语音识别人工智能技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。

另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。

语音识别人工智能技术的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域。

智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。

语音标注的具体应用场景

语音标注的应用前景

语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够摆脱键盘,通过语音命令进行操作。语音技术的应用已经成为日常生活中的一个具有竞争性的新兴高技术产业。

语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经可以满足通常应用的要求。

现如今,许多用户都已经可以很好地享受到语音识别技术给我们带来的便利,比如智能手机的语音操作等。但是,这与实现真正的人机交流还有一定的距离。目前,计算机对用户语音的识别程度不高,人机交互上还存在一定的问题,必须取得突破性的进展,这也是未来语音识别技术的发展方向。

景联文科技为语音识别技术提供一站式数据解决方案

作为人工智能的“养料”,机器想要实现智能化就必须有海量的有效数据来做支撑,而这些数据就需要我们的标注员进行数据标注分析与处理才能得出来。

景联文科技作为一家专业的数据采集标注公司,采集了《50800段车内录音采集数据集》、《60000段中文语音数据集》、《100个id12000段中国人读英语唤醒词数据集》等可用于研究语音识别技术的算法的数据集,可有效的提升企业的测试效率,减少研发时间。还可以针对特定人群、特定场景、特定语种提供个性化的数据定制服务。

为提高数据标注员的标注效率,景联文科技还自建数据标注平台与成熟的标注、审核、质检机制,支持语音工程(语音切割、ASR语音转写、语音情绪判定、声纹识别标注等)、计算机视觉(拉框标注、语义分割、3D点云标注、关键点标注、线标注、2D/3D融合标注、目标跟踪、图片分类等)、自然语言处理(OCR转写、文本信息抽取、NLU语句泛化)多类型数据标注。

此外,景联文科技自研专业的数据采集标注平台,已实现标审分离,完善平台风险管控机制,且设置了严格的数据隐私安全保障措施,全面保障数据安全。平台已实现Al数据的全流程线上标注和质量管理,全面支持音频、图像等数据标注需求、支持多类型标注模板、标注结果支持多种格式在线导出等。

随着语音识别技术不断进步,人和机器的交流将会越来越顺畅,人和机器的关系也会越来越紧密,人们的生活也会越来越便利。未来,景联文科技也将继续为语音标注提供更加精准的数据。返回搜狐,查看更多

军事中语音识别技术的应用

Ai中国网

生意社01月19日讯 军事中语音识别技术的应用

所谓语音识别,是指运用计算机系统对语音所承载的内容和说话人的发音特征等所进行的自动识别。比尔・盖茨曾预言:“以人类生物特征(指纹、语音、脸像等)进行身份验证的生物识别技术,在今后数年内将成为IT产业最为重要的技术革命。”近年来语音识别技术的迅速发展充分证明,这是一门很有实用价值并极具发展潜力的高科技,在军事领域也有其广泛的应用空间。对语音识别的研究可以追溯到20世纪50年代ATT贝尔实验室的Audry系统,这是第一个可以识别10个英文数字的语音识别系统。20世纪80年代末,语音识别研究出现重大进展,一些小词汇量识别系统具备了较高的识别率,并在实验室里突破了大词汇量、连续语音和非特定人这三大识别障碍,第一次将这三个特性集成于一个系统中。20世纪90年代前期,语音识别研究掀起了第一次浪潮,IBM、苹果、ATT和NTT等著名的大公司都对语音识别系统的实用化研究投以巨资。语音识别的准确率指标在20世纪90年代中后期实验室研究中得到显著提高。在我国,自从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。目前,我国语音识别技术的研究水平已经与国外基本同步,同时,在汉语语音识别技术上还具有一些特点和优势,达到了国际先进水平。我国语音识别技术具有代表性的研究单位是清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),其性能已经接近实用水平。 一、语音识别基本原理(一)语音识别主要对象语音识别技术基于对语音的物理属性、生理属性和社会属性3个基本属性的分析。1.语音的物理属性。所谓物理属性,主要包括音高、音长、音强和音色4个要素。音高是指声音的高低,主要决定于发音体振动速度的快慢;音长是指声音的长短,主要决定于发音体振动时间的久暂;音强是指声音的强弱,主要决定于发音体振动幅度的大小;音色是指声音的特色,主要决定于发音物体振动所形成的音波波纹曲折形式不同。2.语音的生理属性。所谓生理属性,主要指发音器官对语音的影响,包括肺和气管、候头和声带以及口腔、鼻腔和咽腔等发音气官。3.语音的社会属性。所谓社会属性,主要表现在3个方面,一是语音与意义之间并无必然联系,它们的对应关系是社会成员约定俗成的;二是各种语言或方言都有自己的语音系统;三是语音具有区别意义的作用。(二)语音识别系统基本内容一个完整的语音识别系统大致分为3个部分:1.语音特征提取。从语音波形中提取出随时间变化的语音特征序列。2.声学模型匹配。声学模型是语音识别系统中最为关键的一部分,其目的是提供一种有效的方法,计算语音特征矢量序列和发音模板之间的距离。在辨识时将语音特征同声学模型进行匹配与比较,达到最佳识别结果。3.语言模型与语言处理。语言模型包括由辨识语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。当分类发生错误时,可根据语言学模型进行判断纠正,特别是一些同音字,必须通过上下文才能确定其意义。  二、语音识别技术的主要功能 语音识别技术主要有以下4个方面的功能:(一)声纹识别声纹识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的一门技术。声纹识别的作用主要有两个方面:一是说话人辨认(Speaker Identification),主要用于判断某一语音材料是由若干发音者中哪一人所说,属于“多选一”的识别;二是说话人确认(Speaker Verification),主要用于确认某一语音材料是否由指定的某个人所说的,属于“一对一”识别。声纹识别赖以实现的基础是蕴含于语音信号中的说话人发音特征,这一技术强调说话人的个性,而不考虑以语音为物质外壳的话语意义。从本质上说,声纹识别技术属于“生物因子”认证范畴。声纹同指纹有着类似的属性。每个人的指纹都是唯一的,而声纹也是人的个性特征,很难找到两个声纹完全相同的人。(二)内容识别内容辨识是对语音材料所承载的实际意义的识别。内容识别有别于声纹识别,声纹识别主要着于眼语音的物理属性和生理属性,以辨认或确认说话人为目的;而内容识别则着眼于语音的社会属性,以识别语音信号所承载的话语内容为目的。话语内容识别比声纹识别要困难得多。说话人的语音通常会受到母语、方言、发音器官和发音状态等诸多因素的影响,正是因为说话人语音特征各异,才为声纹识别提供了可能性。但是,要将具有个性的声纹与具有共性的语法和语义模型相匹配,要通过词语切分、词性标注、结构分析和语境理解等程序,达到正确识别话语内容,则是一个相当复杂的处理过程。(三)语种识别语种识别是对语音材料所承载的语种特点的别识,是话语内容识别和机器翻译技术的重要基础。对计算机系统对多语种综合语音材料或不明语种单一语音材料进行识别时,要先把语音材料分拣到不同语种的识别器中进行识别,这时,就要通过语种识别技术发挥预分流作用。(四)语音标准识别语音标准识别是通过个人语音材料与语音标准模型的对照,对个人语音标准状况作出评判,并指出发音不标准的问题。这一技术可广泛应用于语言教学和语音标准测试。三、语音识别技术的军事应用语音识别技术在军事领域有着重要的应用价值。一些语音识别技术就是着眼于军事活动而研发,并在军事领域首先应用、首获成效的。目前,语音识别技术已在军事通信、军事保密、军事情报和指挥办公自动化等方面得以应用,在日常军事活动和高技术条件下的局部战争中都发挥了重要作用。  (一)军事通信在当代高技术通信系统中,语音识别正逐步成为人机接口的关键技术,语音识别技术与语音合成技术的结合,使人们可以甩掉键盘,通过语音命令进行操作。从而,使智能语音接口把通信器材的“工具”属性拟人化、智能化了,变成了服务的“提供者”。比如,人们通过语音命令,可以方便地从远端的数据库系统中查询与提取有关信息。现在,简单的人机对话已在通信服务中广泛应用。比如,我们拨通某一单位的电话总机,通常可以听到“请拨分机号”以及“人工服务请拨0”等语音提示,有的单位电话总机还可以寻问“请说您找哪位”,在进行语音识别后自动接通拨叫的电话。在遍布美国大街小巷的公用电话亭里,凡有语音识别系统标识的,用户只需对着电话说“Connect Operator Please”,系统所具有的关键词检测技术就可以从句子中查找到“Operator”,并直接把电话接通到接线员,系统的识别率超过99%。(二)军事保密语音识别中的声纹识别技术,在军事保密中有着重要的应用价值。在军事计算机系统和核心要害部位的封闭管理中,应用声纹识别技术进行身份认证,具有很高的精确度,可进一步增加系统的安全性。比如,一些应用了声纹识别技术的新型计算机安全产品,可以在普通的USB加密钥匙基础上,增加声纹认证功能,并对计算机系统进行加密,保护计算机系统中的重要文件不被非法窃取、浏览、篡改、删除或破坏。它符合国家安全标准,对文件的加密、解密操作极其简便,提供多重安全保护,能可靠地防止非法用户进入、使用和窃取电脑系统。在一些军事要地的核心部位,应用语音识别技术实施门禁管理,可以有效辨识合法进出者。保密管理系统根据输入的自然语音信号,进行声纹身份认证,并自动开启或闭合门禁设施。(三)指令确认 在军事行动中,通过电话发出命令是常用的信息传递方法。应用声纹识别技术,可以对发出命令者进行身份确认。避免出现敌方利用我方信道伪装我指挥员发出假命令,干扰我方军事行动的情况。由于在计算机信息处理中,录音的过程要经过模拟到数字的信号转换,放音的过程还要经过数字到模拟的信号转换,因此,即使窃密者使用录音设备录下合法用户的声音进行声纹身份认证,经过从模拟到数字、再从数字到模拟的两次信号转换,声音频谱会有明显衰减和失真,这种失真很容易被认证程序分辩出来。所以,依靠录音登录也不能通过声纹认证。适当调节声纹认证严格程度的阈值,声纹认证的“错误接受率”和“错误拒绝率”可以有所下降。(四)情报侦听声纹识别技术对说话人身份确认的作用在情报侦听中具有相当重要的价值。目前该技术在军事情报工作中已经有所应用,据报道,曾迫降在我国海南机场的美军EP-3侦察机中就安装了声纹识别侦听模块。这一声纹识别系统功能强大,只要被侦察者通过无线电进行对话,该系统便能查明通话者的身份,尤其是高层领导者的身份。美军正是靠着这套功能强大的系统,掌握了其他国家大量绝密情报。五角大楼曾专门邀请语言学家,对被侦察国家的语言进行了全面深入的研究,开发出了一套独特的电子监听系统,只要美军截获到对方的通话,这套系统能立即识别出通话者的身份,从而判断出从中掌握到的情报的价值到底有多大。当截获到对方通话后,监听系统能自动删除杂音,通过与声音数据库相对照,准确识别出通话者身份。据美国《华盛顿时报》披露,美国国家安全局一直将声音识别技术当作研究重点。比如,利比亚领导人卡扎菲就是美国情报机构重点识别的对象,现在,只要卡扎菲利用利比亚的通信网络进行通话,声音识别系统就会立即提醒工作人员:卡扎菲正在通话,请注意。事实上,早在70年代,美国国家安全局就已经掌握了移动电话声音识别术,如果前苏联领导人勃列日涅夫乘车行驶在莫斯科的某条大街上,他用移动电话跟其他人说话,国家安全局的声音识别系统就会立即确认出勃列日涅夫的身份,他的谈话内容就会立即被国家安全局工作人员记录下来。五角大楼一位情报官曾表示:“这套系统甚至能够分辨出是车内的勃列日涅夫还是其他人打的嗝儿。最近美国前情报官詹姆士.巴姆福德在其新著《秘密》一书中透露的一些内幕消息也证实了这套声音识别系统的存在。书中说,美国情报部门开始声音识别技术的研究已经有很多年了,最近几年,这套系统的功能不断完善,可以准确地识别出具体的声音。巴姆福德指出:“监听员甚至可以说出被监听者是否感冒了。”他还透露,国家安全局拥有大量被监听者的资料,有时候,监听员在监听时,旁边就放着这些被监听者的照片。

最新评论

发表评论

Ai中国网

本文网址:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇