人工智能识别技术你了解多少人工智能的语音识别技术包括哪些方面

发表时间：2023-07-04 06:01:04

人工智能识别技术你了解多少

人工智能识别技术是指通过计算机、照相机、扫描仪等设备，自动获取并识别出目标指令、数据等信息的技术手段。最早起源于声控技术（语音识别技术），声控技术曾被广泛应用于智能手机的控制和互动中，其核心是将人的语音识别出来，与手机指令集进行对比，从而控制手机。

根据识别对象是否具有生命特征，人工智能识别技术主要可分为两类：有生命识别和无生命识别。

有生命人工智能识别技术实质是指与人体生命特征存在一定关联的技术，包括语音识别、指纹识别、人脸识别、虹膜识别等。语音识别技术工作原理是基于对识别者自身发出语音的科学有效识别，正确识别出语音的内容，或者通过语音判断出说话人的身份（说活人识别）；人工智能指纹识别技术在实践应用中，其工作原理是通过对人体指纹展开智能识别，最终正确判断识别出指纹所属的对应的人，从而满足实际需求；人工智能人脸识别技术是基于对人的脸部展开智能识别，对人的脸部不同结构特征进行科学合理检验，最终明确判断识别出检验者的实际身份；虹膜识别是通过虹膜的特征判断其实际身份。

无生命识别技术实质是指与人体生命特征不存在任何关联的技术，该项技术主要包括射频识别技术、智能卡技术、条形码识别技术。射频识别技术的工作核心是无线电磁波，其具体的工作原理是:无线电信号在电磁场下进行传送，完成数据和标签的识别；条形码识别技术包括一维码技术和二维码技术，二维码技术是在一维码技术基础之上发展出来的，给数据储存留下的空间更大，同时还可以纠错，在信息标示和信息采集中具有十分有效的运用；智能卡识别技术的识别对象主要是智能卡，智能卡主要是由集成电路板组成的，其工作主要是针对数据展开的运算和储存，通过将计算技术良好的融入到智能卡当中，针对数据进行的各种工作都做到了高效完成。

人工智能识别技术的应用非常广泛，而且不同种类的人工智能识别技术已经应用到了社会各领域，例如在语言翻译、面部识别等多个社会活动中都能够看到计算机人工智能的参与。除此之外，二维码识别和使用是人工智能识别技术运用的最典型的方式，它的利用主要是以二维码的形式生成程序和指令，在用户的移动终端屏幕上生成黑白格子拼接的平面图形，这些平面图形的分布通常来说具有一定的规律性，通过各种图形的排列组合，二维码图案具有唯一性，因此用户可以对二维码图案进行保存和记录。

我们相信，随着研究人员不断地对人工智能的有关技术进行优化和创新，人工智能识别技术将会更大程度地满足人们工作和生活需求。

本文由北京信息科技大学通信学院副教授李红莲进行科学性把关。

科普中国中央厨房

新华网科普事业部

科普中国-科学原理一点通

联合出品

更多精彩内容，请下载科普中国客户端。

作者：尹茹 [责任编辑:魏承瑶]

人工智能之语音识别概述（一）

1.语音是被研究对象和基本内容

语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言，最终目标是实现人与机器进行自然语言通信

语音识别的基本内容

语音识别的定义语音识别发展历史语音识别系统框架2语音识别的定义

语音识别的定义语音识别在狭义上有称为自动语音识别（AutomaticSpeechRecognition，ASR），它本质上是一种人机交互方式，就是让计算机通过识别和理解过程把人类的语音信号转变为想要的文本或者命令，以便计算机进行理解和产生相应的操作。语音识别的应用

3语音识别发展史

语音识别发展历程

现代语音识别可以追溯到1952年，Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统，从此正式开启了语音识别的进程。语音识别发展到今天已经有70多年，大致可以分为四个阶段。

语音识别发展的初期

70年代，语音识别主要集中在小词汇量、孤立词识别方面，使用的方法也主要是简单的模板匹配方法，即首先提取语音信号的特征构建参数模板，然后将测试语音与参考模板参数进行一一比较和匹配，取距离最近的样本所对应的词标注为该语音信号的发音。该方法对解决孤立词识别是有效的，但对于大词汇量、非特定人连续语音识别就无能为力

HMM-GMM时代

基于GMM-HMM框架，研究者提出各种改进方法，如结合上下文信息的动态贝叶斯方法、区分性训练方法、自适应训练方法、HMM/NN混合模型方法等。这些方法都对语音识别研究产生了深远影响，并为下一代语音识别技术的产生做好了准备。

DNN-HMM时代

2009年，Hinton将DNN应用于语音的声学建模，在TIMIT上获得了当时最好的结果。2011年底，微软研究院的俞栋、邓力又把DNN技术应用在了大词汇量连续语音识别任务上，大大降低了语音识别错误率。从此语音识别进入DNN-HMM时代。

深度学习时代

随着深度学习的发展，语音识别技术进入了端到端的技术阶段。端到端技术主要分成两类：一类是CTC方法，另一类是Sequence-to-Sequence方法。

语音识别技术发展历程

4语音识别框架

语音对话系统的组成

我们只关注语音识别系统，语音识别系统主要包含四个组成部分：特征提取和信号处理、声学模型（AcousticModel）、语言模型（LanguageModel）和解码搜索部分。

语音识别系统的组成

-我们只关注语音识别系统，语音识别系统主要包含四个组成部分：特征提取和信号处理、声学模型（AcousticModel）、语言模型（LanguageModel）和解码搜索部分。

人工智能识别技术你了解多少 人工智能的语音识别技术包括哪些方面