语音识别技术面临的问题人工智能技术语音识别应用领域有哪些问题

发表时间：2023-07-17 11:41:01

语音识别技术面临的问题

高皓2000/12/19

凭心而论，语音识别是一项复杂的技术，特别对于汉语语音识别尤其如此。因此，尽管多年前就有众多公司和研究机构开始了语音技术，包括语音识别和语音合成技术的研究，但直到最近一两年，在国内应该说是今年，才开始有规模的商用。

国外已经有了不少较大规模的语音识别IVR系统或者呼叫中心的应用，然而在国内，虽然有将语音识别和呼叫中心结合起来的趋势，但仍没有多少应用。这其中虽然有诸多影响因素，但重要的一点就是汉语语音识别技术还不够完善。那么，语音识别技术要进入大规模商用，还要跨越哪些障碍呢？

■用户的独立性所谓用户的独立性，就是语音识别软件能够识别有不同嗓音和口音的用户，而无需通过训练软件来使其识别一个特殊用户的声音。目前的许多语音识别软件，是基于标准的发音来进行识别的。而实际上，人们说话千差万别，发音也各不相同，特别对于有口音的语音来说，更是对语音识别软件提出了严峻的挑战。目前的语音识别软件大部分是通过自学习功能，不断的训练来达到软件对于特定用户语音的识别。

将来，语音识别软件的一个发展趋势就是加强处理性，可以识别在一定范围内的各种发音。而实际上

人工智能技术应用的领域主要有哪些

随着智能家电、穿戴设备、智能机器人等产物的出现和普及，人工智能技术已经进入到生活的各个领域，引发越来越多的关注。那么，人工智能目前都应用在哪些领域，运用了怎样的技术原理呢？

什么是人工智能？

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学，是认知、决策、反馈的过程。曾经有很多人戏称，人工智能就像一列火车，你苦苦期盼，它终于来了，然后它呼啸而过，把你抛在身后。虽然这是一种笑谈，但也反应了人工智能技术发展的迅速和无法想象的快，可能一个不小心，你就被远远甩在身后。

##人工智能技术的细分领域有哪些？人工智能技术应用的细分领域：深度学习、计算机视觉、智能机器人、虚拟个人助理、自然语言处理—语音识别、自然语言处理—通用、实时语音翻译、情境感知计算、手势控制、视觉内容自动识别、推荐引擎等。

1、深度学习

深度学习作为人工智能领域的一个应用分支，不管是从市面上公司的数量还是投资人投资喜好的角度来说，都是一重要应用领域。说到深度学习，大家第一个想到的肯定是AlphaGo，通过一次又一次的学习、更新算法，最终在人机大战中打败围棋大师李世石。百度的机器人“小度”多次参加最强大脑的“人机大战”，并取得胜利，亦是深度学习的结果。

深度学习的技术原理：

1.构建一个网络并且随机初始化所有连接的权重；2.将大量的数据情况输出到这个网络中；3.网络处理这些动作并且进行学习；4.如果这个动作符合指定的动作，将会增强权重，如果不符合，将会降低权重；5.系统通过如上过程调整权重；6.在成千上万次的学习之后，超过人类的表现；

2、计算机视觉

计算机视觉是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉有着广泛的细分应用，其中包括，医疗成像分析被用来提高疾病的预测、诊断和治疗；人脸识别被支付宝或者网上一些自助服务用来自动识别照片里的人物。同时在安防及监控领域，也有很多的应用……

计算机视觉的技术原理：

计算机视觉技术运用由图像处理操作及其他技术所组成的序列来将图像分析任务分解为便于管理的小块任务。比如，一些技术能够从图像中检测到物体的边缘及纹理。分类技术可被用作确定识别到的特征是否能够代表系统已知的一类物体。

3、语音识别

语音识别技术最通俗易懂的讲法就是语音转化为文字，并对其进行识别认知和处理。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。

语音识别技术原理：

1、对声音进行处理，使用移动窗函数对声音进行分帧；2、声音被分帧后，变为很多波形，需要将波形做声学体征提取，变为状态；3、特征提起之后，声音就变成了一个N行、N列的矩阵。然后通过音素组合成单词；

4、虚拟个人助理

说到虚拟个人助理，可能大家脑子里还没有具体的概念。但是说到Siri，你肯定就能立马明白什么是虚拟个人助理。除了Siri之外，Windows10的Cortana也是典型代表。

虚拟个人助理技术原理：（以Siri为例）

1、用户对着Siri说话后，语音将立即被编码，并转换成一个压缩数字文件，该文件包含了用户语音的相关信息；2、由于用户手机处于开机状态，语音信号将被转入用户所使用移动运营商的基站当中，然后再通过一系列固定电线发送至用户的互联网服务供应商(ISP)，该ISP拥有云计算服务器；3、该服务器中的内置系列模块，将通过技术手段来识别用户刚才说过的内容。总而言之，Siri等虚拟助理软件的工作原理就是“本地语音识别+云计算服务”。

5、语言处理

自然语言处理（NLP），像计算机视觉技术一样，将各种有助于实现目标的多种技术进行了融合，实现人机间自然语言通信。

语言处理技术原理：

1、汉字编码词法分析；2、句法分析；3、语义分析；4、文本生成；5、语音识别；

6、智能机器人

智能机器人在生活中随处可见，扫地机器人、陪伴机器人……这些机器人不管是跟人语音聊天，还是自主定位导航行走、安防监控等，都离不开人工智能技术的支持。

智能机器人技术原理：

人工智能技术把机器视觉、自动规划等认知技术、各种传感器整合到机器人身上，使得机器人拥有判断、决策的能力，能在各种不同的环境中处理不同的任务。

智能穿戴设备、智能家电、智能出行或者无人机设备其实都是类似的原理。7、引擎推荐

不知道大家现在上网有没有这样的体验，那就是网站会根据你之前浏览过的页面、搜索过的关键字推送给你一些相关的网站内容。这其实就是引擎推荐技术的一种表现。

Google为什么会做免费搜索引擎，目的就是为了搜集大量的自然搜索数据，丰富他的大数据数据库，为后面的人工智能数据库做准备。

引擎推荐技术原理：

推荐引擎是基于用户的行为、属性（用户浏览网站产生的数据），通过算法分析和处理，主动发现用户当前或潜在需求，并主动推送信息给用户的信息网络。快速推荐给用户信息，提高浏览效率和转化率。

关于人工智能的展望

除了上面的应用之外，人工智能技术肯定会朝着越来越多的分支领域发展。医疗、教育、金融、衣食住行等等涉及人类生活的各个方面都会有所渗透。

当然，人工智能的迅速发展必然会带来一些问题。比如有人鼓吹人工智能万能、也有人说人工智能会对人类造成威胁，或者受市场利益和趋势的驱动，涌现大量跟人工智能沾边的公司，但却没有实际应用场景，过分吹嘘概念。

转自：http://www.arduino.cn/thread-45848-1-1.html

人工智能技术应用的领域主要有哪些

参考链接：人工智能应用

什么是人工智能？

人工智能技术的细分领域有哪些？

人工智能技术应用的细分领域：深度学习、计算机视觉、智能机器人、虚拟个人助理、自然语言处理—语音识别、自然语言处理—通用、实时语音翻译、情境感知计算、手势控制、视觉内容自动识别、推荐引擎等。

1、深度学习

深度学习的技术原理：

1.构建一个网络并且随机初始化所有连接的权重； 2.将大量的数据情况输出到这个网络中； 3.网络处理这些动作并且进行学习； 4.如果这个动作符合指定的动作，将会增强权重，如果不符合，将会降低权重； 5.系统通过如上过程调整权重； 6.在成千上万次的学习之后，超过人类的表现；

2、计算机视觉

计算机视觉的技术原理：

3、语音识别

语音识别技术原理：

1、对声音进行处理，使用移动窗函数对声音进行分帧； 2、声音被分帧后，变为很多波形，需要将波形做声学体征提取，变为状态； 3、特征提起之后，声音就变成了一个N行、N列的矩阵。然后通过音素组合成单词；

4、虚拟个人助理

虚拟个人助理技术原理：（以Siri为例）

1、用户对着Siri说话后，语音将立即被编码，并转换成一个压缩数字文件，该文件包含了用户语音的相关信息； 2、由于用户手机处于开机状态，语音信号将被转入用户所使用移动运营商的基站当中，然后再通过一系列固定电线发送至用户的互联网服务供应商(ISP)，该ISP拥有云计算服务器； 3、该服务器中的内置系列模块，将通过技术手段来识别用户刚才说过的内容。总而言之，Siri等虚拟助理软件的工作原理就是“本地语音识别+云计算服务”。

5、语言处理

自然语言处理（NPL），像计算机视觉技术一样，将各种有助于实现目标的多种技术进行了融合，实现人机间自然语言通信。

语言处理技术原理：

1、汉字编码词法分析； 2、句法分析； 3、语义分析； 4、文本生成； 5、语音识别；

6、智能机器人

智能机器人技术原理：

智能穿戴设备、智能家电、智能出行或者无人机设备其实都是类似的原理。

7、引擎推荐