人工智能 语音识别 论文
基于神经网络的语音信号识别 摘要 语言是人类之间交流信息的主要手段之一,自电脑发明以来, 人们就一直致力于使电 脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工 智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。 神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科 学,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好 地解决语音识别这样一个复杂的模式分类问题提供了新的途径。 本文针时语音识别的特点. BP 神经网络在语音识别技术中的应用进行了探索性研究, 对 进而结合人工智能领域较为有效的方法——遗传(GA)算法。 针对传统 BP 算法识别准确率高 但训练速度慢的缺点,对 BP 网络进行改进,构建了一种基于遗传神经网络的语音识别算法 (GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时问,提 高了网络训练速度和语音的识别率。 关键词:语音识别,神经网络,遗传算法,遗传神经网络,BP 网络 RECOGNITIO THE RSREARCH OF SPEECH RECOGNITION BASED ON THE NEURAL NETWORK ABSTRACT Language is one of the most important means of exchanging information among the mankind.Since the computer was invented,many scientists have been devoted to enabling the computer to understand the natural language.Speech recognition is a comprehensive technology of such areas as acoustics, phonetics, linguistics, computer science,information processing and artificial intelligence,which can be used widely.The research of speech recognition technology has been focused by the world for a long time.The neural network is a new developing science,which simulates the mechanism of human brain and was putted forward by the developing of modern science. is not the overall description of human brain, the abstract, It but simulation and simplifying of the physical neural networks of human beings. The purpose of the research in this area is exploring the human brain mechanisms in information processing,storing and searching.If people can understand these mechanisms,a new way for the research of artificial intelligence,information processing and etc. can be opened up. Artificial neural network is a system which using a physically feasible system to imitate the structure and function of nerve cells in human brain,which has the ability of self—learning,contrasting,reasoning and summarizing .It have offered a new way in solving such complicated pattern classification problems as speech recognition. This paper mainly studies the application of the BP neural network in the research of speech recognition. BP neural network can get higher identification precision, but its training speed is very low, a new recognizing algorithm based on BP algorithm by combining with good effect method in ANN which named genetic algorithm (GA) was proposed and used to improve the BP neural network. Experiments results show that the training speed can be accelerated by the method and the recognition performance is also promoted. words: Key words speech recognition, neural network, genetic algorithm, genetic neural network, BP network 1.绪论 1.1 1.1 课题背景 1.1.1 语音识别概述 随着计算机技术的发展,人与机器之间的交流也越来越广泛和深入,计算机己经渗透 到人们生活的各个方面。在现代社会中,人们逐渐习惯借助计算机来完成各项事务。在这种 情况下, 如何让计算机智能化地与人进行通信, 使人机交互更加自然方便成为现代计算机科 学的重要研究课题之一。 语音识别(Speech Recognition)主要是指让机器听懂人说的话,即在各种情况下,准确 地识别出语音的内容,从而根据其信息,执行人的各种意图。 语音识别是一门涉及面很广的交叉学科, 它是目前发展最为迅速的信息研究诸领域中的 一个。语音识别的最大优势在于使得人机用户界面更加自然和容易使用。随着计算机技术、 模式识别和信号处理技人工智能识别技术你了解多少
人工智能识别技术是指通过计算机、照相机、扫描仪等设备,自动获取并识别出目标指令、数据等信息的技术手段。最早起源于声控技术(语音识别技术),声控技术曾被广泛应用于智能手机的控制和互动中,其核心是将人的语音识别出来,与手机指令集进行对比,从而控制手机。
根据识别对象是否具有生命特征,人工智能识别技术主要可分为两类:有生命识别和无生命识别。
有生命人工智能识别技术实质是指与人体生命特征存在一定关联的技术,包括语音识别、指纹识别、人脸识别、虹膜识别等。语音识别技术工作原理是基于对识别者自身发出语音的科学有效识别,正确识别出语音的内容,或者通过语音判断出说话人的身份(说活人识别);人工智能指纹识别技术在实践应用中,其工作原理是通过对人体指纹展开智能识别,最终正确判断识别出指纹所属的对应的人,从而满足实际需求;人工智能人脸识别技术是基于对人的脸部展开智能识别,对人的脸部不同结构特征进行科学合理检验,最终明确判断识别出检验者的实际身份;虹膜识别是通过虹膜的特征判断其实际身份。
无生命识别技术实质是指与人体生命特征不存在任何关联的技术,该项技术主要包括射频识别技术、智能卡技术、条形码识别技术。射频识别技术的工作核心是无线电磁波,其具体的工作原理是:无线电信号在电磁场下进行传送,完成数据和标签的识别;条形码识别技术包括一维码技术和二维码技术,二维码技术是在一维码技术基础之上发展出来的,给数据储存留下的空间更大,同时还可以纠错,在信息标示和信息采集中具有十分有效的运用;智能卡识别技术的识别对象主要是智能卡,智能卡主要是由集成电路板组成的,其工作主要是针对数据展开的运算和储存,通过将计算技术良好的融入到智能卡当中,针对数据进行的各种工作都做到了高效完成。
人工智能识别技术的应用非常广泛,而且不同种类的人工智能识别技术已经应用到了社会各领域,例如在语言翻译、面部识别等多个社会活动中都能够看到计算机人工智能的参与。除此之外,二维码识别和使用是人工智能识别技术运用的最典型的方式,它的利用主要是以二维码的形式生成程序和指令,在用户的移动终端屏幕上生成黑白格子拼接的平面图形,这些平面图形的分布通常来说具有一定的规律性,通过各种图形的排列组合,二维码图案具有唯一性,因此用户可以对二维码图案进行保存和记录。
我们相信,随着研究人员不断地对人工智能的有关技术进行优化和创新,人工智能识别技术将会更大程度地满足人们工作和生活需求。
本文由北京信息科技大学通信学院副教授李红莲进行科学性把关。
科普中国中央厨房新华网科普事业部科普中国-科学原理一点通联合出品更多精彩内容,请下载科普中国客户端。作者:尹茹 [责任编辑:魏承瑶]