博舍

基于单片机的无线语音遥控智能车设计 语音遥控和智能语音有什么区别

基于单片机的无线语音遥控智能车设计

文末下载完整资料

1无线语音控制智能车设计概述1.1设计目的  随着电子工业的发展,计算机技术随着集成度的提高,和大规模集成电路的发展。计算机的一个重要分支——嵌入式计算机也在向高度智能化的方将发展。让机器能像人一样思考,理解人的语言已不再是一个新鲜的话题。实现使用语音控制单片机,将人机接口简化到人类可以用最自然的方式操作机器是本次设计的目的。本次拟设计能用语音无线遥控的智能小车。根据识别的语音命令来控制启动、停止、返回,完成作品虽功能单一且无实际使用价值,但可将原理推广至各种智能家电的语音遥控,所以该技术具有很高的实际应用价值。1.2设计实现总体功能

利用单片机的语音采集、播放、语音识别资源,实现人类语音的命令识别;通过数字无线传输模组,将控制指令无线发送;接收无线语音指令,实现控制小车的前进、后退、左转、右转等功能;在超出控制范围(开阔处大于100米)时能够自动停车;

2系统总体方案2.1方案论证2.1.1方案一  采用AVR系列8位单片机ATMEGA16L实现语音遥控器,由于有语音识、和语音播放和无线数传功能,所以需要扩展语音识别模块和语音播放模块还有无线发射接收模块,这样必然造成端口的资源紧张,所以还必须加入接口扩展芯片。该实现方案遥控器部分结构如图3-1所示:

3系统芯片功能介绍  在无线语音遥控智能车的设计中,主要包含四片芯片和两个模组,芯片中包括一片凌阳SPCE061A16位单片机,用于语音命令的识别、发送以及命令的语音播放。两片ATMEGA16L高档8位单片机,一片和nRF2401模组组成串口无线发射模块,另一片作为车体部分的主控制器。最后一块为L298N直流电机驱动芯片,用于接收车体主控制器的控制信号,驱动直流电机为小车提供前进的动力。

3.1主控芯片及其各部分性能3.1.1无线语音遥控器主控制器SPCE061A介绍  经过上述讨论,实现声音智能控制功能最理想的控制芯片为台湾凌阳科技推出的SOPC(SystemOnProgrammableChip)级16位MCU-DSP混合处理器SPCE061A作为处理语音指令的控制芯片,其兼有微处理器,数字信号处理器,存储器的三重功能,具有丰富的片上系统资源。凌阳SPCE061A具有μ’nSP™的指令系统提供具有较高运算速度的16位*16位的乘法运算指令和内积运算指令,增添了DSP功能,使得μ’nSPTM系列运用在复杂的数字信号处理方面既很便利,又比专用的DSP芯片廉价。凌阳内嵌32K字的Flash和2K字的SRAM,ROM和RAM统一编址,属于冯诺依曼结构计算机,这样的设计在制作中方便了对语音指令的压缩和存储。

3.1.3nRF2401无线传输模组的主要特性:  nRF2401是单片射频收发芯片,工作于2.4~2.5GHzISM频段,0~1Mbps数据传输速率,125阶(梯度1MHz)收发频率,地址检验和CRC校验。芯片内置频率合成器、功率放大器、晶体振荡器和调制器等功能模块,输出功率和通信频道可通过程序进行配置。芯片能耗非常低,以-5dBm的功率发射时,工作电流只有10.5mA,接收时工作电流只有18mA,多种低功率工作模式,节能设计更方便。其DuoCeiverTM技术使nRF2401可以使用同一天线,同时接收两个不同频道的数据。nRF2401适用于多种无线4.1.4直流电机驱动芯片L298N的介绍  L298是ST公司生产的一种高电压、大电流电机驱动芯片。该芯片的主要特点是:工作电压高,最高工作电压可达46V;输出电流大,瞬间峰值电流可达3A,持续工作电流为2A;内含两个H桥的高电压大电流全桥式驱动器,可以用来驱动直流电动机和步进电动机、继电器、线圈等感性负载;采用标准TTL逻辑电平信号控制;具有两个使能控制端,在不受输入信号影响的情况下允许或禁止器件工作;有一个逻辑电源输入端,使内部逻辑电路部分在低电压下工作;可以外接检测电阻,将变化量反馈给控制电路。其管脚图和实物图分别如图3-9、图3-10所示。

4.2无线语音遥控器中SPCE061A的功能  在本次设计中,关键地问题之一在于人声的A/D转换存储与识别,SPCE061A提供了语音输入压缩以及辨识的先进技术。

语音指令的输入。凌阳SPCE061A利用麦克风的指令输入系统,SPCE061A内置由D/A转换器DACO和逐次逼近寄存器SAR组成的逐次逼近式8通道10位A/D转换器,以及采样/保持电路。其中7个通道用于将模拟量信号(电压信号)转换为数字量信号,可以直接通过引线(IOA0-IOA6)输人(Line_Inl-Line_ln7)另外一个通道只用于语音输人,即通过内置自动增益控制放大器的麦克风通道(MIC-In)输人,是语音采集专用通道,也可设置为普通A/D输入。

2.语音指令的训练。语音遥控器作为机器,一定是不能先天理解人类的语言的,所以,必须教会它人类语言的含义。即语音训练,内容是将人类的语言事先已训练的方式经过模数转换存储在凌阳SPCE061A的FLASH中,并指定每一条语音所要指向的操作,以便在日后的使用中将采集来的语音与存储的语音相比对,以确定单片机需要进行的操作。  凌阳SPCE061A对于不同的辨识能力提供以下两种语音训练方式:1)特定发音人识别SD(SpeakerDependent),是指语音样板由单个人训练,可用于语音提示,而DVR用来录音和放音;2)非特定发音人识别SI(SpeakerIndependert)。是指语音样板由不同年龄、不同性别、不同口音的人训练,可以识别一群人的命令;在本次设计中,需要向小车训练:向前、向后、左转、右转、停止等几项语音指令,以供控制小车时的辨识使用。值得注意的是,使用非特定发音人识别需要利用大量的DVR存储不同人训练的语音,但是凌阳SPCE061A并不能提供大量的内存空间供存储使用,由于设计条件有限,无法扩展必要的存储芯片完成存储语音的功能,故选择使用特定发音人识别。其训练具体流程参看后文内容。3.对训练的语音指令的存储。将经A/D转换后的数据压缩存储,SPCEO61A单片机的16位DSP有很强的信息处理能力,最高时钟频率达49.152MHz,具备运算速度高等优势。这些为语音的录放、合成及辨识提供了条件。凌阳压缩算法中DVR可用于录、放音。语音的编码、存储、解码处理是通过操作麦克风输人所生成的WAVE文件完成的,但在这个环节上会出现的一个问题为其占用的存储空间很大,对SPCEO61A单片机的32KFLASH来说想要存储大量的信息显然是不可能的。而SPCE061A提出了解决方法:SACMV25.LIB。该库将A/D、编码、解码、存储及D/A做成相应的模块,对于每个模块都有其应用程序接口API,所以只须了解每个模块所要实现的功能及其参数的内容,然后调用该API函数即可实现相应功能。在进行A/D转换之前,从MIN_IN输入的模拟信号要经过缓冲器和放大器,AGC功能将通过MIC——IN通道输入的模拟信号放大值控制在一定范围内,然后放大信号经采样-保持模块送入比较器参与A/D转换值得确定。

  .SPCE061A的语音辨识。语音辨识是一种以语音模型为指令基础的控制方式,语音模型的质量直接影响辨识操作的速度和准确率。具体步骤是经过两次语音采集,即训练和发布指令。系统经复杂的函数操作将发布指令与预先训练的一音模型进行比对,如与语音模型相匹配,则输出控制信号。具体原理如图:

全套资料免费下载:关注v-x-公-众-号:【嵌入式基地】后-台-回-复:【毕业设计】即可获资料回复【编程】即可获取包括有:C、C++、C#、JAVA、Python、JavaScript、PHP、数据库、微信小程序、人工智能、嵌入式、Linux、Unix、QT、物联网、算法导论、大数据等资料

语音识别与语义识别究竟有何区别

原标题:语音识别与语义识别究竟有何区别?

语音识别与语义识别有何区别呢?举个更通俗的例子来说明“语音识别”与“语义分析”在人工智能技术层次上的不同:用户对着电视机说一部具体的电影或者电视剧的全名,电视机会对用户语音进行识别,自动搜索片名、播放,这就是“语音识别”;但是,如果用户对电视机说“一部爱情片”、“热播的动作片”、“香港导演的电影”、“好莱坞大片”等模糊语句,电视机根据用户的性别、爱好、平时的点播倾向等特征来进行智能的分析,并进行精准的推荐,这是“语义分析”,在智商上比“语音识别”高了好几个层次,领先一大步。

为了更直观的感受语义识别和语音识别的区别,我们可以形象的用人体器官表达出来:语音技术相当于人的嘴巴和耳朵,负责表达和获取,而语义技术相当于人的大脑,负责思考和信息处理。下面举一个常见的产品形态让我们来感受一下:

例如车载系统,人车交互过程的实现,一方面车辆获取人的语音又通过语音播报路况这都属于语音识别的范畴,而对于所获取到的语音如何理解,路径如何规划则是另一套系统。

就像你的耳朵非常好使,并不代表你的脑袋聪明。在识别同样的语音后,不同的机器可能会作出不同的反应,这就是机器对于语意理解的区别。就像说一个同学能力并不是那么强,并不能代表他的嘴巴和听力有问题,只能说他的处理能力没有那么强,而这往往取决于他的大脑。

当智能家居发展到一定程度,我们坐在电视机前就可以语音遥控想看什么节目。而交互的精准性对语义理解的能力要求很高。假如当您要看英剧《神探夏洛克》,经常会被人叫成《神探夏洛特》,因为夏洛特更顺嘴或者更普遍。这时候如果不做语义理解,可能你搜出来的名字就是《夏洛特烦恼》,因为它频度也很高。

语义识别的行业专家亓超对以上现象向我们这样解释:当你没有办法记住片子完整名字时,语义理解需要给你做纠正,做更合适处理。其实用户在看电视产生很大需求,当用户不知道要看什么,需要机器帮忙做推荐和引导,而这个过程中精准化程度、和人性化程度取决于智能化程度。

亓超将语义理解生动的比作做菜的过程。第一步买菜相当于数据获取部分,第二部洗菜就是数据清理过程,第三部烹饪就是机器学习的过程,要有各种学习工具,就像做饭要有各种厨具,各种调料;机器学习还要有学习能力,就像万事俱备后,有一门烹饪好手艺一样。第四部人工智能产品落地就像最后菜品出来装盘一样。每个环节都需要突破,需要打磨。

出处:物联中国

关于Imagination微信号

权威发布有关Imagination公司CPU,GPU以及连接IP、无线IP最新资讯,提供有关物联网、可穿戴、通信、汽车电子、医疗电子等应用信息,每日更新大量信息,让你紧跟技术发展,欢迎关注!伸出小手按一下二维码我们就是好朋友!返回搜狐,查看更多

责任编辑:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇