搭建智能语音助手思路整理
目录唤醒模块录音模块语音转文字对话机器人文字转语音播放模块主体控制模块搭建一个智能语音助手可以大致分为一下几个模块唤醒模块录音模块语音转文字对话机器人文字转语音播放模块主体控制模块唤醒模块唤醒唤醒模块一旦唤醒,暂时就不工作,唤醒工作结束后继续工作唤醒之后检查网络状态待选方案
snowboy
录音模块一定时间内没有说话自动关闭,系统继续进入等待唤醒状态
一定时间内还在讲话,需要继续录音
录音时间过长提示用户暂停录音,否则继续下一步
录制完成的音频储存为wav格式,录音完成后录音模块停止工作
预选方案
RespeakerUSBMicArray+pyaudio
语音转文字出错后根据不同的错误做出反馈,主要的错误有
返回空字符网络错误预选方案百度语音识别or讯飞语音识别(免费调用量较多)
对话机器人上传文字之后对话机器人会返回相应的文字,错误的处理同语音转文字部分相同
预选方案
tuling机器人or百度机器人
文字转语音将对话机器人返回的文字转换成语音,主要涉及语音合成技术,百度讯飞等都有相应的api
预选方案
百度语音识别or讯飞语音识别(免费调用量较多)
播放模块将语音播放出来
预选方案
扩音器
主体控制模块当对话机器人回应唤醒人的时候是否进入下一轮的录音状态,或者是返回待唤醒状态接入外设时可以从语音识别的文字中查询对应的关键字,然后处理