python自动语音电话
依稀记得去年生日,对着Google说"SingmeHappyBirthday"。
她真的给我唱了英文版的生日歌,满怀深情地(我感觉……)。最后还加了一串调皮的鼓声。
我转头对着公司的前台小姐姐说,看见没有,你的Siri不爱我。。。
呃,不瞎扯了。
基于以上的渊源,我用Python写了一个还算得上智能的语音助理。
截图如下:
AI1
不要慌,用的现成的框架和公共API,一百来行代码而已,权当游戏。
一、整体结构
没有做过多的设计(不懂。。。),整体就是一个简单的线性结构,顺序执行。
一次交互完毕后,从头开始重复执行。
SpeechRecognition(录音)-->百度语音(Speech-to-Text)-->图灵机器人(语义分析及应答)-->百度语音(Text-to-Speech)-->PyAudio(音频播放)
二、SpeechRecognition
SpeechRecogintion是Python的一个语音识别框架,已经对接了如谷歌和微软的STT(语音转文本)服务。
本项目里的语音识别及合成用的是百度的开放服务,所以只是需要SpeechRecogintion的录音功能。
它可以检测语音中的停顿自动终止录音并保存,比PyAudio更人性化(代码写起来也更简单)。
安装依赖库
Windows
安装SpeechRecognition需要提前装好Python的PyAudio