生活中的七个语音识别经典应用
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。
基于声纹识别的通用语音控制系统设计
随着物联网的发展,对家庭电器的控制将会有更多的发展,而语音作为一种自然简单的方法将是一种有效便捷的控制方式。如果可以把语音控制与安全控制结合起来,系统就变得更自然直接更人性化了。在本设计就是希望通过设计出一个通用的系统为将来的这些应用实现基本的框架。
带语音控制的多功能无线监控轮式机器人
本文的仪器设计具有简单、轻便、灵活、达到产业化所要求的质量标准。本项目已对技术进行了充分调研和评估,已将技术风险降到了最低,同时提出了优化最优的技术实现方案;对于市场亦进行了充分有效的评估和调研,已将风险努力降到了最低,具有广阔的应用前景。
基于FPGA的语音控制选频滤波器设计与实现
目前许多语音识别的算法研究都是基于软件平台的,真正的语音识别硬件实现很少,我们的研究针对小词汇量孤立词非特定人的语音识别系统,学习并研究当前主流的语音识别算法。
一种基于SPCE061A单片机的燃气炉灶语音控制装置
笔者正是基于解决燃气炉灶的安全使用问题而引入语音控制技术,在传统的燃气炉灶基础之上,加装语音控制装置,对燃气炉灶的点火、灭火、火力调节、火焰异常熄灭时紧急关闭气源等功能都能用语音命令和语音提示智能化地完成。
DIY创意家电:基于AVR的家庭语音控制器的软硬件实现
本项目开发的家电关键词语音识别系统,可实现语音应答报时以及对基本家电的语音控制,让语音技术融入到日常生活中,给人们带来更便捷、更舒适、更健康的生活模式。
DIY实现智能家居:智能家电语音控制系统的完整设计方案
普通家庭中都会有很多需要红外遥控器控制的家电,由于红外线传输会受到空间位置影响,并且过多遥控器会导致使用不便的问题,为解决这些问题,于是设计一个可将多个遥控设备集中于一体并且可以通过声音控制其常用功能的集成设备,并且在家电关闭的时候能自动切断其电源,达到节能的目的。
非特定人车载音响语音控制系统
本文提出了一种的以专用语音处理芯片UniSpeech-SDA80D51为核心控制车载音响操作的设计方案,并在SL1102C1型车载音响上实现了对非特定人的语音识别与控制。
什么叫语音识别系统
语音识别系统是指将人的语音信号转换为计算机可读的文本或命令的技术和系统。它的核心设备是语音识别软件,可应用于语音输入、语音合成、口语训练等领域。
1.什么叫语音识别系统语音识别系统是一种通过捕捉语音信号后对其进行分析和处理的技术。它主要依赖于模式匹配、统计建模和人工神经网络等方法来进行语音识别操作。
2.语音识别系统包括哪五个部分语音识别系统通常包括以下五个部分:
前端声学处理-捕获语音信号并将其变为数字信号。特征提取-将数字信号转化为能够进行语音识别的特征向量。声学模型-匹配特征向量到相应的语音单元上。语言模型-根据语法规则和语言知识进行翻译操作。解码器-对语音识别结果进行排列,并进行纠错和适当的补全操作。3.语音识别系统的原理语音识别的核心原理是将语音信号转化为数字信号,并基于相应的声学模型和语言模型重新组合,从而得出最终的语音识别结果。其中,最关键的环节是声学模型的训练和优化。一般采用隐马尔可夫模型(HMM)、条件随机场(CRF)等方法对声学模型进行建模,并通过大量的语音样本进行训练和优化。
4.语音识别系统的应用语音识别技术已经广泛应用于如下领域:
语音输入-可以实现通过语音命令控制电脑、手机等设备的操作。拨打电话-可以在自动语音应答系统中提供人机交互服务。口语教育-微信小程序、在线学习平台等进行口语测试、口语趣味互动等活动。健康护理-在医疗机构中可以进行患者语音识别、声线分析、话语情感等方面的应用。语音识别技术在医院中的应用
语音识别技术在医院中的应用发布时间:2019-09-05浏览数:25600韩国献
摘要:随着我国医疗信息化建设的不断发展,基于EMR的医院信息系统不断完善,集成化平台的建设更加促进了数据共享和数据挖掘。面对如此庞多的子系统,医务人员需要完成大量的文字录入工作,文字录入的即时性、便利性、准确性在一定程度上影响着医院整体的工作效率、医疗成本、医疗质量。本文主要分析当前病历录入存在的问题,探讨语音识别技术在医院临床工作中的应用,并总结其在应用过程中存在的问题。
关键词:语音识别;病历录入;医疗信息化
中图分类号:R197.3;TN912.34 文献标识码:B DOI:10.3969/j.issn.1006-1959.2019.22.007
文章编号:1006-1959(2019)22-0019-02
ApplicationofSpeechRecognitionTechnologyinHospital
HANGuo-xian
(DepartmentofInformation,HenanStaffHospital,Zhengzhou450002,Henan,China)
Abstract:WiththecontinuousdevelopmentofmedicalinformationconstructioninChina,thehospitalinformationsystembasedonEMRhasbeencontinuouslyimproved,andtheconstructionofintegratedplatformhaspromoteddatasharinganddatamining.Facedwithsuchalargenumberofsubsystems,medicalpersonnelneedtocompletealargenumberoftextentrywork.Theimmediacy,convenienceandaccuracyoftextentryaffecttheoverallefficiency,medicalcostandmedicalqualityofthehospitaltoacertainextent.Thispapermainlyanalyzestheproblemsexistingincurrentmedicalrecordentry,discussestheapplicationofspeechrecognitiontechnologyinhospitalclinicalwork,andsummarizestheproblemsinitsapplication.
Keywords:Speechrecognition;Medicalrecordentry;Medicalinformationization
隨着我国医疗信息化建设的不断发展,基于EMR的医院信息系统,包括电子病历、影像、手麻、重症、移动护理、移动查房、心电网络、远程医疗等子系统得到不断完善,集成化平台建设更加促进数据共享和数据挖掘。面对如此多的子系统,除可以共享的基础信息,更多诸如病程记录、手术记录、检查报告等个性化信息则需要医务人员手工录入。香港德信对中国医院电子文本录入工作量调查显示,40%以上的医师每天进行文字录入时间约为4h,一半以上的医师每天文字录入时间占工作总时间的40%左右[1],说明文字录入工作严重地影响着医师的工作效率。另外,在部分特殊科室,如彩超中心、内镜中心、口腔科、手术室等,需要边操作边录入,操作者不能即时完成,调阅记录存在诸多不便,也在一定程度上降低了医院的整体工作效率,增加了医院成本,因此亟需一个较为方便的录入方式和口令调用程序来解决这一问题,语音识别技术是目前临床应用中较为理想的人机交互方式。该技术可以在一定程度上降低医师的工作强度、提高工作效率,最终提高医院的整体工作效率,达到降低医院运作成本的目的,现介绍如下。
1传统病历录入过程中存在的问题
1.1临床科室 在临床工作中,伴随着电子病历上线及大范围的应用,可以将临床病历录入操作者分两类:一类是对计算机较为熟悉的年轻人,打字速度较快,也善于应用电子病历系统,他们通过建立模板、复制粘贴,快速的完成病历书写,但存在部分病历内容千篇一律、张冠李戴,甚至有漏改、漏删等问题,不仅缺乏病历个体差异内容,还影响医疗质量,更影响患者后期会诊、治疗等。另一类是对计算机不太熟悉的年长医师,他们有丰富的临床诊疗经验,但不能熟练应用电子病历系统,病历录入费时费力。有些医院会为其配备手写板,但操作并不流畅,且识别率低,这在一定程度上影响了医师的工作效率,增加了医疗成本。
1.2超声中心、康复治疗中心、内镜室及口腔科 对于超声、康复、内镜、口腔等部门,由于医师工作的特殊性,无法边操作边进行文字录入,一般分为以下几种情况:①通过“一对一”专业人员的配合以提高检查、治疗报告录入效率;②由其他工作人员协助记录关键数据,后期进行补录完善;③医师检查或治疗时进行录音,再由其他工作人员集中根据录音内容转录成文字,实现一名录入员服务多名医师。但这种方法受专业差异等外在因素影响,容易导致报告录入不准确,甚至出错,工作人员往往需要折返工作,延长了输出检查或治疗报告的时间。
1.3放射科、病理科及急诊科 在放射、病理、急诊等科室,因检查结果多数不同、每个患者情况差异较大,病历报告要求即时性,需要快速生成大量报告单。面对庞大的文本录入工作,特别是急诊科,目前多数医院仍是手写病历,手工录入和手写病历占据了医师大量的时间。鉴于这些情况,语音识别技术成了一种较好的录入方式。据统计资料显示,美国在临床中使用语音识别录入比例已经达到10%~20%,主要用于放射科、病理科及急诊科等部门,可以有效的控制电子文本记录及诊断报告生成时效,工作效率明显提高[2]。
2语音识别技术的应用优势
语音识别技术是利用机器识别和理解人类语言信号并将其转为相应的文本和命令的技术,属于多维模式识别和智能计算机接口技术[3]。语音识别、智能语音对话的应用已经在生活中各个方面得到体现。在医疗上,语音识别技术已经在美国、欧洲等地区应用,美国Nuance公司的英语语音识别技术及电脑辅助病历抄写系统是先将患者病情口述下来,存为语音档案,同时直接传送至语音识别服务器进行转录,该系统的应用,使处理病历的时间从原本的5天降至不足1个小时[4]。
医疗语音模型是基于隐马尔可夫模型对语音资料库进行语音训练,可以通过部署私有云,建立医疗语音模型、构建语义理解规则、优化个性化数据,形成能适应各种场景的语音模型,通过深度神经网络和循环神经网络自主学习技术,对文本资料在现有专业的语音库中进行深度学习,通过登录的账号识别当前对象,判断要记录和转录的语音,执行记录并传送至语音识别服务器进行转录[5]。
软硬件技术的不断改进使语音识别在医疗中普遍应用成为可能。医疗语音系统采用分布式计算,是一种模式识别系统,包括前端预处理、后端模式识别及训练模型等,通过对数据库中的语音样本特征参数提取、分析并存为模板,后端将待识别语音信号处理后获得语音参数,按照一定的准则和测度与训练样本特征对比得出识别结果,具有高健壮性、高灵活性及高性价比等特点。在硬件方面,医疗上多采用的是定向麦克风,具有更好的敏感度和抗干扰性,大幅度提高了语音采集准确程度。
在临床科室中,医师在与患者沟通时可以边沟通边进行识别转录,例如体格检查时口述:T()℃P()次/分,R()次/分,BP()mmHg,发育(),营养(),步态(),表情(),神志()……,语音系统自动识别相应内容并自动填写,有效提高了医务人员的工作效率。同时,该系统将录入内容进行结构化存储,以方便后期调用。在实际工作中,由于语音数据需要较大的存储空间,一般医院不会作较长时间保存,可以采取针对性的保存,比如通过移动设备(PDA)采集到的病历信息、彩超放射内镜在检查时的口述、口腔和康复治疗过程中的口述信息等保留至病历归档之前,此期间可以随时提取录音。另外,系统将医务人员与患者沟通等内容做永久保存,减少重复性,提高效率,避免纠纷。
3语音识别在临床应用中存在问题
目前,语音识别技术并未在医疗领域中广泛应用,除了医院信息化发展阶段的限制之外,还有其他一些因素,如医学词汇专业性强和特殊符号多、表述人地方口音较重或发音不准、表述人情感影响、工作环境噪杂、采音设备自身抗干扰差等,均可导致语音识别准确度不高。汉字识别技术发展不成熟也是阻碍其进一步发展的关键原因。如中文特有的多音字,我国有415个基本无调音节,构成七千多个基本汉字的发音,使中文语音比英文更难识别[6]。
临床应用率不高使语音识别技术仍处于实验阶段,难以更新改进。年轻医师更偏好于利用模板录入病历信息、语音转换精准度不够等都是阻碍语音识别技术发展的因素。尽管语音识别率目前已达到96%,但仍不能完全满足实际临床工作的需要,特别是对特殊符号的识别。另外,临床医师在书写病历时,对于患者治疗措施的制定等内容需要思考,而语音识别不允许长时间中断;同時,医师在进行语音识别前后需要键盘鼠标的配合,操作不便。
4总结
语音识别技术的应用在一定程度上可以降低临床医师工作强度、提高工作效率以及降低医院日常运作成本。目前国内诸如北京协议医院、北京大学口腔医院、陆军军医大学第一附属医院、青岛大学附属医院等已经在探索语音识别技术并将其应用到临床工作中。但语音识别技术仍难以完全满足对文书要求严格的医疗行业,另外当前进行语音识别技术探索的医院多数仅限于语音转为文字,相当于语音输入法,并没有真正实现智能语音、人机交互技术。相信在未来发展中,通过不断探索实践,语音识别技术在医院应用中可以实现人机对话,通过语音口令唤醒程序指令,并根据语音准确快速地记录执行,真正地实现医疗智能化。
参考文献:
[1]孙国强,赵从朴,朱雯,等.智能语音识别技术在医院应用中的探索与实践[J].中国数字医学,2016,11(9):35-37.
[2]李伟.放射科语音识别系统中环境自适应技术的研究与实现[D].浙江大学,2013.
[3]张毅,刘想德,罗元,等.语音处理及人机交互技术[M].北京:北京科学出版社,2016:99.
[4]李金苗,李鹏,刘庆金,等.智能语音识别技术在临床医疗的应用研究与实践[J].中国卫生信息管理杂志,2019,16(2):218-221.
[5]栗小艳,唐杰,王旸,等.超声语音识别系统的研发及临床应用[J].临床医学工程,2015,22(9):1133-1135.
[6]肖强,周民伟,张海波,等.语音识别技术在电子病历中应用的难点及对策[J].中国数字医学,2018,13(3):55-56,85.
收稿日期:2019-8-29;修回日期:2019-9-5
编辑/钱洪飞
上一篇:[新华网]国家卫健委今年将力推医院智慧服务分级
下一篇:没有了
人工智能领域的认知技术,目前主要应用在哪些领域,商业收益是什么
认知技术目前主要应用在以下领域,具体如下:
1)银行业
自动欺诈探测系统使用机器学习可以识别出预示着欺诈性付款行动的行为模式;借助语音识别技术能够自动完成电话客服;声音识别可以核实来电者的身份
2)医疗健康领域
美国有一半的医院采用自动语音识别来帮助医生自动完成医嘱抄录,而且使用率还在迅速增长;机器视觉系统自动完成乳房X光检查和其他医学影响的分析;IBM的Watson借助自然语言处理技术来阅读和理解大量医学文献,通过假设自动生成来完成自动诊断,借助机器学习可以提高准确率。
3)生命科学领域
机器学习系统被用来预测生物数据和化合物活动的因果关系,从而帮助制药公司识别出最有前景的药物。
4)媒体与娱乐行业
许多公司正在使用数据分析和自然语言生成技术,自动起草基于数据的的公文材料,比如公司营收状况、体育赛事综述等。
5)石油与天然气
厂商将机器学习广泛运用在矿藏资源定位、钻井设备故障诊断等众多方面。
6)公共部门
出于监控、合规和欺诈检测等特定目的,公共部门也已经开始使用认知技术。比如,乔治亚州正在通过众包的形式来进行财政披露和竞选捐助表格的数字化,在这个过程中他们就采用了一套自动手写识别系统。
7)零售商
零售商利用机器学习来自动发现有吸引力的交叉销售定价和有效的促销活动。
8)科技公司
它们正利用机器视觉、机器学习等认知技术来改进产品或者开发全新产品,比如Roomba机器人吸尘器,Nest智能恒温器。
上述例子表明,认识技术的潜在商业收益远大于自动化带来的成本节约,这主要体现在:
更快的行动与决策(比如,自动欺诈检测,计划和调度)
更好的结果(比如,医学诊断、石油探测、需求预测)
更高的效率(亦即,更好的利用高技能人才和昂贵设备)
更低的成本(比如,自动电话客服减少了劳动成本)
更大的规模(亦即,开展人力无法执行的大规模任务)
产品与服务创新(从增加新功能到创造新产品)