博舍

面向防疫的智能导诊机器人关键技术及应用 智能问诊机器人主要放置在病人家中使用吗

面向防疫的智能导诊机器人关键技术及应用

防疫期间,智能导诊机器人肩负着相关医疗咨询服务的责任,通过人工智能解答,借助语音交互技术,快速应对网络问诊和信息上报的需求。智能导诊机器人中的语音交互主要涉及语音识别与语音合成,用于实现语音片段与文本之间的转换。相较于一般的自然语言处理任务,语音识别的特殊之处在于声学模型。因此,与语音识别相关的研究主要围绕声学模型展开。经典的声学模型GMM-HMM分别采用广义矩估计(generalizedmethodofmoment,GMM)和隐马尔可夫模型(hiddenMarkovmodel,HMM)对语音的观察概率及语音的时序进行建模,导致无法学习深层非线性特征变换。微软于2012年率先将前馈神经网络(feedforwardneuralnetwork,FNN)引入声学模型建模[18],大大降低了语音识别的错误率,引领了DNN-HMM混合声学模型的风潮,并衍生出RNN-HMM、LSTM-HMM、CNN-HMM等混合声学模型[19,20,21,22,23]。上述基于DNN-HMM的声学模型要求训练特征序列和标注特征序列必须是等长的,即训练数据中每一帧都要预先确定对应的标注。针对上述问题,谷歌GravesA等人[24]将连接时序分类(connectionisttemporalclassification,CTC)技术引入语音识别,通过前向后向算法自动学习语音特征中的模型边界,解决训练特征序列与标注特征序列不等长的问题,实现了端到端语音识别。至此,业界开始在语音识别系统中大量使用CTC技术,如百度的DeepSpeech[25]和DeepSpeech2[26]、谷歌的NSR[27]等,均取得了比传统混合识别系统更好的性能。但是,CTC技术无法对输出之间的依赖关系进行建模,对上下文信息利用不充分。针对CTC技术的不足,谷歌GravesA[28]提出了RNN-T模型,巧妙地将语言模型与声学模型整合在一起进行联合优化。考虑到语音识别的本质是两个序列之间的转换,谷歌将机器翻译中广泛使用的基于注意力机制的Seq2Seq模型引入语音识别,提出了一种新颖的端到端的语音识别框架LAS[29-30]。尽管当前语音识别精度取得了较大的提升,但是重口音、方言、嘈杂环境、多人同时说话等场景下的语音识别仍表现不佳,这是当前语音交互面临的重要挑战。

智能导诊机器人(医疗机器人)

智能导诊机器人概述(CZ-Robot1s-MED) 智能导诊机器人开发初衷是解决门诊导医人数较少、重复问答较多的现实情况。在医院业务高峰期人满为患的情况下,智能医疗服务机器人可以及时响应,可以指导患者就医、引导分诊,同时向患者可以介绍医院就医环境、门诊就诊流程和医疗保健知识等。导诊机器人通过语音识别、语音合成和自然语言理解等技术,支持语音、触控、图像等多种交互方式,改善就医体验,提高医疗服务质量,是医院智慧医疗的重要组成部分和具体体现。 智能导诊机器人功能

联系我们

电话:4006-935-088  4006-937-088

售后:4008-128-728

地址:北京・清华科技园九号楼5层

智能问诊机器人价格***,可致电咨询。

查看更多相似文章  

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇