服务机器人的图像识别及语音识别技术机器人语音技术应用

发表时间：2023-06-27 03:19:34

服务机器人的图像识别及语音识别技术

原标题：服务机器人的图像识别及语音识别技术

语音识别，图像识别对服务机器人来说意义重大。图像识别和语音识别技术提升能够解决服务机器人很大一部分问题，语音技术可以让服务机器人具有非常灵敏的“耳朵”能够听到你在说什么，不止如此，可以根据有不同的声源，并且准确识别点声音的位置。图像识别技术可以让服务机器人有一双灵敏的眼睛。机器人需要以实时视频流式传输方式将图像数据传递到本地专用服务器中，并通过核心的机器视觉算法对数据进行分析处理最终反馈结果，这是软硬一体化的应用场景。就像人体一样，急需要具备眼睛、大脑这样的生理结构，也需要经过不断的学习认知才能形成对事物的判别和决策。下面由深圳米克力美有限公司给大家分享图像识别及语音识别技术。

图像识别

图像识别就是计算机或者机器人可以像人一样能够读懂图像内容。为了编制模拟人类图像识别活动的计算机程序，人们提出了不同的图像识别模型。

识别某个图像，必须在过去的经验中有这个图像的记忆模式，从而形成一个个模板。当前的刺激如果能与大脑中的模板相匹配，这个图像就被识别了。如有一个字母A，在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致，字母A就被识别了。这个模型简单明了，也容易得到实际应用。但这种模型强调图像必须与脑中的模板完全吻合才能加以识别，而事实上人不仅能识别与脑中的模板完全一致的图像，也能识别与模板不完全一致的图像。

在长时记忆中存储的并不是所要识别的无数个模板，而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型，拿它来检验所要识别的图像。如果能找到一个相似的原型，这个图像也就被识别了。这种模型从神经上和记忆探寻的过程上来看，都比模板匹配模型更适宜，而且还能对一些不规则的，但某些方面与原型相似的图像加以识别。

图像识别主要有文字识别、图像处理与识别、物体识别等模式。文字识别是识别字母、数字和符号；数字图像与模拟图像相比具有存储、传输方便可压缩、传输过程中不易失真、处理方便等巨大优势，这些都为图像识别技术的发展提供了强大的动力。物体识别是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向。目前的图像识别应用就像是盲人的导盲犬，在盲人行动时为其指引方向；而未来的图像识别技术将会同其他人工智能技术融合在一起成为盲人的综合方案提供商，如同我们在驾驶汽车时佩戴谷歌眼镜，它将外部信息进行分析后传递给我们，我们再依据这些信息作出行驶决策；而如果将图像识别运用在机器视觉和人工智能上，这就如同谷歌的无人驾驶汽车，不仅可以对外部信息进行获取和分析，还可以实现完全自动驾驶。

展开全文

语音识别

语音识别就是当你在与机器说话的时候，让机器能够听懂你在说什么。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的数字信号。语音识别技术主要包括特征提取、模式匹配及模型训练三个方面。

我国的语音识别研究起始于1958年，直到1973年才由中国科学院声学所开始计算机语音识别。进入20世纪80年代以后，随着计算机技术逐渐普及和应用以及数字信号技术的进一步发展，国内许多单位具备了研究语音技术的基本条件。

1986年3月，国家高科技发展计划（简称“863计划”）正式启动，语音识别作为智能计算机系统研究的重要组成部分而被列为研究课题。目前在大词汇语音识别方面处于领先地位的IBM语音研究小组，就是在20世纪70年代开始了它的大词汇语音识别研究工作的；AT&T的贝尔研究所也开始了一系列有关非特定人语音识别的实验。

随着互联网技术和信息技术的快速发展，手机等移动终端的快速普及应用，目前可以从多个渠道获取大量文本或语音方面的语料，这为语音识别中的语言模型和声学模型的训练提供了丰富的资源，使得构建通用大规模语言模型和声学模型成为可能。当然由于全球语音种类繁多，标准并不统一，语音识别技术的进一步突破还需要一个较为长期的过程。

米克力美的餐饮机器人、酒店服务机器人、行李服务机器人、监控机器人等多款服务机器人采用的先进SLAM技术及windows10智能交互系统，外观简洁大方，支持多种语言迎宾交流。米克力美服务机器人在图像识别及语音识别技术方面已经小有成就，具有手势识别，语音控制等人性化功能，并且能自动绕过障碍物或人，自动规划最优路线，得到行业的充分认可。

本文摘自米克力美官网，原文链接：https://www.i-so.cn/gv-news-fuwujiqirentxyysb407/返回搜狐，查看更多

责任编辑：

服务机器人的图像识别及语音识别技术 机器人语音技术应用

服务机器人的图像识别及语音识别技术

服务机器人的图像识别及语音识别技术机器人语音技术应用