五款智能语音助手横评:第一名居然是这款国产手机
首先是唤醒速度的对比,五个语音助手的反应都很快,OPPOReno10倍变焦版的Breeno以2.03秒的成绩取得了第一位位置。在响应速度方面,问一些简单的问题,如天气怎么样等常识问题时,Breeno的响应速度也是要比其他四款旗舰快的。
而在识别准确率方面,当@科技威力问到“小龙虾是什么垃圾”、“今天有NBA比赛吗?”等问题的时候,小爱同学、Breeno、小艺都直接给出了正确的答案,而Siri和Bixby则是跳到了网页搜索界面。
而问到新闻、电影等实际性问题的时候,除了Siri,其他都给出了对应的答案,不过当@科技威力问到“我帅不帅”这样的趣味性问题时,除了Breeno,其他语音助手的回答都没有互动性的回答,其中Siri的回答是“我对外貌没什么概念”,瞬间把天聊死了。
从@科技威力整个对比过程来看,Breeno响应速度是最快的,其次是小爱同学和小艺。而从准确率来看,小爱同学和Breeno是最高的,基本没有出现像siri和Bixby那种回答不了问题的情况。整体来说,Breeno的综合体验不错。
有意思的是,OPPOReno10倍变焦版的Breeno不仅仅是个语音助手,它还可以帮你做很多东西。如「Breeno识别屏幕」可以从一段文字提取酒店、快递、电影等相关信息,按场景分类、并把他们设成卡片,方便收藏和查看、一键扫题等。此外,OPPOReno10倍变焦版的Breeno还有识物、建议、空间、速览等应用,极大地方便我们的日常生活。
@科技威力的对比视频让我们看到了目前手机的语音助手确实更智能了,其中OPPO的Breeno无论是相应速度还是准确率都有不错的反馈,其次小爱同学也有不错的表现。未来手机智能语音助手的方向应该重点还是放在与AI的高度磨合方面,为用户打造更智能化的交互体验。返回搜狐,查看更多
语音助手哪个好用点五款好用的手机语音助手评测
未来更懂你的极有可能是人工智能语音助手,人工智能技术的重要载体的语音助手到底怎么样?语音助手哪个好用点?智能语音助手兼具理性与感性。不但可聊骚,而且可通过语音的便利性控制和管理各类智能家居产品。问题来了,智能语音助手又该如何挑选呢?
现阶段,AI(人工智能)绝对是科技行业的流行词。首先说明,基于AI系统的智能语音助手并非传统意义上的Siri、Cortana(微软小冰)等软件类语音助手。智能语音助手更类似于智能音箱的衍生产品,拥有播放新闻、天气、查询时间等基础功能,并加入了对于智能家居的深度管理和控制,给予用户更多自由。
语音助手类应用不断发展,从手机、PC到智能音箱,登陆的平台越来越广泛,竞争当然也更加激烈。那么,苹果Siri、谷歌助手、微软小娜、三星Bixby和亚马逊Alexa哪一款更好用呢?
语音助手哪个好用点?小编给大家评测一下最常用的五大语音助手,我们来看看苹果/谷歌/微软/三星/亚马逊谁更厉害?
五款语音助手的共同点很多,比如都集成在操作系统中、可通过物理或是虚拟按钮启动。功能方面,都可以执行一些任务,如查询天气、新闻、搜索信息等等。
设备兼容方面,则略有不同,比如谷歌助手不仅仅支持Android手机,还包括Chromecast甚至是iOS应用(功能有一定缩水);亚马逊的Alexa则支持Fire平板、Echo语音音箱等。
所以为了保证测试的公平,我们选择了语音助手运行体验最好的平台,比如iPhone(Siri)、Windows10PC(小娜),以此类推。下面,就正式进入测试环节。
测试一:基本问题回答
首先是最基本的操作,我们选择了查询天气、下一次日食是什么时候、体育比赛结果、讲笑话和电影放映时间等问题。
基本上,所有语音助手都能迅速地反应并做出准确的回答。不过相对来说,三星Bixby的理解能力稍弱一些,更容易理解语境直接的问题,或许是因为它最年轻吧。
至于下一次日食的问题,有的语音助手回答是2024年、有的则是2018年,其实都没有错,因为2024年是“美国的下一次日食”、而2018年则是距离现在最近的下一次日食。所以问语音助手问题时,尽量更具体一些。
测试二:执行简单的任务
接下来,我们测试了五个语音助手执行简单任务的能力,包括设置提醒、在YouTube上播放视频/音乐、打开网络浏览器、查找日历和导航。
测试中发现,语音助手们对YouTube的支持不够好,除了谷歌助手和三星Bixby之外,苹果Siri、微软小娜和亚马逊Alexa都无法直接打开或是无法播放。当然,这个操作也可套用至其他在线视频服务,看来这是语音助手们的弱项。
至于处理复杂任务的能力(主要是启动浏览器并打开特定网页),谷歌助手、苹果Siri和三星Bixby更胜一筹。
测试三:执行复杂任务
最后一项测试,自然是最困难的。复杂任务包括打开第三方应用程序、网络叫车、操控飞利浦Hue灯泡、网络订餐和下载应用。
需要单独指出的是,三星Bixby虽然支持飞利浦Hue、但必须提前购买一个SmartHub桥接器;而微软小娜并没有提供直接支持,需要下载第三方应用才能实现。
最终测试结果有点复杂,很难说哪一款语音助手拥有绝对优势,比如苹果Siri可以定比萨但仅是基于位置,不能直接说出餐馆名字;谷歌助手则只有在GoogleHome音箱上才能订餐和叫车。
如果非要比出高低,亚马逊Alexa是错误率最低的(只有一次),另外还是在一款低价平板上完成测试的。
哪个是最好的?
最后,我们来逐个点评吧。谷歌助手相对来说是上下文理解能力最好的,这是其他助手们无法相比的。不过,它的一些功能需要借助GoogleHome来实现,比如订餐、叫车等,对于用户来说需要花费更多成本。
苹果Siri是最早进入市场的语音助手,优势在于平均,在每个测试环节中都位于前列。虽然它只能在iOS设备上使用,但令人印象深刻的是良好的向后兼容性,也就是说在iPhone6等老款手机上的表现也不错。当然,限制就是你只能买iPhone或iPad才能使用它。
亚马逊Alexa的优势则在于定制性,可以为它安装各种小插件实现更多功能,实际上最初亚马逊也是通过这种形式让Echo音箱支持更多智能家居产品的。另外,它擅长收集信息,用户不必重复说出一些说过的内容。遗憾的是,支持Alexa的设备实在是太少了。
三星Bixby是语音助手中最年轻的,但也有令人印象深刻的部分。它的优势是最像一个实际的个人助理,每次都会在屏幕上有反馈,执行力也不错。它的缺点则是功能略简单直接,语境理解还不够好。
最后是微软小娜,优势在于无处不在,版本包括iOS、Windows10、Android甚至是XboxOne,在很多设备上都可以使用。它在实际使用时竞争力不是很强,很多操作无法实现,虽然可以通过整合第三方应用来实现,但微软还应该继续加强其自身功能。
如何挑选语音助手?智能语音助手虽与智能音箱有异曲同工之处,但两者又存在明显的不同。智能语音助手更类似于传统意义上操控和管理智能家居的“遥控器”,只不过是将按键转换为语音。
智能语音助手是感性和理性的合体,仅仅会“聊骚”显然不是智能语音助手的初衷,实用才是王道。当然,现阶段智能语音助手还远远达不到科幻电影中的地步,仅可通过语音查询天气、股票、时间,播放新闻、歌曲、故事等。但随着大数据的运用以及语音优化方案的提升,智能语音助手也会变得越来越“聪明”。
可以预见,智能家居的未来绝对是以更人性化的语音操控为主,APP端控制为辅。智能语音助手则更像是用户的“小帮手”,通过语音即可控制智能灯具、智能扫地机、智能空气净化器等设备的运行。不过,智能语音助手只能控制同一平台下的智能产品,并不能控制所有的设备,而就目前来说生态圈建设较完善的也仅有米家、华为、京东和阿里等为数不多的几家厂商。
辅助参数解析
智能家居的操控并非那么简单,除了要求是同一平台下的生态圈产品之外,基本参数上消费者也应留意。
“就怕听不见”,相信不少消费者对于智能语音助手的“听力”也有着这样或那样的疑问。智能语音助手多配备3-6个全方位麦克风,5米距离内可正常唤醒。而处于嘈杂环境下,智能语音助手的“听力”就会下降,此时不妨将智能语音助手的放置于离自己近一些的位置。
现阶段,智能家居设备多通过Wi-Fi和蓝牙方式与APP端连接(少数采用ZigBee连接方式)。因此,智能语音助手也应配备Wi-Fi(最好为双频)和蓝牙管理模块,方便与同一平台下的智能设备联动。
合理避开缺点
当然,事物都有两面性,智能语音助手优点颇多但也并非没有缺点。
可以说,现阶段智能语音助手虽时尚新颖,但仍在一些地方不够成熟,比较典型的非音质问题莫属了。智能语音助手多选用小模块设计且价格也较为亲民,在如此小的封闭空间内放入麦克风、内置锂电池、扬声器等部件,还要考虑成本等因素,智能语音助手的音质可想而知。
另外,智能语音助手的生态圈问题同样让人烦恼。众所周知,智能家居虽发展迅猛,但仍无一个统一的行业标准。智能语音助手更像是一个补足自家生态圈的衍生产品,适用产品也仅仅涵盖同一平台下的智能家居产品,缺乏了基本的统一性和兼容性。
现阶段,兼具语音聊天和控制智能家居设备的产品仍是少数,产品较为缺乏,智能语音助手同样面对这一尴尬局面。造成这样的处境主要原因还是因为智能家居的兼容性问题,不同平台设备并不具备联动功能。日常选择时,消费者还应注意优先选择同一平台下的智能语音助手。
国内最值得关注的10家人工智能语音识别公司
在谈人工智能的时候,一定不能不谈语音识别,语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。目前国内外都有公司在语音领域有所投入,其中包括才成立几年的初创企业,也包括中途入局的巨头企业,电子发烧友梳理了国内10家在语音领域影响较大的企业如下,排名不分先后,如有任何纰漏,欢迎留言指正。
科大讯飞
成立于1999年,具有语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等智能语音与人工智能核心技术。
主要产品介绍:
讯飞输入法,支持语音输入;
咪咕灵犀,中国移动和科大讯飞联合推出的智能语音助手,支持粤语,既能语音打电话、发短信、查天气、搜航班,还能查话费、查流量、买彩票、订彩铃等;
发条,一款基于科大讯飞AIUI智能引擎,通过语音交互,迅速定位用户想要内容的AI音乐助手;
讯飞电视助手,可以语音播放、换台;
思必驰
成立于2007年,一家专注于智能硬件领域的语音公司,主要面向智能硬件三个垂直领域:智能车载、智能家居和智能机器人,提供自然语言交互解决方案。2018年6月26日,宣布完成D轮5亿元融资。
主要产品介绍:
对话操作系统AIOS系统(AISpeechOperatingSystem思必驰人工智能操作系统)——运行于Android、Linux、阿里云OS等主流操作系统之上,目前主要用于车载领域(AIOSForCar)和家居领域(AIOSForHome);
软硬一体化的芯片模组,它提供声源定位、个性唤醒、语音识别、语义理解、多轮对话等功能,主要用于家居和机器人领域。
云知声
成立于2012年6月29日,一家智能语音识别AI技术企业,专注于物联网人工智能服务。2018年7月,云知声宣布已完成6亿元人民币C+轮融资,至此,云知声C轮系列融资总金额已达13亿元人民币。
主要产品介绍:
面向物联网的AI芯片UniOne,这是一款拥有自主知识产权和语音解决方案的物联网AI芯片,也是面向AIoT(AI+IoT)的AI芯片;
基于该款芯片的智慧家居和智能音箱方案,该方案可以帮助客户完成语音项目开发,加速客户AI产品落地,同时为客户定制AI语音模块,快速量产。
出门问问
成立于2012年,一家以语音交互和软硬结合为核心的人工智能公司,拥有自主研发的语音交互、智能推荐、计算机视觉及机器人SLAM技术。至2017年4月,出门问问共完成六轮融资,累计融资额超过2.55亿美元。
主要产品介绍:
硬件产品包括:TicWatch系列、TicPods系列、TicKasa系列、TicBand、TicMirror、TicWear等,所有硬件都围绕”出门问问”这款应用,它既是一款语音助手App也是连接所有硬件的核心。
声智科技
成立于2016年,一家专注声学前沿技术和人工智能交互的科技创新公司,提供从端到云的智能语音交互技术和服务方案,以及从芯片、模组、开发板到白牌产品的智能语音应用方案。
主要产品介绍:
SoundAIAzero,一款集成声波配网、波束形成、声源测向、噪声抑制、混响消除、回声消除、语音唤醒、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话等全链条智能语音交互开发系统,兼容主流智能语音芯片和硬件架构,支持DuerOS、AliGenies、小爱平台、腾讯叮当、Alexa等AI内容平台;
SoundAI麦克风阵列芯片,支持USB的低功耗麦克风阵列芯片SAI101C;
SoundAI麦克风阵列模组,基于声智科技麦克风阵列核心技术的软硬一体化方案,实现全方向唤醒、声源测向、定向拾音、噪声抑制、混响消除、回声抵消、语音识别、语义理解、声纹识别、语音合成等功能,满足用户在语音交互领域的全方位需求。
捷通华声
成立于2000年10月,是一家专注于智能语音、智能图像、生物特征识别、智能语义等全方位人工智能技术研究与应用,全面发展人工智能云服务的高新技术企业。
主要产品介绍:
灵云开放平台,合作伙伴可根据行业用户实际应用场景,灵活挑选、组合应用多项项人工智能技术,嵌入到系统集成商的平台中,可为各个行业的企业办公自动化提供各种人工智能能力,实现智能化应用。
语音合成,应用灵云提供的TTS技术,实时、准确地将文本转换为自然、流畅、清晰的语音;
语音识别,应用灵云提供的ASR技术,具备高识别准确率、高识别速度、领域模型可定制、支持多种处理模式等功能,同时具有SDK开发简单、开发包资源占用小等优势。
声纹识别,应用灵云提供的VPR技术,通过对说话者语音和数据库中登记的声纹做比较,从而确定该说话人是否为本人,文成对用户进行身份校验和鉴别。
智能语音导航,基于灵云平台应用灵云语音识别(ASR)、语音合成(TTS)、语义理解(NLU)等技术,允许电话呼入的客户以开放的方式表述业务需求,系统将用户的语音转化为文本。
智能语音质检,基于灵云平台应用灵云语音识别(ASR)技术,将海量录音数据进行智能化的自动语音转文本、关键词检出、语速分析、静音分析、情绪检测等核心技术产品,可大大提高企业质检效率、解决人工质检局限性、提升服务质量与管理水平、降低企业运营成本,辅助业务经营决策。
SpeakIn
成立于2015年,一家全球领先的声纹识别与身份安全人工智能公司,2018年5月SpeakIn及其全资子公司国音科技宣布完成近近亿元人民币融资,本轮融资由IDG资本领投。
主要产品介绍:
SpeakIn核心算法,使用目前学术界最前沿、基于深度学习声纹识别技术,使用大数据训练的深度神经网络(DNN)能够提取出更准确的说话人特征,拥有多种声纹识别的前端音频信号处理算法,极大的提高了准确度和鲁棒性,确保声纹提取和验证的速度,并适应多种不同场景与应用的需求。
SpeakIn核心技术,包括活体检测技术、情绪识别、人声分离、性别识别、声纹大数据检索与比对、云平台技术、动态声纹数据库技术、自研声纹采集专用硬件、前瞻性研究等。
百度
主要产品介绍:
语音识别,通过场景识别优化,为车载导航,智能家居和社交聊天等行业提供语音解决方案;
长语音识别,在会议、教学或者媒体采访中,长语音识别服务可快速准确的将长时间的语音转化为文字,方便进行拷贝和编辑等后续的工作;
远场语音识别,通过麦克风阵列前端处理算法,有效消除噪音,同时对目标说话人声音进行增强,使得智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别;
呼叫中心实时语音识别,通过MRCP或TCP协议进行低成本对接,将语音讯号转化为文本流实时输出。应用于智能客服,外呼机器人,实时电话质检,电销辅助机器人等场景;
呼叫中心音频文件转写,可将电销业务、客服业务、质检业务等多场景的语音精准地转为文字。
腾讯
语音识别,依托腾讯的语音技术,为开发者提供全面优质的语音转文字功能。
长语音识别,依托腾讯的语音技术,为开发者提供全面优质的近场长段语音转文字功能,目前支持汉语普通话,并涵盖南北地域重口音。
关键词检索依托微信AI的语音技术,在给定关键词文本列表的前提下,在音频中精准定位出现了哪个或哪几个关键词、具体时间起止点以及置信度,比语音识别更高效。
语音合成,依托腾讯领先的语音技术和深度学习算法,为开发者提供全面优质的文字转语音服务。
小米
小爱同学语音服务基于小米声学实验室、大数据及全生态建设,涵盖语音、NLP、搜索推荐等技术,为开发者提供高效、便捷、智能的语音服务。小爱同学语音服务涵盖影音视听,实用工具,生活,知识教育,游戏趣玩,休闲娱乐,儿童等近百款自研精品技能及上千款第三方技能,且支持语音控制所有小米IoT设备。
总结
语音识别的最终目的是能够真正的理解人类语言甚至是方言,过去几年,人们在人工智能领域和深度学习领域的突破,让语音识别取得了很大的进步,然而在方言识别方面,还极少公司取得比较瞩目的成绩,语言理解本身就是一个复杂的领域,期待未来能够有更多突破。
更多精彩阅读: