博舍

智能语音助手+全息形象,会是下一个趋势吗 人工智能手机语音助手怎么用的啊视频

智能语音助手+全息形象,会是下一个趋势吗

现在,智能语音助手已经无处不在,手机、音箱、电视、汽车里都能寻得他们的踪迹。他们都有一些相似的点:能识别语音、说唤醒词就能开始对话、可以完成人们的各种指令,除了内在技能以外,在外表上,他们目前也都没有能直接交互的可视化形象。

在雷锋网看来,打造一个能交互的可视化智能语音助手,或许是智能语音助手发展的下一步,也可能成为各个致力于交互式人工智能公司体现差异化的地方。

和二次元老婆一起生活

7月31日,即时通讯巨头Line推出了拥有全息形象的智能助手——全新版本的Gatebox,旨在为用户提供家人般的陪伴。

Gatebox的外观接近小桌灯大小,玻璃外壳,利用全息投影技术在玻璃内呈现出一个名为HikariAzuma的二次元人物。

Gatebox这款产品看起来天生就是为日本宅男设计的,用一个玻璃盒就可以把自己的二次元“老婆”养在家里。

演示视频也弥漫着一股单身宅的气息。

第一个画面,“宅男”在公司加班,HikariAzuma通过Line发去了消息,“你记得今天是什么日子吗?什么时候回来?”

“宅男”说,“马上回来!”

HikariAzuma:“好棒!”,随手打开了家里的灯,等待主人回家。

“宅男”回家后,HikariAzuma立马甜蜜问候:“欢迎回来。”然后羞答答地说:“今天是我们住在一起三个月纪念日,你记得吗?”

“宅男”立马拿出了礼物,HikariAzuma看到之后开心地鼓掌。

“宅男”准备好食物和酒,开始庆祝时,HikariAzuma把家里的灯光系统调节成了温馨浪漫的风格。

最后,“宅男”和HikariAzuma举起酒杯,互相感谢对方的陪伴。

视频最后的一句话写着:Livingwithcharacters(和二次元老婆一起生活)。

恩,看完视频,雷锋网编辑感受到,霓虹国在关爱宅男方面,真的是很有建树了。

从视频中男主人与HikariAzuma的交互来看,HikariAzuma具备文字对话、语音识别、视觉感知等多模态的智能。据外媒报道,旧版的Gatebox需要按实体键才能进行对话,新版Gatebox-100可以直接说唤醒词。而视觉部分则是通过外设的摄像头和传感器实现。

很遗憾,目前雷锋网编辑还没有一手体验,无法获知HikariAzuma的对话能力究竟如何,是否能实现连续的对话能力。

Line的智能语音助手布局

Line这家公司为何要做Gatebox这样的产品呢?

Line是韩国最大的网络运营商NaverCorp的子公司,其用户数已经超过2亿。除了即时通讯外,Line还有支付、音乐、游戏等垂直业务。如今,互联网巨头苹果、Facebook、亚马逊都在做智能语音助手,Line进军这个行业也是顺理成章。

去年3月,Line发布了一款名Clova的智能语音助手,然后推出了多款智能音箱,有CloveWave、Champ、Face还有CloveFriends。

而Gatebox最初是由日本公司Vinclus开发,2016年曾推出限量300台,售价30万日元。2017年,Line收购了该公司的多数股权。

现在,Line推出大众市场版本的Gatebox-100,售价降低到15万日元(约合人民币9112元),不过拒说想要和“老婆”生活,每个月还需要交纳1500日元的生活费,不然老婆就要打包走人了。原来虚拟的老婆也是要养的。

但是,令人惊讶的是,Gatebox-100现在并没有搭载Line的人工智能助手Clova。Line表示不久之后,Gatebox就会与Clova集成,可以获得Clova更多AI技能,包括与第三方服务的更深层次集成。

在雷锋网看来,不知道是否是因为将Clova与Gatebox集成需要很大的研发精力,而Line又不确定Gatebox这种小众路线的产品是否能获得足够的市场。

智能语音助手如何可视化

除Line之外,雷锋网发现还有不少公司在探索智能语音助手可视化之路。

三星也在研发类似Gatebox的产品。今年4月,在SXSW2018展会上,三星推出了一款新型智能音箱原型产品,名为Aurora。三星Aurora智能音箱没有麦克风、处理器,甚至任何其他智能的组件,而是采用了可放置兼容智能手机的底座,需要把手机放进去,才能使用。显示屏能够投影出一个全息式的动画角色。

还有微软。

7月26日,微软小冰升级到第六代,她才终于有了3D形象,以前,只是一张看不太清楚长相的二维头像。

在此之前,或许是技术不成熟,又或许是打扰不同的人会对智能助理的外观有不同的要求,小冰一直没有具体的形象。经过四年的发展,小冰从一个活跃在QQ和微信里纯粹的聊天机器人进化成为能写新闻、主持节目、写诗、唱歌、讲故事、识别图像的多才艺智能助理。VR和AR等技术也日趋成熟,视觉的3D化是大势所趋。至少有了3D的形象,小冰就可以靠颜值去主持更多的电视节目。

微软HoloLens团队也多次表示,MR是视觉,AI是大脑,AI与MR的融合是必然。例如以后微软小冰、小娜都会有3D的形象,你带上眼镜就能直接看到3D的小冰、小娜。

小冰从一开始定位为聊天机器人,就很注重对人类的陪伴,这一点与Gatebox的定位其实是一致的。对陪伴式机器人来说,拥有可视化的外形会是加分项。

我们也看到,在小冰拥有3D形象之前。已经有网友自己制作出了微软小娜的全息互动装置。

这名爱好者名叫JaremArcher,2017年5月,他在网上放出了一段视频,展示与全息Cortana之间的互动。整个装置都是他自制的,用Unity3D制作动画效果,用Kinect实现动画动作,然后还采用了面部跟踪来让Cortana一直面朝说话者。

雷锋网也设想,除了Gatebox这样一个专门全息展示装置之外,我们也可以通过其他的技术手段使得现在搭载智能语音助手的硬件也能有3D的形象。例如,利用手机AR,手机里的智能语音助理就可以有3D形象,在用户需要的时候被召唤出来,手机的摄像头也可以识别人的动作和表情,帮助智能语音助理获得视觉的部分。智能音箱则获取可以依赖投影技术,向外投射出智能助理的形象。       

雷锋网也了解到,目前还有其他的专注于交互式人工智能的公司在探索智能语音助理的可视化,放置在公共场景,例如咖啡厅、麦当劳等场所,作为服务员帮助用户点餐,陪伴用户等餐。

那么,为什么现在都还没有成熟的方案呢?

目前,对话式人工智能技术在不断成熟,GoogleAssistant已经能够打电话给餐厅帮用户预订位置,而服务员甚至无法辨认出对方是机器人。微软小冰也已经能够与人类通电话,能了解对方的情绪状态,还能安抚对方的低落情绪。但是,这都是在文字、语音对话的层次上面。

可以想象,如果智能语音助手有了可视化的、具体的形象,人们在与其交流时,会给出更高的心理预期,期待更自然、更多交互的对话。在纯文字和语音时,如果智能语音助手听不懂人类的语音、回复很慢、回复完全风马牛不相及,似乎还能原谅。要是有了一个可视化的形象,这样似乎只会显得很傻。有着完美形象,但是却时常无法与之进行正常的交流,会很气人吧。

像Gatebox这样走的是宅漫风格,能把全息“老婆”带回家,就已经能满足很多人,或许能弥补交互上的问题。除了Line这样的方案以外,雷锋网好奇,还会有什么样合适的场景呢?

相关文章:

第六代微软小冰少女初长成,捞金能力大提升

对话翁嘉颀:畅聊竹间智能情感计算技术与商业落地|CCF-GAIR2018

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

人工智能 浅析语音助手的现状及未来发展

【PConline杂谈】自2011年苹果将Siri带进手机市场之后,语音助手类应用可谓火的一塌糊涂。还记得当年上至生活大爆炸里的谢耳朵,下至无数的果粉,纷纷以调戏Siri为乐。先不说Siri到底是否为消费者带来极致的便利,但就影响力来说,Siri一定是苹果的一个代表作品。苹果几乎以一己之力打开了一个全新的市场,再大的厂家也无法淡定,谷歌微软纷纷入局,使出浑身解数,誓要为消费者在手机上打造一名“私人管家”。那么今天,我们就来聊聊各家的语音助手。

如今手机界有三大操作系统,iOS,安卓和WP8。相应的来说,自然也有三大语音助手,Siri,Google Now和Cortana(微软小娜)。三大语音助手之中,Siri来的最早,也是名头最大的一个,不然怎么有人说iPhone4S的S就是Siri呢。

事实上,Siri直接发源于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。整个CALO计划的带头人名叫Adam Cheyer,现任苹果iPhone团队的工程总监。Cheyer说CALO早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个模仿人类的助理中,帮助人们完成不同的事情。”他形容说Siri计划就是寻求在一件消费产品中做同样的事情。其实,在Siri正式发布的前四年里,Cheyer和他的团队一直在钻研如何优化CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。对Cheyer来说,Siri并不是早期安卓手机上简单的语音识别,Siri是人工智能,是这个十年里移动平台最大的事情之一。Siri最终的目的就是为消费者打造一个贴身的数字管家,让消费者感受到科技的便捷。

iPhone4s上的Siri

有了先行者,自然就有追赶的人。或许,谷歌早就预料到苹果会渐渐在iOS中去掉谷歌服务。为了巩固自己在移动搜索领域的优势,同安卓4.1一起推出了全新的搜索应用,Googlenow。用谷歌官方的话来说,Google now会全面了解消费者的各种习惯和正在进行的动作,并利用它所了解的来为消费者提供相关信息。现如今,谷歌已经为Google now添加了诸如步行和行车里程记录,汽车租赁,演唱会门票和通勤共享等方面的内容,并且如今,Google now已经被直接整合进原生的安卓系统之中,使用更为便利。

Google now

看着苹果和谷歌在移动语音领域大展身手,同样身为科技巨头的微软自然是坐不住了。为了对抗苹果和谷歌,微软也推出了自家的语音助手---Cortana,而且针对中国市场,微软还发布了本土版的Cortana---微软小娜。虽说想达到Holo里Cortana的技术再有500年都未必能够实现,但这并不妨碍微软现在将“非完全体”的它移植进手机之中。在WP8.1之中,Cortana被定位为个人数字助理,能通过不断学习用户的使用习惯和兴趣来帮助用户组织日常活动,常规的Web搜索。

基于这种设计理念,微软为Cortana特意打造了一个虚拟的记事本。当然,这个记事本并非是隐私收集器,而是代表了Cortana记录用户的一切待办事项。并且这些待办事项全部存于云端,如果愿意,用户完全可以同好友分享信息,甚至是位置,兴趣点等等。另外,Cortana最有用的部分在于自主性的学习能力和基于时间的触发行动,有些像是一些基于“IFTTT”(网络行为连锁反应)的Web服务。随着使用时间的推移,Cortana能够学习你的发声习惯,从而更准确地理解你的意思,另外在了解你的喜好之后,理论上可以实现更智能化的主动式服务。微软也将向第三方软件厂商开发API,实现更多操作可能。

微软Cortana

说了这么多,各位读者可能感觉语音助手是一项非常“高大上”的技术,事实上并非如此。以Siri为例,Siri 所用到的技术无过乎只有两样,人工智能以及云计算。但如果更细分来说,则可分为前端技术和后台技术来看。在前端技术方面,即面向用户,和用户交互(User Interface,UI)的技术,主要是语音识别以及语音合成技术。

语音识别技术是把用户的口语转化成文字,其中需要强大的语音知识库,因此需要用到所谓的“云计算”技术。而语音合成则是把返回的文字结果转化成语音输出,这个技术理论上本地就能完成,当然也可以是在云端完成的。后台技术,其实才是真正的大角色。这些技术的目的就是处理用户的请求,并返回最匹配的结果,这些请求类型很多,千奇百怪,要处理好并不简单。基本的结构可能是分析用户的输入(已经通过语音转化),根据输入类型,分别采用合适的技术(合适的技术后台)进行处理。这些合适的后台技术包括,①以Google ,Bing,百度等为代表的网页搜索技术;②以Wolfram Alpha为代表的知识搜索技术(或者知识计算技术);③以维基百科为代表的知识库(和Wolfram Alpha不同的是,这些知识来自人类的手工编辑)技术(包括其他百科,如电影百科等);④以Yelp 为代表的问答以及推荐技术。将处理后得到的结果再返还给用户,也就完成了一次与用户的问答或是聊天。

Siri聊天

Siri和Cortana的技术基本就是如此,但一定要强调的是,严格的说Google now应当只是一款语音搜索软件,并不具备与用户聊天的的交互式功能。Google now只是利用了谷歌强大的搜索引擎,并且加入了上下文联想功能,根据用户的搜索记录,习惯来提供智能化的服务。当然,这意味着它会收集用户数据加以分析,但是其呈现出的信息还是极为有效地。

语音助手的最终目的是为消费者带来便利,因此,往往理论说的极其完美,但消费者更关心其在现实生活之中的表现。仅以在大陆的情况来看,Google now可谓毫无用处。我们都知道Google now是基于Google搜索来提供反馈的,但是在大陆,因为一些“你懂得”的原因,Google基本是无法使用的。唯一能使用的一些本机上的服务,还必需在英文界面下使用。当然,如今谷歌已经推出了Google now的桌面版和可穿戴设备版,要是各位一定想尝鲜的话,挂个VPN就是最好的选择了。

与Google now不同的是,Siri和Cortana目前都是基于Bing平台,因此两者在大陆还是完全可以使用的。Siri在经过了两年的发展之后,成功摘掉了Beta版的帽子,迎来了正式版。相对于早期只能打电话,设置闹钟等简单的操作,如今的Siri正不断地加强其功能,如多国语音,男女声,打开一些程序等,并且在识别率上也有了很大的进步。但从聊天的角度来看,Siri和有人情味还有一段的距离。并且,因为监管的原因,早期还爆出了涉黄等问题。这些都是Siri在未来要加以改正的和进步的。

Cortana在大陆的本土版叫做微软小娜,相比于以上两者,可谓接地气的多。各位读者应当还记得不久前被腾讯封杀的微软小冰吧。事实上,小娜和小冰都是微软中国团队的作品,微软中国曾说过,小冰小娜就像一对姐妹花,虽然都是偏向人工智能的产品,但定位不同,小娜更注重对用户制定任务的完成,小冰则更倾向于娱乐俏皮的交流,两者都是极为接地气的产品。

这一点,在一些小细节中有较大的体现,比如在天气预报之中加入了空气质量提醒,限行信息等,另外从第三方应用上来看,针对大陆市场,微软小娜选择了微信,新浪微博,爱奇艺等七家应用进行深度合作,例如使用微软小娜可以直接打开微信的朋友圈,这在Siri上是无法做到的。从目前大多数使用者的反应来看,微软小娜还是具有很大的优势的。而且随着后天的学习功能的加强,微软小娜必将成为WP手机的一大亮点。

接地气的微软小娜

先布局者得市场,在任何一个行业,这个道理也仅限于前期,谁能真正地笑到最后还不得而知。在竞争日益激烈的移动互联网时代,语音助手最终拼的还是是否真正为用户着想,提供更加便利的语音智能生活。这场竞争还只是刚刚开始,未来大家还有很长的路要走,谁将最终获得用户认可,就让时间给我们一个答案吧。

人工智能成功落地手机,这些AI应用你用过几个

那么,已经落地的AI智能手机上究竟有多少AI应用呢?今天小编为大家说下手机上的那些AI应用,大家可以对照一下,看看你都用过哪些?

语音助手

人工智能最早应用在手机平台上的形式应该算是语音助手了,而让用户最早接触AI这一概念的就是苹果的Siri。但是这么多年来Siri一直没有发展起来,用户的体验度也一直是不温不火的。

而今天,语音助手却成为了智能手机行业的抢滩地,苹果、三星、华为、小米等手机厂商都将语音助手作为手机的一个AI卖点,手机的AI之战也算是正式打响了。

比起当年苹果推出Siri的时候,现在的语音助手进步的太多太多,比如华为的AI语音助手,就是因为有了自家麒麟AI新品和EMUI8.0智能系统的支持,才让华为语音助手具备了更多功能,比如熄屏唤醒、语音搜图、语音翻译等。

除此之外,小E还拥有自研的120多项语音设置,另外还联动了像打车、地图导航、音乐、微信、微博、QQ等第三方APP。

AI拍照

手机摄影功能自问世以来,就深受消费者的青睐。而随着人工智能技术的发展,以华为、苹果为代表的手机企业开始将AI技术引入手机中。AI的加入,大幅提升了手机摄影体验,使手机拍照变得更专业更智能,同时也推动摄影技术进入到了智慧摄影新时代。

要知道今年上市的手机,几乎都具备AI摄影,华为的徕卡三摄、小米的“微整形”美颜相机、OV的AI智慧拍照等都具备该功能。

小编觉得真正的AI摄影冠军,非华为莫属了。要知道人家的P20Pro,可是搭载了自己独创的徕卡后置三摄和AI摄影大师系统,而且网友还称之为“地表最强拍照手机”。在专业影像评测机构DxOMARK榜单中,华为P20Pro也以114分的拍照评分,荣获DxOMARK智能手机相机质量冠军。

AI翻译

如今出国旅游对于人们来说就跟出门买菜一样,越来越便利、越来越频繁,但有一点也成为大家出去游玩的痛点,那就是语言不通。

而如今,痛点也解决了,通过AI技术能够实现实时拍照翻译,整个应用使用流程与正常拍照类似,简单易用,而且有很多手机厂家还做到了离线翻译的,比如华为的AI定制版微软翻译软件,有了AI翻译软件,让你不懂外语也能轻松游遍全球了!

智慧识屏

目前,在一些AI智能手机中有一种叫做智慧识屏的应用,这也算是手机AI应用中的一种了。用户在阅读新闻或者微信时,会遇到一些感兴趣的文字或者词语,以前在没有AI的时候,用户需要转换到浏览器去查询,而现在,有了AI的加入,用户便可以快速识别并提取与之相关的信息。

面部识别

今年的手机市场,可谓是好不热闹啊,除了“全面屏设计”火爆,面部识别同样也是爆热。

其实面部识别不算是个稀奇的技术,早在安卓4.0的时候,就已经加入了,但是这项技术一直没有火起来,厂商也没有去宣传。直到iPhoneX的面世,面部识别技术才算是真正的火起来了,从而也带动了其他商家争相采用面容ID。

说到iPhoneX的面部识别,可能很多人会认为含金量不高,毕竟在很早之前安卓就已经有使用过,但是真正了解的人都知道,为了给面容ID的组件腾出位置,苹果不得不留下被人诟病的刘海。

就因为这一设计,安卓机上的刘海屏也是一并出现了,而目前安卓阵营研究面部识别的手机主要是国内厂商,比如OPPO的R11s系列,vivo的X20系列,华为的P20系列、荣耀V10等全面屏手机。这些机型大部分都是使用的Face++提供的技术方案,因此在实现原理上是一样的。返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇