博舍

苹果做Siri的远见 语音助手带世界进入人机交互新时代 苹果的智能语音助手是谁发明的呢视频

苹果做Siri的远见 语音助手带世界进入人机交互新时代

苹果做Siri的远见语音助手带世界进入人机交互新时代

2015年09月24日08:03来源:凤凰科技

用微信扫描二维码

人参与评论

苹果智能语音助手Siri,才预示着未来手机科技的发展方向,它正与谷歌、亚马逊、微软以及众多创业公司的语音控制系统一道,改变人们对计算设备的传统看法。

苹果推出Siri语音助手服务

凤凰科技讯北京时间9月24日消息,美国《纽约时报》网络版今天撰文指出,在苹果新款智能手机iPhone6s和6sPlus上,触控功能3DTouch被广泛认为是最大的亮点。但实际上,屡遭诟病的苹果智能语音助手Siri,才预示着未来手机科技的发展方向,它正与谷歌、亚马逊、微软以及众多创业公司的语音控制系统一道,改变人们对计算设备的传统看法,引领我们进入一个人机交互的全新时代。

以下为文章全文:

苹果日前发布了新款智能手机iPhone6s和6sPlus,其最大的亮点是一项名为“3DTouch”的功能,用户只要稍微用力按屏幕,都可以激活手机上的快捷菜单。尽管如此,我在新款iPhone上面发现了一项不怎么新奇、却极为便捷的功能——这项功能长期以来一直屡遭诟病,也是外界的笑料,但它现在却成为现代计算设备上必不可少的一部分。

你也许之前听说过,它就是Siri,同谷歌、亚马逊、微软以及多家创业公司的语音控制系统一道,Siri正试图改变我们看待计算机的传统方式。

与计算机互动的最主要方式

正如戴维·皮尔斯(DavidPierce)最近在《连线》杂志上所写,语音识别和人工智能技术发展如此神速、改进如此之快,以至于我们会不由自主地想,与计算机对话不久将成为我们与它们互动的最主要方式之一。全新的Siri也为所谓“环境计算”(ambientcomputing)的发展铺平了道路——将来,机器人助手总是出现在我们身边,随时回答问题、记笔记、接受订单,或是作为那些帮我们承担更多家务的智能助手的“辅助大脑”。

想象一下,我们拥有一台经典科幻剧集《星际迷航》(StarTrek)中所描述的那种计算机,但它不是给星际飞船提供动力,而是帮你关闭地下室的灯,在Netflix网站上面寻找精彩的电影,在听到你和妻子吵架以后,提醒你第二天给她买几朵鲜花。这种帮助稍显隐蔽,而且比你想象的来得快。

Siri在iPhone6s上面的功能有了诸多重大改进,其中一项便向我们展现了这种广阔的前景。届时,你根本不必伸手去够手机,只要离老远对着它大叫一声,就可以将其激活。你大喊一声“嘿,Siri”,这款语音助手立即会做出回应。这其实并不是什么具有里程碑意义的用法;语音控制技术出现在其他厂商的智能手机上已有一段时间了——摩托罗拉早在2013年便引入了这项技术,随后多家手机厂商也纷纷跟进。当你将老款iPhone插在充电器上时,Siri也可以在它们上面使用——之所以要插到充电器上,是因为不断喊叫“嘿,Siri”,会快速消耗电池电量。但是,通过改变硬件设计,iPhone6s的耗电量已经下降了。

与用户手机建立深入连接

不过,“嘿,Siri”并不是iPhone6s上面唯一改进的地方。在苹果最新移动操作系统iOS9中,Siri还被赋予了与用户手机建立更深入连接的重任。它可以控制那些与苹果家居自动化平台HomeKit兼容的设备——例如,你可以告诉它关闭房间电灯。Siri还可以控制苹果新推出的流媒体音乐服务AppleMusic。在车上时,你可以喊一声“嘿,Siri,播放迪伦的作品,”接着真的就会播放鲍勃·迪伦的经典单曲《地下乡愁蓝调》(SubterraneanHomesickBlues)。

后来,语音控制设备开始变得无处不在。除了手机,苹果还将Siri技术集成到智能手表AppleWatch及即将上市的AppleTV机顶盒。亚马逊也有自己的语音控制系统Echo——它总是保持着一种听的状态,准备随时帮你一把,另外它还出现在亚马逊流媒体电视设备上。谷歌和微软也在手机、计算机和电视设备上集成了语音功能。

很多创业公司也加入了这场争夺。例如,一家名为SoundHound的创业公司就在探索让用户与机器对话的可能性:你不需要搜索好几个网站来预订酒店,只需说“帮我在纽约找一家三星级或四星级酒店,入住时间在下周五,价格在300美元以下”,然后机器就开始帮你做这件事。

从营销噱头到实用工具的蜕变

无处不在的语音助手也改变了我们与它们之间的互动方式。Siri和其他智能语音系统刚出现的时候,它们好像只是营销噱头,只知忽悠人。没人确切知道它们的使用方法,人与设备之间的交互总是以尴尬收场。但是,随着语音助手越来越多,人们使用的次数越来越多,它们变得也越来越自然——这意味着你以后使用的次数会更多,从而形成一个良性循环。

亚马逊语音助手Echo给我留下的印象最为深刻。当你叫一声“Alexa”,Echo会立即做出回应。我把它放在厨房里,那里也是我最需要免提设备的地方。在使用Echo初期,我并不太明白它的用法,一旦出现了什么问题,我就开始抱怨它的种种缺点。

然而,我越坚持使用Echo,就越能明白它的各种功能。现在,我每天都向Echo询问好几次天气状况,设置定时器,在厨房快速做数学题,播放音乐或有声读物。它已成为我最有用的电子设备之一。Echo的语音识别硬件比iPhone的还“给力”——Alexa能识别我从房间各个角度发出的声音,而iPhone6的“嘿,Siri”在5英尺外的地方就不能识别了。

实际上,如果不存在某种社交焦虑症,语音助手是不会变得无处不在的。一些习惯是慢慢形成的——比如说,在公交车上大声喊“嘿,Siri!”合适吗?也许这种习惯不会很快形成,但最终还是可以实现的;开始你可能很难为情,但慢慢地就会变得习以为常。(新款iPhone正试着学习掌握你的声音,从而预防别人使用你的设备。)

《星际迷航》中的一幕即将上演

使用智能语音助手也会涉及到隐私问题。为了保证不会错过某些关键词,“嘿,Siri”这样的系统就必须一直听周围环境的声音。据苹果介绍,Siri是在寻找某种模式,而非录下或存储数据信息。

但是,你可以想象一下,做到对用户所有语言的真正分析,其实距离我们并不遥远,因为它可以使语音助手发挥越来越大的作用。事实上,多年来谷歌顶尖搜索工程师一直将《星际迷航》中的计算机称为是他们对未来搜索的愿景。

谷歌搜索团队负责人阿米特·辛哈尔(AmitSinghal)曾经对我说,“《星际迷航》中的那台计算机不仅仅是一个比喻,用来向别人解释我们正在开发什么东西。同时,它还是我们努力实现的理想目标。”

那台虚构的计算机不但能对指令作出回应,还能被动地听人说话,并根据听到的内容分析和预测你想要干什么。我们很容易就能明白这种机器是如何发挥作用的。但是,为什么我必须要主动告诉计算机做什么呢——如果它正在听我说话,当我告诉妻子说我们的面包吃完了,要把面包添加到购物清单上时,难道它不应该注意到这一信息吗?如果我告诉我5岁的儿子,他只有3分钟时间刷牙或做别的事情,那么计算机不该设置一个定时器,提醒我那爱分心的儿子,他最后可能要直接睡觉,而听不到故事了吗?

事实上,一款旨在“执行纪律”的语音助手已经出现在上一季的美剧《硅谷》(SiliconValley)中了。诚然,我发现它过于理想化,但也有些好处。教育孩子很难,我为什么没想到让计算机偶尔来帮忙呢?

进入人机交互的全新时代

当然,这一切还只是一个开始。随着时间的推移,我们允许这些智能助手去听更多与我们生活有关的内容,这样,它们会开始以不可预见的方式来使用数据——届时,语音助手起到的作用不仅越来越大,而且还能从你们之间建立的良好关系中更好地获利。

这些都是让人非常担忧的事情。你根本不必在新一代iPhone上面思考它们的用途,毕竟,苹果新款智能手机不会用它的语音助手来从事任何邪恶的事情。但是,当你大声说,“嘿,Siri”、“O.K,Google”、“嘿,Cortana”或“Alexa”的时候,请记住,你正在进入一个人机交互的全新时代。

多少年来,我们不得不用计算机来完成一些任务。现如今,计算机就在我们身边的每一个角落。它们在听我们说话。它们在帮助我们干活。它们已成为我们人生经历中不可或缺的一部分。(编译/清辰)

王芮

[责任编辑:王芮]

标签:苹果Siri语音助手

用微信扫描二维码

分享到:新浪微博QQ空间人参与评论

智能语音助手泄露隐私 Siri: 倾听还是"窃听"

原标题:Siri:倾听还是“窃听”?丨睡前聊一会儿

睡前聊一会,梦中有世界。大家好,我是党报评论君。不少人都使用过苹果手机的Siri助手。但是,一句“hey,Siri”,激活的不只是一个网络世界的私人助手,还有可能是一部事无巨细的录音机。近日有报道称,Siri会在没有经过允许的情况下,将用户录音上传到服务器,由苹果公司的外包商进行人工分析。苹果官方回应称,“审听的是一个随机子集,不到每日激活的1%”“音频数据与用户账号并不相关联,目的是改进Siri的听写功能”。今天,我们就来聊聊这件事。

一个显而易见的事实是,语音助手正在走进更多人的生活。2011年,第一款语音助手Siri伴随着新款iPhone惊艳亮相,不少消费者还在较真自己的发音能不能识别,智能助手“讲个笑话”够不够有趣。然而时至今日,从智能手机到智能音箱,从智能电视到互联网汽车,语音助手已经成为“科技范儿”的一种标配,功能应用日益丰富,使用场景不断延伸,用户体验持续提升。曾经被诟病答非所问的“人工智障”,逐渐有了“人工智能”的样子。

从产品更新换代的角度来看,“声控”是在继“键控”“屏控”之后出现的新尝试,不仅在形式上解放了双手,而且在本质上拓宽了人工智能的场域。一句“hey,Siri”激活手机助手,一声“你好,斑马”实现人车交互,一句“小度小度”发出操控指令……这些无缝连接手机、汽车、音箱、手环等设备的口令,换个角度看其实就是打开科技生活方式的一串密码。

只不过,从倾听到窃听,智能语音助手的美好愿景也在受到质疑。不只是苹果的Siri,这份不光彩的名单上还有谷歌的Assistant、亚马逊的Alexa……主流语音助手接连曝出隐私泄露和监听问题,消费者的观感也逐渐从惊喜转向担忧。从不离身的手机,很有可能变成一部真正意义上的“随身听”;始终在线的音箱,如同放在房间里的一台开关在别人手中的录音机,这种生活令人“细思恐极”。可以说,便捷与隐私的界线,正在成为智能语音助手产品的生命线。

在一定意义上来说,互联网时代的数据与产品往往密不可分。尤其是在涉及人工智能的技术上,大量的用户数据是科技产品得以优化的基础,这也是苹果公司为自己收集用户数据行为辩护的理由。但是,产品研发的逻辑应该让位于隐私保护的优先级,个人许可的告知责任必须贯穿于科技进步全程,这是一个“价值排序”的根本问题。倘若以产品之名对个人信息滥采滥用,以科技进步的名义想当然侵犯隐私权利,那么即使产品再便利、功能再酷炫,最终也必被消费者淘汰。

在今天,大数据被称为“网络时代的科学读心术”。现实生活中,从各种APP过度索取隐私权限,到统计分析浏览记录、点击频次的各种算法,数据开发利用与个人隐私保护可能是贯穿整个信息时代的命题。在互联网生活早已成为公共生活一个庞大的子集的情况下,完全拒绝让渡任何个人信息无法想象。但是,信息疆域覆盖越广,数据使用越频繁,需要构筑的数字长城就要更加坚固。

当问起Siri“你会泄露我的隐私吗”这个问题时,他(她)的回答是:“我尊重你的隐私。只有在你对我说话的时候,我才会去听。”这样的回答,现在看来令人生疑。由此而言,个人信息保护不能单纯指望自律,而要通过具体而微的制度建设使之变成一项可以积极主张的权利。这不仅是追逐商业利润的道德伦理,也是各方理应恪守的法律规范。只有在个人生活、商业文明、社会治理之间寻求到可能的平衡,才能让信息交换的过程可控,让日新月异的科技造福生活,而不是平添忧虑和恐惧。

这正是:智能语音助手,隐私暗地传走;个人信息泄露,保护远远不够。

各位晚安。

(文|盛玉雷)

(责编:宋心蕊、赵光霞)

分享让更多人看到

智能语音助手+全息形象,会是下一个趋势吗

现在,智能语音助手已经无处不在,手机、音箱、电视、汽车里都能寻得他们的踪迹。他们都有一些相似的点:能识别语音、说唤醒词就能开始对话、可以完成人们的各种指令,除了内在技能以外,在外表上,他们目前也都没有能直接交互的可视化形象。

在雷锋网看来,打造一个能交互的可视化智能语音助手,或许是智能语音助手发展的下一步,也可能成为各个致力于交互式人工智能公司体现差异化的地方。

和二次元老婆一起生活

7月31日,即时通讯巨头Line推出了拥有全息形象的智能助手——全新版本的Gatebox,旨在为用户提供家人般的陪伴。

Gatebox的外观接近小桌灯大小,玻璃外壳,利用全息投影技术在玻璃内呈现出一个名为HikariAzuma的二次元人物。

Gatebox这款产品看起来天生就是为日本宅男设计的,用一个玻璃盒就可以把自己的二次元“老婆”养在家里。

演示视频也弥漫着一股单身宅的气息。

第一个画面,“宅男”在公司加班,HikariAzuma通过Line发去了消息,“你记得今天是什么日子吗?什么时候回来?”

“宅男”说,“马上回来!”

HikariAzuma:“好棒!”,随手打开了家里的灯,等待主人回家。

“宅男”回家后,HikariAzuma立马甜蜜问候:“欢迎回来。”然后羞答答地说:“今天是我们住在一起三个月纪念日,你记得吗?”

“宅男”立马拿出了礼物,HikariAzuma看到之后开心地鼓掌。

“宅男”准备好食物和酒,开始庆祝时,HikariAzuma把家里的灯光系统调节成了温馨浪漫的风格。

最后,“宅男”和HikariAzuma举起酒杯,互相感谢对方的陪伴。

视频最后的一句话写着:Livingwithcharacters(和二次元老婆一起生活)。

恩,看完视频,雷锋网编辑感受到,霓虹国在关爱宅男方面,真的是很有建树了。

从视频中男主人与HikariAzuma的交互来看,HikariAzuma具备文字对话、语音识别、视觉感知等多模态的智能。据外媒报道,旧版的Gatebox需要按实体键才能进行对话,新版Gatebox-100可以直接说唤醒词。而视觉部分则是通过外设的摄像头和传感器实现。

很遗憾,目前雷锋网编辑还没有一手体验,无法获知HikariAzuma的对话能力究竟如何,是否能实现连续的对话能力。

Line的智能语音助手布局

Line这家公司为何要做Gatebox这样的产品呢?

Line是韩国最大的网络运营商NaverCorp的子公司,其用户数已经超过2亿。除了即时通讯外,Line还有支付、音乐、游戏等垂直业务。如今,互联网巨头苹果、Facebook、亚马逊都在做智能语音助手,Line进军这个行业也是顺理成章。

去年3月,Line发布了一款名Clova的智能语音助手,然后推出了多款智能音箱,有CloveWave、Champ、Face还有CloveFriends。

而Gatebox最初是由日本公司Vinclus开发,2016年曾推出限量300台,售价30万日元。2017年,Line收购了该公司的多数股权。

现在,Line推出大众市场版本的Gatebox-100,售价降低到15万日元(约合人民币9112元),不过拒说想要和“老婆”生活,每个月还需要交纳1500日元的生活费,不然老婆就要打包走人了。原来虚拟的老婆也是要养的。

但是,令人惊讶的是,Gatebox-100现在并没有搭载Line的人工智能助手Clova。Line表示不久之后,Gatebox就会与Clova集成,可以获得Clova更多AI技能,包括与第三方服务的更深层次集成。

在雷锋网看来,不知道是否是因为将Clova与Gatebox集成需要很大的研发精力,而Line又不确定Gatebox这种小众路线的产品是否能获得足够的市场。

智能语音助手如何可视化

除Line之外,雷锋网发现还有不少公司在探索智能语音助手可视化之路。

三星也在研发类似Gatebox的产品。今年4月,在SXSW2018展会上,三星推出了一款新型智能音箱原型产品,名为Aurora。三星Aurora智能音箱没有麦克风、处理器,甚至任何其他智能的组件,而是采用了可放置兼容智能手机的底座,需要把手机放进去,才能使用。显示屏能够投影出一个全息式的动画角色。

还有微软。

7月26日,微软小冰升级到第六代,她才终于有了3D形象,以前,只是一张看不太清楚长相的二维头像。

在此之前,或许是技术不成熟,又或许是打扰不同的人会对智能助理的外观有不同的要求,小冰一直没有具体的形象。经过四年的发展,小冰从一个活跃在QQ和微信里纯粹的聊天机器人进化成为能写新闻、主持节目、写诗、唱歌、讲故事、识别图像的多才艺智能助理。VR和AR等技术也日趋成熟,视觉的3D化是大势所趋。至少有了3D的形象,小冰就可以靠颜值去主持更多的电视节目。

微软HoloLens团队也多次表示,MR是视觉,AI是大脑,AI与MR的融合是必然。例如以后微软小冰、小娜都会有3D的形象,你带上眼镜就能直接看到3D的小冰、小娜。

小冰从一开始定位为聊天机器人,就很注重对人类的陪伴,这一点与Gatebox的定位其实是一致的。对陪伴式机器人来说,拥有可视化的外形会是加分项。

我们也看到,在小冰拥有3D形象之前。已经有网友自己制作出了微软小娜的全息互动装置。

这名爱好者名叫JaremArcher,2017年5月,他在网上放出了一段视频,展示与全息Cortana之间的互动。整个装置都是他自制的,用Unity3D制作动画效果,用Kinect实现动画动作,然后还采用了面部跟踪来让Cortana一直面朝说话者。

雷锋网也设想,除了Gatebox这样一个专门全息展示装置之外,我们也可以通过其他的技术手段使得现在搭载智能语音助手的硬件也能有3D的形象。例如,利用手机AR,手机里的智能语音助理就可以有3D形象,在用户需要的时候被召唤出来,手机的摄像头也可以识别人的动作和表情,帮助智能语音助理获得视觉的部分。智能音箱则获取可以依赖投影技术,向外投射出智能助理的形象。       

雷锋网也了解到,目前还有其他的专注于交互式人工智能的公司在探索智能语音助理的可视化,放置在公共场景,例如咖啡厅、麦当劳等场所,作为服务员帮助用户点餐,陪伴用户等餐。

那么,为什么现在都还没有成熟的方案呢?

目前,对话式人工智能技术在不断成熟,GoogleAssistant已经能够打电话给餐厅帮用户预订位置,而服务员甚至无法辨认出对方是机器人。微软小冰也已经能够与人类通电话,能了解对方的情绪状态,还能安抚对方的低落情绪。但是,这都是在文字、语音对话的层次上面。

可以想象,如果智能语音助手有了可视化的、具体的形象,人们在与其交流时,会给出更高的心理预期,期待更自然、更多交互的对话。在纯文字和语音时,如果智能语音助手听不懂人类的语音、回复很慢、回复完全风马牛不相及,似乎还能原谅。要是有了一个可视化的形象,这样似乎只会显得很傻。有着完美形象,但是却时常无法与之进行正常的交流,会很气人吧。

像Gatebox这样走的是宅漫风格,能把全息“老婆”带回家,就已经能满足很多人,或许能弥补交互上的问题。除了Line这样的方案以外,雷锋网好奇,还会有什么样合适的场景呢?

相关文章:

第六代微软小冰少女初长成,捞金能力大提升

对话翁嘉颀:畅聊竹间智能情感计算技术与商业落地|CCF-GAIR2018

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇