博舍

Siri们被调侃为“人工智障”,ChatGPT能拯救语音助手吗 人工智能语音助手都有哪些品牌

Siri们被调侃为“人工智障”,ChatGPT能拯救语音助手吗

·Siri的联合创始人亚当·切耶说,生成式人工智能有可能使语音助手回到最初的科幻轨道上。“我确实认为这与质量有关。”他说,“从根本上说,这项技术将实现上一代语音助理所没有的广度、灵活性和复杂性。我认为会出现复兴。”

随着与ChatGPT的开发机构OpenAI的合作成果良好,微软似乎越来越有自信,近日,微软首席执行官萨蒂亚·纳德拉(SatyaNadella)在接受英国《金融时报》采访时表示,语音助手“笨得像块石头”,“无论是Cortana、Alexa、谷歌助理(GoogleAssistant)还是Siri,所有这些都不起作用。”他宣称,新型人工智能将引领潮流。

十多年来,尽管科技巨头一直在尝试各类语音助手,但事实却表明,苹果的Siri、亚马逊的Alexa以及谷歌助理都发展不顺利,在中国,一批类似的产品也陷入了尴尬境地。《纽约时报》首席消费科技作者布莱恩·陈(BrianX.Chen)评论道,语音助手过去遇到了发展瓶颈,正因如此给了AI聊天机器人崛起的空间,让微软和OpenAI在人工智能竞赛中遥遥领先。

那么,苹果、亚马逊和谷歌是如何输掉这一轮人工智能竞赛的?

误入歧途的语音助手

12年前一个雨天,苹果公司(Apple)的高管们在一个拥挤的礼堂登台发布iPhone4s。这款手机看起来和之前的版本没什么区别,但有一个新功能很快就引起了观众的热议:语音助手Siri。

时任苹果软件主管的斯科特·福斯特尔(ScottForstall)按下iPhone上的一个按钮,召唤出了Siri,并向它提问。在他的要求下,Siri查看了巴黎的时间,定义了“有丝分裂”,并列出了14家评级较高的希腊餐厅,其中5家位于加州帕洛阿尔托。

“我在人工智能领域工作了很长时间,这仍然让我大吃一惊。”福斯特尔当时说。

如今,Siri早已成为被调侃为“人工智障”的对象。Siri的联合创始人亚当·切耶(AdamCheyer)告诉《金融时报》,ChatGPT理解复杂指令的能力,让现有的语音助理看起来相对愚蠢。“之前的能力太尴尬了。”他说,“没有人知道它们能做什么或不能做什么。它们不知道自己能说什么或不能说什么。”

其他语音助手的技术也一直停滞不前,成为被取笑的对象。亚马逊搭载Alexa的智能音箱Echo甚至作为笑点出现在2018年《周六夜现场》(SaturdayNightLive,美国脱口秀节目)的小品中,而最初,亚马逊创始人杰夫·贝索斯(JeffBezos)曾经在白板上兴奋地勾勒出他对Alexa的愿景:网上购物,控制小工具,甚至给孩子们读睡前故事。

事实上,Siri、Alexa和其他语音助手也曾在公众中引发过类似ChatGPT的热情,但在过去十年里,它们浪费了在人工智能竞赛中的领先机会。

前员工表示,亚马逊和谷歌错误地估计了语音助手的使用方式,导致他们投资了一些很少有回报的领域。当这些尝试失败后,公司对这项技术的热情就减弱了。

2014年,亚马逊发布Echo,希望该产品能够让消费者通过与Alexa对话来下单,从而帮助其增加在线商店的销量。但一位参与Alexa的前亚马逊高管表示,虽然人们很享受Alexa回答天气提示和设置闹钟的功能,但很少有人用Alexa订购商品。

亚马逊智能音响Echo嵌入了语音助手Alexa。

这位前高管表示,亚马逊可能在制造新型硬件方面投资过度,比如现已停产的与Alexa兼容的闹钟和微波炉,这些产品的售价低于或等于成本。

此外,他表示,亚马逊在创建一个让人们轻松扩展Alexa功能的生态系统方面投资不足,虽然亚马逊的商店也提供Alexa相关的第三方插件,但设置和使用十分困难,这与从应用商店下载应用程序的顺畅体验完全不同。

去年年底,亚马逊负责Alexa的部门是该公司18000人裁员的主要目标,一些Alexa高管已经离开了公司。

一位曾在“谷歌助理”工作的前经理表示,亚马逊在Alexa上的失败可能导致谷歌误入歧途。谷歌的工程师花了数年时间对其语音助手进行试验,以模仿Alexa的功能,包括设计智能扬声器和声控平板电脑屏幕,以控制恒温器和电灯开关等家用电器。该公司后来将广告整合到这些家居产品中,但这并没有成为主要的收入来源。

随着时间的推移,谷歌意识到大多数人只将语音助手用于数量有限的简单任务,例如启动计时器和播放音乐。2020年,当谷歌高管普拉巴卡·拉加万(PrabhakarRaghavan)接管“谷歌助理”时,他的团队将这个虚拟伴侣重新定位为Android智能手机的附属功能。今年1月,当谷歌的母公司解雇了12000名员工时,负责家庭设备操作系统的团队失去了16%的工程师。6月,它将终止专门为其语音助理制作的第三方“对话操作”的访问。

和ChatGPT基于不同技术

这些语音助理产品和类似ChatGPT的聊天机器人虽然功能类似,但本质上基于不同类型的人工智能模型。聊天机器人由大型语言模型提供动力,这些模型是经过训练的系统,能够根据从网络上抓取的大量数据集识别和生成文本。

相比之下,Siri、Alexa和“谷歌助理”则通过所谓的指挥控制系统进行工作。它们可以理解有限的问题和请求列表,比如“纽约市的天气怎么样?”或“打开卧室的灯”。如果用户要求虚拟助手做一些代码中没有的事情,机器人会简单地说它无法提供帮助。

这几家公司都尝试过将语音助手进行升级,但该类技术的升级难度似乎远超生成式人工智能,曾参与Siri开发的苹果前工程师约翰·伯基(JohnBurkey)说,Siri的设计很繁琐,增加新功能也很费时间。2014年,他受命改进Siri,但发现Siri的数据库包含一个巨大的单词列表,他说,这就形成了“一个大雪球”。如果有人想在Siri的数据库中添加新词,代码会“越滚越多”。

因此,看似简单的更新,比如向数据集中添加一些新短语,就需要重建整个数据库,这可能需要长达六周的时间。添加更复杂的功能,比如新的搜索工具,可能需要将近一年的时间。他说,这意味着Siri不可能通过升级成为下一个ChatGPT。

相比之下,苹果的处境还好一些,他们利用Siri吸引了消费者购买iphone。而亚马逊和谷歌的前高管则表示,Alexa和“谷歌助理”依赖于与Siri类似的技术,但这两家公司很难通过这些语音助手产生有意义的收入。

谷歌助手被嵌入在该公司的家庭设备中,如谷歌家庭迷你智能音箱。

在中国,市面上主要有小爱同学、小度、天猫精灵等主流的AI语音助手,被用在手机、电脑、电视、音箱等多种电子产品上,也是连接各种智能家居产品的中枢。但是,其用户体验却备受诟病,比如识别度不高、数据库不够完善,很多产品在用户家中处于半闲置状态。

语音助手准备如何“翻盘”?

根据布莱恩·陈的说法,尽管微软现在在创新竞赛中抢占了领先地位,但谷歌仍紧随其后。秉着“打不过就加入”的原则,将生成式人工智能带来的搜索引擎领域的技术进步引入语音助手,可能只是时间问题。

一些人工智能专家也表示,在未来,聊天机器人和语音助手的技术将会融合。这意味着人们能够通过语音控制聊天机器人,要求虚拟助手帮助他们完成工作,而不仅仅是查看天气等简单任务。

最近,这些大型科技公司都在竞相对ChatGPT做出回应。2月,苹果在总部举行了年度人工智能峰会,这是一个内部活动,让员工了解其大型语言模型和其他人工智能工具,两名了解该项目的人士说,Siri团队成员在内的许多工程师每周都在测试语言生成功能。

科技媒体Techradar表示,苹果虽然没有发布新的语音助手,但这可能只是在等待时机,然后再出手夺回人工智能阵地。一些敏锐的用户已经在将ChatGPT嵌入Siri,用户这种增强Siri功能的渴望也是苹果可以利用的潜力。

此前,谷歌已经发布了聊天机器人巴德(Bard),3月14日,谷歌表示它将很快发布生成式人工智能工具,帮助企业、政府和软件开发人员构建带有嵌入式聊天机器人的应用程序,并将底层技术整合到他们的系统中。

3月16日,百度开放大模型“文心一言”的测试。百度创始人、董事长兼CEO李彦宏表示,百度将在所有业务中全面集成文心一言,包括与语音助手小度进行集成,升级小度智能设备和服务。

AI初创公司Perplexity的创始人AravindSrinivas说:“这些产品过去从未有效,因为我们从未拥有人类层面的对话能力。”“现在我们做到了。”

Siri的联合创始人切耶说,生成式人工智能有可能使语音助手回到最初的科幻轨道上。“我确实认为这与质量有关。”他说,“从根本上说,这项技术将实现上一代语音助理所没有的广度、灵活性和复杂性。我认为会出现复兴。”

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

人工智能虚拟助理大盘点,哪一款是你的菜?

"Siri,给我念首诗。”图片来源:FastCompany。

简介:它是一款语音驱动助手,用户可以长按iPhone或iPad的Home键激活Siri。此外Siri还可以前瞻性地向用户推荐需要执行的行为。最近,Siri已经可以支持AppleTV和AppleWatch了。

典型技能:在苹果设备上使用非常方便,理解人类自然语言,对于新闻、天气、体育、电影、导航和本地商户很了解。非常精通电视内容推荐,知道如何控制一些智能家用电器。

个性缺点:Siri不知道如何与大多数其他App和服务交互,相比于其他智能助手,它的速度并不是最快的。

人性级别:Siri还不能进行扩展对话,不过在某些特定环境下,Siri还是非常智能的,女性发音感觉也很人性化,让人感觉不到在和机器人交流。

展望:Siri其实是语音助手领域里起步比较早的应用,但是在过去的几年时间里,它的智能程度显然没有得到较大提升。而且Siri不支持应用程序接口,所以它不支持第三方应用,比如不能在Spotify里播放歌曲,不能再Wunderlist里执行任务,或是在Slack里发条信息。苹果必须要让Siri支持不同应用和服务的整合,否则Siri的前景不容乐观,不过,或许在下个月的WWDC苹果开发者大会上,我们会了解到一些新料哦。

谷歌语音搜索/GoogleNow

“看看周围的新鲜事。”图片来源:FastCompany。

简介:这款语音助手是由世界上最强大的搜索引擎所支持的。通过挖掘用户电子邮件和搜索历史,给用户提供针对性的支付服务。GoogleNow支持安卓,iOS和Chorme设备。

典型技能:速度快,相对准确。它可以挖掘到用户的个人数据,包括飞行航班,快递包括,酒店预订,等相关信息。此外,Google语音助手还能与第三方App交互,包括笔记应用,消息应用,以及音乐播放服务。

个性缺点:有时太强的主动性会让用户感到不爽,比如告诉你不关心的球队赛事信息,在熟悉的地方帮你导航。此外,它不支持智能家居设备,第三方应用整合似乎也有所停止。

人性级别:完全没有,不愿交谈,甚至连个名字都没有,除了“谷歌”两个字。

展望:在理论上,由于谷歌掌握了大量个人数据和搜索引擎功能,应该能在人工智能领域里占据主宰地位,但是,目前谷歌似乎还不知道如何把自己的优势应用在语音助理上去真正地了解用户。不过就目前而言,GoogleNow和语音搜索依然能够和Siri进行抗衡,但距离下一个级别的人工智能还有一段距离。

"西雅图的天气。”图片来源:FastCompany。

亚马逊ALEXA

简介:语音激活助手支持亚马逊语音设备(Echo、EchoDot、Tap)和FireTV机顶盒,目前亚马逊正在尝试让Alexa支持其他可连接设备,比如闹钟和宠物喂食器。

典型技能:Alexa可以通过多个信息源播放流媒体音乐和阅读新闻,还能提供天气、交通等信息,同时支持大多数智能家居设备控制。用户通过语音就能在AmazonPrime会员服务上购物,甚至还可以预订披萨。此外,开放的应用程序接口允许Alexa接入任何App或服务。

个性缺点:智能家居控制尚未实现和智能手机整合。可能会让用户觉得它不过是个装载亚马逊商品和服务的“容器”而已。

人性级别:你可以和它开些小玩笑,但Alexa总是会把你引导到亚马逊服务上。举个例子,“Alexa,我该如何面对生活?“你应该写小说,当你作品完成之后,亚马逊KindleSelf-Publishing服务将帮你搞定剩下的一切。”

展望:苹果和谷歌应该比较担心Alexa智能语音助手,因为它吸引了很多开发者,现在很多非亚马逊产品设备也开始支持Alexa了。不过,亚马逊没有自己的智能手机平台,在这一点上,GoogleAssistant和Siri还是有一定优势的。

“Miranda你好,有什么我可以帮忙的吗?”图片来源:FastCompany。

微软“小娜”CORTANA

简介:小娜是一款基于语音和文本的虚拟助手,支持Windows、iOS、以及Android系统。回答问题时能够结合主动式知识,说不定,未来它还能阻止外星人毁灭星系生命。

典型技能:可以处理事务提醒和日常预约,追踪包裹,设置闹钟。同时它还能启动Bing(必应)搜索引擎获取体育,天气和其他信息。小娜可以与一些Windows应用进行交互,最近它开始和Skype的聊天机器人进行互动。

个性缺陷:感觉小娜仅局限在Windows操作系统平台下,至少开发人员和用户是这么觉得。它在iOS和安卓系统上功能极弱。

人性级别:小娜会说笑话,对于一些通用性问题,它的答案会显得十分俏皮,而且它还会引用莎士比亚名言哦,文艺女青年一枚。

展望:微软小娜这几年感觉一直落后Siri和谷歌,但是它现在已经变成了一款比较有竞争力的聊天机器人。此外,微软还希望小娜为其他聊天机器人提供智能服务,帮助用户制定旅行攻略、会晤计划、待办事项等等。此外,微软还希望小娜可以和其他微软产品(比如Office)进行深度整合。微软的目标也很明确,就是要在后PC时代重新定义计算,但是他们是否会获得成功,现在下结论还为时尚早。

FacebookM

简介:FacebookM一部分是人工智能,一部分是纯人工服务。目前它依然处于开发阶段。M是一款基于本文的虚拟助手,可以帮助FacebookMessenger用户搞定很多事情。

典型技能:它会尝试做任何用户要求的事情。

个性缺陷:目前M还不能真正支持消费者产品,而且还有很长一段距离要走。目前只有一小部分用户尝试使用过相关服务。

人性级别:相当高,因为M有部分服务是依靠真正的人工客服来回答问题的。不过据说Facebook之所以这样做,是希望能够花时间去训练M。

展望:现阶段,M似乎还不到太明显的发展前景,但是Facebook对于聊天机器人业务非常重视,因此未来M很可能会化身成为一个超级智能。

“帮我找找附近五公里以内的咖啡店,不要星巴克。”图片来源:FastCompany。

SOUNDHOUNDHOUND

简介:这是一款支持iOS和安卓系统的语音助手App,旗下基于云引擎的语音识别平台Houndify允许第三方开发者在自己的服务和设备里添加语音识别功能。

典型技能:SoundHound可以理解复杂的查询请求,比如“帮我找找附近五公里内的咖啡店,不要星巴克。”该服务整合了一些第三方服务,比如Yelp,Uber和Expedia。

个性缺陷:连接到第三方应用的数量还是比较有限,而且在iOS和安卓系统上,用户需要先退出SoundHound应用,才能打开其他App,操作不便捷。

人性级别:不是很有料,但是当完成第一次查询请求之后,就会知道它会如何回应后续问题。

展望:实际上人们应该能感受到,Hound的移动App只是Houndify服务的一个展示而已,SoundHound期望能将此服务销售给其他公司,如果成功的话,你可能都不会意识到它的存在。

Siri之父在Viv的发布会上称,Viv将成为我们与万物交互的简便智能界面。图片来源:FastCompany。

VIV

简介:这是Siri团队离开苹果公司后推出的一款虚拟助手应用,目前还没有上市,但是它应该可以支持所有类型的计算设备。

典型技能:Viv出名的原因,就是它可以解释复杂的问题,比如“后天下午五点之后,金门大桥附近地区的气温会超过华氏七十度吗?”。此外,它还能和第三方应用整合,比如Venmo。

个性缺陷:Viv之前发布过一个demo,但是它的实际功能是否和demo里展示的一样目前尚不得而知。

人性级别:Viv只能根据自己所见的实际信息作出客观性的描述反馈,至于它会不会和用户开开玩笑,就不得而知了。

展望:目前已经有很多科技媒体报道了Viv智能服务,因为他们推出的demo中,自然语言处理能力实在是太令人印象深刻了。不过,这家初创公司至今还没有正式发布产品,所以对他们所说要改变世界的态度,不禁会让人感到一点点怀疑。

OZLO

简介:这个人工智能应用的唯一目的,至少现在是这样的,就是要帮助你找到想吃的和想喝的。目前仅为一些早期注册用户提供支持。

典型技能:通过多个不同信息源搜索数据,比如Yelp和FourSquare,OZLO将收集到的数据整合成为信息卡,再通过理解用户对话提供相应的答案,比如“现在哪家餐厅开门营业?”,“这家餐厅的菜单有哪些蔡?”

性格缺陷:效用性比较有限,除非Ozlo开发公司可以增加更多功能。另外他们太依赖用户来训练人工智能。

人性级别:这款人工智能助手不会和用户进行太多额外交互,甚至也不会简单的寒暄。

展望:Ozlo是一款单一功能聊天机器人,如果他们不新增更多功能的话,那么前景并不会太好。不过,Ozlo可以整合多个信息源,然后根据问题,汇总成最合适的答案,目前这款应用是否能像其开发者所说的那样有前景,尚不得而知。Ozlo缺少商业规划,它不应该把自己看做是一款“可下载的App应用”,而是应该不断训练人工智能数据,才能有机会获得成功。

邮件主题:约咖啡。

邮件内容:Michael你好,昨天聊得很开心。你有时间碰头吗,今天晚点、明天或者下周?我大多数时候下午1点都有空。John。

X.AI

简介:X.AI也是一款单一功能虚拟助手,它可以根据用户行为通过电子邮件安排会议。

典型技能:X.AI可以了解到用户的日常安排和喜好,然后根据会议各方的时间安排,妥善处理工作安排。

个性缺陷:人为依赖太强,因为这款虚拟助手需要收取电子邮件中的大量日程安排数据。

展望:X.ai高度专注智能代理,如果它能够足够智能并实现自动化操作,前景还是非常不错的。

用户:哈喽,你哪位?

助理:我是Sam,你的个人助理。我是来帮你让生活变得更简便。

SPEAKTOITASSISTANT.AI

简介:这款安卓智能助手,有些模仿了Siri,功能包括了语音命令,语音秘书和助手服务。

典型技能:可以说,这款应用在某些功能上甚至比Siri还要好,它可以学习个性化的语音命令来激活现有技能列表。

个性缺陷:相比于智能手机自带的虚拟助手服务,Speakoit的用途并不是很大,而且也不易访问。

人性级别:这款智能助手听上去非常机器人化,但是它本身定位却是“人工秘书”,有虚拟形象哦!而且,这款虚拟助手的性别和外观也可以自定义设置。

展望:这种模仿Siri的虚拟助手应用,通常受众群体都是一些非苹果用户,他们需要找一个替代品。所以,对于Speakoit开发公司来说,如果局限在这个定位上可能无法获得成功。实际上,未来他们可以考虑如何设计开发工具,帮助开发人员开发他们自己的聊天机器人。

以上每一款都各有千秋,不过都距离理想中的智能助理还有些距离。也许,今年的"最强AI个人助理讲“还是会颁发给——JARVIS。

VIAFastCompany返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇