用ChatGPT让Siri和小爱同学不再智障我看行
编辑:冬日果酱排版:LINAI语音助手的「蠢」,好像全世界都知道。不管是Siri还是小爱同学,大部分使用过所谓「AI语音助手」的用户大概都同意,它们肯定不算聪明。尤其是在ChatGPT出来之后,这种对比尤为明显,甚至包括微软的最高话事人也在批评自家的语音助手。微软CEO萨蒂亚·纳德拉最近在接受英国《金融时报》采访时表示,苹果的Siri、亚马逊的Alexa,微软自家的Cortana(中文名:小娜)以及公认拔尖的GoogleAssistant,这些语音助手有一个算一个:都笨得跟石头一样。纳德拉和Cortana,图/微软2014年4月,纳德拉刚刚上任微软CEO两个月后的微软Build开发者大会上,微软全球副总裁乔北峰正式推出了Cortana。在最初的几年,Cortana表现了不俗的智能,也受到包括纳德拉在内微软高层的集体认可,纳德拉在2016年还称赞Cortana的智能,并说「机器人是新应用」。但Cortana的智能(横向比较)和市场份额越来越糟糕,到2021年微软就正式宣布停止支持iOS和Android上的Cortana应用,仅保留对Windows平台的支持。更重要的是,OpenAI带着ChatGPT来了,微软直接拿到了AI时代目前为止最好的一张船票。与此同时,语音助手在过去几年基本陷入了停滞,Siri的联合创始人AdamCheyer也承认,ChatGPT理解复杂信息的能力让现有的语音助手看起来很蠢。但换句话说,如果能在语音助手上实现类似ChatGPT理解复杂信息的能力,Siri和小爱同学是不是就能重获新生?至少很多人已经开始尝试了。个人开发者的尝试ChatGPT出现后不久,互联网上其实就有了一大堆的新想法,声量最大的一个是改变「搜索」,如今已经成为了搜索引擎巨头的共识,微软必应已经在测试,谷歌和百度也提前进行了预告。而另一方面,也有不少人在惊叹于ChatGPT的自然语言沟通能力之余,期望会推出语音助手版本的ChatGPT,替代掉目前不堪一「谈」的语音助手。在今年又一轮爆发之后,尽管我们还是没看到OpenAI或者微软推出对应的语音助手版,但已经有开发者进行了大量的尝试。xiaogpt,图/GitHub在全球最大的代码托管平台Github上,就有开发者尝试将ChatGPT接入小爱同学,Star数已经达到了1.3k。据项目介绍,只要有ChatGPT的账号、小爱音箱、正常连接ChatGPT的网络以及python3.8+,人人都可以在小爱音箱上使用「ChatGPT版小爱同学」。原理上很简单,唤起小爱同学后,以「帮我」开头询问的问题会自动以文本形式发送一份给ChatGPT,同时会屏蔽小爱同学原本的回答,替换成「正在问GPT,请耐心等待」,而ChatGPT生成的文本则会被小爱同学通过TTS(语音合成技术)进行语音回答。从开发者的演示显示,整个过程足够流畅,实际回答也远超小爱同学原本的「智力」。(具备条件可搜索GitHub项目「xiaogpt」)演示,图/YouTube不仅是小爱同学,另一位更为大众调侃的「智障」语音助手——Siri,实际上更早就被开发者尝试接入ChatGPT。围绕Siri其实有不少尝试,其中国内开发者@Yue-Yang最近就以「快捷指令」形式连接了Siri和ChatGPT,让Siri变成真正的AI聊天机器人。在GitHub或者「小众软件」上你都能找到对应的快捷指令——智能聊天,不过使用条件是需要申请OpenAI的付费API。「ChatGPTSiri」在原理上与「xiaogpt」类似,利用OpenAI的API(应用程序接口)和iOS的特性,先将语音指令转换为文本再传递给ChatGPT,收到回答后再让Siri「读」出来。在B站上,通过搜索「ChatGPTSiri」可以查看对应的演示。ChatGPTSiri,图/GitHub当然,以上两个项目都是个人开发者的尝试,也包括其他类似的项目,不管是使用体验还是上手门槛,都并不适合普通用户。考虑到语音助手的技术、产品和生态,大公司的入场很可能降低门槛、提高整体的使用体验。问题在于意愿和能力,很多公司其实也看到了站在ChatGPT的「肩膀」上重新打造语音助手的可能性,但在全球范围内,真正同时手握AI能力和语音助手背后生态的公司总共也就那几家。巨头的入场,不远了与搜索一样,ChatGPT不可能直接取代现有的语音助手。一方面语音交互的优势在于直接、易上手,很多任务通过触控、文字输入等方式不仅繁琐、更耗时间,同时对于老人、小孩等用户也偏于复杂,自然的语音交互则能比较轻松地实现。另一方面,ChatGPT并不能对现实层面进行直接干预,比如我们用Siri或者小爱同学操控空调、扫地机器人等。ChatGPT,或者说生成式AI更大的价值在于通过强大的自然语言理解和沟通能力,来改善语音助手的使用体验。小爱同学5.0发布现场,图/小米过去我们总抱怨AI太笨,要么答非所问,要么干脆就是「我没有明白」,基本几轮对话就会感到心累,转向对功能性的需求,比如天气、问题查询、智能家居操作等。相反,ChatGPT的对话能力则基本不用担心,尽管可能会有错误信息,但至少不会像Siri和小爱同学那样沟通成本太高。这也是多年的发展停滞之后,语音助手的关键机会所在。2月底,微软在推出支持AI对话的新必应之后,又支持了Android和iOS版本,并且在AI对话中第一次增加了语音对话功能,用户如果使用语音开启对话,新必应也会使用语音回应。不过就现在而言,新必应的语音对话功能还仅限于对话,并不能用来进行一系列操作,比如在手机上唤起某个系统或应用的功能,也不支持设置为默认的语音助手。语音功能加入,图/微软此外,微软自家的Windows平台也还未支持,目前为止尚未流出Cortana或其他新语音助手加入类ChatGPT能力的消息。而更早些时候,小度官方在2月初宣布,AI语音助手小度将在未来融合百度文心一言的全面能力,同时在此基础上还将打造针对智能设备场景的人工智能模型「小度灵机」并应用到小度全系产品。而据小度官方数据,搭载小度的智能设备已经进入了4000万户家庭。当然,按照百度此前的规划,文心一言要在本月才上线测试,距离小度全面接入文心一言的显然还需要一段时间。另一方面,谷歌也早早看到了这一点。2021年的I/O大会上,谷歌就首次宣布将LaMDA大语言模型的对话能力整合入GoolgleAssistant、搜索和Workspace。今年2月,谷歌推出了类ChatGPT的聊天机器人Bard之后,接入GoogleAssistant似乎也是题中应有之义,包括9TO5Google、《连线》杂志也认为谷歌应该这么做。就像人人都知道语音助手的「蠢」,所有人也看到了ChatGPT让语音助手们至少在理解人类语言和对话上「变聪明」的很大可能。「贾维斯,有时在你学会走之前得先跑起来」,图/《钢铁侠》过去我们都畅想过,有一个数字语音助手可以在日常生活中帮我们解决各种需求,就像《钢铁侠》里的贾维斯,现实是Siri和小爱同学们距离听懂人类的话还差很远,充斥着各种「不明白」「听不懂」。的确,现实世界的技术还赶不上科幻世界的想象很正常,但ChatGPT背后强大的对话语言能力,无疑可以让语音助手们能够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的AI助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。更或许,当AI越来越聪明并理解人类,智能家居乃至物联网的未来也会随之发生巨变。题图来自Unsplash特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。PC上的智能语音助手:小爱同学 PC 版体验
引言
小爱同学,作为搭载在智能设备的上的语音助手,自从2017年7月26日在音箱上推出就受万众瞩目。
紧接着小爱同学又不断在其他平台扩展,包括:手机、电视、甚至还有App。
其他手机厂商也同时跟进,先后推出小溪、小布、jovi等语音助手。
在最近红米K40新品发布会中,小爱同学又被搭载在红米笔记本上。这是小爱同学第一次被搬上桌面端设备。
很幸运的是,第三方电脑端同时可以使用,现在就带大家一起体验一下。
下载安装
由于运行环境的限制,Win10版本为20H2才可以正常安装运行,因此请确保你的设备处于上述版本。
由于PC端小爱同学是基于微软应用商店的UWP应用。因此可以直接下载,访问对应的应用商店链接即可。
点击获取,即可跳转到应用商店。点击安装开始下载。
等待下载安装即可,安装成功后会出现在开始菜单内。
使用向导
初次打开使用时,会有使用引导,点击同意并继续。
使用方法中,有图标打开、按下快捷键(由于该功能是基于红米笔记本的,因此,绝大部分的设备均无法使用)、键盘输入。
键盘输入是我们这次体验中最重要、也是通用的输入方式。
如果你的设备配备有语音。可尝试语音输入内容。
PC版小爱同学拥有的技能。
最后完成登录即可体验,PC版小爱同学未对设备进行限制、登录任意账户即可。
页面设计
引导完成后,即可进入小爱同学主页面。
与手机版类似,都使用了一致的唤醒logo
右下方配备有键盘输入按钮、设置按钮。
点击键盘输入按钮时,即可出现文本输入框,点击发送按钮就能完成内容输入、同样的回车键也可直接发送。
页面和功能类似于手机版小爱同学长按悬浮球输入文本。
由于笔者的电脑未配备语音设备,因此无法使用语音输入,以下使用过程中的操作均以键盘输入为主。
现在进设置里瞧瞧,看看功能是否完备。
进入设置后,首先关注点就是这个灰色按钮——语音设置中的语音唤醒显示为灰色。
笔者认为,除小米笔记本外的电脑应该均不支持该功能,语音唤醒需要系统底层驱动实现,第三方电脑上仅安装应用是无法使用的。
而同样的,语音键虽然有选项,但也是无法使用的。该功能为按对应按键小爱同学开始聆听。
接下面是音色设置,同手机端一样,支持蜜糖、茉莉、青葱三种音色,暂不支持自定义音色。
最后主题样式有深色、浅色两种,符合Win10设计语言,但不支持全局切换(即Win10切换深色模式,应用自动切换)
在设置中,还有全部技能选项,点击选项后,可查看小爱同学PC端支持的功能。
比如:文件搜索、询问天气、日期、计算器、设置等。
使用体验
查看了小爱同学PC端的页面设计,接下来来看看到底支持什么功能,
基础功能
查询时间、天气、日期。不出意外,这三种最基础的功能都是支持查询的。
时间
天气
日期
输入完成后即可获得对应的回答,但没有语音提示,仅仅显示文字内容。
对了,在询问天气时,笔者也询问穿什么衣服好,小爱同学同样会提醒当前的天气,并推荐适合穿的衣物。
系统设置
如:调节声音、亮度、打开任务管理器、控制面板
调节声音、亮度都可以说明具体操作,比如说,降低、提高。
打开系统功能也正常运行
输入即出结果,反应迅速。
查询文件
对于这一功能,使用起来虽然功能较为齐全,但是还有待提升。比如:
查找最近的文件。查询结果默认为最新的文本、文档文件等内容,但却显示了系统文件。
如下图,全部为最新的软件运行的日志、残留文件和个人文件无关。
在查询过程中,如果加上具体的文件内容。
比如:查找最近的图片、查找大于10m的视频。体验就会好很多。
日常娱乐
在日常娱乐中,小爱同学表现不俗。一般的询问都有对应的回答。
比如:播放最近的新闻。
计算器
吃喝玩乐
百科信息
这些功能齐全,应有尽有,有问必答。体验还是不错的。
但比较遗憾的是,PC版小爱同学暂不支持播放音乐。
不过电台应有尽有,可算是弥补不足吧。
以上均为小爱同学PC版的体验,目前由于PC版刚上线,其部分功能可能有待完善。
但就目前体验而言,功能已经完全足够日用的水平。并且在PC端小娜不断被砍除的大环境下,小爱同学PC版无外乎是一个更好的选择。
最后,想体验PC版小爱同学?私信回复MIUI即可获取链接!
小爱同学Windows版下载
小爱同学是一款非常好用的智能语音助手。那么之前有不少用户想要在Windows操作系统上使用,现在官方支持Win10操作系统,相信未来可能还会支持Win7系统,让受众人群更广泛,它的功能就不必多说,查找文件、搜索邮件、打开程序、播放演示文档、控制智能设备等样样齐全,喜欢的小伙伴赶紧下载试试吧!
【功能特点】小爱同学支持:RedmiBookPro14、RedmiBookPro15等
查找文件:按照名称、日期类型搜索电脑中文件
打开程序:通过语音打开系统中已安装程序
播放演示文档:进入PPT模式后,无需唤醒词,直接语音控制翻页
还支持控制智能设备、查询天气、看百科信息、并陪你聊天
【软件特色】1、个人中心
账号管理、个人信息管理、音箱管理,简单明了、高效便捷
2、音乐电台
集浏览、搜索、频道管理于一体的综合音乐服务,总之和音乐播放器相关的能力,这里应有尽有
3、初始化设置
帮你快速便捷地给小米AI音箱配置网络,填写使用中需要的个人信息,让AI更懂你
4、智能家居
呈现你能控制的小米旗下的智能硬件设备,教你“一句话玩转智能家居控制”
5、技能中心
帮你发现小爱已经集成的几十种能力,你想要,我们就给。小爱的能力仍处于快速扩充阶段,没事儿常来看看
【相关新闻】2月27日消息小米于2月25日发布了RedmiBookPro14和15两款笔记本电脑,搭载了11代酷睿H35处理器,最高搭载3.2k90Hz屏,号称“同档无敌”。RedmiBookPro14售价4499元起,RedmiBookPro15售价4999元起。
值得一提的是,RedmiBookPro其中一个亮点就是首次搭载了小爱同学,宣称“一句话搞定工作与生活”。
小爱同学是小米研发的人工智能语音系统,目前小米手机、小米电视、小米手环、智能音箱等多个品类都内置了该AI语音系统。现在发现小爱同学的UWP应用已经出现在了Win10应用商店中。