手机语音助手不该“拟人化” 怎样呼叫手机人工智能语音助手呢

发表时间：2023-07-04 02:15:54

手机语音助手不该“拟人化”

虚拟人、虚拟形象的出现，给许多产品、功能或服务带来了更多可行的展现形式，比如直播带货中的虚拟主播，又比如手机里的虚拟语音助手。那么，虚拟形象于语音助手而言，是必要的吗？目前的技术又是否支撑得起人们的语音交互需求？

随着元宇宙的大火，目前无论国外的科技厂商，都相继推出了自家的“虚拟人”角色。从整体概念来看，这类虚拟形象的推出都是为了“元宇宙”而存在。

虽然元宇宙这一概念在目前来看未来的发展并不明朗，甚至目前连具体落地的大众化产品都没有，但这并不能阻挡科技厂商的“提前布局”，不管未来如何，“抢占先机”总归是一件好事。

比如国际大厂三星，就推出了自家的“虚拟人角色”：G·NUSMAS，一个外星人形象的虚拟角色，在名字上也非常有意思，是SAMSUNG的倒写，意味着“镜像”的意思，也表明了其三星虚拟世界化身的身份。

G·NUSMAS图源：来自网络

我个人是很喜欢这种有创意的虚拟角色的，另一方面从虚拟人的立意上也能看出品牌的调性。

而在国内，虚拟人这一概念虽然同样火热，但是对于各大厂商来说，虚拟角色这一概念有着更大的商业价值，尤其是手机厂商，手机上很多功能都和“虚拟人”有关，其中关联最大的就是语音助手。

随着智能手机的不断进化，手机已经人工智能高度捆绑在一起，早期智能手机“所见即所得、所点即所得”的操作方式成为智能机的标志，更为直观的操作方式获得了消费者的好评。

而当语音助手出现之后，智能手机又掀起了新一轮的革命，语音交互有着更为直观的体验和感受，同时也更符合人类交流的方式。

国外智能语音媒体Voicebot在2020年末发布了一份《智能手机语音助手消费者采用率报告》，根据报告数据内容显示，智能手机上语音助手的使用率从2018年的51.5％上升到2020年的56.4％，由此可见语音助手的使用频率还是比较高的。

图源：源于网络

语音助手从刚刚诞生到如今百花齐放，早已经脱离了早前只单纯从“词库”中搜索对应答案的阶段。

语音助手早已经有了足够深度的AI学习能力，这里我们就用小米标志性的“小爱同学”举例，小爱同学可以通过不断的与用户进行对话，来不断地学习用户的语音习惯，并且将其通过网络共享，丰富自身的“知识库”。这种不断通过对话喂养人工智能的能力，我更愿意叫它“调教”。

图源：来自网络

直到现在，安卓语音助手甚至已经进化到了“连问连答”、“情感对话”的阶段，通过自身的AI能力识别上下句的语义，并且得出用户是否在与机器进行对话的结论。

在我看来，“连问连答”的加入已经属于“跨时代”的进步。AI技术的加入让语音助手这类功能形成了质变，拥有了一定程度的学习能力和自主理解能力。

“情感对话”则要更进阶一些，这里我们用小爱同学的一段对话来表达这一概念。

你：我感冒了小爱：你还有我~我在这儿陪着你你：我失眠了小爱：摸摸你，先别着急，怎么会睡不着呢？我猜…是不是睡前做了剧烈运动呢？比如跑步、跳绳之类的？

“情感对话”简单来讲，就是赋予机器感情，它能够实现与人类的共情，再直白些，就是能在你悲伤的时候安慰你，在你迷茫的时候鼓励你。机器通过理解人的情绪和处境，给出关怀的、富有同情心的回应，从而给人提供即时的情绪支持和长期的情感陪伴。

这两个功能的加入，让语音助手实现了更一步的进化。

图源：来自网络

但高速的发展必然伴随着创新瓶颈，手机厂商并不知道AI语音助手的下一条路在哪里。恰逢虚拟人概念火热，而且AI智能语音助手也有足够强的智能化。

所以，就有一些厂商认为：语音助手比任何功能都需要一个“人”的外表。

不过智能语音助手+虚拟人+手机这样的组合，感觉味道就有点不太对劲。

虽然拥有虚拟外表的智能语音助手可以连答，也能提供情绪支持。但首先，过于“花里胡哨”的外表很难让人提起使用的欲望，这里我们用MIUI13的小爱同学举例，MIUI13的小爱同学可以自定义外观，并且经过定制的小爱同学会出现在语音助手界面，每次呼出语音助手都会看到小爱同学的虚拟形象。

图源：MIUI13

从身边同事的反馈来看，自从他的小米手机升级了MIUI13之后，他连语音助手都不经常打开了……

略显幼稚的形象只是用户吐槽的一部分，在OPPO推出的小布语音助手（小布数字人）上，OPPO还提到了其情感陪伴的能力，根据情绪的波动，来为用户提供不一样的语音反馈，也就是我们刚才说到的“情感对话”技术。

图源：来自网络

用虚拟人提供情感陪伴，看似完美的解决了虚拟人的功能需求，但实际上，“情感对话”技术目前有着很大的问题。正如上述的对话示例一样，上一句语音助手还在安慰我们，可我们下一句一旦没有这些关键词，语音助手就会重回“冰冷”的状态，像极了反反复复的渣男。

目前手机语音助手拟人化做的最好的，就是小米旗下黑鲨的“鲨鲨酱”，由于黑鲨游戏手机特殊的属性，二次元形象的鲨鲨酱反而更受欢迎。基于此，黑鲨为鲨鲨酱添加了更多融入性的功能，比如玩游戏时可作为战况播报员，充电时，鲨鲨酱也会一同充能，显示精美动画，此外，鲨鲨酱还拥有闹钟功能，可以拟人的形式叫用户起床。

图源：黑鲨官网

基于鲨鲨酱的成功，黑鲨还为其在各种渠道打造IP，是目前手机助手虚拟形象做的最好的一个，也是唯一成功的一个。

在我看来，手机上出现“拟人化”的语音助手，该，也不该。

从整体布局上来讲，拟人化的语音助手可以更好的融合整个IOT生态。比如小爱同学，小爱同学从诞生到现在，愈发有种“贾维斯”的感觉。

与Siri一样，小爱同学承担了智能管家类的角色，可以更好的统一产品生态，融合各类智能化设备，让用户拥有更强的科技感。

图源：MIUI官网

除此之外，虚拟形象的出现可以提早对IP进行布局，无论是在未来元宇宙还是虚拟IP形象，都是非常不错的开端。

但“拟人化”的语音助手，不该出现在手机产品上，手机本身就是一个频繁使用产品，对于产品来说，界面越复杂、越浮夸，就越不被消费者接受，尤其是语音助手在手机中还扮演着比较重要的角色。

技术不断的拓展人工智能的能力，语音助手提供了全新的交互逻辑，两者结合，使得语音助手成为了通往智能化生活的入口，但语音助手过早的以虚拟人的形象出现在消费者的手机当中，让消费者提前适应“虚拟人”的存在，在我看来更得不偿失。

毕竟，口碑做起来容易，毁掉只在一念之间，少搞点花里胡哨的功能，让语音助手回归本质，比什么都强。

作者：ByArsT；来源公众号：不客观实验室（ID：zhinan617）

原文链接：https://mp.weixin.qq.com/s/dLePyOoLQI4m8cLtit27xw

本文由@不客观实验室授权发布于人人都是产品经理，未经作者许可，禁止转载

题图来自Unsplash，基于CC0协议。

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

别小看手机人工智能语音助手不是它的唯一形态

“人工智能”已经不是什么新鲜的词汇，毕竟在很早之前就有很多关于“人工智能”题材的科幻电影。然而，“人工智能”在去年开始又成了热门的话题，从AlphaGo击败围棋大师，到手机厂商纷纷以“人工智能”作为卖点。

“人工智能”已经成为移动领域发展的重要方向，而且有不少手机厂商正在研发相关的产品。那么，“人工智能”会给智能手机带来怎么样的体验环境呢？此篇文章，我们就来详细地谈谈“人工智能”的应用。

语音助手不是人工智能的唯一形态

在智能手机出现之前，“人工智能”一词看上去远不如现在那般亲民。因为“人工智能”需要庞大的硬件和网络资源，普通消费者接触或体验的成本很大，因此“人工智能”的应用非常有限，往往只服务于金融、机器人等专业领域。

然而，随着云端运算和移动网络的日渐完善，人手一台的智能手机为“人工智能”带来了新的机遇，而其最初的形态就是语音助手，譬如苹果的Siri语音助手。此后，嗅到时机成熟的厂商们便开始在手机上搭载人工智能技术。“人工智能”可以通过云端神经网络的运算，整合和预测用户信息，为人们的生活带来便利。人工智能助手，将会让现在的智能手机变得更加智能。

但有很多人认为，“人工智能”无非就是语音助手，只适合尝鲜，一点都不实用。

这种看法是缺乏远见的。语音助手只是“人工智能”应用的一种具体方式，未来手机对“人工智能”的应用并不会局限于此。此外，就算是语音助手，其也会通过不断学习和整合服务，变得更智能和更实用。

举个例子来说，传统的语音助手只能进行简单的问答，而现在的人工智能助手却“聪明”了不少，不但可以回复更加复杂的问题，还可以在邮件中自动获取时间和地点信息，并且自动添加备忘事项，自动帮你管理信息。总而言之，“人工智能”的应用远不止语音助手那么简单。

人工智能其实就在你身边

事实上，“人工智能”已经从很多方面对我们的日常生活产生影响。目前，IBM、Google和微软等掌握最尖端人工智能技术的厂商都已经加快人工智能的布局，微软在Windows10集成的Cortana、谷歌的Pixel手机，都从前端设备层面为人工智能打开了面向消费者的窗口。

在成为手机系统的一部分之前，“人工智能”也早已深入我们生活的方方面面。例如网易云音乐、今日头条等音乐类和资讯类的应用，会在日常使用中学习我们的阅读习惯和听歌喜好，从而识别出我们感兴趣的内容并进行推送。如果你在一段时间内连看了几篇同类的新闻，那么很可能接下来刷到的都是类似的资讯。

除了AWS之外，国内也有阿里云和、京东云等大数据处理服务

在购物网站上，利用“人工智能”向用户推送针对性产品的做法更是常见。亚马逊的AWS作为目前最出色的云端计算平台之一，也承载着大量用户消费习惯的大数据分析工作，从而猜测出用户感兴趣的产品。同时，AWS还会以API接口的方式为人工智能应用提供服务，亚马逊智能音响Echo就是基于AWS的人工智能助手。

以制造“核弹”著称的老黄也要在人工智能掺一脚

汽车厂商也在不断加快“人工智能”在自动驾驶上的布局，通过为AI功能专门打造的高性能处理器，汽车上的人工智能在脱离集群网络计算的情况下依旧可以完成复杂的行人识别、路况观察和交通标志识别等工作，同时为驾驶员提供自动驾驶和语音控制的功能，仿佛在驾驶时多了一个贴心伴侣。

此外，手机对“人工智能”的应用也越来越广泛。例如华为EMUI5.1的人工智能系统和魅族的OneMind人工智能系统，可以通过学习用户的使用习惯来预测使用行为，从而预先调配资源，提高常用应用的启动速度，保证手机流畅运行。在手机空闲的时候，人工智能系统还可以对手机的运行环境进行优化，做到久用不卡。

不仅如此，“人工智能”还可以为你的手机提供计算机视觉。虽然手机的摄像头越来越清晰，但要让手机能够看懂这个世界，依旧少不了人工智能的帮助。像是常见的人脸识别功能，还有当下流行的换脸、动态美颜应用，都需要“人工智能”对动态的脸部进行识别。

在社交应用里，人工智能助手只要通过照片就能快速识别你朋友的社交帐号，甚至可以拍照识物和拍照寻址。

更值得期待的是：人工智能整合互联网服务

对于“人工智能”的应用，更让人憧憬的是“人工智能”和互联网服务的结合。也就是，“人工智能”在整合互联网服务的入口的前提下，可以预测用户的需求直接进行服务推送。这样一来，手机可以自动进行信息管理，不用我们一个个地打开APP去找相应的服务。

举个列子来说，你的朋友发短信约你看电影的时候，手机自动识别并直接跳转到购买电影票的界面（甚至根据定位给你推存附近的电影院），不用打开订票应用来查找。买好电影票之后，电影开始的时间和地点都会自动添加到备忘事项，并根据交通情况提前提醒你出门。到了电影院之后，手机会自动弹出取票的二维码，不用你再打开APP查找。

还有，开车出游的时候，也不用专门照相记住自己的停车位置，在你停稳车辆的时候手机已经默默记下了你的停车位置。当你需要找到车辆的时候，手机就会在地图中标出停车位置，并列出到达停车点的最短路径和回家所需的时间。

这些看似“科幻”的功能，其实都是能够实现的，而且只是“人工智能”应用比较浅显的阶段，它还会随着互联网服务的整合变得越来越智能。

结语：

当人们真正开始享受一项伟大的科技时，它往往是察觉不到的，“人工智能”也正在以润物细无声的方式影响着我们生活的方方面面。手机人工智能日后将会如何发展目前还不能妄下定论。但无论如何，它都是值得让人期待的。

标签:语音助手人工智能手机话题应用

更多好物在等你新浪众测·免费送推荐阅读聚焦应用中心新浪公益新浪游戏新浪视频新浪科技带领皇室家族赢得胜利靠反应力还不如背赛道动脑筋喂小怪物吃饼干轻松延长手机续航时间练就梦寐以求的好身材帮助保持健康生活方式随心所欲打造完美效果银河系最全新番齐放送复杂世界里一个就够了进入机器梦境寻找真相疯狂逃离恐怖的压碎机冰锋暗影古色庙殿狂奔斗巫师夺回被偷的糖果屯兵练兵出征攻占堡垒伪装胖猪混敌营救伙伴国内最专业的手机地图帮你一起保护你的颈椎随时随地轻松订火车票沈阳遭遇六级重度雾霾2万大妈齐跳小苹果禁烟范冰冰传递社会正能量未富先老养老金吃紧益调查：慈善需立法么反虐待动物法制化呼声高涨如何看待广州拟奖拾金不昧环保部即将解决红顶中介明星婚礼上的“善”姿“百名春蕾之星”评选舞剧《画皮》关注孤独症女孩患尿毒症自筹药费互联网发展基金会成立林青霞为慈善参加节目全面实施城乡大病保险儿童安全座椅强制认证办养老院真的是机会么志愿者慰问抗战老兵战舰世界海神节礼包乱斗西游2新浪独家卡倩女幽魂2夏日特权卡功夫熊猫新手高级礼包新倩女幽魂新浪特权卡灵魂战神不删档测试码我是大主宰新浪荣耀卡大话西游2免费版礼包西楚霸王新浪荣耀礼包镇魔曲神兵觉醒尊享卡完美国际2一生有你卡新天龙八部新手特权卡问道经典十年至尊礼包大战神新浪独家礼包热血传奇新区独享礼包剑网3萌宠浪浪大礼包创世2封测激活码问道手游媒体礼包极限Girl美与野性结合让萌宠当一天司机亲千万不要手贱啊超级屌的视觉错觉运动地球上最美丽的天堂鸟新一代武林最萌小道士神奇的PS造钱术大开眼界的泡面新吃法让宝宝嘴馋的菠萝炒饭经典电影镜头神级剪辑亲手教你范爷经典妆容盘点全球最糟糕山寨品恶搞:当一骷髅在开车健身是把整容刀三分钟看尽十年成长和TFBOYS一起过暑假不用去医院的牙美白术一分钟识别面试潜台词Windows10升级秘籍净水器的水有多深？识趣毕业季户外特辑用户关注手机哪些功能有曰：国内外展会吐槽三十年经典Moto手机ChinaJoy2015大看点东芝虚增利润财务丑闻紫光集团收购美光科技诺基亚为未来电影造球全球APP开发创意大赛享说第四期主持人李晨猎豹靠近捕食熟睡疣猪非洲血腥动物标本加工相机拍泡腾片遇水冒泡冰岛令人窒息美景懒惰青蛙蜗牛背搭便车美摄影师拍奇怪毛毛虫

人工智能语音如何实现

语音识别是以语音为研究对象，通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科，它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术，语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

1、语音识别的基本原理

语音识别系统本质上是一种模式识别系统，包括特征提取、模式匹配、参考模式库等三个基本单元，它的基本结构如下图所示：

未知语音经过话筒变换成电信号后加在识别系统的输入端，首先经过预处理，再根据人的语音特点建立语音模型，对输入的语音信号进行分析，并抽取所需的特征，在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型，将计算机中存放的语音模板与输入的语音信号的特征进行比较，根据一定的搜索和匹配策略，找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义，通过查表就可以给出计算机的识别结果。显然，这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。

语音识别系统构建过程整体上包括两大部分：训练和识别。训练通常是离线完成的，对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘，获取语音识别系统所需要的“声学模型”和“语言模型”;而识别过程通常是在线完成的，对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块：“前端”模块主要的

手机语音助手不该“拟人化” 怎样呼叫手机人工智能语音助手呢