博舍

汽车语音交互还有多大可能 人工智能语音交互引擎有哪些

汽车语音交互还有多大可能

看似普通的语音交互,却是汽车交互中应用得最多的方式,市场渗透率超过86%;看似简单的技术,含金量却很高,涉及大数据、云计算、人工智能等多项前沿技术。在完全自动驾驶来临之前,语音交互仍是车内最便捷、最安全,最受用户欢迎的交互方式。

作为“软件定义汽车”的先驱和典型,目前,语音交互有哪些良好体验?还有多大可能?近日,国际车载智能语音巨头Cerence赛轮思首席执行官StefanOrtmanns博士来到上海拜访客户,Stefan在接受记者采访时表示:“我们将持续创新,将语音能力高举高打并引领未来,打造一种完全多模态、多传感器、基于人工智能的最直观的体验。通过更智能的语音助理,不仅提升舒适性和便捷性,还通过主动和被动功能提高驾驶安全。”

语音交互更接近真人

Stefan表示,语音交互能力的提升将对座舱交互生态发展起到核心作用。当前,已经有量产车型可以实现语音连续对话等功能,不过在语音识别和语义理解方面还有很大的提升空间。

语音按钮和唤醒词长期以来都是用户与语音助手开启对话的激活方式。CerenceJustTalk全时免唤醒让人和座舱的语音交互更接近人与人之间的自然对话,使交互变得自然、流畅、愉悦和高效率。

启动CerenceICC多座椅跨区通讯系统后,开车不用回头就可以轻松地和第二、第三排乘客对话聊天。新一代语音增强技术采用了新型超定向波束,不但增强了自适应控制噪音分离,还优化了三排座位的语音交互质量。

CerenceTourGuide助力梅赛德斯-奔驰直观的MBUX智能人机交互系统接入互动旅游内容,将专业导游内容直接、无缝地带进车内,并结合CerenceLook多模视觉语音交互技术,实现车内外视线所及的多模态交互。比如,当你开车经过上海大厦时,你不知道这个建筑物的确切名称,你可以说“告诉我更多关于这个建筑物的信息”。

CerenceEVD警铃侦测系统可以感知到来自车辆后部的紧急车辆,并提示驾驶者重新接管驾驶任务,做出安全的避让动作。

多模态融合

智能座舱是汽车智能化的标志之一,也是各家车企争夺消费者的主战场。超大中控屏幕、零重力座椅、巨幕观影、环绕立体声、卡拉OK、游戏等各种功能应有尽有。随之而来的问题是:一是消费者学习成本上升,功能使用不方便。二是驾驶员操作中控屏,手眼并用存在安全隐患。智能座舱的核心在于交互形式。业内人士认为,智能座舱应该从“堆配置、堆功能”中做“减法”,同时改变目前以触控为主,语音为辅的交互方式。

在Stefan看来,通过智能语音助理结合传感器数据,将实现更多车辆控制功能,大幅提升车载体验。

用户拿着大包小包离开汽车时,可以直接使用语音指令关闭后备箱或车门。上车前调整座舱温度,夏天车内先降温,冬天车内先加热。如果你在车里想和车外的人说话,但基于太冷、太热、不安全,或不方便降下车窗、走出车外等原因,你可以通过CerenceExteriorVehicleInteraction车内外通讯功能一一实现。

作为一个虚拟副驾驶,CerenceCo-Pilot可以分析语音、视线、手势和触摸输入,以及汽车传感器信息,利用实时数据、内置智能、用户偏好和车辆传感器信息实现一系列创新功能,并在他们提出请求前主动发起交互,让语音助理从被动的出行伙伴变成主动的副驾驶。例如,它能够实现车上购物和支付、汽车维护提醒等功能,满足出行过程中的基本需求等。从车载助理到副驾驶,从以驾驶者为中心的智能座舱延伸到沉浸式数字座舱,意味着从对话式AI扩展到多模态Al交互。

ChatGPT引入座舱

眼下,有越来越多的车企正在将ChatGPT概念引入座舱。Stefan表示,一个真正的数字座舱智能语音助理,不仅可以提升安全和生产力,还能为驾驶者带来更多乐趣。

今年4月,CerenceCarKnowledge进行了全面升级。CarKnowledge利用与ChatGPT类似的生成式AI和大型语言模型(LLMs),为驾驶者提出的问题提供上下文感知和个性化的答案。例如,驾驶者可以询问:“我可以远程启动我的车吗?”“我忘带了钥匙,想远程启动我的车。”……所有这些问题都会从用户手册中的相同信息获得一致的答案;但是,每个答案都会根据驾驶者提出的具体问题使用生成式AI回答。由于答案只从OEM提供的数据中生成,并根据特定汽车的型号及配置定制,因此排除了在网上搜索类似问题的不确定性,这让驾驶者对答案的准确度和可信性十分放心。

驾驶者和乘客的客户体验,以及为OEM厂商实现轻松整合和差异化是赛轮思秉持的两个开发重点。CarKnowledge还可以将OEM数据直接导入大型语言模型以实时更新内容,为驾驶者提供可控的、定制的、个性化的体验。目前,已有一家大型北美OEM厂商和一家大型德国OEM厂商采用了CarKnowledge。

CerenceBrowse则是一种崭新的搜索引擎级知识问答体验,通过车载语音助理智能回答,如POI(兴趣点)、特定领域的信息、名人或重要人物知识点等。

汽车语音交互还有多大可能

CerenceTourGuide助力梅赛德斯-奔驰直观的MBUX智能人机交互系统接入互动旅游内容,将专业导游内容直接、无缝地带进车内,并结合CerenceLook多模视觉语音交互技术,实现车内外视线所及的多模态交互。比如,当你开车经过上海大厦时,你不知道这个建筑物的确切名称,你可以说“告诉我更多关于这个建筑物的信息”。

CerenceEVD警铃侦测系统可以感知到来自车辆后部的紧急车辆,并提示驾驶者重新接管驾驶任务,做出安全的避让动作。

多模态融合

智能座舱是汽车智能化的标志之一,也是各家车企争夺消费者的主战场。超大中控屏幕、零重力座椅、巨幕观影、环绕立体声、卡拉OK、游戏等各种功能应有尽有。随之而来的问题是:一是消费者学习成本上升,功能使用不方便。二是驾驶员操作中控屏,手眼并用存在安全隐患。智能座舱的核心在于交互形式。业内人士认为,智能座舱应该从“堆配置、堆功能”中做“减法”,同时改变目前以触控为主,语音为辅的交互方式。

在Stefan看来,通过智能语音助理结合传感器数据,将实现更多车辆控制功能,大幅提升车载体验。

用户拿着大包小包离开汽车时,可以直接使用语音指令关闭后备箱或车门。上车前调整座舱温度,夏天车内先降温,冬天车内先加热。如果你在车里想和车外的人说话,但基于太冷、太热、不安全,或不方便降下车窗、走出车外等原因,你可以通过CerenceExteriorVehicleInteraction车内外通讯功能一一实现。

作为一个虚拟副驾驶,CerenceCo-Pilot可以分析语音、视线、手势和触摸输入,以及汽车传感器信息,利用实时数据、内置智能、用户偏好和车辆传感器信息实现一系列创新功能,并在他们提出请求前主动发起交互,让语音助理从被动的出行伙伴变成主动的副驾驶。例如,它能够实现车上购物和支付、汽车维护提醒等功能,满足出行过程中的基本需求等。从车载助理到副驾驶,从以驾驶者为中心的智能座舱延伸到沉浸式数字座舱,意味着从对话式AI扩展到多模态Al交互。

ChatGPT引入座舱

眼下,有越来越多的车企正在将ChatGPT概念引入座舱。Stefan表示,一个真正的数字座舱智能语音助理,不仅可以提升安全和生产力,还能为驾驶者带来更多乐趣。

今年4月,CerenceCarKnowledge进行了全面升级。CarKnowledge利用与ChatGPT类似的生成式AI和大型语言模型(LLMs),为驾驶者提出的问题提供上下文感知和个性化的答案。例如,驾驶者可以询问:“我可以远程启动我的车吗?”“我忘带了钥匙,想远程启动我的车。”……所有这些问题都会从用户手册中的相同信息获得一致的答案;但是,每个答案都会根据驾驶者提出的具体问题使用生成式AI回答。由于答案只从OEM提供的数据中生成,并根据特定汽车的型号及配置定制,因此排除了在网上搜索类似问题的不确定性,这让驾驶者对答案的准确度和可信性十分放心。

驾驶者和乘客的客户体验,以及为OEM厂商实现轻松整合和差异化是赛轮思秉持的两个开发重点。CarKnowledge还可以将OEM数据直接导入大型语言模型以实时更新内容,为驾驶者提供可控的、定制的、个性化的体验。目前,已有一家大型北美OEM厂商和一家大型德国OEM厂商采用了CarKnowledge。

CerenceBrowse则是一种崭新的搜索引擎级知识问答体验,通过车载语音助理智能回答,如POI(兴趣点)、特定领域的信息、名人或重要人物知识点等。返回搜狐,查看更多

智能语音机器人在线应答功能

智能语音机器人是基于人工智能技术的在线应答系统,通过语音识别、自然语言处理和机器学习等技术,实现与用户进行智能化的对话和交流。语音机器人可以广泛应用于客服、咨询、教育、娱乐等领域,为用户提供便捷、高效的服务体验。

智能语音机器人的在线应答功能主要基于以下技术和过程:

语音识别:智能语音机器人能够将用户的语音信息转换为文本内容。它利用先进的语音识别算法,识别并转录出用户的说话内容,为后续的处理提供基础数据。

自然语言处理:语音识别后,智能语音机器人会对用户输入的文本进行自然语言处理。它分析文本的语义、意图和关键词,理解用户的提问或需求,并为后续提供准确的回答做准备。

知识库检索:智能语音机器人拥有丰富的知识库,其中包含了各种领域的信息和常见问题的答案。当用户提出问题时,机器人会从知识库中检索相应的信息,以便为用户提供准确和实用的回答。

回答生成:基于用户的提问和知识库的内容,智能语音机器人会生成相应的回答。它可以根据不同的场景和用户需求,提供个性化的回答,解决用户的疑问或问题。

对话管理:智能语音机器人能够进行上下文的理解和管理,实现连贯的对话交流。它可以记住之前的对话内容,根据上下文进行适当的问答,使对话更加连贯和自然。

学习与优化:智能语音机器人还具备学习和优化的能力。通过机器学习算法和数据分析,它可以不断优化自身的回答能力,提升对用户需求的理解和满足度。

智能语音机器人在线应答的优势在于其高效、便捷和智能化的服务。它可以实现24小时不间断的在线应答,不受时间和地域限制,为用户提供即时的帮助和支持。同时,智能语音机器人能够处理大量用户的咨询和问题,减轻人工客服的负担,提高工作效率。

综上所述,智能语音机器人在线应答是一种利用人工智能技术实现的高效、便捷的服务方式。它可以满足用户的咨询和需求,为企业提供智能化的客户服务。随着人工智能技术的不断发展和进步,智能语音机器人将会在各个领域得到更广泛的应用,并为用户带来更好的体验和服务。

沃丰科技GaussMind的智能语音机器人采用深度学习和自然语言处理技术,用自然逼真的业务话术自动外呼客户,适用于各行业客服、营销、回访、通知等业务的外呼电话场景,轻松调教即可上岗,助力企业实现外呼业务智能化转型。

》》免费试用/预约演示——智能语音机器人,优势一试便知

相关词条推荐:AI外呼语音机器人|ASR语音识别|在线聊天客服机器人

世界人工智能大会,体验中国的AI时代

来源:环球时报

【环球时报记者戚席佳赵觉珵马梦阳环球时报驻德国、韩国特约记者青木张静】如果说2023年有什么热词,人工智能(AI)一定位列其中,这股热潮也让正在上海举办的2023世界人工智能大会备受瞩目。各个实力大厂汇聚上海世博中心“大秀肌肉”,上千名嘉宾围绕大模型、科学智能、人形机器人、类脑智能、自动驾驶等话题展开讨论。在ChatGPT点燃AI热潮后的首个夏天,AI将如何影响各个产业和全球未来,AI的标准体系、安全准则、伦理规范该如何搭建,中国在AI领域的发展如何令世界受益等都成为大会的热点话题。

从文心一言到盘古天气

人工智能大模型无疑是今年世界人工智能大会上炙手可热的焦点。各大展商推出的大模型产品占据了大半个展馆。一位百度展台的工作人员告诉《环球时报》记者,截至7日下午5时,至少已经有上百位观众向百度大语言模型产品“文心一言”提问。提问的内容涉及写作文、写藏头诗,回答专业领域的问题等等。

7月6日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰解读了文心大模型3.5的核心技术创新。在基础模型训练上,文心大模型3.5采用了飞桨的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,加快了模型迭代速度,提升了模型效果和安全性。同时,创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。王海峰表示,“文心一言”将逐步开放插件生态,帮助开发者基于文心大模型打造自己的应用。

6日当天,国际学术期刊《自然》杂志刊发了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》。华为团队研发的新的人工智能预报AI程序“盘古天气”,比之前的预测模型快1万倍。精度大致相当于“欧洲中期天气预报中心”的最佳中期预报模型。这一成果也受到外媒关注。“天气预报:AI生成预报的速度提高了1万倍”,瑞士Nau新闻网当日报道称,人工智能可能很快就会取代传统的天气预报。在科大讯飞展台,很多观众围在讯飞“星火认知大模型”前争相提问。今年5月科大讯飞发布该模型,展示文本生成、语言理解、知识问答、逻辑推理、数学知识等七大能力。

外界热议中国AI潜力

本届大会以及近年中国企业在AI领域取得的成果也受到国际多方关注。在7月6日上午的大会开幕式上,特斯拉首席执行官埃隆·马斯克通过视频形式发言。“我一直对中国人的智慧和判断力表示敬意,只要中国下定决心,就没有什么做不好的。”马斯克说,中国在人工智能领域已经具备强大影响力。

韩国《韩民族新闻》报道称,中国的人工智能已经达到相当高的水平。根据全球科技研究论文分析机构科睿唯安的统计数据,2018-2022年全球生成型人工智能相关论文中,中国有1.93万篇位居第一,其后依次是美国、印度。论文被引用次数位居前1%的论文中,美国最多(691篇),中国第二(565篇),英国第三(144篇)。韩国中国经济金融研究所所长全炳瑞称,美中半导体竞争的成败似乎取决于人工智能,美国为限制中国正利用所有方法和手段阻止中国制造出尖端人工智能半导体。

“中国迈入AI时代的伟大跨越”,瑞士《周报》称,中国的高科技产业正遭受美国限制政策的影响,但这个亚洲超级大国在这一领域占据全球领导地位似乎只是时间问题。中国人工智能行业可以从大量合格人才中汲取资源。最重要的是,中国可以将数字化优势与零售结合起来,使网上贸易、固定贸易和物流的数据整合在一起。“可以肯定的是,北京将坚持聚焦前沿技术和人工智能进一步发展的路线:华盛顿咄咄逼人的立场会阻挡中国的努力,但不太可能使这些努力脱轨。”

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林在接受《环球时报》记者采访时表示,中国拥有庞大的生成式AI用户市场,中国能够让AI应用实现广泛扩散,能够通过AI提升内容创作的生产力水平,而当前中国有全球第二规模的数字经济和平台经济,通过平台企业的应用实践,很容易形成生成式AI的应用生态。中国是世界AI应用最大的市场,也是最大的生态试验场,中国活跃的数字用户能够为AI应用普及提供庞大助力。

大模型更贴近生活了

7日,腾讯发布大模型时代AI趋势报告称,垂直领域应用将是大模型未来主战场。对于普通观众来说,最大的感受就是大模型已经越来越贴近日常生活。在会场,科大讯飞展示了一款运用大模型技术的学习机。这款学习机可以做到批改作文,指出错别字,并且教导学生如何更好地写作。工作人员告诉记者,目前为止这个大模型技术主要用于小学生语文和英语的辅导,未来会不断更新,融入更多学科。

在本次大会上,腾讯云行业大模型展示了其在金融风控、交互翻译、数智人客服等场景中的应用。腾讯云行业大模型应用,除了在产业数字化转型方面发挥效应,也加速推动大模型等AI技术在科学计算领域的应用。在文化领域,腾讯将文字检测、摹本生成、字形匹配等AI算法,综合应用于甲骨文研究。

很多ToB(面向企业)端的大模型产品在会场上也吸引了记者的注意。人工智能技术与服务提供商第四范式携大模型“式说”展示了大模型在医疗、金融、零售、房地产等行业的应用,受到广泛关注。例如在医院场景下,通过和医院数据的结合,大模型可以帮助医生根据病人情况开医嘱、开检查单等,提高医生工作效率。

对于未来AI的应用场景,盘和林表示,最看好搜索辅助类应用。当前人们在搜索信息的时候往往很难得到想要的搜索结果,当前搜索引擎有很多,最终具备较好搜索算法的网站获得成功。同样的,生成式AI将进一步提升搜索引擎的搜索效率,生成式AI在搜索领域将迅速落地。未来比较快落地的项目可能有生成式AI写代码、生成绘画、虚拟人语音库、虚拟人动作库、聊天机器人、搜索引擎辅助等等。

海量资讯、精准解读,尽在新浪财经APP

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇