博舍

科大讯飞赵毅:跨界融合的智能汽车产品和服务生态体系 讯飞智能汽车事业部

科大讯飞赵毅:跨界融合的智能汽车产品和服务生态体系

2020年8月13日-15日,“2020中国汽车论坛”在上海隆重召开。该论坛是由中国汽车工业协会(CAAM)主办,世界汽车组织(OICA)、世界经济论坛(WEF)唯一支持的行业顶级论坛。本届论坛以“新变局新挑战新思路——引领中国汽车新征程”为主题,紧扣时代脉搏,求索突破之道,紧密围绕“十四五”规划,把控宏观产业形势,解析全球汽车产业发展动态。其中,在8月15日上午举办的“智能网联汽车创新发展与产业生态的升级”分论坛上,科大讯飞智能汽车事业部副总经理赵毅发表了主题演讲,以下为演讲实录:

科大讯飞智能汽车事业部副总经理赵毅

赵毅:最后一个分享,首先必须要感谢在座各位还能坚持到现在。

我的PPT展示分为两部分:第一部分,科大讯飞对行业的理解;第二部分,基于理解突出的产品特性、布局。

像上午这么多大咖给我们进行的介绍一样,智能化有非常多的方向是不同公司、不同从业人员在努力探索的。一方面汽车行业“四化”说了一两年、两三年了,这是大家共同努力的目标。另外一个方向大家可以一起共同关注,汽车行业的数字化转型。因为传统制造型企业想转变成基于软件、基于服务的企业时,数字化转型是必不可少的。

就是说,可以通过车联网能够将汽车“四化”和“数字化”融合在一起,所以我们认为车联网就是当前节点汽车新业态形成的关键。

今天很多大咖都在说软件定义汽车、架构定义汽车、服务定义汽车,看一下过往所有的汽车品牌基本上无非是操控、内外饰竖立品牌、形成品牌。但是在现在的状态下,软件和服务会让品牌的调性变得更加不同,甚至可能会比传统认为的内外饰、操控性、科技感更加重要,科大讯飞觉得有两点:(1)车内人机交互。(2)用户服务生态。

我们通过调研公司了解的信息,具体的就不说了,大家可以看到用户一定希望有个性化、多样化,同时会注重安全感和愉悦感。现在的客户已经脱离了对简单功能、功能叠加的需求,更加关注的是软性,比如说是否能带来愉悦、能否带来安全、能否在我伤心的时候逗笑我,这是目前主要的诉求。已经脱离了功能性需求。就是说,如果我们还一味地强调现在有这样的功能、那样的服务,并不能吸引当前主力的购买人群。

从更大的行业来看——“ABC+芯片”,人工智能、大计算、云计算已经说了很多,和汽车息息相关,但在每个行业都在产生影响。在这样的大环境下,目前汽车供应生态也在发生着变化,刚才长安的张总在提,在这样的新软件服务的业态下,整车厂和供应商的关系应该是什么样?我们既有自给自足型的,什么都自己来做,比如说特斯拉,特斯拉就是典型的自给自足型的。同时大部分车厂是第三方解决型的。我们相信车企和消费者会和传统和新兴的势力融合在一起,无论是产品研发、技术研发、用户研发,一定是“蜘蛛网型”的。

虽然今天上午以及昨天论坛有很多大咖都在讲,但恕我直言,很多时候只是理念和愿景,是需要有节奏、过程的。实际上看现在目前各个整车厂生态系统的建设,是和理念、愿景相对滞后的。在中国也好,在国外也好都有生态壁垒的问题、选边站队的问题,很多时候通过资本的方式、资源置换的方式,虽然某种时刻可以打破壁垒,但是会看到在中国服务提供商的壁垒是长期存在的。

如何跨行业协同创新意识和能力?汽车方向的创新是不是汽车人可以单独搞定,如何创立一个模式跨越其他行业?比如说《公检法》、医疗、教育,这都是上半年疫情一直比较火的行业,这些行业对汽车行业是不是有帮助、有认识,如何构建渠道?这是三个典型的问题。

我们梳理出来和的生态发展观——共创共研推动去中心化生态。

这是讯飞对未来智能汽车发展布局的理解,相信上午所有嘉宾基本上在看横向的事情——车如何理解环境?终极目标就是自动驾驶,是车和环境之间的关系。讯飞选的路是纵向的,因为车是服务于人的,所以一定要理解人,只有车既理解了环境又理解了人,才能够真正成为我们定义的智能汽车。

十年前我们更多是在核心技术这一块儿去深耕,去积累,把车内的语音交互从不可用做成可用,从可用做到好用,这是过去五年十年我们做的事情。但现在以及在未来的两三年,希望能够达到虚拟个人助理的水平。到底有什么区别?目前终端用户已经不是特别care产品是不是一堆功能叠加的结果,更加care能否带来软性的东西。所谓的软性就是情感化交互。

这是我们梳理出来的四个最核心的点,后面我都会进行介绍:

(1)听说看能力。

大家对讯飞最了解的就是语音识别、语音合并,很多朋友说讯飞的语音好,但实际上语音并不是单纯的技术,是由十多个技术闭环所组成的,所以会形成木桶效应。十几个闭环里有任何一个不是特别好就会给最终人机交互感觉变得不好,因为短板比较短。还好讯飞在这一块儿基本上每一环都是世界领先的,所以我才有信心说我们可以打造全闭环的世界领先的语音交互产品。

(2)从现在维度看未来两三年车内人机交互会有三个升级。

多模态交互,今天上午很多大咖都提到了,后面我会具体讲。多乘客交互、情感化交互是我们正在做的,也是我们认为会有升级机会的。

多模态交互,比如说有一些手势、视觉、语音,但实际上讯飞目前做的更多的是眼神的追踪,通过对乘客眼神的追踪,我们发现好像对用户意图可以进行判断最高的途径。这是讯飞比较早在行业里发现的事情,今年年底应该会有相应的产品出来。

多乘客交互,所谓的多乘客是在一辆车内,特别是大车,第一排和第三排的乘客会有交流的需要愿望。比如说我在开车的时候我的后排坐的是我的女儿,6岁,很多时候她说话我听不到,如果我回头会有安全的问题。能不能通过车内声学的方式解决这个问题?这是我们现在正在做的事情。

前两年智能座舱大家都在拼谁的屏多,恨不得一个车里装20多个屏,但屏只是解决了视觉的问题,并没有解决听觉的问题。为什么我和前面这个屏说话和旁边的屏说话是不是一样?你希望得到的反馈是否一致?从我的角度应该是不一致的。通过语音交互来做的话,整车如何判断我是对这块屏说的,而不是对那块屏说的。这是我们为了解决这个问题做的核心问题的突破和积累。

同时讯飞是做语音的,人要和车说话,车对人说话怎么办?过去几年我们只做人对车说话这件事情,但声音不能形成闭环,也就是说我们仍然不能从声音维度在汽车内给用户完整的体验,这也是为什么在前年开始发力整个智能驾驶舱的音效体验。

(播放视频)

这是一个例子。您会发现想做真正情感化交互肯定是离不开多模态的交互,他们是相辅相成的,否则我怎么知道司机累了或者不开心了,如何更精准地判断取决于多模态交互的手段,所以所有的这一切都是相辅相成的。

谈到生态智能,我们做了分类,不太再想把BAT的CP/SP纳入到非常大的范围内,但仍然属于娱乐和生活相关的小类,对整车场来讲最有价值的仍然是整车的生态势能,加上和售后相关的能够产生售后运营价值养护、保修、保养、保险、二手车生态,无论对用户还是终端客户来讲都是最有价值的。

过去大家更多说的是功能,我有这个功能,我有其他功能,但现在OS相信一定会基于场景,基于情绪的良好助手。

未来一定是“交互+生态+场景”三擎驱动的。讯飞没有光想,我们也做了很多事情,无论是OS的软硬分离还是云端的软硬分离,一说软硬分离就是车机的软件和硬件大家分开做,但我们还有定义云端的软硬分离,会和很多整车厂通过专有云、私有云的方式搭建云端平台的软件和硬件是分离的。

讯飞不仅可以做语音,现在也在做非常多的OS,在国内和广汽、长安、奇瑞、江铃形成了品牌化OS合作,目前在智能驾驶舱方向积极探索。

到今年为止,讯飞在汽车方向已经耕耘了18年,到上半年全中国有2500万辆搭载了讯飞的语音,离不开在座的各位对讯飞的鼎力支持,特别希望能和在座各位携手起来,汇智同行,谢谢大家!

(注:本文根据现场速记整理,未经演讲嘉宾审阅)

作者:王鸣幽

科大讯飞智能汽车业务

智能汽车是AIoT时代最重要的终端之一

  汽车场景因为其限定空间的交互范围、限制双手的交互方式以及复杂抗噪所需要的极高AI技术门槛,成为科大讯飞大显身手的重要AIoT市场。而进入AIoT时代的最大红利,对企业提出不同于移动互联网时代的要求:1、软硬件结合或者云-端-芯全方位布局,才能使终端与业务覆盖不同类型的碎片化场景;2、企业架构与业务能力要能适应跨行业碎片化场景落地;3、具备能高效复用的技术平台,赋能各碎片化场景的同时,形成数据反馈的正循环。科大讯飞无疑符合以上三大要求,而汽车场景因为其限定空间、限制交互要求以及复杂抗噪所需要的极高AI技术门槛,成为科大讯飞大显身手的重要AIoT市场。

深耕汽车行业20年的讯飞语音

  公司的核心技术的不断演进将车载交互分为三代,目前仍处于第二代末及第三代萌芽阶段,并最终将是往多模态、多区域、多乘客的角度发展。公司的“飞鱼音效”作为车载音响智能化的先驱者,开启整车智能的大局。“飞鱼音效”通过自身技术平台+赛道的模式形成在智能座舱全产业链技术积累,最终赋能飞鱼管理系统,确保音乐元素分离技术实现智能声场效果。通过音频系统、调音能力以及算法能力三管齐下之势,最终实现“皇帝位”听音能力。

 独木成林,“讯飞开放者平台”加速商业化落地,全方位助力产品生态圈形成

  受益于开放者平台,公司成立“科大讯飞智能音效生态联盟”,进一步整合行业资源。公司2010年上线讯飞开放者平台,开发者伙伴基于讯飞开放平台开发的应用和智能硬件规模不断扩大,开发者伙伴的“端”、“芯”与讯飞开放平台的“云”已实现一体化。借助平台及联盟的模式,多家合作伙伴在不同细分音频领域持续提供海量数据,为公司战略布局形成有力支撑。

-------------------------------------------------------

1智能汽车是AIoT时代最重要的终端之一

  目前计算机行业最重要的“天下大势”是:我们正从移动互联网时代进入AIoT(万物智联)的时代,其中最重要的就是计算终端将从标准化统一的平台走向碎片化非标准化场景,而智能汽车是AIoT时代最重要的终端之一。在标准化终端PC、手机上靠“杀手级”应用“一招鲜”就能够通吃天下的时代已经过去,无论是基础软硬件、应用场景甚至到业务架构,都要适应从“一统天下”到“合久必分”的碎片化智能物联时代的需求。进入AIoT时代的最大红利也对企业提出了不同于移动互联网时代的要求:1、软硬结合或者云-端-芯全方位布局,才能使得终端与业务能够覆盖不同类型的碎片化场景;2、企业架构与业务能力要能够适应跨行业的碎片化场景落地;3、具备能够高效复用的技术平台,赋能各碎片化场景的同时,形成数据反馈的正循环。科大讯飞无疑符合以上三大要求,而汽车场景因为其限定空间的交互范围、限制双手的交互要求以及复杂抗噪所需要的极高AI技术门槛,成为科大讯飞大显身手的重要AIoT市场。

2深耕汽车行业20年的讯飞语音

  公司于2011年以量产第一代智能语音车载产品为起始,开启了与汽车行业深度交融的20年历程。根据公司官网数据,目前总体交付超1000多车型项目,同时与90%以上的中国自主车企和合资车企进行合作,覆盖2900万辆及以上汽车前装搭载。

  公司的产品迭代和布局其实是核心技术的不断演进的缩影。根据公司的核心技术:语音合成、识别、认知智能等,可以清晰的将车载交互分为三代,目前仍处于第二代末及第三代萌芽阶段:

  第一代的形态是以基础的语音控制功能实现以命令词识别交互的状态为主,公司于2014年完成全产品线支持;

  第二代于2017年开始转向面向内容搜索的多维交互,从而识别上下文进行多轮交互的识别,同时讯进入到音场领域,通过软件的提升模拟声音音场的效果,从而提升用户声音的感知能力;

  而经历两代的发展之后的第三代车内语音的交互必将是往多模态、多区域、多乘客的角度发展,同时通过高阶声场区和独立听觉分区达到高阶的体验感。

3车载音响——补足整车智能的新一块拼图

  汽车智能化的最终形态是全方位、全模态的智能交互。目前伴随着车机系统和自动驾驶等相关技术的逐步落地,智能屏和L2及L3的自动驾驶体验也触手可及。而延续数十年的配件体系并无过多更新,整体与智能化呈现互不匹配的格局。公司于11月18日发布的“飞鱼音效”,旨在为相关配件开启智能化先河。

  公司通过自身技术平台+赛道的模式形成在汽车智能座舱全产业链技术优势与积累,最终赋能飞鱼音频管理系统,确保音乐元素分离技术实现智能声场效果。依托公司对语音以及车联操作系统的深耕,公司在汽车领域的业务处于稳步上升之势,2019年汽车总营收为3.71亿元,2020年在全球汽车销量及产量双重挫的情况下,仍能确保相同量级的营收。而此次发布会的产品将音频落实于车内、行车场景下,实现多重体验功能,整体汽车领域布局进一步完善。

  软硬件实现双轮驱动,映射至讯飞音响的“皇帝位”听音。传统的车载音频系统发展尚不及智能化的需求,目前主要存在三个问题:1)由于车内空间较小,不足以产生混响效果,导致声音比较局促;2)由于车辆内部结构限制,车内扬声器的安放并不能实现最优方案,声场较为杂乱;3)车内扬声器与乘客的相对位置并非为最佳匹配。而解决三大痛点的飞鱼系统通过先进的软硬件配置形成7大功能:声景空间、虚拟现场音效、品牌声浪、专属音频、车内降噪、聊天优化、声学空间。通过音频系统、调音能力以及算法能力三管齐下之势,满足用户日益严格的听觉需求。

  硬件方面,公司通过飞鱼智能音频管理系统内置自研的音频计算平台。该计算平台使用高性能浮点DSP处理器,相较于传统的定点DSP处理器,高性能浮点DSP处理器具有1GHZ高速音频处理加速器、128通道数字音频处理能力以及支持高达24bit、96kHZ的高清晰音频,更是让其性能远超行业主流的定点DSP处理器性能的十倍。

  软件算法层面,飞鱼智能音频管理系统依赖AUTOSAR结构和公司专精的音效及语音质量评级标准,可实现全车独立声场分区,实现主驾、副驾、后排乘客互不干扰的语音交互模式。同时,全自主知识产权的3D沉浸环绕音等高级音效算法可对音频进行即时的高质量还原,具有虚拟声学空间、发动机主动降噪、车内交流补偿等高级智能车载音响系统的高精尖技术,能够为每一辆车营造出广阔无垠的声场空间。

  独木成林,“讯飞开放平台”加速商业化落地,全方位助力产品生态圈形成。2010年,讯飞开放者平台正式上线,经过10年的培育和发展,开发者伙伴基于讯飞开放平台开发的应用和智能硬件规模不断扩大,开发者伙伴的“端”、“芯”与讯飞开放平台的“云”已实现一体化,并形成了可以共同运营的流量。开放者平台的布局使得智能语音的发展空间已远远不止下游B端品牌

设备商在设备开发过程中支付的技术付费。一方面,技术提供方可以通过提供芯片、麦克风阵列解决方案、AI算法的全链方案,增加技术输出的“厚度”;另一层面,开放者平台令使研发环节的模块标准化成为可能,开发配置的门槛得以进一步降低。技术层面的“解压”让公司更加注重应用场景的理解与用户交互体验感的优化。

  公司已形成“云-芯-端”的AIoT生态圈。开发者伙伴基于讯飞开放平台开发的应用和智能硬件规模不断扩大,开发者伙伴的“端”、“芯”与讯飞开放平台的“云”已实现一体化,并形成了可以共同运营的流量。目前,“云-芯-端”的生态圈已成功应用在ToC产品线中。C端产品中,讯飞翻译机、讯飞智能会议系统、讯飞录音笔等智能硬件设备底层采用AI芯片,顶层嵌入打包好的AI算法,能够使用户离线使用;讯飞有声、讯飞输入法及讯飞智能转写等软件服务主要采用深度全序列卷积神经网络,研发出高精度的记忆增强式多通道端到端语音识别技术,从而落地语音输入、语音交互、语音记录等典型应用场景;讯飞开放平台主要为用户提供自主软件开发平台,并利用开发用户所形成的产业生态,持续地从终端使用中提供其未来发展战略决策的一线数据支撑。根据讯飞开放平台官网数据,讯飞开放平台已拥有396项AI产品及方案,合计链接200万+合作伙伴共建人工智能生态。

  受益于开放者平台,公司成立“科大讯飞智能音效生态联盟”,进一步整合行业资源。本次活动上,科大讯飞与中央广播电视总台云听、喜马拉雅、爱奇艺、芒果动听、雷石、酷我等音效合作伙伴以及讯飞音乐、讯飞听见等集团内部生态资源形成联盟之势。

  在首批生态伙伴中,作为国内优质的音频内容生产和分发平台,喜马拉雅为飞鱼系统提供包含98个品类的2.9亿条音频,可以满足不同场景的驾乘声乐需求;而作为国家级5G声音新媒体平台,云听在车载领域开创了“场景化+智能电台流”的应用,可以根据用户收听行为及喜好,针对不同的出行场景,基于移动端800多套广播频率、300万小时有声内容,按需推送音乐、新闻、娱乐、电影、旅游、科技等优质丰富的节目。多家合作伙伴在不同细分音频领域持续提供海量数据,为公司坚持数据反哺核心技术迭代的战略布局形成有力支撑。

  公司作为国内人工智能龙头企业,正进入人工智能2.0阶段。公司自身在AI赛道的车载智能音响补足整车智能的的发布展现公司AI全产业链覆盖的野望,同时伴随着汽车智能化行业的高景气度,有望进一步扩大市场份额。

本文转载自网络,版权归原作者所有,如侵犯您的权益请联系wyl860211@qq.com,我们将第一时间删除。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇