博舍

2023年中国人工智能产业研究报告(Ⅳ) 人工智能语音技术现状调查报告

2023年中国人工智能产业研究报告(Ⅳ)

报告简介

中国人工智能产业研究报告(Ⅳ)为艾瑞咨询集团自主研究发布的年度行业报告,至今已连续四年。本年度艾瑞除了持续更新计算机视觉、智能语音与对话式AI、机器学习、自然语言处理与知识图谱等各项技术的细分市场规模、探讨新兴应用场景或趋势外,还深入探讨了数字经济时代的人工智能产业升级、人工智能产业的持续增长力、行业典型参与者的商业模式与战略发展路线、智能化改革践行者的人工智能思维等四大关键性问题,希望通过本报告,为读者呈现2021年人工智能产业发展的要素与亮点,提供辨析和判断人工智能行业趋势的方法启发。

目录

一、数字经济时代人工智能产业社会经济价值1.1人工智能产业化发展进程1.2数字经济的华章1.3数字经济下的人工智能产业升级1.4人工智能助力产业经济价值实现二、人工智能产业的持续增长力2.1人工智能产业规模2.2人工智能产业图谱2.3机器学习2.4知识图谱与自然语言处理2.5智能语音与对话式AI2.6计算机视觉2.7AI芯片2.8“新需求”下的AI技术发展趋势三、人工智能产业的供需天平3.1资本市场总况3.2人工智能企业价值实现进程3.3智能化改革践行者的人工智能思维3.4人工智能企业商业化价值路径3.5轻量标准化产品的商业价值3.6定制化解决方案的商业价值3.7AI平台的商业价值3.8AI工程化能力的商业价值四、人工智能行业标杆企业与新锐势力4.1商汤科技4.2第四范式4.3明略科技4.4萨摩耶云4.5澎思科技4.6慧算账4.7易道博识4.8百应科技4.9竹间智能4.10地平线4.11爱数智慧五、人工智能产业趋势展望5.1可信人工智能的重要性升级5.2预训练大模型的商业化5.3人工智能基础层价值持续凸显5.4低/零代码开发,AI落地千行百业

图表目录

图1-12015-2020年中国数字经济规模及占GDP比重图1-22012-2021年5月对话机器人投融资轮次情况图2-32019-2026年中国人工智能产业规模图2-42015-2020年中国数字经济内部结构变化图2-52018-2021年11月中国机器学习融资事件数与融资金额情况图2-62018-2021年11月中国机器学习融资轮次情况图2-72018-2021年11月中国机器学习融资赛道热度情况图2-82019-2026年中国机器学习核心产品及带动相关产业规模图2-92019-2026年中国机器学习核心产品在主要行业应用规模图2-102018-2021.11月中国知识图谱融资概况图2-112018-2021.11月中国知识图谱融资轮次情况图2-122018-2021.11月中国NLP融资概况图2-132018-2021.11月中国NLP融资轮次情况图2-142018-2020.11月中国知识图谱获投企业业务赛道热度统计图2-152018-2021.11月2018-2020.11中国NLP获投企业业务赛道热度统计图2-162019-2026年中国知识图谱核心产品及带动相关产业规模图2-172019-2026年中国知识图谱核心产品在主要行业应用规模图2-182019-2026年中国NLP核心产品及带动相关产业规模图2-192019-2026年中国NLP核心产品在主要行业应用规模图2-202019-2026年中国智能语音垂直行业应用核心产品及带动相关产业规模图2-212019-2026年中国对话式AI核心产品及带动相关产业规模图2-222018-2021年11月中国智能语音企业融资金额与融资笔数统计图2-232018-2021年11月中国智能语音企业融资轮次情况图2-242018-2021年11月中国智能语音获投企业业务赛道热度统计图2-252019-2026年中国智能语音垂直行业应用各领域市场规模图2-262019-2026年中国智能语音垂直行业应用按业务模式划分市场规模图2-272019-2026年中国对话机器人在主要行业领域应用规模图2-282020-2026年中国智能硬件搭载的AI语音助手算法产值图2-292018年-2021年11月中国计算机视觉企业融资金额与融资笔数情况图2-302018年-2021年11月中国计算机视觉企业融资轮次情况图2-312018年-2021年11月中国计算机视觉获投企业业务领域分布情况图2-322019-2026年中国计算机视觉核心产品及带动相关产业规模图2-332019-2026年中国计算机视觉核心产品在主要行业领域应用规模图2-342019-2026年中国AI芯片市场规模图3-352018-2021年11月中国一级市场人工智能赛道融资表现

2023年中国智能语音行业研究报告

报告简介

《2020年中国智能语音行业研究报告》为艾瑞咨询集团自主研究发布的年度行业研究报告,本报告对中国智能语音行业整体市场和细分赛道进行分析,详细梳理了智能语音行业2019年消费级智能硬件、企业级与公共级智能语音产品的应用场景与发展渗透情况,为AI公司和巨头企业进行了业务发展分析,旨在将向市场提供更多的参考依据,为智能语音相关企业提供一定的支持和帮助,为有关投资机构提供参考。

目录

一、智能语音相关技术概述1.1智能语音的概念1.2智能语音的前情提要1.32020年建议重点关注的技术方向1.4本章小结二、子研究(1/3)消费级市场2.1语音助手及其发展历程2.2消费级智能硬件家族2.3智能音箱研究单元2.4语音输入法2.5本章小结三、子研究(2/3)企业级与公共级市场3.1企业级与公共级市场画像3.2智能语音与医疗健康3.3智能语音与公检法3.4智能语音与教育3.5智能语音与客服3.6智能语音与互联网内容审核监管3.7智能语音与泛传媒四、子研究(3/3)市场参与者4.1中国智能语音行业图谱4.2中国智能语音行业热度4.3代表性企业案例五、写在最后

图表目录

图2-12018年中国智能家居从业者最看好的用户入口图2-22012-2019年中国智能手机与智能音箱出货及渗透情况图2-32018年11月-2019年11月中国主要智能音箱App月独立设备数图2-42017-2022年中国智能音箱整机销售额图2-52019年中国智能音箱成本分布图2-62019年中国智能音箱平台商业模式图3-12018-2022年中国智能语音企业级和公共级市场规模图3-22019年&2022年中国智能语音企业级和公共级市场细分结构图3-32016-2018年美国智能语音巨头Nuance营业收入结构图3-42018-2022年中国智能语音在医疗健康领域市场规模及细分结构图3-52019H1中国部分娱乐社交头部App月度使用时长图4-1中国人工智能投资数据概览图4-2科大讯飞人工智能产业生态与近期业务结构

人工智能论坛第12期——智能语音交互技术发展现状

报告题目:智能语音交互技术发展现状

报告人:李雅特聘副研究员

主持人:宋晴教授

报告时间:2022年6月15号(周三)16:00-17:00

腾讯会议:335-546-957

报告摘要:

语音是人们信息获取和沟通最便捷、最有效的手段。自从iPhone4S推出SIRI后,智能语音交互应用得到飞速发展。近年来,语音交互技术被广泛运用于B端和C端各个场景,包括医疗、客服、教育、智能家居、移动设备、车载等。讲座将介绍语音交互技术中的语音识别以及语音合成这两个核心技术,也将介绍情感识别与理解、语音转换等前沿热点技术,激发同学们对智能语音交互领域的兴趣。

专家简介:

北京邮电大学特聘副研究员,博士生导师,北邮-中科深智元宇宙联合实验室主任。主要从事语音识别与合成、情感计算、多模态人机交互等研究。任中国计算机学会语音对话与听觉专委会委员、全国人机语音通讯学术会议常设机构委员、中国人工智能学会情感智能专委会委员等。在国内外重要期刊和会议上发表论文70余篇,授权专利近10项。主持和参与包括国家自然科学基金重点项目、面上项目、国家重点研发计划、863项目在内的多项科研项目。与百度、腾讯、搜狗、三星、中科深智、云知声等多家企业展开深入合作。研究成果曾获2018年中国电子学学会科技进步一等奖,2014年北京市科学技术奖二等奖,指导研究生获语音领域顶级会议INTERSPEECH2016的最佳学生论文奖、全国人机语音通讯会议最佳学生论文奖等。

【人工智能调查报告】人工智能调查报告精选八篇

人工智能研究报告

成员:XXX

基本信息

概念

各个蚂蚁在没有事先告诉他们食物在什么地方的前提下开始寻找食物。当一只找到食物以后,它会向环境释放一种挥发性分泌物pheromone(称为信息素,该物质随着时间的推移会逐渐挥发消失,信息素浓度的大小表征路径的远近)来实现的,吸引其他的蚂蚁过来,这样越来越多的蚂蚁会找到食物。有些蚂蚁并没有象其它蚂蚁一样总重复同样的路,他们会另辟蹊径,如果另开辟的道路比原来的其他道路更短,那么,渐渐地,更多的蚂蚁被吸引到这条较短的路上来。最后,经过一段时间运行,可能会出现一条最短的路径被大多数蚂蚁重复着。

原理

设想,如果我们要为蚂蚁设计一个人工智能的程序,那么这个程序要多么复杂呢?首先,你要让蚂蚁能够避开障碍物,就必须根据适当的地形给它编进指令让他们能够巧妙的避开障碍物,其次,要让蚂蚁找到食物,就需要让他们遍历空间上的所有点;再次,如果要让蚂蚁找到最短的路径,那么需要计算所有可能的路径并且比较它们的大小,而且更重要的是,你要小心翼翼地编程,因为程序的错误也许会让你前功尽弃。这是多么不可思议的程序!太复杂了,恐怕没人能够完成这样繁琐冗余的程序。

然而,事实并没有你想得那么复杂,上面这个程序每个蚂蚁的核心程序编码不过100多行!为什么这么简单的程序会让蚂蚁干这样复杂的事情?答案是:简单规则的涌现。事实上,每只蚂蚁并不是像我们想象的需要知道整个世界的信息,他们其实只关心很小范围内的眼前信息,而且根据这些局部信息利用几条简单的规则进行决策,这样,在蚁群这个集体里,复杂性的行为就会凸现出来。这就是人工生命、复杂性科学解释的规律!那么,这些简单规则是什么呢?

问题

蚂蚁究竟是怎么找到食物的呢?在没有蚂蚁找到食物的时候,环境没有有用的信息素,那么蚂蚁为什么会相对有效的找到食物呢?这要归功于蚂蚁的移动规则,尤其是在没有信息素时候的移动规则。首先,它要能尽量保持某种惯性,这样使得蚂蚁尽量向前方移动(开始,这个前方是随机固定的一个方向),而不是原地无谓的打转或者震动;其次,蚂蚁要有一定的随机性,虽然有了固定的方向,但它也不能像粒子一样直线运动下去,而是有一个随机的干扰。这样就使得蚂蚁运动起来具有了一定的目的性,尽量保持原来的方向,但又有新的试探,尤其当碰到障碍物的时候它会立即改变方向,这可以看成一种选择的过程,也就是环境的障碍物让蚂蚁的某个方向正确,而其他方向则不对。这就解释了为什么单个蚂蚁在复杂的诸如迷宫的地图中仍然能找到隐蔽得很好的食物。

…………余下全文

2023年人工智能领域发展七大趋势

2022年人工智能领域发展七大趋势

有望在网络安全和智能驾驶等领域“大显身手”

人工智能已成为人类有史以来最具革命性的技术之一。“人工智能是我们作为人类正在研究的最重要的技术之一。它对人类文明的影响将比火或电更深刻”。2020年1月,谷歌公司首席执行官桑达尔·皮查伊在瑞士达沃斯世界经济论坛上接受采访时如是说。

美国《福布斯》网站在近日的报道中指出,尽管目前很难想象机器自主决策所产生的影响,但可以肯定的是,当时光的车轮到达2022年时,人工智能领域新的突破和发展将继续拓宽我们的想象边界,其将在7大领域“大显身手”。

增强人类的劳动技能

人们一直担心机器或机器人将取代人工,甚至可能使某些工种变得多余。但人们也将越来越多地发现,人类可借助机器来提升自身技能。

比如,营销部门已习惯使用工具来帮助确定哪些潜在客户更值得关注;在工程领域,人工智能工具通过提供维护预测,让人们提前知道机器何时需要维修;法律等知识型行业将越来越多地使用人工智能工具,帮助人们对不断增长的可用数据中进行分类,以找到完成特定任务所需的信息。

总而言之,在几乎每个职业领域,各种智能工具和服务正在涌现,以帮助人们更有效地完成工作。2022年人工智能与人们日常生活的联系将会变得更加紧密。

更大更好的语言建模

语言建模允许机器以人类理解的语言与人类互动,甚至可将人类自然语言转化为可运行的程序及计算机代码。

2020年中,人工智能公司OpenAI发布了第三代语言预测模型GPT—3,这是科学家们迄今创建的最先进也是最大的语言模型,由大约1750亿个“参数”组成,这些“参数”是机器用来处理语言的变量和数据点。

众所周知,OpenAI正在开发一个更强大的继任者GPT—4。尽管细节尚未得到证实,但一些人估计,它可能包含多达100万亿个参数(与人脑的突触一样多)。从理论上讲,它离创造语言以及进行人类无法区分的对话更近了一大步。而且,它在创建计算机代码方面也会变得更好。

网络安全领域的人工智能

今年1月,世界经济论坛发布《2021年全球风险格局报告》,认为网络安全风险是全世界今后将面临的一项重大风险。

随着机器越来越多地占据人们的生活,黑客和网络犯罪不可避免地成为一个更大的问题,这正是人工智能可“大展拳脚”的地方。

人工智能正在改变网络安全的游戏规则。通过分析网络流量、识别恶意应用,智能算法将在保护人类免受网络安全威胁方面发挥越来越大的作用。2022年,人工智能的最重要应用可能会出现在这一领域。人工智能或能通过从数百万份研究报告、博客和新闻报道中分析整理出威胁情报,即时洞察信息,从而大幅加快响应速度。

人工智能与元宇宙

元宇宙是一个虚拟世界,就像互联网一样,重点在于实现沉浸式体验,自从马克·扎克伯格将脸书改名为“Meta”(元宇宙的英文前缀)以来,元宇宙话题更为火热。

人工智能无疑将是元宇宙的关键。人工智能将有助于创造在线环境,让人们在元宇宙中体会宾至如归的感觉,培养他们的创作冲动。人们或许很快就会习惯与人工智能生物共享元宇宙环境,比如想要放松时,就可与人工智能打网球或玩国际象棋游戏。

低代码和无代码人工智能

2020年,低代码/无代码人工智能工具异军突起并风靡全球,从构建应用程序到面向企业的垂直人工智能解决方案等应用不一而足。这股新鲜势力有望在2022年持续发力。数据显示,低代码/无代码工具将成为科技巨头们的下一个战斗前线,这是一个总值达132亿美元的市场,预计到2025年其总值将进一步提升至455亿美元。

美国亚马逊公司2020年6月发布的Honeycode平台就是最好的证明,该平台是一种类似于电子表格界面的无代码开发环境,被称为产品经理们的“福音”。

自动驾驶交通工具

数据显示,每年有130万人死于交通事故,其中90%是人为失误造成的。人工智能将成为自动驾驶汽车、船舶和飞机的“大脑”,正在改变这些行业。

特斯拉公司表示,到2022年,其生产的汽车将拥有完全的自动驾驶能力。谷歌、苹果、通用和福特等公司也有可能在2022年宣布在自动驾驶领域的重大飞跃。

此外,由非营利的海洋研究组织ProMare及IBM共同打造的“五月花”号自动驾驶船舶(MAS)已于2020年正式起航。IBM表示,人工智能船长让MAS具备侦测、思考与决策的能力,能够扫描地平线以发觉潜在危险,并根据各种即时数据来变更路线。2022年,自动驾驶船舶技术也将更上一层楼。

创造性人工智能

在GPT—4谷歌“大脑”等新模型的加持下,人们可以期待人工智能提供更加精致、看似“自然”的创意输出。谷歌“大脑”是GoogleX实验室的一个主要研究项目,是谷歌在人工智能领域开发出的一款模拟人脑具备自我学习功能的软件。

2022年,这些创意性输出通常不是为了展示人工智能的潜力,而是为了应用于日常创作任务,如为文章和时事通讯撰写标题、设计徽标和信息图表等。创造力通常被视为一种非常人性化的技能,但人们将越来越多地看到这些能力出现在机器上。(记者刘霞)

【纠错】【责任编辑:吴咏玲】

中国智能语音行业的历史沿革、现状与发展动态分析

数据来源:沙利文数据中心,其中2021年-2023年数据为预测数据

3

中国智能语音行业的应用

01

消费级市场的应用

智能语音助手赋能多类智能终端,构建全产业生态链。消费级智能语音交互是人们接触智能语音最普遍的渠道,从手机语音助手、家庭智能音箱、智能耳机、智能电视到智能车载等等。

语音助手是用于终端的语音控制程序,通过智能对话与即时问答的智能交互,让智能机器助手帮助完成用户指派的任务。2011年第一款手机语音助手Sirl伴随IPhone4S亮相,各大厂商纷纷入局。从2017年下半年开始,通过开放语音生态系统,进行产业内合作,语音助手向家居、车载、可穿戴设备等领域不断延伸和迁移,构建出全产业生态链。

(1)通过语音助手或语音转写能力提供音频内容与任务处理服务。目前带有智能语音能力的消费级硬件大体可划分为智能家居、儿童产品、随身产品、车载设备、商务产品等。部分产品的交互特性更强,需要通过语音交互为用户提供音频内容和某些任务处理操作。

(2)为语音交互蓝图铺路,成为智能生活入口。近年,智能音箱作为智能生活的“入口”的地位逐渐被夯实。

(3)提升输入效率,满足个性化表达需求输入法是智能语音技术在C端的重要落地场景,语音输入(多语种支持)、智能纠错、语音翻译等功能开始成为标配;语音变声、语音斗图等针对年轻群体的创新功能也相继推出。

02

企业级和公共级市场的应用

平台化技术输出和解决方案两类模式,解决方案业务占比高。智能语音消费者业务主要通过硬件出售及相关互联网增值服务获利,而企业级和公共级业务则主要有两类合作模式:

一是技术平台输出模式,将通用技术能力封装为SDK或API,下游客户或生态中的开发者使用时向技术提供方支付一定费用,当然为了促进生态的快速发展,一些平台如华为HiAl、百度语音技术采取面向开发者免费的策路。

二是切入传统行业,提供解决方案(含核心设备),这种情形下涉及智能语音企业与传统行业集成商或最终客户进行定制化、深度合作。

2.1智能语音与医疗健康

智能语音与医疗健康的核心价值在于提升输入效率和查询效率。医疗领域对于智能语音的需求主要来自电子病历系统上的语音功能,通过语音输入的方式生成结构化病例、执行病例检索,节约医师输入病历的时间,解决方案室一般包括ASR/NLU技术和专用医疗麦克风。在导诊机器人、问诊小程序、诊后随访系统、住院病房管理系统、临床决策支持系统(CDSS)中也有应用。

在落地过程中,需要重视针对医疗专业术语和各科室专有名词/符号/用药等知识进行模型训练和优化,建立筛选机制以过滤问诊无关信息,并进一步增强病例整理的语义标准化与深度结构化能力,以使系统便捷提取病例主症状、伴随症状、用药等重要特征信息。而智能语音这些领域的应用和突破在当前常态化的疫情防控以及新冠肺炎疑似患者的检测和确诊病例的治疗过程中都可以提供全新的支撑。

2.2智能语音与公检法

智能语音在公检法领域的应用主要是帮助公检法系统实现便捷办公和战法突破,主要由六个部分组成:

(3)虚拟法官,通过语音合成和虚拟形象生成,在互联网诉讼平台上,以虚拟AI形象同当事人进行初步沟通,协助真人法官完成线上诉讼接待等重复性的基础工作。

(4)声纹研判战法,声纹鉴定与语音分析系统能够进行语音片段检索、语音自动检测分离和声纹模拟画像,可协助鉴定人员自动在音频数据中检索出特定的音素及相似的音素,进行语音自动比对,快速确定犯罪嫌疑人身份。

(5)智能接警,由窗口报警自助录入和电话警情自动记录组成。

(6)警务语音语言服务,针对公安领域专业词汇做专门优化,提供警用语言输入法和机器翻译等服务。

2.3智能语音与教育

智能语音与教育应用于教、管、测、考等环节。智能教育领域,Al课堂的建设进入快车道,既解决家校之间、线上线下之间学习资源互通的问题,还通过多模态识别收集课堂学情信息并做数据精准分析。

另一方面,在线教育竞争呈白热化态势,用技术解决教育资源的复用、增加学习交互体验感等诉求也促进了智能语音技术在线上口语测评、虚拟教师等领域的应用。考试赛道方面,北京、上海、江苏和广东等省市近年推行在新中考、新高考英语考试中以机考形式进行口语测试,因此人机对话技术和智能语音评测技术开始应用于考试场景,以提升口语考试的效率。

2.4智能语音与互联网内容审核监管

特定声音检测和语音识别技术帮助净化网络环境。互联网的变迁使音视频内容的传播得以快速发展。粗略估计娱乐社交类App背后产生的音视频内容时长接近每月4700万小时,这一数字如果用年来表示,相当于5400年,显然通过人工审核音视频的方式净化网络环境是不可能实现的,而如果依靠举报再人工审核的方式也只如沧海一粟、大量问题语音将被漏查。

目前除使用图像识别技术审核图片和视频外,通过特定声音检测和语音识别技术赋能实时语音流及音频文件的内容审核,弥补之前针对互联网语音内容的审核空白,提高审核效率与准确度。

2.5智能语音与泛传媒

增加媒体产能,丰富传播形式。智能语音在泛传媒领域的应用主要包括合成主播自动播发稿件,将外语音视频新闻或节目自动翻译、根据画面同步匹配字幕,及为新闻稿件文字自动合成语音等。

以自动播发稿件为例,2019年全国两会期间,新华社AI合成主播共播发稿件236条,为资讯内容的生产提供了新的方式;而音频与文字之间的转换则丰富了媒体的传播形式,使用户能够按需、按喜好获取资讯服务。

03

市场参与者的应用

3.1代表性企业案例——科大讯飞

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。

目前科大讯飞的人工智能产业生态已经形成三个同心圆:

第一层是核心层。围绕“讯飞超脑”,科大讯飞的教育BG、智慧城市BG、消费者BG、智慧政法BG、智慧医疗BU、智能服务BU、智能汽车BU、运营商BU、工业智能业务部等共同构筑科大讯飞人工智能产业生态的核心层。第二层是探索层。在探索性方向,科大讯飞鼓励内部实施创业机制和战略合作机制,通过资本纽带的形式推动人工智能产业化。

第三层是开发层。围绕人工智能核心开发平台,科大讯飞为创新创业者提供技术和数据支持,帮助创新创业者在各应用领域进行业务创新探索,将自身源头核心技术提供给平台伙伴,推动整个产业生态构建。

第三层是开发层。围绕人工智能核心开发平台,科大讯飞为创新创业者提供技术和数据支持,帮助创新创业者在各应用领域进行业务创新探索,将自身源头核心技术提供给平台伙伴,推动整个产业生态构建。

截至2019年12月31日,讯飞开放平台已聚集超过112W开发者团队,总应用数超过73W,累计覆盖终端用户数26.3亿+,A.I.大学学员总量达到33.3W+,以科大讯飞为中心的人工智能产业生态持续构建。

3.2代表性企业案例——依图科技

依图科技创立于2012年,是人工智能独角兽公司,担纲科技部“视觉计算国家新一代人工智能开放创新平台”。依图的愿景是参与人工智能领域的基础性科学研究,全面解决机器看、听、理解的根本问题,建设更加安全、健康、便利的世界。因此,除已取得重大成就的计算机视觉领域之外,依图在语音识别与自然语言理解领域也厚积薄发。

2018年底公司首次对外公布语音识别能力,甫一公布便取得亮眼成绩,语音识别算法大幅刷新全球最大开源中文数据库AlSHELL-2上的字错率记录,字错率仅3.71%,比过去领先水平还进一步提升约20%;2019年依图NLP成果荣登《NatureMedicine》,这是该期刊全球首次刊发中文NLP在临床智能诊断的研究成果;2019年荣获国际权威声纹识别竞赛VoxSRC冠军,并首次将等错误率(EER)记录刷新至1%以内;2019年,在由网信办、工信部及公安部三部委指导的首届中国人工智能多媒体信息识别竞赛中,依图于11个任务中斩获10个A级,为所有参赛者中最多,其中包含语种相关关键词和声纹识别两项。

4

中国智能语音行业的保障

根据上文对我国智能语音行业的分析,可以发现我国智能语音行业市场发展速度快、潜力大,目前已存在以科大讯飞为代表的智能语音上市公司,并且智能语音技术在教育、医疗、公检等领域已经得到应用。

智能语音的良好发展不仅得益于我国人口红利形成的巨大需求和市场,还得益于我国以科技企业代表对人工智能和智能语音行业的持续投入和深耕,也与我国政策、方针等的大力支持是密不可分的,这些因素是我国智能语音行业发展的重要基石和保障。

01

中国智能语音行业的政策支持力度大

我国高度重视智能语音技术进步与行业发展,智能语音已上升为国家战略。为了在新一轮国际科技竞争中掌握主导权,我国加快人工智能和智能语音行业的布局与规划。

2017年,工业和信息化部出台的《促进新一代人工智能产业发展三年行动计划(2018-2020年)》;

2018年,国务院办公厅出台的《关于促进“互联网+医疗健康”发展的意见》;

2019年,最高人民法院出台的《最高人民法院关于深化人民法院司法体制综合配套改革的意见》;

2020年,教育部、国家发展改革委、财政部联合出台的《关于”双一流”建设高校促进学科融合,加快人工智能领域研究生培养的若干意见》等重要文件中都明确提出了加快智能语音技术在医疗、公检等领域的应用以及智能语音的学科建设和人才培养,进一步促进我国人工智能和智能语音行业发展。

此外,中国已有逾20个省市出台了人工智能产业鼓励政策,其中江苏、上海、广东、北京、浙江是国家大力发展人工智能的热点区域。在国家政策以及地方配套政策的推动下,人工智能、智能语音等领域产业链初具规模,与产业下游应用领域的结合不断深入,推动经济社会各领域从数字化、网络化向智能化加速提升。

02

中国智能语音技术的支撑

03

中国智能语音行业的市场需求大

随着我国经济的高质量增长以及基于我国巨大的人口红利,我国智能语音行业市场需求大、增长快。2014年我国智能语音行业市场规模仅有28.7亿元,到2018年,智能语音市场规模增长至157.9亿元,年复合增长率为53.2%,并根据历史数据预测,到2023年,智能语音行业市场规模将达到655.1亿元,2018-2023年的年复合增长率为32.9%。

5

中国智能语音行业的制约因素

01

行业基础层技术存在短板

目前,中国智能语音行业基础层的核心关键技术积累较薄弱,算法、芯片及基础元器件的原创科技实力与国外企业相差较大。智能语音行业基础层核心技术实力欠缺,如芯片,传感器等核心元器件,不仅影响行业原创科技成果的输出,并且核心技术或生产环节长期依赖国外,不利于中国智能语音企业建立国际竞争优势。

智能语音芯片等核心基础元器件从投入到规模化生产的周期较长,在产品研发至生产期间所需资金投入较大且回报周期长,致力于基础层核心)元器件研发的企业需面临较大的资金压力。

近年来,智能语音行业较好的发展前景吸引资本涌入,中国国内资本持续加码智能语音领域,但资本多集中在智能语音行业的应用层,在回报周期较长的基础层领域缺乏布局。智能语音基础层核心元器件的技术瓶颈导致企业的国际竞争力不足。中国近90%的芯片需依靠进口,行业对于进口芯片等基础元器件的进口依赖,消耗了大量的外汇储备,导致智能语音产品的生产成本居高不下,压缩行业的获利空间,制约智能语音行业的发展。

02

03

自然语言处理技术尚不成熟

6

中国智能语音行业的未来展望

01

行业将大力发展深度集成语音Al芯

深度集成语音Al芯片拥有较大的数据存储空间,无需将语音语料上传至云端进行计算,保护信息安全性。深度集成语音Al芯片降低了设备的数据运算量及功耗,在节约设备运行成本的同时,提高智能语音处理速度,提升消费者的用户体验。

02

行业将构建智能语音专利池

目前,中国智能语音行业进入快速成长期,语音技术在各下游场景的商业化应用日益广泛,推动智能语音产业分工的细化以及科学技术的密集化。

落地的智能语音产品会涉及众多专利技术,且分属于不同所有者,众多的专利请求、复杂的专利授权、以及高额的专利侵权赔偿等问题将阻碍智能语音新技术的实践运用。

因此,中国智能语音行业有望建立智能语音专利池,引导和促进智能语音技术跨行业的实施和应用,推动语音相关产业的发展,智能语音专利池的建立可以有效降低交易成本,消除专利实施中的授权障碍,减少企业间的专利纠纷、有利于专利技术的推广应用。

专利权人可以向智能语音专利池贡献自己的核心专利,同时享有免费使用其他专利人专利的权利,免去了专利权相互交叉许可的交易成本。

专利的有效管理消除了专利实施中重复授权的障碍,有效降低了专利许可中的交易成本,满足行业需求的同时,提高社会经济效益。构建智能语音专利池可以促进专利权人的相互合作,形成专利权人的利益联盟,使其共同开发研究智能语音产业的新型技术,保持智能语音专利池的先进性,实现利益最大化。此外,智能语音专利池的建立将提高我国智能语音企业的国际竞争力,实现优势互补。

03

人工智能融入企业战略

在《MIT斯隆管理评论》(MITSloanManagementReview)和波士顿咨询公司(BCG)联合开展的2019年人工智能全球企业高管调研与研究的主要发现中,90%的受访者认为人工智能可以为他们的企业带来商机。

此外,越来越多的领导者认为,人工智能不仅是机遇,也是战略风险。因此,让人工智能融入战略,充分利用人工智能赋能战略,也是管理者需要考虑的问题。如果人工智能计划不是企业商业战略的核心,它们就不太可能创造出重要的价值和规模。如果企业当前的商业战略忽视了人工智能的风险或机遇,那么很可能需要对战略进行重新审视。

【参考文献:】

[1]朱家泉,付晶晶.智能语音助运营商智慧家庭业务落地[J].中国电信业,2021(05):78-80.

[2]李国光.智能语音在数字出版领域的应用探析[J].科技传播,2021,13(08):31-33.

[3]刘丽.基于智能语音的人机交互在智慧交通服务中的应用[J].中国交通信息化,2021(04):129-131.

[4]罗建勋.智能语音转写平台的应用[J].现代电视技术,2021(04):143-146.

[5]孙楚音,黄孟祺,唐德鹏,魏书杰.中国智能语音产业的发展潜力研究[J].科技经济导刊,2020,28(02):185+184.

[6]任智.浅析中国智能语音产业的发展潜力[J].广西质量监督导报,2019(08):93-94.

作者:石云;CC-CMM标准组织研发总监;

本文分为下上两篇刊载于《客户世界》2021年9月刊,10月刊。

◆关于我们返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇