2023年中国人工智能基础层行业研究报告
2021年中国人工智能基础层行业研究报告原创艾瑞艾瑞咨询
核心摘要:
算力、算法、数据是人工智能产业发展的三大要素。基于此,艾瑞定义人工智能基础层是支撑AI应用模型开发及落地的必要资源,主要包括智能计算集群、智能模型敏捷开发工具、数据基础服务与治理平台三大模块。发展人工智能基础层可多环节提效AI技术价值的释放,解决需求方人工智能生产力稀缺问题,且依托AI基础层资源,AI企业可有效应对下游客户的长尾应用需求,将其高频应用转化为新主营业务,寻找业务增长突破点。此外,基础层工具属性标志着AI产业社会化分工的出现,AI产业正逐步进入各产业深度参与、双向共建的效率化生产阶段。据艾瑞测算,2020年人工智能基础层市场规模为497亿元,为AI产业总规模的33%,AI芯片的高增长是产业规模增长的主要拉动力。未来,伴随各行业智能化转型的迫切需求,艾瑞认为人工智能基础层的各模块工具有望走向集约型的生产模式,更多企业将自研开源框架,国产的操作系统与数据库等软件配套设施将稳步崛起,算力模块的智能服务器国产化率也将逐步提升。
人工智能基础层定义
支撑各类人工智能应用开发与运行的资源和平台
算力、算法、数据是人工智能产业发展的三大要素。据此,人工智能基础层主要包括智能计算集群、智能模型敏捷开发工具、数据基础服务与治理平台三个模块。智能计算集群提供支撑AI模型开发、训练或推理的算力资源,包括系统级AI芯片和异构智能计算服务器,以及下游的人工智能计算中心等;智能模型敏捷开发工具模块主要实现AI应用模型的生产,包括开源算法框架,提供语音、图像等AI技术能力调用的AI开放平台和AI应用模型效率化生产平台;数据基础服务与治理平台模块则实现AI应用所需的数据资源生产与治理,提供AI基础数据服务及面向AI的数据治理平台。AI基础层企业通过提供AI算力、开发工具或数据资源助力人工智能应用在各行业领域、各应用场景落地,支撑人工智能产业健康稳定发展。
人工智能基础层价值
AI基础层是支撑AI应用模型开发及落地的必要资源
开发一项人工智能模型并上线应用大致需经历从业务理解、数据采标及处理、模型训练与测试到运维监控等一系列流程。过程中需要大量的AI算力、高质量数据源、AI应用算法研发及AI技术人员的支持,但大部分中小企业用户并不具备在“算力、数据、算法”三维度从0到1部署的能力,而财力雄厚的大型企业亦需高性价比的AI开发部署方案。依靠AI基础层资源,需求企业可降低资源浪费情况、规避试错成本、提高部署应用速度。作为支撑AI模型开发及落地的必要资源,AI基础层可在多环节提效AI技术价值的释放;其工具属性也标志着AI产业社会化分工的出现,AI产业正逐步进入低技术门槛、低部署成本、各产业深度参与双向共建的效率化生产阶段。
人工智能基础层进阶之路
粗放式单点工具向集约型、精细化资源演进
智能化转型趋势下,企业部署AI项目的需求正经历着变化,对数据质量、模型生产周期、模型自学习水平、模型可解释性、云边端多样部署方式、人力成本及资金投入、投资回报率等的要求都逐步走高。在上述需求特点及自动机器学习、AI芯片硬件架构等技术发展的共同推动下,AI基础层资源的整体效能水平也在不断进化,以有效降低需求企业的AI开发成本。大致涵盖相互交融的三个阶段:雏形期,算法/算力/数据各模块多为粗放式的单点工具,新兴产品及赛道逐步出现;快速发展期,各赛道活跃度显著提升,参与者积极探索产品形态与商业模式,基础层服务体系逐步完善、资源价值凸显;最后则向成熟阶段过渡,各赛道内企业竞争加剧,逐步跑出头部企业。同时各赛道间企业生态合作增多,一站式工具平台出现。
基础层初步成型是AI产业链成熟的标志
基础层资源促进AI产业链各环节价值传导顺畅、分工明确
现阶段,已初步成型的AI基础层资源可有效缓解下游行业用户逐渐增长的、从感知到认知多类型的AI应用模型开发及部署需求。细看基础层内部,一方面,数据资源、算力资源和算法开发资源三者之间的分工更为明确和有序。数据基础服务及治理平台企业为AI产业链供应数据生产资料;智能计算集群产出高质效的生产力;智能模型敏捷开发工具则负责模型开发及模型训练等,输出AI技术服务能力,提高AI应用模型在各行业的渗透速率与价值空间。另一方面,基础层厂商的数量保持增长、厂商业务范围持续扩大,可提供专业定制化或一站式的基础资源服务。由此,基础层完成AI工业化生产准备,通过直接供应和间接供应的形式,将基础层资源传送到下游的AI应用需求端,产业链向顺畅的资源输送及价值传导方向演进。
AI基础层解决人工智能生产力稀缺问题
基础层资源缓解甲方在对待人工智能投资上的“矛盾”
根据艾瑞2020年执行的CTO调研,2019年超过51%的样本企业AI相关研发费用占总研发费用比重在10%以上,2020年65.9%的企业AI研发占比达到10%以上。一方面是甲方企业不断增长的对智能化转型的强劲需求,一方面则是在AI应用开发与部署过程中企业普遍面临的数据质量(49%)、技术人才(51%)等基础资源配置难点。且目前只有少数企业可以完成AI项目实施前设定的全部投资回报率(ROI)标准,因此甲方企业在投资AI项目时相对审慎。AI基础层资源则可有效缓解甲方利用AI技术重塑自身业务时的投资矛盾,提升模型生产效率,降低部署成本:数据资源集群具备数据采标与数据治理能力,且一站式的数据平台可对实时数据进行统一管理,提高数据利用率;高效的AI算力集群与调度系统可满足模型训练与推理需求,降低总拥有成本(TCO,TotalCostofOwnership);基于算法开发平台演化出的语音识别、计算机视觉、机器学习等专业的AI模型生产平台,可提供高效、一站式的AI模型生产服务。
人工智能基础层产业图谱
人工智能基础层市场规模
AI企业业务突破、智能化转型趋势等多因素驱动产业规模增长
AI企业突破业务增长瓶颈的需求是人工智能基础层发展的驱动力之一。当前人工智能核心产业规模保持线性增长态势,且增速趋于平稳与常态化。为寻求产值增长突破点,AI企业发力探索开拓市场的有效手段。依托人工智能基础层资源建设,AI企业可有效应对下游客户的长尾应用需求,再将高频应用转化为新主营业务。此外“新基建”、半导体自主可控等相关政策扶持、传统行业智能化转型等因素也都在助推人工智能基础层资源的发展。据艾瑞测算,2021-2025年,人工智能基础层市场规模CAGR为38%,整体产业规模发展速度较快、空间较为广阔,总体呈现持续增长的走势。2020年,中国人工智能基础层市场规模为497亿元,为人工智能产业总规模的33%,市场规模相较去年同比增长76%,AI应用模型效率化生产平台创收增长、AI芯片市场规模随着云端训练需求出现较高增长等是同比增速的主要拉动力;2021-2024年同比增速趋于平缓下降,市场开始恢复稳步增长态势。到2025年,中国人工智能基础层市场规模将达到2475亿元,云端推理与端侧推理芯片市场持续走高使得人工智能基础层整体市场同比增速稍有抬升。
算力:超算/数据中心的存量与增量判断
从算力需求与节能减排规定看存量替换与增量增长
现有的超算/数据中心以建设单位为标准,可分为两类:1)以国家或地方为建设单位的G端超算中心,服务对象主要为国家牵头的重点科研单位、高校研究院等,此类超算中心是解决国家安全、科学进步、经济发展与国防建设等重大挑战性问题的重要手段,近两年受国家与地方的高度重视与扶持,建设与升级超算中心的趋势愈加明朗。但由于数据网络安全与计算精度要求高,建设周期较长,此类超算中心的数量在中短期内增长缓慢,长期来看则会成为替换存量与增量增长的贡献主力之一。2)以智能云厂商或IDC服务商为建设供应主体的B端超算/数据中心,为互联网公司、其他类型的企业或事业单位提供主机托管、资源出租、增值或应用服务,是存量与增量市场变化主要推力。
从市场变化趋势来看:1)存量市场:日渐增加的AI计算负载需要处理力更强、能耗承受度更大的数据中心,同时,一系列有关控制数据中心PUE值的节能审查规定相继出台,一味盲目扩建、新建数据中心已难合时宜,促进老旧数据中心绿色化改造的减量替代方案因此诞生。微型、中小型数据中心会逐渐被改造为集约型的大型数据中心,符合节能减排相关标准、机柜数量与异构组合增多的集约型超算/数据中心将在存量市场中占据主流。2)增量市场:考虑到边缘计算可分担AI计算任务、兼具低延时优势,管理边缘计算中心则需要布局相应的大型云端数据中心,故增量市场会被异构的边缘计算数据中心与云端超算或大型数据中心扩充。
算力:云化AI算力
开放共享虚拟AI算力资源,实现AI模型海量训练与推理
AI是一种高资源消耗、强计算的技术,AI算力的强弱直接关联到AI模型训练的精度与实时推理的结果。若企业独立部署AI算力,不仅需要建设或租用机房这类重资产与网络宽带资源,还需要购置物理机、内存、硬盘等硬件设备,而且购置设备存在采购周期不确定、硬件资源过度铺张、专业管理团队缺乏等问题。所以,独立部署AI算力资源是一项耗时耗力的工作。将AI算力云化是一种高效能、低成本的有力解决方案。具备先天性业务优势的云服务商搭建数据中心,先将AI服务器算力资源虚拟化,开放给AI模型开发者,做到按需分配,如给短视频业务的开发者优先配备CPU+GPU方案,而后对算力资源的调度工作进行统一管理。由此,“物美价廉”的算力有序注入各行各业的AI模型中,减轻了井喷式数据爆发所带来的模型训练负担,并能及时根据用户使用情况弹性扩充或缩减虚拟算力资源空间,达到方便、灵活、降本增效的效果。
算力:端-边-云的算力协同
端-边-云实现AI算力泛在,加速AI模型训练与推理
在人工智能与5G等技术的冲击下,设备端产生大量实时数据,若直接上传到云端处理,会对云端的带宽、算力、存储空间等造成巨大压力,同时也存在延时长、数据传输安全性等问题。因此,为缓解云端的工作负载,云计算在云与端之间新增了若干个边缘计算节点,从而衍生出端-边-云的资源、数据与算力协同。在算力协同的业务模式下,靠近云端的云计算中心承担更多的模型训练任务,贴近端侧的各设备主要进行模型推理,而二者之间的边缘侧则负责通用模型的转移学习,帮助云端分散通用模型训练任务、处理实时计算的同时,也解决了终端算力不足、计算功耗大的难题。未来,边缘计算的发展会催生出更适宜边缘计算场景的算力集群异构设计,其异构化程度将会高于传统的数据中心,异构设计的突破将会进一步提高端-边-云的整体计算效能,进而加速AI模型的训练与推理。
算力:AI芯片市场规模
当前以训练需求为主,推理需求将成为未来市场主要增长动力
AI芯片是人工智能产业的关键硬件,也是AI加速服务器中用于AI训练与推理的核心计算硬件,被广泛应用于人工智能、云计算、数据中心、边缘计算、移动终端等领域。当前,我国的AI芯片行业仍处于起步期,市场空间有待探索与开拓。据艾瑞统计与预测,2020年我国AI芯片市场规模为197亿元,到2025年,我国AI芯片市场规模将达到1385亿元,2021-2025年的相关CAGR=47%,市场整体增速较快。从AI芯片的计算功能来看,一开始,因AI应用模型首先要在云端经过训练、调优与测试,计算的数据量与执行的任务量数以万计,故云端训练需求是AI芯片市场的主流需求。而在后期,训练好的AI应用模型转移到端侧,结合实时数据进行推理运算、释放AI功能,推理需求逐渐取代训练需求,带动推理芯片市场崛起。2025年,云端推理与端侧推理成为市场规模增长的主要拉动力,提升了逐渐下滑的AI芯片市场规模同比增速。
算法:智能模型敏捷开发工具商业价值分析
API规模经济+AI应用模型效率化生产平台的杠杆增效
智能模型敏捷开发工具的出现与驱动AI业务的外因以及企业自身的内因紧密相关。从外因看,规模化多场景的业务不断衍生出长尾需求,原有的应用需及时更新;从内因看,囿于开发企业有限的经营成本与AI技术人才,其资源主要投放到现阶段的主营业务,现有人员难以推动业务的智能化改造。对此,可有效解决AI应用模型设计与开发过程中通用或特有问题的智能模型敏捷开发工具逐步成为备选方案。AI开放平台与AI应用模型效率化生产平台作为其中的代表性工具,不仅能减少由0到1的开发成本,而且可降低人工智能市场的参与门槛,提升开发效果。AI开放平台属于API资源的一种,其可帮助技术领先企业开放AI能力与先进资源,从而延伸价值链,形成规模经济与长尾经济,利用开发者的创新应用来反哺开放平台。AI应用模型效率化生产平台可提供较为前沿的技术、经济合理的模型生产经验以及为实现敏捷开发而打包的数据、算力与算法资源。具体而言,其采用自动机器学习技术,很大程度上降低了机器学习的编程工作量、节约了AI开发时间、减轻了对专业数据科学家与算法工程师的依赖,让缺乏机器学习经验的开发者用上AI,加快开发效率。
算法:智能模型敏捷开发工具增长模型
API与定制方案共拓产业广度与深度,AI柔性生产贴近需求
在人工智能产业发展的过程中,智能模型敏捷开发工具可持续拓宽与深挖AI业务的广度和深度。从广度讲,AI开放平台形成平台效应,调用平台API的开发者聚集创新,针对不同业务场景的开发成果数量逐渐增多,提高了技术产品的利用率,打造出轻量化的输出模式、降低单位开发成本,并且构建出动态更新的服务池;与此同时,一站式AI应用模型效率化生产平台逐步填充因场景多元化而衍生出的长尾业务模型,丰富模型供应市场的种类与数量。从深度讲,二者均从业务前端发掘潜在或外显的市场需求,针对刚需应用与高价值环节延伸出多条增量建设与运行需求业务线,瞄准市场风口的同时,敏捷、经济地消化个性化或碎片化需求,根据需求柔性匹配生产。
算法:AI技术开放平台市场规模
产业受API经济带动,主要收入贡献来源为计算机视觉类
随着数据量与AI算力的提升,可落地的场景与算法的交互变得愈加频繁,二者结合开发出的AI应用模型就需要更大量地通过API调用AI技术开放平台的AI技术能力。据艾瑞统计与预测,2020年我国AI技术开放平台市场规模为225亿元,到2025年,相应规模可达到730亿元,2021-2025年的相关CAGR=26%。受API经济兴起的影响,2020年市场规模同比增速走高较快,2021年下滑后恢复平稳态势。按AI技术能力划分,计算机视觉类与语音技术类收入占比达72.2%,是收入的主要贡献来源。人脸识别、人体识别、OCR文字识别、图像识别等构成了计算机视觉类业务的主要技术能力,且计算机视觉类的技术价格相较于其他技术而言更高,应用领域也更为广泛。现阶段的市场集中度相对分散,未来,能持续投入成本、研发出强劲算法的厂商有望占领更多的市场份额,市场集中度亦会因此提升。
算法:AI应用模型效率化生产平台市场规模
集成式的模型开发工具包,产业恰逢伊始,前景有待开拓
AI应用模型效率化生产平台是全栈式的、可实现流水线开发的AI应用模型生产工具。假若每次开发模型都需要算法工程师单独完成从生产到上线的全流程搭建,就会导致很多时间的耗损与AI模型开发成本的浪费。集成了数据、算法与算力的相应开发工具的模型开发工具包——AI应用模型效率化生产平台应运而生。据艾瑞统计与预测,2020年我国AI应用模型效率化生产平台市场规模为23亿元;到2025年,相应规模可达到204亿元,2021-2025年的相关CAGR=49%。2020年,AI应用模型效率化生产平台相关业务拓展相对较快、产品恰逢创收伊始阶段,故同比增速增幅较快。与此同时,因参与技术门槛偏高,具备能力的厂商较少,市场尚未形成稳定状态,市场集中度偏高。
数据:人工智能数据基础服务定义
以AI训练与调优为目的提供的数据采集、标注与质检等服务
人工智能基础数据服务是指为各业务场景中的AI算法训练与调优而提供的数据库设计、数据采集、数据清洗、数据标注与数据质检服务。整个基础数据服务流程围绕着客户需求而展开,最终产出产品以数据集与数据资源定制服务为主,为AI模型训练提供可靠、可用的数据。数据采集、数据标注与数据质检是较为重要的三个环节。数据采集是数据挖掘的基础,提供多源的一手数据和二手数据;数据标注对数据进行归类与标记,为待标注数据增加标签,生产满足机器学习训练要求的机器可读数据编码。数据质检为数据的客观性和准确性设置检验标准,从而为AI算法的性能提供保障。AI基础数据服务商可着重在以上三个环节建立壁垒,以巩固行业地位。
数据:AI基础数据服务市场规模
行业规模稳步向前,图像、语音类内容继续向新兴场景开拓
高质量的数据是提高AI应用模型训练速度与精度的必要准备之一,而行之有效的AI基础数据服务又为提高数据质量奠定了坚实的基础。因而,提供通用化、精细化、场景化的AI基础数据服务才能满足日渐增长的AI应用模型训练需求。据艾瑞统计与预测,2020年我国AI基础数据服务市场规模(含数据采集与标注)为37亿元,到2025年,相应规模可达到107亿元,2021-2025年的相关CAGR=25%,整体增速呈现稳步提升的趋势。从市场细分收入结构来看,图像类与语音类收入占总收入规模的88.8%,是业务的主要构成部分;图像类与语音类收入基本持平,图像类业务以智能驾驶与安防为主,而语音类业务以中英大语种、中国本土方言以及外国小语种为主。目前,行业中也相应地分成了以图像类或语音类为主的供应商阵营,各类供应商将会继续立足于主营业务,深挖现有应用场景的业务细分需求,从而带动未来收入的增长。
数据:面向人工智能的数据治理定义
产生于业务,围绕于AI,追溯于治理
在大数据时代背景下,金融、零售、公安、工业等不同行业的业务场景衍生出诸多应用,多元的AI模型开发需求因此产生。AI模型开发的原材料是数据,但在挖掘模型数据时,往往面临模型与数据无法拉齐的问题,所以需要溯源到前置环节,从一开始就把数据治理的工作做好,面向AI的数据治理这一概念也就由此出现。面向AI的数据治理是指,以具体业务产生的AI模型开发与训练为目的,使用各个数据组件与人工智能技术,对数据进行针对性与持续性的诊治与管理。相比于传统的数据治理,其更新了数据接入、数据汇聚、数据分析的功能,并新增了AI模型开发与应用组件,以应对海量实时数据迸发、模型需及时对接数据等情形。面向AI的数据治理的特点在于,其对接企业现有的数据、积累新的AI数据而非重新进行AI数据的数据库建设,而且提供针对实时数据的处理办法、优先解决业务落地的困难,并持续挖掘具体业务的数据资产价值。
数据:面向AI业务的数据积累与治理模型
锚准方向,双轮驱动为智能化转型速度与质量赋能
在大数据应用的驱动下,具有相当数据规模的企业的多条业务条线往往会产生大量的结构化与非结构化数据,愈加需要企业内部的数据及时融通,但企业不可能完全抛弃现有的数据库系统、更换一套完全符合面向AI业务开发的数据治理系统;另一方面,智能化转型浪潮推动着企业的AI应用开发需求增长,但数据开发缺少统一标准、数据与业务场景割裂,让面向AI的数据治理的工作面临两难的局面。对此,艾瑞认为面向AI的数据治理并非完全舍弃已有的数据治理结构,而是在原有的基础上,进行数据治理结构的改造,让治理工作更多为AI开发服务,从而完成AI业务数据的积累。面向AI的数据治理工作完成后,才能驱动AI应用模型开发高效、高质运行,而模型开发反过来会为面向AI的数据治理工作提供指导。业务系统与数据系统像两个锚准工作方向的齿轮,共同滚动。符合业务场景需求的AI应用模型、MLKGNLP等AI技术加速促进两个齿轮的转动,使企业的业务系统运转效率向高质高效发展,为企业带来更可观的智能化转型业务发展速度与业务服务质量。
数据:面向AI的数据治理市场规模
存在数据中台带来的业务冲击,后期恢复稳步爬坡态势
在数字化转型与智能化转型的大趋势下,数据治理工作一般伴随着数据中台的搭建以及AI应用模型的开发而展开。数据治理属于数据中台的构成组件,数据治理的工作与服务则属于数据中台建设、运营与维护中不可缺少的环节。与此同时,以AI应用模型所需的数据标准去治理数据,结合AI技术提升数据的可用度与模型的训练效率,才能够更好更快地为人工智能业务前端服务,改善供应商的业务流程与消费者的消费体验。据艾瑞统计与预测,2020年我国面向AI的数据治理市场规模为14亿元,到2025年,相应规模可达到50亿元,2021-2025年的相关CAGR=28%。2018年,数据中台概念兴起,其规模在2020年处于爆发点,而数据治理作为数据中台的组件,也于同期迎来增长爆发点,从而带动面向AI的数据治理。2020年后,数据中台市场规模增速开始降温,数据治理也随之回落,面向AI的应用模型开发业务在该过程中的带动作用有限,故2021年的业务同比增速出现拐点。后期,面向AI的应用模型开发业务的带动效应逐步凸显,规模增速呈现稳步爬坡态势。
一站式基础层资源平台
泛在需求下AI模型生产模式的变迁与资源集成
在人工智能由技术落地应用阶段向效率化生产阶段转变的背景下,艾瑞认为人工智能基础层的各模块工具有望走向集约型的生产模式。该模式主要能赋予开发企业以下价值:1)开发方式改进:从客户需求分析到解决方案部署形成独立的闭环,构建端到端的工作流。在强大算力的支持下,完成数据采集、数据标注、数据治理、数据应用、模型设计、参数调优、模型训练、模型测试、模型推理的全栈式流水线生产。2)管理效率提升:将数据、算法与算力委托给专业的服务商,实现一站式托管,打通三者之间的衔接壁垒,提高交互友好性,让开发者专注于业务。3)部署成本降低:集成数据、算法、算力的各个软件与硬件,企业可在一个平台内按需选择自己所缺失的模块组件并自由搭配,有效避免因采购不同供应商的产品或服务而带来的隐性成本损失与显性成本损失。
基础层全栈自主可控展望
自主可控稳步向前,内外兼修
信创产业涉及到核心技术问题,受到国家的大力扶持。比如,2020年12月,财政部、发改委、工信部等部门就联合发布了《关于促进集成电路产业和软件产业高质量发展企业所得税政策的公告》,文中明确指出:国家鼓励的集成电路线宽小于130纳米(含),且经营期在10年以上的集成电路生产企业或项目,第一年至第二年免征企业所得税,可见国家对国产芯片的重视。在信创产业稳步推广的的趋势下,人工智能基础层的各模块也在逐个突破“卡脖子”的关键点,朝着全栈国产化的方向迈进。算法模块相对其他两个模块而言,因开源框架协助,算法开发相对容易,但依然面临开源框架商用版限制的潜在风险,同时,使用开源框架难以友好对接到AI企业的业务逻辑,基于这两点,部分企业已开始自研开源框架并取得一定成效;数据模块的各类操作系统与应用软件在较大程度上仍以国外企业为主导,而国产的操作系统与数据库等软件配套设施正在稳步崛起,已存在相应的产品与服务可供客户选择;算力模块的智能服务器的国产化率逐步提升,AI芯片虽然仍以英伟达的GPU为主导,但国内部分企业开始自研AI芯片,产生了一批针对通用GPU、ASIC与FPGA的先行玩家。总的来说,基础层全栈的自主可控建设还处在萌芽阶段,未来将在“可用”的建设要求上打好根基,向“好用”的状态演变,并且从以政府政策引导为主的局面向以企业产品自由竞争的局面转变。
原标题:《2021年中国人工智能基础层行业研究报告》
阅读原文
人工智能三要素:数据、算力、算法 人工智能产业链包括基础层、技术层和应用层。其中,基础层是人工智能产业的基 础,主要是包括 AI 芯片等硬件设施及云计算等
来源:雪球App,作者:奕棋者,(https://xueqiu.com/1049599620/246478070)
人工智能产业链包括基础层、技术层和应用层。其中,基础层是人工智能产业的基础,主要是包括AI芯片等硬件设施及云计算等服务平台的基础设施、数据资源,为人工智能提供数据服务和算力支撑;技术层是人工智能产业的核心,以模拟人的智能相关特征为出发点,构建技术路径;应用层是人工智能产业的延伸,集成一类或多类人工智能基础应用技术,面向特定应用场景需求而形成软硬件产品或解决方案。
数据、算力、算法是人工智能三要素。人工智能模型的应用分为训练、推理两大环节。我们认为,数据与算力是模型训练的基础,算法是模型实现路径,近年人工智能的快速发展得益于三大要素共同进步。
数据:人工智能“燃料”,全球数据量指数级增长。深度学习算法是推动人工智能技术突破性发展的关键技术理论,大量训练数据的训练支撑是深度学习算法的基础。训练数据越多、越完整、质量越高,模型推断的结论越可靠。根据DimensionalResearch的全球调研报告,72%的受访者认为至少使用超过10万条训练数据进行模型训练,才能保证模型的有效性和可靠性。根据中国信通院数据,到2035年,全球数据量将达2142ZB,是2020年数据量的45-46倍。数据量的指数级增长有望为人工智能产业发展提供“燃料”。
算力:人工智能“底座”,AI芯片是核心。人工智能模型的训练依赖大量算力支持,海量算力是大规模训练及生产人工智能模型的前提。数据海量增加,算法模型愈加复杂,应用场景的深入和发展,带来了对算力需求的快速提升。根据《2022-2023中国人工智能计算力发展评估报告》,2021年中国智能算力规模达155.2每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模将达到268.0EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS,2021-2026年期间年复合增长率达52.3%,而同期通用算力规模年复合增长率为18.5%。AI芯片专门用于处理人工智能相关的计算任务,其架构针对人工智能算法和应用进行专门优化,具有高效处理大量结构化和非结构化数据的特征。AI芯片类型包括GPU、NPU、ASIC、FPGA等,其中GPU是主要的人工智能加速芯片,根据《2022-2023中国人工智能计算力发展评估报告》,2021年GPU占据中国AI芯片约89%的份额。
算法:人工智能“发动机”,深度学习是主流方向。2006年深度学习算法的提出使AI进入新发展阶段,其通过卷积的方式,取代了机器学习中特征提取环节。我们认为,近年AI应用的繁荣来源于AI算法持续突破创新,而且是在大数据、大算力的支持下发挥出较大的威力。深度学习典型算法包括卷积神经网络(CNN)、递归神经网络(RNN)、前馈神经网络(FNN)、生成对抗网络(GAN)等。2017年谷歌提出Transformer算法,此后Transformer广泛应于自然语言处理,并逐步在计算机视觉等领域应用,OpenAI最近发布的ChatGPT也是以此为基础构建。
巨头坚定投入,开启AI新浪潮。2023年1月18日,微软宣布将于3月底前在全球裁员1万人,约占员工总数的5%;1月23日微软在其官方博客宣布,已与OpenAI扩大合作伙伴关系,微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能领域的技术突破,此前微软已分别于2019年和2021年对OpenAI进行投资。1月20日,谷歌母公司Alphabet宣布将裁员约1.2万人,占该公司员工总数的6%以上,同时谷歌CEO表示,公司将会进一步聚焦AI技术核心业务的研发投入。国内来看,2月7日,百度宣布大模型新项目文心一言(ERNIEBot),其将于2023年3月正式上线,目前已有包括互联网、媒体、金融、保险、企业软件等行业的300家头部企业宣布加入百度“文心一言”生态;2月8日,科大讯飞AI学习机、讯飞听见将成为自然语音处理大模型技术率先落地的产品,将于今年5月6日进行产品级发布。
研报来源:天风证券 吴先兴缪欣君 张若凡 2023年02月20日
$昆仑万维(SZ300418)$ $三六零(SH601360)$ $寒武纪-U(SH688256)$ #人工智能# #AI智能谁称王#
2023深圳市人工智能产业发展白皮书
报告认为
1、深圳市人工智能产业发展走在全国前列。在智能硬件、计算机视觉、自动驾驶、智慧金融、智慧医疗等领域的“AI+应用”发展全国领先。
2、深圳人工智能产业创新生态体系要素齐备。集聚了大湾区的创新资源与各类高端创新载体,人才储备、专利规模居国内前三。
3、底层算法和核心零部件仍受制于人,亟需加快突破基础算法、高端芯片、关键器件和底层软件等技术。
4、医疗、制造、智能驾驶等重点领域的数据资源开放共享,是人工智能产业发展的共性需求,亟需加快构建数据法律法规体系。
01
人工智能概览
(一)人工智能定义
人工智能(ArtificialIntelligence,AI)是指使用机器代替人类实现认知、识别、分析、决策等功能,包含了基础层、技术层、应用层三部分。基础层主要由关键硬件(AI芯片、传感器)、数据、算法模型(软件)三部分构成。传感器负责收集数据,AI芯片(GPU、FPGA、NPU等)负责运算,算法模型负责训练超大量的数据。新一代人工智能技术体系由基础技术平台和通用技术体系构成,其中基础技术平台包括云计算平台与大数据平台,通用技术体系包括机器学习、自然人机交互、模式识别等技术。在此技术体系的基础上,人工智能技术不断创新发展,产生包括智能金融、智慧医疗、智能机器人、自动驾驶、智能安防、智慧零售、智慧教育及智能家居等应用场景和典型产品。
图:人工智能的基础层、技术层和应用层
资料来源:德勤
(二)全球发展情况
人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。加快发展新一代人工智能是我国赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。欧美、日本等国已将发展人工智能提升为国家战略,我国也加紧系统布局和主动谋划,争夺全球科技竞争的主导权。
美国是人工智能超极强国。遥遥领先的人才储备。近十年来入选国际人工智能学会会士的顶尖学者中,美国占比69%,全球顶尖企业家数量美国占据50%以上。“超一流”的技术供给。论文产出量排名全球第一,专利申请量排名全球第二,尤其在开源框架和智能芯片等基础领域对我国形成了强力压制。强大且完备的产业体系。美国在人工智能领域基础层、技术层和应用层实力雄厚,并已实现全面领先。
英国领跑欧洲人工智能发展。综合实力位居全球前列。英国人工智能企业数量、融资量、顶尖人才数量、学术论文数量等关键指标均排名全球前三。“伦敦现象”优势凸显。伦敦已成为欧洲人工智能“首位城市”,深度得益于“伦敦-牛津-剑桥”黄金三角密集的学术资源和顶尖的学科集群。输出了源源不断的创新型企业。
我国人工智能应用领先,基础理论研究及关键核心技术方面尚处跟随者地位。在产业链下游,得益于我国旺盛的产业需求,以及庞大的人口基数产生的海量数据和丰富的应用场景优势,我国在人工智能应用层的智慧城市、智能安防、智能家居、智能零售、智能金融、智能医疗等多个领域世界领先。在产业链中游,我国在技术层的计算机视觉、智能语音等方面处于世界领先地位。旷视、科大讯飞等一批企业人脸识别率、语音识别率等屡获世界第一。但在产业链上游基础层的芯片、高精传感器、开源框架等底层软硬件技术方面十分薄弱。芯片领域,GPU与FPGA芯片完全依赖进口;算法方面的底层算法、原创算法缺失,主流开源平台仍由欧美等科技巨头把控。
图:主要国家人工智能战略
资料来源:中国信通院
02
深圳人工智能产业发展情况
深圳发展人工智能产业具有较好基础。2019年我市获批建设国家人工智能创新应用先导区和国家人工智能创新发展试验区,为人工智能产业发展奠定良好基础。从企业数量、人才数量、国际级载体等方面来看,我市人工智能综合实力位居全国主要城市前三位,形成了“高端资源集聚、技术深度融合、应用遍地开花”的发展格局。主要有以下特征:
(一)AI产业链完善
人工智能产业链分为如下三层:基础层提供数据采集、算力等基础设施,主要包括芯片、传感器、开发平台、数据服务、云计算等环节;技术层主要提供机器学习算法、智能语音识别技术、计算机视觉等算法和技术;应用层是将人工智能算法应用于各行各业形成的新业态、新模式、新产品,主要包括智能机器人、智能无人机、智能制造、智能医疗、智能金融、智能安防、自动驾驶、智能供应链等。
人工智能产业链的各个环节都有深圳企业,并且在全国都有一定的竞争力。比如海思半导体在芯片领域居于行业领先地位,速腾聚创、奥比中光、瑞声声学等企业在传感器领域位居行业前列,腾讯、华为、平安、大疆创新等企业在全产业链均处于领先地位。
图:深圳人工智能产业链
资料来源:HIIC智能经济研究所
(二)“AI+应用”发展全国领先
智能硬件领域,以大疆为代表的300多家无人机企业,占据全球市场七成份额。优必选的服务机器人已经应用在教育、家居、零售等场景,成为行业发展标杆。
计算机视觉领域,云天励飞的“深目”是中国最大规模实战应用警用级人像识别系统,微众银行AI团队推出了金融业内首个“联邦视觉系统”。
自动驾驶领域,大疆发布了千元级、性价比高的激光雷达,与速腾聚创、镭神智能的激光雷达共同加速了自动驾驶规模化落地,在自动驾驶增量零部件领域形成了初步集聚效应。华为、腾讯大局发力自动驾驶,在全国率先推出了业内一流的基础软硬件、车辆网和应用产品和方案。
智慧金融领域,微众银行的AI信贷风险管理体系做到全国领先,AI智能客服可直接回答约98%的顾客咨询;平安集团获批金融领域唯一国家级人工智能开放创新平台。
智慧医疗领域,腾讯觅影成为了“AI+医疗”标杆,并获批医疗领域唯一国家级人工智能开放创新平台,已在全国百余家三甲医院落地,疫情期间部署在湖北最大方舱医院,以秒级速度识别新冠肺炎CT影像。
(三)聚焦产业需求的技术研发
龙头企业围绕业务需求建立企业实验室。例如,腾讯优图实验室、华为诺亚方舟实验室、中兴通讯云计算及IT研究院等一批AI研发中心。华为2018年的研发投入高达高达1015亿人民币,占到销售收入的14%左右,国内企业排名第一;腾讯2018年研发投入212亿元,国内排名第五。
AI产学研协同创新趋势加快。鹏城实验室与微众银行联合建立了“AI金融联合实验室”,发力联邦迁移学习、新一代人机交互;腾讯AILab和港中大(深圳)联合成立了机器智能联合实验室,共同攻克机器学习、计算机视觉和自然语言处理。
(四)创新生态体系要素齐备
依托新兴产业集群发展的坚实基础,深圳已成为全球电子信息产业软硬件整合、供应链和产业链最为完整的区域,为人工智能技术的商业化落地提供了丰富的应用场景和强有力的集成创新条件。
深圳人工智能人才储备与专利等均居国内前三名。技术人才储备日益增强,深圳企业提供的人工智能就业岗位占全国总量的10.5%,全国排名第四。在中国人工智能企业知识产权竞争力百强企业中,深圳共拥有14家,仅次于北京(55家),主要包括了人工智能综合型以及计算机视觉、激光雷达等细分领域的龙头企业。
在高端创新载体方面,我市新增四个国家级人工智能开放创新平台,分别是腾讯集团医疗影像人工智能开放创新平台、平安集团普惠金融人工智能开放创新平台、华为公司基础软硬件人工智能开放创新平台和商汤公司智能视觉人工智能开放创新平台,近两年深圳新增了鹏城实验室、人工智能与数字经济广东省实验室等省级实验室,以及深圳人工智能与机器人研究院等市级基础研究机构。
03
深圳人工智能产业发展问题
(一)基础研究实力与前瞻性有待提升
深圳专注人工智能基础研究的顶级科研机构和研究成果较少,在高级机器学习、类脑智能计算、量子智能计算等基础理论和前沿研究方向尚未形成原始创新的科研成果及专利布局。相较之下,北京的类脑计算中心已研发出“天机芯”,合肥的中国科技大学与杭州的浙江大学正在研制50个量子比特以上的量子处理器等(仅滞后谷歌1-2年)。
(二)底层算法和核心零部件受制于人
深圳企业仍高度依赖国外深度学习框架的开源代码和开源工具库。尽管当前华为、腾讯等龙头企业正在积极发展人工智能计算框架,但尚未建立成熟的开源平台和社区。与此同时,企业所使用的关键设备、高端芯片、核心元器件,仍以美国、德国、日本的产品和技术为主。虽然华为、大疆、云天励飞等企业已加速研发面向训练推理和终端应用的芯片,但受制于国外企业的生态优势和专利壁垒,突破难度大。
(三)高端复合型人才缺口较大
人才是人工智能竞争关键要素。深圳的人工智能国际顶尖学者数量少,其中中国人工智能学会会士仅2名,占全国总量的3%,远低于北京(31名)、上海(5名)、合肥(4名)等地。同时,由于居住成本高昂、教育医疗等公共服务资源紧张等问题,高技术人才分配的不确定性增高,留住人才的难度变大。
(四)公共服务平台滞后于产业发展
数据共享方面,政府掌握的大量政务信息涉及个人隐私,且尚未归集,需要强有力的顶层设计才能打通数据,并探索向社会领域开放使用。另一方面,我国尚未形成统一数据平台或大型数据库供科研机构和产业界使用。相比之下,美国等发达国家已搭建医疗大数据平台、ImageNet图像数据集等,为科学研究和产业发展提供数据服务。
检验检测方面,面向自动驾驶的车规级零部件的测试设备和人力成本较高,深圳本土的实验室和开放环境模拟测试设施欠缺,导致部分企业优先选择到武汉、上海等地进行测试;医疗智能机器人缺乏综合性实验平台及FDA、NMPA认证前的评估与测试体系。
04
深圳人工智能产业发展建议
(一)利用“揭榜制”吸引全球顶尖创新资源落地
借鉴上海人工智能产业招商引资政策体系,采用“揭榜制”,面向全球发布重点应用场景、重大攻关项目清单,实行“双向激励”制度,吸引全球顶尖团队来深发展,有效加强我市的人工智能产业创新力量。
(二)打造面向基础和应用基础研究的研发机构
借鉴北京智源人工智能研究院模式,引进国际一流高校和尖端企业联合建立面向基础和应用基础研究的产学研深度融合的新型研发机构,增强我市人工智能发展的原始创新能力。
(三)实施重大装备及核心零部件专项研制计划
在人工智能基础算法、高端芯片、关键器件和底层软件领域分批开展重大装备及核心零部件专项研制计划,攻克面向云端训练、终端和边缘端推理的高性能深度学习芯片,以及基于新型架构的高端智能芯片。
(四)加快建设重点领域人工智能公共技术服务平台
医疗、制造、智能驾驶等领域的数据资源开放共享成为制约行业发展的难题。参考美国、欧盟等国以数据资源开放促进人工智能发展的经验,我市应在智能医疗、智能制造、智能驾驶等领域先行开展数据资源开放试验,打造人工智能开放创新平台,有效促进人工智能产业发展。
(五)主动出击引进国际高端团队
凭借毗邻香港的优势,近年来有多个香港高校团队来深创业。香港是我国人工智能学术研究的高地,深圳拥有丰富的应用场景和供应链资源,建议加强政府统筹,在深港合作区等区域大力引进香港、以色列等国际顶尖的创新资源落地,促进产业高端发展。
附件:人工智能产业链 六产业链及相关企业1、产业链概况人工智能产业链主要分为基础层、技术层和应用层。基础层主要包括人工智能芯片、传感器、云计算
来源:雪球App,作者:郭伟松_鑫鑫投资,(https://xueqiu.com/2524803655/243770065)
六
产业链及相关企业
1、产业链概况
人工智能产业链主要分为基础层、技术层和应用层。基础层主要包括人工智能芯片、传感器、云计算、数据采集及处理等产品和服务,智能传感器、大数据主要负责数据采集,AI芯片和云计算一起负责运算。技术层是连接产业链基础层与应用层的桥梁,包括各种深度学习框架、底层算法、通用算法和开发平台等。应用层则是将人工智能进行商业化应用,主要提供各种行业解决方案、硬件和软件产品。
2、产业链上游解析
基础层提供数据资源、硬件设施以及计算力平台等一系列基本支持。具体来看,基础层包括人工智能芯片、传感器、大数据及云计算等,其中大数据与智能传感器的主要任务是数据采集,AI芯片与云计算则负责数据分析与运算,技术门槛较高,生态搭建已基本成型。目前,浪潮、戴尔、HPE分列全球人工智能基础设施市场份额前三,其中浪潮以16.4%的市场占有率成为全球人工智能基础设施的龙头玩家。
通用计算芯片CPU、GPU全球市场基本被Intel、Nvidia等美国芯片厂商垄断,技术与专利壁垒较高,卡脖子现象严重。华为麒麟、巴龙、昇腾及鲲鹏四大芯片有望突破此壁垒。未来几年,全球各大芯片企业、互联网巨头、初创企业都将成为该市场的主要玩家。计算力指数国家排名中美国列国家计算力指数排名第一,坐拥全球最多超大规模数据中心,这是美国算力的基础保障。中国列第二,AI算力领跑全球。日本、德国、英国分别位列第三至第五名。计算平台方面,全球市场被亚马逊、谷歌、阿里、腾讯、华为等公司基本垄断,但小公司的计算平台凭借价格优势仍有生存空间。
3、产业链中游解析
技术层是AI产业发展的核心,包括通用技术、AI技术框架以及算法模型等。这一层级依托于海量数据的挖掘处理与机器学习建模,来进行各种应用技术的开发,从而解决实践中的具体类别问题。计算机视觉、自然语言处理、语音识别、机器学习、深度学习、知识图谱为这一层级的代表性技术。优势企业如谷歌、亚马逊、Facebook加快部署机器学习、深度学习底层平台,建立产业事实标准。
目前业内已有近40个各类AI学习框架,生态竞争异常激烈,全球公司先后推出用于深度学习模型训练的开源框架,包括Caffe、Theano、Torch、MXNet、TensorFlow等,极大降低了人工智能技术在实践中的入门门槛,中国的百度飞桨(PaddlePaddle),清华大学的计图(Jittor)和华为推出的MindSpore也先后问世。除了谷歌、阿里、百度、腾讯等科技巨头在纷纷布局外,如商汤、旷视、科大讯飞等公司也加入了技术层深耕行列。
4、产业链下游解析
应用层是人工智能技术在各不同场景下的商业化应用。人工智能已在金融、教育、交通、医疗、家居、营销等多垂直领域取得较大发展;与此同时,智能终端、模型预测控制、推荐系统、定位与地图构建等服务层面及自动驾驶汽车、无人机、智能机器人、智能语音助手等人工智能产品发展迅速。
受人工智能技术应用的链条长、短期获益难度大等因素影响,一些早期的技术型企业也纷纷将重心转移到等垂直领域的软硬件解决方案当中。众多人工智能各类企业“从谋求单点技术的极致,向场景化综合生态发展”,这无疑推进了AI技术与商业应用场景的落地与融合。国外应用企业以苹果、IBM等为代表,而中国企业在应用层发展最为活跃,除华为、小米、阿里巴巴等大型企业外,众多中小型企业也纷纷加入应用层的竞争行列当中。
5、相关企业
(1)科大讯飞:AI+行业应用领域领跑者
公司深耕智能语音领域,战略转型人工智能赛道,发展成为行业领军企业。公司在智能语音行业布局多年,核心技术优势明显,2010年以来向人工智能产业发展,推动AI与各行业的应用结合,在智慧教育、智能办公、智慧公安、医学影像、智能汽车、智慧服务、智慧城市等领域不断取得成果。
坚持“平台+赛道”发展战略,公司构建自有业务闭环生态体系。公司坚持“平台+赛道”的人工智能战略,依托国内首家上线的AI开放平台——讯飞开放平台,为开发者提供一站式人工智能解决方案,构建AI产业生态,并在教育、医疗、办公、智慧城市等领域实现AI的深度应用,在多语种语音合成和识别、自然语言处理、图文识别、人机交互等领域提供丰富的AI能力,赋能下游客户的效率提升。
推动AI走向强人工智能,“讯飞超脑2030计划”为公司明确未来成长空间规划。2022年,公司发布“讯飞超脑2030计划”,旨在构建基于认知智能的复杂智能系统,深度融合垂直行业的细分场景任务,实现各业务场景赋能。公司计划分为三个阶段,第一阶段着眼于机器人和数字虚拟人领域;第二阶段着眼于自适应行走的外骨骼机器人和陪伴数字虚拟人家族,以及面向青少年的抑郁症筛查平台;第三阶段计划全面进入家庭场景。
(2)拓尔思:国内NLP龙头厂商
深耕NLP领域30年,公司发展成为国内政务领域NLP龙头厂商。公司以“语义智能+”为发展战略深耕多年,主要业务覆盖内容安全和互联网空间治理、数字政府和数据智能三大板块,向以党政机关及企事业单位为主的下游客户提供大数据检索、智能风控营销、舆情监控等服务。公司以深耕多年的大数据积累与行业领先的NLP技术成为国内政府政务领域NLP龙头,多年以来一直保持行业领先的市场地位。
公司以NLP技术为核心,金融、政府、公安领域竞争优势显著。目前公司以公共安全市场为最主要业务,产品和场景包括公安情报研判指挥、公安知识图谱、公安舆情监控、开源情报智能分析、开源情报数据采集监测以及各类领域知识库构建;在信息安全领域,全资子公司天行网安提供各类网安产品服务。
公司积极开辟新赛道,机器人+虚拟人有望为公司业务提供新增量。公司将以“虚拟人+”场景为突破口,开发支撑虚拟人的AI技术平台,推动虚拟人在各行业场景中的率先落地。公司基于中文NLP核心技术、海量数据积累及具备行业专业能力的知识图谱等元宇宙技术基因的优势,致力构建数字虚拟人的智能引擎,提供虚拟人智能对话、知识积累、语义理解和智能决策等技术支撑。
在机器人领域,公司与头部AI厂商共同合作研究人形机器人软件技术。合作双方将在人形机器人的智能化方面,研发云端协同的AI算法框架以及面向特定领域的知识图谱技术,公司在NLP、知识图谱领域的积淀将赋能机器人软件大脑及开放软件生态的构建。
(3)商汤-W:人工智能领域全球领军
商汤科技是全球知名的人工智能软件与技术的领军企业。公司不断增强行业领先的全栈式人工智能能力,涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。此外,商汤前瞻性打造新型人工智能基础设施——SenseCore商汤AI大装置,打通算力、算法和平台,大幅降低人工智能生产要素价格,实现高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,推动人工智能进入工业化发展阶段。商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块,相关产品与解决方案市场认可度较高。
(4)云从科技:国内领先的人机协同解决方案提供商
云从科技是国内领先的人机协同解决方案提供商,致力于助推人工智能产业化进程和各行业智慧化转型升级。公司一方面凭借自主研发的人工智能核心技术打造了人机协同操作系统,通过对业务数据、硬件设备和软件应用的全面连接,把握人工智能生态的核心入口,为客户提供信息化、数字化和智能化的人工智能服务;另一方面,基于人机协同操作系统,赋能智慧金融、智慧治理、智慧出行、智慧商业等应用场景,为更广泛的客户群体提供以人工智能技术为核心的行业解决方案。公司将人工智能科技融合大数据技术,在金融、治理、交通、商业、医疗、教育及新基建等各个领域,提供优质而丰富的整合解决方案,每天为全球数亿人次用户带来更智能、便捷及人性化的AI生活体验。
(5)格灵深瞳:场景聚焦的计算机视觉龙头
格灵深瞳是一家行业领先的人工智能科技公司,公司专注于将先进的计算机视觉技术和大数据分析技术与应用场景深度融合,提供面向城市管理、智慧金融、商业零售、体育健康、轨交运维等领域的人工智能产品及解决方案。深瞳技术致力于感知物理世界中的人、车、物、场等的基础属性、行为、特征信息,同时深入挖掘内在的关联、关系等多维图谱。基于深瞳大脑学习平台、高性能计算平台、智能大数据平台构造低成本、高性能、可扩展的视觉计算系统,为各行业用户深度赋能,提供云、边、端一体化的无感切换体验。深瞳技术主要分为视觉感知类算法、数据智能挖掘类技术、高性能计算技术。
(6)海天瑞声:AI训练数据标注优质提供商
公司是国内领先的训练数据专业提供商,致力于为AI产业链各类机构提供专业数据集。公司致力于为各类AI厂商和机构提供算法模型开发训练需要的专业数据集,覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,应用场景多元,包含人机交互、智能驾驶、智能家居、智慧城市等。
公司智能语音业务发展成熟,竞争壁垒高且小语种领域优势显著。公司在语音语言学基础研究方面积累深厚,基于发音词典构建技术和流程技术的持续迭代,构建高质量的自然语言处理模型训练所需的标注数据,截至2022H1公司已具备190个语种/方言的覆盖能力,并且公司致力于开拓海外市场,未来业务规模有望加速扩张。
公司成立智能驾驶事业部,积极布局自动驾驶业务。公司于2022年6月上线了第三代智能驾驶标注平台,目前自动驾驶数据标注方面业务已覆盖全景语义分割、2D图像标注、2D/3D融合标注、3D点云标注等。公司基于多年以来在数据标注领域的算法积淀,在标注效率、准确度等指标上具备显著竞争优势,未来有望构建行业领先的综合性、规模化和自动化的数据处理能力体系。
公司客户资源粘性高优势显著,未来有望受益行业加速发展和人工智能商业化进程加速。公司在智能语音业务方面与字节跳动、阿里巴巴、腾讯、百度、科大讯飞及海外大型客户保持良好合作关系,考虑人工智能未来有望加速商业化应用,叠加国家信创浪潮政策支持,公司有望迎来加速成长期。
七
社会经济价值
1、促进数字技术与实体经济深度融合,赋能传统产业转型升级
2021年3月我国十四五规划纲要出台,提出“打造数字经济新优势”的建设方针,并强调了人工智能等新兴数字产业在提高国家竞争力上的重要价值。规划纲要指出要充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,以数据驱动生产过程优化,催生新产业、新业态、新模式。数字经济的高速发展为人工智能发展创造了良好的经济与技术环境;同时,人工智能作为关键性的新型信息基础设施,也被视为拉动我国数字经济发展的新动能。随着新基础设施计划的实施、消费互联网的升级和产业互联网的发展,人工智能科技产业开始步入全面融合发展的新阶段,成为数字经济时代的核心生产力和产业底层支撑能力,是激活数字经济相关产业由数字化向智能化升级的核心技术。
2、人工智能助力产业经济价值实现
(1)人工智能于各环节提升经济生产活动效能
近年来,人工智能技术及产品在企业设计、生产、管理、营销、销售多个环节中均有渗透且成熟度不断提升。同时,随着新技术模型出现、各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等泛C端领域,向制造、能源、电力等传统行业辐射。以计算机视觉技术主导的人脸识别、光学字符识别(OCR)、商品识别、医学影像识别和以对话式AI技术主导的对话机器人、智能外呼等产品的商业价值已得到市场充分认可;除感知智能技术外,机器学习、知识图谱、自然语言处理等技术主导的决策智能类产品,也在客户触达、管理调度、决策支持等企业业务核心环节体现价值。
(2)人工智能产业发展,将打开新一轮城市与区域竞争变局
在产业数字化和数字产业化浪潮下,城市经济转型和升级过程中创造出的智能化需求,是促进创新资源聚集和产业发展的关键因素。以智能化需求为导向,构建和培育富有活力的创新生态,是区域人工智能科技产业发展的前提和基础。人工智能产业发展也打开了新一轮的城市与区域竞争变局。根据中国新一代人工智能发展战略研究院2018-2021年针对区域人工智能科技产业竞争力评价指数的追踪研究表明,2021年长三角总评分首次超过京津冀位列第一。人工智能和实体经济融合发展进程的加速和北方人工智能科技产业创新资源的“南移”,是改变区域竞争力发展格局的重要因素。因此,各区域应加速补全人工智能及面向各行业的产业链、积极建设示范性智慧应用场景、前瞻布局人工智能相关标准及管理体系、推动公共研发等资源共享,强化科研与人才培育建设、鼓励系统性超前研发布局等以把握人工智能产业发展的重大历史机遇。
八
市场前景前瞻
人工智能技术在我国呈现政策大力支持、应用场景多元化、技术成熟度不断提升等发展态势,具备广阔的市场前景。
1、中国人工智能行业整体呈快速发展趋势,行业大环境持续向好
从2017年以来,中国一直在大力发展人工智能产业,从政策及资本上给予行业很大的支持,人工智能也与5G、大数据、工业互联网等新兴技术产业一起被列入新基建范围。
2020-2022年,是中国人工智能商业化较快的时期,AI进入了深度融合的发展期,开始运用于各行各业。回看近几年AI的发展,行业大环境与快速发展的趋势未改变。
2、政策:人工智能政策红利日益凸显
自2015年以来,人工智能被先后写进“十三五”、“十四五”国家发展规划纲要。此后,中央部委出台了诸多人工智能工作计划、实施意见。在国家持续推动下,各地也紧跟大潮,充分结合自身优势和产业基础,积极布局人工智能发展规划。例如,2019年,长沙市发布《关于进一步促进人工智能产业发展的意见》提出设立人工智能产业发展专项资金,每年列支5亿元,用于支持全市人工智能产业发展,重点支持产业集聚、企业引培、研发创新、示范应用、人才培养、金融创新、生态优化等方面。2022年,广州市发布《关于开展2022年度新一代信息技术、人工智能政策兑现工作的通知》提出针对人工智能示范应用、获奖情况进行资金奖励,并对相关企业租房用房、举办重大活动提供资金支持。
3、技术:应用驱动创新、积极补齐短板,已基本形成创新高地
目前中国各类AI技术全面发展,除了由市场需求驱动的应用技术发展之外,在政策牵引及业务需求驱动下,中国市场也在积极补齐基础理论研究方面的短板,大力推动如AI芯片、深度学习等领域的技术突破,从底层技术出发赋能AI产品及解决方案的迭代。
从技术创新角度看,以中国为首的东亚地区,已基本形成了人工智能创新高地,中国在专利、论文量及全球占比也在逐年提升。
4、产业融合:AI持续泛化,持续深入赋能传统行业并保持健康发展态势
当前,人工智能已广泛应用于人们日常生产、生活的方方面面,人工智能工具的引入也为中国数字经济发展带来巨大的增量,其发展态势健康稳定、持续且乐观。同时,在产业智能化转型升级的进程中,传统行业的参与程度将越来越深入,这将为AI提供海量的数据和更丰富的应用场景,为人工智能的应用打开新的空间。
5、产业规模持续扩大,市场份额将进一步集中
随着人工智能产业的不断发展和投资,人工智能产业规模在过去五年持续增长。根据2017年国务院发布的《新一代人工智能发展规划》,到2020年人工智能与世界先进水平同步,核心产业规模超过1500亿元,带动相关产业规模超过1万亿元;到2025年,核心产业规模将超过4000亿元,带动相关产业规模超过5万亿元。
2021年人工智能核心产业规模预计达到1998亿元规模,预计将于2026年超过6000亿元,对应2021年到2026年的CAGR为24.8%,带动产业规模超过2万亿元。随着越来越多的头部企业登陆资本市场,市场份额将进一步集中。
全面透析人工智能产业链 文章开始前先感谢崔老师的分享,专注人工智能领域的分析。人工智能产业链分为基础层、技术层和应用层人工智能产业链包括三层:基
来源:雪球App,作者:一只猪的勇气,(https://xueqiu.com/7821378668/148422770)
文章开始前先感谢崔老师的分享,专注人工智能领域的分析。人工智能产业链分为基础层、技术层和应用层
人工智能产业链包括三层:基础层、技术层和应用层。其中,基础层是人工智能产业的基础,主要是研发硬件及软件,如AI芯片、数据资源、云计算平台等,为人工智能提供数据及算力支撑;技术层是人工智能产业的核心,以模拟人的智能相关特征为出发点,构建技术路径;应用层是人工智能产业的延伸,集成一类或多类人工智能基础应用技术,面向特定应用场景需求而形成软硬件产品或解决方案。
中国人工智能100强企业产业链分布情况
基础层是人工智能产业的基础,主要是研发硬件及软件基础层是人工智能产业的基础,主要是研发硬件及软件,如AI芯片、数据资源、云计算平台等,为人工智能提供数据及算力支撑。主要包括计算硬件(AI芯片)、计算系统技术(大数据、云计算和5G通信)和数据(数据采集、标注和分析)。
中国人工智能100强企业产业链基础层
1、计算硬件-AI芯片
AI芯片是人工智能产业的核心硬件。人工智能芯片的定义从广义上讲只要能够运行人工智能算法的芯片都叫作人工智能芯片,但是通常意义上的人工智能芯片指的是针对人工智能算法做了特殊加速设计的芯片。现阶段,这些人工智能算法一般以深度学习算法为主,也可以包括其它机器学习算法。人工智能芯片分类一般有按技术架构分类、按功能划分、按应用场景分类三种分类方式。
人工智能芯片分类
当前,我国人工智能芯片行业正处在生命周期的幼稚期。主要原因是国内人工智能芯片行业的整体销售市场正处于快速增长阶段,传统芯片的应用场景逐渐被人工智能专用芯片所取代,市场对于人工智能芯片的需求将随着云/边缘计算、智慧型手机和物联网产品一同增长,并且在这期间,国内的许多企业纷纷发布了自己的专用AI芯片;尽管国内人工智能芯片正逐渐取代传统芯片,但是集成商或芯片企业仍在寻找新的合作模式,这样才能很好地抓住新客户的需求,除了当前的合作客户,拓展新客户合作开发产品是困难的,因此纷纷推出开源或开放平台让客户开发新需求。
我国人工智能芯片行业所处周期
2、计算系统技术-大数据、云计算和5G通信
人工智能与大数据、云计算和5G关系紧密,由于巨大数据的产生,使得人们关注用数据做一些过去只有人能够做的事情。配合云计算带来的计算资源和计算能力,人工智能依托数据基础,对周遭环境做出一定的程序反应,实现人工智能的落地。其中,5G网络的主要作用是让终端用户始终处于联网状态,让信息通过5G在线快速传播和交互。
人工智能与大数据、云计算、5G的关系
大数据
当前,我国正在加速从数据大国向着数据强国迈进。国际数据公司IDC和数据存储公司希捷的一份报告显示,到2025年,随着中国物联网等新技术的持续推进,其产生的数据将超过美国。我国产生的数据量将从2018年的约7.6ZB增至2025年的48.6ZB,数据交易迎来战略机遇期。1ZETTABYTE大约是1万亿GIGABYTE,这是当今常用的测量方法。与此同时,美国2018年的数据量约为6.9ZB。到2025年,这个数字预计将达到30.6ZB。据贵阳大数据交易所统计,中国大数据产业市场在未来五年内,仍将保持着高速增长。2017年中国大数据市场规模为3517亿元,增速为41.6%,预计到2020年,中国大数据产业规模或达13626亿元左右。
2018年-2025年中美数据生产量
云计算
近年来,我国云计算新兴产业快速推进。多个城市开展了试点和示范项目,涉及电网、交通、物流、智能家居、节能环保、工业自动控制、医疗卫生、精细农牧业、金融服务业、公共安全等多个方面,试点已经取得初步的成果,将产生巨大的应用市场。根据中国信通院公布的数据显示,2013年以来我国云计算市场规模保持了逐年较快增长,2017年达691.6亿元,同比增长34.3%。据测算2018年我国云计算市场规模突破900亿元。
2013-2018年中国云计算市场规模增长情况(单位:亿元)
5G通信
虽然2014年5月三星电子就已宣布其开发出首个机遇5G核心技术的移动传输网络,且我国运营商和设备制造商也较早开展相关技术研发,但是我国5G规划从2015年开始。《国家"十三五"规划》指出积极推进第五代移动通信(5G)技术研究,于2020年启动5G商用。中国5G试验规划分为两大阶段:第一个阶段为5G关键技术测试阶段(2015~2018),第二个阶段为5G产品研发阶段(2018~2020),预计2020年实现正式商用。2018年12月,工信部发放5G系统试验频率使用许可。
中国5G产业发展历程
3、数据-数据采集、标注和分析
人工智能产业目前已经发展至量变阶段,需要通过大量的数据做出质变进而突破现有的屏障,数据标注和采集行业应运而生。数据采集、标注和分析是指文本、图像、视频、语音等数据的采集、数据标注和分析。
数据采集和标准分类
技术层是人工智能产业的核心,以模拟人的智能相关特征为出发点技术层是人工智能产业的核心,以模拟人的智能相关特征为出发点,构建技术路径。主要包括算法理论(机器学习)、开发平台(基础开源框架、技术开放平台)和应用技术(计算机视觉、机器视觉、智能语音、自然语言理解)。
中国人工智能100强企业产业链技术层
1、中国人工智能专利及论文量世界领先
从近十年人工智能专利数量来看,根据乌镇智库发布的数据,中国在全球人工智能专利数量上处于绝对领先的地位。2009-2018年,中国人工智能累计专利数量达到68467件。同期美国人工智能专利数量为30200件,美国和中国位于第一梯队并占据绝对领先优势。韩国位于第二梯队,同期数量为6893件,仅为中国的10%。英国和加拿大的专利数量相近,分别排在全球的第四位和第五位。从近十年人工智能论文数量来看,根据乌镇智库发布的数据,2009-2018年中美英三国在论文数量方面占据全球前三的位置。其中,中国同样在数量上具有绝对的优势,论文累计数量达到了30303篇,美国和英国累计数量为18144篇和8188篇。印度后来居上位居第四位,西班牙则排名第五。
各国人工智能领域专利数量累计情况(单位:件)
各国人工智能领域论文累计数量情况(单位:篇)
2、国内基础及技术层企业基础算法及平台公司数量仅占4%
算法作为人工智能技术的引擎,主要用于计算、数据分析和自动推理。目前美国是人工智能算法发展水平最高的国家。从高校科研到企业的算法研发,美国都占据着绝对优势。在中国,仅有少数几家科技巨头拥有针对算法的开放平台,国内人工智能基础及技术层企业中,基础算法及平台公司数量仅占4%。我国人工智能产业发展过于依赖开源代码和现有数学模型,导致专业性和针对性不足,效果往往不能满足具体任务的实际要求。以图像识别为例,用开源代码开发出的AI即使可以准确识别人脸,但在对医学影像的识别上却难以达到临床要求。
国内人工智能基础级技术层企业数量分布情况(单位:%)
3、中国人工智能人才相对匮乏
根据牛津大学2018年对中美两国算法研究领域的人才与全球先进国家的对比显示,中国目前在算法研究方面的人才仅占全球人工智能底层技术研究的13.1%,而美国算法人才的占比为26.2%。从开设人工智能专业院校的数量来看,中国仅有不到30所大学的研究实验室专注于人工智能,这一数字远远无法满足人工智能企业的用人需求。
中美两国算法研究人才占比(单位:%)
应用层是人工智能产业的延伸,为特定应用场景提供软硬件产品或解决方案应用层是人工智能产业的延伸,集成一类或多类人工智能基础应用技术,面向特定应用场景需求而形成软硬件产品或解决方案。主要包括从行业解决方案(“AI+”)和热门产品(智能汽车、机器人、智能家居、可穿戴设备等)。
中国人工智能100强企业产业链应用层
1、行业应用-AI+传统行业
“AI+传统行业”,覆盖了医疗、金融、教育、文娱、零售、物流、政务、安防等诸多垂直领域。
人工智能行业应用
2、行业产品-智能汽车、机器人、智能家居、可穿戴设备等
人工智能领域的热门产品主要有智能汽车、机器人、智能家居、可穿戴设备等。对5G和人工智能来说,汽车是绝佳载体,而对于汽车行业来说,5G和人工智能又是重要的附加值,智能汽车已成为汽车产业发展的重要方向;机器人分为工业机器人和特种机器人(服务机器人、水下机器人、娱乐机器人、军用机器人、农业机器人),随着人工智能的快速发展,各种类型的机器人纷纷面世,一些公司也在以实际行动推动机器人落地,如今,一个机器人应用的新时代正在出现;智能家居主要包括智能灯光控制系统、智能窗帘、智能门锁、智能音箱、智能冰箱、智能水壶等等,人工智能让家居产品拥有“会思考、能决策”的能力,设备智能化以后让生活变得更简单化;可穿戴设备主要包括智能手环、智能手表、智能眼镜、智能头盔,可穿戴设备作为AI的入口,可应用在体育、医疗、娱乐、科教、商业等方面。
人工智能行业产品
@今日话题$科大讯飞(SZ002230)$#5G##云计算#
人工智能行业产业链情况及市场规模
原标题:人工智能行业产业链情况及市场规模人工智能产业链包括基础层、技术层、应用层。基础层是人工智能产业的基础,主要有AI芯片、传感器、云计算平台等,为人工智能提供算力与数据的支持;技术层包括感知层、认知层、平台层,感知层以算法模拟人的感知来构建技术路径,可分类为计算机视觉、语音、触感和味觉等,认知层以算法模拟人的认知,使机器具备理解、学习、推理以及思考的能力,平台层主要为技术开放平台与基础开源框架,为人工智能技术提供平台支持;应用层将人工智能技术落地到具体的应用场景,根据不同需求形成具体的软硬件产品与解决方案。
数据来源:《人工智能产业发展与创新趋势白皮书》(赛迪顾问)
从技术应用看,根据中国新一代人工智能发展战略研究院2021年的研究,中国2205家人工智能企业中,涉及基础层和技术层的人工智能企业共有382家。其中,智能芯片、语音识别和自然语言处理、图形图像识别、机器学习和推荐、工业机器人、硬件的企业数占比相对较高,依次为8.90%、8.64%、7.59%、5.76%、4.97%和3.66%。
图:国内基础层及技术层人工智能企业分布情况
数据来源:《全面融合发展中的中国人工智能科技产业》(中国新一代人工智能发展战略研究院)
展开全文从应用场景看,根据艾瑞咨询的研究,2020年中国人工智能市场的主要应用场景为政府城市冶理和运营(公安、交警、司法、城市运营、政务、交运管理、国土资源、监所、环保等)、互联网、金融,合计占比达到79%。而随着人工智能行业核心技术的增速不同,不同下游行业对人工智能技术和产品的应用节奏不同,未来行业格局将会发生一定变化。
2020年,中国提出加快包括大数据中心、人工智能等在内的新型基础设施建设,推动产业信息化、数字化、智能化转型发展。由于非接触式交互逐渐兴起,人工智能融合应用速度显著加快。根据艾瑞咨询预测,2025年,人工智能核心产业规模预计达到4,532.6亿元;2025年,人工智能带动产业规模预计达到16,648.3亿元。
图:2019-2025年中国人工智能产业规模
数据来源:《2020年中国人工智能产业研究报告》(艾瑞咨询)
编制:诸葛御责任编辑:赵皋
来源:思瀚产业研究院思必驰返回搜狐,查看更多
责任编辑:人工智能热背后的产业链布局分析
随着《新一代人工智能发展规划》的发布,国务院开始从整体上部署我国的人工智能发展规划。
2017年7月8日,随着《新一代人工智能发展规划》的发布,国务院开始从整体上部署我国的人工智能发展规划,并对2030年前的我国新人工智能发展的总体思路、战略目标和主要任务、保障措施进行系统的规划和部署。主要体现在:加快智能产品的研发、智能制造使能工具与系统、智能制造云服务平台,建立智能制造标准体系,推进制造全生命周期活动智能化。
从国家战略来看,未来一段时间内,人工智能和制造业的结合将成为推进智能制造的主要手段。从产业发展情况来看,人工智能产业架构已经初具雏形,主要包括基础支撑层、技术驱动层和场景应用层,笔者将主要从这三个层面对人工智能产业链进行梳理和解析。
图人工智能产业链三层结构
基础支撑层:国际IT巨头长期盘踞,中国初创企业很难进入
在人工智能领域,传统的芯片计算架构已无法支撑深度学习等大规模并行计算的需求,这就需要新的底层硬件来更好地储备数据、加速计算过程。基础层主要以硬件为核心,其中包括GPU/FPGA等用于性能加速的硬件、神经网络芯片、传感器与中间件,这些是支撑人工智能应用的前提。这些硬件为整个人工智能的运算提供算力,目前多以国际IT巨头为主。
目前在GPU领域,英伟达主打工业级超大规模深度网络加速,并于日前推出了基于Volta、首款速度超越100TFlops的处理器Tesla;英特尔主要围绕FPGA构建产业,推出了模仿人脑的人工智能芯片。谷歌也推出了第二代TPU芯片,为自己的开源TensorFlow框架提供芯片支撑。除了这些谈到的行业巨头,在这一领域还有众多的初创公司,如中星微、寒武纪以及西井科技等,但在产业布局能力和研发实力方面还不可与这些巨头匹敌。
技术驱动层:算法和计算力成主要驱动力,开源化是趋势
技术层是人工智能发展的核心,对应用层的产品智能化程度起到决定性作用,在这一发展过程中,算法和计算力对AI的发展起到主要推动作用。技术层主要依托基础层的运算平台和数据资源进行海量识别训练和机器学习建模,以及开发面向不同领域的应用技术,包含感知智能和认知智能两个阶段。其中,感知智能阶段通过传感器、搜索引擎和人机交互等实现人与信息的连接,获得建模所需的数据,如语音识别、图像识别、自然语音处理和生物识别等;认知智能阶段对获取的数据进行建模运算,利用深度学习等类人脑的思考功能得出结果,如机器学习、预测类API和人工智能平台等。在此基础上,人工智能才能够掌握“看”与“听”的基础性信息输入与处理能力,才能向用户层面演变出更多的应用型产品。
当前,国内的人工智能技术平台在应用层面主要聚焦于计算机视觉、语音识别和语言技术处理领域,国内技术层公司发展势头也随之迅猛,其中的代表性的企业包括科大讯飞、格灵深瞳、捷通华声(灵云)、地平线、SenseTime、永洪科技、旷视科技、云知声等。
场景应用层:AI与场景深度融合,领域应用更加广泛
应用层主要是基于基础层与技术层实现与传统产业的融合,实现不同场景的应用。随着人工智能在语音、语意、计算机视觉等领域实现的技术性突破,将加速应用到各个产业场景。
应用层按照对象不同,可分为消费级终端应用以及行业场景应用两部分。
消费级终端包括智能机器人、智能无人机以及智能硬件三个方向,场景应用主要是对接各类外部行业的AI应用场景。近年来,国内企业陆续推出应用层面的产品和服务,比如小i机器人、智齿客服等智能客服,“出门问问”、“度秘”等虚拟助手,工业机器人和服务型机器人也层出不穷,应用层产品和服务正逐步落地。
其中,IBM最早布局人工智能,“万能Watson”推动多行业变革;百度推出“百度大脑”计划,重点布局无人驾驶汽车;而谷歌的人工智能业务则较为繁杂,多领域遍地开花,包括AlphaGo、无人驾驶汽车、智能手术机器人等;微软在语言语义识别、计算机视觉等领域保持领先。除此此外,家电行业也掀起了人工智能的热潮,不少家电企业都瞄准了人工智能,潜心研发AI技术,将其应用于家电产品。今年以来,长虹、美的、格力、格兰仕等都在向智能制造转型,试图立足“SmartHome”,将人工智能和智慧家庭更紧密地结合在一起。
结语:弱人工智能已加速渗透,强人工智能并不遥远
笔者认为,人工智能领域虽已迎来新的产业爆发期,但总体来看,人工智能仍是以特定应用领域的弱人工智能为主。目前绝大多数的系统,包括深度学习神经网络,机器智能,仍没有达到能够思考的程度。若要继续攀升进入强人工智能,计算机的认知能力是必须的,这也是目前人工智能在试图突破的点。AI源于技术,终于场景,人工智能最终需要通过与产业场景的深度融合才能实现真正的落地。