深度研报：人工智能机器人开启第四次科技革命人工智能工业革命的特点

发表时间：2023-06-19 01:49:57

深度研报：人工智能机器人开启第四次科技革命

图片来源@视觉中国

文|光锥智能&势乘资本，作者|谢晨星、王嘉攀、赵江宇

在互联网红利基本散尽的时代，未来到底属于web3、元宇宙，还是碳中和？到底什么样的革命性技术可以引领人类社会走出经济衰退、疫情和战争的影响，并将全球经济体量再向上推动数十倍？

我们的答案是，我们早已处于人工智能时代之中。

我们正处于传统信息技术时代的黄昏，和人工智能时代的黎明。

在过去的260年间，人类社会经历了三次巨大的科技创新浪潮，蒸汽机、电力和信息技术，将全球GDP提升了近千倍。每一次科技浪潮都通过某一项先进生产力要素的突破，进而引起大多数行业的变革：比如蒸汽机的出现推动了汽车、火车、轮船、钢铁等行业的巨大发展，140年前美国铁路行业的恶性竞争史，就如同现今互联网行业BAT之间的竞争。而铁路行业发展、兼并所需的巨额金融资本，又驱动了华尔街的发展，逐渐成为全球的金融中心。

二战之后以信息技术为核心的第三次科技革命迄今已逾70年，将全球GDP提升约60倍。其中可分为两段：1950年-1990年，是半导体产业迅猛发展的时代，推动了大型计算机向个人PC的小型化；1990年至今是近30年的互联网全球化时代，而互联网时代又细分为桌面互联网和移动互联网两段。

但随着摩尔定律的失效和信息技术红利彻底用尽，加上疫情黑天鹅影响，全球GDP衰退，引发并加剧了全球地缘政治和军事冲突，开始向逆全球化发展。

所以未来到底属于web3、元宇宙，还是碳中和？到底什么样的革命性技术可以引领人类社会走出经济衰退、疫情和战争的影响，并将全球经济体量再向上推动增长下一个50倍？

我们的答案是，我们早已处于人工智能时代之中。就像直到2010年iphone4发布，绝大多数人也并未意识到移动互联网革命早已开始一样，如今人工智能其实也已广泛应用，比如到处遍布的摄像头和手机人脸识别，微信语音和文本转换，抖音动态美颜特效、推荐算法，家庭扫地机器人和餐厅送餐机器人，背后都是人工智能核心技术在过去十年不断取得的巨大突破。

互联网已经是传统行业。

互联网技术作为过去30年最先进的生产力要素，改变了全球的所有人、所有产业、社会经济，甚至是政治、军事、宗教。

虽然互联网的技术红利已基本用尽，但我们仍可通过研究其历史规律，来预测未来新技术发展的可能路径。

30年的互联网发展历程总体可分为桌面互联网和移动互联网两个时代，按产业渗透规律，又可分为信息互联网、消费互联网和产业互联网三大阶段。

系统硬件都是最先起步，包括底层芯片、操作系统、联网通信、整机等，进而初步向媒体工具、文娱游戏行业渗透，因为这些领域最易受新技术的影响。当2002年中国网民达到6000万人，2012年中国智能手机出货量达到2亿部之后，互联网和移动互联网开始全面开花，渗透变革了直接toC的众多行业，如零售消费、交通出行、教育、金融、汽车、居住、医疗等。而当用户量进一步上涨、新技术的渗透进一步加深，企业服务、物流、制造、农业、能源等toB产业被影响。

而这个过程中可以发现，移动互联网时代对产业的渗透深度比桌面互联网更深，桌面互联网介入行业基本停留在信息连接层面，而到移动互联网时代，众多掌握先进技术要素的公司开始自己下场开超市、组车队、重构教育内容和金融机构，甚至是卖房、造车。也有些公司虽然诞生在桌面时代，但成功抓住移动爆发红利杀出重围，比如美团、去哪儿、支付宝。

抖音的崛起是中国移动互联网时代的最大变数，也是数据通信传输技术不断提升的必然，引发了用户流量结构的重组，进而催生了一大批抓住抖音流量红利崛起的消费品牌，如完美日记、花西子等等。但最终都逃不过被平台收割的命运，就像当年淘品牌的结局一样。微信支付、支付宝的普及极大推动了线下连锁零售的数字化程度和管理半径，减少了上下游现金收款产生的风险，促使其在资本市场被重新认可，连锁化率进一步提升，比如喜茶、瑞幸、Manner等等。这两条逻辑共同构成了过去几年的消费投资热潮主线。

如何评判一个新技术是否能引领未来的发展方向？

我们要看它能否从本质上解放生产力、发展生产力。

蒸汽机之所以推动了第一次科技革命，是因为其极大的提升了劳动生产力，并将大量劳动人口从第一产业农业的低级劳动中解放出来，进入第二产业工业。电力加速了这一过程，并推动了第三产业服务业的出现和发展。信息技术将更多的人口从第一、二产业中释放，进入第三产业（如大量年轻人不再进厂而去送外卖、跑滴滴），于是形成了如今全球第三产业GDP占比55%，中国第三产业劳动人口占比50%的格局。

机器人即是人工智能技术的硬件形态，在可见的未来，将第一二三产业的劳动人口从低级劳动中大比例释放和替代，并在这个过程中推动全球GDP继续百倍增长。

同时可大胆预言，以创新为职业的第四产业将会出现，而这个职业在人类的历史长河中其实一直存在于第一二三产业的边缘，不断用突破性创新推动着人类技术的进步，且社会生产力的提升促使该职业人群不断扩大。这大约能证明刘慈欣的技术爆炸假说来源。

人工智能从模块上可分为感知、计算和控制三大部分，由表及里可分为应用层、数据层、算法层、算力层，而随着2012年芯片进入28nm制程后的量子隧穿效应导致摩尔定律失效，“每提升一倍算力，就需要一倍能源”的后摩尔定律或将成为人工智能时代的核心驱动逻辑，算力的发展将极大受制于能源，当前全球用于制造算力芯片的能源占全球用电量的约1%，可以预测在人工智能大规模普及的未来数十年后，该比例将会大幅提升至50%甚至90%以上。而全球如何在减少化石能源、提升清洁能源占比，从而确保减少碳排放遏制全球升温的同时，持续提升能源使用量级，将推动一系列能源技术革命。关于该方向的研究可参考我们的另一篇报告《碳中和：能源技术新革命》。

早在第一次科技革命之前260年，哥伦布地理大发现就使西班牙成为了第一个全球化霸主。蒸汽机驱动英国打败西班牙无敌舰队，电力和两次世界大战使美国超过英国，信息技术又让美国赢得和苏联的冷战对抗，全球过了30年相对和平的单极霸权格局。

因此中国如果仅在现有技术框架中与欧美竞争，只会不断被卡脖子，事倍功半。只有引领下一代人工智能和碳中和能源技术科技革命浪潮，才能从全球竞争中胜出。

尽管中国已经跻身人工智能领域的大国，但是我们必须认识到中美之间在AI领域仍然有着明显的差距。从投资金额和布局上看，从2013年到2021年，美国对人工智能公司的私人投资是中国的2倍多。当前美国AI企业数量领先中国，布局在整个产业链上，尤其在算法、芯片等产业核心领域积累了强大的技术创新优势。更关键的是，尽管近年来中国在人工智能领域的论文和专利数量保持高速增长，但中国AI研究的质量与美国仍然有较大差距（集中体现在AI顶会论文的引用量的差距上）。

请输入图说2013-2021年中美在AI领域私有部门（如风险投资、个人投资等）投资金额上差距逐渐拉大

请输入图说中国在AI顶会上发表的文章数量已经反超美国，但影响力上仍然与美国有较大差距

图片来源：The2022AIIndexReport,StandfordUniversity

因此，中国需要持续加大在AI领域的研发费用规模，特别是加大基础学科的人才培养，吸引全世界优秀的AI人才。只有这样，中国才能有朝一日赶超美国，在基础学科建设、专利及论文发表、高端研发人才、创业投资和领军企业等关键环节上的拥有自己的优势，形成持久领军世界的格局。

一、AI发展简史

人工智能的概念第一次被提出是在1956年达特茅斯夏季人工智能研究会议上。当时的科学家主要讨论了计算机科学领域尚未解决的问题，期待通过模拟人类大脑的运行，解决一些特定领域的具体问题（例如开发几何定理证明器）。

那么到底什么是人工智能？目前看来，StuartRussell与PeterNorvig在《人工智能：一种现代的方法》一书中的定义最为准确：人工智能是有关“智能主体（Intelligentagent）的研究与设计”的学问，而“智能主体”是指一个可以观察周遭环境并做出行动以达致目标的系统。这个定义既强调了人工智能可以根据环境感知做出主动反应，又强调人工智能所做出的反应必须达成目标，同时没有给人造成“人工智能是对人类思维方式或人类总结的思维法则的模仿”这种错觉。

到目前为止，人工智能一共经历了三波浪潮。

第一次AI浪潮与图灵和他提出的“图灵测试”紧密相关。图灵测试刚提出没几年，人们似乎就看到了计算机通过图灵测试的曙光：1966年MIT教授JosephWeizenbaum发明了一个可以和人对话的小程序——Eliza（取名字萧伯纳的戏剧《茶花女》），轰动世界。但是Eliza的程序原理和源代码显示，Eliza本质是一个在话题库里通过关键字映射的方式，根据人的问话回复设定好的答语的程序。不过现在人们认为，Eliza是微软小冰、Siri、Allo和Alexa的真正鼻祖。图灵测试以及为了通过图灵测试而开展的技术研发，都在过去的几十年时间里推动了人工智能，特别是自然语言处理技术（NLP）的飞速发展。

第二次AI浪潮出现在1980-1990年代，语音识别（ASR）是最具代表性的几项突破性进展之一。在当时，语音识别主要分成两大流派：专家系统和概率系统。专家系统严重依赖人类的语言学知识，可拓展性和可适应性都很差，难以解决“不特定语者、大词汇、连续性语音识别”这三大难题。而概率系统则基于大型的语音数据语料库，使用统计模型进行语音识别工作。中国学者李开复在这个领域取得了很大成果，基本上宣告了以专家系统为代表的符号主义学派（SymbolicAI）在语音识别领域的失败。通过引入统计模型，语音识别的准确率提升了一个层次。

第三次AI浪潮起始于2006年，很大程度上归功于深度学习的实用化进程。深度学习兴起建立在以GeoffreyHinton为代表的科学家数十年的积累基础之上。简单地说，深度学习就是把计算机要学习的东西看成一大堆数据，把这些数据丢进一个复杂的、包含多个层级的数据处理网络（深度神经网络），然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合，就保留这个网络作为目标模型；如果不符合，就一次次地、锲而不舍地调整网络的参数设置，直到输出满足要求为止。本质上，指导深度学习的是一种“实用主义”的思想。实用主义思想让深度学习的感知能力（建模能力）远强于传统的机器学习方法，但也意味着人们难以说出模型中变量的选择、参数的取值与最终的感知能力之间的因果关系。

需要特别说明的是，人们往往容易将深度学习与“机器学习”这一概念混淆。事实上，在1956年人工智能的概念第一次被提出后，ArthurSamuel就提出：机器学习研究和构建的是一种特殊的算法而非某一个特定的算法，是一个宽泛的概念，指的是利用算法使得计算机能够像人一样从数据中挖掘出信息；而深度学习只是机器学习的一个子集，是比其他学习方法使用了更多的参数、模型也更加复杂的一系列算法。简单地说，深度学习就是把计算机要学习的东西看成一大堆数据，把这些数据丢进一个复杂的、包含多个层级的数据处理网络（深度神经网络），然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合，就保留这个网络作为目标模型，如果不符合，就一次次地、锲而不舍地调整网络的参数设置，直到输出满足要求为止。本质上，指导深度学习的是一种“实用主义”的思想。实用主义思想让深度学习的感知能力（建模能力）远强于传统的机器学习方法，但也意味着人们难以说出模型中变量的选择、参数的取值与最终的感知能力之间的因果关系。

二、AI的三大基石解析

如前所述，人工智能由表及里可分为应用层、数据层、算法层和算力层。

1.算力

算力层包括具备计算能力硬件和大数据基础设施。回顾历史我们就会发现，历次算力层的发展都会显著推动算法层的进步，并促使技术的普及应用。21世纪互联网大规模服务集群的出现、搜索和电商业务带来的大数据积累、GPU和异构/低功耗芯片兴起带来的运算力提升，促成了深度学习的诞生，促成了人工智能的这一波爆发。而AI芯片的出现进一步显著提高了数据处理速度：在CPU的基础上，出现了擅长并行计算的GPU，以及拥有良好运行能效比、更适合深度学习模型的现场可编程门阵列（FPGA)和应用专用集成电路（ASIC）。

当前，人工智能的算力层面临巨大的挑战。随着2012年芯片28nm的工艺出现，原先通过在平面上增加晶体管的数量来提升芯片性能的思路因为量子隧穿效应而不再可取，摩尔定律开始失效。晶体管MOSFET这个芯片里最基础的单元，由平面结构变成立体结构（由下图中的Planar结构转向FinFET结构，2018年之后进一步从FinFET结构转向GAAFET结构）。

三代MOSFET的栅极结构演化。其中灰色代表电流流经区域，绿色代表充当闸门的栅极

芯片结构的改变直接导致了芯片制造步骤的增加，最终体现为成本的上升。在2012年28nm工艺的时候，处理器的生产大概需要450步。到了2021年的5nm工艺时，生产环节已经增加到了1200步。对应到每1亿个栅极的制造成本上，我们从图中可以清楚地看到，从90nm工艺到7nm工艺，生产成本先下降后上升。这就使得摩尔定律的另一种表述形式——“同样性能的新品价格每18-24个月减半”不再成立。未来我们很可能见到的情况是，搭载了顶级技术和工艺生产出来的芯片的电子产品或设备价格高昂，超过了一般消费者的承受力度。

每1亿个栅极的制造成本、图片来源：MarvellTechnology,2020InvestorDay

不过算力层的这个变化让半导体制造企业受益最大，因为只要需求存在，台积电、三星、英特尔等几家掌握先进工艺的厂商就会持续投入资金和人力，不断设计和制造新一代芯片，然后根据自身成本给产品定价。

想要彻底解决摩尔定律失效的问题，需要跳出当前芯片设计的冯·诺依曼结构。类脑芯片、存算一体、寻找基于硅以外的新材料制造芯片，甚至量子计算等等都是潜力巨大的解决方案，但是这些方案距离成熟落地还非常遥远（最乐观地估计也需要几十年的时间），无法解决当下芯片行业的困局。在这段时期内，行业内为了提升芯片性能，开始广泛应用Chiplet技术，或者使用碳基芯片、光芯片等等。

Chiplet技术

Chiplet技术的原理有点类似搭积木，简单来说就是把一堆小芯片组合成一块大芯片。这种技术能够以较低的成本制造过于复杂的芯片，并且保证足够优秀的良率，从2012年开始就逐步被使用。当前Chiplet技术已经能够在二维平面上实现用不同的材料和工艺加工拼接的小核心，Intel等公司正在把Chiplet技术引入新的阶段发展：在垂直方向上堆叠多层小核心，进一步提升芯片的性能（例如Intel于2018年开发的Foveros3DChiplet）。不过Chiplet技术路线面临的最大问题来源于芯片热管理方面：如果在三维结构上堆叠多层小核心，传统的通过CPU顶部铜盖一个面散热的方案将无法解决发热问题，因此可能需要在芯片的内部嵌入冷却装置来解决发热功率过高的问题。

碳纳米管技术

使用碳纳米管可能是另一个短期解决方案。这项技术属于碳基芯片领域，具体来说就是用碳纳米管承担芯片里基础元件开关的功能，而不是像传统芯片一样使用掺杂的半导体硅来传输电子。这种技术的优势在于导电性好、散热快、寿命长，而且由于其本质上仍然保留了冯·诺依曼架构，当前的生产工艺、产业链等匹配设施都不需要做出太大的调整。但是目前碳纳米管的大规模生产和应用还有一些困难，距离把碳纳米管按照芯片设计的要求制造出来可能还需要几十年。

短期内，围绕Chiplet技术在热管理方面的探索，和碳纳米管技术的灵活生产制造突破是算力层面上我们重点关注的机会。当然，我们也要了解目前类脑芯片、存算一体和量子计算等终局解决方案的相关情况。这里为大家简单介绍如下：

类脑芯片

类脑芯片的灵感源于人脑。类脑芯片和传统结构的差异体现在两方面：第一，类脑芯片中数据的读取、存储和计算是在同一个单元中同时完成的，也即“存算一体”；第二，单元之间的连接像人类神经元之间的连接一样，依靠“事件驱动。

目前，类脑芯片的相关研究分为两派。一派认为需要了解清楚人脑的工作原理，才能模仿人类大脑设计出新的结构。但是目前人类对人脑的基本原理理解得仍然很粗浅，因此这一派取得的进展相当有限。另外一派则认为，可以先基于当前已有的生物学知识，比照人脑的基础单元设计出一些结构，然后不断试验、优化、取得成果，实现突破。目前这一派的研究人员依照神经元的基础结构，给类脑芯片做了一些数学描述，也搭建了模型，并且做出了不少可以运行的芯片。

存算一体

存算一体可以简单被概括为“用存储电荷的方式实现计算”，彻底解决了冯诺依曼结构中“存储”和“计算”两个步骤速度不匹配的问题（事实上，在以硅为基础的半导体芯片出现之后，存算速度不匹配的情况就一直存在）。存算一体机构在计算深度学习相关的任务时表现突出，能耗大约是当前传统计算设备的百分之一，能够大大提升人工智能的性能。除此之外，这种芯片在VR和AR眼镜等可穿戴设备上有广阔的应用前景，也能推动更高分辨率的显示设备价格进一步降低。

目前，存算一体仍然有两个问题没有突破：第一是基础单元（忆阻器）的精度不高，其次是缺少算法，在应对除了矩阵乘法以外的计算问题时表现远不如冯·诺依曼结构的芯片。

量子计算

量子计算是用特殊的方法控制若干个处于量子叠加态的原子，也叫作“量子”，通过指定的量子态来实现计算。量子计算机最适合的是面对一大堆可能性的时候，可以同时对所有可能性做运算。为了从所有的结果中找一个统计规律，我们需要使用量子计算机进行多次计算。不过由于退相干的问题，量子计算很容易出错。目前量子计算的纠错方法有待突破，只有解决了这个问题量子计算才可能被普遍使用。

当前量子计算机体积过大、运行环境严苛、造价昂贵。目前来看量子计算与经典计算不是取代与被取代的关系，而是在对算力要求极高的特定场景中发挥其高速并行计算的独特优势。中科大的量子物理学家陆朝阳曾总结道，“到目前为止，真正可以从量子计算中受益的实际问题仍然非常有限，享受指数级加速的就更少了——其他的仅有更有限的加速”。

总体而言，量子计算机的相关成果都只停留在科学研究的阶段，距离实际应用还很遥远。

2.算法

算法层指各类机器学习算法。如果根据训练方法来分类，机器学习算法也可以分成“无监督学习”、“监督学习”和“强化学习”等。按照解决问题的类型来分，机器学习算法包括计算机视觉算法（CV）、自然语言处理算法（NLP）、语音处理和识别算法（ASR）、智慧决策算法（DMS）等。每个算法大类下又有多个具体子技术，这里我们为大家简单介绍：

2.1计算机视觉

计算机视觉的历史可以追溯到1966年，当时人工智能学家Minsky要求学生编写一个程序，让计算机向人类呈现它通过摄像头看到了什么。到了1970-1980年代，科学家试图从人类看东西的方法中获得借鉴。这一阶段计算机视觉主要应用于光学字符识别、工件识别、显微/航空图片的识别等领域。

到了90年代，计算机视觉技术取得了更大的发展，也开始广泛应用于工业领域。一方面是由于GPU、DSP等图像处理硬件技术有了飞速进步；另一方面是人们也开始尝试不同的算法，包括统计方法和局部特征描述符的引入。进入21世纪，以往许多基于规则的处理方式，都被机器学习所替代，算法自行从海量数据中总结归纳物体的特征，然后进行识别和判断。这一阶段涌现出了非常多的应用，包括相机人脸检测、安防人脸识别、车牌识别等等。

2010年以后，深度学习的应用将各类视觉相关任务的识别精度大幅提升，拓展了计算机视觉技术的应用场景：除了在安防领域应用外，计算机视觉也被应用于商品拍照搜索、智能影像诊断、照片自动分类等场景。

再细分地来看，计算机视觉领域主要包括图像处理、图像识别和检测，以及图像理解等分支：

图像处理：指不涉及高层语义，仅针对底层像素的处理。典型任务包括图片去模糊、超分辨率处理、滤镜处理等。运用到视频上，主要是对视频进行滤镜处理。这些技术目前已经相对成熟，在各类P图软件、视频处理软件中随处可见；

图像识别和检测：图像识别检测的过程包括图像预处理、图像分割、特征提取和判断匹配，可以用来处理分类问题（如识别图片的内容是不是猫）、定位问题（如识别图片中的猫在哪里）、检测问题（如识别图片中有哪些动物、分别在哪里）、分割问题（如图片中的哪些像素区域是猫）等。这些技术也已比较成熟，图像上的应用包括人脸检测识别、OCR（光学字符识别）等，视频上可用来识别影片中的明星；

图像理解：图像理解本质上是图像与文本间的交互，可用来执行基于文本的图像搜索、图像描述生成、图像问答（给定图像和问题，输出答案）等。图像理解任务目前还没有取得非常成熟的结果，商业化场景也正在探索之；

总体而言，计算机视觉已经达到了娱乐用、工具用的初级阶段。未来，计算机视觉有望进入自主理解、甚至分析决策的高级阶段，真正赋予机器“看”的能力，从而在智能家居、无人车等应用场景发挥更大的价值。

2.2语音识别

第一个真正基于电子计算机的语音识别系统出现在1952年。1980年代，随着全球性的电传业务积累了大量文本可作为机读语料用于模型的训练和统计，语音识别技术取得突破：这一时期研究的重点是大词汇量、非特定人的连续语音识别。1990年代，语音识别技术基本成熟，但识别效果与真正实用还有一定距离，语音识别研究的进展也逐渐趋缓。

随着深度神经网络被应用到语音的声学建模中，人们陆续在音素识别任务和大词汇量连续语音识别任务上取得突破。而随着循环神经网络（RNN）的引入，语音识别效果进一步得到提升，在许多（尤其是近场）语音识别任务上达到了可以进入人们日常生活的标准。以AppleSiri为代表的智能语音助手、以Echo为首的智能硬件等应用的普及又进一步扩充了语料资源的收集渠道，为语言和声学模型的训练储备了丰富的燃料，使得构建大规模通用语言模型和声学模型成为可能。

与语音识别紧密关联的是语音处理。语音处理为我们提供了语音转文字、多语言翻译、虚拟助手等一系列软件。一个完整的语音处理系统，包括前端的信号处理、中间的语音语义识别和对话管理（更多涉及自然语言处理），以及后期的语音合成。

前端信号处理：语音的前端处理涵盖说话人声检测、回声消除、唤醒词识别、麦克风阵列处理、语音增强。

语音识别：语音识别的过程需要经历特征提取、模型自适应、声学模型、语言模型、动态解码等多个过程。

语音合成：语音合成的几个步骤包括文本分析、语言学分析、音长估算、发音参数估计等。基于现有技术合成的语音在清晰度和可懂度上已经达到了较好的水平，但机器口音还是比较明显。目前的几个研究方向包括如何使合成语音听起来更自然、如何使合成语音的表现力更丰富，以及如何实现自然流畅的多语言混合合成。

2.3自然语言处理

早在1950年代，人们就有了自然语言处理的任务需求，其中最典型的就是机器翻译。到了1990年代，随着计算机的计算速度和存储量大幅增加、大规模真实文本的积累产生，以及被互联网发展激发出的、以网页搜索为代表的基于自然语言的信息检索和抽取需求出现，自然语言处理进入了发展繁荣期。在传统的基于规则的处理技术中，人们引入了更多数据驱动的统计方法，将自然语言处理的研究推向了一个新高度。

进入2010年以后，基于大数据和浅层、深层学习技术，自然语言处理的效果得到了进一步优化，出现了专门的智能翻译产品、客服机器人、智能助手等产品。这一时期的一个重要里程碑事件是IBM研发的Watson系统参加综艺问答节目Jeopardy。机器翻译方面，谷歌推出的神经网络机器翻译（GNMT）相比传统的基于词组的机器翻译（PBMT），在翻译的准确率上取得了非常强劲的提升。

自然语言处理从流程上看，分成自然语言理解（NLU）和自然语言生成（NLG)两部分，这里我们简单为大家介绍知识图谱、语义理解、对话管理等研究方向。

知识图谱：知识图谱基于语义层面，对知识进行组织后得到的结构化结果，可以用来回答简单事实类的问题，包括语言知识图谱（词义上下位、同义词等）、常识知识图谱（“鸟会飞但兔子不会飞”）、实体关系图谱（“刘德华的妻子是朱丽倩”）。知识图谱的构建过程其实就是获取知识、表示知识、应用知识的过程。

语义理解：核心问题是如何从形式与意义的多对多映射中，根据当前语境找到一种最合适的映射。以中文为例，需要解决歧义消除、上下文关联性、意图识别、情感识别等困难。

对话管理：为了让机器在与人沟通的过程中不显得那么智障，还需要在对话管理上有所突破。目前对话管理主要包含三种情形：闲聊、问答、任务驱动型对话。

2.4规划决策系统

真正基于人工智能的规划决策系统出现在电子计算机诞生之后。1990年代，硬件性能、算法能力等都得到了大幅提升，在1997年IBM研发的深蓝（DeepBlue）战胜国际象棋大师卡斯帕罗夫。到了2016年，硬件层面出现了基于GPU、TPU的并行计算，算法层面出现了蒙特卡洛决策树与深度神经网络的结合。人类在完美信息博弈的游戏中已彻底输给机器，只能在不完美信息的德州扑克和麻将中苟延残喘。人们从棋类游戏中积累的知识和经验，也被应用在更广泛的需要决策规划的领域，包括机器人控制、无人车等等。

2.5算法的发展趋势和面临的瓶颈

近年来。处在机器学习也产生了几个重要的研究方向，例如从解决凸优化问题到解决非凸优化问题，以及从监督学习向非监督学习、强化学习的演进：

从解决凸优化问题到解决非凸优化问题

目前机器学习中的大部分问题，都可以通过加上一定的约束条件，转化或近似为一个凸优化问题。凸优化问题是指将所有的考虑因素表示为一组函数，然后从中选出一个最优解。而凸优化问题的一个很好的特性是局部最优就是全局最优。这个特性使得人们能通过梯度下降法寻找到下降的方向，找到的局部最优解就会是全局最优解。

然而在现实生活中，真正符合凸优化性质的问题其实并不多，目前对凸优化问题的关注仅仅是因为这类问题更容易解决。人们现在还缺乏针对非凸优化问题的行之有效的算法。

从监督学习向非监督学习、强化学习的演进

目前来看，大部分的AI应用都是通过监督学习，利用一组已标注的训练数据，对分类器的参数进行调整，使其达到所要求的性能。但在现实生活中，监督学习不足以被称为“智能”。对照人类的学习过程，许多都是建立在与事物的交互中，通过人类自身的体会、领悟，得到对事物的理解，并将之应用于未来的生活中。而机器的局限就在于缺乏这些“常识”。

无监督学习领域近期的研究重点在于“生成对抗网络”（GANs），而强化学习的一个重要研究方向在于建立一个有效的、与真实世界存在交互的仿真模拟环境，不断训练，模拟采取各种动作、接受各种反馈，以此对模型进行训练。

从“堆数据”到研发低训练成本的算法

MITDigitalLab的研究者联合韩国的相关机构在2020年发表了一项基于1058篇深度学习的论文和数据的研究。在分析了现有的深度学习论文成果后，研究人员提出了一个悲观的预言：深度学习会随着计算量的限制，在到达某个性能水平后停滞不前，因为在深度学习领域有这样一条规律：想提升X倍的性能，最少需要用X^2倍的数据去训练模型，且这个过程要消耗X^4倍的计算量。即便是10倍性能提升和1万倍计算量的提升，这样失衡的比例关系也仅仅是理论上最优的。在现实中，提升10倍性能往往要搭上10亿倍的运算量。以今天地球资源的状况看，想把一些常用的模型错误率降低到人们满意的程度，代价高到人类不能承受。因此，在深度学习领域非常值得关注的是可大幅降低训练成本的新算法创新。

图像分类、物体识别、语义问答等多个领域AI算法准确率及对应所需算力(Gflops）、碳排放量和经济成本

（Today水平截止于2020年已经发表的成果）

3.数据

数据层指的是人工智能为不同的行业提供解决方案时所采集和利用的数据。事实上，使用人工智能解决问题的步骤绝不仅仅包括搜集和整理数据。这里我们简单介绍一下完整的流程和思路：

收集数据：数据的数量和质量直接决定了模型的质量。

数据准备：在使用数据前需要对数据进行清洗和一系列处理工作。

模型选择：不同的模型往往有各自擅长处理的问题。只有把问题抽象成数学模型后，我们才能选择出比较适合的模型，而这一步往往也是非常困难的。

训练：这个过程不需要人来参与，机器使用数学方法对模型进行求解，完成相关的数学运算。

评估：评估模型是否较好地解决了我们的问题。

参数调整：可以以任何方式进一步改进训练（比如调整先前假定的参数）。

预测：开始使用模型解决问题。

如果我们想利用人工智能解决的问题被限定在足够小的领域内，那么我们就更容易活动具体场景下的训练数据，从而更高效、更有针对性地训练模型。在金融、律政、医疗等行业的细分场景下，人工智能已经逐步被应用，且已经实现了一定的商业化。

一、为什么是机器人

1.机器人的外延及框架

虽然机器人产业已有超过60年发展史，在传统【工业机器人】及【服务机器人】分析框架下，全球机器人产业仅有300-400亿美元行业规模，但我们认为，在智能化加持下，机器人的外延及边界已被数倍扩大，新物种的诞生及传统设备的智能化将共同驱动“机器人”产业十倍及百倍增长。

概括来讲，机器人普遍存在的意义是“为人类服务”的可运动智能设备，包括机器人对于人类劳动的替代、完成人类所无法完成任务的能力延伸以及情感陪伴等价值。

面对人类对于物质及精神永不停止的需求增长，相对于元宇宙，机器人将会是“现实宇宙”中的最佳供给方案。

2.AI将会带给机器人怎样的质变

（1）智能化大幅提升

可软件升级：传统机器人无法实现软件算法在线升级，智能化机器人能够通过软件算法的迭代持续提升性能；这让机器人的能力理论上是没有上限的

规模效应：机器人应用规模越大，收集数据越多，算法迭代越完善，机器人越好用

可适用性大幅增加：机器人智慧程度线性增加，可适用的场景及价值将会指数增加

（2）智能化带来的场景适用性提升

AI技术将会是机器人全面爆发的最大变量，机器人产业的爆发极有可能是新物种引领；例如近三年全面爆发的机器人项目，在10年前几乎不存在（例如九号公司、石头科技、普渡、擎朗、云迹、高仙、梅卡曼德、极智嘉等）。

二、为什么是现在？

1.劳动力替代及升级趋势不可逆

在人口老龄化趋势下，2015-2020年，我国劳动力人口减少约1700万人，我国人均收入从4.97万元增至7.15万元，在用工难及用工贵的不可逆趋势下，智能化机器人的补充成为最重要的生产力增长点。

2021年我国人均GDP已超1.2万美元，在我国将成为全球人口最多的高收入国家（门槛为人均1.25万美元）的进程中，作为全球最大的制造业大国转型升级，将会带来全世界体量最大的机器人用工需求。

2.成熟的技术与产业基础

我们认为，智能手机及智能汽车产业的发展，实质上为现阶段智能机器人产业爆发奠定了大量技术基础：

感知层面：视觉模组、激光雷达、毫米波雷达的逐渐发展，成本降低到可用的程度；数据采集、算法训练及软件在线迭代为智能机器人未来持续升级提供了借鉴范式；

决策层面：智能SoC芯片提供了足够的算力基础，汽车自动驾驶与移动机器人在底层技术上亦有相通之处；

控制层面：近十年锂电技术提升了电池续航能力，同时有线及无线充电技术快速进步，5G及WIFI技术发展为机器人提供了通讯控制基础；

环境基础：我国拥有全世界最适合机器人产业发展的土壤，例如低成本敏捷供应链、低成本清洁能源供给、工程师红利、最广大数据收集场景；现阶段创造一款机器人新品的零配件采购难度要远低于十年前；

三、如何判断未来十年新机遇

1.从职业场景出发——寻找未被满足的大赛道

我们认为投资机构在机器人领域投的并不单纯是智能硬件或国产替代，而是押注未来数个万亿级、数十个千亿级、上百个百亿级工作场景的无人化；未来机器人公司主流定价方式很可能取决于可替代的必要劳动价值，机器人公司直接提供高粘性持续的收费服务（RobotasaService），而非按照传统的“BOM成本+一定的毛利空间”去定价。

我们收集了不同职业场景的从业人数及人均收入数据，得出不同职业劳动力成本总和，制作了机器人领域潜在替代场景图谱。

未来机器人对于人工的替代将从大场景、低复杂度入手，逐步向中小型场景、高复杂度渗透；未来10年最有潜力的投资方向将会是现阶段供给基本空白的大场景。

数据来源：国家统计局等机构

上图部分职业又可细分出上百个环节（根据“十四五”机器人发展规划）

（1）制造业：焊接、自动搬运、防爆物品生产、分拣、包装、协作生产、打磨、装配等工作

（2）建筑业：建筑部件智能化生产、测量、材料配送、钢筋加工、混凝土浇筑、楼面墙面装饰装修、构部件安装、焊接等工作

（3）农业：可进一步拆分为果园除草、精准植保、果蔬剪枝、采摘收获、分选，以及用于畜禽养殖业的喂料、巡检、清淤泥、清网衣附着物、消毒处理等工作

（4）矿业：采掘、支护、钻孔、巡检、重载辅助运输等工作

（5）医疗康复：手术、护理、检查、康复、咨询、配送等工作

（6）养老助残：助行、助浴、物品递送、情感陪护、智能假肢等应用

（7）家用场景：家务劳动、教育、娱乐、安防监控等工作

（8）公共场所：讲解导引、餐饮、配送、代步等工作

（9）水下场景：水下探测、监测、作业、深海矿产资源开发等工作

（10）安防场景：安保巡逻、缉私安检、反恐防暴、勘查取证、交通管理、边防管理、治安管控等工作

（11）危险环境作业：消防、应急救援、安全巡检、核工业操作、海洋捕捞等工作

（12）卫生防疫：检验采样、消毒清洁、室内配送、辅助移位、辅助巡诊查房、重症护理辅助操作等工作

2.从技术可行性出发——细分场景的实现难度

（1）从【场景是否单一】及【工作复杂度】两个维度进行分析

分析一项职业被机器人替代的难度，我们认为可以落入以下四个象限进行分析；其中场景维度指该项工作是否需要适应多变的环境，是否需要转移；复杂度指完成该项工作需要的知识储备多少及解决问题的难度

A.单一场景、低复杂度：例如简单的加工制造工序、搬运、安保、清洁、农业养殖等劳动更容易率先实现机器替代

B.单一场景、高复杂度：例如绘画、音乐演奏、作家、医生、教育、财务、销售、厨师等场景

C.多场景、低复杂度：例如应对不同场景下的无人驾驶，不同种类的家务劳动

D.多场景、高复杂度：例如警察、外交官、企业管理人员、研发创新等工作

（2）从机器与人类的思维长处分析

机器智能在大规模数据与信息处理、细节分析等方面具备天然优势

在需要情感、综合推理、想象力、创造力等方面的职业，人类被机器人替代的难度较大

3.从经济性出发——替代人效比

如何判断某个细分场景下，是否已经到达了机器人应用拐点？我们认为核心指标是替代人效比，即机器人的购买及维护成本相对于同岗位人力成本的回本周期

ROI＜48个月时，该细分赛道会有产品出现，客户开始考虑尝试

ROI＜24个月时，该细分赛道客户开始批量购买测试

ROI＜12个月时，市场开始全产爆发

经济性逐渐提升背后的因素：人员成本上涨、人力紧缺、上游零配件成本下降、规模量产降低了成本、AI技术发展使得功能实现的成本降低等

四、机器人智能化三要素解析

什么样的机器人能够称得上是智能机器人？目前世界范围内还没有一个统一定义

我们认为如果对智能机器人进行抽象化解析，往往需要具备三大要素——即感知、决策和控制。

感知要素：用来认识周围环境状态，包括能感知视觉、接近、距离等的非接触型传感器和能感知力、压觉、触觉等的接触型传感器。这些要素实质上就是相当于人的眼、鼻、耳等五官,功能可以利用诸如摄像机、像传感器、超声波传成器、激光器、导电橡胶、压电元件、气动元件、行程开关等机电元器件来实现。

决策要素：也称为思考要素，根据传感器收集的数据，思考出采用什么样的动作。智能机器人的思考要素是三个要素中的关键。思考要素包括有判断、逻辑分析、理解等方面的智力活动。这些智力活动实质上是一个信息处理过程，而计算机则是完成这个处理过程的主要手段。

控制要素：也称为运动要素，对外界做出反应性动作；对运动要素来说，智能机器人需要有一个无轨道型的移动机构，以适应诸如平地、台阶、墙壁、楼梯、坡道等不同的地理环境。它们的功能可以借助轮子、履带、支脚、吸盘、气垫等移动机构来完成。在运动过程中要对移动机构进行实时控制，这种控制不仅要包括有位置控制，而且还要有力度控制、位置与力度混合控制、伸缩率控制等。

从商业机会的角度来讲，三大要素并不是独立割裂的，例如做视觉传感器的玩家往往要配套相应的软件算法，服务于各细分场景的厂商需要极强的多传感器融合、多机型控制及面向行业的智能决策能力。

三大要素中既有专精于某一环节的零部件或软件供应商机会（如核心零部件、操作系统、关键控制算法等），也有整合了其中2-3个环节的关键技术要素，为细分场景提供全套服务的应用机会（例如在清洁、配送、交通等场景的机器人服务商）。

1.感知——机器人感觉器官

（1）传感器分类

内部传感器：内部传感器是用于测量机器人自身状态的功能元件，其功能是测量运动学量和力学量，用于机器人感知自身的运动状态，使得机器人可以按照规定的位置、轨迹和速度等参数运动；包括位置传感器、速度传感器、加速度传感器、力传感器、压力传感器、力矩传感器、姿态传感器等。

外部传感器：外部传感器主要是感知机器人自身所处环境以及自身和环境之家的相互信息，包括视觉、力觉等。包括激光雷达、嗅觉传感器、视觉传感器、语音合成、语音识别、可见光和红外线传感器等。

（2）传感器在智能机器人的应用

视觉和接近传感器：类似于自动驾驶车辆所需的传感器，包括摄像头、红外线、声纳、超声波、雷达和激光雷达。某些情况下可以使用多个摄像头，尤其是立体视觉。将这些传感器组合起来使用，机器人便可以确定尺寸，识别物体，并确定其距离。

触觉传感器：微型开关是接触传感器最常用型式，另有隔离式双态接触传感器(即双稳态开关半导体电路)、单模拟量传感器、矩阵传感器(压电元件的矩阵传感器、人工皮肤——变电导聚合物、光反射触觉传感器等)。

射频识别（RFID）传感器：可以提供识别码并允许得到许可的机器人获取其他信息。

声学传感器（麦克风）：帮助机器人接收语音命令并识别熟悉环境中的异常声音。如果加上压电传感器，还可以识别并消除振动引起的噪声，避免机器人错误理解语音命令。先进的算法甚至可以让机器人了解说话者的情绪。

湿温度传感器：是机器人自我诊断的一部分，可用于确定其周遭的环境，避免潜在的有害热源。利用化学、光学和颜色传感器，机器人能够评估、调整和检测其环境中存在的问题。

运动稳定性感知：对于可以走路、跑步甚至跳舞的人形机器人，稳定性是一个主要问题。它们需要与智能手机相同类型的传感器，以便提供机器人的准确位置数据。在这些应用采用了具有3轴加速度计、3轴陀螺仪和3轴磁力计的9自由度（9DOF）传感器或惯性测量单元（IMU）。

传感器微型化趋势：过去传感器的性能与体积往往成正比，限制了其在机器人领域应用。芯片制程技术提升使微型传感器的制造成为可能，从而广泛应用于机器人领域。

（3）多传感器融合是未来趋势

多传感器信息融合技术是近年来十分热门的研究课题，指综合来自多个传感器的感知数据,经过融合的多传感器系统能够更加完善、精确地反映检测对象的特性,消除信息的不确定性,提高信息的可靠性。融合后的多传感器信息具有以下特性:冗余性、互补性、实时性和低成本性。

多传感器信息融合方法主要有贝叶斯估计、Dempster-Shafer理论、卡尔曼滤波、神经网络、小波变换等。

2.决策——机器人大脑

机器人决策我们认为是最具场景差异化的部分，因为不同职业场景下的工作方式、思维逻辑是大相径庭的；在机器人算法与决策方面的创业团队需要非常熟悉场景需求，提炼出标准化的操作流程，然后应用于机器人软硬件控制中。

想要让机器人解决问题我们需要完成三个步骤：第一，明确问题的方向和边界；第二，建立数学模型；最后，找到合适的算法解决问题。这里我们重点讨论将复杂的现实问题转化为数学语言的“建模”过程和选择算法的过程。

建模的第一步需要确定假设。我们需要先明确想让机器人做出什么样精度的决策，以及能否实现，从而确定需要考虑和舍弃哪些要素。在确定了重要变量和核心关系后，我们就把复杂的现实问题转化成计算机可以理解、算法可以处理的数学问题。确定假设后，常识能帮助我们验证模型，但是多数情况下需要我们不断地将模型和现实问题作比较，从而把现实问题尽可能无损地映射进计算机里面。

在建立了模型后，我们需要选择合适的算法来解决不同模型对应的具体现实问题。在进行算法选择的时候需要具体问题具体分析，兼顾“质量”与“效率”。比如同样是让计算机处理图像数据，家庭场景下的扫地机器人和专门用来处理天文观测数据的计算机对算法要求就不一样：前者要求在较快的时间内完成对图像精准度适中的处理，而后者对时间则无感，对精准度有极高的要求。也正是因为绝大多数问题不存在唯一解或者绝对正确的解，算法工程师需要根据机器人工作的场景和目标做出最合适的取舍。

在机器人决策环节中，让机器人自身的硬件处理多少计算任务是一个关键的问题。通常情况下，如果任务的执行依赖于多个机器人采集的多点数据，那么计算任务就更可能在多点数据汇集起来后，被放在远端的云服务器上进行处理。比如，如果有大量的机器人在特定的街区内追捕嫌犯，那么我们就需要所有机器人把采集到的图像等信息上传到云端处理，在一个“大脑中枢”规划了每一个机器人的路径后，每个机器人执行自己所接收到的指令。当然，多数情况下应用云计算的场景是，每个机器人自身的芯片算力不足或者单位能耗过大。云计算提供了一种更加经济的算力解决方案，帮助机器人解决所面临的问题。在此基础上，为了避免网络带宽不足、处理时间过长等问题，人们还会使用边缘计算、雾计算等方案。

以上是机器人决策部分所需要考虑的共性问题。当然，不同场景下机器人所面临的的决策问题非常不同，我们认为这也是机器人应用中最具场景差异化的部分。不过站在更高的维度上进行抽象后，我们依然能够发现大多数机器人都需要面对三大类决策问题：按照什么规则移动位置——移动决策、按照什么规则调整自身——机械臂运动决策，以及如何保障贯彻人类指令——人机交互决策。

（1）平面移动能力

定位导航技术需要机器人的感知能力，需要借助视觉传感器（如激光雷达）来帮助机器人完成周围环境的扫描，并配合相应的算法，构建有效的地图数据，以完成运算，最终实现机器人的自主定位导航。

同步定位：主要涉及激光SLAM以及视觉SLAM。前者主要采用2D或3D激光雷达进行数据搜集，后者主要有两种技术路径——基于RGBD的深度摄像机和基于单目、双目或鱼眼摄像头。

地图构建：机器人学中的地图构建主要有4种：栅格地图、特征点地图、直接表征法以及拓扑地图。

路径规划：路径规划是导航研究中的一个重要环节，主要方法有3种：基于事例的学习方法、基于环境模型的规划方法、基于行为的路径规划方法。

（2）三维空间运动能力

空间机械臂操控过程中涉及的5项关键技术，包括：交会对接与捕获技术、自主规划与智能控制技术、传感与感知技术、智能协同与操控技术及系统安全保障技术。

视觉系统的是智能机械臂三维运动最重要的组成部分，主要由计算机、摄影设备及图像采集设备构成。机器人视觉系统工作过程主要有图像采集、图像分析、图像输出等，其中，图像特征分析、图像辨别、图像分割均为关键任务，视觉信息的压缩和滤波处理、特定环境标志识别、环境和故障物检测等是视觉信息处理中难度最大、最核心的过程。

（3）人机交互能力

语音交互：结合语音人机交互过程，人机交互中的关键技术中包含了自然语音处理、语义分析和理解、知识构建和学习体系、语音技术、整合通信技术以及云计算处理技术。

视觉交互：机器人如果需要理解人类的感情，就会涉及人脸识别技术，包括特征提取及分类。

手势交互：目前，常用的手势识别方法主要包括基于神经网络的识别方法、基于隐马尔可夫模型的识别方法和基于几何特征的识别方法。

3.控制——机器人运动能力

（1）常见的运动控制部件

机器人三大核心零部件为减速器、伺服电机、控制器，三大部件成本占机器人成本70%左右，其中减速器占成本构成35%左右，伺服电机占23%左右，控制器占12%左右。

我国工业机器人零部件目前仍处于追赶者，核心零部件主要依赖进口，但国产厂商（如埃斯顿、汇川技术、绿的谐波等）目前正在由守转攻的转折点，市占率即将超过50%，正在开始获得国外头部客户订单；我们认为机器人核心零部件进口只是短期问题，未来3-5年我国在制造水平及成本上有望全面赶超国外水平。

在服务机器人领域（如餐饮、清洁、递送等机器人），我国零部件及本体制造已达到全球领先水平；在供应链优势下，技术及成本上有望进一步突破。

数据来源：公司公告、浙商证券研究所，部分国产份额为预估值

（2）机器人运动如何进一步发展

与其他形态的机器人（如履带式、轮式等）相比，腿足式机器人在移动范围和灵活性上有巨大优势。但是实现行走乃至跑跳对腿足式机器人来说并不容易，除了BostonDynamics研发的腿足式机器人（如Atlas）之外，我们很少看到其他公司研发出灵活的、具有优秀平衡感腿足式机器人

要想让机器人像人一样灵巧、平稳地移动，并在此基础上完成复杂的任务，机器人的每一步都需要动态平衡，需要对瞬间的不稳定性有极强的适应能力。这包括需要快速调整脚的着地点，计算出突然转向需要施加多大的力，更重要的是还要在极短的时间内向足部实施非常大而又精准的力。这对控制理论、系统集成和工程实现等多个

人工智能时代是什么时代?

工业4.0是2013年的汉诺威工业博览会上德国为提升工业竞争力而提出的一个概念。基于工业发展的不同阶段划分出4个时代，即工业1.0蒸汽机时代、工业2.0电气化时代、工业3.0信息化时代和工业4.0智能化时代。显然，这种划分只表示了工业革命以来工业领域的时代变迁。如果说“蒸汽机”、“电气化”可以表示工业革命内涵，那么“信息化”、“智能化”就远远超出了工业领域。把人工智能时代称为第4次工业革命时代显然是错误的。

在“第4次工业革命”这一错误概念的影响下，对人工智能时代性的理解出现了许多混乱。仅从工业生产力变迁的角度来看，划分成蒸汽机工业革命、电气化工业革命、信息化工业革命、智能化工业革命时代，的确具有一定道理，但是，如果把它泛化，认为人工智能的智能化是第4次工业革命时代，甚至由此衍生出第5次工业革命、第6次科技革命、第N次工业革命的提法，显然模糊了人工智能的知识革命与工业革命的本质差异。我们可以从以下5个方面看看人工智能时代与工业革命时代的本质差异:

(1)社会生产力结构的本质差异

工业革命后形成了资本整合下的社会化大生产，其社会生产力结构是“劳动者+机械化工具”，劳动者在知识基础上驾驭工具；人工智能时代，在半导体微处理基础上诞生了智能化工具，智能化工具超越了生产领域、经济领域，全面影响人类社会生活，并且具有独立的财富生产能力，其生产力结构变成了“管理者+智能化工具”。

(2)生产工具的本质差异

机械化工具与智能化工具有本质差异，前者无自主能力，必须由劳动者驾驭，后者有自主能力，可以在无人介入下自主式工作。工业革命后期虽然出现过可以自主运行的自动化工具，但不具有智能行为，它们与计算机软件控制的智能化工具有本质不同。

(3)体力劳动与脑力劳动替代的本质差异

工业革命后，机械化工具以蒸汽机械(以及后来的内燃机械、电动机械)代替劳动者的体力劳动，而人工智能时代，智能化工具普遍代替了人类的脑力劳动。

(4)知识相关性的本质差异

工业革命时代，“知识就是力量”是著名的时代口号，因为驾驭机械化工具都需要相应的知识，工人、技师、工程师形成了严格的知识与技术等级；在人工智能时代，智能化工具具有智力行为能力，使用者不需要有相应的知识。知识与知识行为分离，成为人工智能时代的重要特点。

(5)从经济变革到社会变革的本质差异

工业革命的主要变革是经济基础；人工智能变革后的数字化社会、区块链的无偏见人工智能、诚信体制建设等，从经济基础延伸至上层建筑。同时，从资本时代到金融时代、从贸易全球化到经济全球化、从两种文化到第3种文化，都表明人工智能时代从经济基础到上层建筑的延伸效应。

3人工智能时代是第3次浪潮时代

最早揭示人工智能时代与工业革命时代具有本质差异的是著名的未来学者阿尔文·托夫勒。1980年，阿尔文·托夫勒推出了《第三次浪潮》一书，该书将人类现代文明史划分为3个浪潮时代。阿尔文·托夫勒在书中写道:“到目前为止，人类经历了两次重大的变化浪潮，每一次都抹杀了早期的文化和文明，以前人不能想象的生活方式取而代之。第1次浪潮—农业革命—经历了几千年才结束。第2次浪潮—工业文明的崛起—只有300年的寿命。今天的历史速度更快，很可能第3次浪潮将横扫历史，在几十年内结束。”他十分明确地将“今天的历史”与工业革命时期相分割。26年之后，他在2006年出版的《财富的革命》一书中，将“今天的历史”定义为“知识经济”时代，即一个知识创造财富的时代。

阿尔文·托夫勒首先清醒地、科学地认识到“今天的历史”的时代特征与时代本质，它与“机器”创造财富的工业文明完全不同，是一个用“知识”创造财富的时代。托夫勒还天才地描绘了人类现代文明发展史，几千年农业文明、几百年工业文明、几十年知识经济文明演化速度的倍增现象。所有这些都集中反映人工智能时代托夫勒的知识革命观。必须从知识的本源出发，用知识的创新原理来探索人工智能时代的奥秘。不幸的是，托夫勒未能揭示知识革命的奥秘，对“知识”充满了无奈与绝望。

4人工智能时代是知识革命时代

托夫勒敏锐地认识到，人工智能时代是知识创造财富的知识革命时代，但是，对“知识经济”的定义以及“知识创造财富”的知识革命论述却显得苍白无力。在后来《财富的革命》一书中，他充满了悲观与无奈。托夫勒说:“尽管对新兴的知识经济有着数千种分析和研究，但是，知识对创造财富的影响却一直被低估了，而且现在仍然在被低估。”他充分认识到知识经济时代的知识主导作用、知识探索的重要性，书中也描述了人们对“知识”的无知、漠视与无奈，他在书中写道:知“识已经成为我们经济和社会环境中变化最快的组成部分之一。”“自从‘知识经济’开始半个世纪以来，关于知识经济背后的‘知识’我们却了解得很少，简直少得让我们感到尴尬。托”夫勒虽然界定了今天的时代是与工业革命完全不同的知识创造财富的时代，但是并没有回答知识如何创造财富。这是人工智能时代知识革命必须回答的问题。

“知识创造财富”贯穿于人类的全部历史进程中。在原始社会，人类在知识基础上打造工具、使用工具，开创了“人+工具”的社会生产力的基本结构。其后，一直延续到农业社会、工业社会以及人工智能社会。只是人工智能社会之前的生产力结构是“(人+知识)+工具”，即劳动者在知识基础上驾驭工具；人工智能的社会生产力结构变成了“人+(知识+工具)，”即人类将知识成果转移到智能化工具中，劳动者傻瓜化地使用智能化工具，出现了知识从“人”到“工具”的根本性转移。这就是人工智能时代知识创造财富的本质与知识革命的核心所在。

人们普遍意识到知识在社会生产力中的重要作用，因为没有知识，人类就不会使用工具，也不可能创造工具。然而在经济学家、社会学家、历史学家的视野中，“知识”消失了。他们用“劳动者、劳动资料、劳动对象”的生产力结构观来诠释人类社会发展史。

人类对知识的无知，经济学家对知识的忽视，托夫勒对知识的无奈与无助是有道理的。因为，尽管人类对知识的研究远早于自然科学、社会科学，然而，在自然科学、社会科学充分发展的今天，人类对知识的研究一直停留在两千年前坐而论道的“认识论”、“知识论”的哲学陷阱之中。因为，传统概念中的知识一直是虚无缥缈、捉摸不定、隐含在事物之中的东西。只有到了知识从量变到质变的人工智能时代，知识才走到前台，人们才得以从学科视角重新研究“知识”的本质，它的诞生、发展、演化、基本规律，以及它在人工智能时代的财富革命与知识力量变迁。从人工智能的实践中探索知识革命的奥秘，寻找人类知识起源，演化发展的本质与基本规律，创建科学的“知识学”。

人工智能时代的“知识学原理”走出了“认识论”、知“识论”的陷阱，成为指导实践的新兴科学。不但能有效地诠释人工智能的智能生成机理，还将人们对人工智能的认识从“是什么”的低级阶段提升到“为什么”的高级阶段。由于知识的普遍性，”知识学原理”还将全面诠释人类起源、人类演化的生态体系、工具中的第3种知识、从第2种文化到第3种文化，人类工具起源与智能化工具智能生成机理等众多未解之谜。

5人工智能知识革命的时代特征

人工智能时代，是继农业革命、工业革命后，人类现代社会的第3次浪潮时代。正如托夫勒所说，“很可能第3次浪潮将会横扫历史，生存在这个爆炸性时刻的我们会感受到第3次浪潮对这个时代的全面影响。因”此，了解人工智能的时代特征具有重要意义。

(1)人工智能时代是一个动荡的时代

人类历史呈非线性发展特征，百万年的原始社会、万年的农业社会、几百年的工业社会，以及不到百年的人工智能时代。百万年的原始社会是凝固的，万年的农业社会是缓慢的，几百年的工业社会有了显著的变化，不到百年的人工智能时代则是一个激烈动荡的时代，人们会普遍感受到生存环境与社会生活的全面动荡。

(2)人工智能时代是一个人类体力劳动、脑力劳动全面解放的时代

工业革命的动力机械代替了人类的体力劳动、智力革命的智能化工具代替人类脑力劳动，未来，机器人将养活人类，人类社会将进入一个在少数精英引领下的傻瓜化时代。体现群体智力的人工智能远远超越人类个体智力，人们寄希望于人类智慧驾驭人工智能。

(3)人工智能时代是自然人类的终结时代

不到百年的人工智能时代，众多新兴科技(生物科技、生命科技、基因工程、人工生殖、脑科学、脑机工程等)与强人工智能相结合，必将导致自然人类的终结，人们最终将迎来一个非自然人类的新时代。

(4)人工智能时代是生产力结构彻底革命的时代

人类社会生产力结构一般表达形式是“人+工具”，知识隐含其中，成为社会财富生产能力的基础因素。原始社会、农业社会，人类使用简单工具，财富生产能力的“知识重心”在原始人类；工业社会，机械化工具代替了人类体力劳动，财富生产能力的“知识重心”向工具转移；智力革命时代，智能化工具独立的行为能力，将财富生产能力的“知识重心”彻底转移到工具中，实现了生产力结构彻底变革。

(5)人工智能时代是上层建筑革命的时代

农业革命、工业革命是经济领域的革命。人工智能时代，第3种文化以科技文化对人文文化的全面入侵方式彻底改变了人文文化属性，文化艺术领域不再有纯文化、纯艺术；互联网从信息网、物联网到资源网(区块链)的诚信体系建设、去中心化的智能合约、无偏见的人工智能等，表明人工智能进入到伦理时代，从而掀起了上层建筑的全面革命热潮。

人工智能时代的知识革命改变了一切，因为人类社会的一切事物都与知识相关。

从本质上讲，我们这个时代，是人类在外部以人工方式将“知识”变革到“知识行为能力”(即智力)的革命时代。但迄今为止，我们没能用知识的基本原理准确地诠释人工智能时代，对这个时代的认识尚处于模糊阶段。人们需要从不同视角来阐述我们这个时代。（此文发表在《单片机与嵌入式系统应用》2020年第4期学习园地）

6.嵌入式系统中AI和ML的实际应用

免责声明：本文系网络转载，版权归原作者所有。如涉及作品版权问题，请与我们联系，我们将根据您提供的版权证明材料确认版权并支付稿酬或者删除内容。返回搜狐，查看更多

【准确把握新一轮产业技术革命的特征】

进入21世纪，面对能源和资源危机、全球生态和环境恶化、气候变暖、以及各种高新技术的广泛交叉应用，一场新的产业技术革命悄无声息地形成。本次产业技术革命以信息、生物、新材料、新能源技术为代表，带来的是智能化与信息化，引发了人类生产和生活模式的巨大变革。

《工业4.0：即将来袭的第四次工业革命》的作者乌尔里希·森德勒将这次产业技术革命称为第四次工业革命。他指出，世界发生或正在发生的工业革命，用产业技术革命称谓或更为合适，因为每次工业革命核心是技术创新，而技术创新带来的革命性变化不仅仅发生在工业领域：农业、服务业也都发生了革命性变革。与前三次产业技术革命相比，第四次产业技术革命有以下特点：

第一，本次产业技术革命涉及的技术领域多，是全方位的创新。前三次产业技术革命的科技创新内容相对比较单一。第一次产业技术革命以蒸汽机的发明为标志，由英国引领，表现为以机械动力替代人力、畜力，带来了大规模的工厂化生产，引发了纺织业的机械化和冶金工业的变革。第二次产业技术革命以内燃机和电力技术的发明和应用为主要标志，由美国和德国引领，以电力为动力实现了生产生活的电气化，催生出汽车制造业和石化工业，推动了铁路运输业、造船工业等创新发展。第三次产业技术革命是信息技术革命，以电子计算机技术的发展和应用为代表，继续由美国引领，实现了生产生活的自动化、信息化和管理的现代化。而第四次产业技术革命是智能化革命，以基因技术、量子信息技术、新材料技术、新能源技术、虚拟现实等为代表，实现生产生活系统的全面智能化，使经济社会的发展方式出现重大变革，比如智能机器人会出现在人类生产生活的各个领域。

第二，本次产业技术革命所采纳的多种新技术对人类的影响具有系统性、整体性。当前，世界产业技术革命中，信息技术、生物技术、新材料技术、新能源技术的应用广泛，各新兴技术间高度融合，相互渗透，形成了一个完整的技术系统，对人类社会改造有同步性、系统性和整体性特点。比如信息技术广泛应用，数字货币将会很快普及，日常生活中的支付行为将发生革命性变化。还有，信息化和互联网的普及，人们工作生活的便利化程度将得到整体提升。

第三，本次产业技术革命带来的技术创新，对人类生产生活方式的改造影响具有全面渗透、跨界应用的特点。如前所述，新兴技术间高度融合、不断渗透，创造出了具有跨越传统产业边界的新产品、新业态、新模式，给我们的生产和生活带来了颠覆性变化。比如，无人飞行器、智能机器人、无人驾驶汽车、智能机器驮驴、机器人厨师、可穿戴设备、智能手机、智能家居、3D打印、记忆眼镜、DNA生物芯片、纳米机器人、量子计算机等前所未有的产品，正先后走入人们的生活；原有的制造业正在发生根本性变革，向“智造业”目标前行；互联网在逐步走向物联网，企业也纷纷演变成数字企业。

第四，本次产业技术革命发生在世界大国之间具有同步性。这次产业技术革命不再是从单一领域或某一国家率先发生，而是在不同领域或不同国家和地区之间同步进行一场技术变革。也可以这样说，尽管各个大国的技术创新能力仍有明显差异，但是大国对新技术的敏感度和对创新机遇的关注度空前提升。这表现在两方面，一方面，一些技术创新完全有可能在大国之间同时发生，另一方面，某些颠覆性的技术革命在一国出现后，其他国家会立即跟进，引领者和追随者之间的时间差变小了。本次产业技术革命源头带有的多元性，创新表现为去中心化，使得技术创新的外溢效应比以往任何时候都大大增强了。比如，经济发展比较落后的国家或地区，依然可以分享长寿技术突破带来的福利，公共教育资源也会通过互联网向落后地区推送。

第四次工业革命的内涵与经济效应

【摘要】面对第四次工业革命带来的机遇与挑战，我国要从五个方面强化战略部署：要加快高性能运算前沿技术突破和国家工程数据库建设；根据中国独特市场需求特征定义技术和产品，形成以我为主的主导技术路线；根据第四次工业革命产业融合的要求强化产业的垂直部署；根据中国产业全球化布局的战略需要推动产业组织优化调整；强化关键模块和核心零部件的前沿技术和共性技术攻关。

【关键词】第四次工业革命；模块化；经济增长；产业链升级

【基金项目】本文系国家社科基金重点项目“新技术革命背景下全球创新链的调整及其影响研究”（项目编号：19AJY013）的阶段性成果。

进入“后疫情时代”，未来全球经济增长和产业分工格局究竟如何？对这一重大问题，国际主流机构众说不一。生产力是经济活动中最活跃的因素，决定着生产关系，因此，要厘清各种说法的真伪，对此重大问题作出科学判断，则必须充分考虑第四次工业革命这一因素的影响。自德国发布《德国工业4.0》报告以来，有关第四次工业革命发生机理及其经济社会影响的研究就大量涌现，但迄今为止也没有就此达成广泛共识。第四次工业革命对产业发展最深刻的影响是促进了产品架构和产业组织在更大范围、更大程度上的模块化，模块化创新和基于模块的重组式创新成为经济结构调整新的主导模式。未来中国能否充分利用第四次工业革命打开的机会窗口，取决于中国的战略和政策是否与这种主导模式相适应。

运用模块化思维分析第四次工业革命，就是把第四次工业革命视为创造新的积木和对积木进行重新组合的过程

“第四次工业革命”概念的提出，引发了大量有关何为第四次工业革命的讨论，形成了界定第四次工业革命的不同视角。任何一次工业革命，都会涉及到技术、要素、经济运行逻辑和经济结构的变化，对第四次工业革命的分析，也可从不同的层面出发加以把握。从“技术”的角度可将其视为数字化、网络化、智能化等多种技术簇群的涌现。从“要素”的角度可将其看作是数字要素、新能源等新型要素的产生。从经济运行逻辑的角度，美国著名趋势学家杰里米·里夫金曾尝试用边际成本为零的逻辑理解它。边际成本为零在一定程度上可以解释第四次工业革命中的信息化和服务化内容，但对于第四次工业革命涉及的大规模研发和固定资产投资缺乏解释力。有学者强调机器人革命或人工智能革命是新一轮工业革命的核心特征，为此，曾试图从学习的视角理解第四次工业革命的经济学逻辑。但对此仍需深入探讨，因为在工业社会发展的任何时期学习都是重要的，第四次工业革命背景下的学习过程到底与前几次工业革命有何根本不同？这可能需要深入理解第四次工业革命的经济结构逻辑。这一轮工业革命伴随着大量新的技术经济现象，如大量技术、产品、服务和产业跨界融合现象的发生，以及在职能、企业、产业不同层面、意义不同的跨界融合现象的发生，所以，从经济结构层面分析把握第四次工业革命，传统的产业结构分析方法已不再适用，需要引入模块化的思维。只有引入模块化思维，用模块化的分析方法，才能深入刻画大量涌现的跨界融合现象。从模块化的角度来理解第四次工业革命，就是将第四次工业革命带来的变化视为模块化的创新与重组。

由于突破性技术簇群的涌现是第四次工业革命的核心特征，因而对第四次工业革命技术创新本质的理解是洞悉新工业革命经济学本质的逻辑起点。数字时代的两位前沿思想家布莱恩约弗森和麦卡菲的有关创新的类型化研究对此极具启发性。他们在研究机器革命时指出，创新包括果实类创新和重组式创新两种类型。其中，果实类创新即为通用目的技术的不断应用和再创新。在果实类创新范式下，新的通用目的技术在形成初期，因为技术和商业成熟度低，只能创造微薄的经济价值，但随着通用目的技术的技术成熟度、商业成熟度的提升以及更大规模的扩散应用，其创造的经济价值进入爆发式增长阶段，此后随着技术机会的消失，通用目的技术创造的经济价值再次进入衰落阶段。如果说果实类创新的特征是价值创造呈现出周期性特征的话，重组式创新的特征则是价值创造的持续升级。Weitzman提出，知识生产的过程是对人类既有知识的重新拓展和组合过程，基于此类技术创新基础上的经济增长被他称之为“组合式增长”。布莱恩约弗森和麦卡菲认为，数字经济时代的根本特征就是创新范式从果实类创新的主导范式转向重组式创新主导范式。而这种转换发生的机理，就在于第四次工业革命的核心特征是基于数字化、网络化、智能化的新型信息化，新型信息化大大拓展了技术架构的模块化范围和深度。

模块化理论进入经济学和管理学视野发端于麻省理工学院Ulrich教授于1995年开创的产品架构研究。在Ulrich教授将产品架构分为模块化和一体化的基础上,哈佛商学院的鲍德温和克拉克提出了完整、成熟的模块化理论，他们认为，复杂系统是由功能相关的子系统所构成的，将复杂的产品设计、软件开发或生产制造流程不断分解为标准化的、具有特定功能的模块过程就是模块化的过程。由于模块化具有节约成本、提升产品多样性的内在优势，因此，经济系统本身具有模块化的内在驱动力，而以数字化、网络化、智能化为核心特征的第四次工业革命则会大大深化模块化水平，这是因为新型信息化大大降低了模块化设计的技术成本，同时也大大降低了模块交易的制度成本。与此同时，模块化的技术架构不仅推动了产品本身的模块化，同时也会推动产业组织结构的模块化，即模块化技术架构和产业组织结构存在“映射关系”，从而导致知识的分散化。

因此，在第四次工业革命的背景下，伴随着全球化和信息化所带来的交易成本的下降，全球产业加速进入模块化设计、模块化生产和模块化消费的模块化大发展时期，企业为了能更好适应模块化的竞争环境和分散化的知识分布特征，就要能够更有效地利用重组式创新。在既有企业和新创企业不断“组合”和“包络”既有技术和产品模块的过程中，第四次工业革命呈现出加速裂变和颠覆的蓬勃发展态势。

要基于技术变革的本质理解第四次工业革命对经济增长和全球产业竞争带来的深刻影响

第四次工业革命对经济增长的影响。影响经济增长的因素很多，从投入要素的角度看，传统的经济增长要素主要是劳动、资本和技术。第四次工业革命对经济增长的影响机制，首先表现在对传统生产要素的影响上。一个国家劳动投入对经济增长的影响与其人口数量和人口素质相关，第四次工业革命可以通过提高教育质量进而提升劳动者的素质，从而促进经济增长。在投资领域，与新技术革命相关的新产业、新业态、新模式的发展加大了对新型信息基础设施投资的需求，从而对经济增长形成投资拉动作用。最重要的是，第四次工业革命还会通过技术进步带来劳动生产率的显著提升，进而推动经济增长。第四次工业革命至少有两个因素有助于劳动生产率的提升，一是第四次工业革命为扩大市场规模、降低交易成本提供了技术基础，市场规模的扩大、交易成本的降低有助于社会分工的发展，社会分工的发展有利于技术进步；二是第四次工业革命推动着企业组织和产业组织的模块化发展，知识的模块化大大增强了不同创新主体“并行”创新的效率，从而能够加速全球技术进步的步伐。

第四次工业革命对全球分工格局的影响。过去二十年全球产业分工格局的调整主要是基于生产成本的“雁阵式”转移，即由于全球化的发展大大降低了国际贸易的成本，技术进步大大提高了制造品的可贸易性，使得发达国家的制造业向发展中国家进行梯度转移。仅仅从模块化的角度看，第四次工业革命进一步强化了产品的模块化，有利于各国根据比较优势进行产业间、产业内甚至产品内的分工和贸易，从而进一步强化产业的国际梯度转移。但是由于智能化、网络化、数字化对传统劳动力的大规模替代，高效的通用软件平台对专用性重资产的大规模替代，第四次工业革命也使得传统的生产要素对产业区位的影响力下降，无人化、智能化工厂的快速发展有可能促进制造业、特别是高新技术制造业在发达工业国家的本地化生产，甚至有可能随着新型生产制造范式效率的提高，出现传统制造业向发达工业国家回溯的可能性。与此同时，由于发达市场经济体拥有更高收入的群体和更加挑剔的领先用户等市场需求侧的优势，也会遏制、甚至反转全球产业“雁阵式”梯度转移趋势。

第四次工业革命对创新链和产业链升级的影响。传统的产业链升级通常包括以下四种模式：一是工艺升级，即对生产制造技术的改进和生产组织管理效率的提升；二是产品升级，即通过改进产品设计、甚至提供突破性的产品，提高产品的竞争力；三是功能升级，即通过占领产业链上更高附加值的价值链环节实现升级；四是跨产业升级，即通过进入技术壁垒或资本投资壁垒更高的产业，提升盈利能力和竞争力。一般认为，全球价值链视角的产业升级遵循从工艺流程升级到产品升级、再到功能升级、最后到跨产业升级的啄序。第四次工业革命将引致技术系统、生产方式和产业组织的深刻变革，从而为后发企业和国家在生产、产品、功能和新产业等各个维度打开丰富的“机会窗口”，因而大大提升后发国家和企业产业链升级的可能性。更重要的是，由于模块化的加强和重组式创新的涌现，技术融合、产品融合、服务融合和产业融合可能成为产业链升级的最重要的形式。从创新链的角度看，第四次工业革命推进的模块化大大降低了技术创新对模块之间默会性知识的依赖，显著降低了对默会性知识学习的成本，使创新链更具开放性和跨边界性，基于更加开放的资源合作和技术市场的重组式创新将成为主导的技术创新模式，传统的线性创新结构将被打破，产业链与创新链的关系将呈现出非线性、开放式关系。

如何应对第四次工业革命

加快高性能运算前沿技术突破和国家工程数据库建设。由于人工智能、数字制造等第四次工业革命的主导技术都是基于信息通信技术（ICT）发展起来的，因此，新一代信息技术将成为现代制造技术体系中最为重要的通用目的技术。信息的存储、传输和处理能力将成为决定一国先进制造体系技术成熟度和应用效率的关键因素，工业大数据资产将成为新的影响一国制造业竞争力的战略性资产。早在2011年，美国竞争力委员会就将高性能运算定义为“改变全球制造业游戏规则的引擎”，并提出系统的战略规划部署，协调和整合美国计算资源，加快推动美国的计算能力转化为先进制造业竞争力。对标美国的战略和政策实践，德国、日本等工业强国也纷纷出台推动高性能运算研发和应用加快发展的政策。例如，德国通过在斯图加特大学等高校设立高性能运算中心的方式，为德国企业的研发和产品开发提供运算服务。面对发达工业国家针对现代制造技术在高性能运算方面的积极部署，我国应加快建立国家层面的高性能运算研发中心以及地区层面的高性能运算服务中心，在加快高性能运算共性技术和前沿技术突破的同时，推动提升相关服务对广大企业、特别是中小企业的支撑能力。此外，还应针对我国工程数据库建设落后、甚至缺失的问题，加快通用和专业性的工程数据库建设。从体制国情和经济发展需求出发，我国工程数据库建设可以采取政府出资、独立非盈利性社会组织运营的组织方式，数据采集采取会员企业自愿提供、共同分享的工作方法，形成持续投入、有效运营的可持续发展机制，通过基础技术进步促进我国工业产品质量和性能的大幅度提升。

根据中国独特市场需求特征定义技术和产品，形成以我为主的主导技术路线。新工业革命涉及的技术和产业总体上处于探索期，主导技术路线尚未形成，这为我国利用国内市场和需求规模，形成独特的技术能力和技术路线优势提供了机会。例如，我国作为制造业大国，将是未来工业互联网应用的最大市场，其需求方向能够对国际工业互联网技术路线发展产生重要影响。目前，我国企业工业互联网多数采用“现场—控制—操作”的多层架构，但其中现场层和控制层的核心装备与技术多由西门子等外企掌控。建议在各类新型基础设施的部署中，通过合理规划和顶层设计，推动更多企业转向建设全光网底座与工业互联网架构融合的扁平架构，将我国5G和F5G的局部技术优势嫁接到工业互联网上，从根本上消除我国工业互联网体系现场层和控制层装备及技术的对外依赖，进而颠覆目前由德国西门子、博世等企业主导的基于数字物理系统的智能制造技术路线。

根据第四次工业革命产业融合的要求强化产业的垂直部署。建立跨部门协同和对话机制，加强对各类数字产业和制造系统所涉及的底层架构、技术标准等软件基础设施的统一部署，形成协同发展的新工业“大生态”。5G、人工智能、工业互联网、车联网等数字基础设施具有鲜明的商业模式平台化、产业组织生态化的特征，相互之间又具有高度的技术经济协同性，且底层架构、技术标准等软件基础系统在其协同中发挥着重要作用。这意味着，要充分发挥工业互联网等技术的赋能作用，不仅要形成统一的产业内部技术标准，而且要形成统一的产业间技术接口；不仅各产业自身的技术要达到足够的成熟度，而且要预防个别产业技术成熟度不足制约其他产业的技术可应用性。因此，第四次工业革命应以“网络泛在”为基本原则，加强各层次产业以及下游垂直应用行业的融合建设。政府部门应在我国新一代信息技术和工业互联网规划建设初期建立起紧密的工作衔接机制，有效解决部门协调问题，前瞻性的统一各类网络标准和技术接口，切实建立起我国新工业体系的网络效应和数字经济的协同生态优势。

根据中国产业全球化布局的战略需要推动产业组织优化调整。中国的制造业企业要摒弃大而全、小而全的一体化产品开发模式，通过产业重组和流程重组，形成专注于核心模块开发的品牌制造商和能为国内外品牌厂商提供专业化服务的合同制造商。有声誉、信息、知识和资本优势的大企业应把自己定位于模块整合者或产业标准的制定者，通过柔性契约网络在全球整合资源。大企业要努力控制“显性信息”，并处理一些关键的“隐性信息”，通过模块化设计充分利用外部资源，进行“行路图”设计并成为模块化系统开拓者，力争成为模块化网络中的旗舰型企业。广大的中小企业则应定位于产业生态中核心模块的前沿技术提供者、标准制定者和产品提供者，通过控制核心模块占领全球产业链的有利位势。

强化关键模块和核心零部件的前沿技术和共性技术攻关。首先，针对战略性行业和领域的共性技术（竞争前技术）需求，建设一批行业共性技术平台，加快战略性行业和新兴产业重大共性、关键技术的攻关和推广应用。建议综合借鉴美国制造业创新中心和中国台湾工研院的组织运营模式，采取公私合营和准市场化投入的形式，提高共性技术的开发效率。其次，推动本土大型制造企业加大在核心价值模块上的研发投入力度，鼓励互联网头部企业在基础软件领域加快替代性创新，争取在底层技术和基础软件领域形成非对称竞争优势。通过发展产业投资基金、鼓励公司创业等形式，提高对前沿性、战略性、原创性技术领域的研究和开发投资，将产业政策的重心从物质资本投资转向知识资本投资，这一点对于电子、通信、汽车、机械装备等技术密集型模块化产业进入全球产业链、参与更多高附加值经济活动、实现产业功能升级尤为重要。再次，针对创新链衔接不畅的问题，加快发展多种形式的科技中介服务机构，加强产学研用结合，大力发展高新技术、专业性技术领域的中介服务机构，促进企业之间、企业与大学和科研院所之间的知识流动和技术转移转化，真正建立以市场化应用为导向的科技成果转移、扩散机制。最后，鼓励企业基于开放式创新开展积极的重组式创新，即一方面加大在欧洲、日本、韩国等领先市场的研发机构建设和产学研合作，另一方面将边缘性的模块进行外包，以充分利用国外的低成本知识要素和生产资源，强化我国制造业在全球的综合竞争优势。

参考文献

①[美]杰里米·里夫金著、赛迪研究院译：《零边际成本社会》，北京：中信出版社，2017年

来源链接:http://www.rmlt.com.cn/2021/0507/613387.shtml

深度研报：人工智能机器人开启第四次科技革命 人工智能 工业革命的特点