博舍

图谱实战 面向人工智能技术创新的语料库现状及建设路径研究

图谱实战

转载公众号| 数字教育

本文发表于《数字教育》2022年第6期(总第48期)理论探索栏目,页码:21-28。

摘要:人工智能技术的不断提升使得教育知识服务向智能化发展。而学科知识图谱作为人工智能重要技术之一,既能优化教育知识的生产方式,又能为多种智能化的知识服务开展提供支撑。为满足当今教育用户多样化、个性化、精准化的需求,本文在分析学科知识图谱的内涵、构建框架基础上,从助力教育知识库形成、辅助智能化知识发现、支撑多项智能教育知识服务开展三个方面讨论了学科知识图谱与教育知识服务的适切性。随后分析了教育知识服务的构成要素,在此基础上构建了基于学科知识图谱的智能化教育知识服务模型,并从需求采集、服务构建、服务应用、服务评估四个阶段对模型进行了阐释,最后提出了模型的相关实施建议。

关键词:学科知识图谱;智能化;教育知识服务

|全文共9120字,建议阅读时长9分钟 |

引言

人工智能、大数据、知识图谱等技术的出现与应用,为知识服务向智能化发展提供了动力与支撑。学者们开始探索智能技术与知识服务的结合方式,以期通过智能化的知识服务推动领域的发展。孙蒙鸽等从科研智能化的角度认为,智能化的知识服务即采用智能的知识采集、加工、表示、分析、组织等技术对科研数据资源进行知识化处理,从而为研究人员提供研究问题的解决方案,进而提高研发效率[1]。智能技术的广泛应用,不仅引发了科研、商业等领域的知识服务创新风暴,还使教育知识服务发生变革。代杨等认为智能化的知识服务是利用知识图谱、用户画像、人工智能等技术展开数据分析与挖掘,最终实现个性化、精准化的新型服务[2]。田慧君等认为智能化知识服务即以目标用户需求为驱动,根据实际需求,通过人工智能等技术提供有针对性、有效的知识信息资源[3]。

结合上述定义,本研究认为智能化的教育知识服务是指以新时代教育用户需求为导向,以基于智能技术的知识生产和传播为支撑,从而为知识需求者提供以知识为基本单元的教育服务。如何通过智能技术高效地生产、传播教育知识是教育知识服务创新发展的重点内容。学科知识图谱作为人工智能的关键技术,能够实现对海量资源的自动化管理,有效支撑知识的智能化抽取、融合、存储等,并通过建立可视化的知识网络表示知识结构层次,同时在此基础上挖掘知识间的隐性关系并结合用户数据,为智慧语义搜索、智能知识问答等智能化的教育知识服务提供重要的基础性作用[4]。因此,本研究在阐述学科知识图谱的内涵特征、构建流程基础上,探讨学科知识图谱与智能化教育知识服务的适切性,并提出基于学科知识图谱的教育知识服务模型,期望借助其推动教育知识服务发展,助力智慧教育服务体系。

一、学科知识图谱的内涵及构建流程

(一)学科知识图谱内涵

知识图谱一词最早出现于2012年,特指支撑其语义搜索的知识库,随后基于知识图谱的认知智能被广泛应用于各个领域。随着知识图谱在诸多领域的推广与研究,使得教育领域的专家及学者对知识图谱也给予了高度关注,以此衍生出学科知识图谱等概念。但目前学术界对学科知识图谱的定义并未达成一致,依据现有的研究,可以从教学知识组织、教师教学、学生学习三个视角剖析其内涵。

1.教学知识组织

知识图谱是领域知识及知识间关系所联结而成的知识体系,该知识体系是领域中繁杂知识层次化、结构化整合后形成的语义图[5]。

2.教师教学

学科知识图谱是辅助教师合理开展教学设计,恰当安排教学活动,深化新旧知识之间联系的重要参照,教师可以参照学科知识图谱调整学科教学策略、提供个性化答疑和辅导[6]。

3.学生学习

学科知识图谱是帮助学习者把握知识结构、理解知识概念、实现个性化发展的“学习指南”,通过记录学习者的认知动态,学科知识图谱能够引导学习者培养个人能力[7]。

综上所述,本研究认为学科知识图谱是基于多样化异构教育资源构建的以学科知识为节点,以知识关联关系为基础,以支撑精准化、智能化、个性化的教育知识服务高效实现为目标的语义网络图。

(二)学科知识图谱的构建流程

学科知识图谱的构建是智能化教育知识服务开展的基础,因此如何构建学科知识图谱是首要任务。本研究参照已有的构建框架将学科知识图谱的构建流程分为四个环节:数据获取、知识抽取、知识融合及知识加工,同时为解决知识图谱质量较低、知识完整度不高、扩展性较差等问题,需构建知识图谱动态维护机制,因此本研究在此基础上加入质量评估层以提高学科知识图谱的质量[8],如图1所示。

1.数据获取

数据获取是学科知识图谱构建的重要基础,其主要目的是依据选择的数据来源获取与学科相关的数据资源。学科数据的来源包含教育领域和开放领域两部分。教育领域数据是与学科相关的课程标准、教材等,该类型的数据需要通过文字、图片识别等方式获取。开放领域包含结构化数据、半结构化数据、非结构化数据,结构化数据为现有的第三方知识库中的数据,半结构化数据即网页类数据,非结构化数据即学科文献、教育文件等。开放领域的数据一般需要通过爬虫等技术获取。

2.知识抽取

知识抽取是连接数据获取和知识融合的关键枢纽,也是学科知识图谱构建的核心步骤,其目的是对半结构化数据或非结构化数据中的实体、属性及关系三个知识要素进行提取。知识抽取过程主要包含三个步骤即学科知识本体构建、基于众包半自动语义标注、开放领域知识抽取。学科知识本体是形成学科知识体系的核心,但由于当前人工智能技术发展还不够完善,完全自动化的本体构建方式难以保证结果的质量与准确性,纯人工的构建方式消耗时间、资源、人力较多,因此学科专家指导下的半自动本体构建方式更为高效。随后依据已构建的学科本体结构进行众包半自动语义标注形成标注数据,并对本体进一步完善。最后通过机器学习等技术抽取开放领域的学科知识。

3.知识融合

知识融合是知识加工的前提,是多源知识得以整合、汇总的体现。由于不同数据源采取的知识抽取方式不同,知识抽取所得到的知识往往存在冗余和冲突,因此为提升知识的逻辑性和层次性,提高知识图谱的质量,需要在统一标准下对不同数据源的知识实施整合、消歧、加工、更新等操作[9]。融合的知识包含开放领域结构化知识整合后的外源知识,半结构化、非结构化数据抽取的补充知识和学科教育领域的标注知识。知识融合主要包含三个步骤:概念融合、实体对齐、属性对齐[10]。概念融合是将不同来源的知识概念层级结构融合。实体对齐主要包含实体消歧和指代消解。属性对齐是将不同知识的等价属性合并为同一个属性。知识融合后的成果是学科知识的标准化表示即结构化、网络化学科知识图谱雏形。

4.知识加工

知识加工是完善学科知识图谱的关键步骤,该环节主要是提升知识图谱的质量、挖掘知识图谱中的隐性知识[11]。知识加工一般包含本体构建、质量评估与知识推理三个内容,但由于学科知识本体已依据教育领域的数据形成,因此本部分内容包含质量评估与知识推理。质量评估是保障学科知识图谱知识质量的有效手段,该过程需要量化知识的可信度,舍弃质量较低的知识。知识推理则是对知识更进一步的挖掘。经过质量评估后的融合知识即可形成初步的学科知识图谱,但此时的知识图谱仍存在残缺,因此需要依据一定的规则进行完善,从而获取新的知识或隐含关系,并经过质量评估以丰富原有的学科知识图谱。

5.质量评估

质量评估是确保知识图谱高质量发展的有效措施,该过程贯穿知识图谱构建的全周期,是知识图谱得以健康、可持续发展的有力保障。构建前需要专家、教师等多方参与评估数据来源的质量,以此保证信源的专业性和可信度。知识图谱的构建过程中需要对标注样本的质量、优化准则的合理性、模型的适配度进行有效把控,以确保基于机器学习模型的抽取与知识融合的质量,随后还需通过专家设计的高质量规则配合众包的模式对融合后的知识进行有效评估。构建完成后,还需展开错误知识的发现与纠正、过期知识的更新和缺失知识的发现与补全,此过程需要采取“先自动,后人工”的人机协同的方式进行,以保障高效率地提升知识图谱质量[12]。

二、学科知识图谱与教育知识服务的适切性分析

学科知识图谱具有数据类型更丰富、知识关联更全面、挖掘方法更先进、知识发现结果更深入的优点,能够为教育知识的获取、产生、传播提供更为智能化的支撑,因此本部分从助力教育知识库形成、辅助智能化知识发现、支撑多项智能化知识服务开展三个方面分析学科知识图谱与教育知识服务的适切性。

(一)学科知识图谱助力教育知识库形成

学科教育知识库是实现智能化教育知识服务的基础。基于学科知识图谱的知识库能够通过自动化或半自动化的建立方式节省大量的人力、物力资源,以较为高效率的方式实现对海量教育资源的知识抽取、存储、融合、管理,最终形成以节点及节点之间的关联关系组成的具有较强语义处理能力与开放互联能力的高质量知识库。节点内容可以包括文本、图像、视频、课件等多模态的资源,以此促进高质量教育知识的有效传播与共享。

(二)学科知识图谱辅助智能化的知识发现

随着学科领域的不断发展、延伸、细化与交叉,学科的知识体系、知识关联也越来越复杂,这在一定程度上阻碍了学科相关利益者发现隐性知识及关系。学科知识图谱作为一种对多源数据组织、整合的技术,能够支持学科知识间多维度、精细化的知识关联[13],并在此基础上结合深度学习等智能技术,实现知识推理、知识学习路径生成等知识“深”发现,从而有效支持学科知识发现智能化发展。

(三)学科知识图谱为多项智能化教育知识服务的开展提供支撑

智能化的教育知识服务应该包含辅助教育用户提升自身能力、解决学科相关问题的多样化、智能化的服务。学科知识图谱能够通过对多源数据的整合、关联,形成体系化、层次化的学科知识结构体,并在此基础上,结合人工智能、大数据等技术,为智慧搜索、智慧问答、个性化成长路径推荐、个性化资源推荐、个性化数据管理等服务的开展提供支撑,以此满足用户多样化的知识服务需求,从而缩减用户的迷茫期,减轻用户的认知负荷,助力智慧教育服务体系走向智能化、精准化和个性化,促进智慧教育的快速发展。

三、基于学科知识图谱的教育知识服务模型构建

基于学科知识图谱的教育知识服务是驱动智慧教育发展的有效力量,其需要依托学科知识图谱、大数据、深度学习等技术搭建集成教育知识服务中心,对教育资源及用户数据进行处理、整合、分析、可视化,为学科相关利益者(教学者、学习者等)提供智能化的知识服务,并通过服务使用和服务评估,不断提高服务质量,最终满足用户的需求。本研究基于上述定义构建了基于学科知识图谱的教育服务模型,并将其归纳为“一个中心、五种要素、四个环节”,具体情况如图2所示。

(一)一个中心

基于学科知识图谱的教育知识服务中心是知识服务得以实施的支撑,是教育利益相关者满足自身需求的有效工具,是教育资源可视化、结构化呈现的依托,是推动学校、地区和国家智慧教育发展的核心力量。因此,构建基于学科知识图谱的教育知识服务中心是至关重要的。该服务中心需要提供统一信息门户、身份认证等基础支持服务,并有效整合学科教育资源、分析用户行为数据,在双向数据流动的动态特征下持续完善、优化服务中心,最终实现为不同层级的用户提供满足其自身需求的服务。该服务中心的建设需要集合企业、政府、领域专家、教师等多方的力量,以此打造智能时代下支撑教学、学习、科研、决策等活动的服务集成中心,最终通过数据驱动的政策制定、科研探究与实践、教师教学、学生学习促进智慧教育的快速发展。

(二)五种要素

教育服务供给的构成要素包括服务内容、服务主体、服务对象、服务技术、服务环境。在服务环境的依托下,服务主体依据知识图谱等技术和服务内容搭建形成初步的服务中心,为用户提供智慧搜索、智慧问答等基本的智能服务,随后采集用户的多种数据形成用户画像,以此为用户提供更多个性化、适应性的服务。

1.服务内容

服务内容即教育知识,是指从海量教育资源中提取的产物,是构成教育知识服务模型的基本要素。教育领域的知识不仅仅是课本、教案、课程标准等可以被处理整合后直接呈现的显性知识,还应包含服务对象特征、知识学习路径、教学经验、学科发展问题等支撑教育知识服务稳定、健康、可持续发展的隐性知识。

2.服务主体

服务主体是服务的提供方,也是建设、管理服务中心的主要责任人,是服务得以有效施行的推动力量,在服务过程中其不仅是知识的传播者、生产者,也是知识的使用者,通常为教育企业或机构。通过对知识管理与需求分析,服务主体为教育用户提供个性化、精准化的教育服务,同时依据用户的服务体验反馈及时调整服务策略,保障服务有效实施。

3.服务技术

服务技术是指服务过程中对教育知识及用户数据进行相关操作、处理的技术总称,它涉及知识的抽取、融合、推理、发现、存储、呈现等,是支撑服务全过程的核心要素。服务主体依据信息采集、自然语言处理、本体构建、知识图谱、大数据、深度学习等技术实现对教育知识的采集、组织、分析、管理、可视化,从而搭建智慧服务中心。

4.服务对象

服务对象是指服务的接受者,即教师、学生、研究者、决策者等。服务对象不仅是知识有效传播、利用的实践者,也是知识的生产者。通过服务过程中对知识的学习、掌握和利用,从而产生更多过程化和结果化的数据,帮助服务主体衍生更多的隐性知识,并依此挖掘出数据间更为深层次的联系,获得更为精准、有效的服务。

5.服务环境

教育服务的实施需要相应的服务环境支持,即形成与教育服务相关的制度和文化。文化的形成可以增强用户对教育服务的认同,并培养其使用服务满足自身需求的意识,从而形成一定的服务应用氛围。制度的形成可以规范、约束、指导服务供给过程中的实施步骤及职权范围等,从而保障服务模型的良性运转。

(三)四个环节

教育知识服务是以教育用户为中心,以满足用户需求为驱动而进行的一个复杂活动,由此可见用户需求的调研是服务开展的首要条件,随后服务主体需要搭建满足用户需求的服务,最后在应用、评估过程中使服务逐渐趋于完善。因此,本研究将基于学科知识图谱的教育知识服务概括为四个环节,即需求采集、服务构建、服务应用和服务评估,且四者之间依据该逻辑顺序的运行模式形成迭代循环,直至服务高质量达成。

1.需求采集

需求采集是提供高质量、精准化服务的前提。新时代智慧教育不是追逐技术的变革,而是应该注重以技术为支撑的教育服务发展[14]。服务的最终目标即满足用户的需求,因此了解、收集、整合用户的需求是驱动教育知识服务得以有效实现的基础。用户需求主要指管理需求、资源需求、信息需求等,收集方式包含前期调研和中期发现两个阶段。前期调研即在构建服务模式之前通过现状调研、实地考察、交流访谈等方式收集用户的需求,并将其整合、转化为服务需求即服务主体所需提供的服务项目,依据服务需求设计相应的服务模式,以此达成服务搭建和实施的参照。中期发现即在用户体验服务的过程中收集用户相关数据,挖掘用户个性化的需求,以便提供更为精准的服务。总体来说,需求收集是动态性的,即用户的需求并非一成不变,需要依据用户的操作过程及行为路径,及时、有效地调整,以便提供适宜的服务。

2.服务构建

服务构建是教育服务的核心,是对服务模型的有效实现。教育知识服务需要依托智能化平台才能高效开展,并非由服务主体直接提供给服务对象,因此需要依据服务模型的指导建设知识服务中心,以便构建满足用户需求的开放服务功能。服务构建主要包含基础服务和个性化服务。基础服务即构建以知识点及知识关系形成的学科知识图谱将知识内容以结构化、序列化、层级化和可视化方式呈现,帮助用户了解知识结构层级、知识序列顺序,完善、重构自身学科知识体系,掌握知识内涵,探析知识发展脉络,并在此基础上提供智慧搜索、智慧问答等服务。个性化服务的核心为用户过程化数据及其他类型数据的采集、整理、分析,形成动态演化的用户画像。该类型的服务需要利用相关大数据、深度学习等技术将用户画像与学科知识图谱关联结合,从而提供数据驱动的精准化、差异化服务。

3.服务应用

服务应用是服务主体依托服务中心为服务对象所提供实际服务的阶段。学习者通过个性化学习资源推荐等服务提升自身的知识内容与学习效果;教学者以学习者的学情数据与过程数据把握知识的重难点,减少知识的组织,合理地开展教学设计,为学习者提供更加合适的学习路径,着重关注学习者的思维培养与情感交流,同时依据平台所提供的个性化培养路径提升自身综合教学能力;研究者能够及时通过平台及教师了解教学实践过程中的问题,开展相关理论设计与研究,并依托平台进行理论与实践验证,逐渐丰富学科理论研究与实践应用案例。决策者是以教育管理机构、部门为代表的具有分配教育资源、制定学科教学计划的人或组织。依据学校、区域、地方、国家等层面的划分,及时把握了解所属范围内的教学、学习等情况,从而制定出更为精准化、公平化、高效化的决策以提升教学、学习质量。社会公众等其他用户能够依据智能搜索、咨询等服务掌握相关知识。服务应用阶段还需对用户的行为、结果数据进行存储以完善用户画像,提高服务的精准度及个性化。

4.服务评估

尽管服务上线之前会经过一定的服务质量检测,但不可否认的是在服务应用过程中难免出现一些问题,因此需要通过服务对象的应用反馈及行为数据及时、有效地评估服务质量,从而丰富和补充用户需求,优化和改进服务模式。服务供求具有长期动态发展、短期稳定的特征,服务评估需要兼顾动态与静态相结合的原则,以保证服务评估内容、目标等紧跟用户的个人发展需求。因此服务主体需要利用服务中心及时、持续收集用户使用的反馈信息及阶段性的数据,参照相应的教育服务质量评估体系,在遵循科学性、系统性、层次性、整体性等原则的基础上对服务中心为用户提供的各项服务进行质量评估,以判断服务的达成度与用户的满意度,从而整合、分析相关结论,形成服务改进、优化、补充的实施意见,以及时地调整和更新服务内容及模式,最终达到提高教育知识服务质量的目的。

四、基于学科知识图谱的教育知识服务模型实施建议

智能时代教育知识服务的发展已吸引了众多学者的关注,但对学科知识图谱支撑的教育知识服务研究还处于初始阶段,为智能化的教育知识服务得以有效开展,本研究基于服务构建、实施、评估过程提出以下建议。

(一)统一教育知识服务数据标准

制定统一的教育知识服务数据获取、编码、存储标准是数据驱动的教育服务健康、持续发展的基础。现如今尽管数字技术时代的到来使得数据不再是消耗大量运维成本的负资产,但数据冗余较大、收集标准不统一、质量不高、隐私安全得不到保障,这些问题的出现,使得数据价值难以得到有效发挥,因此数据标准的制定显得尤为必要和迫切。统一的教育服务数据标准不仅是教育服务开展的前提,也是减少数据治理成本,保障数据迁移应用的有效措施[15]。同时也是促进基于多学科、跨学科知识图谱的教育知识服务开展的前提。

(二)合理制定教育知识服务规范

教育知识服务涉及的人员、机构、业务较为复杂,为保障其按照既定的标准开展服务的建设、应用与评估,需要政府及服务提供者联合相关利益者合理制定结构完整、层次清晰的教育服务规范。服务建设规范需要规定服务的具体目标、内容范畴、实施流程等,以指导服务的开发;服务应用规范需要说明教育服务主体与学校及政府的对接方式、权责范围、各项服务的使用方式等以降低三者之间协调合作的沟通成本;服务评估规范是政府主导,服务提供者参与制定的限制服务上线门槛、提升服务质量的基础参照。

(三)内外协同提升知识服务质量

服务质量的评估与优化是服务有效达成的保障,但现有的服务优化方法大多依据服务对象的反馈提升服务质量,在一定程度上忽略了服务主体的作用。参考经济学服务利润链模型中提出的“内部服务质量”,可以得出服务企业若要更好地为外部顾客服务,首先必须明确为 “内部顾客”即公司所有内部员工服务的重要性。为此,教育服务企业或机构必须设计有效的激励制度,创造良好的工作环境,尽可能地满足服务主体内部及其他服务构建及评估相关利益者的内在、外在需求,并在此基础结合教育用户的反馈及行为数据以内外协同的方式驱动服务质量的提升,加速服务达成的时限。

参考文献:

[1]孙蒙鸽,韩涛.科研智能化与知识服务:内涵、实现与机遇[J].情报理论与实践,2021,44(10):41-49.

[2]代杨,裴永刚.我国教育出版智能化知识服务转型探析[J].出版广角,2020(14):9-11.

[3]田慧君,管健,朱小冬,等.工程教育知识服务平台的构建与应用研究[J].现代教育技术,2019,29(6):76-82.

[4]李艳燕,张香玲,李新,等.面向智慧教育的学科知识图谱构建与创新应用[J].电化教育研究,2019,40(8):60-69.

[5]丁国柱,余胜泉.基于本体学习算法的学科本体辅助构建研究:以学习元平台语文学科知识本体的构建为例[J].中国电化教育,2015(3):81-89,124.

[6]钟卓,唐烨伟,钟绍春,等.人工智能支持下教育知识图谱模型构建研究[J].电化教育研究,2020,41(4):62-70.

[7]万海鹏,余胜泉.基于学习元平台的学习认知地图构建[J].电化教育研究,2017,38(9):83-88,107.

[8]杨玉基,许斌,胡家威,等.一种准确而高效的领域知识图谱构建方法[J].软件学报,2018,29(10):2931-2947.

[9]杨波,廖怡茗.面向企业动态风险的知识图谱构建与应用研究[J].现代情报,2021,41(3):110-120.

[10]刘峤,李杨,段宏,等.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.

[11]赵雪芹,路鑫雯,李天娥,等.领域知识图谱在非遗档案资源知识组织中的应用探索[J].档案学通讯,2021(3):55-62.

[12]肖仰华,徐波,林欣,等.知识图谱概念与技术[M].北京:电子工业出版社,2020.

[13]胡正银,刘蕾蕾,代冰,等.基于领域知识图谱的生命医学学科知识发现探析[J].数据分析与知识发现,2020,4(11):1-14.

[14]余胜泉,陈璠.智慧教育服务生态体系构建[J].电化教育研究,2021,42(6):5-13,19.

[15]赵成杰,张峰凡,申世越,等.技术治理范式下的教育数据治理[J].数字教育,2021,7(3):15-20.

作者简介:

和文斌(1996— ),男,甘肃兰州人,硕士研究生,研究方向为教育信息化、知识图谱构建;

董永权(1979— ),男,江苏宿迁人,教授、硕士生导师,研究方向为教育信息化、信息集成;

赵成杰(1994— ),男,河南安阳人,硕士研究生,研究方向为教育治理、职业教育;

王惠惠(1995— ),女,江苏徐州人,硕士研究生,研究方向为学习者画像。

OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入OpenKG网站。

分析丨中美人工智能战略策动路径比较与分析

中美人工智能策动路径的比较

美国内外兼顾,对内布局关键技术领域,对外建立最广泛的民主科技联盟;

中国侧重于内,建立独立自主的AI创新生态体系,打造世界科学中心和创新高地。

美国技术反哺国防,维持军事领先优势;

中国全方位开拓应用场景,促进产业转型升级。

美国一方面对内重点布局基础理论和前沿性技术,着力推进多学科交叉研究,旨在掌握未来主导权。

美国联邦政府将投入4000万美元成立国家技术基金委员会,促进技术转移和标准制定;

投入6亿美元,新建30家人工智能研究院,加强人工智能基础领域研究;

设立人工智能创新个人奖和人工智能研究团队奖,鼓励研究人员进行人工智能前沿领域探索;

投入7000万美元进行国家人工智能研究基础设施建设,开发开放人工智能研究资源。

其主要目的在于:保持对未来卷积神经网络等技术路线的主导权,并在人工智能发展所需的基础理论和下一代人工智能技术突破方面[抢跑道]。

相比之下,在[政策红利+生态闭环]的双轮驱动下,中国人工智能呈现几何级渗透扩散。

与行业应用的燎原之势相比,中国人工智能创新环境、创新要素已经跟不上技术创新的速度和市场扩张的规模。

在应用场景开拓上,在[需求端供给端]共同发力下,推进AI技术赋能交通、医疗、安防、制造、民生等实践场景。

同时,实施AI关键核心技术攻关工程,比如说高端芯片、核心基础零部件及元器件、关键基础软件等领域的研发突破和迭代应用。

中美人工智能产业核心技术生命周期

中国和美国在计算机视觉和自然语言处理领域均处于成长期。

中国计算机视觉技术发展相对活跃,专利大量涌现,创新成果较为丰富。

美国计算机视觉技术由于出现性能更加优越的颠覆性技术以取代旧技术,其技术生命周期拟合出多重S曲线。

在计算机视觉和智适应学习技术领域,中国在萌芽期和成长期均具有显著的技术领先优势,而美国并不具有技术优势。

在数据识别和数字信息的传输略占优势,而美国在电数字数据处理具有一定的技术优势。

在脑机接口技术领域,中美两国在脑机接口子领域萌芽期均表现出较强的技术领先态势。

随其发展至成长期,中国领先优势相对减弱,成长期持续时间亦相对较长。

中国人工智能产业发展潜力的瓶颈

此前,中国人工智能产业的核心竞争力就是算法和数据资源,劣势是以芯片为代表的半导体元件。

从2018年开始,美国陆续收紧中国获得国际先进芯片的能力。

中美两国人工智能领域的竞争,算法主要看设计团队的智慧和灵感,双方没什么差距;

大数据资源中国占据绝对优势;大数据分析技术双方相近;但决定人工智能产品表现的关键要素还包括算力。

计算能力是计算机的核心能力,这也是中美两国在超级计算机领域竞争多年的原因之一。

决定计算能力的关键是芯片。

中国在尖端芯片领域受制于美国,是我们必须面对的客观现实。

无法获得最好的芯片,甚至无法自主生产最好的芯片。这是制约中国人工智能产业发展潜力的瓶颈。

从技术资本层面,最大的限制来自算力、算法、数据。

算力方面,我国的数据中心多面向软件应用环境,比如游戏服务器外包,真正面向AI的算力非常少。

而算力本身是非常昂贵的,模型越大,数据越多,数据训练AI所要消耗的费用就越多,一次集中算力训练需要几百万美元的算力,这是国内AI公司不能负担的。

数据方面,国内数据的质量普遍不高,因为数据本身积累上的问题。

算法方面,我国AI开发者有思维惯性,过度依赖开源内容,对大模型缺乏探索创新。

中国朝着包容、创新的AI生态系统努力

为了缩小这个差距,中国正在从战略高度重视AI发展,瞄准大模型、整合大数据、布局大算力,并实施包容审慎的监管,为新事物的发展留足空间。

国内企业正在努力打破传统的研发模式,寻求通过大数据、大模型和大算力的结合,进一步推动AI技术的发展。

同时,政府也正在积极制定政策,以保障AI技术的健康发展,并为AI带来的新事物发展留足空间。

人工智能部分关键核心技术在举国体制支持下也已取得突破性进展,如语音、图像识别现已跻身世界前列。

围绕提升中国人工智能国际竞争力的迫切需求,根据技术相对取得较大突破、应用场景相对明确以及引起各界较大关注等标准,共筛选出8项人工智能产业核心技术:

计算机视觉技术、自然语言处理技术、跨媒体分析推理技术、智适应学习技术、群体智能技术、自主无人系统技术、智能芯片技术、脑机接口技术。

中国的AI研究已经开始从消费者市场向商业市场转变,这标志着中国AI的成熟和进步。

与此同时,中国还提出了新的立法提案,以规范AI的使用和开发,防止AI技术的滥用。

在AI领域中国具备的独特优势

中国在人工智能领域的优势体现在其庞大的数据资源和技术人才,以及其快速增长的市场。

中国政府在该领域的投入和支持也非常明显,并且对人工智能的重视程度高于其他国家。

中国人工智能的应用处于世界前沿,已深入各个行业且应用场景日益丰富,零售营销、金融、交通、医疗保健、教育、制造业、网络安全等各领域的智能化进程加速推进。

中国具有数据量庞大、人工智能应用场景丰富、需求旺盛等特点,这为人工智能技术的快速发展提供了得天独厚的优势。

当前,中国已进入[万模大战],很多公司都推出自己的大模型,未来中国不会只有一个大模型。

发展大模型难的不是研发,而是与场景结合,而中国互联网大厂的核心优势是自带场景。

中美技术竞争发生了根本性转变

近几十年来,美国的半导体政策的主旋律是市场驱动和自由放任。

新政策是在CHIPS法案通过后出台的,美国坚定地要保持对全球半导体技术供应链[卡脖子]的技术的控制。

最重要的[卡脖子技术]指的是人工智能芯片设计、电子设计自动化软件、半导体制造设备,以及设备零部件。

新政策中针对半导体价值链的不同环节设计了四个环:

①切断高端芯片的供应,以扼杀中国的人工智能、超级计算产业。

②切断中国获得美国芯片设计软件、半导体制造设备,来阻止中国在国内设计人工智能芯片。

③切断美国制造的半导体制造设备供往中国,来阻止中国制造高端芯片。

④切断美国制造的部件,来阻止中国在国内生产半导体制造设备。

结尾:

美国对华AI和半导体的最新出口管制,标志着中美技术竞争发生了根本性转变。

人工智能必然是全球未来竞争的一个重要赛道,无论多难,中国都需要注重投入人工智能研发。

部分资料参考:科技导报:《中美人工智能产业核心技术生命周期的动态比较与演进路径》,爱科创:《中美人工智能国家战略策动路径比较》,总财:《发展人工智能,中美各有什么[长短板]》,六爷阿旦:《人工智能与中美之争》,数字经济先锋号:《中美人工智能竞争大PK:谁领先?》,红山智云:《中美竞争新前线:人工智能(特别报告)》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。

中美人工智能战略策动路径比较与分析

前言:

中国和美国的AI发展状况表明,AI不仅是一种技术,更是一种可能对社会产生深远影响的力量。

中国和美国作为全球两大经济体,正在以不同的方式和速度推动人工智能的发展。

作者 | 方文三

图片来源 |  网 络 

中美人工智能策动路径的比较

美国内外兼顾,对内布局关键技术领域,对外建立最广泛的民主科技联盟;

中国侧重于内,建立独立自主的AI创新生态体系,打造世界科学中心和创新高地。

美国技术反哺国防,维持军事领先优势;

中国全方位开拓应用场景,促进产业转型升级。

美国一方面对内重点布局基础理论和前沿性技术,着力推进多学科交叉研究,旨在掌握未来主导权。

美国联邦政府将投入4000万美元成立国家技术基金委员会,促进技术转移和标准制定;

投入6亿美元,新建30家人工智能研究院,加强人工智能基础领域研究;

设立人工智能创新个人奖和人工智能研究团队奖,鼓励研究人员进行人工智能前沿领域探索;

投入7000万美元进行国家人工智能研究基础设施建设,开发开放人工智能研究资源。

其主要目的在于:保持对未来卷积神经网络等技术路线的主导权,并在人工智能发展所需的基础理论和下一代人工智能技术突破方面[抢跑道]。

相比之下,在[政策红利+生态闭环]的双轮驱动下,中国人工智能呈现几何级渗透扩散。

与行业应用的燎原之势相比,中国人工智能创新环境、创新要素已经跟不上技术创新的速度和市场扩张的规模。

在应用场景开拓上,在[需求端供给端]共同发力下,推进AI技术赋能交通、医疗、安防、制造、民生等实践场景。

同时,实施AI关键核心技术攻关工程,比如说高端芯片、核心基础零部件及元器件、关键基础软件等领域的研发突破和迭代应用。

中美人工智能产业核心技术生命周期

中国和美国在计算机视觉和自然语言处理领域均处于成长期。

中国计算机视觉技术发展相对活跃,专利大量涌现,创新成果较为丰富。

美国计算机视觉技术由于出现性能更加优越的颠覆性技术以取代旧技术,其技术生命周期拟合出多重S曲线。

 

在计算机视觉和智适应学习技术领域,中国在萌芽期和成长期均具有显著的技术领先优势,而美国并不具有技术优势。

在数据识别和数字信息的传输略占优势,而美国在电数字数据处理具有一定的技术优势。

在脑机接口技术领域,中美两国在脑机接口子领域萌芽期均表现出较强的技术领先态势。

随其发展至成长期,中国领先优势相对减弱,成长期持续时间亦相对较长。

中国人工智能产业发展潜力的瓶颈

此前,中国人工智能产业的核心竞争力就是算法和数据资源,劣势是以芯片为代表的半导体元件。

从2018年开始,美国陆续收紧中国获得国际先进芯片的能力。

中美两国人工智能领域的竞争,算法主要看设计团队的智慧和灵感,双方没什么差距;

大数据资源中国占据绝对优势;大数据分析技术双方相近;但决定人工智能产品表现的关键要素还包括算力。

计算能力是计算机的核心能力,这也是中美两国在超级计算机领域竞争多年的原因之一。

决定计算能力的关键是芯片。

中国在尖端芯片领域受制于美国,是我们必须面对的客观现实。

无法获得最好的芯片,甚至无法自主生产最好的芯片。这是制约中国人工智能产业发展潜力的瓶颈。

从技术资本层面,最大的限制来自算力、算法、数据。

算力方面,我国的数据中心多面向软件应用环境,比如游戏服务器外包,真正面向AI的算力非常少。

而算力本身是非常昂贵的,模型越大,数据越多,数据训练AI所要消耗的费用就越多,一次集中算力训练需要几百万美元的算力,这是国内AI公司不能负担的。

数据方面,国内数据的质量普遍不高,因为数据本身积累上的问题。

算法方面,我国AI 开发者有思维惯性,过度依赖开源内容,对大模型缺乏探索创新。

中国朝着包容、创新的AI生态系统努力

为了缩小这个差距,中国正在从战略高度重视AI发展,瞄准大模型、整合大数据、布局大算力,并实施包容审慎的监管,为新事物的发展留足空间。

国内企业正在努力打破传统的研发模式,寻求通过大数据、大模型和大算力的结合,进一步推动AI技术的发展。

同时,政府也正在积极制定政策,以保障AI技术的健康发展,并为AI带来的新事物发展留足空间。

人工智能部分关键核心技术在举国体制支持下也已取得突破性进展,如语音、图像识别现已跻身世界前列。

围绕提升中国人工智能国际竞争力的迫切需求,根据技术相对取得较大突破、应用场景相对明确以及引起各界较大关注等标准,共筛选出8项人工智能产业核心技术:

计算机视觉技术、自然语言处理技术、跨媒体分析推理技术、智适应学习技术、群体智能技术、自主无人系统技术、智能芯片技术、脑机接口技术。

中国的AI研究已经开始从消费者市场向商业市场转变,这标志着中国AI的成熟和进步。

与此同时,中国还提出了新的立法提案,以规范AI的使用和开发,防止AI技术的滥用。

在AI领域中国具备的独特优势

中国在人工智能领域的优势体现在其庞大的数据资源和技术人才,以及其快速增长的市场。

中国政府在该领域的投入和支持也非常明显,并且对人工智能的重视程度高于其他国家。

中国人工智能的应用处于世界前沿,已深入各个行业且应用场景日益丰富,零售营销、金融、交通、医疗保健、教育、制造业、网络安全等各领域的智能化进程加速推进。

中国具有数据量庞大、人工智能应用场景丰富、需求旺盛等特点,这为人工智能技术的快速发展提供了得天独厚的优势。

当前,中国已进入[万模大战],很多公司都推出自己的大模型,未来中国不会只有一个大模型。

发展大模型难的不是研发,而是与场景结合,而中国互联网大厂的核心优势是自带场景。

中美技术竞争发生了根本性转变

近几十年来,美国的半导体政策的主旋律是市场驱动和自由放任。

新政策是在CHIPS法案通过后出台的,美国坚定地要保持对全球半导体技术供应链[卡脖子]的技术的控制。

最重要的[卡脖子技术]指的是人工智能芯片设计、电子设计自动化软件、半导体制造设备,以及设备零部件。

新政策中针对半导体价值链的不同环节设计了四个环:

①切断高端芯片的供应,以扼杀中国的人工智能、超级计算产业。

②切断中国获得美国芯片设计软件、半导体制造设备,来阻止中国在国内设计人工智能芯片。

③切断美国制造的半导体制造设备供往中国,来阻止中国制造高端芯片。

④切断美国制造的部件,来阻止中国在国内生产半导体制造设备。

结尾:

美国对华AI和半导体的最新出口管制,标志着中美技术竞争发生了根本性转变。

人工智能必然是全球未来竞争的一个重要赛道,无论多难,中国都需要注重投入人工智能研发。

部分资料参考:科技导报:《中美人工智能产业核心技术生命周期的动态比较与演进路径》,爱科创:《中美人工智能国家战略策动路径比较》,总财:《发展人工智能,中美各有什么[长短板]》,六爷阿旦:《人工智能与中美之争》,数字经济先锋号:《中美人工智能竞争大PK:谁领先?》, 红山智云:《中美竞争新前线:人工智能(特别报告)》

       原文标题 : AI芯天下丨分析丨中美人工智能战略策动路径比较与分析

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇