博舍

人工智能与档案管理:进展、愿景与挑战 人工智能概念愿景与挑战的答案

人工智能与档案管理:进展、愿景与挑战

自1956年美国达特茅斯会议上首次提出“人工智能”一词以来,人工智能经历三次浪潮逐步发展成熟,在众多领域应用中取得了一系列突破性进展,人工智能呈现出的深度学习、跨界融合、人机协同、群智开放、自主操控等新特征,为经济社会发展注入了新动能。在此背景下,《“十四五”全国档案事业发展规划》提出“积极探索知识管理、人工智能、数字人文技术在档案信息深层加工和利用中的应用”“加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用”,从而提升档案管理数字化、智能化水平,加快档案工作全面数字转型和智能升级。

可见,在深化档案信息化战略转型的指导思想下,档案工作环境、对象、内容发生巨大变化,智能化与档案事业各项工作将深度融合,人工智能技术在档案工作中的应用将更为广泛。因此,作为档案工作者必须适应新时代发展步伐,认清人工智能的“庐山真面目”,了解人工智能技术在档案管理中的应用进展,厘清技术赋能管理的内在逻辑,探讨未来两者结合的发展方向及面临的挑战,从而有助于更好地立足管理需求探寻技术与管理融合的最佳路径。

人工智能及其在档案管理中的应用

1人工智能的概念

人工智能是研究、开发用于模拟、延伸和扩展自然智能的理论、方法、技术及应用系统的一门新的技术科学。斯坦福大学的尼尔森教授认为人工智能是关于人造物的智能行为,包括知觉、推理、学习、交流和在复杂环境中的行为。人工智能包含了科学和工程的双重目标,科学人工智能的目标是理解智能行为是否存在于机器、人类或其他动物中,而工程人工智能的目标是发明出可以像人类一样或能更好地完成智能行为的机器。

从上述定义及目标来看,人工智能的研究范畴既包括逻辑推理、理性思考等高级智能,也涵盖了模仿、感知等低级智能,而实现人工智能的路径既包括对智能内在实现机理的探索,也包括对智能外在表现形式的研发。

2人工智能在档案管理中的应用进展

笔者以“人工智能+档案管理”“机器学习+档案管理”“深度学习+档案管理”等关键词组合在中国知网数据库、国家档案局官网中进行了检索,从中梳理出国内外有代表性的落地应用成果。从梳理结果可以看出,人工智能赋能档案管理实践的途径主要有以下几个方面:

一是“智能+库房管理”。通过在实体档案、档案库房内集成各类物联网设施设备,对档案存放位置、库房“八防”状况进行实时感知和跟踪,再结合档案或库房智能管理系统对感知数据按照预设规则进行处理,实现高度自动化的档案实体管理、库房环境控制、库房安全管理等,提高了档案实体管理和库房管理工作的精细化和精准化程度。

二是“智能+资源建设”。针对档案数字资源建设中的具体业务环节,从收集、整理、鉴定、数字化加工、数字信息管理等角度,设计相应的智能分类模型用于机器学习和训练,将档案管理人员在完成相关业务时的规则、经验、方法转化为自动化、规范化、标准化的智能处置和辅助决策方案,在实践层面验证了采用人工智能技术解决电子文件归档整理、档案保管期限判定、档案密级鉴定、档案数字化成果质量检验和档案信息全文识别等问题的可行性,相关智能软件系统达到可用级别也全面提升了档案数字资源建设质量和工作效率。

三是“智能+服务利用”。根据档案服务利用需求、档案数字资源的类型和结构化程度,面向档案数字资源利用率低、利用面窄、利用层次不高等问题,定制开发文档智能检索、文档数据可视化展示、文件智能编研、档案图文智能定位与精细化检索、视频监控档案查询、归档电子邮件开放鉴定等档案服务利用系统,实现文档智能服务从低端数据标记到高端知识提炼、图像视频检索由目录级查询向内容特征级查询的转变,体现了人工智能技术在档案信息深层加工和利用中的良好效果,为充分发挥档案资政服务和公共服务能力提供了可借鉴推广的成熟案例。

人工智能在档案管理中的应用逻辑分析

要想厘清人工智能技术应用于档案管理的内在逻辑,必须首先理解评判“智能”的标准和实现“智能”的途径,才能搞清人工智能“为什么能”应用于档案管理,人工智能与档案管理结合“为什么行”,两者结合效果“为什么好”等问题。

根据人工智能的定义和目标,评判一个研究对象是否具有智能存在“思维类人”和“行为类人”两种视角,并由此衍生出不同的实现途径,包括模拟人类逻辑推理规则和运算的符号智能、模拟人脑神经元结构和信息处理方式的计算智能。符号智能将智能问题假设为由符号、符号组合、符号规则和符号运算组成的符号推理过程,通过基于规则的逻辑运算和概率判断解释其智能实现过程。计算智能则将智能的实现转化为模拟神经元从“受刺激”到“做出反应”的交互过程,通过对神经网络的充分训练,使其能够从数据中学习如何感知对象和执行任务。

对照智能的评判标准和实现途径可以发现:

人工智能“之所以能”应用于档案管理,其原因在于“智能”的表现形式满足档案管理的任务需求。档案管理任务以区分类别为主要需求,因此大多可以转化为模式分类问题,这里的“模式”既可以是管理层面的模式(如电子文件归档模式、电子档案管理方式和手段等),也可以是业务层面的模式(如“八防”措施、质量控制、鉴定分级、数据化处理等)。无论哪种任务都希望系统能根据相应模式,自动化地响应任务需求,呈现出与档案工作者相似或一致的处理方式和处理结果,而“类人”恰恰是人工智能的重要表现形式之一。

人工智能与档案管理结合“之所以行”,其原因在于“智能”的生成来源契合档案管理的资源基础。“智能”产生的前提是良好的、针对性强的资源准备,包括人类的经验知识和用于学习训练的外部数据。档案管理领域相关法规、标准、规范等凝结了行业专家智慧,体系完整、规则明确,且各类数据资源经过长期规范的维护整理,结构化程度高、数据质量好,为系统习得领域知识乃至生成智能提供了优质的资源基础。

人工智能与档案管理结合效果“之所以好”,其原因在于“智能”的擅长领域匹配档案管理的应用场景。符号智能擅长逻辑,机器智能擅长感知,但“擅长”的前提是任务目标和任务规则的确定,也就是说无论采用哪种智能实现方式,都必须给出明确的知识边界,只有在有穷的知识空间内才能发挥人工智能的优势,最终显现出良好的效果。档案管理领域的工作目标清晰、方法规则规范,领域的知识体系较为封闭,知识类型较为简单,较少涉及常识等难以描述的知识,正适合于人工智能的作用发挥。

人工智能融入档案管理的趋势及挑战

人工智能发展正处于百花齐放的时期。针对人工智能的发展方向,有学者提出“人工智能必须从长期占据主导地位的逻辑智能(AI1.0)和近20年来作为主力的计算智能(AI2.0),向人机混合、虚实交互的平行智能(AI3.0)迈进”。同时,在旧IT(InformationTechnology)向新IT(IntelligentTechnology)的转化过程中,档案管理模式、对象、业务、人才等也悄然发生变革。因此,两者结合的方向、思路、效果等也必将产生新的趋势,带来更多值得思考的问题。

1发展趋势展望

(1)“认知智能+档案管理”将成为档案智能化管理实践的新方向

要想完成人工智能与档案管理的高度耦合和深化应用,绝不能仅仅停留在价值、前景、伦理等角度的选边站队层面,要深化对人工智能技术原理及其背后思想内涵的理解,搞清人工智能是如何运转的、究竟为什么会成功、哪些方面还在其能力范围之外等问题。

从档案行业的应用进展情况看,无论是应用场景还是实现手段,都有意无意地选择了人工智能的“拿手菜”,避开了具有开放式、自主化、解释性等特点的任务类型,这说明档案行业对当前人工智能的优缺点有着清醒的认识。然而,伴随平行智能的兴起,虚实之间的互动反馈成为人工智能的发展方向,这就需要机器将具备“理解”和“解释”领域知识的认知智能。那么如何使机器真正理解档案管理的意义、概念、原理、规则、目标,做到举一反三、过程透明、值得信赖是档案行业深化认识、深入研究的重点。

(2)“符号知识+机器学习”将成为自动化萃取档案行业知识的基本思路

对于现有大多数“人工智能+档案管理”应用来说,人工智能基本等同于深度学习,这种以数据驱动为核心的任务解决方法在样本需求量、模型泛化等方面存在较大挑战,而采用知识引导方式,让机器学习模型有效利用已经大量累积的符号知识,是突破该瓶颈的主要方式之一。

因此,应结合知识引导和数据驱动的优势,将原有“原始数据→机器学习模型→结果”的技术思路转换为“原始数据→机器学习模型+知识库→结果”,知识库中既包含档案管理专家的经验知识,也包括以往机器学习模型得到的规律知识,利用知识库增强模型对档案数字资源数据整合、信息关联、知识发现的萃取能力,满足智能档案管理系统应对档案编研等知识密集型任务的需求。

(3)具备可解释能力将成为智能档案管理系统的重要体现

当前人工智能主要解决的是档案管理环节中的“是什么”问题,比如“是否满足‘八防’条件”“是否需要归档”“是否属于永久档案”“是否对应某个字符或图像”等,大多依赖于大量已标注的数据来进行训练,只能在固定类别集合中进行学习判断。

而未来人工智能将加入对自然语言、常识的理解,更多面向“为什么”“怎么做”的问题,这给档案智能化管理提供更加广阔的应用前景,比如以知识图谱为底层知识库的档案管理系统,能够将涵盖文字、图像、语音、视频等多模态档案信息的特征表示映射到同一个空间,使不同模态的档案数据与相应实体或概念关联,形成跨模态的档案管理知识库。知识库给机器提供了必要的档案管理背景知识,弥合了人机在语义理解上的差距,为机器在执行档案管理任务时做出各类推理判断、辅助决策等提供完整的、可回溯的证据链,进一步提升档案智能化管理的科学性和信任水平。

2面临的挑战及思考

(1)档案数字资源可用性较低,应区分“存量”和“增量”做好档案数据化工作

尽管在各级各类档案管理标准规范下,档案数字资源在数据格式、数据来源、数据库类型、数据真实完整性等方面较为统一,数据质量较好,但绝大部分管理粒度仍处于案卷级、文件级粒度,未下沉到档案内容或特征层面的属性描述,无论是文本还是图片、音视频都缺乏结构化的标记,且部分档案出于行业壁垒或国家安全与个人隐私的顾虑,无法共享共用,这些都给档案数据治理和知识获取提出了巨大的挑战。为应对这些问题,可以从“存量”和“增量”两方面进行考虑:

对于“增量”方面,主要应依托电子文件管理系统进行前端控制,在文件形成阶段就将档案智能化管理可能需要的结构化标记信息,以元数据、图像特征、音视频流特征等形式提取和保存起来。

对于“存量”方面,笔者认为仅依靠档案管理人员无法承担如此大量的结构化标记任务,必须借助外部力量才能得以实施。在人工智能领域有一项“亚马逊土耳其机器人(AmazonMechanicalTurk)”服务,能以极低的成本购买数据标注服务,用于创建各式各样的训练数据集,这项服务被人工智能研究者称为“天赐之物”,许多人工智能领域的学术资助提案都会包含一个土耳其机器人的专属条目。这种方式本质上就是采用众包技术获取标注样本,作为档案机构同样也可以将已开放档案数据的结构化标记任务外包给大众志愿者,通过互联网集成大众的知识和智慧来解决存量大、人力少、耗时长、成本高等问题,实现档案知识的规模化获取和验证,提升档案数字资源的可用性。

(2)档案知识库的构建及应用尚处于初级阶段,应探索具有档案管理特色的构建方式

从上述发展趋势看,融入行业沉淀知识是提升档案智能化管理效能的重要手段,知识库则是实现知识资源积累的具体形式。然而,当前流行的以知识图谱为核心的知识库构建技术并不完全适用于档案知识库的构建,具体原因有以下3个方面:

一是数据类型多,目前知识图谱构建技术主要面向文本类数据,而档案信息资源中还包含大量照片类、录音录像类的多媒体档案数据,跨模态的档案知识获取、知识表示、知识关联还缺乏深入研究。

二是部分知识开放性强,知识图谱的构建分为知识框架和知识实例两个层面,知识框架层面的知识单元易于获取,可以利用国家和档案行业标准对相关概念以及概念之间的关系进行描述和定义,但知识实例层面的知识开放性强,特别是档案内容中涉及人物、历史事件、经济社会等方方面面的知识,往往会超出档案管理领域预设的知识边界。

三是部分应用场景复杂性高,与通用的知识图谱相比,档案知识库中更多包含的是业务知识,知识复杂性高于一般的词汇和语义语法知识,且在档案鉴定、编研、辅助决策等场景下需要掌握使用规则更为繁杂的动态过程知识,涉及大量的长程推理,需要针对场景精心设计和较长的学习周期才能胜任复杂应用需求。

因此,在档案知识库构建的落地实践过程中,切忌盲目贪大求全,必须以档案服务利用应用或场景为切入点,按照“结构化数据—半结构化数据—非结构化数据”的顺序选取数据源,遵循“语言知识—业务知识—决策知识”的步骤获取知识类型,由易到难,逐步求精。

(3)档案人员的角色转换意识有待加强,应遵循“人机协同”发展的基本原则

“机器换人”“机器取代人”是人工智能研究过程中无法绕过的一种恐慌悲观情绪,但经过长期的研究实践,学者们已逐渐形成共识—“人有人用,机有机用”,即机器虽然可能取代一部分岗位,但能够创造出更多更好的工作岗位,这一认识实质上是将人机协同作为人工智能发展的基本原则。

因此,人工智能在档案管理领域的落地同样需要人和机器的共同参与,缺一不可。当前及未来一段时期内的档案智能化管理本质上还属于“人工”的智能化管理,还属于档案领域专家指导下的智能系统,档案管理人员将转变为档案数据工程师、档案知识工程师、档案业务架构设计师等角色,承担数据标准把控、经验知识提炼、业务框架设计、质量评估干预、辅助决策分析等工作,形成人机交互协同的闭环管理新模式。档案机构应进一步厘清档案管理任务中的人机边界,即对机器来说,哪些任务或一个任务中哪个环节属于简单任务,而哪些属于看似容易却很难做到的任务;对人来说,哪些需要领域专家出马,哪些可以采用众包服务方式,都需要进一步明确。只有在明晰边界的基础上才能真正使档案智能化管理实现“人机结合、知行合一、虚实一体”。

作者单位:国防大学政治学院

文章来源:《中国档案》2022年第11期

智能的起源和在人工智能领域的愿景与实践

以下是演讲实录:

大家好!下面我就介绍一下华为,特别是诺亚方舟实验室在人工智能方面做的研究和技术开发。重点放在智能手机这块的应用。我先介绍一下我们在智能手机上面的愿景,介绍一下我们相关的产品和我们的研究,最后介绍一下我们的技术。

诺亚方舟实验室成立4年,杨强教授是我们实验室第一人主任,我们研究的方向主要是人工智能、机器学习,数据挖掘,更进一步来说我们现在围绕华为三个BG的产品做研究开发,大概来说我们有4个方向:

第一个是智能通讯网络,大家知道通讯设备是华为非常重要的产品,未来的通讯设备一定是基于数据挖掘的,所以我们在这方面做了很多的技术开发。另一方面是大数据,还有我们聚焦在华为的智能手机上,主要是在语义语音,推荐搜索这方面的技术,帮助我们的用户能够更好的使用手机。简单说一下我们未来的愿景。我们用智能信息数据来概括我们的愿景。未来的华为的智能手机首先通过语言能够很自然的跟用户做交流,能够去帮助用户克服语言障碍,能够帮助做翻译,能够理解用户做需求,给用户做推荐,能够帮助用户管理信息,同时能够很好的帮助用户得到外界的信息。

下面介绍两个我们围绕华为手机做的产品,我们诺亚方舟实验室跟终端的部门有密切的合作,我们在一起开发几个重要的产品,比如说华为的应用市场,大家用华为手机的用户知道到华为的应用市场我们有应用的推荐和搜索,这个推荐和搜索的算法是我们华为诺亚方舟实验室和终端的产品线的同事们一起开发的,这里面的挑战就是一个大数据的挑战,这里面有3亿的注册用户,每天有3000万的用户访问我们这个市场,下载的用户每天有1亿,这里面怎么能够帮助用户很好很快的找到他们的应用,这个是比较挑战性的问题,大家知道搜索和推荐都是在大数据的环境下都是极具挑战性的,怎么样能够时时的更新模型,能够更好的满足用户的需求,现在用业界最新近的技术做推荐和搜索。

另外,我们做的大家有华为手机的话可以有看手机服务这个部分,我们有智能问答,回答怎么样更好的使用华为的手机,用自然语言的方式来问答,比如说怎么给手机做备份,我们可以找到答案,有的是我们的技术手册里面找到的答案,准确率能够达到90%,能够给用户提供更好的帮助,大家不用去网上去搜华为的使用了。

下面我做几个演示,我们诺亚方舟实验室一方面在跟产品部门一起开发产品,另外一方面未来在做一些技术的研发,特别是深度学习这方面我们做了一些工作,我现在演示三个演示:第一个是图片搜索,假设你是一个手机用户,你在手机上可以用语音或者是拼音的方式输入你的问题,比如说在飞机上看到云彩的照片,现在这个场景是由2万张图片,可以用自然语言的方式搜这些图片,这些图片没有做任何的图象处理,比如说吃火锅的照片,或者是爬山的照片可以通过自然语言自动的找到这些照片,现在手机上有成千上万的照片,怎么样做好照片的管理,这个是非常有用的应用,我们现在在做这方面的技术开发。下一个是在做机器翻译,特别是用深度学习,大家叫做神经技术翻译,这块也开发了业界领先的技术,因为时间的关系我就不放了。

这个演示是神经响应机,这个是基于深度学习做单轮的自然语言的对话,这个是我们在业界第一个开发出来的,生成式自对话系统,这个系统可以自动的去产生回答,并不是像传统的问答系统,我们有大量的数据,有44万的数据去建立这样一个系统,这个系统比谷歌其他的公司开发的产品,我们早发表,并且在ACL的顶级的会议上发表了这个论文。我介绍一下里面的内容,比如说你输入一句话,我们到诺亚方舟实验室来访问的话,我们可以给你看看时时的,前天我们华为的总裁来诺亚方舟实验室参观我们就给他展示这个,比如我想买一部三星的手机,这个系统会说还是支持一下国产的吧,比如说你说占中终于结束了,系统会说下一个是不是鹿角嘴,产生一些非常有意思你完全想象不到的回答。

我们下面看一下这个技术,我们在围绕终端这样的应用场景在做技术开发,这块列出来的是我们主要在做的技术研究,包括问答、推荐、语音识别、对话、翻译、图片、检索、深度学习,就是说我们在特别是深度学习这方面做了业界一系列比较领先的一些工作,这块介绍一些具有代表性的工作。第一个是MulimodalCNN,第一个是图片搜索的演示,你说一句话就找到相关的图片,我们现在有2万张图片,每张图片大概有3句的描述,比如说一个小孩在游泳照片,有15万对数据,我们就可以训练这样一个模型,大家知道卷神经网络是一个比较有代表性的网络,左边的是可以把这个图片抽取出来,这个CNN有多层,可以从图片里面抽取里面的轮廓和物体,另外一个是从文本里面抽取特征,直观的就是单词和词组的特征,你说这句话小孩的照片,这个小孩可能就会被抽取出来作为特征,在这个照片里面正好有一个小孩,这个小孩会作为一个物体抽取出来,通过大量的学习可以做到刚好看到的效果,这个可以看一下,我们的实验的结果,这个是英语的30K的数据,我们做了比较实验,我们比较了跟业界的其他部门的方法的结果,可以看到诺亚方舟实验室提出的刚才MulimodalCNN在检索方面可以达到最好的效果,有些模型不一定很公平,大家为了所谓的Exprimental上面,可以达到更好的水平,这个工作在去年的图象识别的大会上训读了我们的论文。

下一个介绍的工作,我们看一下机器翻译和对话里面我们用了序列到序列的学习,最早的模型是谷歌和蒙特利尔大学提出来的,我们对他进行了改进,用在对话和翻译上取得了非常好的效果。序列到序列的学习到底是什么样好的方法。大家问自然语言里面哪个深度学习的工具给我们带来最大的革命性的变化,让我来说的话就是序列到序列的学习,基本的想法是这样,用翻译来做例子,现在把中文的一句话,一只猫坐在垫子上“A catsita cushion”,序列对序列的模型,从左到右一个词一个词的去看我们的中文,把它转换成一个语义的表示,这个是一个向量,我们现在看到的HE、HT-E,HT,就是这个一只猫坐在一个垫子上得到的语义的表示,我们叫编码,这个翻译到目标语言,翻译成英语的话这个T-1,表示说英语产生这样的句子在每个位置上对应的语义表示是什么,我们翻译要做的就是要把这个原文,中文做一个编码,表示成中间的表示,再从中间的表示转换成另外的一个中间的表示,是一个解码,把它转换成英文的句子,中间的C的这一行就是所谓的叫注意力模型,注意力就是帮助我们去选择,当我产生英文的某一个单词,我要做翻译要一个一个的产生英文单词,我要有选择性的去决定,我现在在任何一个位置我要决定产生解码的表示的时候我是要选择中文的语言里面的哪个表示更好,这个C实际上做了一个平衡,我在每个位置上我要重新判断,我现在要产生一个英文的单词的时候对应的中文是哪个好,直观上来说是这样的解释,我们可以通过这样的模型,实际上是相当复杂的,通过这个模型你给我任何一个单词的序列我可以产生另外的序列,这个数据是中英文我可以产生翻译,这个模型的效果是非常好的。

我们刚才演示的神经响应机实际上也是用的序列到序列学习的模型,这个时候我们有一点不同是中文到中文的句子,但是它不像翻译,翻译是在两句话不同的语言,但是语义是一样的几两句话才同一个语言他们形成同一轮的对话,我们最核心的想法就是用注意力的机制,但是我们有一个全球的机制,直观上解释这个C实际上表示我读完这句话整体的语义就是一个10数值的向量,每个位置上的编码得到的结果是得到每个位置上得到的语义是什么,这两者的语义结合起来就变成中间C的这一行的语义,再把它转换成要对应的话的语义的表示,最后再解码变成一句话,这个模型我们有400万的对应的数据的话就可以把这个模型对应得比较好,能够做这样转换。我们看到正确的句子大概有95%,大概有76%的回答是能够形成自然的对话,就是刚才我举的例子。

我们现在可以把它用在机器翻译上,机器翻译我们用的机制就是我们说序列对序列是很强大了,但是我们可以把它做得更好,用传统的序列对序列的模型的话会把原文的东西漏掉,或者是翻译多次,我们这边有一个机制,翻译的时候我哪些东西翻译过了就不用翻了,哪些没有翻,同时这个机制可以把它变得更强,直观上说我要产生英文下面是一个实词和虚词的话是不一样的,就中文的话就好了,如果产生一个实词,cat,这样的话我就要看哪个词影响我,如果两个结合的话会产生很好的效果,这个礼拜ACL顶级会议上我们发表了一个论文,其中有一个就是解决漏译或者是过译的问题。

诺亚方舟实验室在手机方面做产品方面的开发,做图片检索等技术方面的研究,就到这里,谢谢大家!

“人工智能+制造”的机遇与挑战

传统制造企业在全面实施“人工智能+制造”有困难时可以优先发展人工智能质量检测、预测性运营与维护、供应链管理等相对成熟的“人工智能+制造”应用。

人工智能技术可能是继蒸汽机、电力、互联网科技之后推动新一轮产业革命浪潮的革命性技术。在大量的数据、更好的算法和更强的算力的共同推动下,人工智能的应用已经在很多行业落地,逐渐渗透并开始带来实际的价值。

根据壹行研(InnovaReserch)的研究,在全球范围内,人工智能在先进制造、自动驾驶、医疗、金融、安防、电网、家居、零售等数据基础较好的行业的应用场景正在不断建立起来。相关案例包括:人工智能在金融行业的智能风险控制、智能投资顾问、市场预测、信用评级等领域的应用;在医疗领域,人工智能算法被应用到新药研制、辅助诊疗、癌症检测等方面;谷歌、百度、特斯拉、奥迪等新兴科技企业和传统汽车企业巨头纷纷进入人工智能辅助的自动驾驶领域;在制造业,人工智能可以帮助制造企业建立产品的设计模型、优化生产流程和工艺、提升生产效率、降低成本、提升质量。

“人工智能+制造”助力中国制造业升级转型

“人工智能+制造”是将人工智能技术应用到制造业,在自动化、数字化、网络化的基础上,实现智能化。其核心在于机器和系统实现自适应、自感知、自决策、自学习,以及能够自动反馈与调整。人工智能、工业互联网等相关技术的融合应用能逐步实现对制造业各流程环节效率优化。其主要路径是由工业物联网采集各种生产、物流等数据,放到云计算资源中,通过深度学习算法处理后提供流程、工艺等方面的优化建议,甚至实现自主优化,以及在未来实现人类工人与智能机器融合的协同制造。

中国是制造大国,人工智能在制造领域的应用备受重视。2017年12月16日,工业和信息化部发布《促进新一代人工智能产业发展三年行动计划(2018—2020年)》(以下简称《行动计划》),提出鼓励新一代人工智能技术在工业领域各环节的探索应用,提升智能制造关键技术装备创新能力,培育推广智能制造新模式。《行动计划》还进一步提出了加快应用人工智能技术进行制造业改造升级的具体任务,为我国智能制造的深化发展提供有力的支撑。

目前,中国的制造业面临内部和外部多种压力。来自内部的影响包括劳动力成本上升、原材料成本上升、环境压力和市场饱和。外部压力一方面来自西方发达国家的贸易摩擦、关税壁垒、技术封锁、设备和关键零部件禁运等,另一方面来自印度、东南亚低成本新兴国家的竞争。在内部、外部压力越来越大的情况下,提升效率、保证质量、降低成本和节能环保等成为中国制造业升级转型的方向,而人工智能技术在制造业的应用将会助力中国制造业实现这些升级转型的目标。

“人工智能+制造”的机遇与挑战

“人工智能+制造”是中国制造业升级转型的一个重要途径。将人工智能技术用于制造业将有效提高生产效率;实现柔性化生产;提高产品质量,降低人为错误;持续工艺改善,提升成品率,并降低生产成本。未来几年,中国制造业转型升级的巨大需求可以为“人工智能+制造”市场的拓展提供极好的机遇。不过,“人工智能+制造”机遇与挑战并存。

一方面,近年来全球人工智能应用不断拓展,人工智能领域的资金投入迅速增长,人工智能的数据、算力和算法都取得很大的进步,技术可行性越来越高。大数据相关技术在数据输入、储存、清洗、整合等方面作出了贡献,帮助提升了人工智能深度学习等算法的性能。云计算的大规模并行和分布式计算能力带来了低成本、高效率的计算力。

物联网和通信技术的持续发展也为“人工智能+制造”的发展提供了重要的基础设施。在未来5G等无线互联技术的支持下,数据的传输与处理速度将进一步提升。同时,传感器、无线传感网络等技术的发展帮助“人工智能+制造”系统收集大量的制造流程、物流等数据,高质量的海量数据对人工智能数据训练至关重要。总体而言,上述技术的发展使得人工智能赖以学习的标记数据获得的成本在不断下降。

算力增长也为“人工智能+制造”的应用提供了条件。在过去10年间,芯片处理能力提升、云服务普及以及硬件价格下降使计算能力大幅提升。成本不断下降以及算力的提高为“人工智能+制造”的实施提供了保障。

另一方面,中国发展“人工智能+制造”还面临诸多挑战。这表现在以下几点:

首先,关键技术自主能力弱。在“人工智能+制造”所涉及的关键技术上,我国的自主能力还比较弱。相关技术包括半导体芯片、核心装备部件、相关软件、算法等。这些关键技术,尤其是芯片等基础技术,需要大量的人力、物力投入以及长期的技术积累和经验沉淀,短时间内难以突破。

其次,传统制造业的管理模式陈旧。传统制造企业的根基起源于工业时代的大规模、标准化生产,其管理模式仍然以金字塔、多层次、细分化为主。这种企业管理模式灵活性差,较难适应快速变动的制造任务和客户需求。未来,人工智能的实施需要人机协同、人机分工,组织管理也需要更灵活、更高效。为了适应这种变化,很多传统制造企业的管理模式需要改变。

再则,资本投入不足。虽然人工智能行业吸引很多资本涌入,但在“人工智能+制造”应用领域的资本投入比较少。这主要是由于传统制造业利润普遍不高,而传统制造企业的改造升级涉及大量的设备、软件和硬件更新与改造,需要长期、大量的资本投入,投资周期长,短期效益很难显现。因此,虽然“人工智能+制造”的概念深入人心,但真正拿出真金白银投入的相对较少。

最后,制造业细分领域众多,每个细分的行业标准不一。即使在同一制造业领域,企业情况也是千差万别的。因此,“人工智能+制造”项目实施面临的情况十分复杂,没有什么统一的标准可言。例如,在企业车间往往有大量不同厂牌的数字化机床和其他工业自动化产品,涉及很多不同的工业以太网和现场总线标准,厂家软硬件不兼容的情况非常普遍。由于数据格式不兼容,只是进行设备改造,将底层数据收集上来就要花费很多时间和精力,还需要对这些数据进行清洗和转化。对传统制造企业来说,相关标准缺少和复杂的生产线现状使得实施“人工智能+制造”困难重重。

从相对成熟的“人工智能+制造”场景入手

“人工智能+制造”实施投入大,传统制造企业实施相关项目的复杂程度较高。不过,壹行研(InnovaResearch)研究发现,在众多的“人工智能+制造”应用场景中有一些技术相对成熟,并有了相当数量的项目落地。这些相对成熟的“人工智能+制造”的应用主要包括以下几种。

●质量检测

电子制造、汽车等行业工序复杂,在线检测的环节比较多,需要对产品进行大量的、基于视觉识别的质量检测、缺陷检查等。传统的质量检测以人工为主,人工识别精度有限,检测速度慢、误差大、成本高,工人长时间工作容易疲劳,容易出现次品漏检现象。另外,工人经验很难量化,工人流动性高,经验难以积累,难以指导生产线优化,而培训工人的时间较长、花费较高。

使用工业相机或高清摄像头捕捉产品组件、电路模块等在生产和组装过程中的图像和视频,可以提供给人工智能软件进行分析判断。在开始时用人工检查员进行二次检查和确认,人工智能技术可对当前和历史数据进行智能分析与处理,而人工的判断可以反过来帮助人工智能完善算法,指导人工智能系统持续学习。该系统的检测准确率能随着经验积累而持续改善。

例如,腾讯云帮助福耀玻璃工业集团股份有限公司实现了质量检测工序替代80%的人力,并且不良品检出率为90%以上。该系统使用的视觉洞察(VisualInsights)技术,前端使用高清摄像头,后端使用人工智能算法。云端处理器通过训练不断识别合格和异常产品图像的差异,进行快速学习、训练,并完成人工智能算法的建模。

又如,日本NEC公司推出的机器视觉检测系统可以逐一检测生产线上的产品,从视觉上判别金属、人工树脂、塑胶等多种材质产品的各类缺陷,从而快速检测出不合格品并指导生产线进行分拣,在降低人工成本的同时提升出厂产品的合格率。

人工智能视觉检测可以最终实现无须人力的机器自主质检,且全天候无间断。目前,人工智能视觉检测过程用时已经可以做到比人工检测时间缩短80%,有效节约了检测的人工成本。另外,计算机视觉检测精准度高,可以检测到肉眼无法检测的微小瑕疵,且判断标准一致,保持了检测过程的一致性。

人工智能检测在电子、汽车等制造行业的质量控制环节应用越来越广泛。在有些案例中,使用人工智能结合物联网和大数据技术已经能够实现把产品质量的自动监控扩展到整个生产流程。这不仅能提高质量检测效率,还能指导工艺、流程等改善,提高整体良品率。

●预测性运营与维护

传统上,工厂流水线车间一直采用被动式维护,只是在设备产生故障之后,才采取一定的措施来修理,也有采用工人定期巡检的方式来发现问题。这些维护方式过度依靠人工,且效率低下。

基于人工智能的预测性运维系统可以利用机器学习、处理设备的历史数据和实时数据,搭建预警模式,提前更换即将损坏的部件,从而有效地避免机器故障的发生。企业可以借助人工智能运维系统来减少设备故障和由此带来的损失,提高设备利用效率。

例如,美国初创企业Uptake公司凭借大数据、人工智能等技术提供端到端服务,以工业设备故障预测分析、性能优化为主营业务。国内科技创新型企业智擎信息技术(北京)有限公司的故障预测解决方案也可以提前2~4天预判故障,从而降低运维成本和备品备件库存成本,提升设备可利用率和整体运转性能。此外,还有公司推出基于人工智能的轴承健康状态感知系统,利用深度学习方法对轴与轴承部件的状态参数进行大量的历史数据分析,判断轴承的运行寿命。这项技术使设备年平均大修次数降低67%,系统诊断及维护响应时间少于1小时,从而大大缩短了维护周期,提高了设备利用率。

●供应链管理

电子等制造行业的零部件供应商来自全球各地,供应链比较长,涉及的元器件种类和分销渠道的流通环节非常多,容易受到国际政治、天灾人祸等因素的影响。传统供应链管理的效率低、流通成本高、需求预测不准、供应响应不足、应对供应链波动的能力不足、厂商的库存管理成本比较高。

供应链管理落后可能带来巨大损失。例如,2018年上半年存储芯片、硅片、贴片电容(MLCC)全线短缺,价格疯涨,很多电子制造业OEM厂商付出几倍甚至几十倍的价格购买芯片,甚至因为元器件缺货造成一些厂商生产线停产。

使用机器学习深入研究供应管理环节,分析需求、计划和库存,建立实时、精准匹配的供需关系,通过掌握和预测需求动态变化能够有效地促进供应链调整优化。借助人工智能,可以帮助制造业企业实施多级库存、计划生产等库存动态调整,最终实现采购和补货的半自动甚至全自动化。

人工智能可以基于大数据进行需求预测,这些大数据不仅来自供应链内部的各个环节,还来自行业外的数据,如贸易促销、媒体活动、新产品发布、季节性变化,甚至气候数据预测等。一些公司还利用机器学习算法识别需求模式,其手段是将仓库、企业资源计划(ERP)系统与客户洞察的数据合并利用,使用人工智能算法进行有效分析和判断。

在供应链运营方面,美国多式联运运输公司罗宾逊全球物流(C.H.Robinson)针对卡车货运的运营需求开发了用于预测价格的机器学习模型。模型既整合了不同路线货运定价的历史数据,又将天气、交通以及社会经济突发因素等实时参数加入其中,为每一次货运交易估算出公平的交易价格,在确保运输任务规划合理的前提下实现企业利润的最大化。

用人工智能进行供应链管理和预测可以有效地减少预测误差、提高库存周转率,并能有效地优化库存分布。人工智能掌握和预测需求的动态变化,尤其适合于电子制造、汽车及相关零配件、食品饮料等市场需求变动较大、供应链体系复杂的行业。

综上所述,“人工智能+制造”是中国制造业转型升级的重要途径,其发展的机遇与挑战并存。传统制造企业在全面实施“人工智能+制造”有困难时可以优先发展人工智能质量检测、预测性运营与维护、供应链管理等相对成熟的“人工智能+制造”应用,实现“人工智能+制造”的单点突破。这些系统可以独立运作,带来实实在在的收益,也可以在未来并入“人工智能+制造”大系统。

厉俊,壹行研(InnovaResearch)创始人、总经理。壹行研是领先的、专注于新技术的行业研究公司,研究领域涵盖新材料、新能源、工业互联网和机器人、电动汽车和储能等。

作者:厉俊

本文来自《张江科技评论》

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇