博舍

智能化快速审单与基于知识图谱的智能预警系统与方法与流程 智能审单 知识图谱

智能化快速审单与基于知识图谱的智能预警系统与方法与流程

1.本发明属于人工智能与报单识别技术领域,尤其涉及一种智能化快速审单与基于知识图谱的智能预警系统与方法、以及实现所述方法的计算机程序指令介质。

背景技术:

2.报单审查是货物通关、质量检查等必须的环节,同时,在一些企业物流流程化处理过程中,也涉及不同层级上的报单审查。在报单量较少情况下,采用人工审核也能基本满足需要;在报单来源单一(例如企业内部的统一报单)的情况下,可以根据报单来源的统一性(例如表单模板)等属性实现建立预设的报单审阅工具,例如ai审查模型等,辅助或者自动的完成报单审阅。3.然而,如果报单来源多样化、报单申报明细、报单申报主体多种多样,则上述现有技术无法满足要求。人工审核数据量太大,预设模型或者预设工具也无法事先兼顾所有情形,此时,报单审批的速度就会急剧降低,其效率和准确性也会受到影响。4.以海关通关或者质检部门审阅报单的场景来说,单证审阅纯属机械劳动,导致整体通关资料准备花时过长;通关过程数据多次重复录入,准确性较差,导致审单过程工作量加大,通关过程自然被拉长。5.随着大数据、云计算等互联网技术的发展,简化通关作业流程,加快通关速度,降低企业运营成本,不仅是报关行业的诉求,也是外贸发展对服务产业提出的新的需求。6.为此,中国发明专利公开文本cn107918836a提出一种智能通关系统及方法。包括数据采集单元、数据处理单元、数据传输单元;所述数据采集单元支持多行业、多类型数据采集,其中,多行业数据包括企业erp的数据、仓储的wms数据、船代、货代系统的数据、拖车gps信息,多类型的数据xml、txt、excel文件以及各类型数据库的数据;所述数据处理单元根据所述数据采集单元采集数据,处理生成需要申报的单据;所述数据传输单元用于将生成的申报单据发送给海关端,并接收海关端反馈信息发送给企业端。本发明通过对通关环节的资源整合及平台间数据的协同,提升企业无纸化通关速度,创造互联时代通关新环境。7.然而,上述现有技术仍然未能实现在报单来源多样化、报单申报明细、报单申报主体多种多样化的场景下,如何快速智能化审单的需求,更不能实现在不同情况下的分级预警与处理。

技术实现要素:

8.为解决上述技术问题,本发明提出一种智能化快速审单与基于知识图谱的智能预警系统与方法、以及实现所述方法的计算机程序指令介质。9.在第一个方面,本发明提供一种系统类型的技术方案,在该技术方案中,所述系统包括报单接收子系统、报单关联子系统、报单中转子系统、报单分离子系统以及预警子系统以及与报单分离子系统以及预警子系统连接的知识图谱数据库。10.知识图谱数据库包括多个知识谱节点以及知识谱路径;每个知识谱节点对应至少一个明细项目;将每个关联报单组合集包含的明细项目与知识图谱数据库进行匹配,得到匹配的知识谱节点数目与知识谱路径重合程度;基于匹配的知识节点数目与知识谱路径重合程度,确定处理级别,基于所述处理级别将每个关联报单组合集发送至所述预警子系统的多个分级预警子系统;预警子系统汇总所述多个分级预警子系统的分级预警结果,得出待审阅报单的快速审单结果。11.在第二个方面,本发明还提出一种智能化快速审单与基于知识图谱的智能预警方法,所述方法可以由计算机设备,通过计算机程序指令的形式,实现多个步骤的方式来执行。12.多个步骤的执行顺序包括:13.s1:获取待审阅报单ai的著录项目bai;14.s2:判断是否存在对应所述著录项目的关联存储堆栈stacka;15.如果存在,则将待审阅报单ai存贮至所述关联存储堆栈stacka;16.如果不存在,则基于所述著录项目bai新建对应的关联存储堆栈stackai后,将待审阅报单ai存贮至所述关联存储堆栈stackai;17.s3:判断所述关联存储堆栈是否满栈,如果是,则进入下一步;18.否则,令i=i+1,返回步骤s1;19.s4:计算所有满栈的关联存储堆栈存储的关联报单组之间的相似度,将相似度大于预定阈值的关联报单组组成一个关联报单组合集;20.s5:识别出每个关联报单组合集的处理级别;21.s6:基于所述处理级别,调用相应的预警模型对每个关联报单组合集执行分级预警;22.s7:汇总分级预警结果,得出快速审单结果。23.第二个方面的所述方法可以通过包含处理器和存储器的电子装置,尤其是图像处理终端设备,包括移动终端、桌面终端、服务器以及服务器集群等,通过程序指令自动化的执行,因此,在本发明的第三个方面,还提供一种计算机可读存储介质,其上存储有计算机程序指令;一种电子装置,包括处理器、存储器、通信接口。24.通过包含处理器和存储器的图像终端处理设备和电子装置,执行所述程序指令,用于实现所述方法的全部或者部分步骤。所述处理器和存储器通过总线连接,构成终端设备的内部通信。25.本发明的技术方案,通过将属于同一著录项目的多个报单归集到同一个关联组,并基于多个关联组织间的相似性进行集中处理识别出其处理级别后,分发至不同的预警子系统进行分级预警,从而实现了不同级别的针对性处理,并且整个处理不再是针对单份的报单文件,而是集中处理,使得报单审阅和识别更加快速的同时,确保了处理的及时性和准确性。26.本发明的进一步优点将结合说明书附图在具体实施例部分进一步详细体现。附图说明27.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。28.图1是本发明一个实施例的智能化快速审单与基于知识图谱的智能预警系统的子系统结构示意图29.图2是图1所述智能化快速审单与基于知识图谱的智能预警系统中部分子系统的连接和数据流处理示意图30.图3显示了图1所述智能化快速审单与基于知识图谱的智能预警系统中的关联报单组的存储方式示意图31.图4显示了图1所述智能化快速审单与基于知识图谱的智能预警系统中的报单分离子系统与分级预警子系统的处理示意图32.图5是本发明一个实施例的智能化快速审单与基于知识图谱的智能预警方法的计算机程序实现流程示意图33.图6是实现图5所述方法流程的计算机可读存储介质与终端设备的示意图具体实施方式34.下面,结合附图以及具体实施方式,对发明做出进一步的描述。35.参照图1,是一个实施例的智能化快速审单与基于知识图谱的智能预警系统的子系统结构示意图。36.在图1中,所述系统包括报单接收子系统、报单关联子系统、报单中转子系统、报单分离子系统以及预警子系统。37.所述报单接收子系统连接所述报单关联子系统,所述报单关联子系统的输出作为所述报单中转子系统的输入后,报单中转子系统输出作为报单分离子系统的输入,后者的输出端接入预警子系统。38.在图1实施例中,所述系统还包括与所述明细项目有关的知识图谱数据库,所述知识图谱数据库与所述报单分离子系统以及所述预警子系统连接。39.知识图谱(knowledgegraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。40.知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。41.在本发明涉及的知识图谱数据库中,是与所述待审阅报单相关的知识图谱节点和知识图谱路径。42.作为更具体的例子,所述待审阅报单可以是(海关)通关申报单,典型的货物通关申报单包括企业名称或者个人名称,属于该企业或者个人申报的货物明细,以及申报单上固有的处理流程节点。43.所述报单接收子系统,用于接收待审阅报单,所述待审阅报单具有著录项目和明细项目;44.这里的著录项目包括前述提及的企业名称或者个人名称,还包括当前通关申报单的具体处理节点名称,例如初审;45.这里的明细项目,包括前述提及的属于该企业或者个人申报的货物明细,以及当前具体处理节点名称(例如初审)固有的处理流程节点(例如时间审核、签章审核、签字审核等)。46.在图1基础上,参见图2。47.所述报单关联子系统,连接所述报单接收子系统,用于将所述待审阅报单按照著录项目进行关联,获得多个关联报单组;48.作为一个优选的实施方式,将所述待审阅报单按照著录项目进行关联,可以是,将著录项目相同的待审阅报单进行关联;也可以是,将著录项目相似的待审阅报单进行关联;49.作为具体的海关通关单的处理,在本示例中,将所述待审阅报单按照著录项目进行关联,是将至少两个著录项目(企业/个人名称‑统称申报者名称;处理节点名称)相同的待审阅报单进行关联,即关联到一起的待审阅报关单至少申报者名称和处理节点名称相同。50.所述报单中转子系统,连接所述报单关联子系统,用于根据所述多个关联报单组之间的明细项目的相似程度,获得至少一个关联报单组合集,将所述关联报单组合集分发至所述报单分离子系统;51.针对所有的关联报单组合集,所述报单分离子系统识别出每个关联报单组合集的处理级别,并基于所述处理级别,将每个关联报单组合集发送至所述预警子系统的多个分级预警子系统。52.所述预警子系统汇总所述多个分级预警子系统的分级预警结果,得出所述待审阅报单的快速审单结果。53.在图2中,所述处理级别包括自动处理级、辅助处理级以及人工处理级。54.自动处理级意味着可以完全自动化处理与识别,辅助处理级则意味着半自动处理后还是需要人工抽查,而人工处理级则意味着当前处理结果不能满足需要,需要人工复核。55.接下来参见图3,所述报单关联子系统包括关联存储模块;56.所述报单管理子系统针对每一个著录项目,生成著录项目识别号,并在所述关联存储模块中建立对应于所述著录项目识别号的关联存储堆栈;57.将每个关联报单组存贮至对应的关联存储堆栈。58.本实施例采用堆栈这一特殊结构,是针对现场报关单的数量和产生形式,结合堆栈自身的特点来确定的,不同于采用常规的数据存储结构或者其他数据结构(例如队列存储)。59.堆栈(stack)是一种数据结构。堆栈都是一种数据项按序排列的数据结构,只能在一端(称为栈顶(top))对数据项进行插入和删除。60.具体来说,堆栈是一个特定的存储区或寄存器,它的一端是固定的,另一端是浮动的。堆这个存储区存入的数据,是一种特殊的数据结构。所有的数据存入或取出,只能在浮动的一端(称栈顶)进行,严格按照“先进后出”的原则存取,位于其中间的元素,必须在其栈上部(后进栈者)诸元素逐个移出后才能取出。在内存储器(随机存储器)中开辟一个区域作为堆栈,叫软件堆栈;用寄存器构成的堆栈,叫硬件堆栈。61.堆栈先进后出的处理原则,使得本发明使用堆栈存储数据之后,可以确定存储至同一个堆栈的数据来自于同一个关联组,并且最后一个进入堆栈的数据和最先一个进入堆栈的数据的著录项目必然相同,在存储上不会产生歧义。62.这是因为,本实施例进一步实现包括:63.所述关联存储堆栈具有第一预定大小;64.当所述关联存储堆栈满栈时,才将所有满栈的关联存储堆栈存储的关联报单组发送至所述报单中转子系统。65.接下来参见图4。66.所述报单分离子系统识别出每个关联报单组合集的处理级别,并基于所述处理级别,将每个关联报单组合集发送至所述预警子系统的多个分级预警子系统;67.所述预警子系统汇总所述多个分级预警子系统的分级预警结果,得出所述待审阅报单的快速审单结果。68.所述多个分级预警子系统与所述处理级别,包括自动预警子系统、辅助预警子系统以及人工预警子系统,分别接受识别为自动处理级、辅助处理级以及人工处理级的待审阅报单集合。69.在本发明的实施例中,所述知识图谱数据库包括多个知识谱节点以及由所述知识谱节点构成的知识谱路径;每个所述知识谱节点对应至少一个明细项目;70.将每个关联报单组合集包含的明细项目与所述知识图谱数据库的所述知识谱节点进行匹配,得到匹配的知识谱节点数目与知识谱路径重合程度;71.基于所述匹配的知识节点数目与知识谱路径重合程度,确定所述处理级别。72.优选的,基于所述匹配的知识节点数目与知识谱路径重合程度是否大于预定阈值,来确定所述处理级别。73.例如,假若匹配的知识节点数目大于第一数量,且知识谱路径重合程度大于第二阈值,则确定为自动处理级;74.假若匹配的知识节点数目大于第一数量,但知识谱路径重合程度小于第二阈值;或者匹配的知识节点数目小于第一数量,且知识谱路径重合程度大于第二阈值,则确定为辅助处理级;75.假若匹配的知识节点数目小于第一数量,且知识谱路径重合程度小于第二阈值,则确定为人工处理级。76.作为优选,若确定为人工处理级,则在人工预警子系统得出所述待审阅报单的快速审单结果之后,将待审阅报单的明细项目作为新增知识谱节点更新至所述知识图谱数据库中,并创建对应的知识谱路径。77.作为优选,每个分级预警子系统对应不同精度级别的预警模型,其中,自动预警子系统的预警模型的精度级别最高,人工预警子系统的预警模型的精度级别最低。78.需要指出的是,人工预警子系统并不是整个过程全部采用人工,而是让人工选择对应的预警模型,一步步的执行训练识别,并在每一个步骤中根据前一个步骤的结果调节下一个步骤使用的模型,无需过高的预警模型精度。79.基于图1‑图4的系统架构和原理,图5可实现为一种智能化快速审单与基于知识图谱的智能预警方法,所述方法对接收的报单ai执行快速审阅与智能预警,其中i=1,2,…,为报单的递增序号。80.需要指出的是,本领域技术人员可以理解,待审阅报单的到来是一个源源不断的过程,因此,本实施例采用报单ai,i=1,2,…的方式表述,即i没有定义上限,其含义是清楚的,意味着接收的报单ai是源源不断的到来,本发明的处理过程是一个持续的不间断过程,i不需要设定上限,但是其含义清楚。81.该方法通过计算机程序指令可自动化执行,图5示出了这种自动化执行的流程化示意图,包括步骤s701‑s707,并以i=0开头,即第一张待审阅报单为a0;当然,其他的实施例也可以以i=1开头,即第一张待审阅报单为a1;由于前述已经指出i事实上无上限,因此,i=0和i=1都可以实现。82.图5以i=0为例说明,各个步骤实现如下:83.令i=0;84.s701:获取待审阅报单ai的著录项目bai;85.s702:判断是否存在对应所述著录项目的关联存储堆栈stacka;86.如果存在,则将待审阅报单ai存贮至所述关联存储堆栈stacka;87.如果不存在,则基于所述著录项目bai新建对应的关联存储堆栈stackai后,将待审阅报单ai存贮至所述关联存储堆栈stackai;88.s703:判断所述关联存储堆栈是否满栈,如果是,则进入下一步;89.否则,令i=i+1,返回步骤s701;90.s704:计算所有满栈的关联存储堆栈存储的关联报单组之间的相似度,将相似度大于预定阈值的关联报单组组成一个关联报单组合集;91.s705:识别出每个关联报单组合集的处理级别;92.s706:基于所述处理级别,调用相应的预警模型对每个关联报单组合集执行分级预警;93.s707:汇总分级预警结果,得出快速审单结果。94.更具体的,所述步骤s705包括:95.将每个关联报单组合集包含的明细项目与知识图谱数据库的知识谱节点进行匹配,得到匹配的知识节点数目与知识谱路径重合程度;96.基于所述匹配的知识节点数目与知识谱路径重合程度,确定所述处理级别。97.所述处理级别包括自动处理级、辅助处理级以及人工处理级。98.优选的,可通过if‑else的指令实现如下过程以确定处理结果,伪代码可以实现为:99.if{匹配的知识节点数目大于第一数量}&&{知识谱路径重合程度大于第二阈值},100.确定为自动处理级;101.else102.if{匹配的知识节点数目大于第一数量}&&{知识谱路径重合程度小于第二阈值};103.||104.if{匹配的知识节点数目小于第一数量}&&{知识谱路径重合程度大于第二阈值},105.确定为辅助处理级;106.else107.确定为人工处理级。108.图5所述方法的全部或者部分步骤可以通过包含处理器和存储器的终端设备,尤其是图像处理终端设备,包括移动终端、桌面终端、服务器以及服务器集群等,通过程序指令自动化的执行。109.因此,参见图6,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序指令;通过包含处理器和存储器的图像终端处理设备,执行所述程序指令,用于实现所述方法的全部或者部分步骤。所述处理器和存储器通过总线连接,构成终端设备的内部通信。110.本发明未具体展开的手段,可以参照现有技术。111.举例来说,本发明的实施例提及报单分离子系统识别出每个关联报单组合集的处理级别/所述预警子系统的多个分级预警子系统,这些操作可以基于现有技术已有的识别模型和解析模型,包括神经网络模型、深度学习模型、支持向量机、遗传算法等,本发明的实施例对此不作具体展开,因为这也不是本发明的重点改进部分,本领域技术人员可参照前述背景技术,以及如下针对海关报关单识别的现有技术以及其引用文献:112.[1]李大勇.国家海关商品条码信息管理系统设计与实现[d].大连理工大学,2018.[0113][2]邓璨.基于业务流程再造理论的隶属海关功能化改造研究[d].广西大学,2017.[0114][3]王宏星.智能财务报账机器人正在科大讯飞落地实践[n].中国会计报,2021‑04‑30(013).[0115][4]吴佩龙.成都海关检验检疫审单放行的风险管理案例分析[d].电子科技大学,2019.[0116]本发明的技术方案,通过将属于同一著录项目的多个报单归集到同一个关联组,并基于多个关联组织间的相似性进行集中处理识别出其处理级别后,分发至不同的预警子系统进行分级预警,从而实现了不同级别的针对性处理,并且整个处理不再是针对单份的报单文件,而是集中处理,使得报单审阅和识别更加快速的同时,确保了处理的及时性和准确性。[0117]尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇