基于人工智能的图像处理技术：利用Opencv实现人工智能技术方案

发表时间：2023-07-03 16:43:59

基于人工智能的图像处理技术：利用Opencv实现

基于人工智能的图像处理技术

本文档基于电子科技大学软件工程学院的的一门图像处理技术课程要求所撰写，希望后来的学习学妹！！！！不要照抄！！！！！

人工智能概述

人工智能，作为计算机科学的一个重要分支，它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。作为一个面向未来的新技术，值得我们好好探索。

1.1人工智能的发展与现状

人工智能的发展历经了三起三落，才走向今天勃勃生气的繁盛景致。

“人工智能”（ARTIFICIALINTELLIGENCE）一词最初是在1956年DARTMOUTH学会上提出的。其核心是希望计算机可以帮助人来获取一些认知、感知和决策的难题的解决方案。这样的课题成为了全球技术圈的热点，并相继取得了一些研究成果，如机器定理证明、跳棋程序等，人工智能的序幕就此拉开。人工智能发展初期的突破性极大促进人们对人工智能的期望值，一些科学家开始尝试一些不符合实际的目标方案，陷入接二连三的失败，使得人们对人工智能的期望值大大下降。20世纪70年代开发的专家系统模拟人类专家的知识和经验解决特定领域的问题，标志人工智能实现从理论研究走向实际应用并且能够使用专业知识技术解决专门问题的突破。[1]伴随着人工智能的应用规模扩张与高速增长，专家系统也存在诸多待解决的问题，使得人工智能发展再度受限。20世纪90年代中期，乘着互联网发展的东风，加持云存储、大数据、物联网的赋能，以深度神经网络为代表的人工智能技术发展迅速，人工智能打破了技术牢笼，实现了新的跨越与爆发式增长。其发展历程可以概括为下图。

如今，人工智能遍地开花，我们可以把现状概括为——“专用人工智能取得重要突破、通用人工智能尚处于起步阶段”[2]。我们可以看到，对于专业领域上的人工智能，如“阿尔法Go“在下围棋上表现得极为出色。这类人工智能目标更清晰明确，干扰性小，边界明晰，发展也自然更迅速；而对于通用领域来讲，其还达不到完全能领会人们的指令并作出正确判断的地步，泛化领域的人工智能由于其涉足范围广，发展并不超前。

也可以看到，人工智能创新创业走向快车道——对于一些创新创造的人工智能产品，他们正在赋能升级传统行业。搭载了人工智能的融合创新产品显得更加高端智能，逐渐受到消费者喜爱与偏好。

总之，人工智能的社会影响日益显著。其在智能交通、智能家居、智能医疗等智能领域的优势凸显，发展人工智能必对人民、社会、国家产生积极正向的作用。在《工人日报》的一篇社评就写到——人工智能作为新一代产业变革的核心驱动力之一，以AI为典型代表的、基于大模型应用的技术创新和产业成果在我国全面开花，正成为人工智能发展的新趋势。[2]

但是，人工智能目前仍然存在诸多困境。首先，社会上对人工智能存在一些“炒作”，夸大其词的宣传不免让人们对人工智能的真实发展水平产生错误认识认知；同时，隐私保护、知识产权、科技伦理等诸多衍生的现实问题也需要我们一同探讨才能达成共识，找到适合的解决方案。

1.2人工智能的应用

人工智能在各大行业的应用广阔。随着“互联网+万物“概念的引进和提出，人工智能正在逐步渗入我们的各行各业中。

下面将用简单的几个例子说明。

智能家居与物联网

智能家居搭载人工智能，配合智能音箱等设备，可以让用户以自然语言对话的交互方式，实现影视娱乐、生活服务、对话交流、信息拆线呢等操作，并且可以通过链接已经适配的互联网家居产品语音控制家具，同时支持自定义场景达到条件自动触发，达到万物互联的目的。国内的天猫精灵、小米智能家居已经实现这类技术的广泛应用。华为正在尝试更进一步的真正的万物互联模式。

智能交通

“人工智能＋交通”的模式，对我们的生活也大有裨益。这类系统能够使实现自动对交通需求和流量的分析，通过全局最优解的快速计算，引导交通流量变化，快速输送用户群体到目的地。诸如人工智能控制的“绿波带”，公交车的调度系统，导航app的堵车预测等。

智能金融

人工智能对金融的生态领域影响也很显著。人工智能可以根据用户的消费行为习惯个性化推荐相关金融产品，推广个性化的金融服务；也可以综合消费者的消费征信记录，自动生成判定用户的信用分。人工智能在金融的巨大价值还藏在金融安全上，例如支付宝的金融风控系统就是依照人工智能对用户的异常行为的判断，及时阻止异常的资金举动，保障用户的金融安全。

个性化推荐

人工智能的个性化推荐在目前的互联网产品中运用广泛。例如世界最大的视频提供商YouTube的基于神经网络的推荐系统，可以实时根据用户的点赞、收藏等行为形成用户画像和视频标签，基于以上特性形成个性化的精准推送，满足不同人群的差异化视频需求。

人工智能的应用在智能医疗、智能教育、智能工业上也有诸多例子。可见，人工智能正在各大行业发光发热，其巨大价值正在逐步发掘。

1.3人工智能技术与分类1.3.1人工智能技术

随着人工智能的发展，人工智能技术也在不断创新突破。目前人工智能的前沿和基础技术主要有以下几类：

机器学习

机器学习是实现智能的基础技术，是使计算机具有智能的根本途径。这项技术可以让计算机通过模拟人的学习方式和动作，从而重新组织已经掌握的知识体系并使得其不断完善

自然语言处理

这项技术可以满足人和计算机用自然语言的有效通信。其可以让人工智能具备一定的理解、反应自然语言的能力，可以让人与人工智能之间实现自然的沟通交流。能够使得人工智能更加普适化、大众化

计算机视觉

计算机视觉解决的是机器“看“的一门科学技术，其利用摄像机和电脑代替人的眼睛进行识别与处理。其技术可运用在识别、捕捉、跟踪、测量、监视、检测等多项功能点上。其需要从图像这一多维数据中获取有效信息并提取处理，形成有效数据。是人脸识别技术的基础技术

人机交互

人机交互是研究机器与使用者间的交互逻辑与关系的学科。用户可以由人机交互的界面进行操作，控制系统施发命令。人机交互使得人与机器之间可以使用某一种特定的交互方式，高效率地完成人和机器之间的信息交互。视频APP的点赞按键，核电站的控制台等都可以视为人机交互的平台。

生物特征识别

生物特征识别可以让计算机识别人体的某个指定特征来完成对个体的身份核实和判读。例如常见的指纹识别、人脸识别就是生物识别技术的体现。多用在刑事侦查、保密、权限管理等功能点上。

除此之外，还有“语音识别“技术、”虚拟现实“技术、”决策管理“技术等，门类多而复杂，笔者在此不过多阐述

1.3.2人工智能分类

目前流行的分类方法将人工智能分三类[3]：

弱人工智能（ANI）

只能代替人处理某个单方面能力的工作，其本质上只是实现了某种人类具备的技能,但没有取得自主学习的认知。

强人工智能（AGI）

可代替一般人完成生活中的大部分工作，包括不同领域的技术它都能掌握。其各方面都能和人类比肩，它可以思考、认识、理解问题并综合分析。具有一定的经验管理和快速学习能力。

超人工智能（ASI）

在近乎大部分领域都比最聪明的人脑都具备更高的智能，可以如通人类进行自主的学习。其各项水平（包括科创、社交、决断）会远远超越人类。其也具备一定的直觉与意识。

虚拟机与Ubuntu系统的安装2.1Linux内核

目前我们常用的操作系统是Windows，而Linux是有别于Windows的一款经典的操作系统内核。不同于Windows的封闭，Linux开源且免费，因而有众多开发者负责运维和维护，其安全性更加高。Linux能运行主要的UNIX工具软件、应用程序和网络协议，兼容性更强。

Linux的内核模块化细分很巧妙，它的模块化运行机制可随时由用户的需求，切换或者增删相应的模块组件，使得Linux系统内核可以被分割得非常小巧，具有高度的自由性。

Linux的核心思想有两点：第一，一切都是文件；第二，每个软件都有确定的用途。

但在桌面版发行之前，一切操作都有终端命令构成，如果不熟知Linux命令，几乎完全无法使用这个系统。

2.2Ubuntu操作系统

Ubuntu是一个以桌面应用为主的构建在Linux内核之上的操作系统，其意思是“人性”“我的存在是因为大家的存在"。

与Windows从根本上不同的是，因为是搭载了Linux内核，Ubuntu操作系统具有与Linux相似的优点——免费，而且开源，其具有巨大的操作空间来修改与编辑。

而与Windows相似的是，其提供了一个可视化桌面，对于普通的、未系统接触Linux命令的人来讲，这极大的降低了学习和试错成本。

正因为其兼具两个系统独有的优势，Ubuntu操作系统广受欢迎。

2.3虚拟机

在本课程中，我们使用了VMware虚拟机来软安装新的操作系统Ubuntu。

使用虚拟机相当于单独开辟了一个操作系统，它与我们本省的操作系统基本上毫无关联，两者大体上讲互不依赖，是两个独立的操作系统。

虚拟机通过软件来模拟计算机软硬件，无需分区就能在同一台计算机上使用多种的操作系统。操作系统相互独立,可以保护多个的操作系统的稳定性和安全性，他们互不侵犯。不同的操作系统之间也能相互操作，实现文件的转移，热点的共享等内容。也可以通过网卡将几个虚拟机利用网卡连接到一个局域网，十分便捷。

2.4安装过程

下面来简单介绍一下虚拟机和Ubuntu操作系统的安装过程。

我们需要首先下载VMware软件（版本号16）。

安装好后，双击即进入VMwareworkstation页面，选择创建一个新的虚拟机。进入安装向导。在新的页面，选择将Ubuntu操作系统的光盘映像文件（.iso文件）导入至VMware中（即图示第二个选项），等待读取。

为虚拟机设置名称，并为其分配其合理的存储空间（默认20G）、安装位置和相关配置（包括处理器数量、内核数量、网络设置等）。

等待其安装成功后会自动回到workstation页面，双击进入虚拟机。

至此，我们的VMware配置基本结束，接下来是Ubuntu的配置。

我们双击进入Ubuntu后，会出下如下图展示的Ubuntu欢迎页面

（Ubuntu欢迎页面）

点击“installUbuntu”然后在左侧选择语言，继续，随后设置虚拟机的账号和密码，等待安装成功即可进入Ubuntu的页面。

但是当前Ubuntu的屏幕过小，我们下载VMware-tool后点击最上方的放大按钮即可调整大小。

Ubuntu的软件更新默认从国外的源更新，更新速度和下载速度较慢。我们需要在“软件更新”中设置为国内源。笔者将其更换为阿里云的源下载。

OpenCV的安装与调试3.1关于OpenCV

OpenCV是一个免费且开源发行的跨平台计算机视觉与机器学习软件库，旨在为计算机视觉应用程序提供通用基础架构。其主要有C语言代码生成编写，在Linux和Windows下可以自如地运行，运行快速，方便调用。OpenCV库拥有超过2500种优化算法，可以高效的完成各项图像识别的任务。在人脸识别、运动跟踪、动作识别、物体辨识等方面由诸多应用场景。

3.2关于编程环境

本课程主要运用到的编程环境为C++与Python，又因为OpenCV主要由C语言编写而成，因此使用OpenCV的主流调用语言为C++/C语言。

C++是一种计算机高级程序设计语言，由核心是C语言的升级与拓展。C++擅长面向对象程序设计，同时也可以基于过程进行程序设计。其可以直面系统底层，也打破了很多C具有的限制；而Python语言是一种利于程序员编写和阅读的高效语言，其具有独特的简洁性、可读性和可拓展性，可以大大减少代码输入量。

3.3关于make

当我们需要运行一个程序时，我们首先需要编译这个程序使得其生成一个可执行文件。对于一些简单的项目，我么直接调用python编译器/g++编译器进行编译即可。但对于车牌识别这类大型工程，我们编写的大型程序往往由多个编译单元构成。因此，构建应用时，发出的编译命令可能会比较长。

为达到此目的，推荐的构建方式是使用make工具。以C++为例，我们需要编写一个CMakeList.txt文档，其包含了我们要编译的所有单元，我们要链接的库函数、头文件以及我们目标生成的运行程序等一系列参数。编译好后在终端中依次发出cmake.和make命令即可完成编译

3.4安装OpenCV

首先我们在终端运行

sudoapt-getinstallbuild-essential

安装编译必须的基础程序。编译程序有了这个软件，它才知道头文件和库函数的位置。安装过程中可能出现一些安装失败，为了保证安装成功，我们执行

sudoapt-getinstallffmpeglibavcodec-devlibavformat-devlibavdevice-devlibsdl-image1.2-dev

下载这些可能未安装的必备软件。

接着安装cmake并升级：

sudoapt-getinstallcmake

sudoapt-getupdate

利用命令cmake–version查看版本，确认版本在3.0以上。

接下来，右键解压OpenCV文件夹到Ubuntu的home处，在OpenCV根目录下创建一个release文件夹，进入release文件夹后打开终端输入：

cmake-DCMAKE_BUILD_TYPE=RELEASE-DCMAKE_INSTALL_PREFIX=/usr/local-DWITH_FFMPEG=ON-DWITH_TBB=ON-DWITH_GTK=ON-DWITH_V4L=ON-DWITH_OPENGL=ON-DWITH_CUBLAS=ON-DWITH_QT=OFF-DCUDA_NVCC_FLAGS="-D_FORCE_INLINES"..

和

make-j7

sudomakeinstall

等待OpenCV的编译，完成即可

3.5测试OpenCV的安装

OpenCV为我们提供了一个样例来检测我们是否正确安装了OpenCV。

我们首先进入进入opencv-3.4.8/samples/cpp/example_cmake文件夹中，可以看到OpenCV已经为我们提供了一个程序opencv_example.cpp并且已经编写好了相关CMakeList.txt文档。

我们首先需要链接摄像头：顶部点击player->可移动设备->xxxcamera->连接。即可链接摄像头（如下图）。若链接失败需要在player->虚拟机设置->USB控制器将USB兼容性调整为3.x。

随后在终端输入cmake.和make命令完成编译，随后输入./opencv_example即可打开摄像头，摄像头右上方带有HelloOpenCV字样。

车牌识别4.1车牌识别应用与技术概要4.1.1技术简述

车牌识别是计算机视频图像识别技术的一种基础应用，其可以实现在运动的视频或静止的图像里面准确识别车牌，通过图像提取、车牌定位、边界处理、字符识别、输出结果等一系列复杂过程实现。常在停车场，道路收费站系统，小区车库，道路电子眼抓拍系统有着广泛的应用。

车牌识别智能车牌识别模块大体共有两个步骤——车牌图像的定位定点，以及字符的识别判读。示意图如下图所示[4]：

4.1.2“PlateLocate”的实现过程

车牌图像的定位定点步骤中其实隐藏着三个子步骤，分别是“PlateLocate”，“SVMtrain”，“Platejudge”。其中最重要的部分是第一步“PlateLocate”过程。

PlateLocate的大体识别思路如下——一个未旋转的车牌包含很多垂直边缘，若能寻找到含有诸多垂直边缘的长方形图形块，我们就可以大概判断其为车牌。

其流程如下图所示

其中，需要用到两个比较重要的计算机视觉技术——高斯模糊和灰度化。

高斯模糊技术可以大大降低图像噪声以及图像的细节层次[4]，其是将图像中指定像素点（例如车牌识别就是将车牌边缘）和周围点加权平均得到的效果，越靠近指定的中心点那么其与核心主体关系更加紧密，我们就可以设置更大的权重值

如下图所示：

。

公式为

此外，由于计算机的功能限制，彩色的图像图块比纯灰度处理的图像更加难以应付，使用灰度处理技术可以提高算法的运行速度。

我们使用Soble算子检测图像中的垂直边缘，以区分车牌。这种基于边缘特征定位的方法核心是获得数字图像的一阶梯度，把图像中每个像素的上下左右四领域的灰度值加权差，边缘处的加权差将会达到极值，从而我们检测到了边缘。[4]我们可以分别计算二维图像和方向的梯度与，利用公式：计算偏离角度，若那么我们可以认为此处为竖直边界。

此后通过二值化（对图像的每个像素做一个阈值处理）以及闭操作（将车牌字母连接成为一个连通域，便于取轮廓）即可取出车牌的轮廓。再进行角度修正、大小统一，即可得到一张标准的车牌图块。

4.1.3“SVMtrain”训练过程

SVM训练类似于人工智能的机器学习，其利用标签这一属性，将明确的车牌图块定义标签，非车牌图块定义另一个标签，机器经过不断的对不同标签的图块的学习，以达到判断图块是否为真正车牌图块的功能（Platejudge）。[5]

其完整训练过程如下：

我们首先将可能含车牌的大量图片传递给机器，并为其打上标签，哪些有车牌而哪些无车牌贴上标签，机器对这些图片的相似点不同点进行分析判断，生成车牌模型。再利用Fscore指标进行评价。对于评价体系，我们需要两个指标——“准确率”（precision）和“查全率”（recall）。设置的相关公式如下：

4.1.4字符识别实现过程

车牌的样式和编码规则相对固定，我们只需要由取轮廓分割法分割出七个单独的字符块（新能源八个）。且第一个字符永远是省份简称的中文，其他为数字或字母，且字母中没有I与O，减少了识别错误。

字符识别的分块首先仍然需要灰度化、二值化操作，前文已叙述。

类似于SVMtrain的过程，字符识别也需要机器训练，这里采用基于模板的训练方法（ANNtrain）：首先，我们向机器输送一定量的字符模板，进行训练。随后在程序实际识别中，机器会根据公式来依次判断七个字符的每个字符与某一模板的相似度（公式中S代表相似值，I待测数据，T为模板），综合相似度大小即可完成字符的判断。

4.2车牌识别工程实现

在本项目中，我们采用EasyPR库来辅助完成，其提供了大量已经训练好的车牌定位与字符识别数据，我们只需要调用其库函数识别即可。

我们只需要解压EasyPR的压缩包到home目录，在其根目录下打开终端依次输入cdEasyPR-master

./build.sh

EasyPR即安装成功。（如图为安装成功的界面）

在EasyPR提供的根目录中，提供了CMakeList.txt文档，其指向测试程序demo。我们可以借助这个文档加以改编形成自己的make文档。

如下图所示：

我们只需要将CMakeList.txt中的test/main.cpp改为自己的程序代码（比如我的是car/test.cpp）路径，工程名修改为自己的工程名。这样cmake就会编译我们的车牌识别程序并链接上EasyPR相关库函数，生成可执行文件。

以下以识别五个车牌的图片的代码为例，进行相关代码展示。

#include#include#include#includeusingnamespacestd;usingnamespaceeasypr;intmain(){ easypr::CPlateRecognizepr; pr.setResultShow(false); pr.setDetectType(easypr::PR_DETECT_CMSER); pr.setLifemode(true); //启用生活模式,以增大识别范围 pr.setResultShow(false); pr.setMaxPlates(5); //最大车牌识别量 vectorplateVec; Matsrc=imread("/home/jjq1/EasyPR-master/car/5cars.jpg"); //图片的地址 intresult=pr.plateRecognize(src,plateVec); if(result==0) { inttotal=plateVec.size(); std::cout

人工智能的港口实践

专家表示，除自动化码头外，目前国内几大港口集团旗下如招商大榭等10余座码头，已在局部作业环节采用了人工智能技术，管理费用普遍下降。但大部分国内码头在生产作业环节中仍采用传统的人工操作、传统OCR识别和远程控制技术。

多重因素造成推广难

从目前我国集装箱码头生产作业的现状来看，随着码头集装箱量的增加，提高集装箱的运输效率成为码头管理的重中之重。在国外，自动化码头因为建设难度大、成本高、收益慢被称为“贵族码头”。在我国内地，自动化码头发展迟缓，业内专家分析主要有以下四个问题：

首先，普及推广难的重要因素是建设成本压力。还是以一个集装箱年吞吐量200万TEU的码头为例，现有的自动化码头的建设投入一般在10亿元人民币以上，尤其是地下需要埋设几万枚磁钉，且土建不能使用常规的钢筋，必须使用由玻璃纤维构成的“塑料钢筋”，导致基建成本较高。由于国内码头目前装卸费收入普遍不高，用户投资的回报周期太长，投资者对此十分谨慎。

其次，受自动化技术改造的局限，现已运营的码头难以“大动干戈”，因为不可能全面停工实施改建。

第三，风险大，自动化技术稳定性和可靠性仍有待完善。码头作业一旦实现自动化，无论是操作系统，还是自动化设备都不允许“试错”，一旦发生故障，很有可能导致整个码头生产瘫痪，这对于一个每日集装箱吞吐量超过万箱的码头而言是不可想象的。

最后，要形成研发、推广和合作产业链尚有一定距离。自动化码头的推进，涉及方方面面，除需打通供应、集成和应用商的产业链条外，还要构建自动化研发和应用平台，以推动核心项目的突破与应用。

人工智能加速传统码头升级

针对国内沿海港口码头迫切希望发展智慧港口，又苦于资金来源不足的现状，业内专家建议，可采用人工智能技术对大量无法承受自动化码头高昂投入的已运营中小码头进行改造升级，提供从闸口到岸桥再到堆场的全局化人工智能港口解决方案，努力做到低成本又智能，尤其是降本增效，并在未来超越现有的自动化码头的生产效率。

国内的一些码头，已开始在生产环节创新性采用新型人工智能技术，应用已涵盖浙江、广西、广东、山东等多地港口及海关。比如，国家级保税区钦州保税区建设了全球首个人工智能海关监管闸口。

岸桥智慧理货方面，招商局旗下大榭招商码头通过采用人工智能技术，大幅度提升了集装箱箱号、装卸等多状态的识别效率，使集装箱在岸桥装卸过程中无需停顿，毫秒间即可完成识别。该码头负责人介绍，人工智能系统上岗后，理货员已从48名减少到24名，今后还会进一步减少。生产效率也有明显提高，在年设计能力240万标箱的基础上，该码头已经实现300万标箱的吞吐量。

从岸桥到闸口再到集装箱堆场，人工智能正在全方位加速传统码头的智慧进程。

在岸桥、场桥等各类集装箱专用吊装设备的“无人化”改造中，一些自动化码头虽在集装箱装卸生产环节采用智能远程控制技术，但从船只上吊取货时，远控司机仍需要在中控室“手动”操作。有公司研发出人工智能无人集装箱锁孔对位系统，仅在吊具上安装了4个摄像头，借助自主研发的类脑人工智能系统，可毫秒级高准确识别出集装箱锁孔的位置。无论是在技术上还是成本控制，都远远优于现有的吊装机械设备远控系统。更重要的是，该系统实现了自主锁孔对位和吊装机械的智能化控制改造，省去了远控操作室的人员操控岸桥、场桥等吊装机械设备步骤。

在码头集装箱水平运输上，去年广东珠海港集团与上海西井科技合作发布了全球首辆港口作业无人集装箱卡车。

同时，振华重工与上海西井科技联合研发出了全球首辆自主驾驶无人跨运车，无需事先埋设磁钉，依靠人工智能技术，实现自主探测集装箱，并对目标集装箱进行厘米级精度的自主抓箱、跨箱和放箱，根据码头实际路况，自主规划出集装箱水平运输的最优驾驶线路。通常，一台岸边集装箱起重机需要配置5台集装箱卡车或者AGV，而使用无人跨运车，只需要配置3台。设备的单机效率高，提高了经济效益。

有专业人士测算，如采用无人驾驶技术参与港区集装箱水平运输作业，码头至少可节约一半人力，仅用工成本每年就能节约至少3000万元，并且机器只要维护得当，可以24小时作业，缓解码头司机“用工荒”。

智能化改造还需顶层设计

推行人工智能港口建设，传统港口企业的相关人员对人工智能的认知亟待加强，例如在项目招标时，要改变惯性“低价竞标”思维，转为根据项目实际效果和实际功能进行全面比对。

又如，在项目审批时，要整合港口管理权限，改变港口存在的多头管理现象。国内某港口几年前就有意引入人工智能技术，但前期经多个主管部门层层论证审批，历经几年仍没有实质性进展。

港口在新建码头时会提前进行统筹规划，而改建已运营的码头则面临截然不同的情况。目前来说，在各港口进行较多的智能化改造项目，如港口闸口的智能化改造、岸桥理货系统智能化，目前都是基层码头推动、科技公司牵头，再走集团审批流程，缺乏集团全局性的顶层设计，容易造成重复建设，浪费资源和资金。

不过，已有一些港口集团意识到这个问题，正在积极探索从集团层面推进智能化改造。例如，厦门港集装箱码头集团近期与西井科技合作，尝试将原有岸边理货系统扩充至更多功能的岸边人工智能识别新系统，所含人工智能功能涉及码头方和理货公司需要的功能整合，由集团出面统筹规划协调，码头和理货公司将分别获取所需的生产信息数据。

业内人士建议，鼓励中国港口、港机生产商与中国科创企业联合申报应用创新，甚至是联合申报国家和省部级科技奖项等形式，申请专利，设立人工智能港口应用中国标准，鼓励中国企业研发核心技术，实现创新突破。

在资金投入上，可将智慧港口建设纳入交通运输部节能减排项目范围，与建设“绿色港口”相结合。根据项目取得的实际成效，在项目评审、机构评估、成果转化收益等税收优惠政策上，给予相应的奖励和资金补贴，为企业的“自主创新滚动研发”增添动力。

鼓励科创企业参与

在人工智能技术部分落地的港口中，存在着因为港口的业务分工和管理体制问题，导致码头不能完全应用智能系统的问题。

比如，科创企业在岸桥的视觉人工智能系统功能已经涵盖了理货公司生产数据需求和码头前沿无人值守需求，但在现有管理体制下，由于投资方的不同，在运行中往往只能发挥部分作用。甚至出现为了满足不同需求，重复建设多套系统，造成资源浪费。

因此，业内人士建议，政府主管部门制定我国智慧港口建设的总体发展规划，并提出分阶段、分步骤、分地区的可操作细则，使科创企业参与港口人工智能技术的发展有据可依。

政府可适时将港口的创新支持政策调整为“前补贴”，把政府资源精准高效配置到最需要的地方，降低港口企业的科技创新成本，提高他们引入自主原创的人工智能高新技术的积极性。同时，国家扶持重点科创企业掌握人工智能核心技术，保护重点科创企业的知识产权，维护国家利益。

政府层面还可促进国内若干大型港口成立联盟，打造区域自动化码头创新平台，每个港口投入一定比例资金，共同寻找集成商和供应商。联盟可在长三角、珠三角、环渤海湾等港口群先行试点项目，一旦项目和产品取得突破，再在其他港口逐步推广。

另外，我国港口的当务之急是鼓励中国本土科创企业带头制定人工智能港口行业的技术标准，逐步形成在港区推广和应用的无人驾驶车辆标准体系、安全标准、评估规范、测试标准和数据安全监管。返回搜狐，查看更多

人工智能专利申请的专利保护客体判断

文/北京集佳知识产权代理有限公司王宝筠

摘要：人工智能领域的专利申请是否符合专利保护客体的规定，进而能否获得专利权，是人们十分关心的问题。为了进一步明确相关的审查标准，国家知识产权局于2019年12月31日发布了关于修改《专利审查指南》（后文简称“2019年修改的《审查指南》”）的公告，对于包含算法或商业规则和方法等智力活动的规则和方法特征的专利申请，如何判断其是否符合专利保护客体、如何进行创造性的判断，进行了具体的说明。在2020年11月10日发布的《专利审查指南修改草案（第二批征求意见稿）》（后文简称“2020年《征求意见稿》”）中，同样涉及上述内容。本文重点针对这两次修改中的相关内容，对涉及人工智能方案的专利保护客体判断问题进行分析。

关键词：人工智能、保护客体、创造性、算法、技术特征

人工智能技术当前正得到迅速的发展。对于“人工智能”的定义，众说纷纭。我国制定的《人工智能标准化白皮书2018》认为，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

由于人工智能技术能够大幅促进技术创新、带来可观的经济利益，因此，人工智能领域的专利申请当前呈现大幅增加的趋势，此类专利申请是否属于专利保护客体由此成为业内十分关注的问题。在我国，有关是否属于专利保护客体的判断，是依据《中华人民共和国专利法(2020年修正)》（后文简称“《专利法》”）第二十五条以及第二条二款来进行的。

1基于《专利法》第二十五条的判断

涉及人工智能的专利申请是否属于专利保护客体，首先要判断其是否属于《专利法》第二十五条中所规定的“智力活动的规则和方法”，如果属于，则该专利申请不属于专利保护客体。

1.1何谓“智力活动的规则和方法”

《专利审查指南2010》（后文简称为《审查指南》）第二部分第一章第4.2节中就智力活动的规则和方法进行了说明，其指出：

智力活动，是指人的思维运动，它源于人的思维，经过推理、分析和判断产生出抽象的结果，或者必须经过人的思维运动作为媒介，间接地作用于自然产生结果。智力活动的规则和方法是指导人们进行思维、表述、判断和记忆的规则和方法【1】。

从上述定义可见，智力活动的根本属性在于主观性或抽象性，由此，用于对其进行指导的“智力活动的规则和方法”，则也具备主观性或抽象性的特点。由于专利只能用来保护针对客观世界的改造成果，不能用来禁锢人的思想，因此，具有主观性的智力活动规则和方法显然不能获得专利保护；而如果针对抽象性内容提供专利保护，则会给予专利申请人过大的专利权利【2】，阻碍技术的创新，由此也不应对具有抽象性特点的智力活动规则和方法提供专利保护。

1.2《专利法》第二十五条的判断方式

《审查指南》中指出：如果一项权利要求仅仅涉及智力活动的规则和方法，则不应当被授予专利权。如果一项权利要求在对其进行限定的全部内容中既包含智力活动的规则和方法的内容，又包含技术特征，则该权利要求就整体而言并不是一种智力活动的规则和方法，不应当依据《专利法》第二十五条排除其获得专利权的可能性。

上述判断方式中，需要引起我们注意的是“仅仅涉及”以及“又包含”这样的表述。这两处表述体现出《专利法》第二十五条所进行的是方案中是否“不存在”技术特征的判断，而不是一个是否“存在”智力活动的规则和方法的判断。对应于人工智能类的专利申请，如果在该专利申请的权利要求中仅仅包含算法的内容，不具备任何的技术内容，那么，这样的权利要求会被确定为不属于专利保护客体。

我们或者可以将这种方案限定的内容中只有例如算法这样的非技术特征而不具有任何技术特征的权利要求，称为“非混合”型权利要求。所谓的“非混合”，是指其并没有混合有任何技术的内容。

1.3判断示例

对于非混合型权利要求，《审查指南》给出了相关的判断示例。在涉及计算机程序的发明专利申请的审查示例中，其中的【例1】为“利用计算机程序求解圆周率的方法”，【例3】为“一种全球语言文字通用转换方法”。这两个案例的权利要求中，均是仅仅在主题名称中限定包括了计算机，而限定的内容则全部为智力活动的规则和方法，由此，这两个案例均被判定为属于智力活动的规则和方法，不属于专利保护客体。

2基于《专利法》第二条二款所进行的保护客体判断

2.1二条二款的判断目标

《专利法》第二十五条的判断只是对方案中是否不具备技术性的要素的定性判断，但即使具备技术性的要素，也不意味着这一方案就属于专利保护客体，还需要判断其是否属于《专利法》第二条二款所规定的“新的技术方案”。

《专利法》第二条二款规定：发明，是指对产品、方法或者其改进所提出的新的技术方案。

采用二条二款进行专利保护客体的判断，我们首要面临的问题是，判断目标是谁。

回答这一问题，可以从为何要保护专利权出发来进行。

为什么要保护专利权？有很多学说从不同的角度回答它。洛克劳动学说将“劳动”奉为圭臬，将劳动成果视为最自然不过的财产。黑格尔人格学说则将财产和人格联系起来，当“意志”表达为发明创造时，发明就成了“人格”的一部分。以休谟和边沁为代表的功利主义学说则认为促进社会功利是保护发明的唯一理由【3】。

不论是上述哪种学说，我们都可以发现，其所保护的目标均是某种“贡献”。这种“贡献”在洛克劳动学说中体现为人的“劳动”，在黑格尔人格学说中则是以意志表达的“发明创造”，在功利主义学说中则是以社会功利来作为“贡献”。由此可见，“贡献”是专利所保护的核心内容。我们所进行的专利保护客体的判断，实质上就是一个是否应该提供专利权的判断，从提供专利权的目的是为了对于发明人的“贡献”提供保护出发，我们进行专利保护客体判断时的判断目标自然也应该是发明人的“贡献”所在。

如果说上述学说还过于抽象、久远的话，那么，以“贡献”作为专利保护客体的判断目标，也可以从我国《专利法》的立法本意中找到依据。

我国《专利法》第一条中指出：为了保护专利权人的合法权益，鼓励发明创造，推动发明创造的应用，提高创新能力，促进科学技术进步和经济社会发展，制定本法。其中，不论是《专利法》所鼓励的“发明创造”，还是其所要提高的“创新”能力，都是基于发明人在技术上的“贡献”所产生的。在《专利法》这一立法本意的指引下，结合其所“鼓励”、“提高”的目标，我们可以得知，在考虑相关方案是否属于《专利法》的专利保护客体时，其判断目标应关注于方案中的“贡献”所在。

由此，我们在采用《专利法》二条二款进行是否属于专利保护客体的判断时，不应只关注于方案中是否存在技术特征，而是应该将判断目标明确为方案中的“贡献”所在，也就是所谓的“解决方案”，判断该“解决方案”是否是采用技术手段来实现的。

2.2二条二款的具体判断内容

明确二条二款的判断目标有何用处呢？这还要从2020年的《征求意见稿》中所给出的具体判断方式说起。

对于采用二条二款所进行的专利保护客体的判断，2020年的《征求意见稿》保留了以技术问题、技术手段、技术效果来判定是否属于技术方案的判断方式，但强化了技术手段在判断中的中心地位，给出了当解决方案采用了技术手段时，必然能够解决技术问题并获得技术效果的判断思路；同时，《征求意见稿》还明确了计算机实施即为技术手段，并给出了“计算机实施的技术手段”的两种具体情形。相关的修改内容为：

当涉及计算机程序的发明专利申请的解决方案利用了计算机实施的技术手段，其必然能够解决技术问题并获得技术效果。所述计算机实施的技术手段是指如下情形：

情形一，解决方案记载了计算机、网络设备、可编程设备等信息处理设备以及通过上述信息处理设备执行计算机程序实现控制和处理的内容。

情形二，解决方案未包含计算机、网络设备、可编程设备等信息处理设备，但记载了通过执行计算机程序体现计算机控制和处理的内容。例如，解决方案记载了通过执行一种工业过程、测量或测试过程控制程序，对该工业过程、测量或测试过程各阶段实施一系列控制的内容。又如，解决方案记载了通过执行一种技术数据处理程序，对该技术数据实施一系列技术处理的内容。再如，解决方案记载了通过执行一种系统内部性能改进程序，对计算机系统各组成部分实施一系列设置或调整的内容。

结合《征求意见稿》的上述修改，是不是只要在权利要求中具备计算机实施的手段，该权利要求就能够符合《专利法》第二条二款的规定呢？进一步的，如果人工智能方案的创新仅在于提出了一个新的算法，当我们在权利要求中限定该算法采用计算机来实现，这样的方案是不是就能够通过二条二款的审查，进而通过新颖性、创造性的审查，从而获得授权呢？这是否意味着专利保护客体的范围被大幅放开了呢？

答案并非如此。回答这一问题，恰恰要用到我们之前所分析的二条二款的判断目标。

2.3《征求意见稿》的修改并没有大幅对专利保护客体予以放宽

（1）《征求意见稿》中的“计算机实施的技术手段”是“解决方案”中的手段

正如我们之前所分析的那样，二条二款的判断目标是方案中的“贡献”所在，也就是所谓的“解决方案”。由此，并不能仅仅基于整体方案中存在技术特征就认为该方案符合二条二款的要求，而是应该通过判断“解决方案”中是否存在技术特征，来判断该方案是否符合二条二款的要求。

具体而言，在《征求意见稿》中提及的“计算机实施的技术手段”，被限定为是“解决方案”中的手段，并非仅仅是“方案”或者“权利要求”中的手段。《征求意见稿》的原文表述为：当涉及计算机程序的发明专利申请的解决方案利用了计算机实施的技术手段。由此，按照《征求意见稿》的规定，并不是权利要求中具备满足“情形一”或者“情形二”的计算机实施的技术手段就可以了。在分析手段是否为计算机实施的技术手段之前，先要明确该手段是否是用以解决申请文件中所声称要解决的问题的手段，只有具备此种逻辑关系，该手段才是“解决方案”所利用的手段，进而在该手段符合“情形一”或“情形二”时，其才是计算机实施的技术手段，才能由此确定方案解决了技术问题、带来了技术效果，符合《专利法》二条二款的规定。上述判断思路在《征求意见稿》所提供的示例中有明确的体现。

（2）判断示例及启示

例如，在【例3】中，强调了“该方法记载了通过执行计算机程序对橡胶硫化时间进行精确、实时控制的内容，利用了计算机实施的技术手段”，在【例4】中，强调了“该方法记载了移动计算设备和远端服务器以及通过这些设备实现对存储容量扩充的控制和处理的内容，利用了计算机实施的技术手段”。在上述分析中，被确定作为“计算机实施的技术手段”均对应于用来解决方案中所提出的问题，从而满足了“解决方案利用了计算机实施的技术手段”这一要求，最终，这些案例的判断结论均是符合专利法二条二款的规定。类似的判断思路在《征求意见稿》的【例5】和【例6】中也有体现。

在《征求意见稿》的【例7】中，给出了不符合专利法二条二款的一个判断示例。该案例的权利要求为：

一种土地监管抽样方法，其特征在于，所述方法包括：

获取闲置土地的土地特征，所述土地特征包括土地的面积、单价和购买者特征，所述购买者特征包括购买者购买的土地数量、购买者购买的土地中闲置的土地数量；

获取未闲置土地的土地特征；

获取待抽样土地的土地特征；

根据所述闲置土地的土地特征、未闲置土地的土地特征、待抽样土地的土地特征，通过智能应用程序实现土地闲置概率的计算。

对于该权利要求，《征求意见稿》中指出，该解决方案是通过设置待抽样土地闲置可能性的计算要素从而提供一种土地监管抽样方法。该解决方案未记载任何计算机等信息处理设备以及通过上述信息处理设备执行计算机程序实现控制和处理的内容。虽然该方案记载了通过智能应用程序实现土地闲置概率的计算，但是仅记载通过智能应用程序实现土地闲置概率的计算不能体现出计算机对抽样过程的控制和处理。该方案所采用的手段是根据人为设定的指标来计算待抽样土地闲置概率，不构成技术手段，所要解决的问题是随机抽样导致不利于监管的问题，不构成技术问题，获得的效果仅仅是提高土地抽样的针对性，以便对土地进行有效监管，不是技术效果。因此，该发明专利申请的解决方案未采用技术手段解决技术问题，以获得符合自然规律的技术效果，不属于《专利法》第二条第二款规定的技术方案，不属于专利保护的客体。

从上述分析可以看出，尽管该案例的权利要求中具备“通过智能应用程序实现土地闲置概率的计算”这一内容，但由于该内容“不能体现出计算机对抽样过程的控制和处理”，由此并不属于“解决方案”的一部分。实际上，在上述分析的一开始，所提及的“解决方案”中只是包含“设置计算要素”的内容而并不包括上述“计算”的内容。在上述“计算”并非解决方案中所包含的内容的情况下，即使其采用计算机来实现，也并不满足《征求意见稿》中“解决方案利用了计算机实施的技术手段”这一要求，由此，该案例的最终结论为不符合专利法二条二款的规定。

由此可见，不能认为只要在权利要求中具备计算机实施的手段，该权利要求所要保护的方案就能符合《专利法》二条二款的规定。如果计算机实施的手段和申请文件中声称要解决的问题无关，那么，该手段并非是“解决方案”的一部分，其并不能被判定为属于“计算机实施的技术手段”，由此也就不能进而得出符合《专利法》二条二款规定的结论了。

相比于之前我们提及的没有包含有任何技术的内容的“非混合”型权利要求，如上所分析的在权利要求中包括了例如计算机实施这样的技术手段，但该手段却并非对应于用以解决申请文件中所声称要解决的问题，这样的权利要求我们可以称之为“半混合”型权利要求。

（3）引申讨论

“半混合”型权利要求由于没有将技术要素体现于“解决方案”中，因此仍然不满足二条二款的规定。引申出去，如果我们将技术要素混合彻底，例如将计算机实施这一技术要素体现在“解决方案”的手段中，这样的权利要求所保护的方案是否能够符合二条二款的规定，进而获得专利权呢？

例如，我们将如上讨论的【例7】简单修改为如下权利要求：

一种土地监管抽样方法，其特征在于，所述方法包括：

利用计算机从土地信息中获取闲置土地的土地特征，所述土地特征包括土地的面积、单价和购买者特征，所述购买者特征包括购买者购买的土地数量、购买者购买的土地中闲置的土地数量；

利用计算机从土地信息中获取未闲置土地的土地特征；

利用计算机从土地信息中获取待抽样土地的土地特征；

根据所述闲置土地的土地特征、未闲置土地的土地特征、待抽样土地的土地特征，通过智能应用程序实现土地闲置概率的计算。

这样修改后的权利要求，作为解决方案的内容，获取闲置土地、未闲置土地、待抽样土地的土地特征过程中，均采用计算机来实施，由此应该满足解决方案中采用了计算机实施的技术手段这一要求，进而能够必然得出该方案解决了技术问题、带来了技术效果，从而满足《专利法》二条二款的要求。对于这样的在“解决方案”中“混合”进技术要素的权利要求，我们可以称之为“纯混合”型权利要求。按照《征求意见稿》中的规定，这样的“纯混合”型权利要求是能够通过二条二款的审查的。

那么，如果只是进行上述简单修改，就能使得该权利要求通过二条二款的审查，二条二款是否实质上被架空了呢？这样的权利要求如果最终获得授权，是否明显不合理呢？

首先回答第二个问题，这样的权利要求尽管能够通过保护客体方面的审查，但其很有可能在创造性审查过程中被指出并没有提供技术上的贡献，从而被认为相对于现有技术不具有创造性。这实际上是以创造性评判的手段来解决保护客体判断方面的问题，最终的不授权结论是一致的，只不过适用法条有所不同而已。这样的审查思路在美国、欧洲都有明确的体现。

我们再回到第一个问题。一定程度上来说，通过对权利要求进行技术上的“包装”，是会使得其较为容易的通过二条二款的审查，但正如我们之前所分析的那样，这样的“包装”后的权利要求，仍然会在创造性审查中就是否存在技术性贡献而被质疑乃至驳回。由此，即使基于《征求意见稿》的修改，使得二条二款的审查力度变弱，也会由于后续创造性审查的存在，导致本不具有技术性贡献的方案仍然不会获得授权。实际上，《征求意见稿》对二条二款判断方式的修改，准确来说也并非是使二条二款的审查力度变弱了，而是使得该判断更为准确、易行了。

（4）《征求意见稿》的修改使得二条二款的判断更为准确、易行

《征求意见稿》对于二条二款判断方式的核心修改为两处：一处是提出了“解决方案利用了计算机实施的技术手段，其必然能够解决技术问题并获得技术效果”，这实际上是体现了技术手段的二条二款判断中的中心地位。在当前的审查实践中，一些情况下会基于问题并非技术问题，就得出手段并非技术手段、效果并非技术效果。这样以问题为核心的判断方式，导致对方案所采用的手段这一实质内容缺少分析，再加上“技术”本身就属于抽象的概念，难以准确界定，因此经常会由于这样错误的审查方式导致一些原本有技术性贡献的方案无法通过专利保护客体的审查。《征求意见稿》中强化“手段”在二条二款中判断的中心地位，正是在准确使用二条二款进行判断方面所进行的明确规定。

《征求意见稿》对于二条二款判断方式的另一处修改在于给出了“计算机实施的技术手段”的两个“情形”。通过这两个具体化的“情形”，对于“技术手段”这一抽象概念给出了具体、可行的判断标准，从而降低了“技术手段”的判断难度。进一步的，结合利用技术手段必然能够解决技术问题、获得技术效果的逻辑，使得二条二款整体上的判断都能在一个清晰、可行的判断标准下来进行，以避免由于二条二款判断标准的抽象导致错误判断结论出现的问题。

由此可见，《征求意见稿》对于二条二款判断方式的修改，性质上来说是一个使得判断更为准确、可行的修改，并不是一个旨在扩大保护客体范畴的修改。当然，如果能够在最终的修改中强调出，二条二款的判断目标是“解决方案”，进而强调出所谓“计算机实施的技术手段”并不是方案中泛指的技术手段，而是一个用以解决相关技术问题、存在于“解决方案”中的技术手段，则能够配合后续的例子，对于二条二款的判断思路进行更为明确的说明，从而避免人们产生二条二款由于此次修改而被架空的错误认识。

同时应该认识到的是，对于人工智能这样涉及专利保护客体问题的专利申请，一部分方案的保护客体判断实际上被后置于创造性判断中，通过创造性判断中与现有技术的对比，来确定权利要求所保护的方案是否的确具备技术上的贡献，进而确定是否可以获得专利权。

3通过创造性判断实现对于专利保护客体的兜底判断

3.1判断思路

对于如何通过创造性的判断实现对专利保护客体的兜底判断，在2019年修改的《审查指南》中给出了具体的说明，其指出：如果算法特征或商业规则和方法特征与技术特征之间“功能上彼此相互支持、存在相互作用关系”，则应该将该特征与所述技术特征作为一个整体来加以考虑。反之，则应将这两个特征分别作为独立的两个特征来进行评判。

如果是前者的情况，那么，在该“整体”特征没有被现有技术公开的情况下，该方案是具备创造性的，具有获得专利权的可能，而如果是后者的情况，例如算法的特征被单独划分为一个独立的特征，在其他技术特征被现有技术公开的情况下，即使算法存在改进，也会由于其并没有提供技术上的贡献而在创造性评判过程中被考虑，从而使得该方案不符合创造性的要求，无法获得授权。

针对“后者”情况的判断结论，实际上体现出如果方案的改进仅仅在于算法的创新，那么，即使将其“包装”为采用计算机来实施，也无法获得授权。这实现了将仅为“包装”性质的“纯混合”型权利要求排除于专利保护之外，通过创造性的判断过程实现了专利保护客体判断的判断目标。

3.2判断示例

上述判断思路在2019年修改的《审查指南》中通过案例进行了说明，在例10中给出了“一种动态观点演变的可视化方法”：

该申请的内容为：

近年来人们越来越多地通过社交平台发表他们的意见和想法,人们在社交平台上发表的带有情感的内容反映了人们观点的演变,并可以由此看出事件的发展、变化和趋势。发明专利申请通过自动采集社交平台人们发表的信息并对其中的情感进行分析,通过计算机绘制情感可视化图来帮助人们更好地理解情感在不同时间的强度变化和随时间而演变的趋势。

该申请的权利要求为：

一种动态观点演变的可视化方法，所述方法包括:

步骤一，由计算设备确定所采集的信息集合中信息的情感隶属度和情感分类，所述信息的情感隶属度表示该信息以多大概率属于某一情感分类;

步骤二，所述情感分类为积极、中立或消极，具体分类方法为：如果点赞的数目p除以点踩的数目q的值r大于阈值a，那么认为该情感分类为积极，如果值r小于阈值b，那么认为该情感分类为消极，如果值b≤r≤a,那么情感分类为中立，其中a>b;

步骤三，基于所述信息的情感分类，自动建立所述信息集合的情感可视化图形的几何布局，以横轴表示信息产生的时间，以纵轴表示属于各情感分类的信息的数量;

步骤四，所述计算设备基于所述信息的情感隶属度对所建立的几何布局进行着色，按照信息颜色的渐变顺序为各情感分类层上的信息着色。

2019年修改的《审查指南》对该案分析及结论为：

对比文件1公开了一种基于情感的可视化分析方法，其中时间被表示为一条水平轴，每条色带在不同时间的宽度代表一种情感在该时间的度量，用不同的色带代表不同的情感。

发明专利申请的解决方案与对比文件1的区别在于步骤二中设定的情感的具体分类规则。从申请内容中可以看出，即使情感分类规则不同，对相应数据进行着色处理的技术手段也可以是相同的，不必作出改变，即上述情感分类规则与具体的可视化手段并非功能上彼此相互支持、存在相互作用关系。与对比文件1相比，发明专利申请只是提出了一种新的情感分类的规则，没有实际解决任何技术问题，也没有针对现有技术作出技术贡献。因此，要求保护的发明技术方案相对于对比文件1不具备创造性。

由该案例可见，即使将算法予以技术上的“包装”，如果算法特征和技术特征不能功能上彼此相互支持、存在相互作用关系，则仍然会将算法特征作为一个独立的特征，而该算法特征即使存在改进，也会被认为并没有对现有技术做出技术贡献，从而使得纯粹是算法创新的方案仍然无法获得专利权。

3.3《征求意见稿》创造性部分的修改实现了对专利保护客体一定程度的放开

那么《征求意见稿》是否没有就专利保护客体进行任何的放开吗？答案并非如此。

（1）《征求意见稿》的相关修改

在《征求意见稿》针对6.1.3新颖性和创造性的审查部分中，特别就何种情况下考虑算法特征对技术方案做出的贡献进行了说明，具体为：

如果权利要求中的算法实现了对计算机系统内部性能的改进，提升了硬件的运算效率和执行效果，包括减少数据存储量、减少数据传输量、提高硬件处理速度等，那么可以认为该算法特征与技术特征功能上彼此相互支持、存在相互作用关系，在进行创造性审查时，应当考虑所述的算法特征对技术方案作出的贡献。

配合这一修改，《征求意见稿》在第6.2节审查示例部分增加了改进在于算法本身的示例“一种用于适配神经网络参数的方法”，具体修改内容摘录如下：

申请内容概述

针对不同的应用场景需设计不同的神经网络架构，并且需在某一类型的计算架构上使用一系列的运算来实现，因此期望能够通过较低的硬件成本高效地实现神经网络中的运算。发明专利申请提出了用于适配神经网络参数的方法，通过获得具有规范形式的神经网络参数，将神经网络中的运算映射到计算架构所支持的运算中，简化神经网络相关硬件的设计和实现。

申请的权利要求

一种用于适配神经网络参数的方法，所述方法包括：

针对神经网络至少一层中的每一层的权重参数，选择多个维度；

确定所述权重参数在所述多个维度中每个维度上的尺寸；

基于支持神经网络计算的硬件的使用率，确定所述权重参数在所述多个维度中每个维度上的目标尺寸的候选值集合；

选取所述候选值集合中大于或等于对应维度上的尺寸的所有候选值子集，确定所述候选值子集中的最小值为对应维度上的目标尺寸；

如果所述权重参数在多个维度中的至少一个维度上的尺寸小于对应维度上的目标尺寸，则在所述维度上对权重参数进行填充，使得填充之后获得的权重参数在每个维度上的尺寸等于对应维度上的目标尺寸。

分析及结论

对比文件公开了面向神经网络处理器的设计方法，该方法根据神经网络模型描述文件与硬件资源约束参数，从已构建的神经网络组件库中查找单元库，并依据单元库生成对应于神经网络模型的神经网络处理器的硬件描述语言代码，进而将所述硬件描述语言代码转化为所述神经网络处理器的硬件电路。其中将神经网络特征数据和权重数据划分为适当的数据块集中存储和访问。该解决方案与对比文件的区别在于基于硬件参数确定权重参数在每个维度上的目标尺寸，如果至少一个维度上的尺寸小于目标尺寸则对权重参数进行填充。

基于申请文件可知，该解决方案通过将权重参数的尺寸填充为等于目标尺寸，当支持神经网络的硬件对神经网络的数据进行运算时，硬件能够高效处理所述数据，该解决方案中的算法提升了硬件的运算效率。因此，上述用于适配神经网络参数的算法特征与技术特征在功能上彼此相互支持、存在相互作用关系。相对于对比文件，确定发明实际解决的技术问题是如何使硬件高效地执行神经网络中的运算。上述通过适配神经网络参数以提升硬件运算效率的内容未被其他对比文件公开，也不属于本领域的公知常识，现有技术整体上并不存在对上述对比文件进行改进以获得发明专利申请的技术方案的启示，要求保护的发明技术方案具备创造性。

（2）针对《征求意见稿》修改的分析

在国家知识产权局就《征求意见稿》提供的说明中指出：

该示例明确了对于改进在于算法本身的发明专利申请，如果其方案提高了硬件的运行性能，实现了对计算机系统内部性能的改进，在创造性判断时应当考虑其对技术方案作出的贡献。此次修改及时回应了创新主体的需求，有利于加强对人工智能领域相关发明专利申请的专利保护。

从上述《征求意见稿》的修改本身以及“说明”都可以看出，《征求意见稿》将某些“改进在于算法本身的发明专利申请”也纳入可以授权的范围，一定程度上拓宽了专利保护客体的范畴，但这种拓宽仍然是有限度的拓宽。

这种限度体现为仍然要满足“算法特征与技术特征功能上彼此相互支持、存在相互作用关系”这一要求，而对于这一要求的成立条件，《征求意见稿》给出了明确的规定：权利要求中的算法实现了对计算机系统内部性能的改进，提升了硬件的运算效率和执行效果，包括减少数据存储量、减少数据传输量、提高硬件处理速度等。从这一规定以及在第6.2节审查示例部分增加的“一种用于适配神经网络参数的方法”的示例我们或者可以得出，当算法改进的目的并非仅仅是抽象的数学方法改进，而是一个针对改进计算机系统内部性能这一特定技术问题所提出的改进时，该算法特征就和方案中技术特征彼此相互支持、存在相互作用关系，这使得算法特征在贡献层面具备了技术的属性，因而在创造性评判中应被加以考虑，一旦该算法改进并非现有技术，则其所在的方案能够通过创造性的审查进而获得授权。这实际上是一种通过技术问题来将算法赋予技术属性的方式。

这种修改，一方面避免了一见算法就驳回的错误，另一方面，也给出了何种包括算法的方案能够获得专利权的明确判断标准，使得这方面的判断更为准确、更具可操作性。

由此可见，基于2020年的修改，针对不产生任何技术效果的纯规则改变的算法改进，仍然不提供专利的保护，而对于能够产生计算机系统内部性能改进这一效果的算法的改进，则提供专利保护的可能。该修改没有脱离开专利法保护技术的核心要求，而是区分了游离于技术之外的算法和服务于技术的算法两种情况，并对后者提供专利保护。实际上，涉及人工智能的方案，很多算法上的改进都是出于提升计算机系统内部性能这一目的，基于此，《征求意见稿》实际上对于人工智能技术领域进行了较大幅度的保护客体的放宽。落实到实际的专利挖掘及撰写工作中，我们则应注意区分算法改进的属性，挖掘出算法改进能够对应提升计算机内部性能的方案进行专利申请，并将此种改进的属性在专利申请文件中加以清晰的记载。

参考文献：

【1】国家知识产权局.专利审查指南2010[M].北京：知识产权出版社，2010：第二部分第一章4.2.

【2】刘强.人工智能算法发明可专利性问题研究[J].时代法学，2019(4):24.

【3】崔国斌.专利法原理与案例[M].北京：北京大学出版社，2012：3.

基于人工智能的图像处理技术：利用Opencv实现 人工智能技术方案