人工智能促进经济高质量发展:机理、问题与对策
摘要:人工智能技术具有渗透性、协同性、替代性、创造性等技术—经济特征,人工智能促进经济高质量发展的机理可概括为对三类产业的扩张效应、赋能效应和活化效应。其中,核心产业扩张效应与融合产业赋能效应交互构建了促进高质量发展的动态循环过程,潜在关联产业活化效应则通过提供非匹配、非集约、非规整、非公平问题解决方案促进经济社会高质量发展。当前,中国在世界人工智能领域第一梯队的地位愈发巩固,技术创新处于关键突破期,在地域空间上则形成了三大城市群为重要引擎、沿海地区快速增长、内陆地区稳定增长的发展格局。我国人工智能促进经济高质量发展还存在核心产业低质扩张、融合产业低效赋能、潜在关联产业低迷活化、相关社会伦理道德规范缺失、相关人才短缺且结构不合理等问题。为此,我国要推进基础理论研究和关键共性技术开发,提高科技自立自强能力;优化行业发展环境,促进产业生态良性发展;完善相关法律法规和伦理规范制度,促进人工智能“科技向善”;构建高素质人才培养体系和人才流动机制,促进包容性均衡发展;加快人工智能创新应用先导区和创新发展试验区建设,推进改革试点和应用示范。
关键词:人工智能;高质量发展;技术创新;核心产业;融合产业;潜在关联产业
基金项目:国家社会科学基金重点项目“新技术革命背景下全球创新链的调整及其影响研究”(19AJY013)
人工智能(AI)是指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。作为新一代信息技术革命的代表技术之一,人工智能利用计算设备模拟人类思维决策过程,广泛应用了计算机、数学、物理学、生物学、逻辑学等学科的理论与方法。自1955年达特茅斯会议首次提出“人工智能”概念以来,人工智能经历了60余年的曲折发展,研究重点从早期(1956—1974年)基于符号主义的逻辑推理、启发式搜索,到中期(1974—2006年)符号主义与连接主义融合催生的神经元网络方法、专家系统,发展到近期(2006年至今)基于行为主义纲领的深度学习方法突破所带来的多领域广泛应用[1]。1974年以来的人工智能发展都可归类为连接主义,但2006年之前的连接主义主要对人类大脑活动进行模仿,并没有合理借鉴大脑产生智能的机制。2006年,深度学习方法在卷积神经网络等模型和参数训练技巧等方面取得突破,同时信息设备、算法算力、使用数据也迎来了革新、进步与增长,人工智能实现了跨越式的发展。目前,人工智能研究领域主要分为六大类:计算机视觉、自然语言处理、机器学习、认知及推理、机器人、博弈及伦理。人工智能已经成为世界各国竞争角逐的焦点,其发展水平是国家核心竞争力的重要体现,将对经济发展、社会进步、国际政治经济格局产生深远影响。
党的十九大报告明确提出,推动互联网、大数据、人工智能和实体经济深度融合,作为我国深化供给侧结构性改革、建设制造强国、促进经济高质量发展的重要举措。党的十九届五中全会通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》强调,要推动互联网、大数据、人工智能等同各产业深度融合,这是建设制造强国、质量强国、网络强国、数字中国重要内容,是提高经济质量效益和核心竞争力的关键。本文对人工智能如何促进经济高质量发展的机理进行探讨,分析人工智能促进经济高质量发展存在的问题,提出相应的对策建议。
一、人工智能促进经济高质量发展的机理分析
习近平总书记在十九届中央政治局第九次集体学习时强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。人工智能具有溢出带动性很强的“头雁”效应,在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术的驱动下,人工智能加速发展,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征,正在对经济发展、社会进步、国际政治经济格局等方面产生重大而深远的影响。我国经济已由高速增长阶段转向高质量发展阶段,迫切需要新一代人工智能等重大创新添薪续力,要推进人工智能和产业发展融合,为高质量发展提供新动能[2]。
(一)人工智能的技术—经济特征
人工智能技术既具有一般通用型信息通信技术所具有的渗透性与替代性特征,同时还具备与各经济要素协同配合提升经济效率的协同性特征,以及替代人类脑力工作的创造性特征。
1.渗透性。作为一种兼具通用性、基础性和使能性的数字技术,人工智能具备与经济社会各行业、生产生活各环节相互融合的潜能,这种广泛应用于经济社会各领域的特征被定义为通用型技术的渗透性。在发展初级阶段,人工智能只能应用于简单场景,解决一些抽象概念性的游戏问题,但随着人工智能技术发展,人工智能被越来越多地应用于多元场景、复杂场景,问题解决边界也向实际应用拓展。这种应用复杂化的趋势即是对人工智能技术渗透作用的印证。渗透作用是通用型技术最基本的技术—经济特征,也是计算技术领域重大创新能够引发技术革命,带来技术—经济范式转换的技术基础。渗透性特征决定人工智能具有对经济增长产生广泛性、全局性影响的潜力。在可预见的未来,人工智能技术将更加全面地融入日常生产生活活动之中,成为经济社会不可替代的一部分。
2.协同性。人工智能的协同性在一定程度是其渗透效应的具体实现。人工智能技术作为通用型技术渗透进入经济社会各个方面,在生产领域,人工智能技术的应用可以提升资本、劳动、技术等要素之间的匹配度,加强上游技术研发、中游工程实现、下游应用反馈各个生产环节之间的协同,从而提高运行效率。在消费领域,人工智能技术可以实现对用户消费习惯与消费需求的自动画像,完成需求与供给的智能匹配,进一步释放消费潜力的同时,实现经济的高质量增长。总的来说,人工智能的协同性特征体现在对经济运行效率的提升。蔡跃洲等核算了中国在过去三十年中ICT资本对增长的贡献率,并使用格兰杰因果检验印证了ICT资本与全要素生产率TEP增长具有因果关系,ICT资本通过与各个经济要素的协同促进了经济效率提升,最终推动了GDP的增长[3]。
3.替代性。随着设备设施与技术研发的持续发展,信息通信技术(ICT)产品相对价格持续下降,从而出现ICT产品对其他投资的大规模替代。如芯片领域的摩尔定律预言集成电路晶体管数目约18个月便会增加一倍,这使得芯片在能够解决更多问题的同时成本持续下降,实现对非ICT资本的不断替代。人工智能除了对非ICT资本的替代效应外,更能实现对劳动要素的直接替代,蔡跃洲等将人工智能对就业的影响分解为负面的替代效应与正面的抑制效应,并得出结论认为就业总量基本稳定的趋势还将延续一段时间,人工智能完全替代人类劳动的极端情形中短期不会出现[4]。人工智能技术持续发挥替代效应,在作为独立要素不断积累的同时,对其他资本要素、劳动要素进行替代,其对经济发展的支撑作用由此不断强化。
4.创造性。生产自动化能够实现对一些高强度、高难度的持续劳动进行替代,而人工智能之所以引起人们对就业前景强烈担忧的原因更在于其能够实现对人类脑力工作、创造性活动的替代。当下人工智能技术已经被广泛应用于药物发现及筛选、材料识别及模拟等科研活动,更是在金融、数字建模、应急救援、音乐绘画等领域被广泛赋予分析决策甚至是创造创新的权力,展现出人类历史上从未有过的来自人类头脑之外的创造力量。人工智能的创造性可以生产出额外的知识,增加人类整体智慧总量,从而促进技术进步,提高经济效率。针对人工智能将完全取代人类工作的担忧,Holford对人工智能的创造性进行了分析,认为人工智能技术主要通过符号解释、形式化和意义捕捉的方式获取知识,对于人类整体知识和隐性知识的复杂性、创造性较难模仿。在不出现颠覆性技术突破的情况下,人工智能技术无法实现对人类创造的完全替代[5]。
(二)人工智能促进经济高质量发展的机理与效应
人工智能代表了未来经济发展的无限可能性,现有观点普遍认为人工智能可以通过提高生产率促进经济增长。在微观个体活动方面,人工智能发展传统自动化为“智能自动化”,持续释放个体创造力,极大提升劳动生产率。在中观行业生产方面,人工智能不断提升生产能力与资本效率,对行业进行分析并作出控制决策,解决某些行业生产准确率低、工作量大、设备闲置、安全性差等一系列问题。在宏观经济发展方面,人工智能促进管理效率、资源配置效率和社会交易效率的提升,推动创新并提高全要素生产率,深化分工形式,大大拓展产品创新的空间,从提升分工专业化效率转向提升分工多样化效率,从多样性角度拓展生产可能性边界[6-7]。师博从生产、分配、交换、消费四个方面探讨了人工智能充分契合创新、协调、绿色、开放、共享的新发展理念,在生产环节发挥创新效应与技术外溢效应实现创新发展;在分配环节优化分配结构同时提升分配效率深化共享发展;在交换环节,通过平台经济、国际共建等方式实现协调、开放发展;在消费环节改进消费质量,加速绿色消费,贯彻绿色发展理念。人工智能在贯彻新发展理念的同时,与经济社会充分融合,实现经济的高质量发展[8]。任保平等聚焦人工智能与实体经济的融合增长效应,从培育高端要素、优化要素禀赋结构的供给侧到普及智能产品与服务、多元化需求渠道的需求侧,双向探讨人工智能对实体经济的融合促进作用,并结合我国当前发展阶段,分析人工智能对传统产业、新兴产业、新商业模式以及供需协同的带动作用,提出构建融合支持体系、加强新基建、培育产业环境、优化投融资支持、深化对外开放等建议[9]。罗以洪基于数字产业化、产业数字化、数字化治理的模型框架,结合宏观理论中四部门经济的各个部门与要素特征,提出政府、消费者、生产者、国外消费者、国外生产者以及金融机构四部门数字经济模型,细化资源型、技术型、融合型、服务型四种数字经济类型,提出具有针对性的数字经济高质量发展路径与对策建议[10]。
已有研究对人工智能如何促进经济高质量发展的机理分析主要集中在以下几个角度:一是基于微观、中观、宏观三重视角进行分析,其具有坚实的经济逻辑支撑,易于进行理论分析,并提出相关政策建议;二是从生产、分配、交换、消费等经济环节进行分析,其更加全面地聚焦经济社会整体的高质量发展,并与新发展理念有着高契合度;三是以中国信息通信研究院提出的数字经济分析框架(数字产业化—产业数字化—数据价值化—数字化治理)为基础进行分析,这一角度具备国际通用性,同时在实证分析方面具有广泛的研究基础,有较多的研究基于相同框架对国内外不同主体进行数字经济测算。与此同时,上述角度都存在一定缺陷:微观、中观、宏观三重视角难以聚焦人工智能产业如何实现发展的高质量,经济环节视角则难以提出有针对性的促进建议,并且在量化发展质量、实证分析路径效应方面二者都有着较大的局限性。数字经济框架则是为数字经济所设计,套用于人工智能产业需要进一步探讨其适配性。
本文基于人工智能的技术—经济特征,对经济社会产业进行划分,并根据划分结构针对性分析人工智能对经济高质量发展的促进机理。经济社会产业可以分解为三种类型,即核心产业、融合产业、潜在关联产业(见图1)。首先,作为一项系统性较强的数字技术,人工智能催生了一系列配套核心产业,其产品服务涵盖了上游研发到下游应用的产业链各环节。其次,人工智能通过发挥渗透性、替代性、协同性、创造性四大技术—经济特征,对一些已有产业进行技术赋能,进而创造出智慧农业、智能制造、智慧建筑、智慧医疗等一大批产业融合新生态。最后,针对目前经济社会中市场化程度不高,尚与人工智能关联较弱的经济社会领域,在不久的未来,人工智能可能通过对其资产与产业环节的“激活”,实现意料之外的爆发式增长。
图1三类产业:按照与人工智能联系程度来
1.核心产业的扩张效应。人工智能作为一项系统性较强的数字技术,其应用的实现离不开技术研发、软硬件开发、算法模型训练、具体场景应用等一系列环节,从而催生了一系列支撑配套的核心产业,有着完备的产业链条,其产品服务涵盖了上游研发到下游应用的各环节。在软件层面,人工智能技术包括算法软件、图谱模型、处理流程等内容的开发,而在硬件层面,人工智能技术涵盖专用芯片、存储器、处理器等硬件设施的生产,除此之外,还包含对数据的搜集与处理,对样本进行学习,对模型进行训练等一系列配套工作。人工智能技术是一项涵盖诸多技术产品的复杂系统,从上游的技术研发到中游的工程实现,再到下游的应用反馈,系统中各个环节都对应着相匹配的产品及服务,随着行业的发展人工智能行业逐渐形成了一套相对独立的核心产业体系。
人工智能促进经济高质量发展的路径之一,即是人工智能核心产业的扩张增长效应。人工智能产业体系根植于高新信息技术产业,但不同于其他信息技术产业,人工智能具有与生产生活应用更高的融合度,可以快速响应具体问题,根据不同的场景生态提供对应的应用方案。不断增长的应用需求使得人工智能产业保持较高速度的增长,同时也促进了基础信息技术产业的壮大,人工智能核心产业的扩张增长符合产业结构优化升级方向,其对经济的支撑作用不断强化,促使经济实现高质量发展。
2.融合产业的赋能效应。人工智能技术发挥渗透性、替代性、协同性、创造性的技术—经济特征,输出智能化设施、智能化方案,对已有产业进行智能化改造,实现数字经济与实体经济的融合发展,通过提质增效促进经济高质量发展。
在农业领域,人工智能融入农业生产、物流、出售等环节中,实现农业生产的无人数控、基于数据分析的生产决策、智能农业机器人的精准执行等转变。中国工程院院士赵春江认为,数字技术将实现农业的产业结构升级、产业组织优化和产业创新方式变革,进一步实现农业从自然资源依赖向知识资源依赖的转变[11]。在工业领域,人工智能基于不同工业行业的产业特征提供生产服务的精准升级,一方面在生产端实现冗余资产的发现切除、错配资产的优化调整、闲置资产的重新激活,促进生产效率的提升;另一方面在消费端实现用户需求的快速响应、精确匹配、个性定制,充分释放消费端潜力。人工智能目前已经实现了客户识别、定向展示、工业数据分析等诸多应用。在服务业领域,人工智能早已应用于金融、旅游、物流、文化体育等各个领域,其中在金融领域进行赋能的研究与实践最丰富,人工智能的分析与决策潜力被认为是打造数字金融体系,实现包容性增长的重要路径之一[12]。如今人工智能技术正越来越多地被应用于供应链、交通物流、工业互联等领域,在工业、农业、金融、公共安全等行业逐步构建多样化行业技术服务及解决方案平台,将智能技术与行业数据、专业知识、业务流程深度融合,形成细分领域垂直行业平台,提供相对通用的行业应用服务。人工智能核心产业与融合产业促进经济高质量发展的动态作用机理见图2。
图2人工智能核心产业与融合产业促进经济高质量发展的动态作用机理
核心产业与融合产业之间并非独立增长的割裂状态,相反,人工智能对融合产业的增长赋能离不开人工智能核心产业高质量智能化设施与智能化方案的支撑,而核心产业的持续迭代更新也无法脱离融合产业提供的技术升级需求与场景数据反馈,一些阶跃性的模型优化与算法创新在高质量的场景数据支持下可以在短时间内达到极佳的训练效果并迅速投入推广使用,节省大量训练成本。核心产业与融合产业对经济高质量发展的促进作用是一个具有循环化、动态化特征的交互促进过程,在这个交互过程中,核心产业的底层架构创新能力与迭代速度持续提升,数据更加自主可控、安全高效,而融合产业的赋能边界不断拓展,逐步覆盖国民经济全产业链各环节。两类产业对经济高质量发展的促进路径具有内生自我反馈机制,在循环往复、不断深化的持续性过程中,实现更加全面、深化、自主、包容的经济高质量发展。
3.潜在关联产业的活化效应。除核心产业的扩张效应与融合产业的赋能效应外,作为一项颠覆性技术,人工智能还将对经济体系中的潜在关联产业产生重要驱动作用,即产生“活化效应”,带来创造性地增长。很多原本与数字技术毫无关联的产业,在人工智能行业产品输出、服务输出、技术输出、范式输出、商业模式创新等助力下得到活化,迎来了新一轮高质量发展行情。比如,在十余年前,外卖还只是人们拨打商家电话进行点餐配送行为的别称,而如今,外卖在人工智能技术的加持下,通过算法推荐、匹配骑手、产业链优化等方式,已经成长为一个万亿规模的巨型市场。在日常出行领域,人工智能技术为高效安全出行提供支持,在房地产行业,人工智能技术为交易主体实现智能匹配,降低交易时间成本,提升社会福利。我们正处于一个剧烈变革的时代,在可预见的未来,这种活化效应将越来越多地刺激经济社会的各个潜在关联产业,实现高效集约、创新绿色的高质量增长。
活化效应与融合产业的赋能效应有所区别:一是活化效应面对未来,活化对象更多指目前还未与人工智能技术产生交集的潜在行业;二是赋能效应的对象是融合产业,赋能过程中人工智能与融合产业的交互作用、动态发展,需要融合产业不断提供产品服务信息,而活化效应更多通过人工智能核心产业单向输出实现。
此外,对于部分潜在关联产业,特别是非正规部门(可称为市场外潜在关联产业),人工智能通过将其进行资本化来实现活化效应。索托在《资本的秘密》一书曾讨论这类广泛存在于发展中国家,严重阻碍社会部门运转以及经济产业发展的产业,包括城乡接合部非正式市场系统、非法作坊、非法建筑等。这些正式体系之外的经济部门在一定程度上弥补了正式经济领域的空白,但当其比重过大时便会形成对经济社会发展的强大阻力[13]。邱泽奇等将这类资产获得市场进入机会定义为资产的资本化过程,认为促进有效资本增长的途径有两条:其一,提高资本化程度;其二,增加资产数量[14]。在市场外潜在产业的资本化方面,数字技术展现了前所未有的催化效率,而人工智能技术更是综合大数据、识别匹配、智能决策等流程于一体,在社会各个方面实现冗余资产的发现切除、错配资产的优化调整、闲置资产的重新激活,促进了资产的高速、高效资本化。
人工智能通过对市场内潜在关联产业的活化效应,解决产业内存在的问题:其一,供求双方信息流通受阻,市场信息不对称的非匹配问题;其二,产业规模增长而质效降低的粗放增长非集约问题。对于市场外潜在关联产业,人工智能的资本化效应则解决了两方面的问题:其一,非正式产业尾大不掉的非规整问题;其二,数字设备能力差异化、市场进入机会不平等、地域发展不均衡等非公平问题。人工智能充分发挥对潜在关联产业的活化效应,作用范围逐步覆盖国民经济全产业链各环节,提供经济发展过程中非匹配、非集约、非规整、非公平问题的解决方案,实现经济的高质量发展。
二、我国人工智能发展现状
长久以来,中国在世界科技发展历史中扮演着追赶者的角色,而人工智能是我国在新一轮技术革命中率先取得领先优势地位的少数领域之一。2020年中国人工智能核心产业规模达到3251亿元,年度行业投融资金额突破800亿元[15],人工智能正加速与实体经济融合发展,助力产业转型升级、提质增效。
(一)基于行业发展视角,中国处于人工智能领域的第一梯队地位
目前我国在人工智能领域的论文发文量、专利申请量方面都居于世界前列,并且增长速度正进一步提高。总体而言,中国人工智能处于全球第一梯队位置,成为仅次于美国的第二大贡献国。
根据中国科学技术发展战略研究院、科技部新一代人工智能发展研究中心发布的《中国新一代人工智能发展报告2020》数据显示,2019年中国共发表人工智能论文2.87万篇,比上年增长12.4%,单年论文规模达到美国的1.5倍,相比2013—2018年共产出7.4万篇有了大幅提升。在全球近五年前100篇人工智能论文高被引论文中,中国产出占21篇,相比2018年增加5篇。中国在人工智能领域各顶级国际会议上的活跃度和影响力不断提升,在自动机器学习、神经网络可解释性方法、异构融合类脑计算等领域中都涌现了一批具有国际影响力的创新性成果。中国人工智能专利申请量2019年超过3万件,比上年增长52.4%[16-17]。另据深圳市人工智能协会发布的《2021人工智能发展白皮书》,截至2020年底,中国人工智能相关企业数量达到6425家,同比增长25.37%,企业数量位居全球第二[18]。另外,中国始终以积极的姿态推动人工智能领域的国际合作,在国际人工智能开源社区的贡献度已成为仅次于美国的第二大贡献国。
(二)基于技术研发视角,中国正处于人工智能发展的关键突破期
人工智能对经济社会高质量发展的促进力量根植于自身的通用性技术特征,而作为一项引领新一轮产业变革的数字技术,其对产业的变革动力来源于底层的一系列技术创新。中国信息通信研究院对人工智能技术创新程度和突破难度进行分类,从高到低分为颠覆、阶跃、创新优化和工程实现四个发展层级[17]。目前,我国在创新优化和工程实现技术方面处于全球领先位置,但在颠覆性和阶跃性技术方面相对缺乏,缺乏全球引领能力。
据中国信息通信研究院测算,现阶段我国在视觉、语音等基础智能任务的工程实现水平,处于世界领先位置,算法模型的二次创新优化能力同样居于世界前列,但在基础理论、原创模型等颠覆性、阶跃性技术领域仍不具备领导能力[19]。具体而言,中国有一大批人工智能研发机构致力于吸收改造领域内的人工智能算法技术并对其进行场景应用方面的训练,在完成工程实现的同时,基于丰富的场景、用户数据对技术模型进行较小的创新优化。如中国科学院大学人工智能学院近年来开发了基于大数据的互联网机器翻译核心技术及产业化(2017)、大规模知识图谱构建关键技术与应用(2020)等项目。在企业方面,旷视科技融合算法、算力和数据,打造新一代AI生产力平台旷视Brain++,开源深度学习框架“天元”,其ShuffleNet模型具备轻量级CNN模型结构,在同等计算复杂度下可编码更多信息。极智嘉科技基于丰富运营经验和场景积累,建立了国内机器人数量最多、出货能力最大的机器人拣选仓库产品和解决方案系统,覆盖订单拣选、自动搬运、包裹分解等不同物流应用场景,提供环境地图构建、动态环境适应、混合场景多传感器融合、自适应运动等一系列技术服务。依图科技与上海交通大学、芯片公司ThinkForce合作建立“视觉计算与应用”联合实验室,搭建全球最大的人像系统,覆盖超15亿人像,为全国20余省的安防、海关总署、中国边检等合作伙伴提供人像比对服务,并广泛应用在招商银行、浦发银行等多个互联网金融业务场景中。
尽管中国在视觉、语音、自然语言处理等基础应用任务的算法开发上技术完成度高、处理能力强、迭代速度快,多所企业与高校在全球权威比赛中成绩优异①,但是,在颠覆层级的基础理论开发,以及阶跃层级的模型原创或技术优化方面,中国缺失与产业体量相匹配的领导力。一方面,知识工程、深度学习、神经网络等人工智能基础理论开发需要相关统计学、认知学、神经学等底层学科作为理论基础,而中国长久以来一直在现代基础学科理论创新方面落后于欧美发达国家,缺乏基础性创造性贡献。另一方面,中国还没能掌握人工智能热点发展方向的决定权,技术标准、数据标准体系长期对标国际,国内研发重心长期跟随国际,缺失人工智能领域技术研发话语权,短期难以突破领域内寡头垄断格局。
①商汤、旷视、依图、腾讯等企业在细粒度图像识别、自动驾驶场景定位及追踪、行人重识别(ReID)、人体视频解析等复杂任务各类比赛中成绩优异;哈工大讯飞联合实验室(JointLaboratoryofHITandiFLYTEKResearch,HFL)在推理阅读理解评测任务(HotpotQA)全维基赛道中获得第一。
(三)基于地域空间视角,中国形成了三大城市群为重要引擎,沿海地区快速增长,内陆地区稳定增长的发展格局
自2017年国务院发布《新一代人工智能发展规划》以来,全国各地加快推进具有地方特色、符合地方定位的人工智能战略规划布局,央地共治共同推动人工智能发展成效显著,相关细化政策不断完善落地。当前中国形成了以京津冀、长三角、大湾区三大城市群为重要引擎,沿海地区快速增长,内陆地区稳定增长的人工智能地域发展格局。其中,京津冀城市群形成以北京为绝对核心的单核加速发展态势,长三角城市群构建以上海、杭州为正副核心的双核引领发展态势,大湾区城市群形成以深圳、香港、广州为核心的三极协同发展态势。三大城市群以外,主要有成都、武汉、长沙、合肥等城市支撑起了内陆地区人工智能领域的发展。
截至2020年底,中国人工智能企业数量达到6425家,京津冀、长三角、大湾区三大区域占据了企业总数量的80%以上。广东、北京、上海、浙江在企业专利申请数量方面领先全国,广东、江苏、北京、浙江是人工智能专利转移最活跃的地区,这些地区通过科技成果供给激发了区域经济发展新动能。2019年人工智能论文发表活跃度排名依次为北京、江苏、广东、湖北等地。2020年人工智能领域从业人员超过60万人,而北京、上海、深圳、杭州聚集了80%以上的人工智能人才①。三大城市群的人工智能快速发展离不开一大批人工智能研发机构的底层支撑,笔者根据机构资料与中国信息通信研究院对人工智能技术层级划分标准,对地处三大城市群的人工智能研发机构进行了简要划分。在北京,有清华大学神经网络结构研究中心、北京大学智能科学系、微软亚洲研究院、百度深度学习研究院支撑起颠覆与阶跃层级的技术开发,中科大模式识别实验室、北理工仿生机器人与系统国际合作联合实验室、旷视科技计算机视觉研究院等则聚焦创新优化与工程实现级的技术研发。上海与杭州在颠覆与阶跃层级的基础理论开发有上海交通大学人工智能数学基础、机器认知计算研究中心、复旦大学类脑智能教育部重点实验室、深兰科学院等校企机构,创新优化与工程实现级则有浙江大学计算智能与信号处理研究所、多源感知与机器智能研究所、之江实验室、上海智能机器人工程技术研究中心等研发机构提供支撑。大湾区地区有着广泛的人才吸引力与技术流动性,建有华为云计算异构系统关键技术工程实验室、中山大学大数据与计算智能研究所、无人系统研究所、深圳人工智能与大数据研究院、香港中文大学智能系统实验室;云从科技—中国民航共建智慧民航研究中心(广州)、大疆智能无人系统开放创新平台等一大批校企研发机构。
①数据来源:深圳市人工智能行业协会。其中,企业专利申请数量:广东28.32万件,北京10.28万件,上海6.13万件,浙江3.67万件
三、我国人工智能促进经济高质量发展存在的主要问题
(一)关键核心技术缺乏与产业话语权缺失导致核心产业低质扩张
在当前世界局势中,人工智能被视为经济社会发展重要的新增长点,各国都十分重视人工智能技术的发展,国内人工智能企业与高校科研院所在国际市场中极易被打上“中国”的标签,并遭遇一些来自非市场力量的压迫。中国目前在创新优化级、工程实现级的人工智能技术研发工作取得了巨大成就,但在颠覆性理论突破与阶跃性模型创新方面还有所不足,中国还未能掌握人工智能热点方向的决定权,技术标准、数据标准体系不得不长期对标国际,研发重点跟随国际脚步,缺失人工智能领域技术研发话语权。同时,在关键技术、芯片制造、架构设计、底层平台方面中国还面临着发达国家“卡脖子”的局面。人工智能促进经济高质量发展的路径之一是通过其核心产业的扩张增长,在核心技术话语权缺失的情况下,中国将难以发挥核心产业的扩张效应,甚至长期陷入“大而不强”的被动局面。
(二)产学研合作存在“梗阻”与要素流通不畅导致融合产业低效赋能
人工智能对融合产业的赋能过程涉及特定产业专业与人工智能专业的交叉复合知识,更需要研发端长期布局,熟悉特定产业的运行架构与关键症结。然而,目前中国不同人工智能主体的研发重心存在偏差,高校科研院所相对重视人工智能理论开发与模型训练问题,而人工智能企业更重视场景应用与技术服务,产业端与研发端之间的界限依旧牢固,市场激励基础理论研发与基础研发促进产业升级的双向路径不通畅,技术、人才、制度、数据等要素难以自由流动,核心产业与融合产业之间的产品服务流与信息数据流渠道受阻,原本的动态融合逻辑被打破,人工智能对融合产业赋能成本高、效率低、效果差,无法充分发挥对经济高质量发展的交互促进效应。
(三)平台垄断问题与溢出效应不足导致潜在关联产业低迷活化
在人工智能时代,学习算法不断优化,模型算力持续进步,数据的经济价值将得到前所未有的深度挖掘和充分释放,为海量用户数据提供了完美的商业可能。同时,人工智能技术依赖数据进行正反馈循环发展,行业自然倾向于垄断,当人工智能头部平台公司形成一定的市场势力,市场机制将很难阻止其利用“技术+市场势力”的循环进一步深化垄断格局。人工智能产业主体通过数据垄断而限制、排除竞争的行为,将成为反垄断法面临的新时代课题[20]。当前,我国数字经济平台垄断问题已经有所凸显,以滴滴为代表的一批数字平台被国家互联网信息办公室核实存在严重违法违规收集使用个人信息问题,要求下架整改[21-22]。人工智能行业存在的垄断问题对行业发挥溢出效应有着严重的阻碍,行业活力被抑制,导致人工智能对于潜在关联产业的活化效应严重释放不足。
(四)相关社会伦理道德规范缺失,隐私保护和安全性问题突出
与发达国家相比,我国还缺乏与人工智能相关的社会伦理和法律规范系统研究和整体规划,对于人工智能使用和赋能造成的潜在风险、隐私保护,缺乏事前预见性和事后应急处置方案,特别是在社会治理领域的应用,容易诱发隐私侵犯、侵入式检测事件,甚至诱发危及社会稳定和政权安全的严重群体性社会问题。人工智能法律法规有待完善,行业发展尚需伦理准则规范,法律地位不明确、算法不透明、危险决策不可解释等一系列风险亟须解决。
此外,我国还存在开源软件使用不当导致的知识产权侵权风险、强制开源导致企业核心技术泄露风险(如使用GPL等许可协议,要求引用/修改/衍生代码的开源/免费使用,不允许修改/衍生的代码作为闭源商业软件发布和销售)、不遵守许可协议造成合同违约风险,以及多个开源许可证不兼容风险等一系列问题。在开源软件使用不当方面,我国人工智能领域在国际上声誉受损和被经济制裁的案例时有发生。
(五)相关人才短缺且结构不合理,难以支撑实体经济高质量发展
1.高端人才总量偏少。知名AI领域机构ElementAI发布的2020年《全球AI人才流动报告》称,尽管中国在人工智能处于世界前列,论文数量排名也居于全球第二位置,但中国人工智能人才储备表现不佳,在全球AI人才库中,美国拥有188300人,再次位列第一,印度拥有86213人,居次席,中国拥有AI人才数量仅为22191人,排在第四位;并且,据测算,2014—2019年,中国人工智能高端人才呈现越来越严重的净流出状态[23]。
2.人才结构不合理。我国人工智能人才主要集中在应用领域,而美国则主要集中在芯片、机器学习、计算机视觉等重要基础技术领域。我国目前缺乏具备人工智能和实体经济交叉知识体系的复合型人才,但高校专业设置落后于科技发展实际,人工智能专业教学存在缺乏实践、领域宽泛、知识陈旧、碎片化严重等问题。产业界则存在人才使用和激励机制不完善的问题,对如何评价科技人员贡献缺乏有效办法,人工智能技术人员在选拔、任用、培养、使用上缺乏有效激励办法。
四、对策建议
(一)推进基础理论研究和关键共性技术开发,提高科技自立自强能力
针对核心产业低质扩张问题,充分发挥新型举国体制优势,集合产学研多方优势,加大在机器学习、智能计算、核心算法、基础软硬件等人工智能前沿理论和关键核心技术研发应用的投入力度,坚持创新在经济高质量发展中的核心地位,增强科技自主创新能力,尽快在基础理论研究和关键共性技术获得突破,解决一批“卡脖子”技术问题,提高人工智能领域科技自立自强能力。
针对融合产业低效赋能问题,大力推进以企业为主体、“政产学研用”相结合的开放式协同创新,提高创新生态系统开放性、协同性。加强人工智能相关的企业国家重点实验室建设,支持企业与高校、科研院所等共建研发机构和联合实验室,打破产学研壁垒,进一步疏通二者之间技术、人才、制度、数据的流动路径,加强面向人工智能和行业共性问题的应用基础研究,联合开展关键共性技术攻关。鼓励不同产业领域对人工智能技术的创新应用,加快人工智能应用覆盖速度,拓展人工智能应用赋能边界。鼓励实体经济与人工智能的深度融合,推进融合产业动态高质量发展。
(二)优化行业发展环境,促进产业生态良性发展
人工智能与实体经济深度融合需要优化发展环境,包括完善的市场建设、公平的竞争环境、良好的商业秩序、政府规范合理的行为及其激励与保障下企业对于技术创新与产业创新的追求(而非对于寻租及政策套利活动的追求)。
在反垄断方面,贯彻落实《中华人民共和国反垄断法》和《国务院反垄断委员会关于平台经济领域的反垄断指南》,强化对数字经济平台企业反垄断执法,坚决制止平台企业利用算法歧视、算法操纵、数据垄断、侵犯隐私等手段,侵害消费者利益,实施排除、限制竞争的行为。
在政策环境方面,推进普惠性产业政策转型,由当前“政府选择+政策支持”的产业政策,与“产业规划—项目选择—政策支持—效果评估”的政策实施方式,转变为“环境建设+市场选择”的产业政策,与“产业规划—环境建设—体制机制保障—企业行为—市场选择”的政策实施方式[24]。
在市场环境方面,完善全国统一、竞争有序的市场体系建设,加大知识产权保护力度,防范打击人工智能领域知识产权侵权行为。建立完善人工智能知识产权交易制度,促进人工智能技术在产业间的扩散。完善资本市场支撑环境,优化人工智能与实体经济融合的金融市场支持。完善区域间技术、人才、资本流动环境,积极引导中西部地区重视人工智能产业发展,解决地域发展不均衡问题。
(三)完善相关法律法规和伦理规范制度,促进人工智能“科技向善”
新一代人工智能技术是一种数据驱动型技术,存在着技术上鼓励数据的全社会流动共享与安全上要求个人加强隐私信息保护之间的深层矛盾。数据的高质量、大规模、可得性关乎人工智能发展的成败,因此在数据安全性方面,需要政府重视相关法律法规体系建设,行业协会加快制定行业标准规范,企业内部建设并严格执行数据泄露惩罚机制。
贯彻落实《中华人民共和国网络安全法》《中华人民共和国数据安全法》,呼吁尽快出台《中华人民共和国个人信息保护法》。借鉴欧盟《通用数据保护条例》等在数据安全和隐私保护的先进经验,结合实际情况出台相关实施细则和配套政策,在确保数据安全和个人隐私、企业秘密前提下,鼓励数据互联互通。组织社会学家、法律专家、技术专家针对相关问题展开合作,全社会广泛参与讨论,制定完善相关法律法规和伦理规范,规范人工智能信息收集、保存、使用、共享、转让、信息披露等活动,实现信息安全、隐私权与数据可得性之间的平衡,确保人工智能“科技向善”。
(四)构建高素质人才培养体系和人才流动机制,促进包容性均衡发展
人工智能核心产业扩张增长过程的专业性与融合产业赋能增长过程的复合性对相关人才的数量、质量提出了高要求。中国需要在鼓励高校设立人工智能专业的同时,鼓励设立“人工智能+”复合专业,培养融合专业人才。基于多学科构建人工智能人才协同培育体系,加强优势专业校际交流,深化教育科研改革,加大交叉人才培养力度,增加人工智能人才储备。
我国人工智能发展水平高的机构和企业主要集中在东部地区,中西部人工智能研发和应用水平相对较低,区域发展不平衡问题较为突出。中西部地区应以大力发展数字基础设施为契机,完善地区营商环境和知识产权保护制度,构建灵活顺畅的人才流动机制,通过建立人工智能专项发展基金池等办法,吸引东部人才到中西部地区创业发展,提升中西部地区人工智能发展水平。
拓宽国际人才交流和招揽渠道,扶持人工智能、机器学习,以及数字经济所需的数据分析、云端计算等领域的人才引进及培养。鼓励高校、企业相关团队赴国外顶尖大学及研究机构合作交流人工智能及机器学习等最新技术。完善外籍高层次人认定标准,畅通人才申请永久居留的市场化渠道,为外籍高层次数字科技人才在华工作、生活提供更多便利。完善国际化人才培养模式,加强数字科技人才国际交流合作,推进职业资格国际互认。
(五)加快人工智能创新应用先导区和创新发展试验区建设,推进改革试点和应用示范
目前,工信部已经在上海(浦东新区)、深圳、济南—青岛、北京、天津(滨海新区)、杭州、广州、成都设立了8个国家人工智能创新应用先导区,这是部省协同推进人工智能和实体经济深度融合的重要举措。科技部则分别发函支持北京、上海、合肥、杭州、深圳、天津、济南、西安、成都、重庆、广州、武汉、苏州、长沙等城市和浙江省德清县,建设国家新一代人工智能创新发展试验区,国家新一代人工智能创新发展试验区已达14市1县。
要以创建国家人工智能创新应用先导区和国家新一代人工智能创新发展试验区为契机和载体,发挥先导区和试验区在技术原创、产业生态、人才基础、发展环境等多重优势,不断拓展应用场景,促进人工智能与制造业深度融合,促进人工智能与核心产业、融合产业、潜在关联产业更多融合发展。与此同时,探索新一代人工智能发展新路径新机制,形成可复制、可推广的经验,不断挖掘机制改革“深度”,提升创新能力“高度”,加快应用落地“速度”,增进产业集聚“热度”,导出经验、模式、产品及服务,为经济高质量发展提供有力支撑。
参考文献
[1]姜国睿,陈晖,王姝歆.人工智能的发展历程与研究初探[J].计算机时代,2020(9):7-10,16.
[2]习近平主持中共中央政治局第九次集体学习并讲话[EB/OL].(2018-10-31)[2021-07-07].http://www.gov.cn/xinwen/2018-10/31/content_5336251.htm?cid=303.
[3]蔡跃洲,张钧南.信息通信技术对中国经济增长的替代效应与渗透效应[J].经济研究,2015(12):100-114.
[4]蔡跃洲,陈楠.新技术革命下人工智能与高质量增长、高质量就业[J].数量经济技术经济研究,2019(5):3-22.
[5]HolfordWD.Thefutureofhumancreativeknowledgeworkwithinthedigitaleconomy[J].Futures,2019(105):143-154.
[6]曹静,周亚林.人工智能对经济的影响研究进展[J].经济学动态,2018(1):103-115.
[7]郭晗.人工智能培育中国经济发展新动能的理论逻辑与实践路径[J].西北大学学报(哲学社会科学版),2019(5):21-27.
[8]师博.人工智能助推经济高质量发展的机理诠释[J].改革,2020(1):30-38.
[9]任保平,宋文月.新一代人工智能和实体经济深度融合促进高质量发展的效应与路径[J].西北大学学报(哲学社会科学版),2019(5):6-13.
[10]罗以洪.大数据人工智能区块链等ICT促进数字经济高质量发展机理探析[J].贵州社会科学,2019(12):122-132.
[11]赵春江:加快数字技术应用于农业农村[N].农民日报,2020-12-19(03).
[12]张勋,万广华,张佳佳,等.数字经济、普惠金融与包容性增长[J].经济研究,2019(8):71-86.
[13]赫尔南多·德·索托.资本的秘密[M].于海生,译.北京:华夏出版社,2012.
[14]邱泽奇,张樹沁,刘世定,等.从数字鸿沟到红利差异——互联网资本的视角[J].中国社会科学,2016(10):93-115,203-204.
[15][18]深圳市人工智能行业协会发布《2021人工智能发展白皮书》[EB/OL].(2021-05-28)[2021-06-20].https://www.sohu.com/a/469049593_121123919.
[16]《中国新一代人工智能发展报告2019》发布——我国人工智能论文发文量全球领先[EB/OL](.05-26)[2021-06-08].https://baijiahao.baidu.com/s?id=1634542618791206141&wfr=spider&for=pc.2019-
[17]《中国新一代人工智能发展报告2020》发布[EB/OL].(2020-10-22)[2021-06-14].https://baijiahao.baidu.com/s?id=1681229567542644309&wfr=spider&for=pc.
[19]《人工智能核心技术产业白皮书》发布[EB/OL].(2021-04-21)[2021-06-20].https://www.sohu.com/a/462167290_120056153.
[20]吴汉东.人工智能的数据垄断与反垄断法的时代使命[N].光明日报,2018-07-03(11).
[21]关于下架“滴滴出行”App的通报[EB/OL].(2021-07-04)[2021-07-11].http://www.cac.gov.cn/2021-07/04/c_1627016782176163.htm.
[22]关于下架“滴滴企业版”等25款App的通报[EB/OL].(2021-07-09)[2021-07-11].http://www.cac.gov.cn/2021-07/09/c_1627415870012872.htm.
[23]2020全球AI人才报告:全球AI人才突破47万,中国仅有2万[EB/OL].(2021-03-25)[2021-07-09].https://www.sohu.com/a/457292666_120129517.
[24]高煜.我国经济高质量发展中人工智能与制造业深度融合的智能化模式选择[J].西北大学学报(哲学社会科学版),2019(5):28-35.
方澳,中国社会科学院大学硕士研究生,研究方向为数字经济、政府政策。
郭朝先,方澳.人工智能促进经济高质量发展:机理、问题与对策[J/OL].广西社会科学:1-10[2021-07-26].http://kns.cnki.net/kcms/detail/45.1185.C.20210723.1327.002.html.
人工智能的伦理挑战与科学应对
【光明青年论坛】
编者按
2023年2月21日,中国外交部正式发布《全球安全倡议概念文件》,呼吁“加强人工智能等新兴科技领域国际安全治理,预防和管控潜在安全风险”。在中国式现代化进程中,人工智能的技术革新是助推我国科技创新的重要力量之一。作为最具代表性的颠覆性技术,人工智能在给人类社会带来潜在巨大发展红利的同时,其不确定性也会带来诸多全球性挑战,引发重大的伦理关切。习近平总书记高度关注人工智能等新兴科技的发展,强调要加快提升“人工智能安全等领域的治理能力”,“塑造科技向善的文化理念,让科技更好增进人类福祉”。为此,本版特组织几位青年学者围绕人工智能的伦理挑战与科学应对展开讨论,并邀请专家予以点评,以期引发学界的更多关注,为推动人工智能健康发展贡献智慧。
与谈人
彭家锋 中国人民大学哲学院博士生
虞昊 华东师范大学政治与国际关系学院博士生
邓玉龙 南京师范大学哲学系博士生
主持人
刘永谋 中国人民大学哲学院教授、国家发展与战略研究院研究员
1.机遇与挑战并存的人工智能
主持人:新技术革命方兴未艾,以人工智能等为代表的新兴科技快速发展,大大拓展了时间、空间和人们的认知范围,人类正在进入一个“人机物”相融合的万物智能互联时代。请具体谈谈人工智能给人类社会发展带来什么样的机遇?
彭家锋:人工智能、大数据、物联网、云计算等智能技术蓬勃兴起,对人类社会的方方面面产生深刻影响,推动整个社会逐步迈入智能社会。在此过程中,存在许多重大历史机遇需要我们把握。就技术治理而言,人工智能作为一种治理技术,正在助推社会治理的治理理念、治理方式、治理效能等方面的变革,将传统技术治理提升至智能化新阶段,呈现出“智能治理的综合”趋势。智能治理将全面提升社会公共治理的智能化水平,主要呈现出四个方面的特征:一是治理融合化,即促进各种智能技术与其他治理技术相互融合,大幅度提升智能社会的治理水平;二是治理数据化,即以日益增长的海量数据为基础,通过对数据映射出来的“数字世界”进行社会计算,实现治理目标;三是治理精准化,即发挥智能技术强大的感知能力、传输能力和计算能力,将传统的粗放治理转变为精准治理;四是治理算法化,即不断完善智能决策系统,尝试将程序化的算法决策扩展到更多的决策活动中,从而提高决策质量。
虞昊:人工智能有助于反思人类社会得以建立与发展的基础。随着分析式AI向着生成式AI不断演变,尤其是生成式AI初步展现出判别问题、分析情感、展开对话、创作内容等越来越具有人类特征的功能,原本属于人类的领域正被人工智能以另一套由“0”与“1”构成的计算机语言逐步侵蚀。这既是对人类社会的冲击,也势必会在更加平等的开放性框架中增强人类的主体性,促进人类社会进一步发展。
邓玉龙:总体来说,以人工智能为代表的新科技发展,显著提升了社会生产力。例如,生成式AI不但能完成传统AI的分析、判断工作,还能进一步学习并完成分析式AI无法从事的创造性工作。从人机交互的角度来看,人工智能也促进了生产关系的高效发展。具体表现在:一是刺激劳动形态的转化。人工智能高效承担大量的基础机械性劳动,人类劳动则向高阶的创造性劳动转化,由此引发社会层面的劳动结构转型、升级,并且以人工智能为中介,社会范围内的劳动整合、协调能力也实现升级。二是促进劳动场域的重构。随着劳动形态的转化和劳动的社会化扩展,人工智能将劳动从固定场域中解放出来,人类劳动的灵活性增加。相比于创造性劳动,机械性劳动更加受到空间和时间的制约,而在人工智能从技术层面替代更低边际成本的基础性劳动之后,人类劳动空间和时间的自由性实现跃迁。三是对主体的发展提出了更高要求,尤其是对主体适应社会发展提出了更高要求。人工智能技术的发展对人类传统的知识结构提出挑战,要求人类更新原有的知识结构以适应社会发展需要,也对教育提出更高要求,教育模式和教育内容需要更契合科技发展的水平,培养更加全面发展的人才。
主持人:人工智能的一系列产物在给人们带来生活便利的同时,也一定程度上引起大家对其可能引发的伦理挑战的警惕。一些人关注人工智能的风险问题,对人工智能的推进有些焦虑。如何看待这种警惕和焦虑?
虞昊:人工智能的风险以及由此带来的焦虑,是完全可以理解的。但我们无法返回一个没有人工智能的世界,人工智能已然深度介入人类社会,试图遏制人工智能的推进只能是螳臂当车。同时我们对人工智能的发展也不能放任不管,无视甚至于压制人工智能的推进只能是掩耳盗铃。因此,我们应该正视这种焦虑,在发展人工智能的过程中探求解决方案,在人工智能带来的风险中寻求危中之机。
邓玉龙:我们应正确看待这种焦虑。要看到,焦虑有其积极的意义,它体现人类的忧患意识,催生对人工智能风险的预见性思考,提醒我们注意焦虑背后人工智能技术发展存在的问题。正确对待焦虑有助于积极采取措施防范风险,辩证分析焦虑中先见性的思考,通过社会治理模式的升级化解风险问题。同时,仅有焦虑和恐惧是不够的,更重要的是积极解决人工智能发展带来的社会问题。从劳动的角度看,人工智能确实会取代部分人类劳动,推动劳动结构转型升级,让劳动向着碎片化、个体化方向发展,劳动者处于弱势地位,面临着“机器换人”的挑战。但是我们也应该理性认识到,人工智能不是对人类劳动能力的完全替代,而是对劳动者提出了更高的要求,要求劳动者掌握科学知识,将技术的发展内化为自身能力,在更具创造性的劳动中实现自身价值。
彭家锋:任何技术的发明使用,不可避免地伴随着这样或那样的风险。人工智能技术自然也不例外,在其应用过程中,同样引发了诸如隐私泄露、算法歧视、法律责任等风险问题。因此,关注人工智能的风险问题,并由此对人工智能的推进产生焦虑,具有一定理论依据和现实基础。但更应当清醒地认识到,人工智能的某些相关风险可以提前得到规避,并不必然会发生;即便真的发生,也仍可不断寻求化解风险的有效手段。以个人隐私滥用风险为例,在治理过程中,虽然不可避免地会涉及个人数据收集和分析处理,但可以通过建立完整的规范和监管体系来保护个人隐私,降低滥用风险。
2.人工智能科技竞争的“伦理赛道”
主持人:习近平总书记在以视频方式出席二十国集团领导人第十五次峰会时指出,“中方支持围绕人工智能加强对话,倡议适时召开专题会议,推动落实二十国集团人工智能原则,引领全球人工智能健康发展”。请谈谈“人工智能原则”应包含哪些内容?科技向善的文化理念对推动全球人工智能健康发展具有怎样的现实价值?
彭家锋:为应对人工智能等新科技快速发展带来的伦理挑战,2022年,中共中央办公厅、国务院办公厅印发了《关于加强科技伦理治理的意见》,其中明确了“增进人类福祉”“尊重生命权利”“坚持公平公正”“合理控制风险”“保持公开透明”等五项科技伦理原则。我认为,这五项原则基本涵盖了人工智能原则的伦理要求,彰显了科技向善的文化理念。科技向善的文化理念,根本目标是让科技发展更好地服务社会和人民,带来良好社会或社会公益的善。科技向善对推动全球人工智能健康发展至少具有以下三个方面现实价值:一是塑造公众信任。公众对人工智能的信任很大程度上并不完全由相关风险程度决定,而是取决于公众的利益与价值是否得到足够重视。后者正是科技向善的内在要求。二是引领技术创新。科技向善的文化理念将在技术创新发展过程中发挥价值引领作用。三是促进全球合作。科技向善的文化理念试图在全球范围内建立人工智能伦理规范的“最大公约数”,各国在达成伦理共识的基础之上,能够建立互信,实现更加充分深入的国际合作。
虞昊:个人认为,人工智能原则也应包含非对抗与非失控的理念。非对抗意味着不应将人工智能视作人类社会的对抗性存在,人工智能已经成为人类社会的构成性要素,我们必须持更为开放的态度去面对人工智能。非失控意味着不应放弃对人工智能的伦理规范,应以智能的方式去规范加速发展的人工智能。如果以上述理念为前提,也就是说,在支持人工智能发展的情况下,科技向善的文化理念在推动全球人工智能健康发展中就变得极为重要。此处的“善”在国家治理层面即指向“善治”,而当人工智能的发展从国家范围扩展到全球范围,“善治”就在构建人类命运共同体的意义上拥有了更贴近现实的内涵。各国应摒弃冷战思维与零和博弈,基于善意与友谊共同思考人类作为整体如何在人工智能的冲击下通往全球性的“善治”。
邓玉龙:2019年欧盟发布《可信赖的人工智能伦理准则》,2021年中国国家新一代人工智能治理专业委员会发布《新一代人工智能伦理规范》(以下简称《规范》)。与欧盟发布的伦理准则相比,《规范》体现了中国特色社会主义的制度优势,旨在将伦理规范融入人工智能全生命周期。人工智能发展的根本目的是促进人的全面发展,因此,我以为,人工智能原则还应体现共享和有序发展的要求。共享,旨在防止人工智能的技术垄断。科技发展应该兼顾全体人民的利益,而不是服务于少数群体,由全体人民共享科技发展成果,推动全球科技水平的共同增长。有序发展,旨在防止人工智能技术的无序扩张。人工智能技术的发展最终是为了提升人的幸福感,推动科技有序发展能够促进人机和谐融合,有效预防潜在无序扩张的风险。
主持人:从规范层面来说,伦理反思对规范人工智能发展的作用主要体现在哪些方面?
彭家锋:近年来,世界各主要国家在人工智能领域竞争日趋激烈,纷纷将人工智能发展置于国家发展的战略层面。比如,美国陆续出台《国家人工智能研究和发展战略计划》(2016)和《关于维持美国在人工智能领域领导地位的行政命令》(2019);欧盟先后发布《欧洲人工智能战略》(2018)和《人工智能白皮书》(2020);中国也较早发布了《“互联网+”人工智能三年行动实施方案》(2016)和《新一代人工智能发展规划》(2017)。人工智能科技竞争的客观局面已然形成。在此背景下,如果忽视人工智能技术发展所带来的全球性风险与挑战,极有可能陷入技术赶超的竞争逻辑。因此,亟须规范人工智能的科技竞争,而倡导伦理反思或许就是一条可行之路。伦理反思的意义至少在于:一是设定伦理底线。人工智能技术的开发和应用需要遵循一些基本的价值理念和行为规范。只有守住伦理底线,才有可能避免颠覆性风险的发生。二是实现敏捷治理。伦理反思是一个动态、持续的过程,贯穿于人工智能科技活动的全生命周期。为了确保其始终服务于增进人类福祉和科技向善的初衷,需要保持应有的道德敏感性,以灵活、及时、有效的手段化解人工智能带来的各种伦理挑战,确保其在科技向善的道路上行稳致远,实现良性发展。
邓玉龙:人工智能科技竞争是为了促进科学技术发展,而科学技术发展的最终目的是推动人类社会的进步。人工智能科技竞争不应该仅包括技术竞争的单一维度,更不应该通过技术优势遏制他国的科技发展,而应该是在人工智能科技条件下的综合性竞争,通过良性竞争促进全球人工智能和全人类的共同发展。其中就应该包括社会治理竞争,通过社会治理保障社会公平,因而对社会中人与人关系的伦理反思构成人工智能科技竞争的有机组成部分。首先,伦理反思对人工智能科技竞争提出了更高的要求。人工智能的公平性、可信任性、可解释与透明度、安全性不仅是伦理要求,也代表了人工智能技术的发展方向,是人工智能科技竞争需要抢占的技术制高点。科技的发展是为了人的全面发展,因而人的发展内嵌于科技发展要求,伦理反思有助于防止工具主义的泛滥。其次,伦理反思为人工智能科技竞争提供价值引导。伦理反思注重保障人的权利,科技发展并不是社会发展中的唯一衡量因素,我们还应该关注其中多样性的因素,尤其注重保护特殊群体的利益,例如防止数据鸿沟等不良影响。伦理反思有助于实现人工智能的综合性健康发展。
3.人工智能安全与人的全面发展
主持人:科学探究一直以来都是人们认识世界和了解自身的重要认知方式,人工智能等信息产业的革命如何影响着人们的认知方式?
彭家锋:人工智能等信息产业的革命,促进了科学研究新范式——数据科学的诞生,进而对人们的认知方式产生深刻影响。数据科学被认为是继实验、理论和模拟之后的新的科研范式。相较于传统科学,数据科学融合了统计和计算思维,通过人工智能等技术提供的海量数据、强大算法和算力,能够直接从数据中寻找相关关系、提取相关性或者预测性知识,进而产生一种基于相关性的科学思维模式。但这种相关性并不一定能够转化为因果关系,因为可解释性对于从数据科学技术确定的相关性中提取因果解释至关重要,而相关技术一般都缺乏必要的透明度和可解释性。数据科学更可能成为一种预测科学,但是预测并不是科学追求的唯一目标。通过揭示世界的潜在因果结构来解释和干预现象,也是科学的两个重要目标。因此,尽管数据科学能够通过分析大量数据生成相关性知识,却不能直接产生因果解释。对此,传统科学的可检验性假设方法和因果规律探求仍有其重要价值。数据科学并非取代传统科学,相反,两者将相互补充,共同成为人类探索世界的有效工具。
虞昊:显而易见的是,随着人工智能向着通用人工智能迈进,其能够为人们提供的教育资源、生活娱乐、工作讯息也越来越丰富,人们势必越来越依赖于通过与人工智能进行交互来获取外界信息。因此,当人工智能深度地构成人们认知世界的滤镜时,若不对人工智能本身具有重复性、同质性倾向的认知框架保持警醒,人工智能可能扭曲人们的认知方式直至影响人的主体创造性。
邓玉龙:以人工智能为代表的全新技术发展被称为第四次工业革命,其中最显著的特征就是机器与人类的深度融合,机器不再作为一种外在性的工具被人类使用,而是在与人类的深度关联中影响人类的认知方式。一方面,信息产业革命丰富了人类认知的联结方式。人工智能和大数据技术的发展促进人类的分析逻辑从因果关系扩展为相关关系,对相关关系的重视使人工智能可以从大数据而非小数据维度获取信息,为人类认知提供新的视角。按照传统人类认知方式的理解,因果关系要求关于世界的认知是确定性的,而这在数字时代的复杂性社会中很难实现。人工智能对相关关系的认知填补了这一缺失,允许我们在无法掌握确定信息但在掌握大量数据的条件下对未来趋势作出预测。另一方面,如果我们对人工智能等科技的输出结果和生成内容盲目信赖,将结果和内容与经验事实之间进行绝对等同的连接,误认为是事实的全部,那么我们就会丧失人文主义抽象反思的能力,对此我们应当保持警惕,始终坚持反思和批判的人文精神。
主持人:如何调适人的主体创造性与信息高度集成共享之间的关系?
彭家锋:当人们逐渐将更多创造性工作交由人工智能完成,不免让人担忧人工智能是否将会威胁到人的主体创造性。从人机关系的角度来看,这种担忧是基于一种人机敌对论的视角,认为人工智能挤压了人的主体创造性空间,是替代逻辑的延续。但从人机协作的视角出发,将人工智能看作人的得力帮手,通过创造性地使用人工智能可以赋予人类更大的创造性空间。比如,在进行文字写作、多媒体脚本、程序代码、文稿翻译等工作时,可先由人工智能高水平地完成草稿工作,然后再由人类进行一些创造性的调整和发挥。此时人工智能生成的内容将成为进一步创作的原材料,人类将以更高的效率投入创造性活动之中。当然,要实现以上效果并非易事,不仅需要思想观念的转变,还应在制度安排、教育方式等方面作出相应调整。
虞昊:面对信息高度集成共享的人工智能,人有可能转变为算法的动物。试想下述场景:当依据人工智能展开行动变得足够便捷有效时,行动者便会倾向于采信人工智能,此时,看似是人类行动者基于自然语言在进行互动,实则是算法逻辑基于计算机语言在进行数字化运转。于是,人的主体创造性被侵蚀,人可能沦为算法动物。对此类情形,我们应该保持足够的清醒与警惕。
邓玉龙:人工智能技术生成的内容(AIGC)具有高度集成共享的特性,能够高效地对人类知识进行数据挖掘、信息生成。调适人的主体创造性与信息高度集成共享之间的关系,我们需做到如下几个方面:首先,需要通过人的创造性扩大AIGC数据库,当下AIGC主要是依赖于大语言模型,以大量的网络文本作为训练数据库生成的,通过人的创造性生成可以不局限于网络文本,而是进一步扩展数据库的训练文本,从而提高其丰富度。其次,需要通过人的创造性为AIGC提供价值训练,通过人的创造性生成的价值立场、伦理法则等与AIGC的训练数据库相融合,从而建构可信赖、可持续的信息高度集成共享机制。最后,需要将人创造性生成的内容与AIGC共同作为人类知识的来源,人类知识的获得不能仅仅局限于AIGC,而是需要人发挥其主体创造性对人工智能技术生成的内容进行反思和拓展,将人类无法被数据化的、经验性的知识与AIGC数据化的知识融合成为人类知识的来源。
(本版编辑张颖天整理)
传统人工智能中的三大问题
基于神经网络和大样本统计规律的深度学习越来越走入瓶颈,人工智能的发展越来越向基于符号推理和因果推理的传统人工智能回归。AI算法工程师不能把眼光仅仅局限在海量样本的统计规律上,而应该学习并掌握基于符号推理和小样本学习的传统人工智能技术。否则,当深度学习的热点一过,你很可能无法适应企业和市场对AI的新的需求。
本文介绍了传统人工智能要解决的三大问题:问题求解、博弈和谓词逻辑。它们都是基于符号推理和白盒推理的。了解相应的解决方案和算法有助于算法工程师开拓眼界,加深对算法本质的理解,增加解决问题、适应未来需求的能力。
1.传统人工智能的三大问题人工智能包括传统人工智能和现代人工智能两部分。机器学习、深度学习、遗传算法和强化学习是现代人工智能的主要分支。他们主要解决分类、回归、聚类、关联和生成等问题。而传统人工智能主要解决问题求解、博弈和谓词逻辑三大问题。
传统人工智能之所以重要是因为:
传统人工智能的算法比较成熟、可靠、有效。很多能够用传统人工智能解决的问题就不应该使用复杂且成本高昂的现代人工智能方法。比如求上海到北京之间的最短路径问题,用A*算法就要比深度神经元网络高效得多;传统人工智能更基础。很多应用场景中,现代人工智能方法必须在传统人工智能基础上发挥作用。比如战胜围棋世界冠军李世石的AlphaGo其基础部分仍然是博弈算法,而残差神经元网络(深度学习技术之一)只不过在评价棋局优劣时发挥了作用。作为一个算法工程师,如果你只懂深度学习不懂博弈算法,是很难编写出高效的围棋程序的;深度学习是基于黑盒推理的,往往知其然而不知其所以然。也就是说,它能解决问题,但是我们不知道它为什么能解决问题。而传统人工智能的各种算法一般都是基于白盒推理的,知其然更知其所以然;更重要的是,我们不能以“有没有用”为标准来评价传统人工智能。就像数学中某些当时看来“没有用”的理论和方法一样,当它“有用”时你再去研究它就迟了。2.问题求解2.1状态和状态转化这里的问题是指可以用状态来描述的,且起始状态和终止状态明确的问题。比如,八数码问题的一个可能的起始状态如下图所示:
在一个3*3的网格中随机放置了1-8八个数码。其中有一个网格是空着的。这个空网格可以跟上下左右四个方向的任何一个临近的数码交换。但不能跟斜方向上的数码交换。比如上图中空网格可以和右边的那个数码3相交换,得到的子状态就是:
八数码问题就是研究如何用最少的次数移动空网格,从而使得八个数码最终呈现出如下所示的终止状态:
2.2搜索树
问题求解的一个最简单的方法就是构造搜索树。方法是:
把初始状态看成是根结点,构成仅含有一个结点的搜索树T;任选T中的一个候选结点a,把它的所有可能的子结点都挂在a之下。这个过程称为对a的扩展。所谓候选结点就是没有被扩展过的结点;不断重复2)直到找到终止状态,或者没有候选结点为止。下图就是一个搜索树的例子(其中排除了重复的结点)。尽管上述算法并不能保证给出最少移动次数,甚至我们都不能保证它一定能终止(如果我们不排除重复结点的话),但是它仍然给出了问题求解算法的最基本框架。问题求解的各种算法(比如宽度优先、深度优先、爬山法、分支定界法和A*算法等)就是在这个框架基础上按照不同思路进行优化的结果。
比如宽度优先搜索,就是在算法的第2)步选择距离根结点最近的候选结点优先扩展。这个方法找到的第一个解一定也是最优解。所谓解就是从根结点到终止结点的一个路径。
所谓分支定界法就是在找到一个解之后,就把这个解的路径长度与以前找到的解的路径长度相比较,只保留路径短的那个。以后我们在扩展任何一个结点时,都要看看当前路径的长度是否短于解的路径长度。如果回答是“否“,则当前这个结点就没有必要扩展下去了。
至于其他更高明的算法,比如A*,这里就不再赘述。感兴趣的同学请关注方老师博客http://fanglin.blog.csdn.net。
与八数码问题类似的著名问题还有:
华容道问题:见上图,一个4*5的棋盘上有曹操、卒、马云、......大小不同的棋子。4个卒的大小都是1*1,黄忠、赵云、张飞和马超的大小是1*2,关羽的大小是2*1,曹操最大,大小是2*2。棋盘上还有两个1*1的空格以便棋子移动。游戏的目的是把曹操移到下方关口位置处,从而逃出华容道;八皇后问题:在8*8的国际象棋棋盘上(见下图)如何放置八个皇后使得任意两个皇后都不在同一行、同一列或者同一斜线上;求两个城市之间的最短路径问题;背包问题:给定有限个物品以及每个物品的重量以及价值,比如罐头200克6元,手机125克5000元,等等。另外再给你一个最大负重为2000克的背包。问在不超过最大负重的情况下应该在背包中放置哪些物品从而获得最大的价值?路径规划问题,怎样规划一个或者多个快递小哥的路径使得他们跑最少的路把一堆快递送到客户手中。这个问题还可以扩展到物流规划、船舶航运规划上。八皇后问题
解决这些问题的关键在于如何描述问题的状态以及父状态如何生成子状态。比如最短路径问题中,状态就可以用当前所在的城市表示。城市与城市之间有道路直接连通的就可以构成父子状态的转换。由于道路一般是双向的,则父子状态的转换也是双向的。
而背包问题的状态可以用背包里当前所拥有的所有物品的集合表示。所谓子状态就是往父状态背包里添加任意一个不超重的物品构成的。
3.博弈3.1博弈树我们通常所说的博弈其实是博弈的最简单形式,即信息全透明的封闭环境下的两人零和博弈。围棋、象棋、国际象棋等都是这样的博弈。而扑克、麻将、多人跳棋等就不是。以下除非特指,所谓博弈都是指这种两人零和博弈。
博弈要解决的问题是:当人类棋手下一步棋之后,电脑该如何应对呢?跟搜索树一样,博弈所采用算法也是从当前的根结点出发构建博弈树。以井字棋为例,井字棋是一种两人轮流在一个3*3的棋盘上下棋的游戏。目的是看谁先把自己的棋连成了一行、一列或者一条斜线。与中国的五子棋类似。以下是井字棋博弈树的部分结构:
井字棋的博弈树
与搜索树不同的是:
博弈树在扩展过程中,是双方轮流下棋的。而搜索树无需这样的考虑;搜索树通常要考虑从根结点到当前结点的耗费,而A*算法甚至还要考虑从当前结点到可能的终止结点的预期耗费。耗费越小越好。而博弈树通常只考虑当前状态对双方的价值。价值越大越好,价值也称为得分。得分可以小于0(这表示对对方有利);由于我们考虑的仅仅是两人零和博弈,所以当一个状态对一方的价值(或者说得分)是v的话,则同一个状态对另一方的价值就是-v;如果某个状态下,当前走棋的一方已经获胜的话(比如井字棋中己方有三个棋子已经连成一条线),则他的得分就是正无穷大或接近无穷大,而另一方的得分就是负无穷大或接近负无穷大;由于结点的数目会呈几何指数增加,所以博弈树和搜索树一样,都要解决组合爆炸问题。3.2简单博弈算法简单博弈算法主要思想是:
博弈树上所有结点的得分都相对于当前下棋的一方计算。正得分表示对他有利,负得分表示对对方有利;采用深度优先方法扩展候选结点。也就是说,优先扩展离根结点远的结点;为了避免组合爆炸,当博弈树的高度达到一定高度h时,就停止扩展。此时当前结点的得分采用估算法或者深度学习方法获得。这个问题下面还要谈;当一个结点的所有子结点的得分都确定之后,就可以确定该结点的得分。结点的得分总是等于所有子结点得分中最大得分的相反数。比如,假设所有子结点的得分分别是-3,12,7,-10,则当前结点的得分就是-12。这是因为,博弈算法假设对方是理性的,总是会走对他自己最有利的一步棋。而这一步的得分如果是v的话,对当前下棋的一方就是-v。因为是两人零和博弈嘛!有意思的是,这个方法也可以用来计算当前结点的父结点的得分。包括当前结点在内的所有兄弟节点中最大得分的相反数就是父结点的得分。所谓兄弟结点就是父结点相同的结点。这个过程可以不断地向上传播直到根结点;根结点的所有子结点中得分最大的那个就是计算机的解。假设下图是一个限高4层的博弈树,其中所有叶子结点的得分都已经估算出来了:
博弈树(叶子结点的得分已被估算出来)
我们的问题是:A、B、C三个结点中,电脑会选择哪个下棋呢?我们只需沿着叶子结点向上,一层一层计算各个结点的得分即可。记住:每个非叶子结点的得分等于其所有子结点中最大得分的相反数。下面是计算结果:
从叶子结点出发向上一层层计算得分
根据上述结果我们显然知道,电脑应该选择结点A作为自己的应对。
3.3估算得分可能有人会问,我怎么估算结点的得分呢?这要看你们下的是什么棋。如果是井字棋,一般来说正中间的那个位置特别重要,谁占据了那个位置应该给谁高分。给多少分您就自己看着办吧。如果是象棋,可以计算一下双方的剩余棋力,比如“车”给100分,“兵”给1分。然后以双方的棋力差作为得分。这个方法没有考虑棋子的位置。其他棋类游戏都可以以此类推。
值得一提的是,深度学习方法可以在估算得分时发挥重要作用。AlphaGo等就是采用这个方法解决了围棋的组合爆炸问题。由于这个问题比较复杂,并且超出了本文的讨论范围,这里不再赘述。有兴趣的读者可以参考我以后的文章。
3.4Alpha-Beta剪裁绝大多数博弈游戏都面临组合爆炸问题。即随着结点的指数级扩展,博弈树的规模很快就达到天文数字。围棋的博弈程序就是基于这个原因才长期得不到解决直到引入深度学习方法。
Alpha-Beta剪裁算法可以部分地解决这个问题。它的核心思想就是:如果当前结点的某个兄弟结点的得分是v,则当前结点的所有子结点的得分都必须小于-v。只要其中有一个子结点的得分大于或者等于-v,则当前结点及其以它为根结点的整个子树都可以从博弈树上删除。如下图:
Alpha-Beta剪裁示例
假设D的得分是4,E是D的兄弟结点。则E的子结点F和G的得分都必须小于-4。否则就应该把以E为根结点的子树从博弈树上删除。为什么呢?假设F的得分是-3,这意味着E和所有兄弟结点的最大得分至少是-3即:
max_value>=-3
前面我们讲过,E的得分应该等于-max_value。根据上面公式,我们得出E的得分必然小于等于3,从而小于D的得分4。这意味着我们根本就没有必要去扩展E的任何其他子结点了(比如G),因为即使扩展了G,E的得分也不会大于4。这就是Alpha-Beta剪裁的原理!
所以,使用Alpha-Beta剪裁算法时,博弈树的扩展常采用深度优先策略。这不仅更节省空间(因为没有必要保存整棵博弈树,只需把当前路径上的结点保存在一个堆栈中即可),更重要的是,深度优先策略有助于算法快速找到一个叶子结点,从而能把该结点的得分用来对相关结点进行剪裁。
关于Alpha-Beta剪裁的更多细节请关注方老师的博客。我在实践中使用这个方法实现了包括井字棋、五子棋、黑白棋等游戏的开发,证明了它的有效性。
4.谓词逻辑4.1命题、谓词和规则谓词逻辑主要研究如何进行逻辑推理。逻辑推理的基础是事实和规则。“张三和李四是朋友”,“太阳总是从东方升起”等就是事实。事实在谓词逻辑中是以命题的形式给出的。比如上述两个事实对应的命题分别是:
Is_Friend(“张三”,“李四”)
Rise_From(“Sun”,”Oriental”)
这里Is_Friends和Rise_From就是谓词,双引号扩起来的是字符串型逻辑常量。
规则形如:
If 条件 then 结论
其中条件和结论都是命题。比如:
IfIs_Friend(X,Y)thenIs_Friend(Y,X)
这个规则的含义是:如果X是Y的朋友,那么Y也是X的朋友。言下之意:朋友是相互的,不存在X是Y的朋友而Y却不是X朋友的情况。其中X和Y都是逻辑变量。
4.2逻辑运算和复合命题两个谓词之间可以用“and”或者“or”连接,分别表示“与”运算和“或”运算。比如,Is_Father(X,Y)andIs_Father(Y,Z)表示X是Y的父亲,Y是Z的父亲。这样由多个命题经过逻辑运算构成的命题称为复合命题。。
第三个逻辑运算是“not”,表示逻辑“非”操作。它是一个一元运算符。含义自明。
这样我们就可以用复合命题构成复杂的规则。比如:
IfIs_Father(X,Y)andIs_Father(Y,Z)thenIs_Grandpa(X,Z)
这个规则的意思是说:如果X是Y的父亲,Y是Z的父亲,则X是Z的爷爷。
4.3自动逻辑推理当我们把已知的命题和规则罗列在一起时,就能进行逻辑推理。逻辑推理的方法主要有两种,第一种是著名的三段式。比如,所有的猫都是哺乳动物,凯蒂是一只猫,所以凯蒂是哺乳动物。
第二种是利用规则进行反向推导。比如,假设我们想知道Tom的爷爷是谁。这实际上是求解命题Is_Grandpa(X, “Tom”)中X的值。怎么做呢?首先我们可以寻找所有结论是谓词Is_Grandpa的规则,这样的规则目前只有一条那就是:
IfIs_Father(X,Y)andIs_Father(Y,Z)thenIs_Grandpa(X,Z)
然后把Z=“Tom”代入其条件部分,则原命题Is_Grandpa(X, “Tom”)被替换为求解两个命题:
Is_Father(X,Y)andIs_Father(Y,“Tom”)
而求解这两个命题的方法是递归地调用上述步骤,直到所有命题都可以用三段式解决为止。
我们可以开发一个系统自动完成上述推理过程,这就是自动推理系统。事实上逻辑程序设计语言Prolog就是干这事的。如果你想自己开发一个这样的自动逻辑推理系统,你一定要注意:满足当前命题的规则可能不止一个,你应该在找到第一个答案前把所有可能的路径都走一遍而不是一旦一条路径走不通就下结论说原命题不成立。
递归显然不能满足这个要求,所以自动推理系统通常采用的是回溯法。如果你对如何构建自动推理系统感兴趣,请关注我以后的文章。
4.4高阶谓词逻辑我们前面所说的谓词逻辑实际是一阶谓词逻辑,也就是说,谓词的参数要么是变量,要么是常量。如果谓词的参数也是谓词,则这样的谓词就是二阶谓词。这已经超出了本文的讨论范围,本文不再赘述。
4.5谓词逻辑的应用谓词逻辑特别适合构建基于规则的专家系统、决策支持系统和规则系统。这与深度学习基于大量样本的黑盒推理完全不同。深度学习是从特殊(的样本)出发归纳出一般性的结论,谓词逻辑则是从一般性的规则出发推导出特殊情况下的结论,这是两个截然相反的过程。人脑就是这两个过程的完美结合体。
5.结束语本文简单介绍了传统人工智能的问题求解、博弈和谓词逻辑,目的是帮助非计算机专业的算法工程师开拓眼界增加认知的。要想了解更多的详情还需要你系统学习《人工智能》课程,或者关注我的博客。
人工智能的安全问题不容忽视
现在有很多技术可以欺骗人工智能,也有很多人工智能技术被用来欺骗人。在人工智能(AI)时代,安全问题不容忽视。
近几年,人工智能技术在很多领域都取得了初步的成功,无论是图像分类、视频监控领域的目标跟踪,还是自动驾驶、人脸识别、围棋等方面,都取得了非常好的进展。那么,人工智能技术到底安全不安全?事实上,目前的人工智能技术还存在很多问题。
人工智能并不安全
现在有很多技术可以欺骗人工智能,如在图片上加入一些对抗干扰。所谓对抗干扰,就是针对智能判别式模型的缺陷,设计算法精心构造与正常样本差异极小、能使模型错误识别的样本。如图1所示,本来是一幅手枪的图片,如果加入一些对抗干扰,识别结果就会产生错误,模型会识别为不是枪。在人的前面挂一块具有特定图案的牌子,就能使人在视频监控系统中“隐身”(见图2)。在自动驾驶场景下,如果对限速标识牌加一些扰动,就可以误导自动驾驶系统识别成“Stop”(见图3),显然这在交通上会引起很大的安全隐患。另一方面,人工智能的一些技术现在正在被滥用来欺骗人。例如,利用人工智能生成虚假内容,包括换脸视频、虚假新闻、虚假人脸、虚拟社交账户等。
图1被暴恐检测系统识别成正常图片
图2在智能监控下隐身
图3误导自动驾驶系统
不只在图片和视频领域,在语音识别领域也存在这样的安全隐患。例如,在语音中任意加入非常微小的干扰,语音识别系统也可能会把这段语音识别错。同样,在文本识别领域,只需要改变一个字母就可以使文本内容被错误分类。
除了对抗攻击这种攻击类型外,还有一种叫后门攻击的攻击类型。后门攻击是指向智能识别系统的训练数据安插后门,使其对特定信号敏感,并诱导其产生攻击者指定的错误行为。例如,我们在对机器进行训练时,在某一类的某些样本中插入一个后门模式,如给人的图像加上特定的眼镜作为后门,用一些训练上的技巧让机器人学习到眼镜与某个判断结果(如特定的一个名人)的关联。训练结束后,这个模型针对这样一个人还是能够做出正确的识别,但如果输入另一个人的图片,让他戴上特定的眼镜,他就会被识别成前面那个人。训练的时候,模型里留了一个后门,这同样也是安全隐患。
除了对抗样本、后门外,如果AI技术被滥用,还可能会形成一些新的安全隐患。例如,生成假的内容,但这不全都是人工智能生成的,也有人为生成的。此前,《深圳特区报》报道了深圳最美女孩给残疾乞丐喂饭,感动路人,人民网、新华社各大媒体都有报道。后来,人们深入挖掘,发现这个新闻是人为制造的。现在社交网络上有很多这样的例子,很多所谓的新闻其实是不真实的。一方面,人工智能可以发挥重要作用,可以检测新闻的真假;另一方面,人工智能也可以用来生成虚假内容,用智能算法生成一个根本不存在的人脸。
用人工智能技术生成虚假视频,尤其是使用视频换脸生成某个特定人的视频,有可能对社会稳定甚至国家安全造成威胁。例如,模仿领导人讲话可能就会欺骗社会大众。因此,生成技术是否需要一些鉴别手段或者相应的管理规范,这也是亟须探讨的。例如,生成虚假人脸,建立虚假的社交账户,让它与很多真实的人建立关联关系,甚至形成一些自动对话,看起来好像是一个真实人的账号,实际上完全是虚拟生成的。这样的情况该如何管理还需要我们进一步探索和研究。
人工智能安全隐患的技术剖析
针对AI的安全隐患,要找到防御的方法,首先要了解产生安全隐患的技术。以对抗样本生成为例,其主要分为2类:一类是白盒场景下对抗样本生成;另一类为黑盒场景下对抗样本生成。白盒场景的模型参数完全已知,可以访问模型中所有的参数,这个情况下攻击就会变得相对容易一些,只需要评估信息变化的方向对模型输出的影响,找到灵敏度最高的方向,相应地做出一些扰动干扰,就可以完成对模型的攻击。黑盒场景下攻击则相对较难,大部分实际情况下都是黑盒场景,我们依然可以对模型远程访问,输入样本,拿到检测结果,但无法获得模型里的参数。
现阶段的黑盒攻击可大致分为3类。第一类是基于迁移性的攻击方法,攻击者可以利用目标模型的输入信息和输出信息,训练出一个替换模型模拟目标模型的决策边界,并在替换模型中利用白盒攻击方法生成对抗样本,最后利用对抗样本的迁移性完成对目标模型的攻击。第二类是基于梯度估计的攻击方法,攻击者可以利用有限差分以及自然进化策略等方式来估计梯度信息,同时结合白盒攻击方法生成对抗样本。在自然进化策略中,攻击者可以以多个随机分布的单位向量作为搜索方向,并在这些搜索方向下最大化对抗目标的期望值。第三类是基于决策边界的攻击方法,通过启发式搜索策略搜索决策边界,再沿决策边界不断搜索距离原样本更近的对抗样本。
有攻击就有防御,针对对抗样本的检测,目前主要有3种手段。第一种,通过训练二分类器去分类样本是否受到干扰,但通用性会比较差。通常而言,训练一个分类器只能针对某一种特定的攻击算法,但在通常情况下并不知道别人使用哪一种攻击算法。第二种,训练去噪器。所谓的对抗干扰基本上都是样本中加入噪声,通过去噪对样本进行还原,从而实现防御。第三种,用对抗的手段提升模型的鲁棒性,在模型训练中加入对抗样本,模型面对对抗样本时会具有更强的鲁棒性,提高识别的成功率,但训练的复杂度较高。整体而言,这些方法都不很理想,我们亟须研究通用性强、效率高的对抗样本的防御方法。
针对换脸视频的生成,目前主流技术是基于自动编码器进行人脸图像重建。在模型训练阶段,所有的人脸图像使用同一个编码器,这个编码器的目标是学习捕捉人脸的关键特征。对于人脸重构,每个人的脸都有一个单独的解码器,这个解码器用于学习不同人的脸所具有的独特特征。利用训练后的编码器与解码器即可进行虚假人脸生成。
针对换脸视频的鉴别,目前主流技术是基于视觉瑕疵进行鉴别,这个假设是换脸视频具有不真实的情况。因此,可以对眨眼频率、头部姿态估计、光照估计、几何估计等提取特征,利用这些特征去判断人脸的图片或者视频的真假。
对抗攻防已取得一定研究成果
目前,我们在人工智能安全技术上加大了投入,围绕人工智能安全领域的问题开展了一些研究。
第一个工作是针对视频识别模型上的黑盒对抗攻击。在该工作中,我们利用对抗扰动的迁移性,将图像预训练模型中得到的扰动作为视频帧的初始扰动,并在此基础上利用自然进化策略对这些初始扰动噪声进行纠正。当我们得到针对视频域特殊纠正后的梯度信息后,采用投影梯度下降来对输入视频进行更新。该方法可以在黑盒场景下,对主流视频识别模型进行攻击,这也是全球在视频模型黑盒攻击上的第一个工作。我们实现的结果是在目标攻击情况下,需要3万至8万次查询就可以达到93%的攻击成功率,非目标攻击只需要数百个查询就可以完成对主流模型的攻击。目标攻击是指不仅让这个模型识别错,还要指定它把这个东西识别成什么,如把A的照片识别成B。非目标攻击是指只要识别错就可以了,识别成谁则不重要,如A的照片只要不识别成A就可以。
第二个工作是基于时空稀疏的视频对抗攻击。由于视频数据的维度很高,导致攻击算法的复杂度往往较高。对此,我们提出了基于时空稀疏的视频数据对抗攻击方法。时空稀疏是指在生成对抗扰动时,仅对特定帧的特定区域生成扰动,以此降低对抗扰动的搜索空间,提高攻击效率。在该工作中,为了实现时空稀疏,我们根据启发式规则衡量每个帧的重要性,选择视频帧的子集进行扰动;同时,在空间上我们选择指定帧的写入区域,如针对前景运动的人做一些干扰。以此实现高效的视频黑盒攻击。
第三个工作是针对视频识别模型进行后门攻击。针对后门攻击,之前的研究都集中于图像领域,且都是生成固定的棋盘格式的后门,这种方法在视频上的攻击成功率极低。对此,我们提出了一种针对视频数据的后门攻击方法。在该工作中,我们首先对视频数据进行后门生成,并将后门图案安插在视频中不显眼的角落,同时我们对原始视频其他内容施加一些对抗干扰,使得我们识别的模型更加侧重利用后门,以此得到污染数据,并用污染的数据替换原始数据集里对应的数据,实现后门攻击。该工作在公开数据集上取得了比较好的攻击结果,在很多类别上平均攻击成功率可以实现80%左右,远高于现有的基于图像数据的后门攻击方法。
技术对人工智能治理至关重要
未来,技术将在人工智能安全问题检测以及相应规则落实上发挥重要的作用。在保障模型安全方面,通过发展对抗攻防理论设计更加鲁棒的智能模型,确保智能系统在复杂环境下的安全运行,形成人工智能安全评估和管控能力。在隐私保护上,发展联邦学习及差分隐私等理论与技术,规范智能系统分析和使用数据的行为,保障数据所有者的隐私。针对智能系统决策的可解释性问题,发展机器学习可解释性理论与技术,提升智能算法决策流程的人类可理解性,建立可审查、可回溯、可推演的透明监管机制。在决策公平方面,可以利用统计学理论与技术,消除算法与数据中的歧视性偏差,构建无偏见的人工智能系统。最后,为了保证人工智能技术不被滥用,可以通过发展大数据计算与模式识别等理论与技术,预防、检测、监管智能技术被滥用的情况,创造有益于人类福祉的人工智能应用生态。
姜育刚,复旦大学教授、博士生导师,计算机科学技术学院院长、软件学院院长、上海视频技术与系统工程研究中心主任。
文/姜育刚
本文来自《张江科技评论》