博舍

下一代人工智能的发展方向 (上) 人工智能的发展方向包括人工智能云服务吗

下一代人工智能的发展方向 (上)

[[349500]]

尽管人工智能的诞生已经超过半个世纪,但近十年来人工智能领域发展非常迅速。自2012年ImageNet竞赛开始深度学习的现代时代以来,只有8年的时间。自那时以来,人工智能领域的进步令人震惊,现在人工智能已经深入我们日常工作生活的方方面面。

有专家表示,这个惊人的步伐只会越来越快。从现在开始的五年后,人工智能领域将与今天大不相同。当前被认为是最先进的方法将已经过时;今天刚刚出现或处于边缘的方法将成为主流。

下一代人工智能将是什么样子?哪种新颖的AI方法将释放当前在技术和业务方面难以想象的可能性?本文重点介绍了AI中的三个新兴领域,这些领域将在未来的几年中重新定义人工智能领域和社会。

1、无监督学习

当今AI世界中最主要的范例是有监督的学习。在监督学习中,AI模型从数据集中学习人类根据预定义类别进行策划和标记的过程。(术语“监督学习”源于人类“监督者”预先准备数据的事实。)

在过去的十年中,尽管从无人驾驶汽车到语音助手,有监督的学习已经推动了AI的显着进步,但它仍然存在严重的局限性。

手动标记成千上万个数据点的过程可能非常昂贵且繁琐。在机器学习模型提取数据之前,人们必须手动标记数据这一事实已成为AI的主要瓶颈。

在更深层次上,有监督的学习代表了一种狭窄的、受限制的学习形式。受监督的算法不仅无法探索和吸收给定数据集中的所有潜在信息、关系和含义,而且仅针对研究人员提前确定的概念和类别。

相反,无监督学习是一种AI方法,其中算法无需人工提供标签或指导即可从数据中学习。

许多AI领导者将无监督学习视为人工智能的下一个前沿领域。用AI传奇人物YannLeCun的话说:“下一场AI革命将不会受到监督。”加州大学伯克利分校的教授JitendaMalik更加生动地说:“标签是机器学习研究人员的鸦片。”

无监督学习如何工作?简而言之,系统会根据世界的其他部分来了解世界的某些部分。通过观察实体的行为,实体之间的模式以及实体之间的关系(例如,上下文中的单词或视频中的人物),系统引导了对其环境的整体理解。一些研究人员用“从其他事物中预测所有事物”来概括这一点。

无监督学习更紧密地反映了人类学习世界的方式:通过开放式探索和推理,不需要监督学习的“训练轮”。它的基本优点之一是,世界上总是会有比已标记数据多得多的未标记数据(前者更容易获得)。

用LeCun的话来说,他喜欢密切相关的术语“自我监督学习”:“在自我监督学习中,输入的一部分用作监视信号,以预测输入的其余部分。可以通过自我监督学习而不是[其他AI范式]来学习有关世界结构的知识,因为数据是无限的,每个示例提供的反馈量很大。”

无监督学习已经在自然语言处理中产生了变革性的影响。NLP得益于一种新的无监督的学习架构,即Transformer,最近取得了令人难以置信的进步,该架构始于Google大约三年前。(有关Transformer的更多信息,请参见下面的#3。)

将无监督学习应用于AI的其他领域的努力仍处于早期阶段,但是正在取得快速进展。举个例子,一家名为Helm.ai的初创公司正在寻求利用无监督学习来超越自动驾驶汽车行业的领导者。

许多研究人员将无监督学习视为开发人类级AI的关键。LeCun认为,掌握无监督学习是“未来几年ML和AI面临的最大挑战。”

 

 

2、联合学习

数字时代的主要挑战之一是数据隐私。由于数据是现代人工智能的命脉,因此数据隐私问题在AI的发展轨迹中扮演着重要的角色(并且常常是限制性的)。

保持隐私的人工智能(使AI模型能够从数据集中学习而不损害其隐私的方法)正变得日益重要。保持隐私的AI的最有前途的方法也许是联合学习。

联合学习的概念最早由Google的研究人员于2017年初提出。在过去的一年中,对联合学习的兴趣激增:到2020年的前六个月,发表了超过1,000篇有关联合学习的研究论文,而在2018年只有180篇。

如今,构建机器学习模型的标准方法是将所有训练数据收集到一个地方(通常在云中),然后在数据上训练模型。但是,这种方法对全球大部分数据都不可行,出于隐私和安全原因,这些数据无法移至中央数据存储库。这使其成为传统AI技术的禁区。

联合学习通过颠覆传统的AI方法解决了这个问题。

联合学习并不需要一个统一的数据集来训练模型,而是将数据保留在原处,并分布在边缘的众多设备和服务器上。取而代之的是,将模型的许多版本发送到一个带有训练数据的设备,每个模型都在每个数据子集上进行本地训练。然后将生成的模型参数(而不是训练数据本身)发送回云。当所有这些“微型模型”汇总在一起时,结果就是一个整体模型,其功能就像是一次在整个数据集上进行训练一样。

最初的联合学习用例是针对分布在数十亿移动设备上的个人数据训练AI模型。正如这些研究人员总结的那样:“现代移动设备可以访问大量适用于机器学习模型的数据...。但是,这些丰富的数据通常对隐私敏感,数量庞大或两者兼而有之,因此可能无法登录到数据中心....我们提倡一种替代方案,将训练数据保留在移动设备上,并通过汇总本地计算的更新来学习共享模型。”

最近,医疗保健已成为联合学习应用中特别有前途的领域。

不难理解原因。一方面,医疗保健中有大量有价值的AI用例。另一方面,医疗保健数据,尤其是患者的个人身份信息,非常敏感;像HIPAA这样的法规丛书限制了它的使用和移动。联合学习可以使研究人员能够开发挽救生命的医疗保健AI工具,而无需从源头转移敏感的健康记录或使它们暴露于隐私泄露中。

涌现了许多初创公司,以追求医疗保健领域的联合学习。最有名的是总部位于巴黎的Owkin;早期阶段的参与者包括Lynx.MD、FerrumHealth和SecureAILabs。

除医疗保健外,联合学习有一天可能会在任何涉及敏感数据的AI应用的开发中发挥中心作用:从金融服务到自动驾驶汽车,从政府用例到各种消费产品。与差分隐私和同态加密之类的其他隐私保护技术结合使用,联合学习可以提供释放AI巨大潜力的关键,同时减轻对数据隐私的棘手挑战。

如今,全球范围内颁布的数据隐私立法浪潮(从GDPR和CCPA开始,即将推出许多类似的法律)只会加速对这些隐私保护技术的需求。期望联合学习在未来几年中将成为AI技术堆栈的重要组成部分。

3、Transformer

我们已经进入了自然语言处理的黄金时代。

OpenAI发布的GPT-3是有史以来功能最强大的语言模型,今年夏天吸引了整个技术界。它为NLP设定了新的标准:它可以编写令人印象深刻的诗歌,生成有效的代码,撰写周到的业务备忘录,撰写有关自身的文章等等。

GPT-3只是一系列类似架构的NLP模型(Google的BERT、OpenAI的GPT-2、Facebook的RoBERTa等)中最新的(也是最大的),它们正在重新定义NLP的功能。

推动语言AI革命的关键技术突破是Transformer。

在2017年具有里程碑意义的研究论文中介绍了Transformer。以前,最新的NLP方法都基于循环神经网络(例如LSTM)。根据定义,递归神经网络按顺序显示数据,即按单词出现的顺序一次处理一个单词。

Transformer的一项伟大创新是使语言处理并行化:给定文本主体中的所有标记都是同时而不是按顺序分析的。为了支持这种并行化,Transformer严重依赖于称为注意力的AI机制。注意使模型能够考虑单词之间的关系,而不论它们之间有多远,并确定段落中的哪些单词和短语对于“注意”最为重要。

为什么并行化如此有价值?因为它使Transformers的计算效率大大高于RNN,这意味着可以在更大的数据集上对它们进行训练。GPT-3训练了大约5000亿个单词,由1750亿个参数组成,这使现有的RNN显得相形见绌。

迄今为止,由于GPT-3等的成功应用,Transformer几乎只与NLP相关联。但是就在本月,发布了一篇突破性的新论文,该论文成功地将Transformer应用于计算机视觉。许多AI研究人员认为,这项工作可以预示计算机视觉的新时代。(正如著名的ML研究人员OriolVinyals所说的那样,“我的观点是:告别卷积。”)

尽管像Google和Facebook这样的领先AI公司已经开始将基于Transformer的模型投入生产,但大多数组织仍处于将该技术产品化和商业化的初期阶段。OpenAI已宣布计划通过API将GPT-3进行商业访问,这可能会为在其上构建应用的整个初创企业生态系统注入种子。

 从自然语言开始,期望Transformers在未来的几年中将成为整个新一代AI功能的基础。过去十年在人工智能领域令人兴奋,但事实证明,这仅仅是未来十年的序幕。

 

人工智能产业发展现状与四大趋势

随着全球新一轮科技革命和产业变革孕育兴起,人工智能等数字技术加速演进,引领数字经济蓬勃发展,对各国科技、经济、社会等产生深远影响,已成为驱动新一轮科技革命和产业变革的重要力量。近年来,各国政府及相关组织持续加强人工智能战略布局,以人工智能为核心的集成化技术创新成为重点,人工智能相关技术产业化和商业化进程不断提速,正在加快与千行百业深度融合,其“头雁”效应得以充分发挥。此外,全球高度关注人工智能治理工作,发展安全可信人工智能已成为全球共识。

一人工智能的内涵与产业链

(一)人工智能的内涵

人工智能(ArtificialIntelligence)作为一门前沿交叉学科,与数学、计算机科学、控制科学、脑与认知科学、语言学等密切相关,自1956年首次提出以来,各方对其界定一直存在不同的观点。通过梳理不同研究机构和专家学者提出的相关概念,关于“人工智能”的内涵可总结如下:人工智能是指研究、模拟人类智能的理论、方法、技术及应用系统的一门技术科学,赋予机器模拟、延伸、扩展类人智能,实现会听、会看、会说、会思考、会学习、会行动等功能,本质是对人的意识和思想过程的模拟。

图1:人工智能内涵示意图

来源:火石创造根据公开资料绘制

(二)人工智能的发展历程

从1956年“人工智能”概念在达特茅斯会议上首次被提出至今,人工智能发展已经历经60余年,经历了三次发展浪潮。当前全球人工智能正处于第三次发展浪潮之中。

第一次浪潮(1956-1980年):训练机器逻辑推理能力。在1956年达特茅斯会议上,以“人工智能”概念被提出为标志,第一次发展浪潮正式掀起,该阶段的核心是:让计算机具备逻辑推理能力。这一时期内,开发出了计算机可以解决代数应用题、证明几何定理、学习和使用英语的程序,并且研发出第一款感知神经网络软件和聊天软件,这些初期的突破性进展让人工智能迎来发展史上的第一个高峰。但与此同时,受限于当时计算机的内存容量和处理速度,早期的人工智能大多是通过固定指令来执行特定问题,并不具备真正的学习能力。

第二次浪潮(1980-2006年):专家系统应用推广。1980年,以“专家系统”商业化兴起为标志,第二次发展浪潮正式掀起,该阶段的核心是:总结知识,并“教授”给计算机。这一时期内,解决特定领域问题的“专家系统”AI程序开始为全世界的公司所采纳,弥补了第一次发展浪潮中“早起人工智能大多是通过固定指令来执行特定问题”,使得AI变得实用起来,知识库系统和知识工程成为了80年代AI研究的主要方向,应用领域不断拓宽。

第三次浪潮(2006年至今):机器学习、深度学习、类脑计算提出。以2006年Hinton提出“深度学习”神经网络为标志,第三次发展浪潮正式掀起,该阶段的核心是实现从“不能用、不好用”到“可以用”的技术突破。与此前多次起落不同,第三次浪潮解决了人工智能的基础理论问题,受到互联网、云计算、5G通信、大数据等新兴技术不断崛起的影响,以及核心算法的突破、计算能力的提高和海量数据的支撑,人工智能领域的发展跨越了从科学理论与实际应用之间的“技术鸿沟”,迎来爆发式增长的新高潮。

图2:人工智能的三次发展浪潮

来源:火石创造根据公开资料绘制

(三)人工智能的产业链

人工智能产业链分为三层:基础层、技术层以及应用层。基础层涉及数据收集与运算,这是人工智能的发展基础,包括智能芯片、智能传感器、大数据与云计算等;技术层处理数据的挖掘、学习与智能处理,是连接基础层与应用层的桥梁,包括机器学习、类脑智能计算、计算机视觉、自然语言处理、智能语音、生物特征识别等;应用层是将人工智能技术与行业的融合发展的应用场景,包括智能机器人、智能终端、智慧城市、智能交通、智能制造、智能医疗、智能教育等。

图3:人工智能产业链

来源:火石创造根据公开资料绘制

二全球人工智能产业发展现状

(一)人工智能产业规模保持快速增长

近年来人工智能技术飞速发展,对人类社会的经济发展以及生产生活方式的变革产生重大影响。人工智能正全方位商业化,AI技术已在金融、医疗、制造、教育、安防等多个领域实现技术落地,应用场景也日益丰富。人工智能的广泛应用及商业化,加快推动了企业的数字化、产业链结构的优化以及信息利用效率的提升。全球范围内美国、欧盟、英国、日本、中国等国家和地区均大力支持人工智能产业发展,相关新兴应用不断落地。根据相关统计显示,全球人工智能产业规模已从2017年的6900亿美元增长至2021年的3万亿美元,并有望到2025年突破6万亿美元,2017-2025年有望以超30%的复合增长率快速增长。

图4:2017-2025年全球人工智能产业规模(单位:亿美元)

数据来源:火石创造根据公开资料整理

(二)全球主要经济体争相布局,中美两国占据领先位置

人工智能作为引领未来的战略性技术,目前全球主要经济体都将人工智能作为提升国家竞争力、维护国家安全的重大战略。美国处于全球人工智能领导者地位,中国紧随其后,欧洲的英国、德国、法国,亚洲的日本、韩国,北美的加拿大等国也具有较好的基础。从全球各国人工智能企业数量来看,美国人工智能企业数量在全球占比达到41%,中国占比为22%,英国为11%,以上三个国家的人工智能企业数量合计占到全球的七成以上。

图5:全球人工智能企业数量分布

数据来源:中国信通院,火石创造整理

(三)公共数据集不断丰富,关键平台逐步形成

全球数据流量持续快速增长,为深度学习所需要的海量数据提供良好基础。商业化数据产业发展迅速,为企业提供海量图片、语音等数据资源和相关服务。公共数据集为创新创业和行业竞争提供优质数据,也为初创企业的发展带来必不可少的资源。优势企业例如Google、亚马逊、Facebook等都加快部署机器学习、深度学习底层平台,建立产业事实标准。目前业内已有近40个各类AI学习框架,生态竞争十分激烈。中国的代表企业如科大讯飞、商汤科技利用技术优势建设开放技术平台,为开发者提供AI开发环境,建设上层应用生态。

(四)人工智能技术飞速发展,应用持续深入

近十年来,得益于深度学习等算法的突破、算力的不断提升以及海量数据的持续积累,人工智能真正大范围地从实验室研究走向产业实践。以深度学习为代表的算法爆发拉开了人工智能浪潮的序幕,在计算机视觉、智能语音、自然语言处理等领域广泛应用,相继超过人类识别水平。人工智能与云计算、大数据等支撑技术的融合不断深入,围绕着数据处理、模型训练、部署运营和安全监测等各环节的工具链不断丰富。工程化能力持续增强,人工智能的落地应用和产品交付更加便捷高效。AI在医疗、制造、自动驾驶、安防、消杀等领域的应用持续深入,特别是新冠疫情以来,社会的数字化、智能化转型不断提速,进一步推动人工智能应用迈入快车道。

三全球人工智能产业发展趋势

(一)算法、算力和数据作为人工智能产业的底层支撑,仍是全球新一代人工智能产业的核心引擎

算法、算力和数据被全球公认为是人工智能发展的三驾马车,也是推动人工智能发展的重要基础。在算力层面,单点算力持续提升,算力定制化、多元化成为重要发展趋势;计算技术围绕数据处理、数据存储、数据交互三大能力要素演进升级,类脑芯片、量子计算等方向持续探索智能芯片的技术架构由通用类芯片发展为全定制化芯片,技术创新带来的蓝海市场吸引了大量的巨头企业和初创企业进入产业。在算法层面,Cafe框架?CNTK框架等分别针对不同新兴人工智能算法模型进行收集整合,可以大幅度提高算法开发的场景适用性,人工智能算法从RNN、LSTM到CNN过渡到GAN和BERT还有GPT-3等,不断涌现的新兴学习算法将在主流机器学习算法模型库中得到更高效的实现。在数据层面,以深度学习为代表的人工智能技术需要大量的标注数据,催生了专业的技术服务,数据服务进入深度定制化阶段。

(二)全球新兴技术持续孕育涌现,以人工智能为核心的集成化技术创新成为重点

随着全球虚拟现实、超高清视频、新兴汽车电子等新技术、新产品将不断孕育涌现,并与人工智能加速交叉集成,推动生产生活方式和社会治理方式智能化变革的经济形态;与此同时,人工智能与5G、云计算、大数据、工业互联网、物联网、混合现实(MR)、量子计算、区块链、边缘计算等新一代信息技术互为支撑。这意味着以交叉融合为特征的集成化创新渐成主流,多种新兴技术交叉集成的价值将使人工智能发挥更大社会经济价值。例如:人工智能与汽车电子领域加速融合,实现感知、决策、控制等专用功能模块,推动形成自动驾驶、驾驶辅助、人车交互、服务娱乐应用系统;人工智能与虚拟现实技术相结合,为生产制造、家装等提供工具,并为虚拟制造、智能驾驶、模拟医疗、教育培训、影视娱乐等提供场景丰富、互动及时的平台环境等。

(三)新基建春风与场景赋能双轮驱动,全球泛在智能时代加速来临

在新冠肺炎疫情成为全球发展“新常态”背景下,全球主要经济体均面临经济社会创新发展和转型升级挑战,对人工智能的运用需求愈加迫切,纷纷推动人工智能与实体经济加速融合,助力实现新常态下产业转型升级。一方面,全球大力布局智能化基础设施建设和传统基础设施智能化升级,推动网络泛在、数据泛在和应用需求泛在的万物互联生态加速实现,为人工智能的应用场景向更多行业、更多领域、更多环节、更多层面拓展奠定基础;另一方面,AI应用场景建设成为国内外关注和紧抓的关键举措,面向医疗健康、金融、供应链交通、制造、家居、轨道交通等重点应用领域,积极构建符合本地优势和发展特点的人工智能深度应用场景,探索智能制造、智能物流、智能农业、智慧旅游、智能医疗、智慧城市等模式创新和业态创新,同时典型场景建设也吸引了全球资本市场的重点关注,泛在化智能经济发展时代即将到来。

(四)全球高度关注人工智能治理工作,发展安全可信人工智能已成为全球共识

随着全球人工智能发展步入蓬勃发展阶段,人工智能深入赋能引发的挑战与风险广受关注,并在全球范围内掀起了人工治理浪潮。2019年6月,二十国集团(G20)批准了倡导人工智能使用和研发“尊重法律原则、人权和民主价值观”的《G20人工智能原则》,成为人工智能治理方面的首个政府间国际公约,发展安全可信的人工智能已经成为全球共识。此后,全球各国纷纷加速完善人工智能治理相关规则体系,聚焦自动驾驶、智慧医疗和人脸识别等重点领域出台分级分类的监管措施,推动人工治理从以“软法”为导向的社会规范体系,向以“硬法”为保障的风险防控制度体系转变。与此同时,面向人工智能治理体系建设和打造安全可信生态的相关需求,围绕着安全性、稳定性、可解释性、隐私保护、公平性等方面的可信人工智能研究持续升温,其理念逐步贯彻到人工智能的全生命周期之中,基于模糊理论的相关测试技术、AI结合隐私计算技术、引入公平决策量化指标的算法模型等新技术陆续涌现,产业实践不断丰富,已经演变为落实人工智能治理相关要求的重要方法论。

       原文标题 : 全球视野下人工智能产业发展现状与四大趋势

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇