人工智能的创新发展与社会影响
党的十八大以来,习近平总书记把创新摆在国家发展全局的核心位置,高度重视人工智能发展,多次谈及人工智能的重要性,为人工智能如何赋能新时代指明了方向。2018世界人工智能大会9月17日在上海开幕,习总书记致信祝贺并强调指出人工智能发展应用将有力提高经济社会发展智能化水平,有效增强公共服务和城市管理能力。深入学习领会习总书记关于人工智能的一系列重要论述,务实推进我国《新一代人工智能发展规划》,有效规避人工智能“鸿沟”,着力收获人工智能“红利”,对建设世界科技强国、实现“两个一百年”的奋斗目标具有重大战略意义。
一、引言
1956年人工智能(ArtificialIntelligence,简称AI)的概念被正式提出,标志着人工智能学科的诞生,其发展目标是赋予机器类人的感知、学习、思考、决策和行动等能力。经过60多年的发展,人工智能已取得突破性进展,在经济社会各领域开始得到广泛应用并形成引领新一轮产业变革之势,推动人类社会进入智能化时代。美国、日本、德国、英国、法国、俄罗斯等国家都制定了发展人工智能的国家战略,我国也于2017年发布了《新一代人工智能发展规划》,发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏等地政府也相继出台推动人工智能发展的相关政策文件,社会各界对人工智能的重大战略意义已形成广泛共识。
跟其他高科技一样,人工智能也是一把双刃剑。如何认识人工智能的社会影响,也有“天使派”和“魔鬼派”之分。“天使派”认为,人工智能领域的科技创新和成果应用取得重大突破,有望引领第四次工业革命,对社会、经济、军事等领域将产生变革性影响,在制造、交通、教育、医疗、服务等方面可以造福人类;“魔鬼派”认为,人工智能是人类的重大威胁,比核武器还危险,有可能引发第三次世界大战。2018年2月,牛津大学、剑桥大学和OpenAI公司等14家机构共同发布题为《人工智能的恶意使用:预测、预防和缓解》的报告,指出人工智能可能给人类社会带来数字安全、物理安全和政治安全等潜在威胁,并给出了一些建议来减少风险。
总体上看,已过花甲之年的人工智能当前的发展具有“四新”特征:以深度学习为代表的人工智能核心技术取得新突破、“智能+”模式的普适应用为经济社会发展注入新动能、人工智能成为世界各国竞相战略布局的新高地、人工智能的广泛应用给人类社会带来法律法规、道德伦理、社会治理等方面一系列的新挑战。因此人工智能这个机遇与挑战并存的新课题引起了全球范围内的广泛关注和高度重视。虽然人工智能未来的创新发展还存在不确定性,但是大家普遍认可人工智能的蓬勃兴起将带来新的社会文明,将推动产业变革,将深刻改变人们的生产生活方式,将是一场影响深远的科技革命。
为了客观认识人工智能的本质内涵和创新发展,本报告在简要介绍人工智能基本概念与发展历程的基础上,着重分析探讨人工智能的发展现状和未来趋势,试图揭示人工智能的真实面貌。很显然,在当下人工智能蓬勃发展的历史浪潮中如何选择中国路径特别值得我们深入思考和探讨。因此,本报告最后就我国人工智能发展态势、存在问题和对策建议也进行了阐述。
二、人工智能的发展历程与启示
1956年夏,麦卡锡(JohnMcCarthy)、明斯基(MarvinMinsky)、罗切斯特(NathanielRochester)和香农(ClaudeShannon)等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能”这一概念,标志着人工智能学科的诞生。人工智能的目标是模拟、延伸和扩展人类智能,探寻智能本质,发展类人智能机器。人工智能充满未知的探索道路曲折起伏,如何描述1956年以来60余年的人工智能发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能60余年的发展历程划分为以下6个阶段:
一是起步发展期:1956年-20世纪60年代初。人工智能概念在1956年首次被提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序、LISP表处理语言等,掀起了人工智能发展的第一个高潮。
二是反思发展期:60年代-70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入了低谷。
三是应用发展期:70年代初-80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入了应用发展的新高潮。
四是低迷发展期:80年代中-90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
五是稳步发展期:90年代中-2010年。由于网络技术特别是互联网技术的发展,信息与数据的汇聚不断加速,互联网应用的不断普及加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年IBM深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念,这些都是这一时期的标志性事件。
六是蓬勃发展期:2011年-至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器(GraphicsProcessingUnit,简称GPU)等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越科学与应用之间的“技术鸿沟”,图像分类、语音识别、知识问答、人机对弈、无人驾驶等具有广阔应用前景的人工智能技术突破了从“不能用、不好用”到“可以用”的技术瓶颈,人工智能发展进入爆发式增长的新高潮。
通过总结人工智能发展历程中的经验和教训,我们可以得到以下启示:
(一)尊重学科发展规律是推动学科健康发展的前提。科学技术的发展有其自身的规律,顺其者昌,违其者衰。人工智能学科发展需要基础理论、数据资源、计算平台、应用场景的协同驱动,当条件不具备时很难实现重大突破。
(二)基础研究是学科可持续发展的基石。加拿大多伦多大学杰弗里·辛顿(GeoffreyHinton)教授坚持研究深度神经网络30年,奠定人工智能蓬勃发展的重要理论基础。谷歌的DeepMind团队长期深入研究神经科学启发的人工智能等基础问题,取得了阿尔法狗等一系列重大成果。
(三)应用需求是科技创新的不竭之源。引领学科发展的动力主要来自于科学和需求的双轮驱动。人工智能发展的驱动力除了知识与技术体系内在矛盾外,贴近应用、解决用户需求是创新的最大源泉与动力。比如专家系统人工智能实现了从理论研究走向实际应用的突破,近些年来安防监控、身份识别、无人驾驶、互联网和物联网大数据分析等实际应用需求带动了人工智能的技术突破。
(四)学科交叉是创新突破的“捷径”。人工智能研究涉及信息科学、脑科学、心理科学等,上世纪50年代人工智能的出现本身就是学科交叉的结果。特别是脑认知科学与人工智能的成功结合,带来了人工智能神经网络几十年的持久发展。智能本源、意识本质等一些基本科学问题正在孕育重大突破,对人工智能学科发展具有重要促进作用。
(五)宽容失败应是支持创新的题中应有之义。任何学科的发展都不可能一帆风顺,任何创新目标的实现都不会一蹴而就。人工智能60余载的发展生动地诠释了一门学科创新发展起伏曲折的历程。可以说没有过去发展历程中的“寒冬”就没有今天人工智能发展新的春天。
(六)实事求是设定发展目标是制定学科发展规划的基本原则。达到全方位类人水平的机器智能是人工智能学科宏伟的终极目标,但是需要根据科技和经济社会发展水平来设定合理的阶段性研究目标,否则会有挫败感从而影响学科发展,人工智能发展过程中的几次低谷皆因不切实际的发展目标所致。
三、人工智能的发展现状与影响
人工智能经过60多年的发展,理论、技术和应用都取得了重要突破,已成为推动新一轮科技和产业革命的驱动力,深刻影响世界经济、政治、军事和社会发展,日益得到各国政府、产业界和学术界的高度关注。从技术维度来看,人工智能技术突破集中在专用智能,但是通用智能发展水平仍处于起步阶段;从产业维度来看,人工智能创新创业如火如荼,技术和商业生态已见雏形;从社会维度来看,世界主要国家纷纷将人工智能上升为国家战略,人工智能社会影响日益凸显。
(一)专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定领域的人工智能技术(即专用人工智能)由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,因此形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域,统计学习是专用人工智能走向实用的理论基础。深度学习、强化学习、对抗学习等统计机器学习理论在计算机视觉、语音识别、自然语言理解、人机博弈等方面取得成功应用。例如,阿尔法狗在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,语音识别系统5.1%的错误率比肩专业速记员,人工智能系统诊断皮肤癌达到专业医生水平,等等。
(二)通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。虽然包括图像识别、语音识别、自动驾驶等在内的专用人工智能领域已取得突破性进展,但是通用智能系统的研究与应用仍然是任重而道远,人工智能总体发展水平仍处于起步阶段。美国国防高级研究计划局(DefenseAdvancedResearchProjectsAgency,简称DARPA)把人工智能发展分为三个阶段:规则智能、统计智能和自主智能,认为当前国际主流人工智能水平仍然处于第二阶段,核心技术依赖于深度学习、强化学习、对抗学习等统计机器学习,AI系统在信息感知(Perceiving)、机器学习(Learning)等智能水平维度进步显著,但是在概念抽象(Abstracting)和推理决策(Reasoning)等方面能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。
(三)人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,在其2017年的年度开发者大会上,谷歌明确提出发展战略从“MobileFirst”(移动优先)转向“AIFirst”(AI优先);微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿,麦肯锡报告2016年全球人工智能研发投入超300亿美元并处于高速增长,全球知名风投调研机构CBInsights报告显示2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。
(四)创新生态布局成为人工智能产业发展的战略高地。信息技术(IT)和产业的发展史就是新老IT巨头抢滩布局IT创新生态的更替史。例如,传统信息产业IT(InformationTechnology)代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网IT(InternetTechnology)代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等,目前智能科技IT(IntelligentTechnology)的产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动AI技术生态的研发布局,全力抢占人工智能相关产业的制高点。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理GPU服务器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。在技术生态方面,人工智能算法、数据、图形处理器(GraphicsProcessingUnit,简称GPU)/张量处理器(TensorProcessingUnit,简称TPU)/神经网络处理器(NeuralnetworkProcessingUnit,NPU)计算、运行/编译/管理等基础软件已有大量开源资源,例如谷歌的TensorFlow第二代人工智能学习系统、脸书的PyTorch深度学习框架、微软的DMTK分布式学习工具包、IBM的SystemML开源机器学习系统等;此外谷歌、IBM、英伟达、英特尔、苹果、华为、中国科学院等积极布局人工智能领域的计算芯片。在人工智能商业和应用生态布局方面,“智能+X”成为创新范式,例如“智能+制造”、“智能+医疗”、“智能+安防”等,人工智能技术向创新性的消费场景和不同行业快速渗透融合并重塑整个社会发展,这是人工智能作为第四次技术革命关键驱动力的最主要表现方式。人工智能商业生态竞争进入白热化,例如智能驾驶汽车领域的参与者既有通用、福特、奔驰、丰田等传统龙头车企,又有互联网造车者如谷歌、特斯拉、优步、苹果、百度等新贵。
(五)人工智能上升为世界主要国家的重大发展战略。人工智能正在成为新一轮产业变革的引擎,必将深刻影响国际产业竞争格局和一个国家的国际竞争力。世界主要发达国家纷纷把发展人工智能作为提升国际竞争力、维护国家安全的重大战略,加紧积极谋划政策,围绕核心技术、顶尖人才、标准规范等强化部署,力图在新一轮国际科技竞争中掌握主导权。无论是德国的“工业4.0”、美国的“工业互联网”、日本的“超智能社会”、还是我国的“中国制造2025”等重大国家战略,人工智能都是其中的核心关键技术。2017年7月,国务院发布了《新一代人工智能发展规划》,开启了我国人工智能快速创新发展的新征程。
(六)人工智能的社会影响日益凸显。人工智能的社会影响是多元的,既有拉动经济、服务民生、造福社会的正面效应,又可能出现安全失控、法律失准、道德失范、伦理失常、隐私失密等社会问题,以及利用人工智能热点进行投机炒作从而存在泡沫风险。首先,人工智能作为新一轮科技革命和产业变革的核心力量,促进社会生产力的整体跃升,推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域发展积极正面影响。与此同时,我们也要看到人工智能引发的法律、伦理等问题日益凸显,对当下的社会秩序及公共管理体制带来了前所未有的新挑战。例如,2016年欧盟委员会法律事务委员会提交一项将最先进的自动化机器人身份定位为“电子人(electronicpersons)”的动议,2017年沙特阿拉伯授予机器人“索菲亚”公民身份,这些显然冲击了传统的民事主体制度。那么,是否应该赋予人工智能系统法律主体资格?另外在人工智能新时代,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题都需要我们从法律法规、道德伦理、社会管理等多个角度提供解决方案。
由于人工智能与人类智能密切关联且应用前景广阔、专业性很强,容易造成人们的误解,也带来了不少炒作。例如,有些人错误地认为人工智能就是机器学习(深度学习),人工智能与人类智能是零和博弈,人工智能已经达到5岁小孩的水平,人工智能系统的智能水平即将全面超越人类水平,30年内机器人将统治世界,人类将成为人工智能的奴隶,等等。这些错误认识会给人工智能的发展带来不利影响。还有不少人对人工智能预期过高,以为通用智能很快就能实现,只要给机器人发指令就可以干任何事。另外,有意炒作并通过包装人工智能概念来谋取不当利益的现象时有发生。因此,我们有义务向社会大众普及人工智能知识,引导政府、企业和广大民众科学客观地认识和了解人工智能。
四、人工智能的发展趋势与展望
人工智能经过六十多年的发展突破了算法、算力和算料(数据)等“三算”方面的制约因素,拓展了互联网、物联网等广阔应用场景,开始进入蓬勃发展的黄金时期。从技术维度看,当前人工智能处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有数据、能耗、泛化、可解释性、可靠性、安全性等诸多瓶颈,创新发展空间巨大,从专用到通用智能,从机器智能到人机智能融合,从“人工+智能”到自主智能,后深度学习的新理论体系正在酝酿;从产业和社会发展维度看,人工智能通过对经济和社会各领域渗透融合实现生产力和生产关系的变革,带动人类社会迈向新的文明,人类命运共同体将形成保障人工智能技术安全、可控、可靠发展的理性机制。总体而言,人工智能的春天刚刚开始,创新空间巨大,应用前景广阔。
(一)从专用智能到通用智能。如何实现从狭义或专用人工智能(也称弱人工智能,具备单一领域智能)向通用人工智能(也称强人工智能,具备多领域智能)的跨越式发展,既是下一代人工智能发展的必然趋势,也是国际研究与应用领域的挑战问题。2016年10月美国国家科学技术委员会发布了《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。DeepMind创始人戴密斯·哈萨比斯(DemisHassabis)提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年7月成立了通用人工智能实验室,100多位感知、学习、推理、自然语言理解等方面的科学家参与其中。
(二)从人工智能到人机混合智能。人工智能的一个重要研究方向就是借鉴脑科学和认知科学的研究成果,研究从智能产生机理和本质出发的新型智能计算模型与方法,实现具有脑神经信息处理机制和类人智能行为与智能水平的智能系统。在美国、欧盟、日本等国家和地区纷纷启动的脑计划中,类脑智能已成为核心目标之一。英国工程与自然科学研究理事会EPSRC发布并启动了类脑智能研究计划。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。人机混合智能得到了我国新一代人工智能规划、美国脑计划、脸书(脑机语音文本界面)、特斯拉汽车创始人埃隆·马斯克(人脑芯片嵌入和脑机接口)等的高度关注。
(三)从“人工+智能”到自主智能系统。当前人工智能的研究集中在深度学习,但是深度学习的局限是需要大量人工干预:人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据(非常费时费力)、用户需要人工适配智能系统等。因此已有科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类AI”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低AI人员成本。
(四)人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、材料等传统科学的发展。例如,2018年美国麻省理工学院启动的“智能探究计划”(MITIntelligenceQuest)就联合了五大学院进行协同攻关。
(五)人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来十年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,在现有基础上能够提高劳动生产率40%;美、日、英、德、法等12个发达国家(现占全球经济总量的一半)到2035年,年经济增长率平均可以翻一番。2018年麦肯锡的研究报告表明到2030年人工智能新增经济规模将达到13万亿美元。
(六)人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出未来五年人工智能提升各行业运转效率,其中教育业提升82%,零售业71%,制造业64%,金融业58%。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。
(七)人工智能领域的国际竞争将日趋激烈。“未来谁率先掌握人工智能,谁就能称霸世界”。2018年4月,欧盟委员会计划2018-2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略》重点推动物联网建设和人工智能的应用。世界军事强国已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即提出谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。
(八)人工智能的社会学将提上议程。水能载舟,亦能覆舟。任何高科技也都是一把双刃剑。随着人工智能的深入发展和应用的不断普及,其社会影响日益明显。人工智能应用得当、把握有度、管理规范,就能有效控制负面风险。为了确保人工智能的健康可持续发展并确保人工智能的发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,深入分析人工智能对未来经济社会发展的可能影响,制定完善的人工智能法律法规,规避可能风险,确保人工智能的正面效应。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。2018年4月,欧洲25个国家签署了《人工智能合作宣言》,从国家战略合作层面来推动人工智能发展,确保欧洲人工智能研发的竞争力,共同面对人工智能在社会、经济、伦理及法律等方面的机遇和挑战。
五、我国人工智能的发展态势与思考
我国当前人工智能发展的总体态势良好。中国信通院联合高德纳咨询公司(Gartner)于2018年9月发布的《2018世界人工智能产业发展蓝皮书》报告统计,我国(不含港澳台地区)人工智能企业总数位列全球第二(1040家),仅次于美国(2039家)。在人工智能总体水平和应用方面,我国也处于国际前列,发展潜力巨大,有望率先突破成为全球领跑者。但是我们也要清醒地看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。
一是高度重视。党和国家高度重视并大力发展人工智能。党的十八大以来,习近平总书记把创新摆在国家发展全局的核心位置,高度重视人工智能发展,多次谈及人工智能的重要性,为人工智能如何赋能新时代指明方向。2016年7月习总书记明确指出,人工智能技术的发展将深刻改变人类社会生活,改变世界,应抓住机遇,在这一高技术领域抢占先机。在党的十九大报告中,习总书记强调“要推动互联网、大数据、人工智能和实体经济深度融合”。在2018年两院院士大会上,习总书记再次强调要“推进互联网、大数据、人工智能同实体经济深度融合,做大做强数字经济”。在2017年和2018年的《政府工作报告》中,李克强总理都提到了要加强新一代人工智能发展。2017年7月,国务院发布了《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动,人工智能将成为今后一段时期的国家重大战略。发改委、工信部、科技部、教育部、中央网信办等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。
二是态势喜人。根据2017年爱思唯尔(Elsevier)文献数据库SCOPUS统计结果,我国在人工智能领域发表的论文数量已居世界第一。从2012年开始,我国在人工智能领域新增专利数量已经开始超越美国。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成全球人工智能投融资规模最大国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。近两年,清华大学、北京大学、中国科学院大学、浙江大学、上海交通大学、南京大学等高校纷纷成立人工智能学院。2015年开始的中国人工智能大会(CCAI)已连续成功召开四届、规模不断扩大,人工智能领域的教育、科研与学术活动层出不穷。
三是差距不小。我国人工智能在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在较大差距。英国牛津大学2018年的一项研究报告指出中国的人工智能发展能力大致为美国的一半水平。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,存在“头重脚轻”的不均衡现象。在Top700全球AI人才中,中国虽然名列第二,但入选人数远远低于占一半数量的美国。据领英《全球AI领域人才报告》统计,截至2017年一季度全球人工智能领域专业技术人才数量超过190万,其中美国超过85万,我国仅超过5万人,排名全球第7位。2018年市场研究顾问公司CompassIntelligence对全球100多家AI计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国制定完善人工智能相关法律法规的进程需要加快,对可能产生的社会影响还缺少深度分析。
四是前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出到2030年,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。
人类社会已开始迈入智能化时代,人工智能引领社会发展是大势所趋,不可逆转。经历六十余年积累后,人工智能开始进入爆发式增长的红利期。伴随着人工智能自身的创新发展和向经济社会的全面渗透,这个红利期将持续相当长的时期。现在是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧需要深入思考。
(一)树立理性务实的发展理念。围棋人机大战中阿尔法狗战胜李世石后,社会大众误以为人工智能已经无所不能,一些地方政府、社会企业、风险资金因此不切实际一窝蜂发展人工智能产业,一些别有用心的机构则有意炒作并通过包装人工智能概念来谋取不当利益。这种“一拥而上、一哄而散”的跟风行为不利于人工智能的健康可持续发展。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。根据高德纳咨询公司发布的技术发展曲线,当前智能机器人、认知专家顾问、机器学习、自动驾驶等人工智能热门技术与领域正处于期望膨胀期,但是通用人工智能及人工智能的整体发展仍处于初步阶段,人工智能还有很多“不能”,实现机器在任意现实环境的自主智能和通用智能仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此发展人工智能不能以短期牟利为目的,要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,并务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。
(二)加强基础扎实的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。在此发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。根据2017年爱思唯尔文献数据库SCOPUS统计结果,尽管我国在人工智能领域发表的论文数量已经排名世界第一,但加权引文影响力则只排名34位。为了客观评价我国在人工智能基础研究方面的整体实力,我们搜索了SCI期刊、神经信息处理系统大会(ConferenceonNeuralInformationProcessingSystems,简称NIPS)等主流人工智能学术会议关于通用智能、深度学习、类脑智能、脑智融合、人机博弈等关键词的论文统计情况,可以清楚看到在人工智能前沿方向中国与美国相比基础实力存在巨大差距:在高质量论文数量方面(按中科院划定的SCI一区论文标准统计),美国是中国的5.34倍(1325:248);在人才储备方面(SCI论文通讯作者),美国是中国的2.12倍(4804:2267)。
我国应对标国际最高水平,建设面向未来的人工智能基础科学研究中心,重点发展原创性、基础性、前瞻性、突破性的人工智能科学。应该鼓励科研人员瞄准人工智能学科前沿方向开展引领性原创科学研究,通过人工智能与脑认知、神经科学、心理学等学科的交叉融合,重点聚焦人工智能领域的重大基础性科学问题,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。
(三)构建自主可控的创新生态。美国谷歌、IBM、微软、脸书等企业在AI芯片、服务器、操作系统、开源算法、云服务、无人驾驶等方面积极构建创新生态、抢占创新高地,已经在国际人工智能产业格局中占据先机。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。美国对中兴通讯发禁令一事充分说明自主可控“核高基”技术的重要性,我国应该吸取在核心电子器件、高端通用芯片及基础软件方面依赖进口的教训,避免重蹈覆辙,着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如军民融合、产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。
另外,我们需要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过标准实施加速人工智能驱动经济社会转型升级的进程。
(四)建立协同高效的创新体系。我国经济社会转型升级对人工智能有重大需求,但是单一的创新主体很难实现政策、市场、技术、应用等方面的全面突破。目前我国学术界、产业界、行业部门在人工智能发展方面各自为政的倾向比较明显,数据资源开放共享不够,缺少对行业资源的有效整合。相比而言,美国已经形成了全社会、全场景、全生态协同互动的人工智能协同创新体系,军民融合和产学研结合都做得很好。我国应在体制机制方面进一步改革创新,建立“军、政、产、学、研、用”一体的人工智能协同创新体系。例如,国家进行顶层设计和战略规划,举全国优势力量设立军事智能的研发和应用平台,提供“人工智能+X”行业融合、打破行业壁垒和行政障碍的激励政策;科技龙头企业引领技术创新生态建设,突破人工智能的重大技术瓶颈;高校科研机构进行人才培养和原始创新,着力构建公共数据资源与技术平台,共同建设若干标杆性的应用创新场景,推动成熟人工智能技术在城市、医疗、金融、文化、农业、交通、能源、物流、制造、安全、服务、教育等领域的深度应用,建设低成本高效益广范围的普惠型智能社会。
(五)加快创新人才的教育培养。发展人工智能关键在人才,中高端人才短缺已经成为我国人工智能做大做强的主要瓶颈。另外,我国社会大众的人工智能科技素养也需要进一步提升,每一个人都需要去适应人工智能时代的科技浪潮。在加强人工智能领军人才培养引进的同时,要面向技术创新和产业发展多层次培养人工智能创新创业人才。《新一代人工智能发展规划》提出逐步开展全民智能教育项目,在中小学阶段设置人工智能课程。目前人工智能科普活动受到各地学校的欢迎,但是缺少通俗易懂的高质量人工智能科普教材、寓教于乐的实验设备和器材、开放共享的教学互动资源平台。国家相关部门应高度重视人工智能教育领域的基础性工作,增加投入,组织优势力量,加强高水平人工智能教育内容和资源平台建设,加快人工智能专业的教学师资培训,从教材、教具、教师等多个环节全面保障我国人工智能教育工作的开展。
(六)推动共担共享的全球治理。人工智能将重塑全球政治和经济格局,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能将进一步拉大发达国家和发展中国家的生产力发展水平差距。美国、日本、德国等通过人工智能和机器人的技术突破和广泛应用弥补他们的人力成本劣势,希望制造业从新兴国家回流发达国家。目前看,我国是发展中国家阵容中唯一有望成为全球人工智能竞争中的领跑者,应采取不同于一些国家的“经济垄断主义、技术保护主义、贸易霸凌主义”路线,尽快布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合国家“一带一路”战略,向亚洲、非洲、南美等经济欠发达地区输出高水平、低成本的“中国智造”成果、提供人工智能时代的中国方案,为让人工智能时代的“智能红利”普惠人类命运共同体做出中国贡献!
(七)制定科学合理的法律法规。要想实实在在收获人工智能带来的红利,首先应保证其安全、可控、可靠发展。美国和欧洲等发达国家和地区十分重视人工智能领域的法律法规问题。美国白宫多次组织这方面的研讨会、咨询会;特斯拉等产业巨头牵头成立OpenAI等机构,旨在以有利于整个人类的方式促进和发展友好的人工智能;科研人员自发签署23条“阿西洛马人工智能原则”,意图在规范人工智能科研及应用等方面抢占先机。我国在人工智能领域的法律法规制定及风险管控方面相对滞后,这种滞后局面与我国现阶段人工智能发展的整体形势不相适应,并可能成为我国人工智能下一步创新发展的一大掣肘。因此,有必要大力加强人工智能领域的立法研究,制定相应的法律法规,建立健全公开透明的人工智能监管体系,构建人工智能创新发展的良好法规环境。
(八)加强和鼓励人工智能社会学研究。人工智能的社会影响将是深远的、全方位的。我们当未雨绸缪,从国家安全、社会治理、就业结构、伦理道德、隐私保护等多个维度系统深入研究人工智能可能的影响,制定合理可行的应对措施,确保人工智能的正面效应。应大力加强人工智能领域的科普工作,打造科技与伦理的高效对话机制和沟通平台,消除社会大众对人工智能的误解与恐慌,为人工智能的发展营造理性务实、积极健康的社会氛围。
六、结束语
人工智能经过60多年的发展,进入了创新突破的战略机遇期和产业应用的红利收获期,必将对生产力和产业结构以及国际格局产生革命性影响,并推动人类进入普惠型智能社会。但是,我们需要清醒看到通用人工智能及人工智能的整体发展仍处于初级阶段,人工智能不是万能,人工智能还有很多“不能”。我们应当采取理性务实的发展路径,扎实推进基础研究、技术生态、人才培养、法律规范等方面的工作,在开放中创新,在创新中发展,全速跑赢智能时代,着力建设人工智能科技强国!
(主讲人系中国科学院院士)
人工智能如何影响五大科技巨头还有哪些公司会成为赢家
·苹果的策略:聪明的公司试图将其产品的补充品商品化;亚马逊的前景将取决于若干因素;人工智能对Meta来说是一个巨大的机会;谷歌和人工智能的关系让人想起柯达的商业模式导致其最终厄运;微软似乎处于最有利的位置。
·从新公司的角度来看,OpenAI显然是最有意思的:有可能成为所有其他人工智能公司的平台。最大的赢家也可能是英伟达和台积电。
【编者按】2022年,聊天机器人ChatGPT、AI创作机器人DALL-E、MidJourney的爆火,对传统互联网的模式发出了挑战。这个时代的赢家、科技界五大巨头——微软、苹果、Meta、亚马逊、谷歌,仍将是人工智能时代最值得关注的公司。一方面,维持性技术的发展会确保其现有地位,让它们的产品、服务不断迭代,另一方面,被称作破坏性创新或者颠覆性技术的新影响,也将迫使巨头们重新思考自己的商业模式,以及如何在人工智能时代继续成为领导者。
云计算和人工智能技术将成为新时代的主旋律,广告业务和推荐算法将是各个巨头的“护城河”。无论是日渐臃肿的谷歌搜索、市值蒸发的Meta,还是与OpenAI加深合作的微软,这些巨头正处在不同的位置上,但可以预见的是,它们终将以自己的方式强势入场、决出胜负。这五家公司的未来如何?人工智能又将产生怎样的影响?著名科技博客Stratechery的作者BenThompson于1月9日发表文章《人工智能与五巨头》,对此做出了深度剖析。以下为全文,有少量删减。
人工智能的涌现是2022年发生的故事,首先是图像生成模型,包括DALL-E、MidJourney和开源的StableDiffusion,然后是ChatGPT,这是第一个取得重大突破的文本生成模型。在我看来,这明显是一个科技发展的新时代。
为了预测这个时代的发展,我们不妨回顾一下26年前最著名的战略书籍:Clayton Christensen的《创新者的困境》(TheInnovator’sDilemma),特别是这段关于不同类型创新的文字:
大多数新技术促进了产品性能的提高。我把这些技术称为维持性技术。一些维持性技术可能是不连续或激进的,而其他技术则是渐进性的。所有维持性技术的共同点是,它们沿着主要市场的主流客户历来重视的性能维度改善现有产品的性能。某一行业的大多数技术进步都具有维持性的特点。
但颠覆性技术为市场带来了与以往截然不同的价值主张。一般来说,颠覆性技术在主流市场上的表现不如成熟产品。但它们有一些边缘(一般是新)客户看重的其他特点。基于颠覆性技术的产品通常更便宜,更简单,更小,而且经常使用起来更方便。
通过观察创新进入市场现有公司后的表现,似乎很容易总结,并确定一项创新是维持性的还是颠覆性的:如果创新是维持性的,那么现有的巨头会变得更强大;如果是颠覆性的,那么初创公司会抓住大部分的价值。
看看以前的科技时代:
·个人电脑对几乎所有现有公司都是颠覆性的;这些相对便宜和低功率的设备曾经几乎没有微型计算机的能力和利润率,更不用说大型机了。这就是为什么IBM愿意将最初的个人电脑的芯片和操作系统分别外包给英特尔和微软,这样他们就可以推出产品去满足企业客户;不过,随着个人电脑的速度越来越快,英特尔和微软占据了主导地位,让之前的一切都相形见绌。
·互联网几乎完全是新的市场创新,因此由全新的公司来定义。它们颠覆现有公司时,也颠覆了远离技术的行业,特别是涉及信息的行业(即媒体)。这是谷歌、Facebook、在线市场和电子商务的时代。所有的应用都运行在由Windows和英特尔驱动的个人电脑上。
·云计算可以说是互联网的一部分,但我认为它应该有自己的类别。它也是极具颠覆性的:x86架构横扫了专用服务器硬件,一大批SaaS(编者注:软件即服务)初创企业从现有的公司中剥离出功能来建立新公司。值得注意的是,云计算的核心基础设施主要是由以前时代的赢家建造:亚马逊、微软和谷歌。微软尤其值得注意,因为该公司也将其传统的软件业务过渡到SaaS服务,部分原因是该公司已经将上述软件业务过渡到订阅模式。
·移动业务最终被两个在位者所主导:苹果和谷歌。但这并不意味着它不是颠覆性的。苹果公司新的用户界面形式要求不把手机看作是小型个人电脑,就像微软一样;谷歌公司新的商业模式要求不把手机看作是操作系统销售的直接利润中心,而是作为他们广告业务的护城河。
这段历史值得注意的是,我上面所说的假设并不完全正确。颠覆性创新确实一直来自于市场的新进入者,但这些新进入者不一定是初创企业:在以前的科技时代,一些最大的赢家是利用其现有业务进入新领域的公司。同时,Christensen的理论的其他原则也是成立的。微软在移动领域挣扎,因为移动领域是颠覆性的,但SaaS最终是维持性的,它的商业模式已经被调整。
鉴于现有公司在新时代的成功,在思考人工智能的影响时,最明显的起跑点是五大公司:苹果、亚马逊、Facebook、谷歌和微软。
苹果公司
我已经提到了关于科技战略的最著名书籍之一,而最著名的文章之一是JoelSpolsky的《战略信条五》,特别是这句著名的话:
聪明的公司试图将其产品的补充品商品化。
Spolsky是在解释为什么大公司会投资开源软件时写下这句话的:
调试代码不是免费的,无论专有还是开源。即使你不为它支付现金,它也有机会成本,也有时间成本。可用于开源工作的志愿者编程人才是有限的,每个开源项目都在与其他开源项目竞争同样有限的编程资源,只有最引人注目的项目才真正拥有更多可供使用的志愿者开发人员。总而言之,我对那些试图证明免费软件有巨大经济性的人不感兴趣,因为在我看来,他们只是在进行用一个数除以0的错误。
开源不能不受万有引力或经济规律约束。我们在Eazel、ArsDigita、VALinux和其他许多项目中看到了这一点。但有些事情仍在发生,而在开源世界中很少有人真正理解这样一个道理:许多非常大的上市公司,为使股东价值最大化,正在投入大量资金支持开源软件,通常是通过雇佣大量的程序员团队来开发。而这就是补充品原则所解释的。
再次强调:当一个产品的补充品价格下降时,对该产品的需求就会增加。一般来说,一个公司的战略利益将是尽可能降低其补充品的价格。理论上可持续的最低价格是“商品价格”,即当你有一群竞争对手提供无差别的商品时产生的价格。因此,聪明的公司试图将其产品的补充品商品化。如果你能做到这一点,你的产品的需求将增加,你将能够收取更多的费用,赚取更多的利润。
苹果投资于开源技术,最引人注目的是其操作系统的达尔文内核和WebKit浏览器引擎;后者符合 Spolsky的处方,因为确保网络与苹果设备配合良好,会使苹果的设备更具价值。
与此同时,苹果在人工智能方面的努力在很大程度上是其专有的:传统的机器学习模型被用于推荐、照片识别和语音识别等方面,但这些不会对苹果的业务产生重大推动。然而,苹果确实从开源世界收到了一份令人难以置信的礼物:StableDiffusion模型。
StableDiffusion之所以引人注目,不仅仅因为它是开源的,还因为它的模型小得令人吃惊:发布时,它已经可以在一些消费级显卡上运行;几周内,它已经被优化到可以在iPhone上运行。
值得称赞的是,苹果公司抓住了这个机会,其机器学习团队上个月宣布:
今天,我们很高兴在macOS13.1和iOS16.2中发布CoreML的StableDiffusion优化,以及开始部署到AppleSilicon设备的代码……
在任何应用程序中,StableDiffusion的一个关键问题是模型在哪里运行。在应用程序中部署StableDiffusion比基于服务器的方法更可取,原因有很多。首先,用户的隐私会受到保护,因为用户作为模型输入提供的任何数据都保存在用户的设备上。其次,在初始下载后,用户不需要连接互联网就可以使用该模型。最后,在本地部署这个模型使开发人员能够减少或消除与服务器相关的成本……
优化CoreML的StableDiffusion和简化模型转换,使开发人员更容易以保护隐私和经济可行的方式,将这项技术整合到他们的应用程序中,同时在AppleSilicon上获得最佳性能。该版本包括一个Python软件包,用于使用diffusers和coremltools将StableDiffusion模型从PyTorch转换为CoreML,以及一个Swift包来部署模型。
值得注意的是,这一宣布分为两部分:首先,苹果对StableDiffusion模型本身进行了优化(它可以这样做,因为是开源的);其次,苹果更新了其操作系统,由于苹果的集成模型,该系统已经针对苹果自己的芯片进行了调整。
此外,似乎可以肯定这只是一个开始:虽然苹果多年来一直在自己的芯片上发布所谓的“仿生引擎”,但人工智能专用硬件是根据苹果自己的需求调整的。似乎未来的苹果芯片,如果不是今年,也可能是明年,将会为StableDiffusion调整。与此同时,StableDiffusion本身可以内置到苹果的操作系统中,任何应用程序开发者都可以轻松访问API。
这使得“足够好”的图像生成功能可以有效地内置到苹果设备中,因此任何开发者都可以使用,而不需要像病毒式传播的Lensa(编者注:最近流行的人工智能图像生成App)那样扩大后端基础设施。推而广之,这个时代的赢家最终很像AppStore时代的赢家:苹果之所以获胜,是因为它的集成和芯片优势被用来提供差异化的应用程序,而小型独立应用程序制造商拥有API和分销渠道来建立新的业务。
另一方面,输家将是Dall-E或MidJourney等集中式图像生成服务,以及支撑它们的云提供商(到目前为止,还支撑了前面提到的StableDiffusion应用程序,如Lensa)。诚然,苹果设备上的StableDiffusion不会占领整个市场——至少在我看来,Dall-E和MidJourney都比StableDiffusion“更好”。苹果内置的本地功能将影响集中式服务和集中式计算的最终目标市场,当然,苹果设备之外还有一个大世界。
亚马逊
亚马逊和苹果一样,在其应用程序中使用机器学习;不过,像图像和文本生成这样的直接消费者用例似乎不太明显。目前最重要的是AWS(编者注:亚马逊的云服务AmazonWebServices),它在云端提供对GPU(编者注:图形处理器)的访问。
其中一些GPU被用于训练人工智能,包括StableDiffusion。据Stability AI的创始人兼首席执行官EmadMostaque说,StableDiffusion使用256个英伟达A100显卡训练,耗时15万小时,市场价格为60万美元。不过,AWS更大的应用是推理,即实际应用模型来产生图像(或文本,例如ChatGPT)。每次你在MidJourney中生成图像,或在Lensa中生成头像时,推理都会在云端的GPU上运行。
亚马逊在这一领域的前景将取决于若干因素。首先,也是最明显的,就是这些产品最终在现实世界中的实用性如何。然而,除此之外,苹果在建立本地生成技术方面的进展可能也会产生重大影响。不过亚马逊本身就是一个芯片制造商:虽然它迄今为止的大部分努力都集中在其GravitonCPU上,但该公司可以为StableDiffusion等模型建立自己的专用硬件,并在价格上竞争。
亚马逊短期的一个大问题是在衡量需求方面:没有足够的GPU会让资金闲置,而购买太多闲置的GPU,对于一家试图限制成本的公司来说却是一项重大成本。但这也不会是最严重的错误:人工智能的挑战之一就是推理要花钱,换句话说,用人工智能做东西本就有边际成本。
我怀疑,就开发引人注目的人工智能产品而言,边际成本问题是一个被低估的挑战。虽然云服务一直都有成本,但人工智能生成的离散性可能会导致难以提供资金,以实现产品与市场契合所需的迭代。
尽管如此,随着时间的推移,这些成本应该会下降:即芯片本身变得更快、更有效,模型也会变得更有效,而且一旦市场上有足够的产品可以最大限度地利用其投资,云服务就会得到有规模的回报。不过,除了上述在本地运行推理的可能性之外,全栈集成会带来多大的变化仍是一个开放的问题。
Meta
我在《Meta的神话》一文中已经详细说明了,为什么我认为人工智能对Meta来说是一个巨大的机会,值得该公司进行巨额资本支出:
Meta拥有庞大的数据中心,但这些数据中心主要是关于CPU计算的,这是驱动Meta的服务所需要的。CPU计算也是驱动Meta的确定性广告模型(deterministicadmodel)以及推荐算法所需要的。
不过,ATT(编者注:苹果推出的应用程序跟踪透明度功能,用于管理开发者对用户的广告跟踪,对Meta的广告收入造成巨大影响)的长期解决方案是建立概率模型,不仅要弄清楚谁应该成为广告目标,还要了解哪些广告转化了,哪些没有。这些概率模型将由大规模的GPU舰队建立,就英伟达的A100显卡而言,其成本为五位数。在一个确定性广告就能发挥作用的世界里,这显得太昂贵了,但Meta似乎不再属于那个世界,不投资于更好的目标定位和算法是愚蠢的。
此外,同样的方法对Reels(编者注:Instagram于2020年8月推出的一种视频形式)的持续增长至关重要:从整个网络中推荐内容比只从你的朋友和家人那里推荐内容要困难得多,特别是Meta计划不仅推荐视频,还推荐所有类型的媒体,并将其与你关心的内容穿插在一起。在这里,人工智能模型也将是关键,而建立这些模型的设备同样需要大量资金。
不过,从长远来看,这项投资应该得到回报。首先,好处有我刚才描述的,更好的目标定位和更好的算法推荐,可能重新启动Meta的收入增长。第二,一旦这些人工智能数据中心建成,维护和升级它们的成本应该大大低于建造它们的初始成本。第三,这种大规模投资是其他公司无法做到的,除了谷歌(而且,并非巧合的是,谷歌的资本支出也将上升)。
最后一点可能是最重要的:ATT对Meta的伤害比其他任何公司都大,因为它已经拥有迄今为止最大、最精细的广告业务,但从长远来看,它应该会促使Meta加深护城河。对于Snap、Twitter或任何其他数字广告领域的同行者,这种水平的投资根本不可行(即使Snap依赖云提供商而不是自己的数据中心)。
让Meta的人工智能发挥作用,将不是简单地建立基础模型,而是不断根据个人用户进行调整,这将需要巨大的算力,Meta必须弄清楚如何低成本地进行这种内容定制。不过,Meta的产品可能会越来越具有整合性,这一点很有帮助:虽然Meta可能已经承诺为其VR头盔装配高通的芯片,但Meta仍在开发自己的服务器芯片;该公司还发布了提取英伟达和AMD芯片的工具,以满足其工作负载,但Meta似乎也在开发自己的人工智能芯片。
有趣的是,从长远来看图像和文本生成如何影响Meta:SamLessin(编者注:科技创业者、撰稿人)已经假设,算法时间线的终点就是人工智能内容。而在谈到元宇宙时,我也提出了同样的观点。换句话说,虽然Meta正在投资人工智能以提供个性化的内容推荐,但这个想法与2022年的突破相结合,就是个性化的内容,通过Meta的渠道传递。
看Meta的广告工具如何发展也将会很有趣:生成、A/B测试副本和图像的整个过程都可以由人工智能完成,没有哪家公司比Meta更擅长大规模提供这种功能。
谷歌
《创新者的困境》于1997年出版。那一年,伊士曼柯达的股票达到了94.25美元的最高价,而这似乎是有原因的。就技术而言,柯达公司处于完美的位置。该公司不仅主导了当前的胶片技术,而且还发明了下一个浪潮:数码相机。
问题要归咎于商业模式:柯达通过提供卤化银胶片赚了很多钱,利润率非常高;但另一方面,数码相机是数字的,这意味着它们根本不需要胶片。因此,柯达的管理层非常有动力说服自己,数码相机永远只适合业余爱好者,而且它们得变得非常便宜,这肯定需要很长的时间。
事实上,柯达的管理层是对的:从数码相机的发明到销售额超过胶片相机,花了25年;而数码相机在专业领域的应用,则花了更长时间。在此期间,柯达赚了很多钱,并派发了数十亿美元的股息。但该公司在2012年破产,这是因为消费者有机会获得更好的产品:首先是数码相机,然后是内置相机的手机。
柯达是一个警示故事,讲述了一家创新公司的商业模式如何导致它最终的厄运,即使这种厄运是消费者得到更好东西的结果。
由此再看谷歌和人工智能:谷歌发明了thetransformer,这是支撑最新人工智能模型的关键技术。据传闻,谷歌有一款对话聊天产品,远远优于ChatGPT。谷歌声称其图像生成能力比Dall-E或市场上的任何其他产品都要好。然而,这些传闻只是传闻而已,因为市场上没有任何实际产品。
这并不令人惊讶。长期以来,谷歌一直是使用机器学习使搜索引擎和其他产品变得更好的领导者(并通过谷歌云将该技术作为一项服务提供)。然而,搜索引擎一直依赖于人类作为最终的决定者。谷歌提供链接,但由用户通过点击来决定哪一个。这延伸到了广告:谷歌的服务是革命性的,因为它没有就展示次数向广告商收费——其价值很难确定,特别是在20年前——而是对点击收费,广告商想找到的人,才能决定广告是否足够好。
七年前,我在《谷歌和战略的局限性》一文中写到了,这对谷歌在人工智能世界中的业务带来的难题:
在昨天的主题演讲中,谷歌首席执行官SundarPichai在回顾科技历史,强调我2014年底所描述的个人电脑-网络-移动时代后宣布,我们正在从移动优先的世界转向人工智能优先的世界,这就是引入谷歌助理的背景。
发布iOS6的前一年,苹果首次以Siri引入了语音助手的概念;你可以(理论上)第一次通过语音进行计算。起初它的效果并不好(可以说现在也是如此),但它对计算机和谷歌的具体影响是深远的:语音交互扩大了可以进行计算的地方,从你可以把眼睛和手放在设备上的情况扩展到任何有效的地方,即使它限制了你可以做什么。语音助手必须比搜索结果页面更加积极主动;仅仅提供可能的答案是不够的,相反,需要给出正确的答案。
这对谷歌的技术来说是一个可喜的转变;从一开始,搜索引擎就包含了一个“手气不错”按钮,谷歌创始人拉里·佩奇(LarryPage)非常自信,认为搜索引擎可以为你提供想要的准确结果。尽管昨天的谷歌助理演示被取消,但目前来看,尤其是在上下文感知方面,其远比市场上的其他助理令人印象深刻。更广泛地说,很少有人质疑谷歌在其助理背后的人工智能和机器学习领域是否具有领先地位。
然而,一项业务不仅仅是技术,尤其是在语音助手方面,谷歌有两个重大缺陷。首先,正如我在今年谷歌I/O大会之后所说的,该公司有一个走向市场的缺口:语音助理只有在可用的情况下才有意义,对于数亿iOS用户来说,这意味着还得下载并使用一个单独的应用程序(或建立一种用户愿意花费大量时间的体验,就像Facebook一样)。
其次,谷歌有一个商业模式问题:“手气不错”按钮让搜索不会给谷歌带来任何收益。毕竟,如果用户不必从搜索结果中进行选择,那么该用户也没有机会点击广告,从而选择谷歌为其广告商之间创建的用户注意力竞争的获胜者。谷歌助理也有完全相同的问题:广告去哪儿了?
在过去七年中,谷歌的主要商业模式创新是将越来越多的广告塞进搜索中,这是一种在移动设备上特别有效的策略。而且,公平地说,谷歌挣钱最多的搜索——旅游、保险等——可能无论如何都不太适合聊天界面。
然而,这只会增加谷歌管理层的担忧,即在特定的搜索环境中,生成型人工智能可能代表一种颠覆性的创新,而不是一种维持性的创新。颠覆性创新,至少在一开始,不如现有的创新。这就是为什么它很容易被经理们驳回,因为他们可以告诉自己目前的产品更好,以避免思考商业模式的挑战。当然,问题是颠覆性的产品会变得更好,但在任者的产品变得越来越臃肿和难以使用,这听起来当然很像谷歌搜索目前的发展轨迹。
我不为谷歌打call。我以前这样做过,但大错特错。然而,犯错往往是时间问题:是的,谷歌已经有云服务,YouTube的主导地位似乎正在增强,但搜索引擎的瓶颈似乎已经很清晰,即使它会在未来几年带来现金和利润。
微软
与此同时,微软似乎处于最有利的位置。和AWS一样,它也有销售GPU的云服务;它也是OpenAI的独家云提供商。是的,这是非常昂贵的,但考虑到OpenAI似乎有优势成为人工智能时代的另一个顶级科技公司,这意味着微软是在投资那个时代的基础设施。
必应(Bing)就像iPhone诞生前夕的Mac:是的,它贡献了相当多的收入,但只占主导地位的一小部分,在微软整体的背景下,这一数字相对微不足道。如果将ChatGPT式的结果整合到必应中,可能会危及当前的商业模式,而获得巨大的市场份额,但这是一个非常值得的赌注。
TheInformation的最新报道称,GPT最终将进入微软的生产力应用程序。
重要的是,增加新功能——也许是收费的——完全符合微软的订阅业务模式。值得注意的是,这家曾经被认为是颠覆性变革受害者典型代表的公司,在完整的叙述中,将不仅仅是诞生于颠覆,而是因为颠覆而有条件达到更高的高度。
关于人工智能的潜在影响还有很多可以写,但这篇文章已经很长了。从新公司的角度来看,OpenAI显然是最有意思的:OpenAI有可能成为所有其他人工智能公司的平台,这最终意味着在OpenAI之外的人工智能的经济价值可能相当有限。
还有另一种可能性,即除了图像生成之外,开源模型在文本生成领域也会激增。在这个世界里,人工智能变成了一种商品:这可能是对世界影响最大的结果,但矛盾的是,对单个公司的经济影响是最微弱的。
事实上,最大的赢家可能是英伟达和台积电。英伟达对CUDA生态系统的投资意味着该公司不仅拥有最好的人工智能芯片,而且拥有最好的人工智能生态系统,该公司正在投资扩大这一生态系统。不过,这将继续刺激竞争,特别是在谷歌TPU等内部芯片方面。此外,至少在可预见的未来,所有人都将在台积电制造芯片。
然而,最大的影响可能完全不在我们的雷达范围内。就在休息之前,NatFriedman(编者注:GitHub首席执行官)在Stratechery采访中告诉我,Riffusion使用StableDiffusion通过视觉超声波从文本中生成音乐,这让我想知道当图像真的是一种商品时,还有什么可能性。现在文本是通用的媒介,因为自书写发明以来,文本一直是信息传递的基础。然而,人类是视觉生物,人工智能在图像创作和解释方面的可用性可能会从根本上改变信息传递的含义,这是无法预测的。
目前,我们的预测必须有更多的时间限制,而且是适度的。现在可能是人工智能时代的开始,但即使在科技领域,新时代也需要十年或更长时间才能改变周围的一切。
(本文由吴天一编译)