新一代人工智能的发展与展望
随着大数据、云计算等技术的飞速发展,人们生产生活的数据基础和信息环境得到了大幅提升,人工智能(AI)正在从专用智能迈向通用智能,进入了全新的发展阶段。国务院印发的《新一代人工智能发展规划》指出新一代人工智能相关学科发展、理论建模、技术创新、软硬件升级等整体推进,正在引发链式突破,推动经济社会各领域从数字化、网络化向智能化加速跃升。在4月10日“吴文俊人工智能科学技术奖”十周年颁奖盛典中,作为我国不确定性人工智能领域的主要开拓者、中国人工智能学会名誉理事长李德毅院士荣获“吴文俊人工智能最高成就奖”,并在大会上作题为《探索什么叫新一代人工智能》的报告,探讨了新一代人工智能的内涵和路径,引领着新一代人工智能的发展与展望。
人工智能这一概念诞生于1956年在美国达特茅斯学院举行的“人工智能夏季研讨会”,随后在20世纪50年代末和80年代初先后两次步入发展高峰,但因为技术瓶颈、应用成本等局限性而均掉入低谷。在信息技术的引领下,数据信息快速积累,运算能力大幅提升,人工智能发展环境发生了巨大变化,跨媒体智能、群体智能成为新的发展方向,以2006年深度学习模型的提出为标志,人工智能第三次站在了科技发展的浪潮之巅。
当前,随着移动互联网、物联网、大数据、云计算和人工智能等新一代信息技术的加速迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构,人与人、机器与机器、人与机器的交流互动愈加频繁。在多源数据、多元应用和超算能力、算法模型的共同驱动下,传统以计算机智能为基础的、依赖于算力算法和数据的人工智能,强调通用学习和大规模训练集的机器学习,正逐渐朝着以开放性智能为基础、依赖于交互学习和记忆、基于推理和知识驱动的以混合认知模型为中心的新一代人工智能方向迈进。应该说,新一代人工智能的内核是“会学习”,相较于当下只是代码的重复简单执行,新一代人工智能则需要能够在学习过程中解决新的问题。其中,学习的条件是认知,学习的客体是知识,学习的形态是交互,学习的核心是理解,学习的结果是记忆……因此,学习是新一代人工智能解释解决现实问题的基础,记忆智能是新一代人工智能中多领域、多情景可计算智能的边界和约束。进而当人类进入和智能机器互动的时代,新一代人工智能需要与时俱进地持续学习,不断检视解决新的问题,帮助人机加深、加快从对态势的全息感知递进到对世界的多维认知。
事实上,基于数据驱动型的传统人工智能,大多建立在“数据中立、算法公正和程序正义”三要素基础之上,而新一代人工智能更关注于交互能力,旨在通过设计“记忆”模块来模仿人脑,解决更灵活多变的实际问题,真正成为“不断学习、与时俱进”的人工智能。特别是人机交互支撑实现人机交叉融合与协同互动,目前已在多个领域取得了卓越成果,形成了多方面、多种类、多层次的应用。例如,在线客服可以实现全天候不间断服务,轻松解决用户咨询等问题,也可将棘手问题转交人工客服处理,降低了企业的管理成本;在智慧医疗领域,人工智能可以通过神经影像实现辅助智能诊断,帮助医生阅片,目前准确率已达95%以上,节省了大量的人力;2020年,在抗击疫情的过程中,新一代人工智能技术加速与交通、医疗、教育、应急等事务协作联动,在科技战“疫”中大显身手,助力疫情防控取得显著成效。
未来已来,随着人工智能逐渐融入居民生活的方方面面,将继续在智慧医疗、自动驾驶、工业制造智能化等领域崭露头角。一是基于新一代人工智能的智慧医疗,将助力医院更好记录、存储和分析患者的健康信息,提供更加精准化和个性化的健康服务,显著提升医院的临床诊断精确度。二是通过将新一代人工智能运用于自动驾驶系统的感知、预测和决策等方面,重点解决车道协同、多车调度、传感器定位等问题,重新定义城市生活中人们的出行方式。三是由于我国工业向大型化、高速化、精细化、自主化发展,对高端大规模可编程自动化系统提出迫切需求,新一代人工智能将推动基于工业4.0发展纲领,以高度自动化的智能感知为核心,主动排除生产障碍,发展具备有适应性、资源效率、人机协同工程的智能工厂应运而生。总之,如何展望人工智能通过交互学习和记忆理解实现自编程和自成长,提升自主学习和人机交互的效率,将是未来研究着力发展的硬核领域,并加速新一代信息技术与智能制造深度融合,推动数字化转型走深走实,有信心、有能力去迎接下一场深刻产业变革的到来。
人工智能技术拐点来临 未来将如何发展
2018年2月25日,在平昌冬奥会闭幕式“北京8分钟”表演中,由沈阳新松机器人自动化股份有限公司研发的智能移动机器人与轮滑演员进行表演。新华社记者李钢/摄
2018年5月3日,中国科学院发布国内首款云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平。新华社记者金立旺/摄
2017年10月,在沙特阿拉伯首都利雅得举行的“未来投资倡议”大会上,机器人索菲亚被授予沙特公民身份,她也因此成为全球首个获得公民身份的机器人。图为2018年7月10日,在香港会展中心,机器人索菲亚亮相主舞台。ISAACLAWRENCE/视觉中国
2018年11月22日,在“伟大的变革——庆祝改革开放40周年大型展览”上,第三代国产骨科手术机器人“天玑”正在模拟做手术,它是国际上首个适应症覆盖脊柱全节段和骨盆髋臼手术的骨科机器人,性能指标达到国际领先水平。麦田/视觉中国
如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇,就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见,在这场关乎前途命运的大赛场上,我们必须抢抓机遇、奋起直追、力争超越。
概念与历程
了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。
人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。
人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:
一是起步发展期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
二是反思发展期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。
三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
五是稳步发展期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。
六是蓬勃发展期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。
现状与影响
对于人工智能的发展现状,社会上存在一些“炒作”。比如说,认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶,等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此,制定人工智能发展的战略、方针和政策,首先要准确把握人工智能技术和产业发展的现状。
专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定任务(比如下围棋)的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,人工智能系统诊断皮肤癌达到专业医生水平。
通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著,但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。
人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”,微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出,2016年全球人工智能研发投入超300亿美元并处于高速增长阶段;全球知名风投调研机构CBInsights报告显示,2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。
创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史,就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如,传统信息产业代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能相关产业的制高点。
人工智能的社会影响日益凸显。一方面,人工智能作为新一轮科技革命和产业变革的核心力量,正在推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来,需要抓紧提供解决方案。
趋势与展望
经过60多年的发展,人工智能在算法、算力(计算能力)和算料(数据)等“三算”方面取得了重要突破,正处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来,人工智能发展将会出现怎样的趋势与特征呢?
从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的重大挑战。2016年10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室,众多感知、学习、推理、自然语言理解等方面的科学家参与其中。
从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中,人机混合智能都是重要的研发方向。
从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习,但是深度学习的局限是需要大量人工干预,比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等,非常费时费力。因此,科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低人员成本。
人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。
人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来10年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,可在现有基础上将劳动生产率提高40%;到2035年,美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测,到2030年,约70%的公司将采用至少一种形式的人工智能,人工智能新增经济规模将达到13万亿美元。
人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出,未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。
人工智能领域的国际竞争将日益激烈。当前,人工智能领域的国际竞赛已经拉开帷幕,并且将日趋白热化。2018年4月,欧盟委员会计划2018—2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。
人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展,使其发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,制定完善人工智能法律法规,规避可能的风险。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构,旨在“以有利于整个人类的方式促进和发展友好的人工智能”。
态势与思考
当前,我国人工智能发展的总体态势良好。但是我们也要清醒看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。
高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月,国务院发布《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。
态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成为全球人工智能投融资规模最大的国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果,我国在人工智能领域发表的论文数量已居世界第一。近两年,中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院,2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说,我国人工智能领域的创新创业、教育科研活动非常活跃。
差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中,中国虽然入选人数名列第二,但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析,制定完善人工智能相关法律法规的进程需要加快。
前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。
当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等,需要深入思考。
树立理性务实的发展理念。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。实现机器在任意现实环境的自主智能和通用智能,仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此,发展人工智能要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。
重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。
构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强。我们要以问题为导向,主攻关键核心技术,加快建立新一代人工智能关键共性技术体系,全面增强人工智能科技创新能力,确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。同时,我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过实施标准加速人工智能驱动经济社会转型升级的进程。
推动共担共享的全球治理。目前看,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中,我国有望成为全球人工智能竞争中的领跑者,应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合“一带一路”建设,让“智能红利”助推共建人类命运共同体。
作者:谭铁牛中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士
图集+1【纠错】责任编辑:郝多三问ChatGPT如何影响人工智能的未来
学生们在长沙华夏实验学校和机器狗互动(2022年6月22日摄)薛宇舸摄/本刊
➤ChatGPT在技术路径上采用的是“大数据+大算力+强算法=大模型”路线,又在“基础大模型+指令微调”方向探索出新范式,其中基础大模型类似大脑,指令微调是交互训练,两者结合实现逼近人类的语言智能
➤据估算,此类大模型的训练一次的成本接近千万美元,运营成本一个月要数百万美元。“OpenAI为了让ChatGPT的语言合成结果更自然流畅,用了45TB的数据、近1万亿个单词来训练模型,大概是1351万本牛津词典。”
➤新一代网络操作系统和生态雏形初显,“英伟达+微软OpenAI”封闭生态有可能成为智能时代的“Wintel”联盟
文 |《瞭望》新闻周刊记者 朱涵 彭茜 黄堃
ChatGPT会带来一个不同的未来吗?
带着这个问题,记者询问了ChatGPT“本人”,它的回答是这样的:
“随着ChatGPT的普及,它开始被广泛应用于各种领域,从在线交流、信息搜索、机器翻译、文本生成,它的准确性和高效率使得许多工作变得不再困难。然而,人们也开始对它产生了担忧……”
ChatGPT正在成为我们生活中的一部分,ChatGPT会是人工智能通往未来的坐标吗?人工智能的发展,离不开人与人工智能的结合,技术与人类能无缝结合吗?
ChatGPT会是人工智能通往未来的坐标吗
与人类连续对话,拒绝不合适的问题,短时间内完成写邮件、文案、代码、诗歌,轻松通过工程师、MBA、研究生、医师资格等难度较高的专业级测试……推出2个月即拥有1亿月活用户,ChatGPT已成为史上用户增长最快的消费级应用程序。
在语言智能程度呈现跨越式提升的背后,ChatGPT是一场工程创新的“大力出奇迹”。
“ChatGPT的成功,首先是选择了合适可行的技术路径,然后就是数据和人力资源的巨大投入。”北京智源人工智能研究院院长黄铁军说。
黄铁军说,ChatGPT在技术路径上采用的是“大数据+大算力+强算法=大模型”路线,又在“基础大模型+指令微调”方向探索出新范式,其中基础大模型类似大脑,指令微调是交互训练,两者结合实现逼近人类的语言智能。
“OpenAI为了让ChatGPT的语言合成结果更自然流畅,用了45TB的数据、近1万亿个单词来训练模型,大概是1351万本牛津词典。”浙江大学人工智能研究所所长吴飞说。
业内人士表示,OpenAI的主要支持方微软构建了一个算力规模位居全球前列的超算平台以支持其研发,OpenAI在全球范围雇佣了近千名专人进行数据处理。据估算,此类大模型的训练一次的成本接近千万美元,运营成本一个月要数百万美元。
“ChatGPT是人工智能技术‘量变’引发‘质变’的代表,标志了目前机器学习大模型、大训练数据和大算力能够到达的新高度。”之江实验室副主任鲍虎军表示,ChatGPT在GPT模型基础上,采用人类反馈强化学习(RLHF)的训练机制和提示导引模式,促使模型越来越顺应人类的思考逻辑,更加符合人类认知和习惯,这是工程实现上的重要创新。
中国科学技术大学机器人实验室主任陈小平说,迄今为止,人工智能的所有理论和技术都没有解决真实性难题,都不能让机器本身拥有真实创造的能力,但创造效率的提高将产生巨大的效益和多方面的影响。
“目前,人类面临着前所未有的重大机遇。”陈小平说。
ChatGPT能否预示着一个新时代启幕
“ChatGPT的成功不仅是一个新一代聊天机器人的突破,它将为人工智能乃至整个信息产业带来革命。”黄铁军说,ChatGPT将成为点燃人工智能的“网景时刻”“iPhone时刻”。
“网景时刻”和“iPhone时刻”,分别是互联网和移动互联网发展的里程碑事件。网络浏览器诞生于1990年,但直到1994年网景导航者(NetscapeNavigator)问世,大多数人才开始探索互联网。第一部智能手机IBMSimon诞生于1993年,2007年苹果iPhone的横空出世,重新定义了智能手机并开启了移动互联网的新时代。
同样地,ChatGPT极有可能预示着又一个新时代的启幕:
——新一代网络操作系统和生态雏形初显。多位专家受访时表示,ChatGPT正在演变成新一代操作系统平台和生态,用户将能直接用日常语音或者文字与人工智能进行交互,大部分计算负荷由大模型为核心的新一代信息基础设施接管。
在微软算力支持下,OpenAI已相继研发出GPT-3、ChatGPT等通用泛化能力越来越强的闭源大模型,并通过微软云平台提供智能云服务,支持智能应用开发,这将成为智能时代的基础性“操作系统”。再加上在AI芯片市场已占领超主流市场份额的英伟达GPU芯片,形成的“英伟达+微软OpenAI”封闭生态有可能成为智能时代的“Wintel”联盟。
“大模型及其软硬件支撑系统的生态之争将成为未来十年信息产业的焦点。”黄铁军说。
——人工智能直接连接大众,个体深入参与技术发展。“从短期来看,ChatGPT正在从实验室基础科技向产业应用转变,一切还处于‘爆炸式创新’的前期,正如云计算催生了APP应用爆炸,基础模型很可能催生AI应用规模化。”人工智能资深研究专家、科技评论员田涛源说。
“人们将能够直接与我们最新、最强大的语言模型互动,作为搜索的伴侣,以实验和创新的方式。”谷歌CEO桑达尔·皮查伊(SundarPichai)说。
“相较于以AlphaGo这一现象级产品针对于某一个特定领域、其算法模型需要附着在某一个产品中才能赋能使用的模式,ChatGPT能直接面向大众使用者,且具备盈利模式,这将改变很多人工智能企业高成本、低回报的经营模式。”吴飞说。
——重构传统互联网商业模式,催生数字经济新突破。北京瑞莱智慧科技有限公司副总裁唐家渝认为,ChatGPT的应用除了聊天机器人外,还包括涉及文字生成和信息查询的智力工作、低难度的编程等内容创作领域,从而普遍提高这些行业的生产力。也能够与其他生成式技术融合,比如提高数字人的语义交互水平等,打造更具象化的形象,提升交流中的情感链接。
田涛源表示,从中长期发展趋势上预测,“生成式AI+决策式AI”很有可能重构传统互联网的搜索、广告、社交、游戏、电商模式,部分程度上颠覆原有的互联网平台,同时遵从数实融合、以虚强实原则赋能科研、制造、能源、交通等实体企业做强做优做大。
国家超级计算成都中心科研人员在巡检机房设备(2023年2月14日摄)刘坤摄/本刊
技术与人类能无缝结合吗
ChatGPT引发的全球关注,令许多人回忆起2016年AlphaGo战胜人类围棋世界冠军的时刻。当时社会上同样兴起了一场人工智能大讨论。
在这场热潮中,我国抢抓人工智能发展的重大战略机遇,在2017年发布《新一代人工智能发展规划》,推动人工智能一业赋百业。
目前,ChatGPT已引发全球科技公司的新一轮人工智能竞赛。谷歌发布了下一代对话AI系统Bard,微软发布了整合了ChatGPT的全新必应Bing和Edge浏览器,宣布旗下Office、Azure云服务等所有产品都将全线整合ChatGPT。百度表示将在今年3月完成人工智能聊天机器人“文心一言”的内测,随后对公众开放,阿里巴巴达摩院预训练语言模型体系已开放内测。
回顾历史,人工智能的发展并非一帆风顺。自1956年诞生以来,人工智能发展经历三次浪潮,期间充满波折。在人工智能深度学习迅速发展的近10年里,产业上也还没有出现里程碑式的爆发。
事实上,ChatGPT在带来惊艳体验的同时,也有明显“缺陷”。比如,它的知识存在事实性错误、知识盲区、常识偏差,也将面临着隐私泄露、技术滥用、造假、社会公平等伦理问题。因其模型能力出众、用户众多,这些风险隐患还会被放大。
“ChatGPT的应用离不开人的‘提示’,性能的持续提升离不开研发者的算法改进和设计,风险隐患的应对离不开人的引导和治理。”业内人士表示。
人工智能的发展,离不开人与人工智能的结合,我们的未来,也将是人与人工智能共同进化的时代。
正如ChatGPT描绘的人工智能未来世界:
机器人们像人类,
思想智慧已涌动。
在这梦幻的世界里,
技术与人类无缝结合。
生活如同一首诗,
平静而美好,永不停歇。
人工智能的未来发展前景:当前困境和未来可能
但所有这些成功都是有限的。深蓝、沃森和AlphaGo都是高度专业化的、目的单一的机器,只能在一件事上做得很好。深蓝和沃森不能下围棋,AlphaGo不能下国际象棋或参加Jeopardy,甚至最基本的水平都不行。它们的智能范围非常狭窄,也不能泛化。
沃森已经在医疗诊断等应用中取得了很多成果,但它基本上仍然只是一个必须为特定领域专门调制的问答机器。深蓝拥有大量关于国际象棋策略的专门知识和百科全书式的开放知识。AlphaGo是用更通用的架构构建的,但其代码中仍然有很多人工编码的知识。我不是轻视或低估他们的成就,但认识到他们还没有做成的事也是很重要的。
我们还没能创造出可以解决多种多样不同类型问题的人工通用智能(artificialgeneralintelligence)。我们还没有听一两年人类对话的录音就能自己说话的机器。尽管AlphaGo通过分析数千局比赛然后又进行更多的自我对弈而「学会」了下围棋,但这同样的程序却不能用来掌握国际象棋。
同样的一般方法呢?也许可以吧。但我们目前最好的成就离真正的通用智能还很远——真正的通用智能能灵活地无监督地学习,或能足够灵活地选择自己想要学习的内容,不管那是玩棋盘游戏,还是设计PC板。
人工智能的未来发展前景:当前困境和未来可能
迈向通用人工智能
我们如何从狭窄的、特定领域的智能迈向更通用的智能呢?这里说的「通用智能」并不一定意味着人类智能,但我们确实想要机器能在没有编码特定领域知识的情况下解决不同种类的问题。我们希望机器能做出人类的判断和决策。
这并不一定意味着机器将实现创造力、直觉或本能等没有数字类比的概念。通用智能将具备处理多种类型的任务和适应未曾预料的情形的能力。一个通用智能无疑可以实现「正义」和「公平」这样的概念:我们已经在谈论人工智能对法律系统的影响了。
我们先以自动驾驶汽车来证明我们所面临的问题。要实现自动驾驶,汽车需要将模式识别和其它能力整合到一起,包括推理、规划和记忆。它需要识别模式,这样才能对障碍物和街道标志做出反应;它需要推理,这样才能理解交通规则和解决像避开障碍物等任务;它需要规划以获得从当前位置到目标位置的路径,并同时考虑到交通状况等其它模式。
它需要不断重复做这些事,不断更新它的解决方案。但是,即使一辆自动驾驶汽车整合了所有这些人工智能,它也不具备我们所期望的通用智能应该具备的灵活性。你不会期待一辆自动驾驶汽车能和你交谈或布置你的花园。将从一个领域学习到的知识应用到另一个领域的迁移学习是非常困难的。
你也许可以重新加工其中许多软件组件,但那只能指出缺少了什么:我们当前的人工智能能为特定问题提供范围狭窄的解决方案,它们并不是通用的问题解决者。你可以将范围狭窄的人工智能叠加到一起(一辆车可以带有能谈论去哪里、进行餐厅推荐和与你下棋让你不会感觉无聊的Bot),但狭窄人工智能的叠加永远不能得到一个通用人工智能。通用人工智能的关键不是有多少种能力,而是这些能力的整合。
尽管神经网络这样的方法原本是为模拟人脑过程而开发的,但许多人工智能计划已经放弃了模仿生物大脑的概念。我们不知道大脑的工作方式;神经网络计算是非常有用的,但它们并没有模拟人类的思维。
在《ArtificialIntelligence:AModernApproach》一书中,PeterNorvig和StuartRussell写道:“当莱特兄弟和其他人停止模仿鸟类并开始学习空气动力学时,对『人工飞行』的追求才获得成功。”
类似地,要取得成功,人工智能不需要将重点放到模仿大脑的生物过程上,而应该尝试理解大脑所处理的问题。可以合理地估计,人类使用了任意数量的技术进行学习,而不管生物学层面上可能会发生什么。这可能对通用人工智能来说也是一样:它将使用模式匹配(类似AlphaGo),它将使用基于规则的系统(类似沃森),它将使用穷举搜索树(类似深蓝)。
这些技术没有一种能与人类智能直接对应。人类比任何计算机都做得更好的是构建他们的世界的模型,并根据这些模型采取行动。
超越通用智能后的下一步是超智能(super-intelligence或hyper-intelligence)。目前我们还不清楚如何区分通用人工智能和超智能。我们期望超智能系统会具备创造力和直觉等性质吗?鉴于我们对人类的创造力还不甚理解,思考机器的创造力就更为困难了。
围棋专家称AlphaGo的一些落子是“创造性的”;但它们源自与其它所有落子完全一样的过程和模式,而并非以一种新的视角看待这项游戏。同样算法的重复应用可能会产生让人类感到惊讶或意外的结果,但仅仅的惊讶并不是我们所说的“创造力”。
将超智能看作一个规模问题会更容易一点。如果我们可以创造「通用智能」,可以很容易估计出它将很快就比人类强大成千上万倍。或者,更准确地说,通用人工智能要么将显著慢于人类思维,难以通过硬件或软件加速;要么就将通过大规模并行和硬件改进而获得快速提速。
我们将从数千个内核GPU扩展到数千个芯片上的数以万亿计的内核,其数据流来自数十亿的传感器。在第一种情况中,当加速变缓时,通用智能可能不会那么有趣(尽管它将成为研究者的一次伟大旅程)。在第二种情况中,其增速的斜坡将会非常陡峭、非常快。
人工智能的未来发展前景:当前困境和未来可能
训练还是不训练
AlphaGo的开发者声称使用了远比深蓝更通用的算法来训练人工智能:他们制作了一个只具备最少围棋知识策略的系统,学习主要是通过观察围棋比赛获得。这指明了下一个大方向:我们可以从机器基于标注数据的监督学习走向机器依靠自己组织和结构化数据的无监督学习吗?
YannLeCun曾在Facebook的一篇帖子中说到:“在我们想要得到真正的人工智能之前,我们必须解决无监督学习的问题。”
要对照片分类,一个人工智能系统首先会获得数百万张已经正确分类了的照片;在学习了这些分类之后,它还要使用一系列标注了的照片进行测试,看它们是否能够正确标注这个测试集。如果没有标注,机器又能做什么?如果没有元数据告诉机器“这是鸟,这是飞机,这是花”,它还能发现照片中重要的内容吗?机器能像人和动物一样,只需观察远远更少的数据就能发现模式吗?
人类和动物都可以从相对很少的数据中构建模型和抽象:比如,我们不需要几百万张图像才能识别出一种新的鸟或在一座新城市找到我们的路。研究者正在研究的一个问题是对视频的未来画面的预测,这将需要人工智能系统构建对世界运作方式的理解。
有可能开发出能应对全新环境的系统吗?比如在冰面汽车会难以预料的打滑。人类可以解决这些问题,尽管它们不一定很擅长。无监督学习指出,光是靠更好更快的硬件,或开发者只是用当前的库进行开发,问题将无法得到解决。
有一些学习方法处在监督学习和无监督学习的中间。在强化学习中,系统会被给予一些代表奖励(reward)的值。机器人可以穿过一片地面而不跌倒吗?机器人可以不用地图就驾驶汽车穿过市中心吗?奖励可以被反馈给系统并最大化成功的概率。(OpenAIGym是一个很有潜力的强化学习框架)。
在一端,监督学习意味着再现一组标记,这在本质上是模式识别,而且容易发生过拟合。在另一个极端,完全无监督学习意味着学习归纳性地推理关于一个情形的情况,这还需要算法上的突破。半监督学习(使用最少的标注)或强化学习(通过连续决策)代表着这些极端之间的方法。我们将看到它们能达到哪种程度。
人工智能的未来发展前景:当前困境和未来可能
智能的意义
我们所说的「智能」是一个根本性的问题。在Radar2014年的一篇文章中,BeauCronin出色地总结了许多人工智能的定义。我们对人工智能的期待严重依赖于我们希望用人工智能做什么。对人工智能的讨论几乎总是开始于图灵测试。
图灵假设人们可以通过聊天的方式与计算机交互:他假设了一种与计算机的沟通方式。这个假设限制了我们期望计算机做的事:比如,我们不能期望它能驾驶汽车或组装电路。这也是一个故意的模棱两可的测试。计算机的答案可能是闪烁其词的或完全不正确的,正确无误不是重点。人类智能也可能会是闪烁其侧或不正确的。我们不大可能将正确无误的人工智能误解为人类。
如果我们假设人工智能必须被嵌入到能够运动的硬件中,比如机器人或自动驾驶汽车,我们会得到一组不同的标准。我们会要求计算机在它自己的控制下执行一个定义不清的任务(比如开车到一家商店)。我们已经打造出了在路线规划和驾驶上比大多数人类都做得更好的人工智能系统。
谷歌的自动驾驶汽车负有责任的那次事故的原因是该算法被修改得更像人类一样驾驶,并由此带来了人工智能系统通常不会具备的风险。
自动驾驶汽车还有很多没能解决的困难问题:比如在暴风雪的山路上行进。不管人工智能系统是嵌入在汽车里,还是无人飞行器或人形机器人里,其所面临的问题本质上是类似的:在安全、舒适的环境中执行是很容易的;而在高风险、危险的情形中则艰难得多。
人类也不擅长这些任务,尽管图灵所期望的对话中人工智能是回避式的或甚至会错误地回答问题,但在高速路上驾驶时,模糊或不正确的方案却是不能接受的。
可以执行物理行为的人工智能迫使我们思考机器人的行为。应该用什么样的道德来规范自主机器人?阿西莫夫的机器人定律?如果我们认为机器人不应该杀死或伤害人类,武器化的无人机已经打破了这道界限。尽管典型的问题「如果事故不可避免,自动汽车应该撞向婴儿还是老奶奶?」是虚假的道德,但这个问题也有一些更为严肃的版本。
为了避免会杀死其内部乘客的事故,自动驾驶汽车应该冲向人群吗?抽象地回答这个问题很容易,但很难想象人类会愿意购买会牺牲他们而不伤害旁观者的汽车。我怀疑机器人将来能够回答这个问题,但它也必然会在福特、通用、丰田和特斯拉的董事会上得到讨论。
我们可以通过对话系统或自主机器人系统的复杂度分布来更为简单地定义人工智能,并说人工智能只是单纯关于构建能回答问题和解决问题的系统。能够回答问题和推理复杂逻辑的系统是我们已经开发了好些年的「专家系统」,其中大部分都嵌入在沃森中。(AlphaGo解决的是不同类型的问题。)
但是,正如BeauCronin指出的那样,解决对人类来说存在智力挑战的问题是相对简单的;更困难的是解决对人类来说很简单的问题。很少有三岁孩童能下围棋。但所有的三岁孩童都能认出自己的父母——而不需要大量有标注的图像集。
我们所说的「智能」严重依赖于我们想要该智能所做的事,并不存在一个能够满足我们所有目标的单个定义。如果没有良好定义的目标来说明我们想要实现的东西或让我们衡量我们是否已经实现了它的标准,由范围狭窄的人工智能向通用人工智能的转变就不会是一件容易的事。
人工智能的未来发展前景:当前困境和未来可能
助手还是主角?
人工智能的新闻报道聚焦于能够自主行为的机器自主系统。这么做有充足的理由:它有趣、性感、且有点令人害怕。在观看人类辅助AlphaGo下棋的同时,很容易去幻想一个由机器主宰的未来。然而相较于自动化设备,人工智能有更多超过人类的东西。真正的价值——人工智能或者智能增强——都在哪里?人工智能还是智能增强?
这个问题自对于人工智能的初次尝试起就被问到,并由JohnMarkoff在《MachinesofLovingGrace》中深入探讨过。
我们可能不想由一个人工智能系统来做决定,而可能会想为自己保留决定权。我们或许想让人工智能通过提供信息、预测任何行动过程的后果、提出建议来增强智慧,而把决定权留给人类。尽管有点《黑客帝国》的感觉,但这个被人工智能所服务的增强我们的智慧而非推翻我们的未来会比服侍一匹脱缰的人工智能有着更大可能性。
GPS导航系统是一个人工智能系统用来增强人类智慧的绝佳案例。给定一张适宜的地图,大多数的人都能从A点导航到B点,尽管这对于自身能力还有很多要求,尤其是在我们不熟悉的领域。绘制两个位置之间的最佳路线是一个棘手的问题,特别是当你考虑到糟糕的交通和路况时。
但是有了自动驾驶车辆的除外,我们从未把导航引擎连接到方向盘上。GPS是一种严格意义上的辅助技术:它给出了建议,而不是命令。当一个人已经作出忽略GPS建议的决定(或错误)时,你都会听到GPS说「重新计算路线中」,那是它正在适应新情况。
在过去几年中,我们已经看到许多各种意义上有资格作为人工智能的应用程序。几乎所有「机器学习」框架下的事物都有资格成为人工智能:事实上「机器学习」是在人工智能学科陷入声名狼藉之时,被指称回人工智能更为成功的那部分。你不必一定要构建带有人类声音的人工智能,像是亚马逊的Alexa,当然它的推荐引擎肯定是人工智能。
类似Stitchfix的web应用也是人工智能,它增加了由时尚专家们运用推荐引擎所做出的选择。我们已经习惯了那些处理客户服务电话的聊天机器人(并经常被它们气坏)——准确度或高或低。你可能最后还是得和人类对话,而其中的秘密就是使用聊天机器人清理掉所有例行问题。让某个人类去抄录你的地址、保单号码和其他标准信息没什么意义:如果内容不是太多,计算机可以做得至少同样准确无误。
下一代助理将是(已经是)半自主性的。几年前,LarryPage说《星际迷航》中的计算机是理想的搜索引擎:它是一台能够理解人类、已消化所有可用信息、能在被提问之前就给出答案的计算机。如果你现在正在使用谷歌,当它第一次告诉你由于交通堵塞要你早点出发赴约时,你可能会感到惊讶。
这就需要纵观多个不同的数据集:你目前所在的位置、你的约会地点(可能在你的日历或联系人列表中)、谷歌地图数据、目前的交通状况、甚至是有关预期交通模型的时间先后数据。它的目的不是回答某个问题;而是甚至在用户意识到需求之前就提供帮助。
人工智能的未来发展前景:当前困境和未来可能
为何人们对人工智能的兴趣大增?
为什么人工智能在遭受「人工智能的冬天」(AIwinter)的几十年声名狼藉之后,会成为当下如此热门的话题?当然,人工智能的新闻也出现深蓝之后,之后又有沃森的故事;但这些风潮都没能持久。看到目前的人工智能崛起为另一次风潮是很有诱惑力的。这能让我们忽视过去十年的变化。
人工智能的兴起依赖于计算机硬件的巨大进步。列举计算机性能和存储技术自人工智能之冬起(维基百科追溯到1984年)的30多年间的巨大进步是很乏味的。但这是此篇文章无法回避的一部分,特别是如果你已经见过IBM的沃森机器支架。
据报道AlphaGo运行于1920个CPU和280个GPU;;击败了LeeSedol的机器可能更加庞大,并且它使用了谷歌用于构建神经网络所开发的定制硬件。即使人工智能算法在普通笔记本上运行很慢,但在像AWS、GCE和Azure的云平台上配置一些重要的算力是容易且相对便宜的。机器学习得以实现,部分也是因为这种存储大量数据的能力。1985年时的千兆字节(GB)还很罕见且重达数百磅;现在它已司空见惯,廉价而小巧。
除了存储和处理数据的能力,我们现在还能生成数据。在上世纪80年代,大多影像都是模拟信号。现在它们全是数字的,并有很多存储于像是Flickr、GooglePhotos、ApplePhotos、Facebook等的网络服务商那里。许多在线照片已经被贴上了一些描述性的文本,这使得它们成为了训练人工智能系统的良好数据集。
我们的许多对话也都是线上的,通过Facebook、Twitter和许多聊天服务。我们的购物历史也是一样。所以我们(或者更准确的说是谷歌、苹果、雅虎、Facebook、亚马逊等)就有了训练人工智能系统所需的数据。
我们在算法上也取得了显著的进展。神经网络并不是特别的新,但是「深度学习」却堆叠了一系列通过反馈来自我训练的网络。因而深度学习试图解决机器学习中最难的人类问题之一:从数据中学习最优表征。处理大量数据很简单,但是特征学习就更像是一门艺术而非科学。深度学习是要实现那门艺术的部分自动化。
我们不仅取得了算法上进展,更让它得到了广泛的使用,例如Caffe、TensorFlow、Theano、Scikit-Learn、MXNet、CNTK等等。
人工智能并不局限于学术界的计算机科学研究者,而是像PeteWarden所展示的那样,越来越多的人都能够参与进来。你无需了解如何实现一个复杂的算法并让它在你的硬件上运行得多么好。你只需要知道如何安装库并标注训练数据就行了。
正如计算机革命本身所发生的那样,计算机被搬出了机房并被广大市民所使用,同样的民主化进程正在制造一场人工智能革命。来自许多背景和环境的人利用人工智能做试验,我们将会看到许多新型应用。有些会看起来像科幻小说(尽管自动驾驶汽车被看做科幻小说还只是几年前的事);肯定会有我们甚至无法想象的新应用出现。
人工智能的未来发展前景:当前困境和未来可能
建立知识数据库
世界充满了「暗数据」:不存在于良好、有序的数据库中的非结构化信息。它在网站上、埋于表格里、被珍藏在照片和电影中;但它不易被机器智能或其他智能所捕获。
像diffbot和deepdive这样的项目是利用半监督学习来找出非结构化数据中的结构——无论是大量的科学论文还是众多网站的碎屑。一旦他们创建了一个数据库,就能用更传统的工具——API、SQL语句或者桌面应用程序——访问该数据库。
知识数据库和图表已被应用到许多智能应用中,包括谷歌的知识图谱(KnowledgeGraph)。在我们走向聊天应用时,挖掘暗数据并找出其中结构的能力将变得更加重要。在聊天应用从脚本化和目标狭隘型迈向为用户返回任意问题的答案型的道路上,暗数据的有效利用将成为这一转变的关键。
我们可能看不到这样的应用程序被用于问题「理解」,而是会成为未来辅助技术的中心。它们将依靠已被机器分解并结构化的知识库:其中包含的大量数据将超出人类的标记能力。
产生结果
不像人工智能冬天的黑暗时期,那时数据有限、计算机很慢,现在我们到处都能看到成功的人工智能系统。谷歌翻译肯定不会像人类翻译员那样好,但是它经常能够提供一个可用的翻译结果。尽管语音识别系统还没有达到随处可见的程度,也也已经是司空见惯的了,且其准确度令人惊叹;一年前谷歌声称安卓手机可以正确无误地理解92%的问题。如果一台计算机能够准确地将问题转化为文本,那么下一步就是把问题变成答案。
同样,图像识别和图像处理也已经变得司空见惯。尽管存在一些被广泛报道的尴尬错误,计算机视觉系统能够以在几年前还不可想象的精确度来识别人脸。
理所当然地,对此问题的适宜约束在其成功中起着巨大作用:Facebook可以识别照片中的面孔,是因为它假定照片里的人很可能是你的朋友。计算机视觉是(或将是)从寻常到可怕等各种层次的人工智能应用的中心。视觉显然是自动驾驶车辆的关键;它对于监控、自动锁定无人机和其他不令人舒服的应用也同样重要。
深度学习和神经网络在过去的一年里已经吸引了大量的关注:它们已经实现了计算机视觉、自然语言和其他领域的进步。
然而几乎所有打着机器学习旗号的都是人工智能:分类与聚类算法(classificationandclusteringalgorithms)、各种决策树(decisiontrees)、遗传算法(geneticalgorithms)、支持向量机(supportvectormachines)、分层式即时记忆(HTM:hierarchicaltemporalmemory)等等。
这些技术可以被自己使用,也可以与其他技术结合使用。IBM的沃森是集成学习(ensemblelearning)一个很好的例子:它是一个基于规则的系统,并依据所要解决的问题来结合使用其他算法。这个规则在很大程度上是手工制定的,而其他算法则需通过精心调整来获得良好效果。
像Watson一样令人印象深刻的、需要大量手动调整的系统是一块通向智能道路上的最好的踏脚石。任何的通用人工智能和大多数的狭义人工智能系统都将可能结合多种算法,而不是使用单一的、尚未被发现的主算法。
但这种用来得到良好结果的调整是一个主要的限制:AlphaGo团队负责人DemisHassabis说这样的调整「几乎像是一种艺术形式。」如果取得好结果需要花几年时间,并且只有一些专家(Hassabis说有几百人)有能力做这项工作,那么它还是「人工智能」吗?
类似Watson这样的引擎的创造过程是科学,然而也需要许多艺术。另外,手动优化的需求表明人工智能系统的建立方式本质上是狭隘的,只能解决单一的问题。很难想象去优化一个能够解决任何问题的「通用智能」引擎。如果你正在做这件事,那么几乎可以肯定,那是一些特定应用。
人工智能方面的进步取决于更好的算法,还是更好的硬件?如果这个问题还算有意义,那么答案就是「同时」。即使GPU进展的时间速率已经停止,我们把更多东西塞进一张芯片的力还没有停滞:AlphaGo的280个GPU能够轻松平均20万个核心。
更重要的是,我们已经看到了许多用于GPU的数学库和工具方面的改进。我们可能还会看到ASIC(application-specificintegratedcircuit)和FPGA(field-programmablegatearrays)在未来的人工智能引擎中的使用。反过来,ASIC和FPGA将成为在许多需要硬实时状态(hardreal-time)运行的硬件系统(想想自动驾驶汽车)中嵌入人工智能的关键。
但即使有了更好的硬件,我们仍然需要分布于成千上万个节点中的算法;我们需要能够飞速地重新编程FPGA的算法,以适应待解决问题所使用的硬件。MapReduce在数据分析中很流行是因为它提出了一个并行化一大类问题的方法。
并行显然在人工智能中起作用,但它的限制是什么?并行的残酷现实是,其不可被并行的部分能把你折磨死。而大多数并行算法的标志是,你需要一个用以收集部分结果并产生单一结果的阶段。AlphaGo在计算下一步棋时可能正在查看成千上万个选择,但在某一点上,它需要浏览所有的选项,评估哪个是最好的,并给出一个单一结果。
AlphaGo可以利用280个GPU的优势;那么一台有280,000个GPU的计算机怎么样?毕竟,迄今为止我们所制造的最大计算机的计算能力只相当于一只老鼠大脑的一小部分,更不要说与人类相比了。如果是不依赖于并行设计和神经网络的算法呢?在一个路线中的每个元素都采取不同方法来解决问题的系统当中,你如何运用反馈?像这样的问题有可能在不久的将来推动人工智能的研究。
在人工智能算法中使用更多(更快)的硬件有可能使我们获得更好的围棋手、国际象棋手和Jeopardy玩家。我们将能更快更好地分类图像。不过这是我们目前可解决问题的一项改进而已。更多计算能力将会把我们从监督学习领到无监督学习吗?它会把我们从狭义的智能引到通用智能中吗?这还有待观察。无监督学习是一个难题,而且我们并不清楚能否只通过使用更多硬件来解决它。我们仍然在寻找一个可能并不存在的「主算法」。
人工智能的未来发展前景:当前困境和未来可能
道德和未来
对超智能的谈论很容易把人吓到。而且据一些人说,现在是时候决定我们想要机器做什么了,趁现在还未为时已晚。尽管这种立场可能过于简化了,但思考如何限制我们还未造出来的设备是非常困难的;而且它们的能力我们现在还无法想象,可能未来永远也无法理解。
拒绝人工智能也是很困难的,因为没有任何技术是在人类事先考虑周全之后才被发明出来的。在历史的不同时期人们害怕的许多技术现在已经司空见惯:在某个时候,很多人认为以超过每小时60英里的速度旅行是致命的。苏格拉底反对书写,因为他担心这会导致健忘:想象一下他会如何看待我们今天的技术!
但我们可以思考人工智能的未来,以及我们开发协助我们的人工智能的方式。这里给出了一些建议:大部分对超人工智能的恐惧都不是在害怕我们已经知晓或理解的机器,他们害怕的是最糟糕的人性加上无限制的力量。我们无法想象一个思考着我们不能理解的想法的机器;我们想象那是不可战胜的希特勒或斯大林——我们确实能理解他们的想法。我们的恐惧本质上是人类的恐惧:对像人类一样行为的万能机器的恐惧。
这并不是诋毁我们的恐惧,因为我们已经见到机器学习确实能向人类学习。微软不幸的Tay是对话型人工智能Bot从网络对话中「学会」种族主义和偏见的完美案例。谷歌的图像分类曾将黑人夫妇识别为「猩猩」,这个糟糕的测试结果的原因是训练数据集中没有足够的合适标注的黑人图片。
机器学习成为种族主义者的方式和人类差不多一样:因为这是我们教它们那样做的,不管是有意还是无意。这是一个人类问题,而且是一个可以解决的问题。我们可以在人工智能学习的内容和方式上更加小心。
我们可以对我们的训练集中的内容以及这些训练集的标注方式更加谨慎,我们可以过滤我们认为可以接受的答案类型。这些没什么是特别困难的;但却是必须要做的。更困难的是在目前的环境中让人们达成共识:认为种族主义和仇恨是不好的。
这是人类价值观的问题,而不是机器智能的问题。我们会构建出反映了我们自身价值观的机器:我们已经在那样做了。它们是我们想要反映的价值吗?
白宫对数据科学的报告《BigRisks,BigOpportunities:theIntersectionofBigDataandCivilRights(大风险、大机遇:大数据和民权的交集)》在总结章节中提到,我们需要研究审核算法的方法,以「确保人们被公平对待」。随着我们从「大数据」走向人工智能,对算法的审核以及确保它们反映我们所支持的价值观的需求将只会增长。
将对人工智能的深入研究开放给大众,让公众可以见证到,这一点极其重要。这并非因为我们相信,大众会对研究少些「恐惧」(这一点,或许是对的,也可能是错的),也不是因为大众多少会对超级智能的观念「习以为常」;而是因为较之公之于众的研究,人们对闭门研究会投以更大的关注。
实际上,《不道德的研究(UnethicalResearch)》这篇论文建议,打造一个健康的人工智能生态系统的最好方式就是将打造恶毒机器的想法公开。研究会继续在背后进行,认为军方研究和情报部门没有致力于人工智能的想法,很天真。但是,如果没有公开状态下进行人工智能研究,我们就会受到军方或者情报部门研究的支配。
(一个公司,比如谷歌或者Facebook,是闭门研究抑或开诚布公,是个值得讨论的问题)这也就是OpenAI的宗旨:「以尽可能从整体上让人类受益的方式推进数字化智能的研究,不受需要财务收益的限制。」OpenAI是一个激动人心而且让人吃惊的应答(针对人们对人工智能恐惧):尽可能远地推进这项研究,但是公开确保公共领域的研究领先于闭门研究。
对于研究来说,开放且公开也同样重要,因为研究起源时常决定了研究的应用。核能就是个好例子。我们可以打造安全、高效的核反应堆。但是,我们从来没有打造过钍反应堆,因为他们不会帮你制造炸弹,而且对核能的深入研究是由国防部门控制的。
核反应堆不是不会产生可用数量的钚吗?为什么任何人都想要核反应堆?再一次,认为军方和国家情报部门不会做出优秀的人工智能研究,这种想法太天真。但是,如果人工智能变成国家情报部门的专属领域,那么,就会有秘密窃听和理解对话的优秀系统。
当思考人工智能还能为我们做些什么时,我们的想象力会受到限制,而且也很难想象人工智能的应用到底会有哪些,除了杀人无人机、老大哥(BigBrother,典出乔治·奥威尔的名著《1984》)的耳目。我们或许永远无法研发出智能医疗系统和机器人护士助理。
如果我们想要让人工智能服务于人类,就必须公开进行研究:作为人工智能研究人员这一更大社区的一部分,作为更为广泛的公众讨论(讨论目标和宗旨)的一部分。我们必须小心,不要打造出人类自己的最糟梦魇;但是,也许需要认识到,噩梦只不过是一个更强大的、真实的人类自身的版本。
总是在未来
扎克伯格最近说道,未来五到十年,人工智能会比人类更善于做一些最基础的任务。也许他是对的,但是,同样清楚的是,他讨论的是狭义人工智能:从事特别任务,比如语音识别,图像分类以及游戏。他继续说,「那并不意味着计算机将会思考...」。
根据你的交谈对象,一个真的通用智能可能距离我们10到50年。考虑到预测科技未来的难度,最好的答案是「十多年以后」,而且可能更久。啥时候可以做出人类水平的机器智能?一份最近的专家调查(FutureProgressinArtificialIntelligence:ASurveyofExpertOpinion)显示,可能是2040-2050年左右(概率为50%)。正如LeCun所言,「人类水平的通用智能距离我们几十年。」
因此,如果真的可以,我们什么时候会到达那里?几年前,JasonHuggins对机器人的评价,可谓先见之明。机器人,他说,总是在未来。机器人片段一次又一次地中断,成为现在的一部分;但是,当那发生时,它们不再被视为机器人。上世纪二十年代,我们就将一台现代洗碗机视为一个超级智能机器人;如今,不过是一个洗碗机。
这种情形也将不可避免地发生在人工智能身上。实际上,已经发生了。我已经避免对机器智能和人工智能做出区分;「机器智能」是一个术语:当人工智能这个词声名狼藉时,这个术语被用于指代人工智能研究中的一些想法。
如今,那些想法中的很多都变得很常见了。我们不会对亚马逊的推荐系统或者GPS导航思虑再三,我们将之视为理所当然。我们或许发现Facebook和谷歌的图像标签功能很诡异,但是,看到它时,你不会认为那是人工智能。
所有严肃的象棋玩家会对阵象棋程序,围棋菜鸟也是如此,而且在AlphaGo获得成功后,对弈计算机也会延伸到专家层面。这些就是人工智能,他们已经中断并成为当今世界的一部分。这一过程中,人工智能变化了形态,成为IA(智能增强):碾压人类能力的自动化技术开始变得具有辅助性。
我们能否指着某件东西说,「是的,那就是人工智能?」是的,当然可以,我们现在就可以这么做了。更重要的是,我们将不可能避免地被人工智能围绕着,甚至在我们知道这些东西人工智能之前。我们将管道、电力视为理所当然之物,我们的孩子将流媒体音乐视为理所当然。我们也会视人工智能为理所当然,当它们在生活中越来越普遍时。返回搜狐,查看更多