人工智能的历史、现状和未来
如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇,就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见,在这场关乎前途命运的大赛场上,我们必须抢抓机遇、奋起直追、力争超越。
概念与历程
了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。
人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。
人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:
一是起步发展期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
二是反思发展期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。
三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
五是稳步发展期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。
六是蓬勃发展期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。
现状与影响
对于人工智能的发展现状,社会上存在一些“炒作”。比如说,认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶,等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此,制定人工智能发展的战略、方针和政策,首先要准确把握人工智能技术和产业发展的现状。
专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定任务(比如下围棋)的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,人工智能系统诊断皮肤癌达到专业医生水平。
通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著,但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。
人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”,微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出,2016年全球人工智能研发投入超300亿美元并处于高速增长阶段;全球知名风投调研机构CBInsights报告显示,2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。
创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史,就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如,传统信息产业代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能相关产业的制高点。
人工智能的社会影响日益凸显。一方面,人工智能作为新一轮科技革命和产业变革的核心力量,正在推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来,需要抓紧提供解决方案。
趋势与展望
经过60多年的发展,人工智能在算法、算力(计算能力)和算料(数据)等“三算”方面取得了重要突破,正处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来,人工智能发展将会出现怎样的趋势与特征呢?
从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的重大挑战。2016年10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室,众多感知、学习、推理、自然语言理解等方面的科学家参与其中。
从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中,人机混合智能都是重要的研发方向。
从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习,但是深度学习的局限是需要大量人工干预,比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等,非常费时费力。因此,科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低人员成本。
人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。
人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来10年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,可在现有基础上将劳动生产率提高40%;到2035年,美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测,到2030年,约70%的公司将采用至少一种形式的人工智能,人工智能新增经济规模将达到13万亿美元。
人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出,未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。
人工智能领域的国际竞争将日益激烈。当前,人工智能领域的国际竞赛已经拉开帷幕,并且将日趋白热化。2018年4月,欧盟委员会计划2018—2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。
人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展,使其发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,制定完善人工智能法律法规,规避可能的风险。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构,旨在“以有利于整个人类的方式促进和发展友好的人工智能”。
态势与思考
当前,我国人工智能发展的总体态势良好。但是我们也要清醒看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。
高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月,国务院发布《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。
态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成为全球人工智能投融资规模最大的国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果,我国在人工智能领域发表的论文数量已居世界第一。近两年,中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院,2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说,我国人工智能领域的创新创业、教育科研活动非常活跃。
差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中,中国虽然入选人数名列第二,但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析,制定完善人工智能相关法律法规的进程需要加快。
前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。
当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等,需要深入思考。
树立理性务实的发展理念。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。实现机器在任意现实环境的自主智能和通用智能,仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此,发展人工智能要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。
重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。
构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强。我们要以问题为导向,主攻关键核心技术,加快建立新一代人工智能关键共性技术体系,全面增强人工智能科技创新能力,确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。同时,我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过实施标准加速人工智能驱动经济社会转型升级的进程。
推动共担共享的全球治理。目前看,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中,我国有望成为全球人工智能竞争中的领跑者,应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合“一带一路”建设,让“智能红利”助推共建人类命运共同体。
(作者:中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士)
入行人工智能,这一本人工智能领域百科全书不可错过
点击上方“程序人生”,选择“置顶公众号”
第一时间关注程序猿(媛)身边的故事
有人说,2016年是人工智能元年,人工智能技术在各行各业如雨后春笋般出现。2017年年初,我开始着手翻译《人工智能(第2版)》,当我即将完成本书的初译时,科技界传来了阿尔法狗战胜围棋棋手柯洁的消息,于是,这本书成了一本名副其实的、还未出版的“古书”。本书可以称得上是经典教材,内容翔实,逻辑清晰,引经据典,纵横捭阖,是一本不可多得的人工智能教科书,它同时也被誉为“人工智能领域百科全书”。
《人工智能(第2版)》
[美] 史蒂芬·卢奇(StephenLucci)著
扫码购书
回顾历史,1997年,深蓝打败了卡斯帕罗夫,当时人们曾乐观地预测,在体现古老的东方智慧的围棋领域,计算机未必能够这么轻松战胜人类,围棋成了象征着人类智慧的最后一块高地。然而,仅过了20年,人们的预言就被打破。
从阿兰・图灵破解了恩尼格玛密码机,为第二次世界大战的胜利做出了巨大的贡献开始,到达特茅斯研讨会发明了“人工智能”这一词,再到今天,人工智能经历了60年的发展。在此期间,“山重水复疑无路,柳暗花明又一村”,人工智能经历了三次浪潮、两次寒冬的洗礼。当前,在深度学习算法的促进下,人工智能携带着云计算、大数据、卷积神经网络,突破了自然语言语音处理、图像识别的瓶颈,为人类带来了翻天覆地的变化。
“忽如一夜春风来,千树万树梨花开”,用这句诗来形容人工智能的发展一点都不为过。人工智能方兴未艾,全面向人类的各个领域发展,业界有一句戏称的话是:“如果你够走运的话,机器可以把你当成宠物。”
一句戏谑的话却道出了多少人的心酸,人工智能已经在各个方面开始出现代替人类的可能:未来在生产车间里,我们再也看不到人类工人繁忙的身影;在超市,我们也看不到收银员在工作;在餐厅,我们也看不到厨师、服务员。人工智能可以帮助我们完成很多任务,辅助我们做出决策。
关于人工智能是对人类的馈赠还是会给人类带来灭顶之灾,人们对此的争论一度甚嚣尘上、莫衷一是。人工智能也许会像潘多拉的盒子,但是人们心存希望,正是这种希望让人工智能走过了艰难坎坷的60年。
从乐观的一面来看,在未来,科幻故事可能出现在日常生活中,而劳动可能成为一种保持健康的需要。不过,一切距离盖棺论定还为时尚早。正如本书在机器人部分所谈到的,人工智能正处在蹒跚学步的“婴儿期”,在我写下这篇译者序的时候,人形机器人在运动能力方面还是非常初级,因此,有人说了句玩笑话:“如果你要阻碍‘终结者’,关上门就行(机器人比较难以掌握开门技术)。”
本书可以称得上是经典教材,内容翔实,逻辑清晰,引经据典,纵横捭阖,是一本不可多得的人工智能教科书。人工智能包罗万象,包括自然语言处理、知识表示、智能搜索、规划、机器学习、人工神经网络复杂系统、数据挖掘、遗传算法、模糊控制等。面对人工智能的迅猛发展和海量知识,计算机科学和工程相关专业的读者,与其临渊羡鱼,不如退而结网,扎扎实实打好基础。“纸上得来终觉浅,绝知此事要躬行”。
学习人工智能,读者要戒骄戒躁,认真理解算法,并将算法转换成计算机程序,因此,我建议读者读完一章之后,亲自编写代码,在机器上实际运行一下程序。“冰冻三尺,非一日之寒”,要成为人工智能领域的佼佼者,读者需要做好打持久战、打硬仗的思想准备,持之以恒地不断学习新技术,不断推陈出新。唯有这样,才能水滴石穿,成为社会的中流砥柱,引领时代潮流。
为什么会创作《人工智能(第2版)》
2006年,为了庆祝达特茅斯夏季研讨会(DartmouthSummerConference)50周年,人们举办了AI@50,达特茅斯学院哲学系教授詹姆斯·摩尔(JamesMoor)邀请我在AI@50上组织一场计算机博弈表演赛。在达特茅斯夏季研讨会中,约翰·麦卡锡创造了“人工智能”一词。
达特茅斯会议一些最初的与会者参加了AI@50,其中包括约翰·麦卡锡(JohnMcCarthy)、马文·明斯基(MarvinMinsky)、奥利弗·西里奇(OliverSelfridge)和雷·索罗莫洛夫(RaySolomonoff)。卢奇(Lucci)教授也参加了AI@50,之后不久,他同意与我合作撰写人工智能教科书。
我们的观点是,人工智能是由人类(People)、想法(Idea)、方法(Method)、机器(Machine)和结果(Outcome)组成的。
首先,组成人工智能的是人类。人类有想法,并把这些想法变成了方法。这些想法可以由算法、启发式、程序或作为计算骨干的系统来表示。最后,我们得到了这些机器(程序)的产物,我们称之为“结果”。每个结果都可以根据其价值、有效性、效率等方面进行衡量。
我们发现,现有的人工智能书籍通常没有提到其中的一些领域。没有人类,就没有人工智能。因此,我们决定,通过在本书中添加“人物轶事”专栏,介绍对人工智能的成功做出贡献的人,我们在这本书全文17章中介绍的人物包括了提出想法的人以及实现开发方法的人。
与数学、物理、化学和生物学等其他科学相比,人工智能和计算机科学相对较年轻。但是,人工智能是一门真正跨学科的学科,结合了其他领域的许多元素。
机器/计算机是人工智能研究人员的工具,机器/计算机允许研究人员实验、学习和改进求解问题的方法,这些方法可以应用于可能对人类有益的许多有趣领域。最后,由于将人工智能应用到各种各样的问题和学科,我们得到了可测量的结果,这提醒我们人工智能也必须是可解释的。在本书的许多地方,你将会发现“表现”和“能力”之间区别的讨论。随着人工智能的成熟和进步,这两者都是必需的。
到目前为止,通过亲自教授人工智能课程以及阅读人工智能教材,我们发现大多数可用的教材都缺乏了上述的一个或多个领域。Turing、McCarthy、Minsky、Michie、McLelland、Feigenbaum、Shortliffe、Lenat、Newell和Simon、Brooks等许多人的名字和巨大的贡献应该为学生所熟悉。
然而,这不是一本历史书!我们认为,这门学科如此有趣,如此广泛,具有无限潜力,应该合理地使用在这个领域中工作的人物的迷人思想和出色工作,以使得这本书更加多姿多彩。
第2版和第1版有什么不同?
自本书第1版出版以来,已经过去了很长时间。人工智能概念、方法和系统正日益融入人们的日常活动中。例如,在编写第1版的时候,人们将许多汽车制造成具有并行停泊的能力;现在在汽车上配置防撞系统已经变得司空见惯了。科幻爱好者幻想的技术(例如无人机和机器人)现在变成了现实、越来越多的无人机和机器人正在成为人们日常生活的一部分。
在21世纪前10年或早些时候浮出水面的GPS系统、手机应用程序和社交网络,如今已随处可见。这些技术,包括最佳的交通路线、健康咨询和个人服务员,已用于人们生活的各个方面,每种技术通常都使用了某种形式的人工智能。
自然语言和语音处理的进步大大改变了人类与机器进行交互的方式。第2版增加了第10章,介绍和讨论了机器学习的决策树。因此,第10章、第11章(机器学习第二部分:神经网络)和第12章(受到自然启发的搜索)共同为进一步研究提供了基础。第13章(自然语言处理)新增了一个新的小节(13.10节),介绍了语音理解的理论、方法和应用。同时,第13章也添加了一个小节,用来讲述自然语言处理中的隐喻。第15章提供了机器人领域的概述,包括最近的应用,并于结尾与第17章(大事记)一起展望了未来。许多章节都增加了新的练习题。
阿兰· 图灵
人工智能概述
早期,人类必须通过如轮子、火之类的工具和武器与自然做斗争。15世纪,古腾堡发明的印刷机使人们的生活发生了广泛的变化。19世纪,工业革命利用自然资源发展电力,这促进了制造、交通和通信的发展。20世纪,人类通过对天空以及太空的探索,通过计算机的发明及其微型化,进而成为个人计算机、互联网、万维网和智能手机,持续不断地向前进。过去的60年已经见证了一个世界的诞生,这个世界出现了海量的数据、事实和信息,这些数据、事实和信息必须转换为知识(其中一个实例是包含在人类基因编码中的数据,如图1.0所示)。本文介绍了人工智能学科的概念性框架,并阐述了其成功应用的领域和方法、近期的历史和未来的前景。
图1.0 包含在人类基因编码中的数据
人工智能的定义
在日常用语中,“人工”一词的意思是合成的(即人造的),这通常具有负面含义,即“人造物体的品质不如自然物体。但是,人造物体通常优于真实或自然物体。例如,人造花是用丝和线制成的类似芽或花的物体,它不需要以阳光或水分作为养料,却可以为家庭或公司提供实用的装饰功能。
虽然人造花给人的感觉以及香味可能不如自然的花朵,但它看起来和真实的花朵如出一辙。
另一个例子是由蜡烛、煤油灯或电灯泡产生的人造光。显然,只有当太阳出现在天空时,我们才可以获得阳光,但我们随时都可以获得人造光,从这一点来讲,人造光是优于自然光的。
最后,思考一下,人工交通装置(如汽车、火车、飞机和自行车)与跑步、步行和其他自然形式的交通(如骑马)相比,在速度和耐久性方面有很多优势。但是,人工形式的交通也有一些显著的缺点—地球上无处不在的高速公路,充满了汽车尾气的大气环境,人们内心的宁静(以及睡眠)常常被飞机的喧嚣打断。
如同人造光、人造花和交通一样,人工智能不是自然的,而是人造的。要确定人工智能的优点和缺点,你必须首先理解和定义智能。
思维是什么?智能是什么?
智能的定义可能比人工的定义更难以捉摸。斯腾伯格(R.Sternberg)就人类意识这个主题给出了以下有用的定义:智能是个人从经验中学习、理性思考、记忆重要信息,以及应付日常生活需求的认知能力。
我们都很熟悉标准化测试的问题,比如,给定如下数列:1,3,6,10,15,21。要求提供下一个数字。
你也许会注意到连续数字之间的差值的间隔为1。例如,从1到3差值为2,从3到6差值为3,以此类推。因此问题正确的答案是28。这个问题旨在衡量我们在模式中识别突出特征方面的熟练程度。我们通过经验来发现模式。
不妨用下面的数列试试你的运气:
a.1,2,2,3,3,3,4,4,4,4,?
b.2,3,3,5,5,5,7,7,7,7,?
既然已经确定了智能的定义,那么你可能会有以下的疑问。
(1)如何判定一些人(或事物)是否有智能?
(2)动物是否有智能?
(3)如果动物有智能,如何评估它们的智能?
大多数人可以很容易地回答出第一个问题。我们通过与其他人交流(如做出评论或提出问题)来观察他们的反应,每天多次重复这一过程,以此评估他们的智力。虽然我们没有直接进入他们的思想,但是相信通过问答这种间接的方式,可以为我们提供内部大脑活动的准确评估。
如果坚持使用问答的方式来评估智力,那么如何评估动物智力呢?如果你养过宠物,那么你可能已经有了答案。小狗似乎记得一两个月没见到过的人,并且可以在迷路后找到回家的路。
小猫在晚餐时间听到开罐头的声音时常常表现得很兴奋。这只是简单的巴甫洛夫反射的问题,还是小猫有意识地将罐头的声音与晚餐的快乐联系起来了?
关于动物智力,有一则有趣的轶事:大约在1900年,德国柏林有一匹马,人称“聪明的汉斯”(CleverHans),据说这匹马精通数学(见图1.1)。
图1.1 “聪明的汉斯”(CleverHans)—一匹马做演算?
当汉斯做加法或计算平方根时,观众都惊呆了。此后,人们观察到,如果没有观众,汉斯的表现不会很出色。事实上,汉斯的天才在于它能够识别人类的情感,而非精通数学。
马一般都具有敏锐的听觉,当汉斯接近正确的答案时,观众们都变得相对兴奋,心跳加速。也许,汉斯有一种出奇的能力,它能够检测出这些变化,从而获得正确的答案。虽然你可能不愿意把汉斯的这种行为归于智能,但在得出结论之前,你应该参考一下斯腾伯格早期对智能的定义。
有些生物只体现出群体智能。例如,蚂蚁是一种简单的昆虫,单只蚂蚁的行为很难归类在人工智能的主题中。但是另一方面,蚁群对复杂的问题显示出了非凡的解决能力,如从巢到食物源之间找到一条最佳路径、携带重物以及组成桥梁。
集体智慧源于个体昆虫之间的有效沟通。第12章在对高级搜索方法进行讨论时,将相对较多地探讨涌现智能和集群智能。
脑的质量大小以及脑与身体的质量比通常被视为动物智能的指标。海豚在这两个指标上都与人类相当。海豚的呼吸是自主控制的,这可以说明其脑的质量过大,还可以说明一个有趣的事实,即海豚的两个半脑交替休眠。
在动物自我意识测试中,例如镜子测试,海豚得到了很好的分数,它们认识到镜子中的图像实际上是它们自己的形象。海洋世界等公园的游客可以看到,海豚可以玩复杂的戏法。这说明海豚具有记住序列和执行复杂身体运动的能力。
使用工具是智能的另一个“试金石”,并且这常常用于将直立人与先前的人类祖先区别开来。海豚与人类都具备这个特质。例如,在觅食时,海豚使用深海海绵(一种多细胞动物)来保护它们的嘴。显而易见,智能不是人类独有的特性。在某种程度上,许多生命形式是具有智能的。
你应该问自己以下问题:“你认为有生命是拥有智能的必要先决条件吗?”或“无生命物体,例如计算机,可能拥有智能吗?”人工智能宣称的目标是创建可以与人类的思维媲美的计算机软件和(或)硬件系统,换句话说,即表现出与人类智能相关的特征。
一个关键的问题是“机器能思考吗?”更一般地来说,你可能会问,“人类、动物或机器拥有智能吗?”
在这个节点上,强调思考和智能之间的区别是明智的。思考是推理、分析、评估和形成思想和概念的工具。并不是所有能够思考的物体都有智能。智能也许就是高效以及有效的思维。许多人对待这个问题时怀有偏见,他们说:“计算机是由硅和电源组成的,因此不能思考。”
或者走向另一个极端:“计算机表现得比人快,因此也有着比人更高的智商。”真相很可能存在于这两个极端之间。
正如我们所讨论的,不同的动物物种具有不同程度的智能。我们将阐述人工智能领域开发的软件和硬件系统,它们也具有不同程度的智能。我们对评估动物的智商不太关注,尚未发展出标准化的动物智商测试,但是对确定机器智能是否存在的测试非常感兴趣。
也许拉斐尔(Raphael)的说法最贴切:“人工智能是一门科学,这门科学让机器做人类需要智能才能完成的事。”
图灵测试
上一节中提出“你如何确定智能”以及“动物有智能吗?”这两个问题已经得到了解决。第二个问题的答案不一定是简单的“是”或“不是”—一些人比另一些人聪明,一些动物比另一些动物聪明。机器智能也遇到了同样的问题。
阿兰·图灵(AlanTuring)寻求可操作方法来回答智能的问题,欲将功能(智能能做的事情)与实现(如何实现智能)分离开来。
补充资料
抽象是一种策略,这种策略忽略了对象或概念的实现(例如内部的工作),这样,你就可以获得更清晰的人造物及其与外部世界关系的图像。换句话说,你可以将这个对象当作一个黑盒子,只关注对象的输入和输出(见图1.2)。
图1.2 黑盒子的输入和输出
通常,抽象是一种有用而必要的工具。例如,如果你想学习如何驾驶,把车当作一个黑盒子可能是一个好主意。你不必一开始就努力学习自动变速器和动力传动系统,而是可以专注于系统输入,例如油门踏板、刹车、转向信号灯以及输出,如前进、停车、左转和右转。
数据结构的课程也使用抽象,因此如果想了解栈的行为,你可以专注于基本的栈操作,比如pop(弹出一项)和push(插入一项),而不必陷入如何构造一个列表的细节(例如,使用线性链表还是循环链表,或使用链接链表还是连续分配空间)。
图灵测试的定义
阿兰·图灵提出了两个模拟游戏。在模拟游戏中,一个人或实体表现得仿佛是另一个人。在第一个模拟游戏中,一个人在一个中央装有帘子的房间中,帘子的两侧各有一人,其中一侧的人(称为询问者),必须确定另一侧的人是男人还是女人。
询问者(其性别无关紧要)通过询问一系列的问题来完成这个任务。游戏假定男性可能会在他的回答中撒谎,而女性总是诚实的。为了使询问者无法从语音中确定性别,通过计算机而不是讲话的方式进行交流,如图1.3所示。如果在帘子的另一侧是男人,并且他成功地欺骗了询问者,那么他就赢了。
图1.3 第一个图灵模拟游戏
图灵测试的原始形式是,一个男人和一个女人坐在窗帘后面,询问者必须正确地识别出其性别(图灵可能得到那个时代流行游戏的启发,发明了这个测试。这个游戏也促使了他进行机器智能测试)。
正如埃里希·弗罗姆(ErichFromm)所写的[8]:男女平等,但不一定要相同。例如,不同性别的人具有不同的关于颜色和花朵的知识,花在购物上的时间也不同。
区分男女与智能问题有什么关系?图灵认为,可能存在不同类型的思考,了解并容忍这些差异是很重要的。图1.4表示了图灵测试的第二个版本。
图1.4 第二个图灵模拟游戏
第二个游戏更适合人工智能的研究。询问者还是在有帘子的房间里。这一次,帘子后面可能是一台计算机或一个人。这里的机器扮演男性的角色,偶尔会撒谎,但人是一直诚实的。询问者提问,然后评估答案,确定他是和人交流,还是和机器交流。如果计算机成功地欺骗了询问者,那么它就通过了图灵测试,因此也就被认为是有智能的。
众所周知,在执行算术计算时,机器比人类快很多倍。如果帘子后面的“人”可以在几微秒内得到了三角函数的泰勒级数近似的结果,那么就可以不费吹灰之力辨别出在帘子后面的是计算机而不是人。
自然,计算机可以在任意的图灵测试中成功欺骗询问者的机会非常小。为了得到有效的智能“晴雨表”,这个测试要执行许多次。同样,在这个图灵原始版本的测试中,人和计算机都在帘子后面,询问者必须正确地辨别它们。
补充资料
图灵测试
没有计算机系统通过了图灵测试。然而,1990年,慈善家HughGeneLoebner举办了一项比赛,这项比赛旨在实现图灵测试。第一台通过图灵测试的计算机将被授予金牌以及$100000的罗布纳奖金。同时,每年在比赛中表现最好的计算机将被授予铜牌以及大约$2000的奖金。
在图灵测试中,你会提出什么问题?考虑以下示例:
·(1000017)½是多少?像这样的计算可能不是一个好主意。记住,计算机试图欺骗询问者。计算机可能不会在几分之一秒内做出响应,给出正确答案,它可能会有意地花费更长的时间,也许还会犯错误,因为它“知道”人类不熟悉这些计算。
· 当前的天气情况如何?假设计算机可能不会向窗外看一眼,因此你可能会试着问一下天气。但是,计算机通常连接着万维网,因此在回答之前,它也连接到了天气网站。
· 你害怕死亡吗?因为计算机难以伪装人的情绪,所以你可能会提出这个问题或其他的类似问题:“黑色给你的感觉如何?”或者“坠入爱河的感觉如何?”但是,记住,你现在是在试图判定智能,人类的情绪也许不是有效的智能“晴雨表”。
图灵预料到会有许多人反对他在最初论文中所提出的“机器智能”的想法,其中一个就是所谓的“鸵鸟政策反对”。人们相信思考的能力使人变成万物之灵。承认计算机能够思考,这可能挑战了这个仅由人类享有的崇高的栖息地。
许多人认为,正是人的灵魂让人们可以思考,如果我们创造出拥有这种能力的机器,那么将会篡夺“上帝”的权威。
图灵反驳了这个观点,他提出人们仅仅是准备等待具有灵魂禀赋的容器来执行“上帝”的旨意。最后,我们提到洛甫雷斯伯爵夫人(LadyLovelace)的反对意见(在文献中她经常被称为第一个计算机程序员)。
在评论分析式引擎时,她无比轻松地说“单单这台机器不可能给我们惊喜”。她重申了许多人的信念:一台计算机不能执行任何未预编程的活动。
图灵反对这种意见,说机器一直都让他很惊喜。他坚持认为,这种反对意见的支持者认同人类的智慧可以即时推断给定事实或行动的所有后果。图灵的最初论文在收集上述异议以及其他的反对意见时提到了这些读者。
图灵测试的争议和批评
内德·布洛克(NedBlock)认为,英语文本是以ASCII编码的,换句话说,是用计算机内一系列的0和1表示的。因此,一个特定的图灵测试,也就是一系列的问题和答案,可以存储为一个非常大的数。例如,假设图灵测试的长度有一个上限,在测试中,“Areyouafraidofdying?(你害怕死亡吗?)”开始的前三个字符作为二进制数字存储,如图1.5所示。
图1.5 使用ASCII代码存储图灵测试的开始字符
假设典型的图灵测试持续一个小时,在此期间,测试者大约提出了50个问题,并得到了50个答案,那么对应于测试的二进制数应该非常长。现在,假设有一个很大的数据库,储存了所有的图灵测试,这些图灵测试包含了50个或更少的已有合理答案的问题。
然后,计算机可以用查表的方法来通过测试。当然,一个能够处理这么大量数据的计算机系统还未存在。但是,如果计算机通过了图灵测试,Block问:“你认为这样的机器有智能吗?你感觉舒服吗?”换句话说,Block的批评意见是,图灵测试可以用机械的查表方法而不是智能来通过图灵测试。
约翰·塞尔(JohnSearle)对图灵测试的批评更为根本。想象一下,询问者像人们预料的那样询问问题—但是,这次用的是中文。另一个房间里的那个人不懂中文,但是拥有一本详细的规则手册。虽然中文问题以潦草的笔迹呈现,但是房间里的人会参考规则手册,根据规则处理中文字符,并使用中文写下答案,如图1.6所示。
图1.6 中文室的争论
询问者获得了语法上正确、语义上合理的问题的回答。这意味着房间里的人通晓中文吗?如果你的回答是“不”,那么人和中文规则手册的结合通晓中文吗?答案依然是“不”—房间里的人不是在学习或理解中文,而仅仅是在处理符号。同样,计算机运行程序,接收、处理以及使用符号回答,而不必学习或理解符号本身的意思是什么。
塞尔也要求我们设想,如果不是单个人持有规则手册这样的场景:在一个体育馆中,人们互相传递便条。当一个人接到这样的一张便条时,规则手册将确定这个人应该生成一个输出,还是仅仅传递信息给体育馆中的另一个人,如图1.7所示。
图1.7 中文室争论的变体
现在,中文的知识存在于何处?属于全体人,还是属于体育馆?
思考最后一个例子。描绘出一个确实通晓中文的人的大脑,如图1.8所示。这个人可以接收用中文提出的问题,并准确地用中文进行解释和回答。
图1.8 中文说话者用中文接收和回答问题
同样,中文的知识存在于何处?存在于单个神经元中,还是存在于这些神经元的集合中?(它必须存在于某个地方!)
Block和Searle对图灵测试进行批评的关键点在于,图灵测试仅从外部观察,不能洞察某个实体的内部状态。也就是说,我们不应该期望通过将拥有智能的智能体(人或机器)视为黑盒来了解到一些关于智能的新东西。
但是,这也并不总是正确的。19世纪,物理学家欧内斯特·卢瑟福(ErnestRutherford)通过用α粒子轰击金箔,正确地推断出物质的内部状态——它主要由空白空间组成。
他预测,这些高能粒子要么穿过了金箔要么稍微偏转。结果与他的原子轨道理论是一致的:原子由轨道电子包围着的致密核心组成。这是我们当前的原子模型,许多学过高中化学的人对此非常熟悉。Rutherford通过外部观察成功地了解了原子的内部状态。
总之,定义智能很难。正是由于定义智能以及判定“智能体”是否拥有这一属性很困难,因此图灵开发了图灵测试。在论文中,他含蓄地指出,任何能够通过图灵测试的智能体必然拥有“脑能力”来应对任何合理的、相当于人们在普遍意义上接受的人类水平的智能挑战。
《人工智能(第2版)》
[美] 史蒂芬·卢奇(StephenLucci)著
美国经典教材,在美亚上,被评价为自Russell&Norvig的《人工智能:一种现代方法》之后最好的教材,更加适合本科生使用。被誉为人工智能领域百科全书。
本书基于人工智能的理论基础,向读者展示全面、新颖、丰富多彩且易于理解的人工智能知识体系。本书给出诸多的示例、应用程序、全彩图片和人物轶事,以激发读者的阅读和学习兴趣;还引入了机器人和机器学习的相关高级课程,包括神经网络、遗传算法、自然语言处理、规划和复杂的棋盘博弈等。
本期评奖规则
在本文下方留言,说说你想要这本书的理由是什么~
我们会从留言用户中,按照留言点赞数,抽取排名在第2、4和6名的3位幸运者,送出本书。
开奖时间:8月7日当天(以当天小编开奖时看到的名次顺序为准)