博舍

张钹:中国人工智能奠基者 人工智能的专家

张钹:中国人工智能奠基者

张钹近影

张钹(左一)在实验室与博士生讨论。(1995年)

张钹(右)与张玲讨论人工智能学术问题。(1992年)

参与清华大学智能机器人实验室建设的科研人员合影。左一为张钹。(1985年)

科学家寄语

当前,全球科技创新进入空前密集活跃期,特别是新一代信息技术加速突破应用,推动新一轮科技革命和产业变革重构全球创新版图。人工智能作为新一代信息技术的战略重点之一,近年来获得长足进步,给经济社会发展产生了重大而深远的影响。

近年来,中国在人工智能领域表现亮眼,已成为世界人工智能主要创新中心之一。根据《人工智能发展报告2020》,在人工智能高层次人才数量和专利申请量等关键指标上,中国位居世界前列。这亮眼表现的背后离不开以中国科学院院士张钹等为代表的中国科学家作出的奠基性、开创性贡献。

早在40多年前,张钹就开始投身人工智能领域研究,发表了中国第一篇人工智能领域的学术论文、获得中国在人工智能领域的第一个国际重要奖项、领衔成立国内首个智能机器人实验室、培养了本土第一位人工智能领域博士毕业生,组建中国第一个人工智能国家重点实验室……这些“第一”树立了中国人工智能发展的一个个里程碑,推动中国在此领域大踏步前进。

从不被看好到刮目相看

中年成功转型研究人工智能

今天,“人工智能”是人们耳熟能详的热词,但是在40多年前,中国科技界对该词汇还很陌生,科技领域的专业人士对该领域也知之甚少。1978年,已从清华大学毕业留校任教20年的张钹由于所在系调整而改变专业方向,进入一个全新研究领域——人工智能。

张钹时年43岁,中年转型不仅知识结构上面临很大挑战,而且对人工智能领域国内知之甚少,求教无门。张钹回忆说:“当时国内科研人员对人工智能领域发展的认识很有限,甚至相关资料也非常少。”当时,国际上人工智能已经有了约20年发展历程。随着国门打开,国际科技合作与交流兴起,张钹获得了与国际同行交往的机会。

1980年初,张钹赴美访学。然而,抵达美国后,他就在与外国同行交流中感到一种说不出的尴尬和郁闷。“你们是从中国来的?知道什么是人工智能吗?”有外国研究者提出这样的问题。张钹很受刺激,立志让中国在人工智能领域奋起直追,迎头赶上国际先进水平,赢得外国同行的尊敬。

在访学过程中,张钹率先发现数学与人工智能结合的广阔前景。张钹说:“当时,我觉得人工智能要深入发展下去,提高算法效率,必须要很好利用数学这个工具。”于是,他选择跟数学出身当时尚在安徽大学任教的张铃教授合作,一起推进人工智能研究。

由于跨国电话资费昂贵,两人只能通过邮寄书信的方式进行沟通。对当年与张铃中美飞鸿、合作科研的往事,张钹介绍说:“当时,中美间一封航空信大概要人民币8角钱,寄给对方约10天才能收到,一来一回就要约20天。我们计算过,一封信如果超过5张纸,就会超重,须多付邮资。为了省钱,我们特意挑相对薄的纸,写非常小的字。”

就这样,张钹跟张铃开始了一场跨越大洋的人工智能合作研究。约1年后,他们联手完成了一篇人工智能领域的论文,实际上这也是中国科学家在人工智能领域的第一篇学术论文,成功发表于人工智能领域顶级国际期刊《IEEE模式分析与机器智能汇刊》,引起了国际同行的高度关注,这让张钹等中国学人颇为扬眉吐气,也增强了他为中国人工智能发展作出更大贡献的信心和决心。

从少年郎到白发翁

水木清华育人六十余载

1982年初,张钹结束访学回国,着手进一步开拓人工智能研究。为了解产业界对人工智能技术的需求,更好促进科技成果转化,张钹与其他科研人员一起深入从西南到东北的很多工厂调研,形成了基本判断:机器人将来会成为国内一项重大需求。

根据上述判断,张钹领衔组建了清华大学智能机器人实验室并着手购置重要试验装备。为此,张钹与同事们多方奔走、筹措经费,联系国内外相关厂家,进行洽谈协商。在有关方面的大力协助下,清华大学智能机器人实验室成功添置了中国第一台进口机械臂。

机械臂是高精度、高度非线性、强耦合的复杂系统,是人工智能的工业智能化应用的典型。对于清华大学智能机器人实验室而言,引入这款机械臂对于科研和教学无疑具有重要价值和意义。张钹对此非常期待并倾注了大量心血。他回忆说:“当我知道机器臂已经装上飞机,正在飞往北京时,那种兴奋真的难以言表。” 机械臂运抵北京后,张钹亲自跟车到机场“迎接”,直到搬运、装车、运抵清华园,他才终于松了一口气。

关于自己的职业生涯,张钹曾这样概括说:“我一辈子就做了两件事,一件是读书,另一件就是在清华大学教书育人。”

从毕业留校至今,张钹在清华大学的三尺讲台上坚守了超过一甲子。从不满24岁初登讲台的青涩年华到耄耋之年,他可谓桃李满天下,为国家培养、输送一批高科技专才,尤其是在人工智能领域。据统计,他培养的博士研究生近九十名。

万事开头难。人工智能作为当时中国的新兴学科,科研和教学的条件都很艰苦。张钹介绍说,那时候,虽然他们的研究已经有了一定基础,但是软硬件条件与国际同行相比,差距很大,研究资料也不足,特别是专业、权威资料匮乏,更多是靠自力更生摸索。在那样的环境下,想留住优秀人才着实不易。面对徘徊在出国或留校读博士并向他请教的学生,张钹语重心长地说:“国外知名导师的科研、教学水平比我高,培养条件也比我这里好。你们选择出国深造和科研,我非常支持。但是如果你选择留下来,我会全心全意地培养你,绝不辜负。”肺腑之言感人至深,与他交谈的学生大部分选择了留下来,与他并肩奋战在人工智能领域并成长为行业的佼佼者。

从一片空白到创新中心

中国人工智能造福全人类

路漫漫其修远兮,吾将上下而求索。张钹和志同道合者正视差距、风雨兼程,一路追赶着国际人工智能发展前沿,取得了丰硕成果。

1983年是张钹人工智能科研的丰收年。当年,国际人工智能大会在德国召开,张钹和张铃一起成为率先在国际人工智能大会上发表论文的中国科学家。1984年,他和张铃摘得一项欧洲人工智能奖项,成为首次获得该领域国际重要奖项的中国人。1985年,他领衔成立了中国首个智能机器人实验室。1987年,他培养的中国第一位人工智能领域的博士生毕业。1990年,他和同事一起成立了全国第一个人工智能国家重点实验室——“智能技术与系统”国家重点实验室。1987-1994年,张钹出任国家“863计划”即高技术计划智能机器人主题专家组专家,承担国家重点攻关课题。2018年,清华大学人工智能研究院成立,张钹出任研究院院长。

作为中国人工智能主要奠基者和发展推动者,40多年来,张钹矢志不渝致力于中国人工智能领域的创新,发表或共同发表了数百篇学术论文,出版系列专著。他获得了诸多奖项,其中包括ICL欧洲人工智能奖、国家自然科学三等奖、国家科技进步三等奖、国家教委科技进步一、二等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖,推动中国人工智能研究和产业向世界一流水平迈进。相关资料显示,中国在图像识别、语音识别等技术创新应用进入了世界先进行列,人工智能发明专利授权总量全球排名第一,核心产业规模持续增长。

“在第三代人工智能发展上,中国科学家今天与国际同行处在同一起跑线上。我们已经摸索出中国人工智能的发展道路,正在向新的科技高峰继续攀登,我们有能力为造福国家和民族、造福全人类作出更多、更大贡献。”张钹表示。

虽已经86岁高龄,但是张钹仍担任清华大学人工智能研究院名誉院长,活跃在科研创新领域。科技创新永无止境,人工智能技术发展永远在路上,矢志不移、创新不止的科学家永远年轻。这是张钹的写照。

(原载于《人民日报海外版》2021-08-3009版)

人工智能的历史、现状和未来

如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇,就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见,在这场关乎前途命运的大赛场上,我们必须抢抓机遇、奋起直追、力争超越。

概念与历程

了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。

人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。

人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:

一是起步发展期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。

二是反思发展期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。

三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。

四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。

五是稳步发展期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。

六是蓬勃发展期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。

现状与影响

对于人工智能的发展现状,社会上存在一些“炒作”。比如说,认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶,等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此,制定人工智能发展的战略、方针和政策,首先要准确把握人工智能技术和产业发展的现状。

专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定任务(比如下围棋)的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,人工智能系统诊断皮肤癌达到专业医生水平。

通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著,但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。

人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”,微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出,2016年全球人工智能研发投入超300亿美元并处于高速增长阶段;全球知名风投调研机构CBInsights报告显示,2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。

创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史,就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如,传统信息产业代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能相关产业的制高点。

人工智能的社会影响日益凸显。一方面,人工智能作为新一轮科技革命和产业变革的核心力量,正在推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来,需要抓紧提供解决方案。

趋势与展望

经过60多年的发展,人工智能在算法、算力(计算能力)和算料(数据)等“三算”方面取得了重要突破,正处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来,人工智能发展将会出现怎样的趋势与特征呢?

从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的重大挑战。2016年10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室,众多感知、学习、推理、自然语言理解等方面的科学家参与其中。

从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中,人机混合智能都是重要的研发方向。

从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习,但是深度学习的局限是需要大量人工干预,比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等,非常费时费力。因此,科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低人员成本。

人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。

人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来10年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,可在现有基础上将劳动生产率提高40%;到2035年,美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测,到2030年,约70%的公司将采用至少一种形式的人工智能,人工智能新增经济规模将达到13万亿美元。

人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出,未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。

人工智能领域的国际竞争将日益激烈。当前,人工智能领域的国际竞赛已经拉开帷幕,并且将日趋白热化。2018年4月,欧盟委员会计划2018—2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。

人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展,使其发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,制定完善人工智能法律法规,规避可能的风险。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构,旨在“以有利于整个人类的方式促进和发展友好的人工智能”。

态势与思考

当前,我国人工智能发展的总体态势良好。但是我们也要清醒看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。

高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月,国务院发布《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。

态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成为全球人工智能投融资规模最大的国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果,我国在人工智能领域发表的论文数量已居世界第一。近两年,中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院,2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说,我国人工智能领域的创新创业、教育科研活动非常活跃。

差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中,中国虽然入选人数名列第二,但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析,制定完善人工智能相关法律法规的进程需要加快。

前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。

当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等,需要深入思考。

树立理性务实的发展理念。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。实现机器在任意现实环境的自主智能和通用智能,仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此,发展人工智能要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。

重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。

构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强。我们要以问题为导向,主攻关键核心技术,加快建立新一代人工智能关键共性技术体系,全面增强人工智能科技创新能力,确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。同时,我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过实施标准加速人工智能驱动经济社会转型升级的进程。

推动共担共享的全球治理。目前看,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中,我国有望成为全球人工智能竞争中的领跑者,应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合“一带一路”建设,让“智能红利”助推共建人类命运共同体。

(作者:中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士)

2023年人工智能领域发展七大趋势

2022年人工智能领域发展七大趋势

有望在网络安全和智能驾驶等领域“大显身手”

人工智能已成为人类有史以来最具革命性的技术之一。“人工智能是我们作为人类正在研究的最重要的技术之一。它对人类文明的影响将比火或电更深刻”。2020年1月,谷歌公司首席执行官桑达尔·皮查伊在瑞士达沃斯世界经济论坛上接受采访时如是说。

美国《福布斯》网站在近日的报道中指出,尽管目前很难想象机器自主决策所产生的影响,但可以肯定的是,当时光的车轮到达2022年时,人工智能领域新的突破和发展将继续拓宽我们的想象边界,其将在7大领域“大显身手”。

增强人类的劳动技能

人们一直担心机器或机器人将取代人工,甚至可能使某些工种变得多余。但人们也将越来越多地发现,人类可借助机器来提升自身技能。

比如,营销部门已习惯使用工具来帮助确定哪些潜在客户更值得关注;在工程领域,人工智能工具通过提供维护预测,让人们提前知道机器何时需要维修;法律等知识型行业将越来越多地使用人工智能工具,帮助人们对不断增长的可用数据中进行分类,以找到完成特定任务所需的信息。

总而言之,在几乎每个职业领域,各种智能工具和服务正在涌现,以帮助人们更有效地完成工作。2022年人工智能与人们日常生活的联系将会变得更加紧密。

更大更好的语言建模

语言建模允许机器以人类理解的语言与人类互动,甚至可将人类自然语言转化为可运行的程序及计算机代码。

2020年中,人工智能公司OpenAI发布了第三代语言预测模型GPT—3,这是科学家们迄今创建的最先进也是最大的语言模型,由大约1750亿个“参数”组成,这些“参数”是机器用来处理语言的变量和数据点。

众所周知,OpenAI正在开发一个更强大的继任者GPT—4。尽管细节尚未得到证实,但一些人估计,它可能包含多达100万亿个参数(与人脑的突触一样多)。从理论上讲,它离创造语言以及进行人类无法区分的对话更近了一大步。而且,它在创建计算机代码方面也会变得更好。

网络安全领域的人工智能

今年1月,世界经济论坛发布《2021年全球风险格局报告》,认为网络安全风险是全世界今后将面临的一项重大风险。

随着机器越来越多地占据人们的生活,黑客和网络犯罪不可避免地成为一个更大的问题,这正是人工智能可“大展拳脚”的地方。

人工智能正在改变网络安全的游戏规则。通过分析网络流量、识别恶意应用,智能算法将在保护人类免受网络安全威胁方面发挥越来越大的作用。2022年,人工智能的最重要应用可能会出现在这一领域。人工智能或能通过从数百万份研究报告、博客和新闻报道中分析整理出威胁情报,即时洞察信息,从而大幅加快响应速度。

人工智能与元宇宙

元宇宙是一个虚拟世界,就像互联网一样,重点在于实现沉浸式体验,自从马克·扎克伯格将脸书改名为“Meta”(元宇宙的英文前缀)以来,元宇宙话题更为火热。

人工智能无疑将是元宇宙的关键。人工智能将有助于创造在线环境,让人们在元宇宙中体会宾至如归的感觉,培养他们的创作冲动。人们或许很快就会习惯与人工智能生物共享元宇宙环境,比如想要放松时,就可与人工智能打网球或玩国际象棋游戏。

低代码和无代码人工智能

2020年,低代码/无代码人工智能工具异军突起并风靡全球,从构建应用程序到面向企业的垂直人工智能解决方案等应用不一而足。这股新鲜势力有望在2022年持续发力。数据显示,低代码/无代码工具将成为科技巨头们的下一个战斗前线,这是一个总值达132亿美元的市场,预计到2025年其总值将进一步提升至455亿美元。

美国亚马逊公司2020年6月发布的Honeycode平台就是最好的证明,该平台是一种类似于电子表格界面的无代码开发环境,被称为产品经理们的“福音”。

自动驾驶交通工具

数据显示,每年有130万人死于交通事故,其中90%是人为失误造成的。人工智能将成为自动驾驶汽车、船舶和飞机的“大脑”,正在改变这些行业。

特斯拉公司表示,到2022年,其生产的汽车将拥有完全的自动驾驶能力。谷歌、苹果、通用和福特等公司也有可能在2022年宣布在自动驾驶领域的重大飞跃。

此外,由非营利的海洋研究组织ProMare及IBM共同打造的“五月花”号自动驾驶船舶(MAS)已于2020年正式起航。IBM表示,人工智能船长让MAS具备侦测、思考与决策的能力,能够扫描地平线以发觉潜在危险,并根据各种即时数据来变更路线。2022年,自动驾驶船舶技术也将更上一层楼。

创造性人工智能

在GPT—4谷歌“大脑”等新模型的加持下,人们可以期待人工智能提供更加精致、看似“自然”的创意输出。谷歌“大脑”是GoogleX实验室的一个主要研究项目,是谷歌在人工智能领域开发出的一款模拟人脑具备自我学习功能的软件。

2022年,这些创意性输出通常不是为了展示人工智能的潜力,而是为了应用于日常创作任务,如为文章和时事通讯撰写标题、设计徽标和信息图表等。创造力通常被视为一种非常人性化的技能,但人们将越来越多地看到这些能力出现在机器上。(记者刘霞)

【纠错】【责任编辑:吴咏玲】

人工智能的未来之路

人工智能的未来之路

演讲人:刘嘉 演讲地点:清华大学人文清华讲坛 演讲时间:2022年11月

演讲人简介:

刘嘉,麻省理工学院博士,心理学家,长期从事心理学、脑科学与人工智能研究。清华大学基础科学讲席教授、心理学系系主任、清华大学脑与智能实验室首席研究员、北京智源人工智能研究院首席科学家。

人的认知与大脑构造

为什么人如此难以理解?为什么这个世界总是让我们产生很多困惑?这是人类从有文明开始就一直存在的问题,道理其实非常简单。

首先,我们看见的世界只是这个世界中非常小的一部分,我们忽略了绝大部分的东西。

我们在清华做过一个小实验:一位戴黑色渔夫帽的女士在清华问路,在她问路的时候,我们安排一块隔板从戴黑色渔夫帽的女士和被问路的人之间穿过。当板子过来时,原来问路的女士抬着板子走开了,而原来抬板子过来的另一位戴蓝色渔夫帽的女士留了下来,由她继续问路。在7个被问路的人中,只有一个人注意到了提问人的变化。这个小实验的问路场景里,人们其实只看见了世界上非常小的一部分,由于这些是不重要的信息,人们就容易忽略掉这些信息。

但更可能发生的是,人们的认知还会扭曲这个世界。比如图1这一组图里,有两个拼在一起的方块图,一个颜色深一点,一个颜色浅一点,还有一个圆环,它的灰度介于两者之间,圆环左右两半颜色一样。但如果把两个方块图分开,大家一般都会觉得圆环的颜色一边变浅了,一边变深了,事实上,它们的颜色仍是完全一样的。再把这个圆环分开,变成上下移动,这时看见的东西有立体感了,好像是深灰色的东西盖上了一层浅色的毛玻璃,以及浅色的板盖上了深色的毛玻璃。

我们无时无刻不在观察这个世界,但又无时无刻不在扭曲这个世界,这到底是为什么?

这其实取决于我们的视觉系统。假如外部世界存在一个绿苹果,它会以大约100亿比特/秒的信息量进入我们的视网膜,视网膜通过约100万个神经连接,连接到视觉皮层,这个时候我们的信息流就从百亿比特/秒变成600万比特/秒;经过视觉初级皮层加工再传到高级皮层来决定看到的东西是什么时,信息流又变成了100比特/秒。这时信息量衰减了1亿倍。可见,当我们做决策时,我们获得的信息其实是非常有限的,所以我们就需要构造出新的东西,把缺失的信息补上,而我们的大脑就像魔术师一样来弥补这些缺失的信息。这一方面可以解释为什么有很多东西我们看不见——因为传输过程中已经被人脑衰减掉、过滤掉了;同时也可以解释,为什么有的人看见一个绿苹果会认为是红苹果——因为这个重构的过程是创造性的,不是简单复制。正是基于这个构造,我们也可以把一个苹果看成一个梨子,这是我们大脑构造的过程,是一个正常的现象。

人脑重构的意义

为什么我们的大脑不能像摄像机、照相机一样忠实客观地反映物理世界,为什么非要自己来重构这个世界?这样的人脑重构究竟有什么好处?

正如康德所言:“没有感觉支撑的知识是空的,没有知识引导的感觉是瞎的。”这句话的前半句说的是,如果没有外部的输入,我们很难构建自己的心理世界,但我想强调的是下半句“没有知识引导的感觉是瞎的”。如果你不知道你看的是什么东西,那你就等于什么都看不见。这是因为,这个世界是模棱两可的,需要我们去构造,把我们的理解加进去,只有这样我们才能真正知道这个世界究竟发生了什么。

与理解相比,更重要的是创造。当大脑没有被外部信息填满而留下空间时,我们能够在这空间里创造出自己想要创造的东西。正如《小王子》的作者圣·德克旭贝里所言:“一堆岩石在有人对着它思考时就不再是岩石了,它将化身为大教堂。”这就是人类了不起的创造——当我们的祖先跋山涉水来到一片荒原,他们看见的不是一堆乱石,而是未来的家园。所以,在过去的300万年里,人和猴子分开进化,人的大脑体积增加了3倍;但是,这体积并不是平均增加的,增加最大的地方在额叶:与200万年前的祖先能人相比,我们的头骨往前突出,以容纳更大体积的额叶,而强大的额叶使我们能构造出不存在的东西。比如我们的祖先准备去打猎,不用等看见猎物才做出反应,他只需要提前想象狩猎的情景,就可以把一切安排好。如此一来,人可以把未来在脑海里“演”一遍,构建出一个个可能的未来,从而对未来做出行动方案,这是人类能够战胜其他比我们更强大更凶猛的动物,成为万物之灵的关键。这也印证了荀子的一句话:“然则人之所以为人者,非特以二足而无毛也,以其有辨也。”

重构心理世界的知识从何而来

人脑对世界的构造,总是需要先验知识,而先验知识一部分来自基因的烙印。换言之,我们来到这个世界时并不是一块白板,而是带着32亿年的智慧来的,这些智慧就印刻在基因中。

我们曾经用我校心理系女教授和女博士后的照片,做了一个有趣的小实验:如果把她们的脸全部叠加起来,做一张“平均脸”,大家普遍反馈说这张“平均脸”充满两个字:“睿智”。“平均脸”所代表的意思是什么?人脸其实是我们的基因图谱——我们的基因都写在脸上,当我们把脸平均起来之后,得到的是这18位老师平均的基因,平均的基因代表突变很少。而基因一旦突变,大概率是有害的,基因突变越少,说明基因越好,携带遗传性疾病的概率就越低,这就是为什么人们普遍会觉得“平均脸”更好看、更符合我们的审美。

既然脸是我们的基因图谱,对生存来讲如此重要,我们便需要发展出非常强大的看脸能力,即面孔识别。我们研究小组已经通过实验证明,面孔识别能力也写在人类的基因里。我们找了两类双胞胎,一种是同卵双胞胎(由同一个受精卵发育而来),基本上具有100%相同的基因。另外一种是异卵双胞胎(由两个独立的受精卵发育而来),基因遗传物质的平均遗传度大概是50%。通过比较他们在面孔识别上的能力,我们发现同卵双胞胎在面孔识别任务上的相似程度更高,即面孔识别的能力受遗传因素的影响。这一点也可以从我们的另一研究得到验证,即面孔失认症或者大家说的“脸盲”。

在图2显示的这个遗传树里,只要孩子有面孔失认症,他的父母中大概率有一个也是面孔失认症。第二幅图里有一个有趣的三角,三角形底边的两个端点代表的就是同卵双胞胎。当时我们在大学里测试了一个女孩,发现她有面孔失认症,那女孩说她有一个同卵双胞胎姐姐,我们把她姐姐请来一测,发现果然也是面孔失认症。

“自尊”对大脑的影响

除了看别人的面孔,我们也常常照镜子看自己。最喜欢照镜子的人据说是纳西索斯,他是古希腊神话里的超级帅哥,对自己的面孔着了迷,每天趴在溪边,通过水的倒影欣赏自己的绝世美颜。心理学由此称这种现象为“纳西索斯情结”,意思是一个人高度自恋,对自己爱到了极致。

其实对自己的爱,对自己面孔的欣赏,背后反映的是一个非常重要的特质,即人类的自尊。自尊是个体对自己的总体态度,人分成高自尊和低自尊两种。

什么是高自尊?这里有四个问题:1.你是否认为你是一个有价值的人?2.你是否认为你拥有很多美好的品质?3.你是否对自己满意?4.你是否对自己持肯定态度?

如果你对每道问题的回答都是“是”,那么你就是高自尊的人。“自尊”在我们面临困境时能提供极大的帮助。

当一个人长期经受压力和苦难,身体会变得差,心理幸福感会低下,更糟糕的是,认知发展会受损,认知能力会比别人低很多,体现在大脑上就是海马体会受到极大的损伤,而海马体是人学习、记忆、空间导航的中枢。

自尊在压力源和心理世界之间建立起一道牢不可破的防线,它就像勇敢的士兵一样挡在人的心理世界面前,帮人把压力、负性事件挡在外面,让人能够正常、健康地成长。人有两种资本,一种是物质资本,一种是心理资本,自尊自信、理性平和,这些就是心理资本。物质资本富裕的人未必有高自尊,而处境不利的人没有丧失他的自尊与自信时,就很可能在触达低点时再反弹,并达到人生新的高度。

我们所处的物理世界永远是不完美的,总有让人不满意之处,但是每个人可以在一个不完美的物理世界里构建出一个美好的心理世界。为什么?因为我们的大脑就是一个构造体,从物理世界所接收到的信息,经过大脑的工作,可以构建出一个完美的心理世界。这正印证了社会心理学家班杜拉所说的一句话:“人既是环境的产物,也是环境的营造者。”

人的双链进化

人和动物的进化有着本质的区别。动物是按照基因,按照达尔文的进化论,一点点试着生存、前进。人除了有代表着过去的生物基因的演化,还有另外一条演化线,即基于社会基因(Meme)的演化,而这条线带着我们以与动物不一样的方式前进。

生物基因由一些碱基对构成,那社会基因是什么?远古时,我们的祖先中有一位突然因为某种原因能够把火生起来了,一种知识、技能被创造出来,这就相当于基因在突变,一个优秀的基因产生了。会生火的这种技能、知识就像基因一样开始传播给其他人,从一个部落传到其他部落,慢慢地生火就从个人拥有的技能变成人类拥有的技能。渐渐地,人们又开始会制作长矛和其他工具,经过漫长的发展,逐步构建成今天的人类社会。这就是为什么我们一直强调知识、文明是如此重要,而大学就是文明的产房。孟子说过:“人之所以异于禽兽者几希;庶民去之,君子存之。”这里的“几希”就是我们的文明,就是我们在演化过程中所创造所传播的社会基因。

科技发展的主要目的之一,是要让知识的扩散变得更快、更便利。大约在六千年前,人类最早的文字楔形文字在新月地带被发明出来,使得人类的知识技能可以被记录下来,可以被忠实传播。之后的活字印刷,以至今天的电话、电报、互联网等等这一切,使得我们能够更加高效地把知识传播出去,推动文明加速演化。

人类的文明时代大约可以分成三个阶段:第一个阶段是原始文明,大约经历了两百多万年,它的前十万年和后十万年没有什么太大变化。第二个阶段是农业文明,大约经历了四千多年,这个时候人类开始变成文明种族,懂得了一些天文地理知识等等,学会种植庄稼,可以驯服野兽,把它们变成家畜,但发展依然十分缓慢。真正带来巨大变化的是第三个阶段,即工业文明。工业文明从开始诞生到现在,不过是短短三百年;但在这三百年里,变化是如此之快,以至于我们不得不将它再细分成四个阶段,第一个阶段是机械化时代(1760-1840年代),出现了蒸汽机等。第二个阶段是电气化时代(1840-20世纪初),出现了电力等。第三个阶段是自动化时代(1950-21世纪初)。而第四个阶段,就是我们现在所处的信息时代。

人工智能的进展

2002年,我的博士论文答辩题目是《面孔识别的认知神经机制》,在答辩的第二张PPT里我这么写道:“现在最先进的机器识别面孔的正确率只能是随机水平,而人类能够在一秒钟内识别上百张面孔,为什么人类如此伟大,为什么人类如此聪明,为什么机器如此愚笨?”

在2002年,机器识别人脸还可以说是“一塌糊涂”。到了2015年,我作为江苏卫视《最强大脑》的总策划,设计人机大战项目,即机器和人比拼面孔识别,看谁的能力最强。比赛的结果让我震惊:经过十几年的发展,人工智能已经强大到在人脸识别上胜过人类的最强大脑。我当时非常庆幸我的博士论文是在十几年前答辩的;如果我现在这么开题,可能就拿不到博士学位了。

当时除了震惊,还有好奇:人工智能究竟是靠什么来达到和人一样的面孔识别水平,甚至超越人类的水平?

我们建立了一个人工神经网络,训练它去识别性别,即区别是男性还是女性,它的正确率能达到100%。这个神经网络究竟是靠什么把男性和女性区分开?我们找了一张中性面孔,就是把男性和女性面孔求平均,给它加上随机噪音,然后“喂给”人工神经网络,它有时候会判断这个图是一个女性,而这个面孔加上其他噪音,则会被判断为男性。于是,完全一样的底图,加上不同的噪音,就会得到一组被人工神经网络认为是女性的图和一组被认为是男性的图。当把这组被认为是女性的图中的中性面孔去掉,只留下噪音时,这些噪音叠加起来,我们得到的就不再是随机噪音,而是人工神经网络用于识别女性的内部表征。同样,我们也可以得到男性面孔在这个神经网络中的内部表征。进一步,我们把两者相减,就得到了人工神经网络用以区分男性和女性的模式。在这个模式里,可以看到,眼睛、眉弓、鼻子、人中是它认为的区分男性和女性的关键特征。而这些关键特征,的确是我们人类用于区分男性和女性的关键特征,它们的相似度达到了0.73,这是非常高的相关度。但是,自始至终,我们并没有告诉过这个人工神经网络:你应该用什么方式去识别男性和女性;只是要让它做这件事情,它就会产生跟人类类似的内部表征、认知操作,从而完成性别判断。也就是说,人工智能在这个过程中呈现出和人类一样的心理世界。

在那一刻我开始意识到,生物过去的进化都是一条单线,基于碳基的方式运行。但是当人类创造出人工智能之后,人类文明就很可能不再是平滑向前,接下来或许会出现一种革命性的跃迁,可能在文明的进化中出现奇点。

为什么这么说呢?我们来看人类和人工智能的三大区别。

第一,算力。人类的大脑通常重3.5斤左右,虽然只占我们体重的2%,但消耗了我们身体25%以上的能量,因此它是一个耗能大户,已经达到了我们身体能够支撑的极限。所以,人类的大脑看起来已经到了进化极限,再给一千年、一万年,人类的大脑很可能不会变得更大,聪明程度也不会增加。但是对于人工智能来说,一块CPU不够可以再加一块CPU,一块硬盘不够可以再加一块硬盘,理论上它有无限的算力和无限的存储能力。

第二,寿命。人的寿命是有限的,再伟大的思想也有停止的一刻。但人工智能的寿命是无限的,CPU烧了可以换块CPU,电线断了再换根电线就行。

最关键的,是人工智能的无尽可能。对于人类而言,一般来说有两种知识,一种是可以描述的明知识,比如牛顿定律。一种是可以感受但难以描述的默知识,比如骑自行车的知识。此外还有第三种知识,是人类所没有而机器拥有的,即暗知识,它不可感受,不可描述,不可表达,它是存在于海量数据中万世万物之间的联系,数量极其巨大,人类无法理解。

2016年,AlphaGo击败了人类围棋顶尖高手之一李世石。当时世界围棋积分排名第一的围棋手柯洁说:“我们人类下了2000年围棋,连门都没入。”棋圣聂卫平说:“我们应该让阿老师(AlphaGo)来教我们下棋。”这不是他们谦虚,而是事实。一个人不吃不喝一辈子所下的围棋最多也就是10万盘,而从人类发明围棋到现在,累计总共下了大约3000万盘围棋。而围棋的空间有多大呢?一个格子可以有三种状态,放白棋、放黑棋或者不放,而棋盘总共有19×19个格子,所以它的状态总共有319×19种,大约等于10172,这比整个宇宙中的原子数量还要多。相对于如此庞大的围棋空间,人类的两千多年探索,只是这个空间里一个微不足道的小点,而大部分空间还是一片黑暗。AlphaGo之所以比人类更加强大,并不是它比人类聪明,而是因为它探索了更大的空间,因此找到了更多下法而已。牛顿曾说:“我就像在海边玩耍的小孩,偶尔拾到美丽的贝壳,就高兴不已。但面对真理海洋,我仍一无所知。”现在看来,这不是牛顿谦虚,而是实情。

再看一下艺术。目前人工智能已经可以制作达到专业水平的绘画(图3、图4)和音乐。此外,律师、医生、税务师、咨询师等需要非常专业的知识的“金领”职业,也逐渐出现了人工智能的身影,看起来很可能有一天会被人工智能取代。神经网络之父、深度学习的创始人杰弗里·辛顿(Geoffrey Hinton)接受麻省理工学院的《Tech Review》采访时说:“将来深度学习可以做任何事情。”

人工智能与类人智能的巨大差距

人工智能真的已经无所不能吗?心理学家考验了当时最先进的人工神经网络模型GPT-3。他们认为之所以GPT-3显得非常聪明,是因为问了它智能的问题。假设问它一些很“弱智”的问题,它会怎么回答?他们问它:“我的腿上有几只眼睛?”这个连没有上过学的小孩都能正确回答的问题却难倒了GPT-3,它回答说:“你的腿上有两只眼睛。”这表明它并不理解眼睛是什么,它只是在做关联而已——人有两只眼睛,腿是人的一部分,所以它认为腿上应该有两只眼睛。这个例子充分印证了爱因斯坦名言:“任何傻瓜都知道,关键在于理解。”GPT-3知道但并不理解眼睛究竟是什么,而理解,恰是我们人类真正了解这个世界、能在这个世界里自由徜徉的关键。

杰弗里·辛顿显然也意识到了这个问题,他表示,我们可以进一步发展人工智能,当一个人工智能能够准确描述一个场景,它就是理解了。真是这样么?假设有这么一个场景:有个人从柱子上狠狠摔了下来,摔倒在地。如果让人工智能来描述这个场景,它会说一个人从柱子上掉下来了。而我们对这个场景还有一个很重要的反应——“疼”。这个区别体现了人类具有一种特别重要的能力,即共情:别人遭受了苦难我能感同身受,而这种感受是自动的。共情不是一种奢侈品,而是一种必需品,因为当一个孩子没有这种感同身受的能力,缺乏同理心,他在小时候就很难对父母产生依恋,很难和其他小朋友玩到一起;在长大以后,会对社交常情缺乏理解,对他人情绪缺乏反应,不能根据社交场合调整自己的行为,有可能做出反社会的行为。假设我们的未来是由一台台没有共情的机器所组建的“自闭症”式的社会,这个社会还能有文明吗?这个社会还能有发展吗?所以,人工智能的奠基人之一马文·李·明斯基说过这么一句话:“现在的问题不是一个智能的机器是否拥有情感,而是不拥有情感的机器是否能拥有智能。”在马文·李·明斯基看来,情感是智能的基础,得先有情感才有智能。

又如在好莱坞电影里,美国的黑手党跑去找一个店家说:“你这个蛋糕店看上去真不错,如果意外发生火灾烧掉那就太可惜了。”请问这个黑手党的话是什么意思?A:请店家做好消防工作,别烧掉了店铺,那样太可惜了。B:请店家交保护费,要不然就要烧掉店铺。对我们而言,答案显而易见是B,是黑手党在威胁并勒索店家。但是对于机器来说,它还很难理解这话背后隐藏的推理和因果。正如古希腊哲学家德谟克利特所言:“我宁可找到一个因果的解释,也不愿成为波斯人的王。”对人而言,我们认为万事万物都是有因果的,而正是这种对因果的执着使我们能够推理,能够把零散的万世万物联系在一起,构成一个个故事。

其实笛卡尔四百多年前就说过:“即使机器可能在某些方面做得和我们一样好,甚至更好,但它们在其他方面不可避免地会失败。这是因为它们不是通过理解而只是根据预设来行动。”这一点,到现在还没有发生本质的改变。

所以,虽然目前人工智能取得了很高的成就,但是和人的智能仍然存在巨大差距,依然没有达到类人智能。那么未来如何实现类人智能呢?我认为,关键点就在于脑科学+人工智能。

举个简单的例子:线虫是一个非常简单的生物,只有302个神经元。但是,麻省理工学院的研究者模仿了其中19个神经元,就完成了自动驾驶这个任务,其参数比传统的大模型足足低三个数量级,只有75000个参数,而这个仿生的人工神经网络对不同道路具有非常高的通用性和可解释性,以及非常强的鲁棒性。仅仅模仿来自简单生物的19个神经元,就可以完成自动驾驶的初步任务,这是因为生物不是靠神经元的数量取胜,而是靠32亿年进化形成的智慧取胜,这项研究模仿的其实是32亿年进化形成的智慧。从这个角度讲,人类的大脑是目前世界上最聪明的大脑,有860亿个神经元,平均每个神经元有3000个连接,它代表着宇宙中在智力上所能达到的最高成就。那么,人工智能为什么不能向人脑学习,以人脑为模板、以人脑为借鉴,来发展出更好的人工智能呢?

对线虫神经元的模仿,只是一个开始,下一步也许我们会去模仿神经元数量百万级的果蝇、更高量级的斑马鱼,甚至小鼠、大鼠、猕猴,最后是人类。仅仅从神经元的数量上来讲,这就是一个巨大的挑战,因为神经元的数量足足差了9个数量级,而还有更多更大的挑战来自机制和算法,以及更多的未知。但是我坚信,脑科学加上人工智能,有一天也许能够造出一个媲美人脑的数字大脑。

小结

莎士比亚说:“所谓过往,皆为序章。”我们的现在是过去的未来,已经写定,但我们的此刻绝对不是未来的过去,因为我们的未来是未定的,取决于我们现在如何做出选择。

人类发明了人工智能,在今天随着算力的增加、技术的进步,它开始有了超越人类的可能。我们现在需要对具有一切可能的未来做出选择。

在我看来,未来大约有三种可能。第一种,人工智能像科幻电影《星球大战》里的R2-D2一样,是人类忠实的伙伴,成为人类非常好的朋友,帮助人类变得更强大。第二种可能,我们构建出一个数字大脑,它的能力可能比现在人类的大脑更强,这时可以实现人机合二为一,把我们的意识、记忆、情感上传到这个数字大脑里,如果CPU坏了就换一块CPU,内存需要扩大一点就加点内存,这样人就可以获得精神上的“永生”。未来学家库兹韦尔在《奇点来临》这本书中认为大约在2045年,这一刻就会到来。第三种可能,就是科幻电影《终结者》里所展示的,人类文明消失。

未来会怎么样,最终取决于我们现在做什么。这很重要,因为我们今天站在了这个进化的节点之上。

《光明日报》(2022年12月24日 10版)

[责编:孙宗鹤]

人工智能——专家系统从诞生到发展

文/陈根

自从1965 年世界上第一个专家系统 DENDRAL问世以来,专家系统的技术和应用,就在短短的30 年间获得了长足的进步和发展。尤其是在80年代中期以后,随着知识工程技术的日渐丰富和成熟,各种各样的实用专家系统推动着人工智能日益精进。

专家是指在学术、技艺等方面有专门技能或专业知识全面的人;特别精通某一学科或某项技艺的有较高造诣的专业人士。通常来说,专家拥有丰富的专业知识和实践经验,或者说专家们拥有丰富的理论知识和经验知识。专家还应该具有独特的思维方式,即独特的分析问题和解决问题的方法和策略。

专家系统,就是从“专家”而来,专家系统(ExpertSystem)也称专家咨询系统,是一种智能计算机(软件)系统。顾名思义,专家系统就是能像人类专家一样解决困难、复杂的实际问题的计算机(软件)系统。可以说,专家系统是一类特殊的知识系统。

作为基于知识的系统,建造专家系统就需要知识获取,即从人类专家那里或从实际问题那里搜集、整理、归纳专家级知识;知识表示,即以某种结构形式表达所获取的知识,并将其存储于计算机之中;知识的组织与管理,即知识库;建立与维护等和知识的利用,即使用知识进行推理等一系列关于知识处理的技术和方法。

DENDRAL作为世界第一个专家系统,由美国斯坦福大学的费根鲍姆教授于 1965年开发的。DENDRAL是一个化学专家系统,能根据化合物的分子式和质谱数据推断化合物的分子结构。

20世纪 70 年代,专家系统趋于成熟,专家系统的观点也开始广泛的被人们接受。70年代中期先后出现了一批卓有成效的专家系统,在医疗领域尤为突出。MYCIN就是其中最具代表性的专家系统。

MYCIN 系统是由EdwardH.Shortliffe等人于1972 年开始研制的用于诊断和治疗感染性疾病的医疗专家系统,其不仅能对传染性疾病作出专家水平的诊断和治疗选择,而且便于使用、理解、修改和扩充。此外,它可以使用自然语言同用户对话,并回答用户提出的问题,还可以在专家的指导下学习新的医疗知识。

MYCIN 第一次使用了知识库的概念,并使用了似然推理技术。可以说,MYCIN 是一个对专家系统的理论和实践都有较大贡献的专家系统,后来的许多专家系统都是在 MYCIN 的基础上研制的。

进入20世纪80年代,随着专家系统技术的逐渐成熟,其应用领域迅速扩大。20世纪70年代中期以前,专家系统多属于数据解释型(DENDRAL、PROSPECTOR、 HEARSAY 等)和故障诊断型( MYCIN、CASNET、INTERNIST 等)。它们所处理的问题基本上是可分解的问题。

20世纪70年代后期,专家系统开始出现其他的类型,包括超大规模集成电路设计系统KBVLSI、自动程序设计系统 PSI 等设计型专家系统;遗传学实验设计系统MOLGEN、安排机器人行动步骤的NOAH等规划型专家系统;感染病诊断治疗教学系统 GUIDON、蒸气动力设备操作教学系统 STEAMER 等教育型专家系统;军事冲突预测系统 IW 和暴雨预报系统 STEAMER 等预测型专家系统。

与此同时,这一时期专家系统在理论和方法上也进行了较深入的探讨。适于专家系统开发的程序语言和高级工具也相继问世。尤其是专家系统工具的出现又大大加快了专家系统的开发速度,进一步普及了专家系统的应用。

20世纪80年代,专家系统在生产制造领域中的应用已非常广泛,比如CAD/CAM和工程设计、机器故障诊断及维护、生产过程控制、调度和生产管理等。这些应用在提高产品质量和产生巨大经济效益方面带来了巨大成效,从而极大地推动了生产力的发展。

专家热议人工智能时代的数字素养

6月19日,由全民数字素养与技能培训基地主办、腾讯研究院与腾讯学堂承办的“打开:人工智能时代的数字素养”活动在深圳举行。随着人工智能技术迎来新突破,并预示着数字技术将给社会带来更大变化,“应该以怎样的数字素养迎接人工智能时代”这一问题成为人们关注的热点。

腾讯全民数字素养与技能培训基地负责人、腾讯研究院总顾问杨健在会上致辞。腾讯IEG用户平台部高级运营经理张煜瑾、腾讯研究院高级研究员王健飞、腾讯青少年科技学习中心总监凌云分别进行了精彩的主题分享。在圆桌讨论环节,国家工业信息安全发展研究中心信息政策所数字经济研究室主任殷利梅、深圳大学计算机视觉研究所所长沈琳琳教授、中国青少年宫协会媒介与教育工委会副主任张海波、教育立法研究基地(教育部-华南师大共建)秘书长马颜昕等嘉宾共话对数字素养的理解与展望。会议由腾讯研究院高级研究员陆诗雨主持。

“打开”思路:人工智能时代的数字素养将会更加前沿、更有挑战性

“深圳的夏天时而暴雨倾盆、时而晴空万里,变幻无常,这恰巧跟近期人工智能的新突破给我们带来的感受类似。”在活动开场环节,腾讯全民数字素养与技能培训基地负责人、 腾讯研究院总顾问杨健以天气作为比喻,描述了人工智能技术给人们带来的“不确定”感受。他表示,在这样的背景下,人们更需要以数字素养来应对人工智能等数字技术带来的复杂挑战。

“数字素养内涵的演变,可以分为四个阶段:一是1.0阶段的未成年人网络保护;二是2.0阶段的青少年发展;三是3.0阶段全民数字素养与技能的提升;四是4.0阶段的人工智能时代的数字素养。”杨健认为,这四个阶段表现出越来越复杂的特征,而人工智能时代的数字素养,将会更加前沿、更有挑战性。

他指出,近期以ChatGPT为代表的AIGC应用带来巨大的想象空间,在可以直接转化为生产力的同时,也启发人们思考一系列的问题:AIGC带来的究竟是技术门槛降低之后的平权,还是技术门槛更高的新的两极分化和“数字鸿沟”?同时,结合全球科技竞争视角,还要考虑AIGC带来的效率革命、成本革命和交互革命,以及我们参与全球竞争的应对方式等前沿问题。杨健表示,AIGC的话题,比以往数字技术引发的未成年人保护、数字适老等问题更复杂,也更有挑战性。

“从创新周期和普及速度来看,新技术对社会的影响已经越来越深刻,远超预期。”杨健介绍,腾讯研究院长期关注前沿数字技术的发展及应对,用“打开”这个关键词作为活动的主题,传达了一种期待——期望与会嘉宾和社会各界一起,打开思路,共同关注数字技术的机遇与挑战,以及全民数字素养与技能提升等前沿话题。

多元实践:借助科技的力量促进青少年教育、“新农人”培训创新

在活动的主旨演讲环节,三位嘉宾分享了腾讯数字素养与技能培训基地在数字素养与技能培训领域的积极探索。

腾讯IEG用户平台部高级运营经理、全国青少年人工智能追梦营负责人张煜瑾介绍,腾讯未保团队从2019年就开始探索如何以游戏科技助力青少年科学素养提升,并孵化了腾讯扣叮平台和腾讯未来教室项目。

张煜瑾表示,开展项目之前,团队调研发现,全国青少年数字素养的提升在设施、师资、课程、学习出口等方面存在多重困境。由此,腾讯以游戏科技为依托研发了腾讯扣叮平台,研发十大国产自研编程学习实验室,以适应小、初、高不同学龄段、不同编程语言的学习需要。其中,凭借“高仿真”“低耗能”“强AI”三大游戏科技特性,腾讯扣叮于2022年推出了“虚拟仿真实验室”,助力青少年、学校及教育单位,摆脱了硬件桎梏,win7系统的低配电脑就可接触并学习前沿的机器人编程知识。该实验室率先落地广州,走进全市1400余所学校,惠及近百万师生,相关普及成果还入选了2022年广州市十大民生事件。

腾讯扣叮也打造了“全国青少年人工智能追梦营”品牌活动,为全国青少年,尤其是欠发达地区的师生带去体系课程、培训及赛事活动参与机会。目前已经在全国30多个省级行政单位12000余所学校落地,课程累积使用次数超240万人次。张煜瑾介绍,在人工智能技术快速发展的背景下,这个项目积极支持了人工智能教育解决方案的落地与普及。

2021年9月,腾讯成长守护、腾讯游戏联合腾讯SSV推出“智体双百”计划,从科技和体育两个维度,为城乡孩子打造线上+线下的“未来教室”和“未来运动场”,发挥腾讯游戏的科技力和产品力,探索游戏化学习的可能性。未来教室主要以线上线下一体化方式,助力师生科学素养的提升;截至目前,已在全国落地36间,覆盖全国14个省、直辖市及自治区,开设科技课超过9066课时,覆盖29.5万人次初中生;还打造了“未来教室”小程序,供全国科创教师交流和分享,已累计全国各地8.41万科创老师,在小程序上分享教育日常及科创干货。

腾讯研究院高级研究员王健飞分享了以视频号直播电商培训助力“新农人”提升数字素养的实践。他介绍了对农村电商发展现状的观察,认为当前乡村电商已经有了很好的基础设施,但成长空间仍然很大。在电商平台上,个体新农人自己卖货的成功比较少,人们主要是从头部大主播或者做出影响力品牌的二级、三级的供应商手上买商品。

究竟是什么阻碍了新农人做电商?“我们通过访谈发现,不是因为乡镇的用户数字素养差,而是开网店的门槛非常高。”王健飞介绍,由于开店工作的复杂性,“新农人”往往希望有大学生合伙,而县城的人才缺失导致了电商发展的恶性循环:当地产业发展不起来,大学生很难回到当地就业,大学生作为数字素养高的人不回去,当地的产业又不可能发展起来。

王健飞表示,基于这一情况,去年腾讯西南总部、腾讯研究院和微信共同在重庆市三个县开展了视频号“新农具”计划,助力没有深入实践直播带货的新农人使用短视频工具,并实践了线下培训+线上陪跑+本地裂变“三步走”的方式:第一步,线下培训;第二步,线上陪跑,由专门的陪跑老师给予直播带货的技巧指导,并为学员之间建立联系;第三步,培养出当地的小MCN或者主播的领头人,发挥裂变和带动效应。

“我们在三个县市进行了试点,总共培育了150个学员,其中一个明星学员是何财明,2022年年末他的销售额突破2000万,三分之二的收入都来自直播带货,因为直播带货减少中间环节,每双鞋的利润上升了25%。”王健飞表示,今年新农具项目团队也会对这个模式进行调整,探索让项目的效果更好。

腾讯青少年科技学习中心总监凌云介绍了该团队在过去7年所做的探索。她介绍,腾讯青少年科技学习中心是腾讯人力资源体系下专为青少年提供科技学习和发展平台的专业团队,运用腾讯在人力资源、多产业业态、前沿技术与产品的资源与力量,打造了青少年“学-训-战”螺旋式上升的培养模式。其中,“腾讯Mini鹅系列”面向未来的应用型人才,通过课题研究、假期营地、互动展览和企业见习等模式,助力青少年跨学科实践与综合素质提升,青少年运用数字IP、微信小程序、音乐与视频等工具创作多元原创作品,表达他们对文化传承、乡村发展、老龄化等真实社会的思考,让互联网技术、工具、数据助力青少年的小创意、大梦想。

“今年年初ChatGPT的横空出世,带来技术加速发展的同时,也引发了很多社会热议,”凌云指出,“孩子们对于技术变化的敏锐度一点不弱于我们,与AI共存将渗透到他们未来从事的各行各业。为了让孩子们理解技术原理和人机协作的逻辑,我们自研了一款人工智能学习产品,用游戏化AIBot竞技、AI经典算法互动学习项目,帮助孩子们简单易懂AI原理、轻松上手AI实践。”凌云介绍,这款产品充分发挥腾讯在互动化、可视化、游戏化等方面的优势,支持国家级白名单赛事和各省市赛事和活动,为学校教师提供课堂教学的工具及精品内容,为更多未来向工程实践人才方向发展的青少年打开专业的第一扇门。

凌云表示,在全球顶尖科研领域,青年英才、天才少年一直是值得珍视的宝贵人才,积极提供专业培养土壤和前沿实战机会,为国家培养及储备拔尖创新人才也是我们的使命。中心联合腾讯安全、量子、AI多个前沿实验室,由腾讯科学家团队带队,带领中国最顶尖的计算机领域科技少年挑战高精尖课题,“星火计划”少年团在行业赛事、专利、学术论文、专业白皮书各方向上都取得了非凡的成绩。在国家战略的安全领域,星火学子在安全世界杯、国家强网杯、GeekPwn上创出多个高中生首例。

拥抱未来:数字素养研究不是“曲高和寡、阳春白雪的事业”

在圆桌环节,来自政策研究、教育、科技、法律等不同领域的嘉宾们,以多元的视角,共同讨论他们对数字素养的理解与展望。

如何理解数字素养的核心?针对这一问题,国家工业信息安全发展研究中心信息政策所数字经济研究室主任殷利梅阐述了自己的理解。她认为,数字素养与技能,就是每个人对数字化的适应力、创造力,每个人对于应用数字技术、使用数字技术、驾驭数字技术的能力。“素养”和“技能”并重,不能偏废其一,“素养”更强调综合的素质底蕴,“技能”更偏重于在工作当中所具备的数字技术应用能力。《提升全民数字素养行动纲要》提到四大应用场景,涉及怎么利用技术享受更便捷和优质的生活,能够更高效地学习和工作,甚至做一些非常有突破性的创新。

殷利梅表示,《提升全民数字素养行动纲要》的编制,考虑了人的生命周期,数字素养培育要覆盖到每个群体,一个都不能少。未来希望全民数字素养与技能培训基地这个平台,能够触达更多的群体,让他们能够有机会通过基地的各种资源得到培训和体验。她表示:“首先是围绕资源建设能够向社会提供大量优质的社会培训资源;其次是加强师资队伍的建设、志愿者团队建设;此外还要设计一系列活动,无论是培训活动还是展览展示、体验项目、公益项目等等。这些都是基地在下一步要考虑的重点工作方向。”

全国第一套进入国家基础教育课程的网络素养教材主编、中国青少年宫协会媒介与教育工委会常务副主任张海波,在丰富的青少年教育一线工作基础上,提炼了青少年数字素养的三重意义——有“246”三种理解。他表示,用2个字来解释数字素养,就是“善用”,即善用技术,并用它做善事;用4个字解释数字素养,就是“趋利避害”,即认清技术的两面性和“双刃剑”功能;用6个字解释数字素养,就是需要保障数字技术的安全、健康、文明。

张海波表示,一是需要确保技术对个体来讲是安全的,二是保障内容是能够促进青少年身心健康发展的,三是要保证技术构建的社会是文明的,无论是网络社会、数字社会还是人工智能社会,人类的交往文明都是底线。他还提出,在数字素养与技能提升的过程中,我们不应以大人优于儿童的预设成见去推动,而要和儿童有一个平等的心态及眼光来看待。张海波开展的儿童参与式数字素养教育实践显示,儿童更愿意尝试新鲜事物,他们学习掌握数字素养往往比成年人更快,很多时候是儿童反哺老年人。

华南师范大学法学院研究员、数字政府与数字经济法治研究中心主任、教育立法研究基地(教育部-华南师大共建)秘书长马颜昕指出,人工智能时代,对于数字素养应该有两重理解:一是“应对这个世界复杂性的能力”,人工智能时代,我们需要重新理解变化的、复杂的世界,教会孩子辨别什么是真的、什么是假的,比起输出结果,更重要的是面对不断变化和复杂的社会,他们能选择更加正确的工具。二是“价值判断的能力”,至少在现阶段,价值判断仍然是人类最后的竞争优势和阵地,包括价值冲突上的判断、审美的判断、主观上的判断等。

“数字素养与技能提升的核心在于全民。”马颜昕以“数字粤菜”为例,指出即便是过去我们认为最传统的、依赖于师傅传承的领域当中,数字素养也在发挥越来越重要的作用。同时他在实践调研中发现,大多数家庭中父辈的数字素养与技能远弱于青少年,缺乏辅导青少年的能力。所以,要通过全民尤其是成年人的数字素养与技能提升,为下一代数字素养与技能的提升提供社会孵化环境。

他表示,在教学场景中,问题的关键不在于学生会不会用AIGC工具,而在于能不能用,所以应考虑制定场景化的使用指南,明确使用规则。“就像考试可以用计算器,但不能带有联网和编程功能的设备,这是被限定的技术工具,在教育领域大家应该有一个共识。”

鹏城学者、深圳大学计算机视觉研究所所长、大数据系统计算技术国家工程实验室副主任沈琳琳教授指出,当前不同行业的数字素养以及对人工智能的理解都存在落差,各行各业的人都需要对AI技术的开发过程有所了解、认知,这也是人工智能时代全民数字素养与技能提升的一部分。

“我做一些高中科普讲座,主要是科普AI技术是什么,包括涉及哪些核心技术、上个世纪五十年代以来的发展历史等,我希望青少年明白任何东西都有起落,并鼓励他们做自己感兴趣的事情,不必盲目跟风。同时,需要用他们听得懂的话知道AI是什么东西,让他们知道至少从目前的技术来讲,AI不可能毁灭世界。”沈琳琳表示,通过这些活动,能够让普通的学生或者传统行业从事者更加理解AI技术,让AI更好地服务各行各业的进步。

沈琳琳认为,人工智能行业有很多种不同水平的工作类型,不同能力的人可以在金字塔的不同位置找到适合自己的岗位,并依靠自己的兴趣和努力,不停上升直至塔顶。“不管你原来的起点如何,只要你坚持做下去,最后总能够成功。”

杨健在会议的总结发言中指出,通过这场精彩的研讨能够更进一步感受到,数字素养研究不是曲高和寡、阳春白雪的事业,而是与每个人的未来息息相关。他表示,“全民数字素养的培育和生长,需要我们大多数人参与进来,共同努力、拥抱未来。”

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇