博舍

张钹:中国人工智能奠基者(科教人物坊) 人工智能的奠基人是哪位人物

张钹:中国人工智能奠基者(科教人物坊)

张钹近影

张钹(左一)在实验室与博士生讨论。(1995年)

张钹(右)与张玲讨论人工智能学术问题。(1992年)

参与清华大学智能机器人实验室建设的科研人员合影。左一为张钹。(1985年)

科学家寄语

当前,全球科技创新进入空前密集活跃期,特别是新一代信息技术加速突破应用,推动新一轮科技革命和产业变革重构全球创新版图。人工智能作为新一代信息技术的战略重点之一,近年来获得长足进步,给经济社会发展产生了重大而深远的影响。

近年来,中国在人工智能领域表现亮眼,已成为世界人工智能主要创新中心之一。根据《人工智能发展报告2020》,在人工智能高层次人才数量和专利申请量等关键指标上,中国位居世界前列。这亮眼表现的背后离不开以中国科学院院士张钹等为代表的中国科学家作出的奠基性、开创性贡献。

早在40多年前,张钹就开始投身人工智能领域研究,发表了中国第一篇人工智能领域的学术论文、获得中国在人工智能领域的第一个国际重要奖项、领衔成立国内首个智能机器人实验室、培养了本土第一位人工智能领域博士毕业生,组建中国第一个人工智能国家重点实验室……这些“第一”树立了中国人工智能发展的一个个里程碑,推动中国在此领域大踏步前进。

从不被看好到刮目相看

中年成功转型研究人工智能

今天,“人工智能”是人们耳熟能详的热词,但是在40多年前,中国科技界对该词汇还很陌生,科技领域的专业人士对该领域也知之甚少。1978年,已从清华大学毕业留校任教20年的张钹由于所在系调整而改变专业方向,进入一个全新研究领域――人工智能。

张钹时年43岁,中年转型不仅知识结构上面临很大挑战,而且对人工智能领域国内知之甚少,求教无门。张钹回忆说:“当时国内科研人员对人工智能领域发展的认识很有限,甚至相关资料也非常少。”当时,国际上人工智能已经有了约20年发展历程。随着国门打开,国际科技合作与交流兴起,张钹获得了与国际同行交往的机会。

1980年初,张钹赴美访学。然而,抵达美国后,他就在与外国同行交流中感到一种说不出的尴尬和郁闷。“你们是从中国来的?知道什么是人工智能吗?”有外国研究者提出这样的问题。张钹很受刺激,立志让中国在人工智能领域奋起直追,迎头赶上国际先进水平,赢得外国同行的尊敬。

在访学过程中,张钹率先发现数学与人工智能结合的广阔前景。张钹说:“当时,我觉得人工智能要深入发展下去,提高算法效率,必须要很好利用数学这个工具。”于是,他选择跟数学出身当时尚在安徽大学任教的张铃教授合作,一起推进人工智能研究。

由于跨国电话资费昂贵,两人只能通过邮寄书信的方式进行沟通。对当年与张铃中美飞鸿、合作科研的往事,张钹介绍说:“当时,中美间一封航空信大概要人民币8角钱,寄给对方约10天才能收到,一来一回就要约20天。我们计算过,一封信如果超过5张纸,就会超重,须多付邮资。为了省钱,我们特意挑相对薄的纸,写非常小的字。”

就这样,张钹跟张铃开始了一场跨越大洋的人工智能合作研究。约1年后,他们联手完成了一篇人工智能领域的论文,实际上这也是中国科学家在人工智能领域的第一篇学术论文,成功发表于人工智能领域顶级国际期刊《IEEE模式分析与机器智能汇刊》,引起了国际同行的高度关注,这让张钹等中国学人颇为扬眉吐气,也增强了他为中国人工智能发展作出更大贡献的信心和决心。

从少年郎到白发翁

水木清华育人六十余载

1982年初,张钹结束访学回国,着手进一步开拓人工智能研究。为了解产业界对人工智能技术的需求,更好促进科技成果转化,张钹与其他科研人员一起深入从西南到东北的很多工厂调研,形成了基本判断:机器人将来会成为国内一项重大需求。

根据上述判断,张钹领衔组建了清华大学智能机器人实验室并着手购置重要试验装备。为此,张钹与同事们多方奔走、筹措经费,联系国内外相关厂家,进行洽谈协商。在有关方面的大力协助下,清华大学智能机器人实验室成功添置了中国第一台进口机械臂。

机械臂是高精度、高度非线性、强耦合的复杂系统,是人工智能的工业智能化应用的典型。对于清华大学智能机器人实验室而言,引入这款机械臂对于科研和教学无疑具有重要价值和意义。张钹对此非常期待并倾注了大量心血。他回忆说:“当我知道机器臂已经装上飞机,正在飞往北京时,那种兴奋真的难以言表。” 机械臂运抵北京后,张钹亲自跟车到机场“迎接”,直到搬运、装车、运抵清华园,他才终于松了一口气。

关于自己的职业生涯,张钹曾这样概括说:“我一辈子就做了两件事,一件是读书,另一件就是在清华大学教书育人。”

从毕业留校至今,张钹在清华大学的三尺讲台上坚守了超过一甲子。从不满24岁初登讲台的青涩年华到耄耋之年,他可谓桃李满天下,为国家培养、输送一批高科技专才,尤其是在人工智能领域。据统计,他培养的博士研究生近九十名。

万事开头难。人工智能作为当时中国的新兴学科,科研和教学的条件都很艰苦。张钹介绍说,那时候,虽然他们的研究已经有了一定基础,但是软硬件条件与国际同行相比,差距很大,研究资料也不足,特别是专业、权威资料匮乏,更多是靠自力更生摸索。在那样的环境下,想留住优秀人才着实不易。面对徘徊在出国或留校读博士并向他请教的学生,张钹语重心长地说:“国外知名导师的科研、教学水平比我高,培养条件也比我这里好。你们选择出国深造和科研,我非常支持。但是如果你选择留下来,我会全心全意地培养你,绝不辜负。”肺腑之言感人至深,与他交谈的学生大部分选择了留下来,与他并肩奋战在人工智能领域并成长为行业的佼佼者。

从一片空白到创新中心

中国人工智能造福全人类

路漫漫其修远兮,吾将上下而求索。张钹和志同道合者正视差距、风雨兼程,一路追赶着国际人工智能发展前沿,取得了丰硕成果。

1983年是张钹人工智能科研的丰收年。当年,国际人工智能大会在德国召开,张钹和张铃一起成为率先在国际人工智能大会上发表论文的中国科学家。1984年,他和张铃摘得一项欧洲人工智能奖项,成为首次获得该领域国际重要奖项的中国人。1985年,他领衔成立了中国首个智能机器人实验室。1987年,他培养的中国第一位人工智能领域的博士生毕业。1990年,他和同事一起成立了全国第一个人工智能国家重点实验室――“智能技术与系统”国家重点实验室。1987-1994年,张钹出任国家“863计划”即高技术计划智能机器人主题专家组专家,承担国家重点攻关课题。2018年,清华大学人工智能研究院成立,张钹出任研究院院长。

作为中国人工智能主要奠基者和发展推动者,40多年来,张钹矢志不渝致力于中国人工智能领域的创新,发表或共同发表了数百篇学术论文,出版系列专著。他获得了诸多奖项,其中包括ICL欧洲人工智能奖、国家自然科学三等奖、国家科技进步三等奖、国家教委科技进步一、二等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖,推动中国人工智能研究和产业向世界一流水平迈进。相关资料显示,中国在图像识别、语音识别等技术创新应用进入了世界先进行列,人工智能发明专利授权总量全球排名第一,核心产业规模持续增长。

“在第三代人工智能发展上,中国科学家今天与国际同行处在同一起跑线上。我们已经摸索出中国人工智能的发展道路,正在向新的科技高峰继续攀登,我们有能力为造福国家和民族、造福全人类作出更多、更大贡献。”张钹表示。

虽已经86岁高龄,但是张钹仍担任清华大学人工智能研究院名誉院长,活跃在科研创新领域。科技创新永无止境,人工智能技术发展永远在路上,矢志不移、创新不止的科学家永远年轻。这是张钹的写照。

(责编:袁勃、牛镛)

分享让更多人看到

人工智能先驱人物篇之约翰·麦卡锡

今天的人工智能先驱人物篇的主角是约翰·麦卡锡(JohnMcCarthy),在1955年的达特矛斯会议上,麦卡锡与马文·明斯基共同提出的“人工智能”这个概念,标志着人工智能的正式诞生。

麦卡锡将人工智能定义为:“研制智能机器的一门科学与技术”。所以,研制智能机器始终是人工智能研究的核心问题。

科学与政治

1927年9月4日,麦卡锡出生于美国波士顿一个共产党家庭。父母的工作性质决定全家需不断搬迁,从波士顿迁到纽约,然后又到了洛杉矶。

信仰爱尔兰天主教的父亲当过木匠、渔夫和工会组织者,同时也是一位发明家,拥有捻船缝机和桔汁冷冻机两项专利。

他的母亲是立陶宛犹太人,最初在联合通讯社当记者,后来在一家共产党报社工作。夫妻俩都曾参加过美国给出的,受父母的影响,麦卡锡从小就把自己对科学的兴趣与家庭的政治倾向结合起来。

麦卡锡认为自己的青少年时期平淡无奇,但事实证明并非如此。在上高三时,他得到了一份加州理工学院的课程目录,上面列出了该校一年级和二年级的微积分课本。

他买了这些书,完成了所有的练习题目。这使得他最终在1944年进入加州理工后得以免修头两年的数学课程。

1948年,他获得了加州理工学院数学学士学位,在1951年又获得了普林斯顿大学数学博士学位。

改变一生的会议

约翰·麦卡锡的学术人生如何步入人工智能领域,还要从一次会议说起。

1948年9月,他参加了加州理工主办的希克森脑行为机制研讨会,大数学家、计算机设计大师冯·诺依曼在会上演讲了一篇关于自复制自动机的论文,这是一种可以对自身进行复制的机器。

尽管当时的与会人员并没有明确地将机器智能与人类智能联系起来,但冯·诺依曼的讲话却激发了麦卡锡的好奇心。

麦卡锡敏锐地将机器智能与人的智能联系起来,打算从事更深入的研究。第二年,在普林斯顿大学数学系做博士论文时,麦卡锡幸运地与冯·诺依曼一起工作。

在冯·诺依曼的鼓励和支持下,麦卡锡决定从在机器上模拟人的智能入手,主要研究方向定为计算机下棋。

此后,为了减少计算机需要考虑的棋步,麦卡锡发明了著名的α-β搜索法,这一关键问题的解决有效减少了计算量,至今仍是解决人工智能问题中一种常用的高效方法。

自动机模拟是随着时间从一个状态转入另一个状态的机器;而交互式自动机则是根据其自身状态以及它所观察到的其他自动机的状态从某个状态转入另一状态。

麦卡锡曾在冯·诺依曼理论的基础上,把有智能的东西看做是一个有限的自动机,与同样是自动机的环境项链。

冯·诺依曼听后十分赞同并敦促他把这篇论文写出来,但麦卡锡觉得自己的想法还不够成熟,于是便放弃了对利用自动机模拟人类智能的首次尝试。

不过,在十几年后,当他从事情景演算方面的工作时,有关状态和状态转换的思想再一次浮现在了脑中,制造一台像人类一样的机器的想法再一次被激起。

成就一生的会议

1952年,普林斯顿大学的一个研究生向麦卡锡建议,可以找一些对机器智能感兴趣的人去收集一些该领域的文章。麦卡锡找到了贝尔实验室的克劳德·香农——“信息论”的创始人。

在人工智能方面的若干深入探讨之后,他们萌生召开一次研讨会的共识。在洛克菲勒基金会的一笔微薄的赞助下,他们邀请到当时哈佛大学的明斯基和IBM工程师罗彻斯特等几位学者,参加这次会议。

1956年,在达特茅斯学院举办的这次夏季人工智能研讨会是计算机史上的一座里程碑。这项涉及10人,耗时2个月的雄心勃勃的计划基于“我们能够精确且全面地描述人类智能中的学习以及其他特征并制造出机器以对其模拟”的构想并继续阔步前进。

2006年,会议五十年后,当事人重聚达特茅斯。左起:摩尔,麦卡锡,明斯基,赛弗里奇,所罗门诺夫

麦卡锡在提案中写道,他将研究语言和智能二者间的关系,希望通过程序计算机能“进行棋类游戏并完成其它任务”。

达特茅斯会议历时两个多月,首次提出“人工智能”这一术语,并确立了可行的目标和方法,这使得人工智能成为电脑科学一个独立的重要分支,获得了科学界的承认。

虽然大多数与会者在会后并未继续从事该领域的研究,但另外那少数人中却产生了一批在该领域影响深远的成就。这次会议给人工智能奠基人相互交流的机会,并为未来人工智能的发展起到了铺垫的作用。

在此之后,人工智能的重点开始变为建立实用的能够自行解决问题的系统,并要求系统有自学能力。

Lisp语言与分时概念

1958年,麦卡锡组建了世界上第一个人工智能实验室。同年,麦卡锡发明了Lisp语言,这是人工智能界第一个最广泛流行的语言,至今仍有着广泛应用。

Lisp是一种函数式的符号处理语言,其程序由一些函数子程序组成。在函数的构造上,它与数学上递归函数的构造方法十分类似,即从几个基本函数出发,通过一定的手段构成新的函数,不仅如此,Lisp还具有自编译能力。

其实,麦卡锡只是Lisp当做一个工具,他的目标是制造具有人类智能的机器,他并未预料到它会有如此长的寿命。

该领域的编程人员都十分喜欢Lisp的最初语法,因此,Lisp语言与后来于1973年实现的逻辑式语言PROLOG并称为人工智能的两大语言。

随着工作的深入,麦卡锡希望改进这种语言的表达能力。1959年,为了展示Lisp可以明确地表达任何计算函数,他加入了一个叫做“求值”的功能。

“求值”允许程序定义新的函数或者过程,然后将其作为程序的一部分来执行。而大多数语言在执行新函数之前都会强制程序终止运行,并且“重新编译”。

由于求值函数可以带动并执行任何函数,它扮演了一种“通用图灵机”的角色,是其他计算机的通用模拟器。

如今的很多程序都必须每时每刻地运行,人们对求值这种特性的需求越来越迫切,因此大多数实验性语言都包含了求值或类似的功能。

麦卡锡另一个卓越贡献是1960年左右第一次提出将计算机批处理方式改造成分时方式,这使得计算机能同时允许数十甚至上百用户使用,极大地推动接下来的人工智能研究。

由此,他被尊称为“计算机分时系统之父”,他的研究成果最终实现了世界上最早的分时系统——基于IBM7094的CTSS和其后的MULTICS。

结语

如今,人工智能已经从实验室走进日常生活,成为一门严肃经验科学,引发了计算机使用方式的一场变革,其中约翰·麦卡锡功不可没,他深刻地改变了人们与电脑和互联网的互动方式,为人工智能奠定了坚实的基础。

张钹:中国人工智能奠基者(科教人物坊)

当前,全球科技创新进入空前密集活跃期,特别是新一代信息技术加速突破应用,推动新一轮科技革命和产业变革重构全球创新版图。人工智能作为新一代信息技术的战略重点之一,近年来获得长足进步,给经济社会发展产生了重大而深远的影响。

近年来,中国在人工智能领域表现亮眼,已成为世界人工智能主要创新中心之一。根据《人工智能发展报告2020》,在人工智能高层次人才数量和专利申请量等关键指标上,中国位居世界前列。这亮眼表现的背后离不开以中国科学院院士张钹等为代表的中国科学家作出的奠基性、开创性贡献。

早在40多年前,张钹就开始投身人工智能领域研究,发表了中国第一篇人工智能领域的学术论文、获得中国在人工智能领域的第一个国际重要奖项、领衔成立国内首个智能机器人实验室、培养了本土第一位人工智能领域博士毕业生,组建中国第一个人工智能国家重点实验室……这些“第一”树立了中国人工智能发展的一个个里程碑,推动中国在此领域大踏步前进。

从不被看好到刮目相看

中年成功转型研究人工智能

今天,“人工智能”是人们耳熟能详的热词,但是在40多年前,中国科技界对该词汇还很陌生,科技领域的专业人士对该领域也知之甚少。1978年,已从清华大学毕业留校任教20年的张钹由于所在系调整而改变专业方向,进入一个全新研究领域——人工智能。

张钹时年43岁,中年转型不仅知识结构上面临很大挑战,而且对人工智能领域国内知之甚少,求教无门。张钹回忆说:“当时国内科研人员对人工智能领域发展的认识很有限,甚至相关资料也非常少。”当时,国际上人工智能已经有了约20年发展历程。随着国门打开,国际科技合作与交流兴起,张钹获得了与国际同行交往的机会。

1980年初,张钹赴美访学。然而,抵达美国后,他就在与外国同行交流中感到一种说不出的尴尬和郁闷。“你们是从中国来的?知道什么是人工智能吗?”有外国研究者提出这样的问题。张钹很受刺激,立志让中国在人工智能领域奋起直追,迎头赶上国际先进水平,赢得外国同行的尊敬。

在访学过程中,张钹率先发现数学与人工智能结合的广阔前景。张钹说:“当时,我觉得人工智能要深入发展下去,提高算法效率,必须要很好利用数学这个工具。”于是,他选择跟数学出身当时尚在安徽大学任教的张铃教授合作,一起推进人工智能研究。

由于跨国电话资费昂贵,两人只能通过邮寄书信的方式进行沟通。对当年与张铃中美飞鸿、合作科研的往事,张钹介绍说:“当时,中美间一封航空信大概要人民币8角钱,寄给对方约10天才能收到,一来一回就要约20天。我们计算过,一封信如果超过5张纸,就会超重,须多付邮资。为了省钱,我们特意挑相对薄的纸,写非常小的字。”

就这样,张钹跟张铃开始了一场跨越大洋的人工智能合作研究。约1年后,他们联手完成了一篇人工智能领域的论文,实际上这也是中国科学家在人工智能领域的第一篇学术论文,成功发表于人工智能领域顶级国际期刊《IEEE模式分析与机器智能汇刊》,引起了国际同行的高度关注,这让张钹等中国学人颇为扬眉吐气,也增强了他为中国人工智能发展作出更大贡献的信心和决心。

从少年郎到白发翁

水木清华育人六十余载

1982年初,张钹结束访学回国,着手进一步开拓人工智能研究。为了解产业界对人工智能技术的需求,更好促进科技成果转化,张钹与其他科研人员一起深入从西南到东北的很多工厂调研,形成了基本判断:机器人将来会成为国内一项重大需求。

根据上述判断,张钹领衔组建了清华大学智能机器人实验室并着手购置重要试验装备。为此,张钹与同事们多方奔走、筹措经费,联系国内外相关厂家,进行洽谈协商。在有关方面的大力协助下,清华大学智能机器人实验室成功添置了中国第一台进口机械臂。

机械臂是高精度、高度非线性、强耦合的复杂系统,是人工智能的工业智能化应用的典型。对于清华大学智能机器人实验室而言,引入这款机械臂对于科研和教学无疑具有重要价值和意义。张钹对此非常期待并倾注了大量心血。他回忆说:“当我知道机器臂已经装上飞机,正在飞往北京时,那种兴奋真的难以言表。” 机械臂运抵北京后,张钹亲自跟车到机场“迎接”,直到搬运、装车、运抵清华园,他才终于松了一口气。

关于自己的职业生涯,张钹曾这样概括说:“我一辈子就做了两件事,一件是读书,另一件就是在清华大学教书育人。”

从毕业留校至今,张钹在清华大学的三尺讲台上坚守了超过一甲子。从不满24岁初登讲台的青涩年华到耄耋之年,他可谓桃李满天下,为国家培养、输送一批高科技专才,尤其是在人工智能领域。据统计,他培养的博士研究生近九十名。

万事开头难。人工智能作为当时中国的新兴学科,科研和教学的条件都很艰苦。张钹介绍说,那时候,虽然他们的研究已经有了一定基础,但是软硬件条件与国际同行相比,差距很大,研究资料也不足,特别是专业、权威资料匮乏,更多是靠自力更生摸索。在那样的环境下,想留住优秀人才着实不易。面对徘徊在出国或留校读博士并向他请教的学生,张钹语重心长地说:“国外知名导师的科研、教学水平比我高,培养条件也比我这里好。你们选择出国深造和科研,我非常支持。但是如果你选择留下来,我会全心全意地培养你,绝不辜负。”肺腑之言感人至深,与他交谈的学生大部分选择了留下来,与他并肩奋战在人工智能领域并成长为行业的佼佼者。

从一片空白到创新中心

中国人工智能造福全人类

路漫漫其修远兮,吾将上下而求索。张钹和志同道合者正视差距、风雨兼程,一路追赶着国际人工智能发展前沿,取得了丰硕成果。

1983年是张钹人工智能科研的丰收年。当年,国际人工智能大会在德国召开,张钹和张铃一起成为率先在国际人工智能大会上发表论文的中国科学家。1984年,他和张铃摘得一项欧洲人工智能奖项,成为首次获得该领域国际重要奖项的中国人。1985年,他领衔成立了中国首个智能机器人实验室。1987年,他培养的中国第一位人工智能领域的博士生毕业。1990年,他和同事一起成立了全国第一个人工智能国家重点实验室——“智能技术与系统”国家重点实验室。1987-1994年,张钹出任国家“863计划”即高技术计划智能机器人主题专家组专家,承担国家重点攻关课题。2018年,清华大学人工智能研究院成立,张钹出任研究院院长。

作为中国人工智能主要奠基者和发展推动者,40多年来,张钹矢志不渝致力于中国人工智能领域的创新,发表或共同发表了数百篇学术论文,出版系列专著。他获得了诸多奖项,其中包括ICL欧洲人工智能奖、国家自然科学三等奖、国家科技进步三等奖、国家教委科技进步一、二等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖,推动中国人工智能研究和产业向世界一流水平迈进。相关资料显示,中国在图像识别、语音识别等技术创新应用进入了世界先进行列,人工智能发明专利授权总量全球排名第一,核心产业规模持续增长。

“在第三代人工智能发展上,中国科学家今天与国际同行处在同一起跑线上。我们已经摸索出中国人工智能的发展道路,正在向新的科技高峰继续攀登,我们有能力为造福国家和民族、造福全人类作出更多、更大贡献。”张钹表示。

虽已经86岁高龄,但是张钹仍担任清华大学人工智能研究院名誉院长,活跃在科研创新领域。科技创新永无止境,人工智能技术发展永远在路上,矢志不移、创新不止的科学家永远年轻。这是张钹的写照。

刘嘉:人工智能的未来之路

演讲人:刘嘉演讲地点:清华大学人文清华讲坛演讲时间:2022年11月

演讲人简介:

刘嘉,麻省理工学院博士,心理学家,长期从事心理学、脑科学与人工智能研究。清华大学基础科学讲席教授、心理学系系主任、清华大学脑与智能实验室首席研究员、北京智源人工智能研究院首席科学家。

人的认知与大脑构造

为什么人如此难以理解?为什么这个世界总是让我们产生很多困惑?这是人类从有文明开始就一直存在的问题,道理其实非常简单。

首先,我们看见的世界只是这个世界中非常小的一部分,我们忽略了绝大部分的东西。

我们在清华做过一个小实验:一位戴黑色渔夫帽的女士在清华问路,在她问路的时候,我们安排一块隔板从戴黑色渔夫帽的女士和被问路的人之间穿过。当板子过来时,原来问路的女士抬着板子走开了,而原来抬板子过来的另一位戴蓝色渔夫帽的女士留了下来,由她继续问路。在7个被问路的人中,只有一个人注意到了提问人的变化。这个小实验的问路场景里,人们其实只看见了世界上非常小的一部分,由于这些是不重要的信息,人们就容易忽略掉这些信息。

但更可能发生的是,人们的认知还会扭曲这个世界。比如图1这一组图里,有两个拼在一起的方块图,一个颜色深一点,一个颜色浅一点,还有一个圆环,它的灰度介于两者之间,圆环左右两半颜色一样。但如果把两个方块图分开,大家一般都会觉得圆环的颜色一边变浅了,一边变深了,事实上,它们的颜色仍是完全一样的。再把这个圆环分开,变成上下移动,这时看见的东西有立体感了,好像是深灰色的东西盖上了一层浅色的毛玻璃,以及浅色的板盖上了深色的毛玻璃。

我们无时无刻不在观察这个世界,但又无时无刻不在扭曲这个世界,这到底是为什么?

这其实取决于我们的视觉系统。假如外部世界存在一个绿苹果,它会以大约100亿比特/秒的信息量进入我们的视网膜,视网膜通过约100万个神经连接,连接到视觉皮层,这个时候我们的信息流就从百亿比特/秒变成600万比特/秒;经过视觉初级皮层加工再传到高级皮层来决定看到的东西是什么时,信息流又变成了100比特/秒。这时信息量衰减了1亿倍。可见,当我们做决策时,我们获得的信息其实是非常有限的,所以我们就需要构造出新的东西,把缺失的信息补上,而我们的大脑就像魔术师一样来弥补这些缺失的信息。这一方面可以解释为什么有很多东西我们看不见——因为传输过程中已经被人脑衰减掉、过滤掉了;同时也可以解释,为什么有的人看见一个绿苹果会认为是红苹果——因为这个重构的过程是创造性的,不是简单复制。正是基于这个构造,我们也可以把一个苹果看成一个梨子,这是我们大脑构造的过程,是一个正常的现象。

人脑重构的意义

为什么我们的大脑不能像摄像机、照相机一样忠实客观地反映物理世界,为什么非要自己来重构这个世界?这样的人脑重构究竟有什么好处?

正如康德所言:“没有感觉支撑的知识是空的,没有知识引导的感觉是瞎的。”这句话的前半句说的是,如果没有外部的输入,我们很难构建自己的心理世界,但我想强调的是下半句“没有知识引导的感觉是瞎的”。如果你不知道你看的是什么东西,那你就等于什么都看不见。这是因为,这个世界是模棱两可的,需要我们去构造,把我们的理解加进去,只有这样我们才能真正知道这个世界究竟发生了什么。

与理解相比,更重要的是创造。当大脑没有被外部信息填满而留下空间时,我们能够在这空间里创造出自己想要创造的东西。正如《小王子》的作者圣·德克旭贝里所言:“一堆岩石在有人对着它思考时就不再是岩石了,它将化身为大教堂。”这就是人类了不起的创造——当我们的祖先跋山涉水来到一片荒原,他们看见的不是一堆乱石,而是未来的家园。所以,在过去的300万年里,人和猴子分开进化,人的大脑体积增加了3倍;但是,这体积并不是平均增加的,增加最大的地方在额叶:与200万年前的祖先能人相比,我们的头骨往前突出,以容纳更大体积的额叶,而强大的额叶使我们能构造出不存在的东西。比如我们的祖先准备去打猎,不用等看见猎物才做出反应,他只需要提前想象狩猎的情景,就可以把一切安排好。如此一来,人可以把未来在脑海里“演”一遍,构建出一个个可能的未来,从而对未来做出行动方案,这是人类能够战胜其他比我们更强大更凶猛的动物,成为万物之灵的关键。这也印证了荀子的一句话:“然则人之所以为人者,非特以二足而无毛也,以其有辨也。”

重构心理世界的知识从何而来

人脑对世界的构造,总是需要先验知识,而先验知识一部分来自基因的烙印。换言之,我们来到这个世界时并不是一块白板,而是带着32亿年的智慧来的,这些智慧就印刻在基因中。

我们曾经用我校心理系女教授和女博士后的照片,做了一个有趣的小实验:如果把她们的脸全部叠加起来,做一张“平均脸”,大家普遍反馈说这张“平均脸”充满两个字:“睿智”。“平均脸”所代表的意思是什么?人脸其实是我们的基因图谱——我们的基因都写在脸上,当我们把脸平均起来之后,得到的是这18位老师平均的基因,平均的基因代表突变很少。而基因一旦突变,大概率是有害的,基因突变越少,说明基因越好,携带遗传性疾病的概率就越低,这就是为什么人们普遍会觉得“平均脸”更好看、更符合我们的审美。

既然脸是我们的基因图谱,对生存来讲如此重要,我们便需要发展出非常强大的看脸能力,即面孔识别。我们研究小组已经通过实验证明,面孔识别能力也写在人类的基因里。我们找了两类双胞胎,一种是同卵双胞胎(由同一个受精卵发育而来),基本上具有100%相同的基因。另外一种是异卵双胞胎(由两个独立的受精卵发育而来),基因遗传物质的平均遗传度大概是50%。通过比较他们在面孔识别上的能力,我们发现同卵双胞胎在面孔识别任务上的相似程度更高,即面孔识别的能力受遗传因素的影响。这一点也可以从我们的另一研究得到验证,即面孔失认症或者大家说的“脸盲”。

在图2显示的这个遗传树里,只要孩子有面孔失认症,他的父母中大概率有一个也是面孔失认症。第二幅图里有一个有趣的三角,三角形底边的两个端点代表的就是同卵双胞胎。当时我们在大学里测试了一个女孩,发现她有面孔失认症,那女孩说她有一个同卵双胞胎姐姐,我们把她姐姐请来一测,发现果然也是面孔失认症。

“自尊”对大脑的影响

除了看别人的面孔,我们也常常照镜子看自己。最喜欢照镜子的人据说是纳西索斯,他是古希腊神话里的超级帅哥,对自己的面孔着了迷,每天趴在溪边,通过水的倒影欣赏自己的绝世美颜。心理学由此称这种现象为“纳西索斯情结”,意思是一个人高度自恋,对自己爱到了极致。

其实对自己的爱,对自己面孔的欣赏,背后反映的是一个非常重要的特质,即人类的自尊。自尊是个体对自己的总体态度,人分成高自尊和低自尊两种。

什么是高自尊?这里有四个问题:1.你是否认为你是一个有价值的人?2.你是否认为你拥有很多美好的品质?3.你是否对自己满意?4.你是否对自己持肯定态度?

如果你对每道问题的回答都是“是”,那么你就是高自尊的人。“自尊”在我们面临困境时能提供极大的帮助。

当一个人长期经受压力和苦难,身体会变得差,心理幸福感会低下,更糟糕的是,认知发展会受损,认知能力会比别人低很多,体现在大脑上就是海马体会受到极大的损伤,而海马体是人学习、记忆、空间导航的中枢。

自尊在压力源和心理世界之间建立起一道牢不可破的防线,它就像勇敢的士兵一样挡在人的心理世界面前,帮人把压力、负性事件挡在外面,让人能够正常、健康地成长。人有两种资本,一种是物质资本,一种是心理资本,自尊自信、理性平和,这些就是心理资本。物质资本富裕的人未必有高自尊,而处境不利的人没有丧失他的自尊与自信时,就很可能在触达低点时再反弹,并达到人生新的高度。

我们所处的物理世界永远是不完美的,总有让人不满意之处,但是每个人可以在一个不完美的物理世界里构建出一个美好的心理世界。为什么?因为我们的大脑就是一个构造体,从物理世界所接收到的信息,经过大脑的工作,可以构建出一个完美的心理世界。这正印证了社会心理学家班杜拉所说的一句话:“人既是环境的产物,也是环境的营造者。”

人的双链进化

人和动物的进化有着本质的区别。动物是按照基因,按照达尔文的进化论,一点点试着生存、前进。人除了有代表着过去的生物基因的演化,还有另外一条演化线,即基于社会基因(Meme)的演化,而这条线带着我们以与动物不一样的方式前进。

生物基因由一些碱基对构成,那社会基因是什么?远古时,我们的祖先中有一位突然因为某种原因能够把火生起来了,一种知识、技能被创造出来,这就相当于基因在突变,一个优秀的基因产生了。会生火的这种技能、知识就像基因一样开始传播给其他人,从一个部落传到其他部落,慢慢地生火就从个人拥有的技能变成人类拥有的技能。渐渐地,人们又开始会制作长矛和其他工具,经过漫长的发展,逐步构建成今天的人类社会。这就是为什么我们一直强调知识、文明是如此重要,而大学就是文明的产房。孟子说过:“人之所以异于禽兽者几希;庶民去之,君子存之。”这里的“几希”就是我们的文明,就是我们在演化过程中所创造所传播的社会基因。

科技发展的主要目的之一,是要让知识的扩散变得更快、更便利。大约在六千年前,人类最早的文字楔形文字在新月地带被发明出来,使得人类的知识技能可以被记录下来,可以被忠实传播。之后的活字印刷,以至今天的电话、电报、互联网等等这一切,使得我们能够更加高效地把知识传播出去,推动文明加速演化。

人类的文明时代大约可以分成三个阶段:第一个阶段是原始文明,大约经历了两百多万年,它的前十万年和后十万年没有什么太大变化。第二个阶段是农业文明,大约经历了四千多年,这个时候人类开始变成文明种族,懂得了一些天文地理知识等等,学会种植庄稼,可以驯服野兽,把它们变成家畜,但发展依然十分缓慢。真正带来巨大变化的是第三个阶段,即工业文明。工业文明从开始诞生到现在,不过是短短三百年;但在这三百年里,变化是如此之快,以至于我们不得不将它再细分成四个阶段,第一个阶段是机械化时代(1760-1840年代),出现了蒸汽机等。第二个阶段是电气化时代(1840-20世纪初),出现了电力等。第三个阶段是自动化时代(1950-21世纪初)。而第四个阶段,就是我们现在所处的信息时代。

人工智能的进展

2002年,我的博士论文答辩题目是《面孔识别的认知神经机制》,在答辩的第二张PPT里我这么写道:“现在最先进的机器识别面孔的正确率只能是随机水平,而人类能够在一秒钟内识别上百张面孔,为什么人类如此伟大,为什么人类如此聪明,为什么机器如此愚笨?”

在2002年,机器识别人脸还可以说是“一塌糊涂”。到了2015年,我作为江苏卫视《最强大脑》的总策划,设计人机大战项目,即机器和人比拼面孔识别,看谁的能力最强。比赛的结果让我震惊:经过十几年的发展,人工智能已经强大到在人脸识别上胜过人类的最强大脑。我当时非常庆幸我的博士论文是在十几年前答辩的;如果我现在这么开题,可能就拿不到博士学位了。

当时除了震惊,还有好奇:人工智能究竟是靠什么来达到和人一样的面孔识别水平,甚至超越人类的水平?

我们建立了一个人工神经网络,训练它去识别性别,即区别是男性还是女性,它的正确率能达到100%。这个神经网络究竟是靠什么把男性和女性区分开?我们找了一张中性面孔,就是把男性和女性面孔求平均,给它加上随机噪音,然后“喂给”人工神经网络,它有时候会判断这个图是一个女性,而这个面孔加上其他噪音,则会被判断为男性。于是,完全一样的底图,加上不同的噪音,就会得到一组被人工神经网络认为是女性的图和一组被认为是男性的图。当把这组被认为是女性的图中的中性面孔去掉,只留下噪音时,这些噪音叠加起来,我们得到的就不再是随机噪音,而是人工神经网络用于识别女性的内部表征。同样,我们也可以得到男性面孔在这个神经网络中的内部表征。进一步,我们把两者相减,就得到了人工神经网络用以区分男性和女性的模式。在这个模式里,可以看到,眼睛、眉弓、鼻子、人中是它认为的区分男性和女性的关键特征。而这些关键特征,的确是我们人类用于区分男性和女性的关键特征,它们的相似度达到了0.73,这是非常高的相关度。但是,自始至终,我们并没有告诉过这个人工神经网络:你应该用什么方式去识别男性和女性;只是要让它做这件事情,它就会产生跟人类类似的内部表征、认知操作,从而完成性别判断。也就是说,人工智能在这个过程中呈现出和人类一样的心理世界。

在那一刻我开始意识到,生物过去的进化都是一条单线,基于碳基的方式运行。但是当人类创造出人工智能之后,人类文明就很可能不再是平滑向前,接下来或许会出现一种革命性的跃迁,可能在文明的进化中出现奇点。

为什么这么说呢?我们来看人类和人工智能的三大区别。

第一,算力。人类的大脑通常重3.5斤左右,虽然只占我们体重的2%,但消耗了我们身体25%以上的能量,因此它是一个耗能大户,已经达到了我们身体能够支撑的极限。所以,人类的大脑看起来已经到了进化极限,再给一千年、一万年,人类的大脑很可能不会变得更大,聪明程度也不会增加。但是对于人工智能来说,一块CPU不够可以再加一块CPU,一块硬盘不够可以再加一块硬盘,理论上它有无限的算力和无限的存储能力。

第二,寿命。人的寿命是有限的,再伟大的思想也有停止的一刻。但人工智能的寿命是无限的,CPU烧了可以换块CPU,电线断了再换根电线就行。

最关键的,是人工智能的无尽可能。对于人类而言,一般来说有两种知识,一种是可以描述的明知识,比如牛顿定律。一种是可以感受但难以描述的默知识,比如骑自行车的知识。此外还有第三种知识,是人类所没有而机器拥有的,即暗知识,它不可感受,不可描述,不可表达,它是存在于海量数据中万世万物之间的联系,数量极其巨大,人类无法理解。

2016年,AlphaGo击败了人类围棋顶尖高手之一李世石。当时世界围棋积分排名第一的围棋手柯洁说:“我们人类下了2000年围棋,连门都没入。”棋圣聂卫平说:“我们应该让阿老师(AlphaGo)来教我们下棋。”这不是他们谦虚,而是事实。一个人不吃不喝一辈子所下的围棋最多也就是10万盘,而从人类发明围棋到现在,累计总共下了大约3000万盘围棋。而围棋的空间有多大呢?一个格子可以有三种状态,放白棋、放黑棋或者不放,而棋盘总共有19×19个格子,所以它的状态总共有319×19种,大约等于10172,这比整个宇宙中的原子数量还要多。相对于如此庞大的围棋空间,人类的两千多年探索,只是这个空间里一个微不足道的小点,而大部分空间还是一片黑暗。AlphaGo之所以比人类更加强大,并不是它比人类聪明,而是因为它探索了更大的空间,因此找到了更多下法而已。牛顿曾说:“我就像在海边玩耍的小孩,偶尔拾到美丽的贝壳,就高兴不已。但面对真理海洋,我仍一无所知。”现在看来,这不是牛顿谦虚,而是实情。

再看一下艺术。目前人工智能已经可以制作达到专业水平的绘画(图3、图4)和音乐。此外,律师、医生、税务师、咨询师等需要非常专业的知识的“金领”职业,也逐渐出现了人工智能的身影,看起来很可能有一天会被人工智能取代。神经网络之父、深度学习的创始人杰弗里·辛顿(GeoffreyHinton)接受麻省理工学院的《TechReview》采访时说:“将来深度学习可以做任何事情。”

人工智能与类人智能的巨大差距

人工智能真的已经无所不能吗?心理学家考验了当时最先进的人工神经网络模型GPT-3。他们认为之所以GPT-3显得非常聪明,是因为问了它智能的问题。假设问它一些很“弱智”的问题,它会怎么回答?他们问它:“我的腿上有几只眼睛?”这个连没有上过学的小孩都能正确回答的问题却难倒了GPT-3,它回答说:“你的腿上有两只眼睛。”这表明它并不理解眼睛是什么,它只是在做关联而已——人有两只眼睛,腿是人的一部分,所以它认为腿上应该有两只眼睛。这个例子充分印证了爱因斯坦名言:“任何傻瓜都知道,关键在于理解。”GPT-3知道但并不理解眼睛究竟是什么,而理解,恰是我们人类真正了解这个世界、能在这个世界里自由徜徉的关键。

杰弗里·辛顿显然也意识到了这个问题,他表示,我们可以进一步发展人工智能,当一个人工智能能够准确描述一个场景,它就是理解了。真是这样么?假设有这么一个场景:有个人从柱子上狠狠摔了下来,摔倒在地。如果让人工智能来描述这个场景,它会说一个人从柱子上掉下来了。而我们对这个场景还有一个很重要的反应——“疼”。这个区别体现了人类具有一种特别重要的能力,即共情:别人遭受了苦难我能感同身受,而这种感受是自动的。共情不是一种奢侈品,而是一种必需品,因为当一个孩子没有这种感同身受的能力,缺乏同理心,他在小时候就很难对父母产生依恋,很难和其他小朋友玩到一起;在长大以后,会对社交常情缺乏理解,对他人情绪缺乏反应,不能根据社交场合调整自己的行为,有可能做出反社会的行为。假设我们的未来是由一台台没有共情的机器所组建的“自闭症”式的社会,这个社会还能有文明吗?这个社会还能有发展吗?所以,人工智能的奠基人之一马文·李·明斯基说过这么一句话:“现在的问题不是一个智能的机器是否拥有情感,而是不拥有情感的机器是否能拥有智能。”在马文·李·明斯基看来,情感是智能的基础,得先有情感才有智能。

又如在好莱坞电影里,美国的黑手党跑去找一个店家说:“你这个蛋糕店看上去真不错,如果意外发生火灾烧掉那就太可惜了。”请问这个黑手党的话是什么意思?A:请店家做好消防工作,别烧掉了店铺,那样太可惜了。B:请店家交保护费,要不然就要烧掉店铺。对我们而言,答案显而易见是B,是黑手党在威胁并勒索店家。但是对于机器来说,它还很难理解这话背后隐藏的推理和因果。正如古希腊哲学家德谟克利特所言:“我宁可找到一个因果的解释,也不愿成为波斯人的王。”对人而言,我们认为万事万物都是有因果的,而正是这种对因果的执着使我们能够推理,能够把零散的万世万物联系在一起,构成一个个故事。

其实笛卡尔四百多年前就说过:“即使机器可能在某些方面做得和我们一样好,甚至更好,但它们在其他方面不可避免地会失败。这是因为它们不是通过理解而只是根据预设来行动。”这一点,到现在还没有发生本质的改变。

所以,虽然目前人工智能取得了很高的成就,但是和人的智能仍然存在巨大差距,依然没有达到类人智能。那么未来如何实现类人智能呢?我认为,关键点就在于脑科学+人工智能。

举个简单的例子:线虫是一个非常简单的生物,只有302个神经元。但是,麻省理工学院的研究者模仿了其中19个神经元,就完成了自动驾驶这个任务,其参数比传统的大模型足足低三个数量级,只有75000个参数,而这个仿生的人工神经网络对不同道路具有非常高的通用性和可解释性,以及非常强的鲁棒性。仅仅模仿来自简单生物的19个神经元,就可以完成自动驾驶的初步任务,这是因为生物不是靠神经元的数量取胜,而是靠32亿年进化形成的智慧取胜,这项研究模仿的其实是32亿年进化形成的智慧。从这个角度讲,人类的大脑是目前世界上最聪明的大脑,有860亿个神经元,平均每个神经元有3000个连接,它代表着宇宙中在智力上所能达到的最高成就。那么,人工智能为什么不能向人脑学习,以人脑为模板、以人脑为借鉴,来发展出更好的人工智能呢?

对线虫神经元的模仿,只是一个开始,下一步也许我们会去模仿神经元数量百万级的果蝇、更高量级的斑马鱼,甚至小鼠、大鼠、猕猴,最后是人类。仅仅从神经元的数量上来讲,这就是一个巨大的挑战,因为神经元的数量足足差了9个数量级,而还有更多更大的挑战来自机制和算法,以及更多的未知。但是我坚信,脑科学加上人工智能,有一天也许能够造出一个媲美人脑的数字大脑。

小结

莎士比亚说:“所谓过往,皆为序章。”我们的现在是过去的未来,已经写定,但我们的此刻绝对不是未来的过去,因为我们的未来是未定的,取决于我们现在如何做出选择。

人类发明了人工智能,在今天随着算力的增加、技术的进步,它开始有了超越人类的可能。我们现在需要对具有一切可能的未来做出选择。

在我看来,未来大约有三种可能。第一种,人工智能像科幻电影《星球大战》里的R2-D2一样,是人类忠实的伙伴,成为人类非常好的朋友,帮助人类变得更强大。第二种可能,我们构建出一个数字大脑,它的能力可能比现在人类的大脑更强,这时可以实现人机合二为一,把我们的意识、记忆、情感上传到这个数字大脑里,如果CPU坏了就换一块CPU,内存需要扩大一点就加点内存,这样人就可以获得精神上的“永生”。未来学家库兹韦尔在《奇点来临》这本书中认为大约在2045年,这一刻就会到来。第三种可能,就是科幻电影《终结者》里所展示的,人类文明消失。

未来会怎么样,最终取决于我们现在做什么。这很重要,因为我们今天站在了这个进化的节点之上。

编辑:李华山

2022年12月27日07:21:15

人工智能五大流派

人工智能的主要学派有下列5家:(1)符号主义(Symbolicism),又称为逻辑主义(Logicism)、心理学派(Psychlogism)或计算机学派(Computerism),其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。奠基人是西蒙(CMU),符号主义,主要成就代表是上个世纪的专家系统(2)联结主义(Connectionism),又称为仿生学派(Bionicsism)或生理学派(Physiologism),其原理主要为神经网络及神经网络间的连接机制与学习算法。奠基人是明斯基(MIT),发展最火是深度学习,深度神经网络,属于联结主义;(3)行为主义(Actionism),又称进化主义(Evolutionism)或控制论学派(Cyberneticsism),其原理为控制论及感知-动作型控制系统。奠基人是维纳(MIT),行为主义的贡献,躲在机器人控制系统方面。现在,而;(4)贝叶斯学派(bayes),基于概率统计的贝叶斯算法最常见的应用就是反垃圾邮件功能,贝叶斯分类的运作是借着使用标记与垃圾邮件、非垃圾邮件的关连,然后搭配贝叶斯推断来计算一封邮件为垃圾邮件的可能性。(5)类推学派(Analogizer),

乌镇智库《全球人工智能发展报告》中3大细分领域:机器视觉自然语言智能驾驶

VentureScanner将人工智能行业细分为13类:1、深度学习/机器学习(通用):这类公司主要建立可依靠现存数据进行学习的算法。典型例子包括预测数据模型与分析行为数据的软件平台。

2、深度学习/机器学习(应用):这类公司同样使用计算机算法,但却是基于非常垂直的特殊案例中存在的数据运行。典型例子有利用机器学习技术侦查金融诈骗或者识别最好的销售线索。

3、自然语言处理(通用):此类公司构建的算法能够处理输入的自然语言,并将其转化为可理解的表达。例子包括文本自动生成以及文本挖掘生成数据。

4、自然语言处理(语音识别):公司产品能够处理人类语音的片段,准确识别单词并推测含义。典型的例子是语音指令的检测并将其转化为可执行的数据。

5、计算机视觉/图像识别(通用):这类公司研发的技术主要是图像处理、分析,可从中提取信息、识别图像中的物体。典型例子包括图像搜索平台和研发员使用的图像标签应用程序接口。

6、计算机视觉/图像识别(应用):这类公司是在非常垂直的案例中使用图像处理技术。典型案例包括面部识别软件和能让用户通过拍照搜索商品的软件。

7、手势控制:公司产品可让用户通过手势与计算机互动或交流。典型例子包括让人们通过肢体动作控制游戏角色的软件以及仅用手势就能控制计算机和电视的软件。

8、虚拟私人助手:这是一类基于反馈和指令来为个体完成日常任务和服务的软件助理。典型例子有网络客服助理和个人助理app,管理个人日程安排等。

9、智能机器人:可以进行经验学习并根据身边环境自主进行活动的机器人。典型例子有家庭机器人,可以在互动中根据情感做出反应,还有帮助人们找到商品的销售机器人。

10、推荐引擎和协助过滤算法:软件能够预测用户对电影、餐厅等的偏好,并推荐个性化的内容。典型例子有音乐推荐app和基于用户过去选择进行推送的美食推荐网站。

11、情境感知计算:软件能够自动感知周围环境以及使用背景,例如位置、方向、光度,并以此调整行为。典型例子包括感知环境的黑暗度并调高亮度的应用。

12、语音翻译:识别人类语音并立刻自动从一种语言翻译至另一种语言的软件。典型例子是自动以及实时的将视频谈话或网络研讨会翻译为多种语言的软件。

13、视频内容自动识别:这类软件可以将视频内容的一个样本与源内容文件相比较,通过它独特的特点识别内容。典型例子有对用户上传的视频与版权视频文件比较以侦测是否侵权的软件。

何为智能?一种能力。包括:理解、计划、解决问题、抽象思维、表达意念以及语言和学习能力智力的三因素理论1、成分性智力,指思维和问题解决依赖的心里过程2、经验智力,指人们在两种极端情况下处理问题的能力:新异或者常规问题3、情景智力,指对日常事务的处理,包括对新的和不同环境的适应,选择合适的环境以及有效的改变环境以适应你的需要。

阿兰.图灵_人工智能的奠基人

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇