博舍

人工智能的起源:六十年前,一场会议决定了今天的人机大战 人工智能开始的会议叫什么名字

人工智能的起源:六十年前,一场会议决定了今天的人机大战

2006年,会议五十年后,当事人重聚达特茅斯。左起:摩尔,麦卡锡,明斯基,赛弗里奇,所罗门诺夫

背景

现在一说起人工智能的起源,公认是1956年的达特茅斯会议。殊不知还有个前戏:1955年,美国西部计算机联合大会(WesternJointComputerConference)在洛杉矶召开,会中还套了个小会:“学习机讨论会”(SessiononLearningMachine)。讨论会的参加者中有两个人参加了第二年的达特茅斯会议,他们是塞弗里奇(OliverSelfridge)和纽厄尔(AllenNewell),塞弗里奇发表了一篇模式识别的文章,而纽厄尔则探讨了计算机下棋,他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨(Pitts),他最后总结时说:“(一派人)企图模拟神经系统,而纽厄尔则企图模拟心智(mind)……但殊途同归。”皮茨眼可真毒,这预示了人工智能随后几十年关于“结构与功能”两个阶级、两条路线的斗争。

开聊达特茅斯会议之前,先说六个最相关的人。首先,会议的召集者麦卡锡(JohnMcCarthy)当时是达特茅斯学院的数学系助理教授。两年前(1954年)达特茅斯数学系同时有四位教授退休,这对达特茅斯这样的小学校真是不可承受之轻。刚上任的年轻系主任克门尼(Kemeny)之前两年才在普林斯顿逻辑学家丘奇(Church)门下得了逻辑学博士,于是跑到母校求援。这么说起来,克门尼算是图灵的师弟,他战时和物理学家费曼一起工作,还一度当过爱因斯坦的数学助理,后来一头扎在计算机里,和麦卡锡一起琢磨出了分时系统,但他最为人知的工作应该是老少咸宜的编程语言BASIC。现在估计已经没人知道BASIC语言发明人曾是LISP语言发明人的老板。克门尼是天生的官僚,后来位居达特茅斯的校长,美国三里岛核电站出事,总统委托他当调查委员会主席,这是后话。克门尼从母校数学系带回了刚毕业的四位博士前往任教,麦卡锡是其中之一。麦卡锡后来发明的LISP语言中最重要功能Eval实际就是丘奇的lambda演算,而且他后半生致力于用数理逻辑把常识形式化,大家由此猜他可能也是丘奇的学生,但其实不是,他压根学的就不是逻辑。他的老师是失去双手的代数拓扑学家所罗门·莱夫谢茨(Lefschetz)。但麦卡锡对逻辑和计算理论一直有强烈兴趣,他1948年刚到普林斯顿读研究生时就认识了冯·诺伊曼,在老冯影响下开始对在计算机上模拟智能发生兴趣。

会议的另一位有影响力的参加者是明斯基。他也是普林斯顿的数学博士,和麦卡锡在读书时就相熟。他的主业也不是逻辑,尽管他后来写过计算理论的书,还培养过好几个计算理论的博士,其中就有图灵奖获得者布鲁姆(ManualBlum)。布鲁姆目前和他老婆(就是实数计算模型BSS的B)、儿子一家三口都在卡内基梅隆大学任教。明斯基的理论情结和丘奇关系也不大,他的老师塔克(Tucker)是莱夫谢茨的学生,主要搞非线性规划和博弈论,多年担任普林斯顿数学系主任,是数学世家,儿子、孙子也都是数学家。所以按辈分论,麦卡锡还是明斯基的师叔。塔克的另一名出色的学生后来得了诺贝尔经济学奖,就是心灵美丽的纳什。纳什比明斯基小一岁,但比他早四年拿到博士,也算是明斯基的师兄。明斯基的博士论文做的是神经网络,他在MIT一百五十周年纪念会议上回忆说是冯·诺伊曼和麦卡洛克启发他做了神经网络。有人还找过他麻烦,质疑说神经网络的研究算数学吗,倒是老冯力挺说:现在不算,但很快就得算。倒是明斯基自己后来和神经网络结下梁子,那段故事见我的《“想啥来啥”和“吃啥补啥”的人工智能之争》(《东方早报·上海书评》2014年9月28日)。

塞弗里奇被后人提及不多,但他真是人工智能学科的先驱,他在MIT时一直和神经网络的开创人之一沃伦·麦卡洛克(WarrenMcCulloch)一起在维纳手下工作,他是维纳最喜欢的学生,但从没读完博士,维纳《控制论》一书的第一个读者就是塞弗里奇。塞弗里奇是模式识别的奠基人,他也写了第一个可工作的AI程序。他后来在麻省理工参与领导MAC项目,这个项目后一分为二:MIT计算机科学实验室和人工智能实验室,分久必合:现在这俩地方又合并了,变成MITCSAIL。顺便给女读者添点料:塞弗里奇的爷爷就是英国第二大百货店塞尔福里奇(Selfridges)的创始人,塞尔福里奇百货和隔壁的哈罗德百货支撑着牛津街的零售业,现在大概一半顾客来自中国二线城市。

信息论的创始人克劳德·香农(ClaudeShannon)被麦卡锡拉大旗做虎皮也请到会上打酱油。其实麦卡锡和香农的观点并不一致,平日相处也不睦。香农的硕士、博士论文都是讲怎么实现布尔代数,当时MIT校长布什(Bush)亲自指导。博士毕业后他去了普林斯顿高等研究院,曾和数学家外尔(Weyl)、爱因斯坦、哥德尔等共事,战争中,他一直在贝尔实验室做密码学的工作,图灵在1943年曾秘访美国,和同行交流破解德国密码的经验,其间和香农曾有会晤,一起聊过通用图灵机。战后香农去英国还回访过图灵,一起讨论过计算机下棋。香农内向,从没说过这段往事,直到1982年接受一次采访时才提起。1950年香农在《科学美国人》发表过一篇讲计算机下棋的文章。香农比其他几位年长十岁左右,当时已是贝尔实验室的大佬。

纽厄尔

另外两位重量级参与者是纽厄尔和司马贺(HerbertSimon)。纽厄尔是麦卡锡和明斯基的同龄人,他硕士也是在普林斯顿数学系,按说普林斯顿数学系很小,他们应有机会碰面,但那时纽厄尔和他俩还真不认识。他们的第一次见面,纽厄尔回忆是在IBM,而麦卡锡回忆是在兰德公司,纽厄尔硕士导师就是冯·诺伊曼的合作者、博弈论先驱摩根斯顿,纽厄尔硕士毕业就迁往西部加入著名智库兰德公司。在兰德开会时认识了塞弗里奇,并受到塞做的神经网络和模式识别的工作的启发,但方法论却完全走的是另一条路。

司马贺(HerbertSimon)

司马贺比他们仨都大十一岁(怀特海比罗素也大十一岁),那时是卡内基理工学院(卡内基梅隆大学的前身)工业管理系的年轻系主任,他在兰德公司学术休假时认识了纽厄尔。司马贺后来把纽厄尔力邀到卡内基梅隆大学,并给纽厄尔发了个博士学位,开始了他们终生的合作。

纽厄尔和司马贺的合作是平等的,司马是纽的老师,但他们合作的文章署名都是按字母顺序纽在前司马在后,每次他们受邀去演讲,都是轮流。司马每次见到别人把他名字放到纽厄尔之前时都纠正。他们共享了1975年的图灵奖,三年后司马贺再得诺贝尔经济学奖。纽厄尔和司马贺代表了人工智能的另一条路线:符号派,他们后来把他们的哲学思路命名为“物理符号系统假说”。简单地说就是:智能是对符号的操作,最原始的符号对应于物理客体。这个思路和英美的经验主义哲学传统接近。他们和当时的数学系主任、第一届图灵奖获得者阿兰·珀里思(AlanPerlis)一起创立了卡内基梅隆大学的计算机系,CMU从此成为计算机学科的重镇。

达特茅斯会议

会议原址:达特茅斯楼

1953年夏天,麦卡锡和明斯基都在贝尔实验室为香农打工。香农那时的兴趣是图灵机以及是否可用图灵机作为智能活动的理论基础,麦卡锡向香农建议编一本文集,请当时做智能研究的各位大佬贡献文章,这本文集直到1956年才以《自动机研究》(AutomataStudies)为名出版,这个书名最后是香农起的,他不想花里胡哨,但麦卡锡认为这没有反映他们的初衷。

文集的作者有两类人,一类是逻辑学家(后来都变成计算理论家了),如丘奇的两位杰出学生马丁·戴维斯和克里尼,后者的名著《元数学导论》国内有逻辑学家莫绍揆先生的译本。明斯基、麦卡锡也都有论文录入,香农本人贡献了一篇讲只有两个内部状态的通用图灵机的文章,文集录入的一篇冯·诺伊曼的论文后来开创了容错计算。文集的另一类作者几乎都是维纳的信徒,如阿什比(RossAshby)等,以控制论为基础。麦卡锡素不喜控制论和维纳,既不想把维纳当老大,也不愿和他见面争执,其中原因不详,或许和维纳与麦卡洛克吵翻了有关。麦卡洛克和皮茨两位为维纳《控制论》思想贡献多多的人物,在维纳的自传里压根没被提及。麦卡锡同时又觉得香农太理论,当时他想自立门户,只对用计算机实现智能感兴趣。于是他筹划再搞一次活动。

1955年夏天,麦卡锡到IBM打工(美国教授都是九个月工资,如果没有研究经费,夏天要自己觅食),他的老板是罗切斯特(NathanielRochester),罗切斯特是IBM第一代通用机701的主设计师并对神经网络素有兴趣。他们两人倒是挺对脾气,决定第二年夏天在达特茅斯搞一次活动,他俩遂说动了香农和当时在哈佛做初级研究员(JuniorFellow)的明斯基(哈佛的Fellow还是挺值钱的,历史上人数不多,蒯因、王浩、库恩在变成正式教授之前都做过。乔姆斯基几乎在同时也是哈佛的Fellow)一起给洛克菲勒基金会写了个项目建议书,希望得到资助。美国富豪还是有文化传统,至少知道要资助好东西,值得中国土豪的后代学习,别像他们的父辈即使打着“办大学”的名义还是要骗钱。

麦卡锡给这个第二年的活动起了个当时看来别出心裁的名字:“人工智能夏季研讨会”(SummerResearchProjectonArtificialIntelligence)。普遍的误解是“人工智能”这个词是麦卡锡想出来的,其实不是。麦老晚年回忆也承认这个词最早是从别人那里听来的,但记不清是谁。后来英国数学家菲利普·伍德华(Woodward)给《新科学家》杂志写信说他是AI一词的始作俑者,麦卡锡最早是听他说的,因为他1956年曾去MIT交流,见过麦卡锡。但麦卡锡的建议书1955年就开始用“人工智能”了,人老了回忆真不靠谱。当事人除了明斯基之外,都已仙逝,这事恐怕要成悬案了。

大家对“人工智能”这个词一开始并没取得完全共识。很多人认为啥事一加“人工”就变味了。纽厄尔和司马贺一直主张用“复杂信息处理”这个词,以至他们发明的语言就叫IPL(InformationProcessingLanguage)。他们从某种意义上说偏功能学派,也就是说找到智能的功能不一定非得依靠结构相同或相似。图灵机和递归函数等价,但结构完全不同,所以他们强调“信息处理”。他们俩一开始颇不喜“人工智能”几个字。1958年,在英国国家物理试验室(NPL)召开了“思维过程机器化”(MechanizationofThoughtProcess)会议,达特茅斯会议的麦卡锡、明斯基、塞弗里奇都参加了,此外还有致力神经网络研究的麦卡洛克,以及英国的控制论代表人物阿什比。两位编程语言的先驱也出席了:巴克斯(Backus)发表了一篇关于他新发明的语言FORTRAN的论文,但他后来一直是函数式语言的倡导者;美国海军女少将格蕾丝·哈泊(GraceHopper)的文章是讲第一个编译器的,这项工作导致了COBOL语言,中国也有女少将,也是码农。他俩论文的题目里都有AutomaticProgramming的说法,这在当时就是指高级语言编程,不能和后来人工智能中的自动编程搞混了。这次会上有人再提“人工思维”(ArtificialThinking)的说法。司马贺等人由此也逐渐接受了AI的说法,他晚年还写了本书“人工的科学”,倒是把Artificial这个词更加放大了。

AI历史的方法论

历史研究素有两种方法,基于事件的,基于课题(issue)的。人和事的八卦都属前种。纽厄尔在1981年为一本颇为有料的文集《信息研究》贡献的一篇文章“AI历史的智力课题”走了第二条路线。他的方法也挺有意思。他把AI历史当作斗争史,把历史分为两个阶级、两条路线的斗争,于是历史成了一串儿对立的议题,如模拟vs数字,串行vs并行,取代vs增强,语法vs语义,机械论vs目的论,生物学vs活力论,工程vs科学,符号vs连续,逻辑vs心理等,在每一议题下有进一步可分的子议题,如在逻辑vs心理下又有定理证明vs问题求解等。

被提到最多的是人工智能vs控制论。在Googlengrams里试试Cybernetics和ArtificialIntelligence两个词在GoogleBooks里出现的词频,可以看出学科的起伏跌宕。前苏联,倒是一直用“控制论”指称AI,人工智能和铁幕是一个节奏。美国最早办的一批计算机相关的系科都创办于1960年代中期,那时有些系直接叫“计算机科学系”,而有些则叫“计算机与信息科学系”,带“信息”的都有些“控制论”的背景,如麻省大学计算机与信息系的创办人就有维纳的学生麦克·阿比卜。而密歇根大学则叫计算机与通讯科学系。这些系后来都改名叫计算机系了。而原来的图书馆系现在都纷纷改名叫信息科学系,如伯克利和华盛顿大学的图书馆学院都改名叫信息学院(SchoolofInformation),连“科学”都省了。但现在计算机系又有加载信息的趋势,麻省大学和加州大学厄湾分校近年又改名叫信息与计算机科学学院了。大概和现在深度学习及神经网络又峰回路转有关吧。倒是中国的学科简单,一直都有计算机和自动化之分,老死不相往来罢了。

“人工智能”这个词真正被共同体广泛认可是在十年后的1965年,当伯克利的欧陆派哲学家德雷弗斯(HubertDreyfus)发表了《炼金术与人工智能》一文之后。这篇文章一开始只是针对纽厄尔和司马贺的工作,几年后这篇文章演变成了那本著名的(或者被AI圈子称为“臭名昭著”的)《计算机不能干什么》一书,则是把整个AI当作靶子。欧陆派哲学家被人诟病数学和科学不通,但德雷弗斯有个数学家的兄弟,和他同一年在哈佛得了应用数学博士,后来又同在伯克利教书,是动态规划的大家,还带过神经网络的博士。哥俩一个立场。有时一个共同体的形成并不是靠内部的团结,而是靠外部的反对。有意思的是《炼金术》一文是德雷弗斯在兰德公司工作时写就的。司马贺后来撰文猛批德雷弗斯,说他滥用兰德公司的标签。德雷弗斯后来抱怨他在MIT和哈佛食堂吃饭,所有AI的人都躲他远远的。学术争执哪儿都一样。

麦卡锡和明斯基的建议书里罗列了他们计划研究的七个领域:一、自动计算机,所谓“自动”指的是可编程;二、编程语言;三、神经网络;四、计算规模的理论(theoryofsizeofacalculation),这说的是计算复杂性,明斯基后来一直认为计算理论是人工智能的一部分,他早期对理论问题时不时会动动手,后来一手组建了MIT的计算理论队伍;五、自我改进,这个是说机器学习;六、抽象;七、随机性和创见性。

麦卡锡的原始预算是一万三千五百美元,但洛克菲勒基金会只批了七千五百美元。麦卡锡预计会有六位学界的人出席,会议应该支付每人两个月的薪水一千两百美元,由此可推算出麦卡锡、明斯基当时的年薪在八千美元左右。

除了那六君子外,另外还有四人也参加了达特茅斯会议。他们是来自IBM的撒缪尔(ArthurSamuel)和伯恩斯坦,他们一个研究跳棋,一个研究象棋。达特茅斯的教授摩尔(TrenchardMore)也参与了,他后来在工业界混的时间长,少为外人所知。达特茅斯会议中一位被后人忽视的先知是所罗门诺夫(Solomonoff)。

和其他来来往往的人不同,所罗门诺夫在达特茅斯严肃地待了整整一个暑假。他1951年在芝加哥大学跟随费米得了物理硕士就到了MIT。但在芝加哥对他影响最大的是哲学家卡尔纳普。有意思的是神经网络的奠基者之一皮茨也受惠于卡尔纳普。司马贺的回忆录里也讲到自己在芝加哥时听卡尔纳普的课开始启蒙逻辑,从而开始对智能相关的问题感兴趣。这么说来人工智能的两大派:逻辑和神经网络都发源于老卡。这个话题以后有机会再展开。卡尔纳普那时的兴趣是归纳推理,这成为所罗门诺夫毕生的研究方向。所罗门诺夫后来结识了明斯基和麦卡锡,在他们的影响下研究逻辑和图灵机。达特茅斯会议时,他受麦卡锡“反向图灵机”和乔姆斯基文法的启发,发明了“归纳推理机”。他的工作后来被万能的苏联数学家柯尔莫格罗夫(Kolmogorov)重新但又独立地发明了一遍,就是现在俗称“柯尔莫格罗夫复杂性”和“算法信息论”的东西。来自中国的计算理论学者李明现在是这领域的大牛,曾有专著。柯尔莫格罗夫1968年开始引用所罗门诺夫的文章,使得后者在苏联的名声比在西方更加响亮。所罗门诺夫的另一个观点“无限点”(InfinityPoint)后来被未来学家库兹维尔改名“奇点”窃为己有。目前AI中广泛用到的贝叶斯推理也可见到所罗门诺夫的开创性痕迹。他一生并没有大富大贵,大部分时间都是在自己的咨询公司Oxbridge(牛津+剑桥,汉语俗称“清北”)拿政府(空军、海军、ARPA和NIH——NIH资助了很多AI研究,以后有空再聊)的研究经费,那公司只有他自己一个雇员。伦敦大学皇家哈洛威学院(RoyalHolloway)后来在前苏联学者领导下搞柯尔莫格罗夫奖,他是第一届获奖人,并在那里兼职教授。他的学术自传1997年发表在计算理论杂志《计算机与系统科学》上。明斯基所谓AI孵化出计算理论的说法不是没有道理。

按照麦卡锡和明斯基的说法,这十个人参加了达特茅斯会议,但现在有证据表明会议也有其他的列会者,后来一直做神经网络硬件研究从而躲过AI几十年过山车的斯坦福大学电机系教授维德罗(BernardWidrow)后来回忆他也去了达特茅斯并且在那儿待了一周。

麦卡锡原来的计划是两个月闭门研讨,但并非所有人都对那个事那么上心。纽厄尔和司马贺只待了一周。纽厄尔后来回忆说达特茅斯会议对他和司马没什么影响。

尽管是“十仙过海”,但给所有人留下最深印象的是纽厄尔和司马贺的报告,他们公布了一款程序“逻辑理论家”(LogicTheorist),这个程序可以证明怀特海和罗素《数学原理》中命题逻辑部分的一个很大子集。司马贺回忆录里说自己学术生涯最重要的两年就是1955和1956年。这篇文章后来成了AI历史最重要的文章之一。一段有意思的插曲:这篇文章最早是投给逻辑学最重要的刊物《符号逻辑杂志》的,但惨遭主编克里尼退稿,理由是:把一本过时的逻辑书里的定理用机器重证一遍没啥意思。纽厄尔和司马贺给罗素写信报告这一成果,罗老不咸不淡地回复说:“我相信演绎逻辑里的所有事,机器都能干哈。”

值得注意的是“逻辑理论家”对人工智能后来的一个分支“机器定理证明”的影响并不大。哲学家王浩1958年夏天在一台IBM-704机上,只用九分钟就证明了《数学原理》中一阶逻辑的全部定理。当然《数学原理》中罗列的一阶逻辑定理只是一阶逻辑的一个子集,目前,一阶逻辑的机器定理证明比起五十年代已有长足进展,但仍然没有高效的办法。毕竟,王浩证明的是一阶逻辑而“逻辑理论家”只能处理命题逻辑。数学家马丁·戴维斯和哲学家希拉里·普特南合作沿着王浩的思路进一步提出了戴维斯-普特南(DP)证明过程,后来进一步发展为DPLL。王浩对“逻辑理论家”一直持鄙视的态度,认为这是一个不专业的东西。王浩在1983年被授予定理证明里程碑大奖,被认为是定理证明的开山鼻祖。司马贺在他回忆录里则对此不满,认为王浩的工作抵消了“逻辑理论家”的原创性,他们的初衷并不是要有效地证明定理,而是研究人的行为。这是后话,我后续还会有《机器定理证明简史》。

麦卡锡多年后回忆说:他从纽厄尔和司马贺的IPL语言中学到了表处理,这成为他后来发明LISP的基础。明斯基后来接受采访时说他对纽厄尔和司马贺的“逻辑理论家”印象深刻,因为那是第一个可工作的AI程序。但事实上,明斯基当时为大会写的总结里对“逻辑理论家”只是轻描淡写。麦卡锡和明斯基明显是一伙的,会议是他们发动的,旨在创立一门新学科。但纽厄尔和司马贺却抢了他们的风头。美国上世纪五十年代的学术氛围也不免浮躁,这一帮人又都是年轻气盛、野心十足。

会议之后

达特茅斯会后不久,1956年9月IRE(后来改名IEEE)在MIT召开信息论年会上,麦卡锡被邀请做一个对一个月前达特茅斯会议的总结报告,这引起了纽厄尔尤其是司马贺的不满,他们认为麦卡锡只能聊,没干货,而达特茅斯会议唯一的干货是纽厄尔和司马贺的程序“逻辑理论家”(LogicTheorist)。打了一圈架,最后纽厄尔和司马贺做了妥协:麦卡锡先做总结报告,但最后还是由纽厄尔和司马贺讲他们的“逻辑理论家”并发表一篇题为LogicTheoryMachine的文章。明斯基认为是他的协调起了作用,但纽厄尔晚年则只对香农的邀请有印象,而司马贺的回忆录则说是大会的主席罗森布利特和司马贺散了很长一圈步才了断。明斯基机敏异常,讲话时带幽默,但在对这段历史的重构中,却给人印象有点太“刁滑”(cynical),原因也不难猜出。研究历史有时必须得全方位,空间或时间上的接近不见得就真实。太接近时,当事人还都活着,还在一个圈子里混,不方便互相揭短。但在接近生命末期,或者功成名就或者人之将死或者对头已死无所顾忌,敞开了说,有时虽有夸张,但一不留神就会流露真话,纽厄尔属于后者。明斯基“刁滑”可能和他身体好有关系,偌大岁数也没不惑,觉得还有好长路要走。

科学达人弗里曼·戴森在他的《一面多彩的镜子》一书中借鉴过以赛亚·伯林“刺猬与狐狸”的比喻:刺猬是那些构建理论体系的人,而狐狸则是那些解决问题的人。在他眼里:爱因斯坦、哥德尔是刺猬;而费米、冯·诺伊曼属狐狸。科学史有时刺猬得势,有时狐狸当道。是不是可以说纽厄尔和司马贺更像刺猬,而麦卡锡和明斯基更像狐狸呢?具体到AI的源头和达特茅斯会议,麦卡锡认为他和明斯基是发起人,纽厄尔和司马贺是“外人”,是搅局者。明斯基的解释是纽厄尔和司马贺一开始的出发点是心理学,这与麦卡锡和他本人的背景不符。但在随后的十年里,他本人更多地走向心理学,而纽厄尔和司马贺更靠近AI,也没什么矛盾。麦卡锡除了和明斯基关系紧密外,和其他AI群体的交流并不多,在所谓其他群体中,最有影响当属卡内基梅隆了。麦卡锡晚年回忆说那时群体之间的沟通主要是通过研究生,研究生就像大佬们的大使。后来斯坦福、CMU、MIT的学生确实互为教授,门户之见随着时间的推移逐渐被抹平了。

总之,1956年IRE信息论年会是个值得纪念的会议,除了纽厄尔和司马贺发表的那篇文章之外,心理学家乔治·米勒(GeorgeMiller)发表了《人类记忆和对信息的储存》(HumanMemoryandtheStorageofInformation),这是那篇著名的文章《魔力数字七》(TheMagicNumberSeven)的另一个版本,不知算不算一稿多发。同在此会上,伟大的乔姆斯基则发表了《语言描述的三种模型》(ThreeModelsfortheDescriptionofLanguage),该文证明了有限状态句法不能表达某类语言,这是乔姆斯基分层的起源,文中引用了还没出版的不朽名著《句法结构》。乔姆斯基当时刚刚到MIT现代语言学系(该系后来演变为语言学与哲学系)出任助理教授并在MIT电子实验室做机器翻译的研究。尽管乔老爷后来是反政府斗士,但有点反讽的是他的早期研究经费都来自美国空军和海军。

从参与者的角度看,大家会认为这次IRE的信息论年会比达特茅斯会议更重要,影响也更深远。乔治·米勒回忆说他当时直觉认识到实验心理学、理论语言学、认知过程的计算机模拟,都是一个大家伙里面的组成部分。这个所谓的大家伙就是现在的人工智能加认知科学吧。

明斯基回忆自己在达特茅斯会议期间,在纸上画了一个几何定理证明器的设计,并手动模拟证明了等腰三角形的一个定理。会后的1956年9月,IBM招了新毕业的物理博士格兰特(HerbGelernter)实现明斯基的几何定理证明器。麦卡锡此时受到纽厄尔和司马的影响,建议在Fortran里实现表处理语言,作为实现语言。这个项目在1959年实现后,IBM削减了AI的投入,把这项目砍掉了,理由是IBM不想给人以机器可以替代人的印象。IBM再次资助AI是二十几年后的1983年了,现在好像IBM百年老店只能靠AI系统Watson翻身了。

麦卡锡1958年离开达特茅斯去了MIT,他帮助创立了MIT的MAC项目。他和明斯基一起领导了MAC项目中的AI实验室,1962年他再次跳槽到斯坦福。之后明斯基又和帕伯特(Papert)合作。计算机操作系统里“分时”的概念是由麦卡锡在MAC项目中首创的。他回忆说当时机器太少,但等着上机的学生很多。于是就发明了分时系统。按说分时系统的贡献要比麦卡锡后来的AI贡献彰显得多,但麦卡锡得图灵奖可不是靠“分时”,这就像爱因斯坦得诺奖没靠相对论一样。从这个意义上AI有点像哲学:由此衍生出很多问题,而对这些问题的解决产生出许多子学科;一旦这些子学科独立,就不再待见AI了。现在计算机科学已成为成熟的学科,每个计算机系大都有三拨人:理论、系统和AI。二十年前的美国计算机圈子曾有一种说法:理论和系统的人互相看不起,但又同时看不起AI的人。AI这几年火了,但曾几何时,AI人是被压迫者。哲学曾经孕育了科学,但一旦问题被确定,就分离成为单独的科学,最新的例子是逻辑学,现在的逻辑学家都在数学系和计算机系,哲学系被彻底空洞化。哲学家丹尼尔·丹尼特曾说:AI就是哲学。MAC项目孕育了计算机科学中很多原创的概念。以至于明斯基后来认为UNIX系统是反动落后的东西,因为他们丢掉了很多Multics中的精华。

1968年,参议院多数党领袖曼斯菲尔德对“先进研究项目局”(ARPA)的资助方向不满,他认为国防部的钱不能被用于军事目的之外,非军事目的的项目应该由美国国家科学基金会NSF负责。于是,ARPA遂改名DARPA,更强调“国防”。七十年代初期在海尔梅尔(GeorgeHeilmeirer)任内,DARPA大砍AI预算。协调政府和AI实验室的工作变得头绪繁多,明斯基决定从AI实验室退位,让他刚毕业的学生温斯顿(PatrickWinston)接手。

尽管明斯基说他不喜事务性工作,但他的采访和回忆中,触及的话题总是和联邦政府的资助有关。温斯顿后来回忆时说,管理一个成功的实验室要管理好三个圈的交集:出资人(主要是政府)、科学上有创建、有国计民生的价值。他试图说服几任ARPA的头别把AI当作一个几年一次的项目,而是长期而独立的一门学科。另外他对比了早期ARPA和NSF的不同,NSF给钱少,而且都是同行评议制,结果是越有成就的(established)拿的钱越多,但很少会有根本性的原创性贡献,ARPA早期都是头们说了算,好处是如果管事的头们品味好,肯定会支持好东西。这点也值得中国科技人的借鉴:大型项目决策者的品味可以超越“透明计算”吗?

再说回海尔梅尔,他以AI不能帮助造武器打仗为理由。削减了对AI的大规模经费,但同时却重金资助了隐形飞机和空间武器技术,使美国在相关领域一直保持领先。ARPA资助的这类项目要是通过同行评议是很难实施的。ARPA几乎在同时也支持了ARPAnet,后来演变成互联网。有意思的是,海尔梅尔从ARPA离任后去了德州仪器(TI)做CTO,在TI却大力提倡AI。ARPA对AI的资助在克柔克(SteveCrocker)手里才逐步回复。大家知道克柔克是互联网的先驱之一。再后来的ARPA信息技术办公室(IPTO)的负责人中还有图灵奖获得者萨瑟兰(Sutherland),也对AI继续投入。精英制风格的ARPA,更适合做大型开创性项目,成功取决于少数决策者;而以民主制为基础的NSF,历来就是小规模资助基础研究。

预测未来:会有奇点吗?

司马贺1957年曾预言十年内计算机下棋会击败人。1968年麦卡锡和象棋大师列维(DavidLevy)打赌说十年内下棋程序会战胜列维,最后赔了列维两千块。乐观的预言总会给对手留下把柄:德雷弗斯后来每年都拿此事嘲讽AI,说计算机下下跳棋还行,下象棋连十岁的孩子都干不过。这便宜话一直说到1997年,IBM的下棋程序“深蓝”击败了卡斯帕罗夫。这真是“四十年太久,只争朝夕”啊。在1995年卡斯帕罗夫还在批评计算机下棋缺乏悟性(insights),但1996年时他已经开始意识到“深蓝”貌似有悟性了。而两年间“深蓝”的计算能力只不过提高了一倍而已。有没有悟性其实就是人的能力的极限。量变到质变的临界点就是人的解释能力,人解释不了的东西就有悟性,解释了的东西就没有悟性。司马贺和日本计算机科学家宗像俊则(Munakata)合写了篇解气的文章《人工智能的教训》(AILessons)登在《ACM通讯》上。

当然,德雷弗斯们还可以将“计算机仍然不能干什么”加上若干个“仍然”接着批评。明斯基1968年在库布里克的电影《2001太空漫游》的新闻发布会上曾大放厥词说三十年内机器智能可以和人有一拼,1989年又预言二十年可以解决自然语言处理。现在我们恐怕还不能说机器翻译器令人满意吧。过分乐观的另一个原因,照明斯基自己的说法是,一门年轻的学科,一开始都需要一点“过度销售”(excessivesalesmanship)。但是过头了不免被人当作狗皮膏药或炼金术。

2006年,达特茅斯会议五十年,十位当时的与会者有五位仙逝,活着的五位:摩尔、麦卡锡、明斯基、塞弗里奇和所罗门诺夫在达特茅斯团聚,忆往昔展未来。参会人之一霍维茨(Horvitz)现在是微软实验室的头目,他和他老婆拿出一笔钱在斯坦福捐助了一个“AI100”的活动:在下面一百年里各路豪杰聚会,每五年出个AI进展报告。第一期原定于2015年底出版,我们拭目以待。

乔姆斯基晚年边做学问边做斗士。2015年3月他和物理学家克劳斯对话时被问及“机器可以思维吗?”,他套用计算机科学家戴客斯特拉(Dijkstra)的说法反问:“潜艇会游泳吗?”如果机器人可以有意识(consciousness)的性质,机器人可以被认为有意识吗?他进一步说“意识”是相对简单的,而“前意识”(preconsciousness)是困难的问题。他把AI分成工程的和科学的。工程的,如自动驾驶车等,能做出对人类有用的东西;科学的一面,乔老爷明显不认可。他引用图灵的话:这问题toomeaninglesstodeservediscussion(没有讨论的意义)。当一帮奇点理论的粉丝带着正面的期望采访乔姆斯基时,他却对人工智能这个被他深刻影响过的学科没太当回事,他认为气候和毁灭性武器是比奇点更紧迫的问题。这算有意回避吧。

明斯基在2012年接受他的学生、预言家、奇点理论炮制者库兹维尔的采访时说,他相信奇点的到来,可能就在我们的有生之年。两位“斯基”在MIT一百五十年纪念会上分在一个小组讨论里,却只打了下太极,并没有针锋相对。他们尽管年长,但身体都挺好,如果他们能在2016年达特茅斯会议六十年时面对面掐一架,肯定会很精彩,反正住得也不远。

人工智能历史回眸:达特茅斯会议

后来,这被人们看作是人工智能正式诞生的标志。就在这次会议后不久,麦卡锡与明斯基两人共同创建了世界上第一座人工智能实验室——MITAILAB实验室。开始从学术角度对AI展开严肃而精专的研究。在那之后不久,最早的一批人工智能学者和技术开始涌现,从此人工智能走上了快速发展的道路。现在一说起人工智能的起源,公认是1956年的达特茅斯会议。殊不知还有个前戏:1955年,美国西部计算机联合大会(WesternJointComputerConference)在洛杉矶召开,会中还套了个小会:“学习机讨论会”(SessiononLearningMachine)。讨论会的参加者中有两个人参加了第二年的达特茅斯会议,他们是塞弗里奇(OliverSelfridge)和纽厄尔(AllenNewell),塞弗里奇发表了一篇模式识别的文章,而纽厄尔则探讨了计算机下棋,他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨(Pitts)(热爱数学,很聪明的年轻人),他最后总结时说:“(一派人)企图模拟神经系统,而纽厄尔则企图模拟心智(mind)……但殊途同归。”皮茨眼可真毒,这预示了人工智能随后几十年关于“结构与功能”两个阶级、两条路线的斗争。

 

 美国*达特茅斯学院

 

会议参加者(简介)

 

  开聊达特茅斯会议之前,先说六个最相关的人。首先,会议的召集者麦卡锡(JohnMcCarthy)当时是达特茅斯学院的数学系助理教授。两年前(1954年)达特茅斯数学系同时有四位教授退休,这对达特茅斯这样的小学校真是不可承受之轻。刚上任的年轻系主任克门尼(Kemeny)之前两年才在普林斯顿逻辑学家丘奇(Church)门下得了逻辑学博士,于是跑到母校求援。这么说起来,克门尼算是图灵的师弟,他战时和物理学家费曼一起工作,还一度当过爱因斯坦的数学助理,后来一头扎在计算机里,和麦卡锡一起琢磨出了分时系统,但他最为人知的工作应该是老少咸宜的编程语言BASIC。现在估计已经没人知道BASIC语言发明人曾是LISP语言发明人的老板。克门尼是天生的官僚,后来位居达特茅斯的校长,美国三里岛核电站出事,总统委托他当调查委员会主席,这是后话。克门尼从母校数学系带回了刚毕业的四位博士前往任教,麦卡锡是其中之一。麦卡锡后来发明的LISP语言中最重要功能Eval实际就是丘奇的lambda演算,而且他后半生致力于用数理逻辑把常识形式化,大家由此猜他可能也是丘奇的学生,但其实不是,他压根学的就不是逻辑。他的老师是失去双手的代数拓扑学家所罗门.莱夫谢茨(Lefschetz)。但麦卡锡对逻辑和计算理论一直有强烈兴趣,他1948年刚到普林斯顿读研究生时就认识了冯.诺伊曼,在老冯影响下开始对在计算机上模拟智能发生兴趣。

     本次会议的10位参会人员 

 

 会议的另一位有影响力的参加者是明斯基。他也是普林斯顿的数学博士,和麦卡锡在读书时就相熟。他的主业也不是逻辑,尽管他后来写过计算理论的书,还培养过好几个计算理论的博士,其中就有图灵奖获得者布鲁姆(ManualBlum)。布鲁姆目前和他老婆(就是实数计算模型BSS的B)、儿子一家三口都在卡内基梅隆大学任教。明斯基的理论情结和丘奇关系也不大,他的老师塔克(Tucker)是莱夫谢茨的学生,主要搞非线性规划和博弈论,多年担任普林斯顿数学系主任,是数学世家,儿子、孙子也都是数学家。所以按辈分论,麦卡锡还是明斯基的师叔。塔克的另一名出色的学生后来得了诺贝尔经济学奖,就是心灵美丽的纳什。纳什比明斯基小一岁,但比他早四年拿到博士,也算是明斯基的师兄。明斯基的博士论文做的是神经网络,他在MIT一百五十周年纪念会议上回忆说是冯.诺伊曼和麦卡洛克启发他做了神经网络。有人还找过他麻烦,质疑说神经网络的研究算数学吗,倒是老冯力挺说:现在不算,但很快就得算。倒是明斯基自己后来和神经网络结下梁子,那段故事见我的《“想啥来啥”和“吃啥补啥”的人工智能之争》(《东方早报.上海书评》2014年9月28日)。

塞弗里奇被后人提及不多,但他真是人工智能学科的先驱,他在MIT时一直和神经网络的开创人之一沃伦.麦卡洛克(WarrenMcCulloch)一起在维纳手下工作,他是维纳最喜欢的学生,但从没读完博士,维纳《控制论》一书的第一个读者就是塞弗里奇。塞弗里奇是模式识别的奠基人,他也写了第一个可工作的AI程序。他后来在麻省理工参与领导MAC项目,这个项目后一分为二:MIT计算机科学实验室和人工智能实验室,分久必合:现在这俩地方又合并了,变成MITCSAIL。顺便给女读者添点料:塞弗里奇的爷爷就是英国第二大百货店塞尔福里奇(Selfridges)的创始人,塞尔福里奇百货和隔壁的哈罗德百货支撑着牛津街的零售业,现在大概一半顾客来自中国二线城市。

信息论的创始人克劳德.香农(ClaudeShannon)被麦卡锡拉大旗做虎皮也请到会上打酱油。其实麦卡锡和香农的观点并不一致,平日相处也不睦。香农的硕士、博士论文都是讲怎么实现布尔代数,当时MIT校长布什(Bush)亲自指导。博士毕业后他去了普林斯顿高等研究院,曾和数学家外尔(Weyl)、爱因斯坦、哥德尔等共事,战争中,他一直在贝尔实验室做密码学的工作,图灵在1943年曾秘访美国,和同行交流破解德国密码的经验,其间和香农曾有会晤,一起聊过通用图灵机。战后香农去英国还回访过图灵,一起讨论过计算机下棋。香农内向,从没说过这段往事,直到1982年接受一次采访时才提起。1950年香农在《科学美国人》发表过一篇讲计算机下棋的文章。香农比其他几位年长十岁左右,当时已是贝尔实验室的大佬。

另外两位重量级参与者是纽厄尔和司马贺(HerbertSimon)。纽厄尔是麦卡锡和明斯基的同龄人,他硕士也是在普林斯顿数学系,按说普林斯顿数学系很小,他们应有机会碰面,但那时纽厄尔和他俩还真不认识。他们的第一次见面,纽厄尔回忆是在IBM,而麦卡锡回忆是在兰德公司,纽厄尔硕士导师就是冯.诺伊曼的合作者、博弈论先驱摩根斯顿,纽厄尔硕士毕业就迁往西部加入著名智库兰德公司。在兰德开会时认识了塞弗里奇,并受到塞做的神经网络和模式识别的工作的启发,但方法论却完全走的是另一条路。

司马贺比他们仨都大十一岁(怀特海比罗素也大十一岁),那时是卡内基理工学院(卡内基梅隆大学的前身)工业管理系的年轻系主任,他在兰德公司学术休假时认识了纽厄尔。司马贺后来把纽厄尔力邀到卡内基梅隆大学,并给纽厄尔发了个博士学位,开始了他们终生的合作。

纽厄尔和司马贺的合作是平等的,司马是纽的老师,但他们合作的文章署名都是按字母顺序纽在前司马在后,每次他们受邀去演讲,都是轮流。司马每次见到别人把他名字放到纽厄尔之前时都纠正。他们共享了1975年的图灵奖,三年后司马贺再得诺贝尔经济学奖。纽厄尔和司马贺代表了人工智能的另一条路线:符号派,他们后来把他们的哲学思路命名为“物理符号系统假说”。简单地说就是:智能是对符号的操作,最原始的符号对应于物理客体。这个思路和英美的经验主义哲学传统接近。他们和当时的数学系主任、第一届图灵奖获得者阿兰.珀里思(AlanPerlis)一起创立了卡内基梅隆大学的计算机系,CMU从此成为计算机学科的重镇。

 

 达特茅斯会议

 

1953年夏天,麦卡锡和明斯基都在贝尔实验室为香农打工。香农那时的兴趣是图灵机以及是否可用图灵机作为智能活动的理论基础,麦卡锡向香农建议编一本文集,请当时做智能研究的各位大佬贡献文章,这本文集直到1956年才以《自动机研究》(AutomataStudies)为名出版,这个书名最后是香农起的,他不想花里胡哨,但麦卡锡认为这没有反映他们的初衷。

文集的作者有两类人,一类是逻辑学家(后来都变成计算理论家了),如丘奇的两位杰出学生马丁.戴维斯和克里尼,后者的名著《元数学导论》国内有逻辑学家莫绍揆先生的译本。明斯基、麦卡锡也都有论文录入,香农本人贡献了一篇讲只有两个内部状态的通用图灵机的文章,文集录入的一篇冯.诺伊曼的论文后来开创了容错计算。文集的另一类作者几乎都是维纳的信徒,如阿什比(RossAshby)等,以控制论为基础。麦卡锡素不喜控制论和维纳,既不想把维纳当老大,也不愿和他见面争执,其中原因不详,或许和维纳与麦卡洛克吵翻了有关。麦卡洛克和皮茨两位为维纳《控制论》思想贡献多多的人物,在维纳的自传里压根没被提及。麦卡锡同时又觉得香农太理论,当时他想自立门户,只对用计算机实现智能感兴趣。于是他筹划再搞一次活动。

1955年夏天,麦卡锡到IBM打工(美国教授都是九个月工资,如果没有研究经费,夏天要自己觅食),他的老板是罗切斯特(NathanielRochester),罗切斯特是IBM第一代通用机701的主设计师并对神经网络素有兴趣。他们两人倒是挺对脾气,决定第二年夏天在达特茅斯搞一次活动,他俩遂说动了香农和当时在哈佛做初级研究员(JuniorFellow)的明斯基(哈佛的Fellow还是挺值钱的,历史上人数不多,蒯因、王浩、库恩在变成正式教授之前都做过。乔姆斯基几乎在同时也是哈佛的Fellow)一起给洛克菲勒基金会写了个项目建议书,希望得到资助。美国富豪还是有文化传统,至少知道要资助好东西,值得中国土豪的后代学习,别像他们的父辈即使打着“办大学”的名义还是要骗钱。

麦卡锡给这个第二年的活动起了个当时看来别出心裁的名字:“人工智能夏季研讨会”(SummerResearchProjectonArtificialIntelligence)。普遍的误解是“人工智能”这个词是麦卡锡想出来的,其实不是。麦老晚年回忆也承认这个词最早是从别人那里听来的,但记不清是谁。后来英国数学家菲利普.伍德华(Woodward)给《新科学家》杂志写信说他是AI一词的始作俑者,麦卡锡最早是听他说的,因为他1956年曾去MIT交流,见过麦卡锡。但麦卡锡的建议书1955年就开始用“人工智能”了,人老了回忆真不靠谱。当事人除了明斯基之外,都已仙逝,这事恐怕要成悬案了。

大家对“人工智能”这个词一开始并没取得完全共识。很多人认为啥事一加“人工”就变味了。纽厄尔和司马贺一直主张用“复杂信息处理”这个词,以至他们发明的语言就叫IPL(InformationProcessingLanguage)。他们从某种意义上说偏功能学派,也就是说找到智能的功能不一定非得依靠结构相同或相似。图灵机和递归函数等价,但结构完全不同,所以他们强调“信息处理”。他们俩一开始颇不喜“人工智能”几个字。1958年,在英国国家物理试验室(NPL)召开了“思维过程机器化”(MechanizationofThoughtProcess)会议,达特茅斯会议的麦卡锡、明斯基、塞弗里奇都参加了,此外还有致力神经网络研究的麦卡洛克,以及英国的控制论代表人物阿什比。两位编程语言的先驱也出席了:巴克斯(Backus)发表了一篇关于他新发明的语言FORTRAN的论文,但他后来一直是函数式语言的倡导者;美国海军女少将格蕾丝.哈泊(GraceHopper)的文章是讲第一个编译器的,这项工作导致了COBOL语言,中国也有女少将,也是码农。他俩论文的题目里都有AutomaticProgramming的说法,这在当时就是指高级语言编程,不能和后来人工智能中的自动编程搞混了。这次会上有人再提“人工思维”(ArtificialThinking)的说法。司马贺等人由此也逐渐接受了AI的说法,他晚年还写了本书“人工的科学”,倒是把Artificial这个词更加放大了。

 

  AI历史的方法论

 

历史研究素有两种方法,基于事件的,基于课题(issue)的。人和事的八卦都属前种。纽厄尔在1981年为一本颇为有料的文集《信息研究》贡献的一篇文章“AI历史的智力课题”走了第二条路线。他的方法也挺有意思。他把AI历史当作斗争史,把历史分为两个阶级、两条路线的斗争,于是历史成了一串儿对立的议题,如模拟vs数字,串行vs并行,取代vs增强,语法vs语义,机械论vs目的论,生物学vs活力论,工程vs科学,符号vs连续,逻辑vs心理等,在每一议题下有进一步可分的子议题,如在逻辑vs心理下又有定理证明vs问题求解等。

被提到最多的是人工智能vs控制论。在Googlengrams里试试Cybernetics和ArtificialIntelligence两个词在GoogleBooks里出现的词频,可以看出学科的起伏跌宕。前苏联,倒是一直用“控制论”指称AI,人工智能和铁幕是一个节奏。美国最早办的一批计算机相关的系科都创办于1960年代中期,那时有些系直接叫“计算机科学系”,而有些则叫“计算机与信息科学系”,带“信息”的都有些“控制论”的背景,如麻省大学计算机与信息系的创办人就有维纳的学生麦克.阿比卜。而密歇根大学则叫计算机与通讯科学系。这些系后来都改名叫计算机系了。而原来的图书馆系现在都纷纷改名叫信息科学系,如伯克利和华盛顿大学的图书馆学院都改名叫信息学院(SchoolofInformation),连“科学”都省了。但现在计算机系又有加载信息的趋势,麻省大学和加州大学厄湾分校近年又改名叫信息与计算机科学学院了。大概和现在深度学习及神经网络又峰回路转有关吧。倒是中国的学科简单,一直都有计算机和自动化之分,老死不相往来罢了。

“人工智能”这个词真正被共同体广泛认可是在十年后的1965年,当伯克利的欧陆派哲学家德雷弗斯(HubertDreyfus)发表了《炼金术与人工智能》一文之后。这篇文章一开始只是针对纽厄尔和司马贺的工作,几年后这篇文章演变成了那本著名的(或者被AI圈子称为“臭名昭著”的)《计算机不能干什么》一书,则是把整个AI当作靶子。欧陆派哲学家被人诟病数学和科学不通,但德雷弗斯有个数学家的兄弟,和他同一年在哈佛得了应用数学博士,后来又同在伯克利教书,是动态规划的大家,还带过神经网络的博士。哥俩一个立场。有时一个共同体的形成并不是靠内部的团结,而是靠外部的反对。有意思的是《炼金术》一文是德雷弗斯在兰德公司工作时写就的。司马贺后来撰文猛批德雷弗斯,说他滥用兰德公司的标签。德雷弗斯后来抱怨他在MIT和哈佛食堂吃饭,所有AI的人都躲他远远的。学术争执哪儿都一样。

麦卡锡和明斯基的建议书里罗列了他们计划研究的七个领域:一、自动计算机,所谓“自动”指的是可编程;二、编程语言;三、神经网络;四、计算规模的理论(theoryofsizeofacalculation),这说的是计算复杂性,明斯基后来一直认为计算理论是人工智能的一部分,他早期对理论问题时不时会动动手,后来一手组建了MIT的计算理论队伍;五、自我改进,这个是说机器学习;六、抽象;七、随机性和创见性。

麦卡锡的原始预算是一万三千五百美元,但洛克菲勒基金会只批了七千五百美元。麦卡锡预计会有六位学界的人出席,会议应该支付每人两个月的薪水一千两百美元,由此可推算出麦卡锡、明斯基当时的年薪在八千美元左右。

除了那六君子外,另外还有四人也参加了达特茅斯会议。他们是来自IBM的撒缪尔(ArthurSamuel)和伯恩斯坦,他们一个研究跳棋,一个研究象棋。达特茅斯的教授摩尔(TrenchardMore)也参与了,他后来在工业界混的时间长,少为外人所知。达特茅斯会议中一位被后人忽视的先知是所罗门诺夫(Solomonoff)。

和其他来来往往的人不同,所罗门诺夫在达特茅斯严肃地待了整整一个暑假。他1951年在芝加哥大学跟随费米得了物理硕士就到了MIT。但在芝加哥对他影响最大的是哲学家卡尔纳普。有意思的是神经网络的奠基者之一皮茨也受惠于卡尔纳普。司马贺的回忆录里也讲到自己在芝加哥时听卡尔纳普的课开始启蒙逻辑,从而开始对智能相关的问题感兴趣。这么说来人工智能的两大派:逻辑和神经网络都发源于老卡。这个话题以后有机会再展开。卡尔纳普那时的兴趣是归纳推理,这成为所罗门诺夫毕生的研究方向。所罗门诺夫后来结识了明斯基和麦卡锡,在他们的影响下研究逻辑和图灵机。达特茅斯会议时,他受麦卡锡“反向图灵机”和乔姆斯基文法的启发,发明了“归纳推理机”。他的工作后来被万能的苏联数学家柯尔莫格罗夫(Kolmogorov)重新但又独立地发明了一遍,就是现在俗称“柯尔莫格罗夫复杂性”和“算法信息论”的东西。来自中国的计算理论学者李明现在是这领域的大牛,曾有专著。柯尔莫格罗夫1968年开始引用所罗门诺夫的文章,使得后者在苏联的名声比在西方更加响亮。所罗门诺夫的另一个观点“无限点”(InfinityPoint)后来被未来学家库兹维尔改名“奇点”窃为己有。目前AI中广泛用到的贝叶斯推理也可见到所罗门诺夫的开创性痕迹。他一生并没有大富大贵,大部分时间都是在自己的咨询公司Oxbridge(牛津+剑桥,汉语俗称“清北”)拿政府(空军、海军、ARPA和NIH——NIH资助了很多AI研究,以后有空再聊)的研究经费,那公司只有他自己一个雇员。伦敦大学皇家哈洛威学院(RoyalHolloway)后来在前苏联学者领导下搞柯尔莫格罗夫奖,他是第一届获奖人,并在那里兼职教授。他的学术自传1997年发表在计算理论杂志《计算机与系统科学》上。明斯基所谓AI孵化出计算理论的说法不是没有道理。

按照麦卡锡和明斯基的说法,这十个人参加了达特茅斯会议,但现在有证据表明会议也有其他的列会者,后来一直做神经网络硬件研究从而躲过AI几十年过山车的斯坦福大学电机系教授维德罗(BernardWidrow)后来回忆他也去了达特茅斯并且在那儿待了一周。

麦卡锡原来的计划是两个月闭门研讨,但并非所有人都对那个事那么上心。纽厄尔和司马贺只待了一周。纽厄尔后来回忆说达特茅斯会议对他和司马没什么影响。

尽管是“十仙过海”,但给所有人留下最深印象的是纽厄尔和司马贺的报告,他们公布了一款程序“逻辑理论家”(LogicTheorist),这个程序可以证明怀特海和罗素《数学原理》中命题逻辑部分的一个很大子集。司马贺回忆录里说自己学术生涯最重要的两年就是1955和1956年。这篇文章后来成了AI历史最重要的文章之一。一段有意思的插曲:这篇文章最早是投给逻辑学最重要的刊物《符号逻辑杂志》的,但惨遭主编克里尼退稿,理由是:把一本过时的逻辑书里的定理用机器重证一遍没啥意思。纽厄尔和司马贺给罗素写信报告这一成果,罗老不咸不淡地回复说:“我相信演绎逻辑里的所有事,机器都能干哈。”

值得注意的是“逻辑理论家”对人工智能后来的一个分支“机器定理证明”的影响并不大。哲学家王浩1958年夏天在一台IBM-704机上,只用九分钟就证明了《数学原理》中一阶逻辑的全部定理。当然《数学原理》中罗列的一阶逻辑定理只是一阶逻辑的一个子集,目前,一阶逻辑的机器定理证明比起五十年代已有长足进展,但仍然没有高效的办法。毕竟,王浩证明的是一阶逻辑而“逻辑理论家”只能处理命题逻辑。数学家马丁.戴维斯和哲学家希拉里.普特南合作沿着王浩的思路进一步提出了戴维斯-普特南(DP)证明过程,后来进一步发展为DPLL。王浩对“逻辑理论家”一直持鄙视的态度,认为这是一个不专业的东西。王浩在1983年被授予定理证明里程碑大奖,被认为是定理证明的开山鼻祖。司马贺在他回忆录里则对此不满,认为王浩的工作抵消了“逻辑理论家”的原创性,他们的初衷并不是要有效地证明定理,而是研究人的行为。这是后话,我后续还会有《机器定理证明简史》。

麦卡锡多年后回忆说:他从纽厄尔和司马贺的IPL语言中学到了表处理,这成为他后来发明LISP的基础。明斯基后来接受采访时说他对纽厄尔和司马贺的“逻辑理论家”印象深刻,因为那是第一个可工作的AI程序。但事实上,明斯基当时为大会写的总结里对“逻辑理论家”只是轻描淡写。麦卡锡和明斯基明显是一伙的,会议是他们发动的,旨在创立一门新学科。但纽厄尔和司马贺却抢了他们的风头。美国上世纪五十年代的学术氛围也不免浮躁,这一帮人又都是年轻气盛、野心十足。

 

 会议之后

 

达特茅斯会后不久,1956年9月IRE(后来改名IEEE)在MIT召开信息论年会上,麦卡锡被邀请做一个对一个月前达特茅斯会议的总结报告,这引起了纽厄尔尤其是司马贺的不满,他们认为麦卡锡只能聊,没干货,而达特茅斯会议唯一的干货是纽厄尔和司马贺的程序“逻辑理论家”(LogicTheorist)。打了一圈架,最后纽厄尔和司马贺做了妥协:麦卡锡先做总结报告,但最后还是由纽厄尔和司马贺讲他们的“逻辑理论家”并发表一篇题为LogicTheoryMachine的文章。明斯基认为是他的协调起了作用,但纽厄尔晚年则只对香农的邀请有印象,而司马贺的回忆录则说是大会的主席罗森布利特和司马贺散了很长一圈步才了断。明斯基机敏异常,讲话时带幽默,但在对这段历史的重构中,却给人印象有点太“***滑”(cynical),原因也不难猜出。研究历史有时必须得全方位,空间或时间上的接近不见得就真实。太接近时,当事人还都活着,还在一个圈子里混,不方便互相揭短。但在接近生命末期,或者功成名就或者人之将死或者对头已死无所顾忌,敞开了说,有时虽有夸张,但一不留神就会流露真话,纽厄尔属于后者。明斯基“***滑”可能和他身体好有关系,偌大岁数也没不惑,觉得还有好长路要走。

科学达人弗里曼.戴森在他的《一面多彩的镜子》一书中借鉴过以赛亚.伯林“刺猬与狐狸”的比喻:刺猬是那些构建理论体系的人,而狐狸则是那些解决问题的人。在他眼里:爱因斯坦、哥德尔是刺猬;而费米、冯.诺伊曼属狐狸。科学史有时刺猬得势,有时狐狸当道。是不是可以说纽厄尔和司马贺更像刺猬,而麦卡锡和明斯基更像狐狸呢?具体到AI的源头和达特茅斯会议,麦卡锡认为他和明斯基是发起人,纽厄尔和司马贺是“外人”,是搅局者。明斯基的解释是纽厄尔和司马贺一开始的出发点是心理学,这与麦卡锡和他本人的背景不符。但在随后的十年里,他本人更多地走向心理学,而纽厄尔和司马贺更靠近AI,也没什么矛盾。麦卡锡除了和明斯基关系紧密外,和其他AI群体的交流并不多,在所谓其他群体中,最有影响当属卡内基梅隆了。麦卡锡晚年回忆说那时群体之间的沟通主要是通过研究生,研究生就像大佬们的大使。后来斯坦福、CMU、MIT的学生确实互为教授,门户之见随着时间的推移逐渐被抹平了。

总之,1956年IRE信息论年会是个值得纪念的会议,除了纽厄尔和司马贺发表的那篇文章之外,心理学家乔治.米勒(GeorgeMiller)发表了《人类记忆和对信息的储存》(HumanMemoryandtheStorageofInformation),这是那篇著名的文章《魔力数字七》(TheMagicNumberSeven)的另一个版本,不知算不算一稿多发。同在此会上,伟大的乔姆斯基则发表了《语言描述的三种模型》(ThreeModelsfortheDeionofLanguage),该文证明了有限状态句法不能表达某类语言,这是乔姆斯基分层的起源,文中引用了还没出版的不朽名著《句法结构》。乔姆斯基当时刚刚到MIT现代语言学系(该系后来演变为语言学与哲学系)出任助理教授并在MIT电子实验室做机器翻译的研究。尽管乔老爷后来是反政府斗士,但有点反讽的是他的早期研究经费都来自美国空军和海军。

从参与者的角度看,大家会认为这次IRE的信息论年会比达特茅斯会议更重要,影响也更深远。乔治.米勒回忆说他当时直觉认识到实验心理学、理论语言学、认知过程的计算机模拟,都是一个大家伙里面的组成部分。这个所谓的大家伙就是现在的人工智能加认知科学吧。

明斯基回忆自己在达特茅斯会议期间,在纸上画了一个几何定理证明器的设计,并手动模拟证明了等腰三角形的一个定理。会后的1956年9月,IBM招了新毕业的物理博士格兰特(HerbGelernter)实现明斯基的几何定理证明器。麦卡锡此时受到纽厄尔和司马的影响,建议在Fortran里实现表处理语言,作为实现语言。这个项目在1959年实现后,IBM削减了AI的投入,把这项目砍掉了,理由是IBM不想给人以机器可以替代人的印象。IBM再次资助AI是二十几年后的1983年了,现在好像IBM百年老店只能靠AI系统Watson翻身了。

麦卡锡1958年离开达特茅斯去了MIT,他帮助创立了MIT的MAC项目。他和明斯基一起领导了MAC项目中的AI实验室,1962年他再次跳槽到斯坦福。之后明斯基又和帕伯特(Papert)合作。计算机操作系统里“分时”的概念是由麦卡锡在MAC项目中首创的。他回忆说当时机器太少,但等着上机的学生很多。于是就发明了分时系统。按说分时系统的贡献要比麦卡锡后来的AI贡献彰显得多,但麦卡锡得图灵奖可不是靠“分时”,这就像爱因斯坦得诺奖没靠相对论一样。从这个意义上AI有点像哲学:由此衍生出很多问题,而对这些问题的解决产生出许多子学科;一旦这些子学科独立,就不再待见AI了。现在计算机科学已成为成熟的学科,每个计算机系大都有三拨人:理论、系统和AI。二十年前的美国计算机圈子曾有一种说法:理论和系统的人互相看不起,但又同时看不起AI的人。AI这几年火了,但曾几何时,AI人是被压迫者。哲学曾经孕育了科学,但一旦问题被确定,就分离成为单独的科学,最新的例子是逻辑学,现在的逻辑学家都在数学系和计算机系,哲学系被彻底空洞化。哲学家丹尼尔.丹尼特曾说:AI就是哲学。MAC项目孕育了计算机科学中很多原创的概念。以至于明斯基后来认为UNIX系统是反动落后的东西,因为他们丢掉了很多Multics中的精华。

1968年,参议院多数党领袖曼斯菲尔德对“先进研究项目局”(ARPA)的资助方向不满,他认为国防部的钱不能被用于军事目的之外,非军事目的的项目应该由美国国家科学基金会NSF负责。于是,ARPA遂改名DARPA,更强调“国防”。七十年代初期在海尔梅尔(GeorgeHeilmeirer)任内,DARPA大砍AI预算。协调政府和AI实验室的工作变得头绪繁多,明斯基决定从AI实验室退位,让他刚毕业的学生温斯顿(PatrickWinston)接手。

尽管明斯基说他不喜事务性工作,但他的采访和回忆中,触及的话题总是和联邦政府的资助有关。温斯顿后来回忆时说,管理一个成功的实验室要管理好三个圈的交集:出资人(主要是政府)、科学上有创建、有国计民生的价值。他试图说服几任ARPA的头别把AI当作一个几年一次的项目,而是长期而独立的一门学科。另外他对比了早期ARPA和NSF的不同,NSF给钱少,而且都是同行评议制,结果是越有成就的(established)拿的钱越多,但很少会有根本性的原创性贡献,ARPA早期都是头们说了算,好处是如果管事的头们品味好,肯定会支持好东西。这点也值得中国科技人的借鉴:大型项目决策者的品味可以超越“透明计算”吗?

再说回海尔梅尔,他以AI不能帮助造武器打仗为理由。削减了对AI的大规模经费,但同时却重金资助了隐形飞机和空间武器技术,使美国在相关领域一直保持领先。ARPA资助的这类项目要是通过同行评议是很难实施的。ARPA几乎在同时也支持了ARPAnet,后来演变成互联网。有意思的是,海尔梅尔从ARPA离任后去了德州仪器(TI)做CTO,在TI却大力提倡AI。ARPA对AI的资助在克柔克(SteveCrocker)手里才逐步回复。大家知道克柔克是互联网的先驱之一。再后来的ARPA信息技术办公室(IPTO)的负责人中还有图灵奖获得者萨瑟兰(Sutherland),也对AI继续投入。精英制风格的ARPA,更适合做大型开创性项目,成功取决于少数决策者;而以民主制为基础的NSF,历来就是小规模资助基础研究。

 

预测未来:会有奇点吗?

 

司马贺1957年曾预言十年内计算机下棋会击败人。1968年麦卡锡和象棋大师列维(DavidLevy)打赌说十年内下棋程序会战胜列维,最后赔了列维两千块。乐观的预言总会给对手留下把柄:德雷弗斯后来每年都拿此事嘲讽AI,说计算机下下跳棋还行,下象棋连十岁的孩子都干不过。这便宜话一直说到1997年,IBM的下棋程序“深蓝”击败了卡斯帕罗夫。这真是“四十年太久,只争朝夕”啊。在1995年卡斯帕罗夫还在批评计算机下棋缺乏悟性(insights),但1996年时他已经开始意识到“深蓝”貌似有悟性了。而两年间“深蓝”的计算能力只不过提高了一倍而已。有没有悟性其实就是人的能力的极限。量变到质变的临界点就是人的解释能力,人解释不了的东西就有悟性,解释了的东西就没有悟性。司马贺和日本计算机科学家宗像俊则(Munakata)合写了篇解气的文章《人工智能的教训》(AILessons)登在《ACM通讯》上。现在两台普通计算机对弈,人类高手都看不懂了,所有棋手现在都用机器做教练。

当然,德雷弗斯们还可以将“计算机仍然不能干什么”加上若干个“仍然”接着批评。明斯基1968年在库布里克的电影《2001太空漫游》的新闻发布会上曾大放厥词说三十年内机器智能可以和人有一拼,1989年又预言二十年可以解决自然语言处理。现在我们恐怕还不能说机器翻译器令人满意吧。过分乐观的另一个原因,照明斯基自己的说法是,一门年轻的学科,一开始都需要一点“过度销售”(excessivesalesmanship)。但是过头了不免被人当作狗皮膏药或炼金术。

2006年,达特茅斯会议五十年,十位当时的与会者有五位仙逝,活着的五位:摩尔、麦卡锡、明斯基、塞弗里奇和所罗门诺夫在达特茅斯团聚,忆往昔展未来。参会人之一霍维茨(Horvitz)现在是微软实验室的头目,他和他老婆拿出一笔钱在斯坦福捐助了一个“AI100”的活动:在下面一百年里各路豪杰聚会,每五年出个AI进展报告。第一期原定于2015年底出版,我们拭目以待。

乔姆斯基晚年边做学问边做斗士。2015年3月他和物理学家克劳斯对话时被问及“机器可以思维吗?”,他套用计算机科学家戴客斯特拉(Dijkstra)的说法反问:“潜艇会游泳吗?”如果机器人(300024)可以有意识(consciousness)的性质,机器人可以被认为有意识吗?他进一步说“意识”是相对简单的,而“前意识”(preconsciousness)是困难的问题。他把AI分成工程的和科学的。工程的,如自动驾驶车等,能做出对人类有用的东西;科学的一面,乔老爷明显不认可。他引用图灵的话:这问题toomeaninglesstodeservediscussion(没有讨论的意义)。当一帮奇点理论的粉丝带着正面的期望采访乔姆斯基时,他却对人工智能这个被他深刻影响过的学科没太当回事,他认为气候和毁灭性武器是比奇点更紧迫的问题。这算有意回避吧。

明斯基在2012年接受他的学生、预言家、奇点理论炮制者库兹维尔的采访时说,他相信奇点的到来,可能就在我们的有生之年。两位“斯基”在MIT一百五十年纪念会上分在一个小组讨论里,却只打了下太极,并没有针锋相对。他们尽管年长,但身体都挺好,如果他们能在2016年达特茅斯会议六十年时面对面掐一架,肯定会很精彩,反正住得也不远。

    暮年再聚首

2006年,当年的10个主要人物,只有5个人参加了, 参加者从左到右依次为:摩尔、麦卡锡、明斯基、赛弗里奇、所罗门诺夫。

2016年,达特茅斯会议,60周年。基本的人物,都物是人非,深度学习重新成为技术的热点。从应用计算,到了智能计算的回归。

 

 

附录:1956年AI会议的7个主要议题

 关于人工智能的发展,如果谈到起源,大部分的人都会聊到DartmouthWorkshop,发起人主要有四位,J.McCarthy、MLMinsky、N.Rochester、CEShannon。此会议的全名为DartmouthSummerResearchProjectonArtificialIntelligence(达特茅斯夏季人工智能研究计画),会议名称中加入Summer整个让人很青春,实在是很想坐个时光机去体验体验。

人工智能基础与应用国际会议:跨学科视角中的人工智能

2022年4月8~10日,由北京大学哲学系宗教学系与北京大学外国哲学研究所主办,北京大学人工智能研究院与北京大学哲学与人类未来研究中心协办的“人工智能基础与应用国际会议”在北京大学召开。会议全程在线上举行,并通过Bilibili、Youtube以及北京大学哲学系微信视频号对报告进行了直播。

会议报告人来自于北京大学、清华大学、复旦大学、浙江大学、香港大学、中山大学、东南大学、中国社会科学院、上海社会科学院等国内院校,以及纽约大学、杜克大学、巴黎索邦大学、德国波恩大学、硅谷人工智能研究院等海外院校。

会议组织者北京大学哲学系助理教授SebastianSunday(王小塞)在开幕式上简要介绍了会议主旨,认为现代计算机之父阿兰·图灵的成就部分归功于其对于知识的跨学科涉猎,因而本次会议也致力于为国内外人工智能理论和实践领域的顶尖专家和青年才俊提供跨学科交流平台。会议的另一位组织者,北京大学哲学系的博雅博士后隋婷婷介绍了会议流程,本次会议分为“特邀嘉宾会场”和“平行会场”。“特邀嘉宾会场”的特邀报告时长为每人一小时,“平行会场”分为“中文平行会议”与“英文平行会议”,每人报告时长为半小时。在为期两天半的会议中,共有46场报告,分别是17场特邀报告,29场平行会议报告。

大会由北京大学外国哲学研究所所长韩水法教授以及人工智能学院的副院长李文新教授分别致开幕词。

韩水法教授首先对来自海内外的会议报告人表达了欢迎和感谢,并从三点阐述了人工智能与哲学的关系。第一点是人工智能从产生伊始便与哲学有着紧密关联,本次会议的创办说明了北大哲学系在人工智能研究上的积极态度;第二点指出人工智能无论在基础层面或是应用层面都直接关涉到人,而“人”正是哲学的核心和基础问题。第三点展望了人工智能的发展,提出要始终关心人工智能对人的性质的改变,应从人文主义的角度来对待人工智能,哲学工作者应与科学工作者一起为人工智能的未来发展担负责任,这也是本次会议的重要意义。

李文新教授在致词中回溯了北京大学人工智能研究院的创立过程,指出其作为一个交叉性的研究机构,致力于在人工智能方面形成一个世界顶尖的研究平台,助力北京大学的新文科,新工科和新医科的建设。李教授就自己的研究转向阐述了机器学习和学生培养共通之处,并指出研究院能做的两件核心任务,一是开设更多的人工智能的课程,把人工智能的技术黑箱打开,让更多人了解黑箱内部的决策过程,另一个则是让更多不同背景的人能够来到交叉的环境里面,共同规划和决策未来人机混合的发展走向,这也是本次会议的主旨之一。

开幕式之后是第1场特邀嘉宾报告。本场报告由北京大学的安乐哲教授主持,报告人分别是中国科学院自动化研究所的曾毅教授,以及美国华盛顿大学计算机科学与工程系的佩德罗·多明戈斯(PedroDomingos)教授。

曾毅教授的报告主题为“构建符合伦理的类人工智能并与其共生”,他认为,随着人工智能的发展,类人机器已经可以通过镜子测试(mirrortest),制造有意识的类人人工智能在不久的将来可能变为现实,在这种情境下,人与人工智能的相处可能不仅是教会人工智能如何与人相处,并将人工智能放在道德的笼子里,同时也应制定人类如何与人工智能和平相处的原则。

佩德罗·多明戈斯(PedroDomingos)教授的报告题目是“人工智能将如何改变伦理学?”,他认为人工智能最近备受关注,但目前通常的研究方法是将人工智能硬塞进当前西方的伦理规范中,然而,事实上人工智能将极大地改变社会,从而改变人们对道德和非道德的看法。人工智能就像此前的技术革命一样,将广泛地影响隐私和数据共享、公平和平等、战争和智能武器等领域的伦理发展。

特邀嘉宾报告之后的平行会议分为中文场和英文场。

中文平行会议由山西大学的梅剑华教授主持。报告人分别是华南师范大学马克思主义学院的涂良川教授、东南大学人文学院的张学义教授、浙江大学马克思主义学院的郭喨老师以及西安外国语大学中国语言文学学院的赵周宽教授。

涂良川教授的报告主题是“人工智能‘高阶自动化’的主体可能性——兼论人工智能奇点论的存在论追问”,认为重新思考主体的本质,是人工智能时代中理解人所必须要解决的问题。

张学义教授的题目是“‘伦理旋钮’:破解无人驾驶算法困境的密钥?”,报告指出依据调查数据,伦理旋钮虽没有完全消解道德-法律归责困境,但其为破解无人驾驶算法困境提供了可能的解决方案。

郭喨老师的主题为“自动驾驶交通系统中的‘人类’与‘机器’”,指出“算法主持、机器主导”的局面中人类智慧不得不让位于机器决策,载客车辆将执行一个“算法推荐的愚蠢路线”,交通系统和人类将付出经济、效率和不环保的代价。

赵周宽教授的题目为“后人类世伦理问题的基本思考”,探讨了人工智能与人类取得平行伦理地位的未来“后人类世”当中人机交互的伦理问题,认为以程序伦理为基本规则的人机伦理交互,将在现实增强之后进一步实现世界的伦理增强。

英文平行会议由东南大学的德米特罗•米哈伊洛夫(DmytroMykhailov)老师主持,报告人分别是北京大学计算机学院的王乐业老师、北京大学前沿计算研究中心的孔雨晴教授、德国波恩大学哲学系的艾坦丁(KonstantinAzarov)老师以及北京大学哲学系的隋婷婷老师。

王乐业老师在题为“最小感知计算原则:探索基于最小必要数据的智能系统构建”中介绍了最小感知计算原则的原理和优势,指出该原理可以用最少的数据构建智能系统。

孔雨晴老师的报告题目是“无先验学习思考等级”,介绍了一种新颖的无先验启发式范式——答案-猜测范式,并阐述了其相对于以往范式的优越性。

艾坦丁老师在“塞尔的中文屋及作为其原型的阿纳托利·第聂伯夫的小说‘游戏’”的报告中介绍了第聂伯夫对强人工智能的观点,并对比了其与塞尔观点的异同。

隋婷婷老师在题为“自动驾驶道德算法实验中的‘是’与‘应当’问题”的报告中对比了功利主义算法与利己主义算法在实验中的数据,指出道德算法并非单纯的“应当”问题,而是结合了“是”与“应当”的综合问题。

晚间的特邀嘉宾会议由北京大学的朱利叶斯·舍恩赫尔(JuliusSchönherr)老师主持,报告人为北京大学哲学系的王彦晶教授、香港大学哲学系的赫尔曼·卡普兰(HermanCappelen)教授以及纽约大学哲学系的大卫·查尔莫斯(DavidChalmers)教授。

王彦晶教授在题为“从‘知道如何’到自动规划”的报告中阐述了哲学和人工智能如何通过逻辑为桥梁相互促进。他认为哲学与人工智能的互动有两个方向,一个是基于规划的“知道如何”(planning-basedknow-how),这一方向在人工智能中使用了各种自动规划的概念来帮助刻画知识;另一个是基于“知道如何”的自动规划(know-how-basedplanning),该方向致力于在人工智能中引入高阶认知规划的逻辑以处理复杂的规划问题。

赫尔曼·卡普兰的报告题目为“人工智能可以变革哲学吗?”,探讨了查尔莫斯在其新书《现实+》(Reality+)中的技术哲学观点,并援引了笛卡尔与普特南等哲学家对相关问题的回应,同时概述了技术哲学在人工智能时代的新愿景,认为一些与人相关的概念,如交流、意义、思维、信仰、义务、责任以及信任等核心的哲学概念,将随着人工智能的发展而被扩展或修正。

大卫·查尔莫斯在题为“从黑客帝国到元宇宙”的报告中探讨了虚拟现实对于人类生活的意义,他的核心论点是虚拟现实就是真正的现实(genuinereality),指出尽管人们所处的环境是虚拟的,但人们在这一环境中的行为和活动并不是被程序规定的,人们在虚拟世界中依然可以建立真实的人际关系。同时查尔莫斯认为,即便虚拟现实如何发达,人们依然可以选择不进入这个世界,因而这一技术并不会对人类生活产生太大的负面影响。

会议第二天议程由3场特邀嘉宾会议以及4场平行会议组成。

第1场特邀嘉宾会议由北京大学哲学系的南星老师主持,报告人为美国杜克大学计算机科学学院与电气计算工程学院的辛西娅·鲁丁(CynthiaRudin)教授以及硅谷人工智能研究院的皮耶罗·斯卡鲁菲(PieroScaruffi)院长。

鲁丁教授在主题为“对于高风险决策选择可解释机器学习模型,而不是黑盒模型”的报告中,重点讨论了目前高风险决策中使用黑盒模型产生的风险,并指出依照医学的相关案例数据,可解释模型与以往的黑盒模型在决策方面的结果基本相同,使用可解释模型并不会损害人工智能系统在决策方面的准确性。同时,可解释模型可以在医生查验时提供可查证的决策原因,这对于减少决策风险尤为必要。

斯卡鲁菲教授在题为“人工智能已经达到与人类同等水平了吗?”的报告中指出,尽管各种人工智能系统宣布人工智能已经达到了人类同等水平,但由于我们通常通过语言来评估一个人的智力,大多数针对人工智能系统的智商测试都是基于自然语言任务,但事实上由于人工智能缺乏人类普遍具有的常识,其通过对数据集的“深度学习”生成的智能与人类的“深度思考”之间还有着很大的差距。

特邀嘉宾会议后是中英文平行会议。

中文平行会议由浙江大学的郭喨老师主持,报告人是曲阜师范大学政治与公共管理学院的赵松老师,以及清华大学哲学系的张伟特老师。

赵松老师的题目为“哲学与人工智能的根本联系:生存论的前提反思”,认为人们对于智能理解的偏差归根结底在于对人的存在的认识的不同。

张伟特老师在题为“笛卡尔与人工智能:‘我思故我在’作为智能测试标准的可能性”的报告中提出可以通过“我思故我在”为蓝本构建一种新的图灵测试。

英文平行会议由达勒姆Excelsior古典学院的扎克·加勒特(ZackGarrett)老师主持,报告人分别是美国艾尔弗尼亚大学哲学系的石奉来(BongraeSeok)教授、东南大学人文学院的德米特罗•米哈伊洛夫(DmytroMykhailov)老师以及北京大学法学院的张平教授。

石奉来老师在题为“人工智能,机器人学与佛教”的报告中探讨了人工智能在佛学中的应用,如人工智能可否成为搭载佛学知识的服务机器人等。

米哈伊洛夫老师的报告是“智慧教育领域的人工智能新应用:人工智能教育自适应系统及其道德缺陷”,主要阐述了人工智能应用于教育的有效性和相关数据隐私问题。

张平教授的报告主题为“人工智能生成物的著作权问题讨论”,探讨了当人工智能涉入文学、艺术领域并生产作品时,是否应被赋予署名权以及是否应被赋予主体地位等问题。

平行会议结束后,是第2场特邀嘉宾会议。会议由北京大学医学人文学院院长、北京大学哲学系周程教授主持,报告人为上海社会科学院哲学研究所的成素梅教授、山西大学哲学社会学学院的梅剑华教授以及中国社会科学院哲学研究所的段伟文教授。

成素梅教授进行了题为“人工智能的跨学科理解”的主题报告,报告指出人工智能的发展不是单纯的技术问题,而是关乎人类社会与人类文明如何健康发展的复杂问题。需要人文与科技同步发展。目前,人工智能在具体场景中的成功应用是建立在人机合作的基础之上的,在很大程度上依赖于人的隐性劳动。未来有可能出现的人机融合,将会带来更多值得思考的问题。科技发展既需要颠覆性创新,也需要有社会担当,更需要有人文关怀。

梅剑华教授在题为“儿童哲学与人工智能哲学间的三重对话”中探讨了儿童哲学对人工智能发展的重要性,因为人工智能要模仿人类智能,对儿童哲学、儿童智能的探究可能成为人工智能研究的一个新思路。探究儿童哲学与人工智能对话的三个层次,即智能体的认知特征、智能体的学习方式、智能体的自主标准,将对人工智能的进一步发展有所助益。

段伟文教授在“深度伪造的认知挑战与伦理治理”的报告中论述了人工智能图像深度合成方面的技术发展对当代社会影响,指出其衍生的深度伪造使得现有的图像以及视频的可信度降低,从而削弱人们对信息和媒介的信任感,同时由于社交媒体能够将内容定位到特定的群体,可能还会进一步加强深度伪造的负面影响。因而对于深度伪造问题,需要采用多元的应对方式,包括技术、法律和更广泛的社会措施等等,以便能够实现稳健的数字伦理治理。

特邀嘉宾会议后的中英文平行会议各有4名报告人。

中文平行会议由清华大学的张伟特老师主持,报告人分别为武汉大学计算机学院的蔡恒进教授、扬州大学美术与设计学院的简圣宇教授、中国科学院哲学研究所的吴东颖老师以及复旦大学哲学学院的李欣怡同学。

蔡教授在题为“人的意识能上传到元宇宙吗?”的报告中指出,即便通过认知坎陷工程化的方式让机器形成“自我”原型,但人的意识仍无法完整地上传给机器。

简教授的报告题目是“‘元宇宙’问题:技术化娱乐的人文之思”,认为元宇宙造成了部分人群的成瘾性依赖和逃避现实等问题,有必要从人文关怀的视域对此进行思考。

吴老师在题目为“因果贡献度的困境与证成”的报告中探讨了因果贡献的程度问题,并提出了一种能够满足卡罗琳娜·萨托里奥对于因果贡献程度性挑战的方案。

李欣怡同学的报告题目为“历时地衡量公平:基于因果结构理论的分析”,报告介绍了基于因果分析的历时模型,并尝试为解决因果模型下的算法公平提供方案。

英文平行会议由中国人民大学的郭春宁教授主持,报告人分别是巴黎索邦大学哲学系的嘉坦·皮斯蒂利(GiadaPistilli)博士、天津大学马克思主义学院的宋建丽教授、意大利萨莱诺大学文化遗产学系的提摩西·坦巴西(TimothyTambassi)教授以及中山大学哲学系的张梦婷同学。

皮斯蒂利博士在题为“自然语言处理中作为道德训练的伦理架构”的报告中探讨了如何在语言多样性、价值多元化的前提下通过“和谐”概念避免冲突的产生。

宋建丽教授在“世纪疫情下人工智能的加速与不平等挑战”的报告中指出,在疫情冲击下,对人工智能应坚持命运共同性的理念、以人民为中心,保障人工智能的安全发展,以实现人工智能造福人类的根本目的。

提摩西·坦巴西教授在“人类与软件系统间的相互理解——人工智能中信息系统存在论的作用”的报告中阐述了信息系统本体(informationsystemontologies,ISOs)的概念,并指出人与软件系统在ISOs方面的差异。

张梦婷同学在题为“对梦的新解释:从模型的角度看”的报告中结合机器学习领域的模型欠拟合与过拟合现象,对人类做梦的现象提供一种新解释。

平行会议后的第3场特邀嘉宾会议由北京大学哲学系的隋婷婷老师主持,报告人是佛罗里达大西洋大学哲学系的苏珊·施奈德(SusanSchneider)教授与北京大学心理与认知科学学院的罗欢教授。

施奈德教授在题为“基于人工智能的大脑强化、超智能与心灵的未来”探讨了通过人工智能技术进行大脑强化的相关伦理问题,认为若通过芯片植入式的方法进行人类增强,不但需面对自由、隐私等伦理问题,当外来增强部分超出人类本有的意识天花板(theconsciousnessceiling)时,被增强者很可能需要面对技术对自我的完整性的挑战。

罗欢教授的报告题目为“人脑中的关系知识结构:表征、记忆和学习”,报告介绍了人类大脑对结构化知识的认知神经反馈。罗教授指出人类有着推理碎片化知识背后隐藏的关系结构的能力,其脑电数据在矩阵对比中,对不同结构的声音目标有着显著差异。目前的系列实验结果支持分离的结构-内容神经表征以及关系结构在介导记忆和学习中的重要作用。此类对于大脑运行模式的研究对于未来制造类脑智能有积极意义。

会议第三天的议程同样包含3场特邀嘉宾会议以及4场平行会议。

第1场特邀嘉宾会议由北京大学的李麒麟教授主持,报告人为厦门大学人文学院的朱菁教授。

朱菁教授在题为“人工智能可解释性问题的哲学探索”的报告中指出,解释历来是哲学研究的重要课题,哲学对于理解和阐明人工智能的可解释性问题可以起到有益的作用。解释的多元主义或可为理解人工智能的可解释性提供合适的理论框架,有助于容纳面向智能系统的多目标、多层次和多种模式的解释需求与活动。“以学习为中心的解释”可为多元主义提供一种可行的方向。

接下来的平行会议中,中文会议由华南师范大学的涂良川教授主持,报告人是中华女子学院社会工作学院的周旅军老师,以及北京大学教育学院的沈苑博士。

周旅军老师在“人工智能中的性别不平等治理何以可能?——基于文化堕距视角的算法规制路径分析”的报告中阐述了人工智能在搜索引擎以及网络众包平台上引发的性别不平等,并讨论了治理这一问题的算法规制路径。

沈苑博士在题为“人工智能教育应用的价值敏感设计”的报告中提出,智能课堂教学评价系统的设计应以优质为目标价值,以科学、无害、公平、自主、透明为规范价值,推动符合伦理的人工智能教育应用。

英文会议由天津大学的宋建丽教授主持,报告人是美国达勒姆Excelsior古典学院的扎克·加勒特老师,以及中国人民大学艺术学院的郭春宁教授。

加勒特老师在“人工智能和作者的意图”的报告中探讨了作者意图在应用人工智能文学创作系统中的作用,以及人工智能创作的人物自身的本体论问题。

郭春宁教授在题为“科幻电影的超语言转变:人工智能的具身化叙事与传播”的报告中,通过对科幻电影中人工智能形象的梳理,重新审视了人工智能在科幻电影中作为视听文件和“机器语言”存档的形象。

第2场特邀嘉宾会议由北京大学的陆俏颖老师主持,报告人为北京大学集成电路学院的杨玉超教授和北京大学计算智能实验室的谭营教授。

杨玉超教授的报告题目为“基于忆阻器的高效AI芯片与学习系统”,这场报告着重介绍了忆阻器对于人工智能发展的作用,以往“存算分离”的芯片架构将大部分算力用在了搬运数据上,相比“存算一体”的忆阻器较为低效,忆阻器能够有效地提高人工智能的运算效率,并降低其造价,助力未来的人工智能发展。

谭营教授在题为“群体智能及其应用研究进展”的报告中着重介绍了对于群体智能的最新研究和应用。群体智能最初来源于对蚂蚁、鸟类等生物群体的自然集群现象的模拟,群体智能中较有代表性的算法有“烟花算法”,即在可行解空间中随机产生一定数据的“烟花”,通过优化目标函数计算每个烟花的适应度值,根据结果选择停止条件或继续迭代。在人工智能时代,群体智能的算法与思路被广泛应用于群体机器人多目标搜索与群体协同学习,对机器的集群化发展有着积极意义。

之后的平行会议中文场由张学义教授主持,报告人是北京大学医学人文学院的张琨老师,以及南开大学哲学院的陶峰教授。

张老师在“论医疗决策中人工智能技术运用的法律责任——以给药剂量为例”的报告中,由知情决策、共享决策、家长制、工具性决策四种决策模式探讨了控制给药剂量的人工智能技术,及其相应的法律责任承担方式。

陶教授在题为“人工智能模拟时代的艺术品”的报告中探讨了人工智能的艺术品生成机制,认为从海德格尔的艺术真理观、阿多诺的审美合理性概念出发,真理和审美理性才是艺术与技术融合的本质要素。

平行会议英文场由巴黎索邦大学的嘉坦·皮斯蒂利博士主持,报告人是北京大学法学院的姜聪,以及山西大学哲学社会学学院/德国吕讷堡大学哲学系的伊冯娜·弗尔斯特(YvonneFörster)。

姜聪同学在“为司法人工智能的可解释性辩护:以法感为出发点”的报告中提出,司法人工智能应当从任务目标、训练方式、训练数据等方面进行改良,以构建可解释的司法人工智能模型。

伊冯娜·弗尔斯特教授的报告题目是“人工智能:透明度的辩证法”,她认为决策过程的透明度至关重要,应从哲学的角度思考人工智能的黑盒构造与决策透明性。

之后的第3场邀嘉宾会议也是本次会议的最后一场,会议由北京大学的陈海丹教授主持,报告人为德国拜罗伊特大学哲学系的莉娜·卡斯特纳(LenaKästner)教授和北京大学前沿交叉学科研究院的葛鉴桥老师。

卡斯特纳教授在题为“精神病理学建模:八个挑战及其应对”的报告中指出,在对于精神疾病的理解和治疗中需要观察各种不同的因素,科学家必须考虑到行为、心理、神经生理、遗传、药理学和环境对精神病理学的影响,人工智能的计算模型可以为融合这些不同的因素提供诸如多因素网络、大脑联通模型等多种方案。

葛鉴桥老师的报告题目是“人脑会认为人工智能是人工的吗?”,她通过实验数据阐述了人类对于人类、普通机器以及类人型机器的不同脑电反馈,指出人在数字测试实验中看到人类和类人型机器时倾向于从对方的视角观察数字,但在看到非类人的普通机器时,倾向于从自己的视角观察数字,这也说明了人脑对于人工智能的认知与面对真实人类或高度类人的机器时有明显区别。

会议报告至此全部结束,相关录屏将在近期上传至北京大学外国哲学研究所的B站帐号https://space.bilibili.com/342002870/。

在为期两天半的报告中,共有9127名观众通过B站直播平台、7972名观众通过首次开通的北京大学哲学系微信视频号观看了本次会议。组织者王小塞(SebastianSunday)与隋婷婷最后向所有观看会议的观众、工作人员以及参会者表达了感谢,并宣布本次会议圆满落幕。

2023中国人工智能大会

    由中国人工智能学会、福建省大数据集团有限公司共同主办,福建大数据产业园区运营管理有限公司承办的2023中国人工智能大会(CCAI2023)将于7月22-23日在福建福州隆重举行。本届大会以“数智领航·共筑未来”为主题,聚焦国内外人工智能的研究进展和学术前沿,将为人工智能基础理论突破、关键技术创新、产业化应用提供新的启发和思路。

    中国人工智能大会创办于2015年,是我国最早发起举办的人工智能大会,目前已成为我国人工智能领域规格最高、规模最大、影响力最强的专业会议之一。大会着力打造国际化的人工智能学术交流与合作平台,助力我国智能科技向更高水平的自立自强不断迈进。

    当前,福州正深入学习贯彻党的二十大精神,坚持“3820”战略工程思想精髓,聚焦大数据、人工智能、物联网等新一代信息技术,积极营造数字经济发展良好环境。本次大会将力邀中外院士、技术精英、商业先锋等数百位知名专家汇聚有福之州,共同启迪数字化时代智能科技的创变活力,进一步打响数字福州国际品牌,为加快建设现代化国际城市注入强大动力。

人工智能的伦理挑战

原标题:人工智能的伦理挑战

控制论之父维纳在他的名著《人有人的用处》中曾在谈到自动化技术和智能机器之后,得出了一个危言耸听的结论:“这些机器的趋势是要在所有层面上取代人类,而非只是用机器能源和力量取代人类的能源和力量。很显然,这种新的取代将对我们的生活产生深远影响。”维纳的这句谶语,在今天未必成为现实,但已经成为诸多文学和影视作品中的题材。《银翼杀手》《机械公敌》《西部世界》等电影以人工智能反抗和超越人类为题材,机器人向乞讨的人类施舍的画作登上《纽约客》杂志2017年10月23日的封面……人们越来越倾向于讨论人工智能究竟在何时会形成属于自己的意识,并超越人类,让人类沦为它们的奴仆。

维纳的激进言辞和今天普通人对人工智能的担心有夸张的成分,但人工智能技术的飞速发展的确给未来带来了一系列挑战。其中,人工智能发展最大的问题,不是技术上的瓶颈,而是人工智能与人类的关系问题,这催生了人工智能的伦理学和跨人类主义的伦理学问题。准确来说,这种伦理学已经与传统的伦理学旨趣发生了较大的偏移,其原因在于,人工智能的伦理学讨论的不再是人与人之间的关系,也不是与自然界的既定事实(如动物,生态)之间的关系,而是人类与自己所发明的一种产品构成的关联,由于这种特殊的产品――根据未来学家库兹威尔在《奇点临近》中的说法――一旦超过了某个奇点,就存在彻底压倒人类的可能性,在这种情况下,人与人之间的伦理是否还能约束人类与这个超越奇点的存在之间的关系?

实际上,对人工智能与人类之间伦理关系的研究,不能脱离对人工智能技术本身的讨论。在人工智能领域,从一开始,准确来说是依从着两种完全不同的路径来进行的。

首先,是真正意义上的人工智能的路径,1956年,在达特茅斯学院召开了一次特殊的研讨会,会议的组织者约翰・麦卡锡为这次会议起了一个特殊的名字:人工智能(简称AI)夏季研讨会。这是第一次在学术范围内使用“人工智能”的名称,而参与达特茅斯会议的麦卡锡和明斯基等人直接将这个名词作为一个新的研究方向的名称。实际上,麦卡锡和明斯基思考的是,如何将我们人类的各种感觉,包括视觉、听觉、触觉,甚至大脑的思考都变成称作“信息论之父”的香农意义上的信息,并加以控制和应用。这一阶段上的人工智能的发展,在很大程度上还是对人类行为的模拟,其理论基础来自德国哲学家莱布尼茨的设想,即将人类的各种感觉可以转化为量化的信息数据,也就是说,我们可以将人类的各种感觉经验和思维经验看成是一个复杂的形式符号系统,如果具有强大的信息采集能力和数据分析能力,就能完整地模拟出人类的感觉和思维。这也是为什么明斯基信心十足地宣称:“人的脑子不过是肉做的电脑。”麦卡锡和明斯基不仅成功地模拟出视觉和听觉经验,后来的特里・谢伊诺斯基和杰弗里・辛顿也根据对认知科学和脑科学的最新进展,发明了一个“NETtalk”的程序,模拟了类似于人的“神经元”的网络,让该网络可以像人的大脑一样进行学习,并能够做出简单的思考。

然而,在这个阶段中,所谓的人工智能在更大程度上都是在模拟人的感觉和思维,让一种更像人的思维机器能够诞生。著名的图灵测试,也是在是否能够像人一样思考的标准上进行的。图灵测试的原理很简单,让测试一方和被测试一方彼此分开,只用简单的对话来让处在测试一方的人判断,被测试方是人还是机器,如果有30%的人无法判断对方是人还是机器时,则代表通过了图灵测试。所以,图灵测试的目的,仍然在检验人工智能是否更像人类。但是,问题在于,机器思维在作出自己的判断时,是否需要人的思维这个中介?也就是说,机器是否需要先绕一个弯路,即将自己的思维装扮得像一个人类,再去作出判断?显然,对于人工智能来说,答案是否定的,因为如果人工智能是用来解决某些实际问题,它们根本不需要让自己经过人类思维这个中介,再去思考和解决问题。人类的思维具有一定的定势和短板,强制性地模拟人类大脑思维的方式,并不是人工智能发展的良好选择。

所以,人工智能的发展走向了另一个方向,即智能增强(简称IA)上。如果模拟真实的人的大脑和思维的方向不再重要,那么,人工智能是否能发展出一种纯粹机器的学习和思维方式?倘若机器能够思维,是否能以机器本身的方式来进行。这就出现了机器学习的概念。机器学习的概念,实际上已经成为发展出属于机器本身的学习方式,通过海量的信息和数据收集,让机器从这些信息中提出自己的抽象观念,例如,在给机器浏览了上万张猫的图片之后,让机器从这些图片信息中自己提炼出关于猫的概念。这个时候,很难说机器自己抽象出来的猫的概念,与人类自己理解的猫的概念之间是否存在着差别。不过,最关键的是,一旦机器提炼出属于自己的概念和观念之后,这些抽象的概念和观念将会成为机器自身的思考方式的基础,这些机器自己抽象出来的概念就会形成一种不依赖于人的思考模式网络。当我们讨论打败李世石的阿尔法狗时,我们已经看到了这种机器式思维的凌厉之处,这种机器学习的思维已经让通常意义上的围棋定势丧失了威力,从而让习惯于人类思维的棋手瞬间崩溃。一个不再像人一样思维的机器,或许对于人类来说,会带来更大的恐慌。毕竟,模拟人类大脑和思维的人工智能,尚具有一定的可控性,但基于机器思维的人工智能,我们显然不能作出上述简单的结论,因为,根据与人工智能对弈之后的棋手来说,甚至在多次复盘之后,他们仍然无法理解像阿尔法狗这样的人工智能如何走出下一步棋。

不过,说智能增强技术是对人类的取代,似乎也言之尚早,至少第一个提出“智能增强”的工程师恩格尔巴特并不这么认为。对于恩格尔巴特来说,麦卡锡和明斯基的方向旨在建立机器和人类的同质性,这种同质性思维模式的建立,反而与人类处于一种竞争关系之中,这就像《西部世界》中那些总是将自己当成人类的机器人一样,他们谋求与人类平起平坐的关系。智能增强技术的目的则完全不是这样,它更关心的是人与智能机器之间的互补性,如何利用智能机器来弥补人类思维上的不足。比如自动驾驶技术就是一种典型的智能增强技术,自动驾驶技术的实现,不仅是在汽车上安装了自动驾驶的程序,更关键地还需要采集大量的地图地貌信息,还需要自动驾驶的程序能够在影像资料上判断一些移动的偶然性因素,如突然穿过马路的人。自动驾驶技术能够取代容易疲劳和分心的驾驶员,让人类从繁重的驾驶任务中解放出来。同样,在分拣快递、在汽车工厂里自动组装的机器人也属于智能增强类性质的智能,它们不关心如何更像人类,而是关心如何用自己的方式来解决问题。

这样,由于智能增强技术带来了两种平面,一方面是人类思维的平面,另一方面是机器的平面,所以,两个平面之间也需要一个接口技术。接口技术让人与智能机器的沟通成为可能。当接口技术的主要开创者费尔森斯丁来到伯克利大学时,距离恩格尔巴特在那里讨论智能增强技术已经有10年之久。费尔森斯丁用犹太神话中的一个形象――土傀儡――来形容今天的接口技术下人与智能机器的关系,与其说今天的人工智能在奇点临近时,旨在超越和取代人类,不如说今天的人工智能技术越来越倾向于以人类为中心的傀儡学,在这种观念的指引下,今天的人工智能的发展目标并不是产生一种独立的意识,而是如何形成与人类交流的接口技术。在这个意义上,我们可以从费尔森斯丁的傀儡学角度来重新理解人工智能与人的关系的伦理学,也就是说,人类与智能机器的关系,既不是纯粹的利用关系,因为人工智能已经不再是机器或软件,也不是对人的取代,成为人类的主人,而是一种共生性的伙伴关系。当苹果公司开发与人类交流的智能软件Siri时,乔布斯就提出Siri是人类与机器合作的一个最朴实、最优雅的模型。以后,我们或许会看到,当一些国家逐渐陷入老龄化社会之后,无论是一线的生产,还是对这些因衰老而无法行动的老人的照料,或许都会面对这样的人与智能机器的接口技术问题,这是一种人与人工智能之间的新伦理学,他们将构成一种跨人类主义,或许,我们在这种景象中看到的不一定是伦理的灾难,而是一种新的希望。

(作者:蓝江,系南京大学哲学系教授)

人工智能顶级会议最佳论文里的“DaDianNao”是什么鬼

最近对人工智能领域的AI加速芯片感兴趣,在翻阅Google的第一代TPU论文时,在相关工作中看到了DaDianNao,PuDianNao,ShiDianNao。看的我一脸懵逼,这是什么?汉语拼音吗?后来经过搜索,发现这是中科院计算所的一系列研究成果,后来直接催生了国内芯片独角兽--寒武纪的诞生。

故事得从20年前说起,当时江西南昌有俩亲兄弟,哥哥叫陈云霁,弟弟陈天石。他们分别于97、01年先后考入中国科学大学少年班学习,后来攻读研究生时,哥哥在计算所跟胡伟武(龙芯之父)做芯片方面研究,弟弟在中科大跟着陈国良、姚新做人工智能算法方面研究。08年的时候,他俩想合起来做一些人工智能芯片方面的事情。

2012年到2014年,俩兄弟和当时任职于法国巴黎综合理工学院(InriaSaclay)的OlivierTemam教授一起合作,做人工智能加速器的研究。最开始叫做electricbrain,是一个电子的大脑,但是外籍教授Olivier说起个中国的名字,这样别人会觉得外国的东西,很有意思,很先进。于是就有了DianNao这个汉语拼音的名字了。中科院有专门页面介绍“DianNao”项目,项目的核心是提出了一系列定制的AI加速器的设计方案。

当时他们研究领域想要解决的三大矛盾是:

有限规模的硬件vs任意规模的算法:硬件出厂后就固定了,但是算法是研究员自己定义的,会是任意的结构固定的硬件vs千变万化的算法:算法有图像、语音、自然语言处理等领域,而硬件构造在生产之后就固定了能耗受限的硬件vs精度优先的算法:硬件功耗受制于场景是受限的,但是算法研究员希望精度越高越好

陈氏兄弟的解决之道:

虚拟化:没有让硬件运算单元和算法神经元一一对应起来,而是采用了对小尺度神经网络分时复用的方法来支持任意规模的神经网络智能指令集:自动化抽取各种深度学习算法共性基本算子,设计首个深度学习指令集来高效处理算法。利用神经网络对于计算误差的容忍能力,进行稀疏化神经网络处理,这样降低了功耗,提高了精度。

他们设计出了第一个加速器DianNao--电脑。第二个加速器叫DaDiannao--大电脑。这个是DianNao的多核版本,通过多片设计,可以将较大的模型放在加速器(芯片)的内存上运行,提高效率。第三个加速器ShiDianNao--视电脑:将AI加速器与传感器直连,从而减少内存通讯的开销,是属于端/边侧摄像头上的AI加速器。电脑和大电脑只能做深度学习处理,还有很多其他的人工智能算法,怎么去支持?于是就有了PuDianNao--普电脑。它比较普世,能支持很多机器学习算法。PuDianNao也是DianNao项目的最后一个工作。我大胆猜测是因为再接着做下去,围绕电脑起名很困难。后来16年时他们提出了国际首个神经网络通用指令集DianNaoYu--电脑语。这些指令集相当于深度学习算法界的乐高积木,是算法研究员与加速器打交道的唯一接口。

他们当时的DianNao论文获得了这个领域最重要的国际会议--ASPLOS的最佳论文奖。这也是亚洲地区,第一次在计算机体系结构的这种顶尖的国际会议上拿奖。他们研究最大的创新点在于前人做的不是一个完备的处理器,只能说是一个神经网络功能部件,只适用于特定大小的神经网络。而他们的工作是一个真正意义上完备的处理器,能够支持任意规模的神经网络。打个比方,只能处理两个数相加,而不能处理10000甚至任意个数相加的硬件,只能叫加法器,而不能叫处理器。

后来弟弟陈天石从中科院出来创办了寒武纪,哥哥也一起合伙。但半年之后,哥哥因为觉得还是喜欢搞科研,所以又回到了中科院。

对上述内容感兴趣的朋友可以去看看B站上陈云霁的智能之芯视频。大佬演讲风趣幽默,着装朴实,让人印象深刻。有两篇陈天石的采访放到了文末,从文章来看很清楚自己的能力边界,他强调了多次,做好本职工作,好好搬砖,感觉就是对有志青年的淳淳教导。

彩蛋

2015年,陈天石有一次“问我任何事”的活动,我翻看了里面的问题,有好几个问题非常有意思。比如有人会问中科大的神通、天才和普通人的区别,还有家长因为孩子无法成为神通而苦恼。对这些问题,他没有一贯我们看到的好为人师的印象,回答很有借鉴意义,能给现在焦虑的家长们一些启发,点击阅读原文可以查看。

参考资料甲小姐对话陈天石:AI芯片市场广阔,寒武纪朋友遍天下|甲子光年甲小姐对话陈天石:通往伟大芯片公司的赛程很长智能之芯欢迎关注我的微信公众账号,会在第一时间更新,博客园上只有部分文章会发布

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇