博舍

普遍语言与人工智能——莱布尼茨的语言观探析 人工智能对语言的理解和认识论文

普遍语言与人工智能——莱布尼茨的语言观探析

2.2对洛克语言观的肯定

在《人类理智新论》第三卷的开篇,莱布尼茨就对洛克的语言观表示赞同:人类作为社会性动物天生就有与同类其他成员建立联系的倾向,并有语言这种天赋能力来实现这种社会联系(莱布尼茨1982:297)。洛克认为,语词就是用于表征、阐明观念的,进而实现与其他成员建立联系的功能。莱布尼茨认同洛克的这一观点,并进一步认为,语言同时也是人类思考、推理的工具,使人类的抽象思想得以记忆、保持。他将人类的语言粗略地分为两大类,一类是词语的语言,例如印欧语系的语言,他认为这类语言具有更多的理性和抽象的成分;另一类是声调的语言,例如汉语,这类语言偏于具体、形象,具有艺术色彩(同上:291)。他认为后者的层次更丰富,可以通过声调和重音的方式来变化语词,因此可以使用更少的词汇来表达更多的意义。同时,莱布尼茨虽然承认语言符号的任意性,但他认为语词与观念间的任意联系也是以人类理性为基础(李洪儒2018:3)。也正是从人类理性出发,莱布尼茨注意到人类语言在理性层面上的共性,进而希望设计其著名的普遍语言来对人类思维形式化。其中,语言层面的哲学思考对他后续的“莱布尼茨之梦”的基础性作用的确是不容置疑的(霍永寿2012:6)。

3.普遍语言与数理逻辑

莱布尼茨被誉为“17世纪的亚里士多德”,他开创了逻辑数学化的道路。他将所有的推理归于计算,认为“我们要造成这样的一个结果,使所有推理的错误都只成为计算的错误,这样,当争论发生的时候,两个哲学家同两个数学家一样,用不着辩论,只要把笔拿在手里,并且在算盘面前坐下,两个人面面相觑地说:让我们来计算一下吧!”(肖尔兹1977:54)他意识到,要达到此目标,必须做两件事情:一是构造“通用语言”,另一个是构造理性演算(陈波2014:5)。

3.1莱布尼茨的设想

1710年,莱布尼茨在《神正论》中提出建立一种普遍语言的设想,“这种语言是一种用来代替自然语言的人工语言,它通过字母和符号进行逻辑分析与综合,把一般逻辑推理的规则改变为演算规则,以便更精确更敏捷地进行推理”(莱布尼茨1985:8)。他将这种语言称为“人类思想的字母表”(alphabetofhumanthought),认为在这种语言中,一切理性真理都会被还原为一种演算。当时,欧洲的各门学科发展迅速,尤其是数学和力学等学科的发展更是突飞猛进。莱布尼茨认为,尽管各学科目前发展趋势很好,但是各门学科的之间相互独立,缺乏交流。他将造成这一现象的原因归为各学科独立的语言形式。莱布尼茨认为,为使各门学科更好的发展,应该通过统一科学语言的方式来统一科学,为各门学科建立统一的表达方式,为认识世界建立统一的表达方式。基于此,莱布尼茨开始对构建普遍语言和数理逻辑的思考。在莱布尼茨之前,哲学史上也有一些哲学家提出过类似的思想,不过每个人的切入点都不同。莱蒙德·卢里提出过概念组合术的思想,尝试通过基本概念的组合来建立所有可能想象的命题体系。笛卡尔曾经希望通过将数学方法应用于哲学的所有领域来建构“普遍数学”。霍布斯认为逻辑学研究的名词、名称和三段论的推理,在本质上也是一种运算。而莱布尼茨则是受到汉语的启发,认为中国的表意文字与文字符号表现的内容之间有内在的关系,进而提出自己有关普遍语言的设想(周祯祥周晟2009:29)。

莱布尼茨认为,普遍语言应该具有以下3个特点:第一,符号与人头脑中的概念,也就是符号的意义,应一一对应;第二,如果人头脑中的概念可分解,那么符号也可以分解;第三,如果人头脑中的概念1与概念2有前件与后件的关系,那么概念1的符号与概念2的符号有统一的关系(肖尔兹1977:31)。莱布尼茨认为,建构普遍语言的首要任务是建构一套与思考之物有一一对应关系的词汇表,其次是提出模仿现实中人们的思维过程的推理规则。他希望能够采用类似算术一样的符号来归纳所有的思想,用这种语言在所有学科中都完成类似于算术一样的计算。“倘若我们能找到一些字或符号适宜于表述我们的全部思想,像算术表明数字或几何学的分析表明线那样明确和正确的话,我们就能在一切科目中,在它们符合推理的范围内,完成像在算数和几何学中所完成的东西。”(弗雷格2006:23)这就为弗雷格等后世哲学家对日常语言的批判以及对人工语言的建构奠定主要基础。弗雷格直接从莱布尼茨那里得到启发,在现有符号的基础上增加一种新的符号,且这种新符号处于中心位置,与所有其他符号邻接。以此补充现有形式语言的不足,进而创建他自己的概念文字。

3.2数理逻辑的影响

莱布尼茨认为,符号、世界和逻辑3者是统一的,世界的面貌可以通过计算得出。关于符号的科学应该既能形成符号又能对符号进行排列组合,使得这些符号能够表达一些思想,或者说使得它们之间具有和这些思想之间的关系等同的关系。表达式是一些符号的组合,这些符号能表现事物。如果被标识的那个事物的观念是由一些事物的一些观念组成的,那么那个事物的表达式也是由这些事物的符号组成的。莱布尼茨认为,词表达人对观念的理解,语法则表示观念之间的关系,这就是逻辑。罗素(B.Russell)认为,莱布尼茨的哲学主要就是逻辑学。尽管莱布尼茨并未专门、系统地阐述他的逻辑学,但其在《论普遍语言》和《理性演算的基础》等论文中论述逻辑学的相关问题。在此基础上,弗雷格、罗素与怀德海等创建命题演算与谓词演算,数理逻辑由此正式发展成一门备受关注的新兴学科。莱布尼茨建立的数理逻辑既是对古典形式逻辑思想的继承,也是现代逻辑发展的起点,可以说,他的数理逻辑思想是从古典逻辑到现代逻辑的关键转折点(徐华2017:46)。自莱布尼茨提出建立实现思维演算的普遍语言的设想起,数理逻辑进入高速发展时期。第一阶段是从布尔(G.Boole)的逻辑代数到德摩根(A.Demor.gan)的关系逻辑,第二阶段是弗雷格在《概念文字》(ConceptNotation,1879)中建立量词理论和在《算术基础》(TheFoundationsofArithmetic,1884)中建立的命题逻辑和一阶谓词逻辑,第三阶段是罗素在《数学的原则》(ThePrinciplesofMathematics,1903)(中提出的类型论,以及在与怀特海合著的《数学原理》(PrinciplesofMathematica,1910-1913)中论述的逻辑类型论。直到1928年希尔伯特和阿克曼证明一阶谓词演算的一致性、1930年哥德尔证明一阶谓词演算的完全性时,莱布尼茨的理想才算部分地实现,数理逻辑才算真正创立(陈波2013:2)。除此之外,莱布尼茨的数理逻辑思想也为当今人工智能的发展提供理论基础。

4.普遍语言对人工智能的启示

莱布尼茨认为,“就一种更广的意义来说,语言的历史也就是一般的人类心灵发展的历史”(莱布尼茨1982:301)。“语言是人类心灵最好的镜子,而对于语词意义的一种精确分析,将会比任何其他事情都更好地使人认识理智的活动”(同上:383)。莱布尼茨认为世界是数理逻辑的,一切都可以被符号化(徐华2017:41)。这种思想在当今的人工智能领域影响广泛,得到普遍认同。在德国举行的“纪念莱布尼茨逝世三百周年”大会上,有关莱布尼茨的数理逻辑思想与人工智能关系的讨论成为一个热点话题。人工智能的根基源于对“普遍语言”的追求,无论其内核,还是目标,都与语言密切相关。语言的意义问题是多年来语言哲学家和语言学家关注的核心问题。鉴于意义的复杂性,完全确定任何一种语言中词汇的语义都是悬而未决的难题。因而,人工智能语义难题的出现也就具有其必然性。在塞尔(J.Searle)看来,机器是无法使用语言的,因为它不具有理解能力与意向性(intentionality)能力,只有纯形式的符号操作而没有真正的言语行为(徐愚2016:97)。作为理性主义的代表人物,莱布尼茨认为事物的逻辑,即科学的结构所依赖的各种物质概念和关系的逻辑,是与数理逻辑分不开的。符号不是思想的偶然外壳,而是它的必然媒介物,更是一种工具,能够使思想内容通过它发展并规定自身。这一思想直接促进现代计算机雏形的诞生,同时也为如何让机器“听懂人类的语言”指明方向,因此人工智能也被称为“莱布尼茨之梦”(黄炎孙2014:9)。

以莱布尼茨为首的哲学家们对普遍语言的追求是建立在厌弃自然语言的基础上,这一点使得建立普遍语言的思想在很长一段时间内被误认为是为了取代自然语言。尽管以前期维特根斯坦(L.Wittgenstein)为代表的分析哲学家认为自然语言存在种种不足,遮蔽我们的思想,带来很多哲学问题,但是也没有要取代自然语言(刘辉2009:35)。事实上,莱布尼茨等哲学家希望建立普遍语言的目的是在于避免歧义,希望符号与意义的对应关系是唯一而绝对的。这样我们在探讨科学问题的时候就可以不受交际工具——语言的影响。恰恰是这种努力为人工智能和人机对话的形成提供理论支撑。

自1956年约翰·麦卡锡(JohnMcCarthy)在“达特茅斯会议”上第一次提出人工智能的概念以来,人工智能作为一个新兴的研究领域开始长达半个多世纪的蓬勃发展(徐愚2016:2)。随着研究的不断深入,人工智能研究面临的困境逐渐显现出来,进入发展的瓶颈期。简单来说,人工智能面临的问题主要来自两方面:一方面是人工智能算法和计算机运算能力的限制,一方面是哲学对心灵和智能等基础概念的混沌状态。其中,哲学家们最关注的是人工智能的语义困境。符号及其语义实现已经成为限制人工智能理论及其研究的难题(同上:6),但我们可以从莱布尼茨的思想中得到一些启示。人工智能是否可能具有处理语义的能力?我们认为,莱布尼茨有关普遍语言的思想间接回答了这个问题。人工智能的发展终究无法摆脱人的因素,是人“教会”人工智能各种本领。因此,可以换一个角度思考这个问题。人工智能能否具有语义的能力事实上取决于人类对语义的形式化程度。如果我们能将自然语义形式化到莱布尼茨设想的符号与意义一一对应的程度,人工智能当然能具有处理语义的能力。也就是说,问题不是人工智能是否能具有处理语义的能力,而是语言学家能否清晰地将自然语言语义的每个义素形式化。自然语言语义形式化的程度才是决定人工智能发展高度的瓶颈。

自然语言语义的复杂性使得其形式化之路异常艰辛。主观意义的不确定性及其与人的意向性之间的密切联系使得自然语言的逻辑分析面临诸多挑战(孙颖2016:45)。以莱布尼茨创立的数理逻辑为基础的现代逻辑研究不仅在创立普遍语言方面表现突出,同时也为自然语言的逻辑分析提供路径。克里普克(S.Kripke)以模态逻辑为基础创立的可能世界语义学为自然语言的语义分析以及人工智能的底层语言编码提供设计框架。基于神经网络的自然语言处理与计算机学习能力研究都须要依托高度形式化的普遍语言或是自然语言的语义分析。莱布尼茨的主要诉求是将人使用的自然语言转换为哲学分析使用的普遍语言,而这种普遍语言恰恰可以为当今的计算机使用,为人工智能服务,使得计算机能够将自然语言转化为普通语言,再将普通语言转化为自然语言,以实现“人机对话”。因此,人工智能的发展须要以语言学的研究为基础。普遍语言是人和计算机的交际工具。

5.结束语

对于莱布尼茨在哲学史上的重要性,海涅曾经这样说到,“正是莱布尼茨把德国人引上哲学思维的道路”(俞吾金等2009:10)。这个评价充分肯定莱布尼茨作为德国哲学领航人的地位。自他开始,德国哲学被唤醒,康德(I.Kant)等后世大哲们都不同程度上受到莱布尼茨思想的启示。罗素甚至认为德国哲学苦涩的文风也遗传自莱布尼茨,是他把德国哲学“弄得迂腐而干燥无味”(罗素1981:123)。然而,“无趣”的莱布尼茨的人工智能梦想却使得现代人的生活丰富多彩。比尔·盖茨曾经说过,自然语言理解是人工智能皇冠上的明珠。语言智能才是人工智能的最高阶段。希望通过深入挖掘莱布尼茨的思想可以更好地为自然语言处理提供帮助,以便为推动人工智能的发展贡献语言学的力量。

作者简介

刘辉:黑龙江大学应用外语学院教师。

本文来源:《外语学刊》,感谢刘辉老师的支持

今日责编:苹果你往上飞返回搜狐,查看更多

人工智能

博主github:https://github.com/MichaelBeechan博主CSDN:https://blog.csdn.net/u011344545

============================================概念篇:https://blog.csdn.net/u011344545/article/details/89525801技术篇:https://blog.csdn.net/u011344545/article/details/89526149人才篇:https://blog.csdn.net/u011344545/article/details/89556941应用篇:https://blog.csdn.net/u011344545/article/details/89574915下载链接:https://download.csdn.net/download/u011344545/11147085

============================================清华AMiner团队AMiner.org

从知识产业角度来看,自然语言处理软件占有重要的地位,专家系统、数据库、知识库,计算机辅助设计系统(CAD)、计算机辅助教学系统(Cal)、计算机辅助决策系统、办公室自动化管理系统、智能机器人等,全都需要自然语言做人机界面。长远看来,具有篇章理解能力的自然语言理解系统可用于机器自动翻译、情报检索、自动标引及自动文摘等领域,有着广阔的应用前景。随着自然语言处理研究的不断深入和发展,应用领域越来越广。文本方面的应用主要有:基于自然语言理解的智能搜索引擎和智能检索、智能机器翻译、自动摘要与文本综合、文本分类与文件整理、智能自动作文系统、自动判卷系统、信息过滤与垃圾邮件处理、文学研究与古文研究、语法校对、文本数据挖掘与智能决策以及基于自然语言的计算机程序设计等。语音方面的应用主要有:机器同声传译、智能远程教学与答疑、语音控制、智能客户服务、机器聊天与智能参谋、智能交通信息服务(ATIS)、智能解说与体育新闻实时解说、语音挖掘与多媒体挖掘、多媒体信息提取与文本转化以及对残疾人智能帮助系统等。此外,建立在自然语言处理技术基础之上的心理学、认知学、哲学、混沌学说的共同发展,将使人们对智能的起源问题有新的认识。如果把计算机网络和未来的网格看作是由机器组成的机器社会,那么一种属于机器的智能可能会因为人类的参与以及机器社会中各元素的相互作用而自然诞生。这样,机器必将能够通过“图灵测试”,达到“会思考”的层次。而有关智能机器的研究也会诞生一系列新的领域,比如,机器心理学和机器认知学等。其中,机器心理学主要研究机器的心理反应和意图。美国圣迭戈神经科学研究所研制的机器人DarwinVII,能够根据其感知对外部事物进行分类,并根据经验和知识采取相应的对策。然而,机器心理学的研究不能局限于此,人们还需要对机器的意识、知觉、思想、情感、情绪、创造力、机器社会、机器交流等方面进行研究,而这一切还需要计算机科学、心理学、神经科学的同步发展。我们选取一些自然语言处理应用较为频繁的场景进行介绍。

1、知识图谱

知识图谱能够描述复杂的关联关系,它的应用极为广泛,最为人所知的就是被用在搜索引擎中丰富搜索结果,并为搜索结果提供结构化结果体现关联,这也是google提出知识图谱的初衷。同时微软小冰、苹果siri等聊天机器人中也加入了知识图谱的应用,IBMWatson是问答系统中应用知识图谱较为典型的例子。按照应用方式,可以将知识图谱的应用分为语义搜索、知识问答、以及基于知识的大数据分析和决策等。语义搜索利用建立大队莫知识库对搜索关键词和文档内容进行语义标注,改善搜索结果,如谷歌、百度等在搜索结果中嵌入知识图谱。知识问答是基于知识库的问答,通过对提问句子的语义分析,再将其解析为结构化的询问,在已有的知识库中获取答案。在大数据的分析和决策方面,知识图谱起到了辅助作用,典型应用是美国Netflix公司利用其订阅用户的注册信息以及观看行为构建的知识图谱反映出英剧版《纸牌屋》很受欢迎,于是拍摄了美剧《纸牌屋》,大受追捧。

2、机器翻译

机器翻译是自然语言处理最为人知的应用场景,一般是将机器翻译作为某个应用的组成部分,例如跨语言的搜索引流等。目前以IBM、谷歌、微软为代表的国外科研机构和企业均相继成立机器翻译团队,专门从事智能翻译研究。如IBM于2009年9月推出ViaVoiceTranslator机器翻译软件,为自动化翻译奠定了基础;2011年开始,伴随着语音识别、机器翻译技术、DNN(深度神经网络)技术的快速发展和经济全球化的需求,口语自动翻译研究成为当今信息处理领域新的研究热点;Google于2011年1月正式在其Android系统上推出了升级版的机器翻译服务;微软的Skype于2014年12月宣布推出实时机器翻译的预览版、支持英语和西班牙语的实时翻译,并宣布支持40多种语言的文本实时翻译功能。尤其值得之注意的是,在“一带一路”这一发展背景下,合作沟通会涉及60多个国家、53种语言,此时机器翻译的技术应用显得尤为重要,语言的畅通是“一带一路”战略得以实施的重要基础。而机器翻译涉及到语义分析、上下文环境等诸多挑战,其发展道路还有很长一段路要走。

3、聊天机器人

聊天机器人是指能通过聊天app、聊天窗口或语音唤醒app进行交流的计算机程序,是被用来解决客户问题的智能数字化助手,其特点是成本低、高效且持续工作。例如siri,小娜等对话机器人是一个应用场景。除此之外,聊天机器人在一些电商网站有着很实用的价值,可以充当客服角色,例如京东客服jimi,有很多基本的问题,其实并不需要真的联系人工客服来解决。通过应用智能问答系统,可以排除掉大量的用户问题,比如商品的质量投诉、商品的基本信息查询等程式化问题,在这些特定的场景中,特别是会被问到高度可预测的问题中,利用聊天机器人可以节省大量的人工成本。

4、文本分类

文本分类是指根据文档的内容或者属性,将大量的文档归到一个或多个类别的过程。这一技术的关键问题是如何构建一个分类函数或分类模型,并利用这一分类模型将未知文档映射到给定的类别空间。按照其领域分类不同的期刊、新闻报道,甚至多文档分类也是可能的。文本分类的一个重要应用之处是垃圾电子邮件检测,除此之外,腾讯、新浪、搜狐之类的门户网站每天产生的信息分繁杂多,依靠人工整理分类是一项耗时巨大的工作且很不现实,此时文本分类技术的应用就显得极为重要。

5、搜索引擎

自然语言处理技术例如词义消歧、句法分析、指代消解等技术在搜索引擎中常常被使用。搜索引擎的职责不单单是帮助用户找到答案,还能帮助用户找到所求,连接人与实体世界的服务。搜索引擎最基本的模式是自动化地聚合足够多的内容,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回。每一个环节,都需要用到自然语言处理。用百度举例,比如用户可以搜“天气”、“日历”、“机票”及“汇率”这样的模糊需求,会直接在搜索结果呈现结果。用户还可以搜索“范冰冰演过的电视剧”这样的复杂问题,百度都可以准确地回答。一方面,有了自然语言处理技术才使得搜索引擎能够快速精准的返回用户的搜索结果,几乎所有的自然语言处理技术都在搜索引擎中有应用的影子;另一方面,搜索引擎(例如谷歌商业帝国和百度巨头)在商业上的成功,也促进了自然语言处理技术的进步。

6、推荐系统

第一个推荐系统是1992年Goldberg提出的Tapestry,这是一个个性化邮件推荐系统,第一次提出了协同过滤的思想,利用用户的标注和行为信息对邮件进行重排序。推荐系统依赖数据、算法、人机交互等环节的相互配合,应用了数据挖掘技术、信息检索技术以及计算统计学等技术使用推荐系统的目的是联系用户和信息,帮助用户发现对自己有价值的信息,同时让信息能够展示在对它感兴趣的用户面前,精准推荐,用来解决信息过载和用户无明确需求的问题。推荐系统在音乐电影的推荐、电子商务产品推荐、个性化阅读、社交网络好友推荐等场景发挥着重要的作用,美国Netflix2/3的电影是因为被推荐而观看,Googlenews利用推荐系统提升了38%的点击率,Amazon的销售中推荐占比高达35%。

7、发展趋势

随着深度学习时代的来临,神经网络成为一种强大的机器学习工具,自然语言处理取得了许多突破性发展,情绪分析、自动问答、机器翻译等领域都飞速发展。下图分别是AMiner计算出的自然语言处理近期热点和全球热点。通过对1994-2017年间自然语言处理领域有关论文的挖掘,总结出二十多年来,自然语言处理的领域关键词主要集中在计算机语言、神经网络、情感分析、机器翻译、词义消歧、信息提取、知识库和文本分析等领域。旨在基于历史的科研成果数据的基础上,对自然语言处理热度甚至发展趋势进行研究。图中,每个彩色分支表示一个关键词领域,其宽度表示该关键词的研究热度,各关键词在每一年份(纵轴)的位置是按照这一时间点上所有关键词的热度高低进行排序。图14显示,情绪分析、词义消歧、知识库和计算机语言学将是最近的热点发展趋势。图15显示词义消歧、词义理解、计算机语言学、信息检索和信息提取将是自然语言处理全球热点。

参考文献[1]中文信息处理发展报告2016[2]李涓子,侯磊知识图谱研究综述.[J]山西大学学报2017[3]冯志伟.机器翻译研究.[M].北京:中国对外翻译出版社.2004[4]冯志伟.自然语言处理的形式模型[M].北京:中国科学技术大学出版社2010[5]吴军,数学之美[M].北京:人民邮电出版社2012[6]2006-2020年国家信息化发展战略[Z]中共中央办公厅、国务院办公厅2006[7]刘奕群,马少平,洪涛等搜索引擎技术基础[M]北京:清华大学出版社2010[8]韩家炜等,数据挖掘:概念与技术[M]北京:机械工业出版社2012

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇