博舍

语言学等于学语言吗为什么要学语言学 人工智能语言学是什么学科门类

语言学等于学语言吗为什么要学语言学

 

任何一门学科都不是故作高深、自抬身价。今天就给大家奉上《小白手册》,来带领大家了解语言学的ABC。

 

语言学≠学语言

这一点或许是众多语言学科普工作者最经常讲的一点,因为“语言学=学语言”是最常见的一个误区。用英文表述或许有助于澄清这个概念。上词典:

 

可见语言学是“study”不是“learning”,也就是“研究‘语言’这种现象”,与“会说好几种语言”是不一样的。虽然语言学界的大佬的确基本都是polyglot(多语者),但是对语言学家而言,研究一门语言并不以熟练掌握这门语言为必然前提;而且语言学里面有趣的东西也远远不止一两门语言本身。不过实际上,研究语言学的人基本都至少会两门语言(或许是因为没有比较就总结不出规律吧),而熟练掌握母语之外的一门语言的确会为语言学研究带来不少好处。

 

“所以不要指望身边玩儿语言学的戏精们帮忙做同声传译之类啦,这种事还是交给搞翻译的砖家们去吧”

 

语言≠汉语/한국어/English/français……

细心的小伙伴可能已经发现了,词典里linguistics的定义中的“language”一词没有复数也没有冠词。没错,这里的“language”和“Icanspeakseverallanguages”中的“language”不同,是不可数名词,指的是一个抽象的系统,而不是具体的某几种语言。现代语言学的主流观点认为,语言学的核心任务就是尽可能清晰、准确地描绘人类语言的结构、功能和历史发展。

 

诺姆·乔姆斯基(N.Chomsky)指出,自然语言之间非常不同,但万变不离其宗,有一套普适的规则约束着语言系统的可能的变化。这套规则被乔姆斯基称为UniversalGrammar(普遍语法),简称UG。乔姆斯基认为,UG是先天存在的,是人类生物属性的一部分。正是UG的存在,才使得人类儿童的母语习得如此轻而易举;UG也是人类独特性的一部分,动物不会说话(怎么教都不会)正是因为缺少UG。某种意义上讲,语言能力之于人类正像翅膀之于鸟类,属于“天赋秉异”,有之则自然能说话/飞翔,无之则绝不可能。而至于“翅膀”具体长什么样,是大是小、羽毛多寡,则由众多因素决定,但总是脱离不了基本框架的。

 

语言是一个复杂的符号系统

语言本身是一个符号系统,这个观点是结构主义之父索绪尔(F.deSaussure)提出来的。简单来讲,一个词代表一个物,几个词组成一句话描述一件事,多个句子连缀成文段表达说话人的意思(当然这样的表述是非常不严格的),而懂这门语言的听众可以通过听到的声音信号将说话人的意思解析出来。这是因为语言符号是音、义结合的双面结构。可是,对于相同的概念,比如“树”这个概念,汉语叫“树”(拼音:shu),英语叫“tree”,法语叫“arbre”,日语叫“き”(罗马音:ki),不同的语言有不同的叫法,而“树”这个概念本身与shu,tree,arbre,ki这几个声音信号之间都没有什么逻辑上的联系(对于拟声词语言学有专门的研究)。

 

语言符号像一枚硬币,“形”和“义”是其两面

语言的这种性质称为语言的任意性(arbitrariness)。索绪尔认为,“音”(能指,signifier)与“义”(所指,signified)之于一个语言符号是一体两面的,在一门确定的具体语言中二者的对应关系是确定的,但这种关系是没有任何逻辑基础的。换句话说,一门语言中一个东西叫什么就像给宠物取名字一样,没多大道理。而语言这个符号系统,作为人类的一种独特能力,神奇之处在于人类能够通过具象的、无意义的声音信号将脑海中抽象的、丰富的新想法传递给同类。某种意义上讲,语言能力是一切哲学、科技、文化成就的基础,正是这种能力才使人类成为这个星球的主宰。

“或许正是因为语言与生活如此密不可分,我们才将语言的存在视为理所当然,忽略了语言的神奇和它代表的意义和无限潜力。”

句法、语义、形态学……语言学概念好多

词典里linguistics的定义中有“……includingthestudyofgrammar,syntax,andphonetics”,这些都是语言系统的各个具体构成部分,也是语言学研究的各个分支(日常用语中grammar,即语法,这个词已经被用滥了,因此语言学中一般不用。通常意义上的grammar与syntax,即句法,有很大重合)。这其实提到的是普通语言学(或称“理论语言学”)。

语言学的确概念比较多,不过也就只是概念多而已,实际上理解起来倒是不难。下面就来带领大家了解一下这些分支。

语音学Phonetics

研究的是自然语言中出现的语音(sound)。这或许是多数大学语言学专业最先接触、也最熟悉的一个分支了。元音、辅音、前鼻音、后鼻音、卷舌音、小舌音、大舌音……这些概念统统属于语音学。  “曾经为练习法语小舌音r一个月每天早上含漱口水,然而还是发不像……歪果仁朋友学习汉语zhi,chi,shi,ji,qi,xi的时候感觉如何?”

多数语言都有自己的拼写方案,用字母等记音符号来记录真实的发音。然而字母总是有限的,而且语言随时间变化,曾经的拼写常常不再与当今的发音贴合(英语就是一个典型例子,拼写规则十分复杂,甚至有人调侃说毫无规则可言);另一方面,不同语言之间可能会用同一个符号记录不同的音,而不同符号所代表的音值又可能相同。于是19世纪末的以英国、法国为主体的语言学家们成立了国际语音学协会,基于拉丁字母创制了一套通用的标音系统,旨在精确记录人类语言中的所有发音,这就是国际音标(IPA,InternationalPhoneticAlphabet),其中的符号与音值一一对应。目前看来IPA的功能还是十分强大的,基本实现了初衷。

 

2005年版IPA(部分)

 

音系学Phonology

研究的是音位(phoneme)规则。

音位指能够区别意义的最小的语音单位。一种确定音位的方法是用“最小配对”(minimalpair)。如英语这个“最小配对”可以区别出/k/和/ph/两个音位。这和中国古代的“反切”注音法类似。如《说文解字》中就有大量的“冬,都宗切”这样的注音描述。音系学即研究具体语言的语音系统。同一音位在不同位置上时往往会有不同的具体实现。比如美式英语中的音位/t/在等单词中就有不同的音位变体(allophone),分别是[th]、[t]、[ɾ](flap,闪音)。这些变化是规则的,即处在该位置时务必采用该种音位变体。音系学研包括究音位的变化规则,以及不同音位之间的区别性特征(distinctivefeatures)。

超音段特征(重音、声调、韵律等)在音系学分析中也被看作音位,携带了语气(疑问/命令)等语义信息。赵元任的“五度标调法”就是为了记录汉语声调而设计的。

 

五度标音法

 

形态学Morphology

研究的是词汇(word)的屈折变化(inflection),如单复数、时态、人称、主谓一致等等,和句法学关系紧密。

一个相关的概念是词库(lexicon),可以简单地理解为vocabulary,被认为是大脑中储存词汇信息的地方。语言产出过程中,一个个词条(entry)从词库中被调出,通过句法规则组成句子。一般认为,在词库中,规则变化(如英语中时态的-ed,-en,单复数的-s,-es)被存储为一个词条,具体实现形式由变形规则决定;而不规则变化(如英语中时态的drink-drank-drunk,单复数的-a,-i)被储存为不同词条。

句法学Syntax

研究的是句子(sentence)的组织结构。句子是语言微观方面的最大单位,也是语言宏观方面的最小单位。如果拿生物进行类比的话,一个句子就是一个个体,词汇是细胞,语篇是种群。

传统语法将句子分析为主语(Subject,简记为S)、谓语(Predicate或Verb,简记为V)、宾语(Object,简记为O)等,也根据语序对不同语言进行了一定区分,如汉语、英语是SVO语言,日语是SOV语言,爱尔兰语是VSO语言等(这里指的是该语言中一个典型句子的语序,并不是说该语言绝对不允许其他语序的句子存在)。

乔姆斯基认为,句子的结构性不止体现在词汇的线性顺序上,更有深层次上的体现。他指出,句子中不同成分之间的相互依赖关系与线性距离远近关系不大:两个成分可以远程依赖,无论中间隔多少词;而两个线性顺序上相邻的词可能完全没有关系。

一个例子是结构歧义(structural-ambiguity),即词语组成和顺序完全相同的句子实际意义不同,如赵元任的名例“咬死了猎人的狗”就有四种可能的意思,每一种意思都对应一种不同的结构。

 

“我就是机智”

乔姆斯基认为,描绘句法是语言学的核心任务。UG理论也以句法为中心展开。

 语义学Semantics

研究的是句子的含义(meaning)。

很多人也尝试用一些哲学和逻辑学的理论和方法去理解及表达语义,将句子的意义视为其真值条件。有趣的是,并非所有的句子都有真值条件,比如询问、命令、感叹等等都是真实自然的句子,而这些句子很难用真值条件的概念来理解,因为它们并无真假。更别提自然语言中无处不在的synonymy(异形同义),homonymy(同形异义),polysemy(一词多义)等现象了。因此语义可以说是语言最复杂的分支,但同时也是最有趣的分支。 

“所以下一次你再和TA吵架的时候,请静下来想一想,真的是事实或价值观的问题吗?还是你们两个在语义处理方面的脑回路不同呢?”

 语用学Pragmatics

研究语言在实际使用中的规律。

广义上讲,语用学可以算作语义学的一个方面,因为实际生活中人们最关心的是“你说的话是什么意思”,而不是发音或者语法等形式上的内容。礼貌用语、言外之意、幽默、委婉说法等等这些实际语言使用中的现象都是语用学研究的对象。

语用学是普通语言学中特别关注语境相关的分支,这使得其相对于句法、语义、音系等“重理论”分支来说显得比较另类。或许也是因为这样,语用学和应用语言学经常被混淆。

“我们就是在亲自逼近人类认知的极限。”

还记得上一篇讲座预告中的这句话吗?没错,语言学的意义就是这么宏大。

语言能力与人类的其他认知能力是息息相关的,也与整个人类的社会是密不可分的。由此衍生出诸多宏观语言学(macrolinguistics)分支,如神经语言学、心理语言学、社会语言学、计算语言学等等。因此语言学也是一门十分前言、十分具有交叉性的学科。美国著名心理语言学家米勒(George.A.Miller)曾言,未来的语言学家要想取得决定性突破,就务必具备生物学或者计算机科学的知识,至少其一。这也同样决定了,语言学是一门前景广阔、充满巨大可能性和潜力的学科。解决了“Howdoweknowwhatweknow”的问题,几乎就等于拿到了解释整个人类意识、认知、思维的钥匙。

 

为什么要学语言学

为什么要去学习语言学呢?

为了像《降临》里那样拯救世界?

为了像《窈窕淑女》那样凭语音纯正攀入上流?

 

原本想说,真正的学术人完全是为了热爱,然而不可能所有人都是因为热爱才去学习一门学科。实际上,语言学的应用领域相当的广泛:比如语言习得的研究成果就被用于改进语言教学方法;人工智能领域,基础坚实的语言学理论可以成为机器翻译的强大支持(虽然现在搞NLP的孩子们都是在玩儿统计);刑侦领域,分析和对比个人语言特征能够大大提升锁定嫌疑人的效率,乃至实现犯罪预警;商业领域,合理的广告词设计能够有效提升消费者对产品的青睐……实际上,凡是用到语言的地方,就是语言学的用武之地,而这基本包括了你所能想到的任何行业和学科!

  

参考文献

[1]F.deSaussure. CoursdeLinguistiqueGénérale.

[2]Fromkin. AnIntroductiontoLanguage.

[3]G.A.Miller. ThePlaceofLanguageinaScientificPsychology.

[4]M.Macaulay&K.Syrett. WhyMajorinLinguistics.

 

本文来源:THU语协

免责声明:文章部分内容和信息来源于互联网,不代表本网站赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:17300859163),我们将迅速采取适当的措施。本网站原创内容,转载需注明作者和出处。

人工智能涉及的学科

人工智能涉及的学科人工智能涉及哪些学科?计算机类自动化类数学专业领域类心理学和哲学学习人工智能为什么要会心理学知识?哲学和人工智能有什么关系?其他人工智能涉及哪些学科?

人工智能相关学科有很多,看看你的知识储备够不够!需要补充哪些方面?

计算机类

首先,人工智能是计算机科学中的一个分支,所以对应的计算机科学、计算机基础知识、编程语言、互联网知识、物联网知识、软件工程、信息安全等是必备的。

自动化类

其次,人工智能的目标是实现辅助人类智慧、部分代替人类智能、扩展人类智能,所以还会涉及自动化、机器学习、智能科学与技术、空间信息与数字技术、电子与计算机工程、信息与计算科学。

数学

然后,人工智能需要处理大量的数据,所以数学和逻辑思维也很重要,高数、数学与应用数学、信息与计算科学、数理基础科学、数据科学与大数据技术等。

专业领域类

另外,除了一些通用的学科,面对不同的领域,还要学习不同的学科,如:通信工程、信息工程、水声工程、电子信息工程、微电子科学与工程、光电信息科学与工程、自然语言处理、电磁度场与无线技术、电子信息科学与技术、电波传播与天线、集成电路设计与集成系统、轨道交通信号与控制。

心理学和哲学

除了计算机知识,心理学和哲学也是必学的学科。

学习人工智能为什么要会心理学知识?

试想一下人工智能模仿的是人类的什么?是人类的智慧。人类的智慧由什么产生?人的思想、知识、记忆、创造力。而这一切皆由人的大脑控制。而心理学其实是大脑活动后的一种产物,所以要想让一台计算机真正拥有人类智慧,必须了解人类的心理活动和思考方式。与其说人工智能是在模仿人类智慧,不如说人工智能是在模仿人类思维。只有当人工智能可以像人类一样思考、分析问题、拥有人类的喜怒哀乐,才能算得上是真正的人工智能。

哲学和人工智能有什么关系?

说到人工智能中的哲学问题,不得不提著名的图灵测试。图灵测试是由阿兰·麦席森·图灵在1950年的一篇论文《计算机器与智能》中提出的。图灵是英国著名的数学家和逻辑学家,被称为计算机科学之父、人工智能之父,是计算机逻辑的奠基者。图灵测试说的是,一个人和一台机器,在人类不知道对面是机器的情况下对他提问,以此来判断对面的是人类还是机器。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。从哲学层面来说,如果一台机器通过了图灵测试,那么它真的能被称之为和人类一样有智慧吗?判定一台机器有智慧的标准或者说是界限到底是什么?在实际应用中,哲学在人工智能上也起到了很多决定性的作用。比如一台人工智能机器,在面对文化、信仰、法律都不同的日本人和阿拉伯人,一个可能说这台机器非常智能,一个可能说并不智能,达不到想要的、或做的不对。那么这时,这台机器能不能被称之为是一台人工智能机器?在人工智能发展上,有很多关于类似的哲学问题。仅仅是“智能”二字,在哲学上都有很多的争议。比如,智能的含义到底要怎么去定义?达到什么样的界定才能称之为智能?在这里,我给自己留一个作业,等以后我积累了更多的知识,再和大家讨论关于“人工智能与哲学之间的关系”的问题。

其他

除了上面提到的学科,还有认知科学、神经生理学、信息论、控制论、不定性论等。因为人工智能属于跨学科的技术,所以想要学习人工智能,不仅要知道人工智能的基本知识,还要确定研究的方向,朝着既定的目标前进,才不至于在人工智能的学习道路上走岔了。

人工智能技术与语言学理论

目前,人工智能已成为新一轮科技革命和产业变革的重要驱动力量。在这种背景下,如何进一步介绍和从事人工智能与语言学的交叉研究,是亟待思考和解决的重要问题。

 

人工智能是计算机学科的一个分支,也是一门边沿学科,属于自然科学、社会科学、技术科学三向交叉学科。人工智能从上世纪五十年代诞生起就表现出了极强的生命力,它在上世纪八十年代后期得益于计算机软硬件发展的日新月异而得到迅猛发展。人工智能作为当下科技领域最热门的技术,吸引了众多行内和行外人士的关注;它也已渗透进学术领域,正以各种方式玩转学术界。目前,人工智能技术包括大数据、计算机视觉、语音识别、自然语言处理、机器学习五大部分。人工智能技术主要是建设在机器学习的基础上,而机器学习除了先进的算法和硬件运算能力,还需要大数据。

人工智能,是一种对人类智能现象的模拟,其中包括对人类思维过程的模拟;它涉及到计算机科学、心理学、语言学和哲学等学科。人工智能的发展似乎并不遵循由低级到高级的进化过程,而是会在一些“点”上,也就是某单一维度上突然变得比人类“聪明”很多。人类智能是综合多维的,或许我们的学习、记忆、信息搜索、决策、判断或者加工能力并不是最了不起的,AlphaGo已经证明,我们人类在这些方面可能不如深度学习后产生的人工智能。

语言学,顾名思义,是研究自然语言(即人们日常使用的语言)的学科。但是语言学不是指学习某一门或几门具体的语言过程。语言学的任务是研究、描写语言的结构、功能及其历史发展,揭示语言的本质,探索语言的共同规律。因为只有人类有语言、使用有声语言进行交际,因此通过语言研究,可以更加清楚地了解人类在世界或宇宙中的位置,从而更加透彻地理解人类的本质。语言是人区别与万物的重要标准,机器理解人的语言是人工智能最后一个挑战,也是最难的一个挑战。可以说,自然语言是人类智能的最高层的抽象表达。

语言学作为研究自然语言的科学,它的历史非常古老;人类最早的语言研究是从解释古代文献开始的,是为了研究哲学、历史和文学而研究语言的。而人类的多种智能都与语言有着密切的关系;语言是人类特有的沟通方式,在生物或心理层面上反映人类高度演化的心智能力,在社会文化层面上反映人类文明进步。语言学就是要研究人类最核心本能的语言能力,透过对口语、书面语甚至手语进行分析和研究,进而了解人类的本质。除了认识人类的本质外,语言学研究还具有多种应用价值。

人的思维过程可以理解为符号处理的计算过程;人类的语言理解过程也可以理解为是一种在知识表示上的计算过程,这使得计算机理解自然语言在技术上具有可能性。因此,对语言的认知研究的自然延伸便是对语言的计算分析。可以说,对语言有处理能力是人工智能的一种高级表现形式。虽然语言学与人工智能有重要的区别,但它们的研究有着密切的联系;它们相互促进,共同发展。从理论与应用的角度看,语言学目前至少有以下几个分支学科与人工智能有关。

计算语言学

计算语言学是植根于计算机科学、语言学和数学等多学科沃土而成长起来的一门新兴学科。它通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的。它的项目有统计资料,检索情报,研究词法、句法,识别文字,合成语音,编制机助教学程序,进行机助翻译等。拥有对语言的感悟和理解是语言计算的基础,语言与思维的密切联系,语言的变化性、变异性、内省性等都不为人们所把握和确知。计算语言学的主要目的为借助计算机科学、统计学领域中的模型与算法,解决语言学中的问题。

自然语言处理(NLP)是计算语言学的一个重要研究课题,它主要研究如何利用计算机来理解和生成自然语言。实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。自然语言处理的目的是高效的可用于处理自然语言的算法,但实现自然语言理解和自然语言生成是十分困难的,造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的歧义性或多义性。

认知语言学

认知语言学主要是在认知科学的理论背景下建立起来的,同时两者之间亦有同步发展、相辅相成的关系。认知科学既推动了认知语言学的发展,成为后者的主要理论基础,同时也汲取了认知语言学的研究成果,认知语言学成为认知科学的主要组成部分之一。因此,不少学者将认知语言学视为认知科学的一个分支,把它作为是认知研究和语言学的边缘学科。认知语言学的特点是把人们的日常经验看成是语言使用的基础,着重阐释语言和一般认知能力之间密不可分的联系。

认知语言学涉及人工智能、语言学、心理学、系统论等多种学科,它针对生成语言学,提出:语言的创建、学习及运用,从基本上都必须能够透过人类的认知而加以解释,因为认知能力是人类知识的根本。认知语言学对于构建人工智能的操作系统来说是一种指导思想。我们可以想象未来我们对人工智能的交互不是再用一行行命令,而更像是人与人之间的交流;这就要求人工智能必须具备语言能力。另外,语言也具有指导认知和思维的作用。由此可见认知语言学对于人工智能的重要性。

老年语言学

老年语言学,顾名思义,就是研究老年人语言问题的学科。它主要研究老年人运用的语言系统的性质、结构及其变化规律和言语交往问题。研究的基本内容包括老年语音、音位、词汇、语法、修辞、文字等和老年人语言风格的灵活性、阅读技能障碍以及双语老人第二语言的丧失等。在应用上,老年语言学还包括外语学习与成功老龄、老年看护沟通、临终关怀与丧慰等方面。伴随着年龄的增长,老龄人群会出现语言衰退、甚至语言障碍现象,老年语言学研究及其应用正日益受到关注。

老年语言学研究具有跨学科属性,涉及语言学、认知科学与脑科学等多个领域,也与人工智能密切相关。正常老年人及罹患神经退行性疾病老年人语言能力衰退的神经机制、疾病病理、治疗康复等问题,属于从分子、细胞及行为水平研究人脑机理的脑科学范畴;语言与感知、记忆、思维、情感、意识等紧密相关,言语理解与产出研究及言语治疗等问题,属于认知科学范畴;如何利用现代科技,对人脑的语言功能进行模仿,对语言能力衰退及其干预进行辅助,属于人工智能研究及应用范畴。

由上可见,人工智能和语言学是两个相互独立却又密切相关的研究领域。人工智能技术的发展,需将语言学理论的研究成果运用到人机对话的设计中,使机器理解“寒暄”、“安抚”甚至是“讽刺”、“幽默”这样的言语修辞行为,让机器真正读懂人类语言的复杂语义,以及背后的意图和情感,然后给予用户拟人的反馈,从而达到更好的人机自然语言交互效果。同样,人工智能也必将改变语言学研究的发展方向。传统的重理论分析而轻实例,坐着想句子的研究方法将逐渐退出舞台;真实语料、口语和书面语并重,侧重对语言形态进行统计分析的研究将大量涌现。

最后一提,我国语言学界对人工智能与语言学的交叉研究已有介绍,如著名学者王宗炎教授在《略谈美国人工智能研究的新发展》(《国外语言学》1981年第3期)一文中最早对国外学界如何进行语言学与人工智能的研究作了介绍。另一位著名学者伍铁平教授在《语言学是一门领先的科学》(北京语言学院出版社,1994年3月出版)一书中提到了语言学与人工智能的研究。这两位学术先贤为我国语言学界从事这方面研究提供了有用的信息和有益的帮助。

(作者单位:澳门大学人文学院)

责编:微科普

上一篇:自然语言处理的过去、现在与未来

下一篇:返回列表

人工智能技术与语言学理论  |  责任编辑:微科普微博微信QQ空间分享到:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇