机器翻译和自然语言信息处理专业硕士研究生培养方案
http://ling.cass.cn/yanjiusheng/fuaiping.htm
2.专业基础课(由导师在下列课程中指定3-4门)(1)语言学概论2学分《语言学概论》邢公畹,语文出版社(2)语法理论4学分《现代语言学流派》冯志伟,陕西人民出版社(1981)(3)形式语言理论2学分《形式语言与自动机》陈崇昕,北京邮电学院出版社(1988)(4)离散数学(数理逻辑)3学分3.专业课(由导师在下列课程中指定2-3门)(1)自然语言的计算机处理4学分《自然语言的计算机处理》冯志伟,上海外语教育出版社(1996)《自然语言处理》刘开瑛等,科学出版社(1991)《汉语计算语言学》吴蔚天等,电子工业出版社(1994)(2)机器翻译概论3学分《自然语言机器翻译新论》冯志伟,语文出版社(1995)《MachineTranslation:Past,Present,Future》W.J.,HutchinsChichester,England(1986)《自然语言理解》姚天顺,清华大学出版社(1995)《MachineTranslation:AnIntroductionguide》D.Arnold,NCCblackwellOxford(1994)《中国的机器翻译》刘涌泉等,知识出版社(1984)(3)自然语言处理系统设计及上机实验5学分《计算语言学研究与应用》陈力为主编,北京语言学院出版社(1993)《计算语言学进展与应用》陈力为主编,清华大学出版社(1995)《语言工程》陈力为主编,清华大学出版社(1997)《机器翻译研究进展》陈兆雄主编,电子工业出版社(1992)(4)计算语言学2学分
机器翻译和自然语言信息处理专业硕士研究生培养方案
一、培养目标1.
能较好地掌握和运用马克思主义、m思想和d建设有中国特色的社会主义理论,拥护党的基本路线,热爱祖国,遵纪守法,品德良好,学风严谨,具有较强的事业心和献身精神,积极为社会主义现代化建设事业服务。2.
在计算语言学、自然语言处理和机器翻译方面具有坚实的理论基础及系统的专门知识和技能,对于本专业的研究方向有比较全面深入的了解,具有独立从事研究工作的能力。比较熟练地掌握一种外国语,在有条件的情况下掌握两种外国语。能够用第一外语熟练地阅读本专业的外文资料,并具有一定程度的听、说和写作能力。3.
身心健康。二、培养方式通过系统理论学习、进行科学研究、参加学术交流和实践活动的方式,既要使硕士研究生牢固掌握基础理论和专门知识,又要培养他们从事科学研究和独立担负专门业务工作的能力。在指导方式上采取导师个别指导和指导小组集体培养相结合的方法。同时为了适应本专业领域跨学科交叉的特点,在专业课和专业基础课的教学中,注意安排硕士研究生到其他研究机构和高等院校选课。导师要严格要求、全面关心研究生的成长,定期交流,重视专业课和专业基础课的教学,重视专业外语的学习,指导学生做好开题报告,组织他们参加学术活动,鼓励并帮助他们发表学术论文。三、研究方向1.自然语言信息处理(Naturallanguageinformationprocessing)用计算机对人类特有的书面形式或口头形式的语言信息进行各种处理和加工,叫做自然语言信息处理。它的任务是对字、词、句、篇章的语音形式和书面形式进行输入、输出、统计、检索、识别、分析、理解和生成,涉及语言学、数学和计算机科学等学科的交叉领域。自然语言处理的应用目标是使人与计算机之间用自然语言进行交流。具体说是建立各种处理自然语言的计算机应用软件系统,比如:自然语言理解系统、计算机辅助教学系统、自动校对系统、文字自动识别系统、智能信息检索系统、文献自动分类系统、自动文摘系统,还有文本中的信息提取、网上智能搜索引擎,以及电子词典和术语数据库。2机器翻译(Machinetranslation) 机器翻译的任务是用计算机把一种语言翻译成另外一种语言。要建立一个机器翻译系统,首先需要确立分析和生成语言的基本观点,选择适用的语言学理论,构造系统的运行机制,组织各种必要的参数和规则,提出在计算机上实现的算法,然后设计程序。机器翻译的研究涉及了人文科学、自然科学和技术科学的多个领域,整个研究是理论方法和工程技术并举的。四、学习年限 硕士研究生的学习年限一般为三年(包括论文答辩时间)。五、课程设置与学分 1.公共必修课 1.克思主义理论课:科学社会主义的理论与实践3学分马克思主义经典著作选读3学分2.外国语课6学分 2.专业基础课(由导师在下列课程中指定3-4门) (1)语言学概论2学分(2)语法理论4学分(3)形式语言理论2学分(4)离散数学(数理逻辑)3学分(5)计算机程序设计3学分(6)数据结构3学分(7)人工智能2学分 3.专业课(由导师在下列课程中指定2-3门) (1)自然语言的计算机处理4学分(2)机器翻译概论3学分(3)自然语言处理系统设计及上机实验5学分(4)计算语言学2学分 4.选修课(导师可以指定限修1门) (1)现代汉语语法3学分(2)数据库系统3学分(3)第二外语3学分(4)数理统计2学分 导师根据每一位硕士研究生的研究方向和本科专业背景制订教学计划。譬如,对于研究方向为自然语言处理且具有理工科专业背景的研究生,专业基础课必修第1、2、3、7门,专业课必修第1、3、4门,选修课指定限修第1门。 5.社会实践(必修)2学分六、中期筛选考核 在硕士研究生课程学习阶段基本结束的第三学期(入学后第二年的10月中旬到11月底)进行中期筛选考核。考核内容包括思想品德、课程学习、科研能力等方面。七、学位论文 学位论文选题应综合考虑我国社会主义建设的实际需要和本学科的发展状况,应有一定的学术意义或应用价值,对研究的问题应有新的见解。学位论文应在导师的指导下由硕士研究生独立完成。论文应包括论述和计算机程序设计两个部分。论述部分应做到概念清楚、条理分明、分析严谨、文句通顺精练、文本工整、图表整齐清晰。计算机程序设计部分应该做到程序结构清晰、数据完整,具备应有的功能、附有必要的文档,并上机调试通过。学位论文中还应包括中、英文摘要和中、外文参考文献。硕士学位论文(包括论述和计算机程序)一般在三万字左右。 硕士研究生用于写作学位论文(包括在计算机上实现)的时间,应不少于一学年。硕士研究生学位论文的评阅、答辩和学位授予,按有关规定办理。 课程教学大纲 课程编号:课程名称:语言学概论授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师及职称:黄国营教授授课方式:讲课、问题答疑及作业讲评学时:40学分:2课程内容概要:语言的功能及发展;语言作为一个结构系统的性质和特点;语言学的各部门(语音学、词汇学、语法学和语义学等)的基本理论和基本知识;记录语言的符号-文字;语言的分类。教学要求:使学生树立科学的语言观,掌握语言学的基本概念,初步具备运用语言学的理论和方法分析语言现象的能力。考核方式:提交报告、综述,考查。参考书目:《语言学概论》邢公畹,语文出版社《普通语言学教程》德·索绪尔,(中译本,高名凯译)商务印书馆(1989)《西方语言学名著选读》胡明扬,人民出版社(1988)《languageandlinguistics:anIntroduction》J.Lyons,CambridgeUniv.Pr.(1981) 课程编号:课程名称:语法理论授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师及职称:张伯江研究员授课方式:讲课、阅读文献、问题答疑及作业讲评学时:60学分:4课程内容概要:二十世纪以来现代语言学主要流派的基本理论和方法,包括结构主义理论、功能主义理论、形式主义理论以及数理语言学和计算语言学的理论。教学要求:使学生了解现代语言学主要流派的基本理论和方法,重点是与语言的信息处理密切相关的语法理论,为下一步学习专业课"自然语言的计算机处理"和"机器翻译系统设计"打下良好的基础。考核方式:提交报告、课程论文、考查参考书目:《现代语言学流派》冯志伟,陕西人民出版社(1981)《语义学》徐烈炯,语文出版社(1990)《现代语言学研究:理论方法与事实》陈平,重庆出版社(1991)《当代国外语言学:学科综述》徐烈炯,河南人民出版社(1993)《LecturesonContemporarySyntacticTheories》P.Sells,Stanford:CSLI(1987)**《AnIntroductiontoUnification-basedApproachestoGrammar》S.M.,shieber(1987)**《Constraint-basedGrammarFormalisms:ParsiingandTypeinferencefor NaturalandComputerLanguages》S.M.,shieber,CambridgeMass:MITPr.(1992) 课程编号:课程名称:形式语言理论授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师:(到清华计算机系上课)授课方式:讲课、问题答疑及作业讲评学时:40学分:2课程内容概要:形式语言的四类文法:正则文法、上下文无关文法、上下文相关文法和短语结构文法;与这四类文法相应的语言及其分析算法。教学要求:使学生掌握语言信息处理的基本理论和方法。考核方式:笔试参考书目:《形式语言与自动机》陈崇昕,北京邮电学院出版社(1988)《形式语言、自动机和语法分析》邹海明等,华中工学院出版社(1985)《编译原理》蒋立源,西北工业大学出版社(1994) 课程编号:课程名称:离散数学授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师:(到清华计算机系上课)授课方式:讲课、问题答疑及作业讲评学时:60学分:3课程内容概要:数理逻辑;集合论;代数结构;图论;教学要求:通过课堂讲授、习题和综合练习,使学生掌握离散数学的基本理论和概念,学会处理离散结构所必须的描述工具和方法,了解形式系统的基本思想和形式化的基本方法,培养学生的抽象思维和严格逻辑推理的能力。考核方式:笔试参考书目:《离散数学导论》徐洁磐,高等教育出版社(1991)《简明数理逻辑基础》刘治旺等,福建人民出版社(1985)《集合与逻辑代数》肖鹏一,科学出版社(1983)《系统论、控制论、信息论概要》曾广容,中南工业大学出版社(1986) 课程编号:课程名称:计算机程序设计授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师:张弘助理研究员授课方式:讲课、上机操作、问题答疑学时:60学分:3课程内容概要:BORLANDC系统简介C语言数据处理基本概念基本输入输出和文件输入输出常用数据结构(数组和指针、链表)和字符串剖析VISUALC++入门及可视化编程教学要求:通过讲授和实践要求学生掌握计算机程序设计的基本概念和方法,了解C语言的基本数据结构,熟练运用C语言设计程序、操作文件、输入/输出、处理汉字、作简单图形等。初步了解可视化编程方法,并能独立完成简单的应用程序。考核方式:程序设计参考书目:《程序设计方法学基础》陈火旺等,湖南科学技术出版社 《算法语言及数据库》胡运机,西南交通大学出版社(1993)《C语言程序设计基础》李成付,科学出版社(1992)《计算机信息检索软件设计原理》张进,武汉大学出版社(1994) 课程编号:课程名称:机器翻译概论授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师:傅爱平研究员授课方式:讲课、阅读文献、问题答疑学时:40学分:3课程内容概要:机器翻译原理;机器翻译系统的设计方法;机器翻译系统实例讲评。教学要求:使学生掌握机器翻译的原理、基本方法和主要技术,了解国内外机器翻译研究和开发的历史和现状,熟悉本专业的主要文献资料。考核方式:提交报告、课程论文参考书目:《自然语言机器翻译新论》冯志伟,语文出版社(1995)《MachineTranslation:Past,Present,Future》W.J.,HutchinsChichester,England(1986)《自然语言理解》姚天顺,清华大学出版社(1995)《MachineTranslation:AnIntroductionguide》D.Arnold,NCCblackwellOxford(1994)《中国的机器翻译》刘涌泉等,知识出版社(1984) 课程编号:课程名称:自然语言的计算机处理授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师:冯志伟研究员学时:60学分:4授课方式:讲课、阅读文献、问题答疑课程内容概要:自动词法分析;自动句法分析;自动语义分析;自然语言处理系统;语料库。教学要求:使学生掌握自然语言处理的基本理论和方法,熟悉有关操作过程,并对自然语言处理各个分支领域的研究及应用有比较全面的了解。考核方式:课程论文、提交报告、算法设计参考书目:《ComputationalLinguistics:AnIntroduction》,Grishmen,CambridgeUniv.Press(1986)《LanguageasaCognitiveProcess》,Winograd,AddisonWesleyPublishingCompany(1983)《自然语言的计算机处理》冯志伟,上海外语教育出版社(1996)《自然语言处理》刘开瑛等,科学出版社(1991)《汉语计算语言学》吴蔚天等,电子工业出版社(1994)课程编号:课程名称:自然语言处理系统设计及上机实验授课对象:机器翻译和自然语言信息处理专业硕士研究生授课教师:傅爱平研究员学时:80学分:5授课方式:讲课、上机操作、问题答疑课程内容概要:机器翻译系统的语言分析方法;机器翻译系统的程序设计;机器翻译系统的上机调试。教学要求:使学生掌握自然语言处理系统的构造方法、算法设计策略和上机实现的技术。考核方式:程序设计参考书目:《计算语言学研究与应用》陈力为主编,北京语言学院出版社(1993)《计算语言学进展与应用》陈力为主编,清华大学出版社(1995)《语言工程》陈力为主编,清华大学出版社(1997)《机器翻译研究进展》陈兆雄主编,电子工业出版社(1992)