北京外国语大学人工智能与人类语言重点实验室正式成立—中国教育和科研计算机网CERNET 人工智能与人类语言实验室

发表时间：2023-07-17 06:16:11

北京外国语大学人工智能与人类语言重点实验室正式成立—中国教育和科研计算机网CERNET

12月26日，北京外国语大学人工智能与人类语言重点实验室（以下简称：实验室）成立大会暨研讨会在北京外国语大学（以下简称：北外）隆重举行。来自北京外国语大学、北京大学、清华大学、北京师范大学、中国传媒大学、哈尔滨工业大学等高校的专家学者出席大会。

“人工智能与教育的结合势不可挡。”北京外国语大学党委书记王定华说道。他指出，人工智能是新一轮科技革命和产业变革的重要驱动力，在此背景下，北外成立“人工智能与人类语言重点实验室”既有重要的现实意义，又有长远的历史意义，更体现了北外的使命担当。王定华强调，实验室将聚焦人工智能与语言教育领域的前沿课题，本着“开放、协同、智能、一流”的建设原则，依托交叉学科智库，围绕国家科教兴国战略，汇聚海内外贤才，力争成为国内乃至世界领先的人工智能助推语言教育的研究高地。与兄弟院校、科大讯飞、华为集团等共建共享、合作互助。

教育部教师工作司司长任友群对实验室的成立表示祝贺，他指出，教育部人工智能助推教师队伍建设试点工作开展以来，北外积极探索人工智能技术与教育融合的新路径，取得了令人瞩目的进展。希望北外在促进人工智能和教育融合发展的过程中，积累更多宝贵的、可推广的先进经验和优秀案例，为实现我国教育现代化和教育强国的目标添砖加瓦，也为构建人类命运共同体贡献应有的才智和力量。

北京市委教育工委委员、北京市教委副主任李奕表示，北外凭借深厚的科研积淀和强大的创新能力，成立“人工智能与人类语言实验室”，能够帮助我国实现人工智能在多语言教学研究及应用领域的突破，也必将对北京进一步落实全国科技创新中心定位、构建首都高精尖经济结构、服务国家创新驱动发展战略产生积极的影响。

华为技术有限公司高级副总裁、中国区总裁鲁勇在致辞中表示，华为将会携手北京外国语大学，利用双方在语言和人工智能领域的优势进行互补，在三个方面全面加深合作：一是共同推进人工智能创新平台建设，合力打造外语高端人才的培训体系，实现真正的科研创新和高素质人才培养；二是共建智慧校园，打造可视、可控、可管的北外；三是在中国教育现代化2035的政策指导下，共同打造“人工智能+教育”的新模式。

实验室首席专家、中国社会科学院创新工程首席研究员顾曰国进行了工作汇报，他表示，实验室的顶层定位是“人类语言+AI”，使命为“阐释自然智能，驾驭人工智能，解码语言奥秘，成就智慧人生”。他还介绍了实验室的特色研究，即外语健脑强智研究中心，上工治未病、大智健晚年，南山夕阳外语课程等。

据了解，实验室聘请了国内外知名专家学者担任实验室学术委员会成员，为实验室建设提供学术指导。北京外国语大学与华为技术有限公司、科大讯飞股份有限公司举行战略合作伙伴协议签约仪式。

当天下午，实验室专题研讨会在行政楼504会议室举行。与会专家学者围绕实验室的下一步发展进行了充分研讨，为实验室的发展提出了富有建设性的意见与建议。（主办方供图）

人工智能大语言模型的今天和明天

本文内容来自“墨子沙龙X2023年科技节”（2023年5月20日），演讲者是香港中文大学计算机科学与工程学系助理教授、博士生导师王历伟。

文字由林梅整理。

今天，我想从“大语言模型的教育”和“大语言模型的产业”两个维度来分享大语言模型的今天和明天。

什么是大语言模型？

其实，大语言模型分很多种，如今大家比较关注的可能是这样一类——我们可以去和它进行一定方式的通信，比如输入一个提示词，一句话，或者是一段对话，大语言模型凭借深度学习系统，根据用户输入的文本，去预测下一个词是什么，这个过程周而复始，最终完成一个更长序列的文本的生成，就像ChatGPT现在表现的这样。

自从GPT-3推出以后，大语言模型体现出了一些非常强大的能力。其中，一个非常重要的能力就是所谓的“上下文学习能力”，或者叫“语境学习能力”。

那么，“上下文学习能力”是什么意思呢？举个例子，如果我们想对它解释一个任务——翻译，我们就可以告诉它一些把英语翻译成法语或者是中文的例子，这时候，不同于以往的神经网络或者深度学习的人工智能系统，现在的大语言模型在面对新的任务时，非常强调泛化的学习能力，我们只需要告诉大语言模型几个简单的翻译的例子，其实就定义了这个新的任务，再用几个简单的例子去告诉大语言模型该怎么做，它就可以对你提出的新的单词给出正确的翻译。

所以，所谓的“上下文学习能力”，其实就是说，大语言模型本身的泛化学习能力是非常强的，我们可能只需要告诉它若干的少数几个例子，它就可以学习并且完成一个新的任务。大语言模型近三四年的发展日新月异，从2018年的GPT系列到2020年的GPT-3系列，再到如今的GPT-4，我们可以发现，这个历程的发展速度极其之快，而且很多语言模型的参数量会越来越大。

图一大语言模型发展历程举个最简单的例子。从GPT-1到GPT-2，短短的一年时间，参数量就从1亿扩大到15亿，然后再到GPT-3，参数量是1,750亿，参数量的飞跃为各方面的能力带来了新的提升，比如上下文学习能力，涌现能力等。这些是参数量，也就是神经网络深度学习系统的复杂程度决定的。虽然不知道GPT-4的训练细节和参数，但是我们相信它和同时期的其它系统，应该都具有很大的参数量规模。

还有第二个能力也是非常重要的，就是“大模型的涌现能力”。图二来自于实验结果，图中的每一张子图，都代表了一种大模型在某一个任务上的性能表现，比如说准确率等，数值越大，可能性能越好。

图二大语言模型的涌现能力图中的横轴代表的是关于模型规模的一些指标，当然，模型的规模，不仅仅体现在参数量的大小，也与其它因素有关。不过无论如何，横轴代表参数量或者规模，通过这张图，我们知道了，随着模型的参数量越来越大，或者说整个模型的规模越来越复杂，它会在超过某一个临界点的时候，实现一些能力的突变。体现在纵轴，可以看出，性能会有一个快速的飞升，这种能力就被定义成所谓的“大语言模型的涌现能力”。

其实“涌现能力”这个词并不是人工智能领域特有的，这个词早在几十年前，就被一名获得过诺贝尔物理学奖的科学家提到了。其实，用咱们中国的古代哲学来理解，涌现能力也就是量变到质变的能力。

迄今为止，我觉得它对于整个人工智能领域，特别是大模型方向的研究来说，依然是一个亟待去突破的能力。2022年底距今不过半年，ChatGPT的诞生完成了这样的突破，也使整个人工智能领域掀起了一个新的进步狂潮。

其实，ChatGPT在做的事情主要分三个步骤：第一个步骤，如果已经有了一个训练好的大模型的基座模型，它可以进行“指令的监督学习”，指令的监督学习其实并不难，需要一些合理的人工标注或者一些合理的监督数据集；然后去做第二步——一个自动的打分模型，为了训练这样的打分模型，现在已经有各种各样更加自动化的方式；第三个步骤就是强化学习优化策略，可以帮助整个系统实现进一步的性能提升。所以说，ChatGPT这三个步骤，每一个步骤都实现了非常有趣的性能提升，三个步骤叠加在一起，最终带来了整个系统的飞跃。

大语言模型的现状

我想从产业的角度来提一些有意思的新现象。

根据最新的行业调研报告，2023年1月，ChatGPT的月活跃用户已经达到一个亿，这意味着，1月份平均每天有超过1,300万名独立的访问者使用ChatGPT，这是去年12月份刚刚发布时候的两倍多，它其实已经成为史上用户增长最快的消费者应用程序。ChatGPT只用了两个月，就实现了用户的指数增长，相比之下，我们熟悉的很多非常强大的消费者端应用，都需要花更长的时间来实现。

ChatGPT推出之后，GPT-4——也就是GPT第四代大语言模型，也很快就推出了，相比之前的几代大语言模型，GPT-4拥有更强大的推理能力。

举一个具体的例子，如果需要去设置一个会议的时间，满足很多与会者共同的时间要求，这是一个非常常用的应用。GPT-4或者其它同等量级的大模型，已经具备完成这样稍微复杂的推理任务的能力。那么，对于更复杂的一些推理任务会怎么样？这里有一个表格，展示的是GPT-4为代表的这一代大语言模型，在各种人类考试上表现得非常优秀。其中，最高的这些绿色代表的都是GPT-4模型的性能。

图三GPT-4在各种人类考试上表现卓越举例说明，纵轴的90%，意味着该模型超过理想中90%的人类的考试水平。图中很多绿色纵轴的出现，说明在很多人类的考试水平上，GPT-4的能力超过大部分人类的平均表现水平。

值得注意的是，这既体现了GPT-4具有非常强大的知识理解能力、甚至推理的能力，同时，也给我们的教育带来新的思考。

在开始讲述大语言模型如何影响我们的产业之前，我想简单讨论一下，我们怎么样去评测大语言模型的能力，这一点现在变得愈加关键。正如我们刚才看到的，很多人类考试上，大语言模型已经表现得非常好了，这个时候，我们需要更加全面的评价体系。举一个最简单的例子，我们知道，中国语言博大精深，同一个表达在不同场景下，意义会有所区别。我们告诉大语言模型一段具有言外之意的对话，看大模型能不能理解这个言外之意，事实上，在某些例子上，大语言模型的表现能力确实是非常不错的。

大语言模型的突破带来了各种各样的应用场景的突破，从工业界产品应用的角度来看，几乎可以为现在所有的b端或者c端的应用升级带来新的驱动。比如，通过积极开展针对b端企业用户的产品升级，可以和儿童们一起创作故事、小说，可以在智能车舱内实现对话的升级等。

大语言模型的明天

下面，我要畅想一下大语言模型的明天以及面对大语言模型的明天，教育应该如何转型和升级。

大语言模型对教育会有哪些影响？会改变教育的内容和方式，更加需要培养学生的综合素质，会推动教育模式的一些改革，也会影响教师本身的角色。这些都需要全方位的思考。教育机构需要积极适应这种现实，更好地满足学生和社会的要求。

我本人在香港中文大学任教，对于本科生，我会在教课的过程中，告诉他们ChatGPT的强大，同时我也会思考两个问题。第一，人工智能时代我们到底需要培养学生的哪些能力？我想，对于以前的填鸭式的教育，某种程度上需要我们重新思考、改变。第二，人工智能时代，学校应该如何规范学生合理地使用智能工具？这可能涉及到学校应该和教师、学生如何通过互动来解决这个问题。

从大模型的角度来说，我认为有两点是非常重要的。

第一点是大模型本身一定会具备更全面的工具化的能力，这一点其实需要我们重新衡量大模型的能力，虽然我们希望大模型能够完成各种复杂的任务，但是我们并不一定希望或者迫切的需要大模型本身足以解决所有的任务，因为我们人可以通过学习或者使用工具来解决新的任务。当然，如果有一天，我们教会大模型，自己教会自己通过使用新的工具去解决新的任务，这也是一个非常有意思的科研问题。

第二点就是可信和安全的人工智能，这对教育行业是非常重要的。我们的希望在未来，儿童能够快乐地在电脑上和人工智能一起互相学习，这样的情景是我们非常期待的。

最后，从研究角度来说，结合我自己所带领的香港中文大学语言和视觉实验室，我想聊聊我们目前关注的几个比较前沿的研究方向，第一个就是与物理世界的交互。大语言模型本身现在还是存在于软件层面，但是以大模型为基础的未来的智能系统，一定会和物理世界存在更多的交互，而这种交互一定是多种模态的，比如需要视觉信号、语言信号、声音信号等。

GPT现在已经有了一定的关于语言和图像联合理解的能力，但是目前来看还远远不够。因为大语言模型更加需要的是一个三维视觉场景内的感知和推理。如果大语言模型只是针对输入的图像和视频，那么其实和人类的通用智能并不能完全走在一起，所以我们更加关注的是，将来的机器人或者说真正的通用智能系统，能够从三维的感知世界中学到一些新的知识，以及如何把这件事情和人类的一些能力进行更好的对齐。大模型需要和物理世界进行更多知识的对齐，甚至是交互。机器人应当利用虚拟世界中大模型得到的一些先验知识和学到的新知识，去解决真正的实际场景中一些实际的新问题。

本文2023年7月6日发表于微信公众号墨子沙龙，风云之声获授权转载。

王历伟

博士毕业于美国伊利诺伊大学香槟分校（UIUC）计算机科学系，目前担任香港中文大学计算机科学与工程学系助理教授，博士生导师。王历伟教授在人工智能语言和视觉多模态领域有着至少十年专注的研究积累。他所建立和带领的香港中文大学人工智能语言和视觉实验室（LaViLab）专注于语言和多模态大模型的前沿研究。王历伟教授从0到1带领商汤研究院自然语言处理团队，打造商汤自研中文语言大模型“商量“（SenseChat），并致力于带领团队探索突破大模型研究和应用的技术边界。

同时，王历伟教授担任过若干人工智能顶级学术会议区域主席（如CVPR等）和人工智能顶级学术期刊IJCV（CCF-A类）编委。在他加入香港中文大学任教之前，拥有丰富的工业界科研经验，曾在腾讯西雅图人工智能实验室担任高级研究员，负责多个语言和多模态研究项目。

特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

北京外国语大学人工智能与人类语言重点实验室正式成立

来源：北京外国语大学在职研究生招生信息网

时间：2020-08-25

2019年12月26日上午，北京外国语大学人工智能与人类语言重点实验室成立大会暨研讨会在行政楼配楼多功能厅隆重举行。

教育部教师工作司司长任友群，北京市委教育工委委员、北京市教委副主任李奕，我校党委书记王定华，党委副书记、校长杨丹，党委常委、副校长袁军、孙有中，科大讯飞股份有限公司执行总裁吴晓如，华为技术有限公司高级副总裁、中国区总裁鲁勇，以及来自北京外国语大学、北京大学、清华大学、北京师范大学、中国传媒大学、哈尔滨工业大学等高校的专家学者出席大会。会议由孙有中主持。教育部原副部长、中国职业技术教育学会会长鲁昕向实验室成立发来贺信，对北京外国语大学人工智能与人类语言重点实验室的成立表示祝贺。贺信指出，北外在人工智能时代，开拓新的研究领域和研究课题，应时应势建立人工智能与人类语言重点实验室，集中学校各学科的科研优势和人才培养力量，聚焦人工智能与语言教育发展中的前沿问题，开展语言学习机理研究，基于人工智能的语言教学研究，多语语料库、多语自然语言处理和外语健脑强智研究，无论是对国家人工智能的发展，还是对我国语言教学与研究的发展，都具有重要价值。

王定华代表学校致辞，向关心和支持北京外国语大学人工智能与人类语言重点实验室的各界朋友表示衷心感谢。他指出，人工智能是新一轮科技革命和产业变革的重要驱动力，必将极大激发教育在促进人类社会进步和人类文明发展中的巨大能量。人工智能与教育的结合势不可挡，人工智能的应用，集中在教育领域，尤其是语言识别和翻译领域。在此背景下，北外成立“人工智能与人类语言重点实验室”可谓应运而生，恰逢其时，既有重要的现实意义，又有长远的历史意义，更体现了北外的使命担当。我们将把握方向，提高站位，深入研究，有所作为。第一，服务国家战略。我国高度重视人工智能与教育的深度融合，近年来，中共中央、国务院、教育部出台了一系列推进人工智能发展，加快人工智能在教育领域应用的规划，提出要利用人工智能技术加快推动人才培养模式、教学方法改革，构建包含智能学习、交互学习的新型教育体系。要加快人工智能在教育领域的创新应用，构建智能化、网络化、个性化、终身化教育体系。北外积极响应国家号召和教育部要求，服务国家战略，精心筹备、认真谋划，经过一年的酝酿和准备，正式成立北京外国语大学人工智能与人类语言重点实验室。第二，发挥北外优势。北外目前获批开设101种外语，涵盖了所有与中国建交国家的官方语言和主要语言，在语言教学和研究方面具有得天独厚的优势，学校注重多学科、多领域的学科建设、人才培养、科学研究，努力做到外语开道、通识跟进、大语做强、中语做优、小语做好、兼容并蓄、博学笃行、服务国家、贡献社会、成就人生、追求卓越、实现一流。在开展人工智能与人类语言研究的过程中，我们要发挥学校的外语优势、多学科优势，利用深厚的语言教学研究的积淀，优秀的信息化外语教学的传统，领先的现代远程外语教育的实践，一流的语料库研究积累，积极做好高校外语慕课联盟，认真总结教育部人工智能助推教师队伍建设的试点经验，不断拓展语言和脑科学研究，使人工智能与人类语言重点实验室在此基础上深化研究、真正发挥作用。第三，聚焦前沿课题。立足新时代，北外有责任和信心抓住人工智能的机遇，积极应对人工智能的挑战。实验室将聚焦相关领域的前沿课题，采取科学方法，探索外语学习的生理机制和内在规律，着力推进多语言脑科学实验研究、大数据驱动的语言智能教学建模和应用研究、跨语言多模态自然语言处理研究、以“健脑强智观”为支撑的人生智力发展研究等。学校将给予实验室更多支持，实验室要把研究做得更加深入，有所发现、有所作为、建功立业。第四，探索崭新机制。本着“开放、协同、智能、一流”的建设原则，依托交叉学科智库，围绕国家科教兴国战略，汇聚海内外贤才，力争成为国内乃至世界领先的人工智能助推语言教育的研究高地。与兄弟院校、科大讯飞、华为集团等共建共享、合作互助。北外创办这个实验室不以营利为目的，以后如有科技成果转化收入，我们会继续用于探索未知、沟通寰宇。同时也希望实验室逐步办好办大办强，成为北外全体师生的科研平台。

任友群对实验室的成立表示祝贺，他指出，教育部人工智能助推教师队伍建设试点工作开展以来，北外积极探索人工智能技术与教育融合的新路径，取得了令人瞩目的进展。实验室的成立体现了北外在信息时代积极开展智慧教育、创新研究的决心和行动，也体现了北外脚踏实地服务国家战略的创新能力和实践能力。希望北外在促进人工智能和教育融合发展，积极探索、勇于尝试，积累更多宝贵的、可推广的先进经验和优秀案例。希望实验室能够取得丰硕的科研成果，为实现我国教育现代化，为实现教育强国的目标添砖加瓦，也为构建人类命运共同体贡献应有的才智和力量。

李奕代表北京市委教育工委、市教委对实验室的成立表示热烈祝贺，他表示，北外凭借深厚的科研积淀和强大的创新能力，成立“人工智能与人类语言实验室”，能够帮助我国实现人工智能在多语言教学研究及应用领域的突破，也必将对北京进一步落实全国科技创新中心定位、构建首都高精尖经济结构、服务国家创新驱动发展战略产生积极的影响。希望北外聚焦人工智能与语言教育发展当中的前沿问题，充分发挥学校在语言学科建设和语言研究方面的一流实力，履行好作为一流高校在新时代的使命和担当，为高水平实现首都教育现代化的2035年的奋斗目标做出做更大的贡献。

中国英汉语比较研究会会长、清华大学教授罗选民表示，语言与科技的碰撞交融由来已久，北外抓住人工智能这个历史性的战略机遇，成立“人工智能与人类语言研究实验室”，聚焦语言与科技融合的尖端领域，与科大讯飞、华为等全球信息科技龙头企业强强联手，广聚贤才，开拓创新，展示了北外人浓烈真挚的家国情怀、放眼未来的远见卓识。

鲁勇在致辞中表示，华为将会携手北京外国语大学，利用双方在语言和人工智能领域的优势进行互补，在三个方面全面加深合作：一是共同推进人工智能创新平台建设，合力打造外语高端人才的培训体系，实现真正的科研创新和高素质人才培养。二是共建智慧校园，打造可视、可控、可管的北外。三是在中国教育现代化2035的政策指导下，共同打造人工智能加教育的新模式。

随后，任友群、李奕、王定华、杨丹、吴晓如、鲁勇通过电子屏幕摁下启动按钮，共同为研究院揭牌，标志着北京外国语大学人工智能与人类语言重点实验室正式成立。

实验室聘请了国内外知名专家学者担任实验室学术委员会成员，为实验室建设提供学术指导。

王定华为实验室首席专家顾曰国教授以及实验室顾问颁发聘书。杨丹为实验室学术委员会主任孙有中教授，学术委员会委员王定华教授、袁军教授、刘挺教授、罗选民教授、袁毓林教授、杨亦鸣教授、尧德中教授、张积家教授、王文斌教授颁发聘书。袁军为学术委员会委员韩家勋教授、李佐文教授、王小捷教授、余胜泉教授、范琳教授、唐锦兰教授、许家金教授等颁发聘书。

成立大会上，我校与华为技术有限公司、科大讯飞股份有限公司举行战略合作伙伴协议签约仪式。孙有中分别与华为技术有限公司北京代表处总经理刘阳，科大讯飞股份有限公司执行总裁吴晓如签署合作协议。

吴晓如作为企业界代表致辞发言，他表示，自然语言处理一直被认为是人工智能皇冠上的明珠，实验室的成立对于推动人工智能和语言融合性的发展具有非常重要的意义。科大讯飞成立20年来，在智能语言和人工智能技术上取得一些进展，本次与北外的合作将聚焦于语言和语言技术的研究，能够让大家更好的通过语言进行交流沟通。

开幕式结束后，实验室首席专家，中国社会科学院创新工程首席研究员顾曰国进行工作汇报，从实验室宏观学术环境，人工智能与人类语言的北外视角，实验室性质、宗旨、目标与方法论，实验室组织架构，实验室特色研究五个部分进行了详细的工作汇报。他表示，实验室的顶层定位是“人类语言+AI”，使命为“阐释自然智能，驾驭人工智能，解码语言奥秘，成就智慧人生”，宗旨为“服务于国家政治、经济、教育、医疗卫生等发展的战略需要”。

北京大学信息科学技术学院黄铁军教授，我校许国璋语言高等研究院院长文秋芳教授，北京大学中文系教授、长江学者特聘教授袁毓林，哈尔滨工业大学人工智能研究院副院长，国家“万人计划”科技创新领军人才刘挺教授，北京师范大学未来教育高精尖创新中心执行主任余胜泉教授分别发言，表达了对人工智能领域学术研究的看法。我校各职能部处、各学院、各研究机构的负责同志参加了成立大会。

当天下午，实验室专题研讨会在行政楼504会议室举行。与会专家学者围绕实验室的下一步发展进行了充分研讨，为实验室的发展提出了富有建设性的意见与建议。

实验室的成立受到社会各界的广泛关注，人民日报、光明日报、科技日报、中国青年报、新华社经济参考报、中国教育电视台、国际商报、人民网、人民日报海外网、新华网、央广网、中国新闻网、国际在线、环球网等多家媒体对大会进行了报道。

上一篇：第十届“国际儒学与中华文化师资班”开班式在京举行

下一篇：北京外国语大学召开“不忘初心、牢记使命”主题教育总结大会