人工智能翻译下的大数据语料库建设 人工智能语料库建立的意义
人工智能翻译下的大数据语料库建设
人工智能翻译下的大数据语料库建设*陆艳渊上海立信会计金融学院外国语学院袁上海201620冤摘要院机器翻译的质量依赖可供其学习的语料袁随着人工智能的发展袁语料库数据的建设成为实现翻译智能化和场景化的关键遥人工智能翻译下大数据语料来源众多袁互联网尧企业数据库袁用户生成内容和机器生成内容都将成为语料数据的来源曰其类型也呈现出多样性特征袁从传统的术语尧文本尧拓展到非结构化数据和知识图谱遥鉴于此袁人工智能翻译下的大数据语料库建设可以从基于第三方开源数据尧众包翻译的共享模式尧基于机器闭环学习模式和人机协同模式四个方面进行袁未来的翻译教学也可依托语料库的建设成为翻译智能化中的重要一环遥关键词院人工智能曰翻译语料库曰翻译教学中图分类号院H059曰TP181概述大数据技术的发展袁使得机器翻译进入到了神经网络的智能翻译阶段袁随着相应的人工智能技术渊ArtificialIntelligence袁AI冤的突破和发展袁基于人工智能的机器翻译成为了近年来的热点遥利用人工智能技术袁机器翻译的错误可以减少大约60%[1]袁提高了翻译的准确率遥微软尧谷歌尧百度以及科大讯飞等公司纷纷推出了基于人工智能的在线翻译系统袁在信息技术驱动下袁许多语言服务企业也提出了基于大数据与人工智能的发展思路[2]遥然而袁尽管基于神经网络的机器翻译取得很大的进步袁但是机器翻译在涉及语义深层结构尧不同文体风格尧语言风格以及语篇层面等方面袁还是欠缺很多[3]袁尤其是语义链接[4]袁这就意味着语料库的建设依然是人工智能翻译发展一个非常重要的基础遥通过将语料库视为一个知识库袁让计算机从中学习各种知识袁或者将语料库看成无穷的尧持续生成的文本集合的抽样代表袁研究语言自动化处理问题是人工智能下机器翻译的主要方法遥以自适应学习能力和巨型容量语料库为基础的机器翻译将成为语言服务的主体[5]遥经过多年的发展袁我国已经形成了野中国英汉平行语料库冶尧中国语言资源联盟等多个语料库袁在翻译教学中得到了广泛的应用袁基于语料库的翻译研究和翻译实践得到了开展袁形成了独立的野语料库翻译学冶[6]遥在大数据背景下袁在更大规模电子语料这一基本前提下袁语料库通过充分记录语言结构和功能特征袁基于关联数据模型袁整合结构尧语义尧语境变量尧语言类型学属性袁进入了3.0时代[7]袁但是大数据下语料库的构成要素有哪些特点袁语料库和人工智能翻译的关系呈现怎样的特点钥如何展开语料库的建设钥这些研究还尚未涉及袁同时直接为翻译教学服务的平行语料库的建库工作也尚未有效展开[8]袁因此如何建设大数据下的语料库并与翻译实践和教学结合起来袁成为了一个重要的问题遥本文将旨在通过对人工智能翻译下的大数据语料的特点分析入手袁提出大数据语料库的构建思路袁并对翻译教学改革如何融入大数据人工智能时代提供建议遥2AI下的翻译要素大数据时代袁随着人工智能技术的出现和发展袁翻译技术得到了迅速的发展袁成为翻译界的新宠袁对翻译产业产生了重要的影响袁也对语料库的建设提出了新的要求遥图1AI下的翻译
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。