基于计算机辅助翻译工具memoQ2015的语料库建设及应用研究
2018-01-08刘晓婷
摘 要:近年来,在信息化大数据的时代背景下,CAT工具已成为译者的必备工具。自语料库引入翻译研究以来,也成为译者的重要参考工具,帮助译者提高了翻译质量和效率。本文介绍了基于计算机辅助翻译工具memoQ2015进行语料库建设和应用的方法,为译者提供了借助语料库进行翻译的工具和方法。
关键词:语料库 计算机辅助翻译 翻译质量和效率
一、基于语料库的翻译研究
语料库(Corpus)的实质是科学取样加工的大规模电子文本库,它具备三大特点:(1)语料库中存放的是在语言实际使用中真实出现的语言材料;(2)语料库是承载语言知识的基础资源,但并不是语言知识;(3)真实语料需要经过加工才能成为有用资源。
语料库翻译(Corpus-based translation studies)自诞生以来,就已广泛应用于翻译研究,为译者提供了研究思路和工具。“翻译研究除需要‘双语对照语料库之外,还要有‘双语平行语料库和‘单语比较语料库”。(Lynne Bowker等,2007 X)如今,基于语料库的翻译研究已成为描述翻译研究的新型研究范式,在理论和应用层面都对翻译研究作用巨大。“基于语料库的翻译研究能使我们简洁、有效地进行编码,能使我们查询并获得大量数据”。(Tymoczko,1998,1)。[1]
二、语料库的建立
目前,世界上有许多通用的语料库可供译者或研究人员使用。
但在翻译中,译者会发现既有语料库未必能满足需求,或尚未有相关题材的语料库可使用。此时,译者可以根据自己的需求自建双语语料库提高翻译质量和效率。本文根据译者的翻译项目为例,介绍语料库建设及其在翻译工具memoQ2015中的应用。[2]
1.语言资料的准备
译者进行的翻译项目需要建立与“一带一路”相关的语料库。
语言材料的搜集可通过网络进行,例如,搜集整理近年来国家关于“一带一路”的双语报道,可参考“中国一带一路网”上的报道等,将材料搜集整理下来后以电子文稿的形式存储。语言材料可使用双语文档(中英文本储存在两个文档),亦可用单语文档(中英文本储存在同一文档)储存。下一部分所介绍的Tmxmall在线对齐功能可进行双语文档和单语文档对齐。[3]
2.利用Tmxmall进行语料对齐
文档对齐可以实现语言材料的句句对齐或段段对齐,虽然该对齐可以靠手工调整实现,但利用对齐工具可以快速、高效地实现对齐。
如图1所示Tmxmall双语文档对齐界面,在下图所示的文件夹
位置点击并选择上传文档。上传完成后,如下图2所示。此时,检查
一下两个文档中的段落数量是否一致,如不一致,需要手动将段落数量调整一致,可使用图2界面中的“合并”、“拆分”功能键。此时不需查看段落内容是否对应,确保段落数量相同即可。段落数量调整后,则选择图2的“对齐”按键进行对齐。
对齐完成后,需要检查对齐效果是否理想。对齐过程并非完全正确,因而还需译者检查,对于出错的地方可以采用“合并”、“拆分”、“删除”、“插入”和“上/下移”等功能键调整。对齐完成后的界面如下图3所示。可以看到,对齐后的文档既可是句句对齐,也可是段落对齐。
对齐完成后的文本,需要“导出”为合适的格式,用作在memoQ2015中建立语料库的文本资料。选择“导出”后,可以看到Tmxmall给出了不同的导出格式,此时选择语料库常用的TMX格式。大部分计算机辅助翻译软件都支持导入TMX文件;如有其他需要,可以根据自身需求导出其他格式。文件导出后,存储在文件夹中待用。[4]
3.在memoQ中建立语料库
在先前的步骤中,我们已经准备好了语言材料,下面我们需要
在计算机辅助翻译软件memoQ2015中建立语料库,将其作为载体,用于承载处理后的语言材料。
运行memoQ2015,打开需要翻译的翻译项目可以看到,左侧选
项栏中有“LiveDocs”(语料库)选项,这就是我们需要使用的功能。点击“LiveDocs”,如下图4所示。
在图4所示界面上方选项栏中选择“Creat/Use New”,新建语料库,并根据自身需求命名;语料库建立后,在上方选项栏中找到“Import Document”,导入处理好的TMX文本。导入完成后,确保勾选语料库前的选择框,保证所建语料库能在数据检索中起作用。
三、语料库在memoQ2015中的应用及数据检索
以上过程完成后,在真正的翻译实践过程中,译者可能会遇到拿不准的术语等,尤其是对于专业领域的术语来说,往往需要查询资料才能确定某个词汇的译法。借助语料库,译者可以快速查询某个词汇的表达,从而帮助自己提高翻译质量和效率。
在使用memoQ2015进行翻译时,译者会遇到某个不确定译法的词汇,这时就可以使用先前建立的语料库进行数据检索,查看语料库中是否存有该词汇,并查询译法。
如下图5所示,第223个句段出现了“政治互信”一词,但译者不明确其译法,此时,译者可以用鼠标选定该词,并按“Ctrl+K”调出数据检索框,点击右侧“Concordance”开始检索。如下图所示,我们可以看到,软件用时0.03秒便检索出了10条结果。检索速度比查询纸质材料或在Word文档中使用“查找”功能快很多。此时,譯者可以查看数据检索给出的结果,选择符合语境的合适译法即可。
又例如,译者在检索“利益共同体”一词时,用时0.04秒,检索得到5条结果。由于建立的语料库相对较小,因而检索结果较少,在语料库足够大的情况下,可以得到更多、更精确的检索结果。
通过使用自建语料库可以发现,软件能够帮助译者在极短时间内快速完成数据检索,大大减少查询时间。但需要注意的是,语料库中所使用的材料须是权威材料,如此才能保证检索结果的可靠性。
相对于几万甚至十几万字词的翻译项目来说,借助语料库,可以帮助译员快速实现语言资源的检索;同时,这些语言材料是可以不断重复使用的;当然,也可以在使用过程中根据需求进行增删,建立更加完善的语料库。根据语料库数据检索所用的时间来看,只需不到1秒(语料库较大时,耗时也会较多)的时间,我们就可以获得多个相关结果,这种效率对于大型翻译项目而言无疑是十分节省时间的。因而,我们可以看到借助语料库,可以有效地帮助译员提高翻译质量和效率。[5]
参考文献
[1] Bowker,Lynne. Unity Diversity? Current Trends in Translation Studies[C]. Beijing Foreign Language Teaching and Research Press,2007.x.
[2] Tymoczko,M. Computerized corpora and the future of translation studies[J]. Meta,XL[j],1998,4.1-8.
[3] 王克非. 新型双语对应语料库的设计与构建[J]. 中国翻译,2004,(6):73-75.
[4] 胡开宝,毛鹏飞. 国外语料库翻译学研究述评[J]. 当代语言学,2012,14(04):380-395+437-438.
[5] 杨梅,白楠. 国内语料库翻译研究现状调查——基于国内学术期刊的数据分析(1993-2009)[J]. 中国翻译,2010,31(06):46-50.
作者简介
刘晓婷(1992-),女,民族:汉,籍贯:山东省济南市。学历:硕士,单位:山东师范大学,单位省市:山东省,研究方向:计算机辅助翻译,翻译学,英语笔译。endprint