APP下载

历史文化文本翻译记忆库建设研究
——浙江文化走出去之良渚文化综论英译为例

2021-11-12祝晓东

散文百家 2021年6期
关键词:源语言良渚语料库

王 璟 祝晓东

浙江外国语学院;宁波城市职业技术学院

鉴于良渚文化之于中华文明的重要性,中国政府正式推荐“良渚古城遗址”作为2019年世界文化遗产申报项目,并在同年7月6日正式成功通过立项。这意味着良渚文化在世界的影响会越来越大,浙江省文化厅的浙江文化工程项目专门重点规划了一系列良渚文化丛书的外译计划,原著《神巫的世界:良渚文化综论》是该系列丛书中最具特色的代表之一,本书从考古案例回顾了良渚文化发现与研究的历史,同时通过对玉器反映的精神内涵解读巫术在当时社会的巨大影响力。随着浙江文化走向世界活动的不断开展,越来越多的良渚文化相关作品需要向世界宣传,翻译质量上也会有更高要求。

一、研究目标

在当前大数据人工智能时代,大量信息化技术手段已经开始应用到翻译领域。其中最具有代表性的是机器翻译和计算机记忆翻译技术。翻译记忆工具可以让译者循环利用以前的译文来提高翻译工作效率和保证翻译的一致性。然而,如果对一个翻译项目是由若干名各自独立的译者共同合作完成,记忆翻译工具也不能完全保证翻译的一致性(不同的译者使用各种的本地翻译记忆库),这些译者使用的翻译记忆库,可能会被不定时地更新或扩充,不能保证数据的一致性。本研究的目标之一是以一个具体项目为例,介绍翻译记忆库和语料库的建设过程;另一目标是讨论一种以集成管理的模式对记忆库进行管理的系统,该系统可以使每个用户都使用同步一致的实时更新的翻译记忆库数据。

二、翻译质量的控制

1.当前面临的问题。

翻译质量问题通常是关于翻译的准确性和一致性的问题。质量问题可以细分为三种:翻译错误、疏忽错误和翻译一致性错误。翻译错误往往是由于译者缺乏相关历史背景知识造成的。翻译疏忽错误通常发生在语法、拼写、格式等处,尤其是数字、天数、月数、年数、日期、钱数量等等。有时还会出现漏译某段文本,这属于另外一种疏忽错误(可以借助常用的双语对齐软件进行检查)。历史文化作品中翻译的不一致性也是一种比较常见的错误。对于历史事件的解释一定要严谨,同样的意思应该用相同的词来表达和描述。当同一系列作品包含一个历史事件时,对该历史事件的描述是通过一部作品内部以及多部作品之间的方式错综复杂地联系在一起。要正确认识和翻译每一条语句,考虑一部作品和系列丛书的相关性,确保翻译的一致性。不一致必然会妨碍读者对内容的正确理解。一致性问题同时也会影响翻译工作的效率。译者参照以前的译文时,从许多不同的相关翻译中选择最佳的翻译是非常困难和费时的。

2.翻译记忆技术。

在互联网+时代,各种信息化技术逐渐应用到翻译过程中,其中最有代表性的技术就是机器翻译和翻译记忆技术。翻译记忆与机器翻译经常被混为一谈,但是这是两种不同的技术。机器翻译是一种计算机完成的自动翻译,是一种正在不断发展的技术,译文质量方面还有许多需要改进之处。在大多数情况下,应用机器翻译出来的文本需要进行人工译后编辑,全面自动化和高质量的机器翻译还没有达到广泛应用的程度。

翻译记忆技术的核心是一个由源语言文本和目标语言文本组成的数据库.数据以许多条语言对(源语言-对应目标语译文)的形式组成,这些文本数据都是来自于以往翻译过的文本资源。翻译记忆库是通过将源语言文本和目标语言文本分割成片段(通常是句子)来创建的。源语言片段和对应的目标语言片段组成一对一的语句对存储在数据库中。数据以TMX3格式(一种开放的针对翻译记忆数据的XML标准)或其他格式存储。如新的源语言片段与过去翻译过的语言片段相同或类似度较高(可以设定阈值),此时计算机辅助翻译工具将从数据库中检索出对应的目标语片段提供给译者参考和选用。

3.建立翻译记忆库实例。

下面以《神巫的世界:良渚文化综论》英译过程中建设翻译记忆库和双语平行语料库为例,描述建立翻译记忆库的核心工作过程。通常翻译记忆库可以被视为一种简单和初级的双语平行语料库,本项目在进行过程中与汉学专家(母语为目标语的)合作,尽可能获得恰当、正确的译文,生成准确的翻译记忆库和术语库,再对翻译记忆库进行深加工,建设高质量的小型良渚文化双语平行语料库。

传统的双语平行语料库的建设往往是针对某一主题,收集筛选译本、双语语料对齐,建立双语平行语料库。翻译实践时,将已对齐的语料库直接导入翻译记忆库,即可辅助翻译。而本研究的工作与之不同,首先在翻译过程中制作高质量的目标语译文,生成翻译记忆库(即初级双语平行语料库),根据该初级双语平行语料库可以再进一步进行深加工,进行分词、分句、分段和标注等深加工,最后生成具有更多用途的双语平行语料库。

(1)第三阶段,翻译、生成翻译记忆库。翻译记忆库建设是从无到有,规模逐渐增长的过程。在这一阶段的翻译过程中,会不断遇到新的源语言文本,产生新的目标语译文,这些语言对将同步存入翻译记忆库,如果遇到重复原语言或者需要修改译文的情况,新的译文将覆盖原记忆库里的数据。整个更新过程由软件自动完成。完成了所有双语语言对的对齐,确保没有出现漏译,翻译记忆库生成工作便基本完成。

(2)第四阶段,对翻译记忆库进行标注,生成双语平行语料库。利用工具软件配合人工对词性进行标注,由于目前还没有对句子进行标注的成熟软件,句法标注基本上还是由人工完成。完成语料标注后,双语平行语料库进入测试和评估,这一系列工作完成后,基础良渚历史文化双语平行语料库的建设基本完成。

后续研究主要包括该语料库的维护和语料库的层次多样化提升和应用工作。

三、集中式翻译记忆系统关键环节

1.系统基本目标。

集中式管理方式的翻译记忆库系统,可以通过互联网免费提供翻译记忆数据,所有译员都可以访问系统中的数据库,并且能够下载CSV或TMX格式的翻译记忆数据,利用翻译记忆工具辅助翻译,该系统还应该具有较强的搜索功能和参考功能。

2.数据库的数据类型。

在数据库中,每条记录由源语言片段、对应的目标语言译文片段和其他元信息(如标题、文章编号等)组成。数据库由S=M+N个记录组成,其中M代表的是语言对(源语言-目标语)片段数量,N代表的是源语言片段数量,其中M>N,意味着对于相同的源语言片段可能有几种不同的翻译目标语片段与之对应,不同的语境对应不同的译文表达形式。

3.集中式翻译记忆数据库的升级。

任何数据都具有时效性,随着时间推移,会有新的文献数据要添加到数据库中或对数据库进行修改,因此集中翻译记忆每间隔一段时间都要进行更新升级。为了编辑集中记忆数据库中的语句片段,就需要编辑相对应的XML文件。随着翻译过程的进展,需要添加新的语言对数据到集中翻译记忆库,或添加新的附加基础数据,源语言片段和目标语言片段对应的XML文件必须要拷贝到指定的目录,以供译者检索和下载。更新集中记忆库的所有工作,从技术角度来看,就是对其数据进行更新,确保用户同步使用最新的数据。用户可以将翻译记忆数据下载保存为CSV格式或TMX格式,主流翻译记忆工具软件都可以使用这些格式的文件。当修改或扩展数据库内容时,这些更改将立即反映在可供下载对应的目录下,所有用户都可以定期从系统进行下载,获得最新的翻译记忆数据库数据。各个用户定期向数据库管理人员提交本地翻译记忆库更新内容,由管理员进行审核和更新集中记忆库供译员共享,具体更新周期可以根据时间各个译员提交数据更新数量的情况而确定。

4.系统的搜索功能。

用户能够直接通过浏览器搜索集中翻译记忆库中的内容。系统允许翻译记忆库中的数据被下载,供翻译记忆软件使用,例如SDLTrados等软件。然而不是所有的译员正好都有翻译记忆工具软件或懂得如何使用这些软件。而且,使用翻译记忆工具搜索相似句子,需要建立项目,打开文件进行翻译,设置语言对,选择和导入翻译记忆数据库等工作,这一系列操作会很耽误时间。系统需要具有能够为所有的用户提供简捷、快速和直接的搜索集中翻译记忆库的功能。这意味着用户可以不借助任何工具,仅仅依靠互联网就可以直接使用集中翻译记忆库。集中翻译记忆数据库系统必须提供三种搜索方式:句子、关键词和规则表达式,其中按句子搜索是最常用且和最有效的方法。按句子搜索模式工作时,系统按用户提供的搜索语言片段进行搜索,最终提供一个模糊搜索结果的列表清单(所有高于设定的相似度阈值的语言片段),每个选项包括源语言片段和目标语言片段,供用户选择使用。搜索结果界面中包括用户给出的关键搜索片段、搜索到的(源语言片段-目标语言片段)语句对、相关参考信息(数据出处和来源)以及关键搜索片段与结果的相似度估计等。

关键搜索语句片段与翻译记忆数据库中语言片段的相似度估计值通常是根据字符编辑距离进行计算的,统计最小编辑距离。所谓编辑距离是指从一个字符串转变成为另外一个字符串所需要进行的编辑次数(插入、删除和替换)。字符串编辑距离是当前估计字符串相似度的主流算法之一。在按关键字进行搜索时,系统将显示源段列表,其中包含与相应目标段配对的指定关键字。还可以对系统提供其他对集中翻译记忆库检索的方式,用户还可以通过正则表达式搜索以指定要检索的源文本的模式匹配等。

四、总结和展望

翻译的一致性问题一直备受翻译界的关注,尤其是对于术语准确性和一致性要求很高的学术文章。本文讨论了利用翻译记忆数据库系统有效解决历史文化文本翻译中的不一致性问题。并且列举了实例,描述了翻译记忆库建立的一般过程。集中式翻译记忆数据库是一种新型的、可以帮助多人合作项目的、解决一致性问题的技术。以集中管理模式进行数据管理,翻译记忆数据库可以被所有翻译人员共享。历史文化文献通常都是按照某种格式起草的,句子的重复率很高,计算机辅助翻译在这个领域有广阔的应用前景。

猜你喜欢

源语言良渚语料库
5000年前的“良渚人”爱吃什么肉
良渚保护大事记
《语料库翻译文体学》评介
“玉”见良渚
林巍《知识与智慧》英译分析
浅析日语口译译员素质
跨文化视角下对具有修辞手法谚语英译汉的研究
以口译实例谈双语知识的必要性
基于JAVAEE的维吾尔中介语语料库开发与实现
语料库语言学未来发展趋势