谈格式化在翻译及本地化中的重要意义
2012-08-15付强
付 强
曲阜师范大学外语教研部 山东 曲阜 273165
0 引言
译者翻译的往往是文件,而不只是文本。也就是说,译者收到的不是TXT格式的文件,而是具有一定格式的文本,是用户可读的数据以及机器可读的代码。由于译者所翻译的文件大多采用Word格式,所以人们通常认为格式化与翻译无关。作为计算机用户,译者并不需要“读”代码来理解文本,但这并不意味着译者不需要关注代码。事实上,了解文件与格式化之间的关系是很有必要的。数字化时代带来了可处理翻译的现代技术,主要是翻译记忆(TM),但同时也带来了格式化问题。基于翻译记忆的文本再利用(text reuse)会产生很高的翻译效益,但处理格式化问题所花费的时间往往会将该效益抵消。
对于从事本地化工作的译者而言,格式化显然是其工作的一部分,但格式化问题并未得到应有的重视。目前开设的各种辅助翻译课程模块往往更多地强调技术方案学习,且这些方案通常认为格式化问题只是计算机软件、翻译记忆或本地化工具应注意的事项。Bowker(2002:37-39,118-119)和Somers(2003:18-19)只是简单地提及格式化问题。尽管一些文献(Reynolds&Jewtushenko,2005)指出了格式化的重要性,但格式化问题在译者培训中基本仍是空白。
译者关注的核心问题是文本而并非格式。但是,格式化仍是译者工作的一部分,目前的技术还不能很好地将文件中的文本与格式分开。在实现完全XML方案之前,数字化时代的格式化问题仍相当重要。
1 翻译行业特点及格式化趋势
在翻译行业中,译者的薪水通常不是年薪或月薪,特别是自由译者,其薪水是按翻译工作量(字数)结算的。 如Chesterman& Wagner(2002:1)所言,译者工作在“文字层面”,要拿出“翻译文字量”。翻译行业的入职门槛较低,受过双语教育的人经过一定时间的训练和指导大都可以成为一名译者,但只有能够快速翻译的人才可将翻译作为职业。
本地化及翻译行业通常需要译者高质量快速完成大量的翻译任务。据统计,2005年世界翻译市场的规模达到227亿美元,其中中国大陆地区翻译市场的产值为210亿元人民币,而2007年中国的翻译市场产值更达到300亿元 (黄友义,2010:49)。如个体译者一样,翻译公司也是按照其提交给客户的翻译字数收费,只有提高生产率才能增加效益。随着计算机技术的发展,人们开始采用数字化的翻译工具提高翻译生产力,最常用则是利用翻译记忆工具对文本进行翻译,并利用本地化工具对程序文件中嵌入的短字符串进行翻译,通过再利用已有的翻译文本及其格式获得生产力。事实上,格式再利用所得效益可能要大于文字再利用所得效益,而对格式化的研究却并未得到人们的重视。
就本地化而言,其涉及到项目经理、平面设计师、软件工程师和其他转换、质量保证、桌面出版调整和测试等人员(Esselink,1998:258-273),而译者的作用则仅限于自然语言字符串的替换,翻译也许仅仅占本地化工作量的30%左右。但是,与这些自然语言字符串的格式相关的任务往往是非常巨大的。具有讽刺意味的是,在翻译研究试图突破数十年处于主导地位的等价模式之际,本地化行业及以市场为导向的翻译理论研究却朝着相反的方向发展,在国际化的驱动下,将翻译规定性地限定为受控等价 (controlled equivalance)(Pym,2004:62-65),从而使译者增加了额外的负担。
译者通常有两种方法可对格式进行处理。方法之一是覆盖文件,但如果译者没有原始文件的创建程序且不了解该程序,这种方法是难以实施的。即使翻译的文件比较简单,将其文本与代码分开也不是一件容易的事,覆盖也不能实现已翻译文本的再利用。另一种方法则比较有意义,即利用翻译记忆工具,在大多本地化项目中译者被迫采用这种工具。尽管如此,仍有很多格式问题在翻译记忆工具中尚未得到解决。译者在使用这些工具时会遇到很多的格式问题,技术性越强,处理的格式问题就越多。
精确地衡量译者在格式问题处理中所使用的时间和精力是比较困难的。作为一名译者,笔者根据自己的经验可以猜测,文字再利用所节省的时间和精力会因处理格式而抵消。本文将通过讨论当前技术的限制性来验证这一假说。
2 辅助翻译工具的功能限制
从理论上讲,翻译记忆工具和本地化工具都是在翻译之前将文本与代码分开,然后再将译文文本与源代码合并,从而实现格式再利用。在翻译过程中,利用已翻译句子和术语库中的术语就可再利用文本。但是,只有重复的内容可为译者提供帮助,译者可将精力用于更具挑战性的文本,但译者仍无法逃避格式问题。
格式和代码处理应是计算机工程师或桌面出版商的核心工作。当译者对文本进行再利用时,他们往往也不得不对格式进行处理。首先,翻译记忆库采用的是专有格式,不允许与其他翻译记忆库进行动态数据交换,而译者为不同的语言服务商工作时往往需要进行这种数据交换。其次,由于这些句段的数据库也保持着内联格式(文本流内的格式,不是结构格式),文本和格式都正确的句段比只有文本正确的句段更好匹配。
事实上,最终客户、语言服务商、译者和翻译记忆工具之间的纯文本交换并不困难,比较困难的是对包含内联格式和元数据信息的文本进行处理。从二十世纪九十年代后期开始,Trados所采用的格式在该行业中已成为事实上的标准,大多数开发商试图通过与Trados兼容来解决格式问题。当翻译记忆交换(TMX)标准出现时,开发商都声称符合TMX标准。但是,与Trados相兼容的各软件之间翻译记忆数据的交换过程并不十分完美,甚至支持最新1.4b版本标准的TMX认证产品之间的交换也不完美。事实上,开发商自己也希望在记忆数据交换过程中减少关键数据的丢失。
从文本再利用到格式再利用,问题也会随之增多。将文件导入任何翻译工具时都需要经过一个过滤器,将原始文件转换为翻译编辑器可读取的格式。创建这些过滤器以及对过滤器进行定期升级维护对开发商而言都是资源浪费。这些问题表明,将导出文件时转换为其原生格式是有必要的。
我们还必须考虑隐错的可能性 (在文件中、过滤器中、编辑器中),具体格式的困难(MIF文件、资源文件),以及后台运行硬件/软件的可能干扰。在翻译中还有文本扩展问题,这往往需要译后调整,特别是针对DTP文件。
理论上讲,译者和翻译项目经理比较了解这些翻译工具的使用情况。真正的困难往往在于出现格式问题时,译者和经理要有能力解决这些问题。为此需要考虑额外的预算和时间,这有可能会抵消文本再利用所得到的效益。
3 开放标准的优越性
格式问题是技术性的,其解决方案也应是技术性的。通过TMX等一系列开放标准,格式问题将逐渐得以解决。在XML技术出现之后,可对文本再利用进行标准化,因为可以适当地设计XML,从而将文件的内容与形式分开。
本地化行业标准协会(LISA)于1997年成立了一个专门机构,开发文本再利用标准,该机构被授权制定形式/内容再利用开放标准(OSCAR)。TMX是出现的第一个此类标准,1.0版本于1997年12月发布,最新的1.4b版本于2004年10月发布,1.4b版本支持格式和元数据交换。主流的翻译记忆工具几乎都与1.4b标准兼容。同时开发了术语库交换标准(TBX),以满足语言服务商及各种工具之间术语交换的需求。随后开发了断句规则交换标准(SRX),以实现完美的TMX交换。所以这些OSCAR标准都可处理文本再利用,而这些标准的最大优势则在于格式重复利用。2000年开发的一个新标准就是被人所熟知的XLIFF(XML本地化交换文件格式),该标准已被结构化信息标准促进组织(OASIS)所接受。1.1版的XLIFF标准已于2003年初成为OASIS规范。
XLIFF标准用于可译或本地化文本在不同文件格式之间的交换。采用XLIFF格式,内容就可在翻译进程中自由交换,而不受其原生文件格式的影响,也不受所使用翻译记忆工具或本地化工具的影响。XLIFF转换工具将结构格式变成一个框架文件,然后将原文和译文的内容及其内嵌的格式断句分成翻译单元。翻译时,XLIFF文件与框架重新合并,以再利用格式。
尽管XLIFF格式中的翻译单元是双语,但可以在一个文件中捆绑数个文件来处理多语项目。XLIFF格式不仅仅是与其他文件格式的简单接口,它还允许可译文本的最小离散单元句段保存在翻译记忆数据库中循环使用,形成复杂的元数据。该元数据可用来跟踪每一句段的原始版本,并跟踪句段所处的工作流程阶段,包括数据、作业标识、客户、译者/译审、备注信息等。XML标准还可进一步扩展,以满足未来的需求(Reynolds&Jewtushenko,2005)。
采用XLIFF格式对本地化行业益处颇多。复杂的项目可能要处理三十多个不同类型的文件,从EXE和DLL编程文件到HTML和XML及其衍生文件,以内容为导向和以设计为导向的DTP程序所生成的格式,以及不同的Microsoft Office应用程序。一旦采用了该标准,则不必为每一种文件格式以及翻译记忆工具之间交换的数据创建多种过滤器,软件开发人员仅需为每一种文件格式开发一种过滤器,从而允许开发商转移资源并精简算法,使译文可全面简单地被再利用。
在XLIFF环境中,客户可只将可译文本传递给语言服务商,而保留具有商业敏感性的代码。在将XLIFF文件转换为其原生格式的过程中仅仅需要对其翻译记忆进行更新。同时,不必再限定于一个特定的语言服务商或某一特定的翻译工具。对于语言服务商,尤其是高端的多语种服务商,XLIFF标准则意味着节省管理、设计和DTP成本,而不必将其语言资产限定于一种特定的翻译记忆工具。对于译者,XLIFF标准则意味着他们将能够重新将精力集中在文本方面,而不需过多地关注格式问题,因为文本翻译才是他们的核心工作。在前数字时代,译者所需要做的仅仅是文本翻译,而XLIFF标准则将前数字化时代的优势与数字时代的优势结合在了一起。同时,译者也不需要被限定于使用某一种特定的工具,摆脱任何第三方的信息,译者只需拥有并使用任何一种可兼容XLIFF的工具。
4 结语
XLIFF对本地化行业而言就如同Unicode一样重要。Unicode可进行多种语言写入,XLIFF则可在不同语言、不同本地化工具之间将该书写文本进行传递,采用XLIFF可极大地促进脱离客户管理系统的本地化过程。
但是,XLIFF标准的发展需要一个长期的过程。目前,其他多种格式和过滤器仍并存使用,一些所谓符合XLIFF标准的工具也存在这些问题,使得所生成的代码并不易于交换。XLIFF标准已经进入翻译与本地化行业,并已在本地化工具(Catalyst,Passolo,WinRC等)和翻译记忆工具(Trados,Heartsome等)中采用,新开发的翻译记忆工具及本地化工具大都接受并已采用XLIFF标准。事实上,可以在一个完全XML方案中,采用更先进的XLIFF标准,实现从文本创作到本地化、出版和归档的全过程的无缝隙管理,从而使整个过程都处于项目经理的监督之下。
[1]Bowker,L.Computer-Aided Translation Technology:A Practical Introduction [M].Ottawa:University of Ottawa Press,2002.
[2]Chesterman,A.& Wagner,E.Can Theory Help Translators[M].Manchester:St Jerome Publishing,2002.
[3]Esselink,B.A Practical Guide to Software Localisation[M].Amsterdam & Philadelphia:John Benjamins,1998.
[4]Pym,A.The Moving Text.Localization,Translation,and Distribution [M].Amsterdam and Philadelphia:John Benjamins,2004.
[5]Reynolds,P.& Jewtushenko,T.What Is XLIFF and Why Should I Use It? [J].XML Journal,2005 (04).
[6]Somers,H.Computers and Translation:A translator’s Guide [M].Amsterdam/Philadelphia:John Benjamins,2003.
[7]黄友义.翻译硕士专业学位教育的发展趋势与要求[J].中国翻译,2010,(1).