APP下载

Déjà Vu 和YiCAT 两款主流CAT 软件功能对比与评价

2022-07-11王琴周兴华

电子技术与软件工程 2022年3期
关键词:句段译员项目经理

王琴 周兴华

(1.山西工商学院 山西省太原市 030006 2.南开大学外国语学院 天津市 300071)

人工智能时代,智能语音识别、神经网络机器翻译、AI智能填充标记、AI 智能术语干预、云翻译、网络协同翻译等技术方兴未艾。“技术”已经成为引发社会变革最具活力的因子之一,正在改变着语言服务的面貌。随着翻译项目语种增多、规模增大,译者借助翻译技术提升翻译效率和翻译质量已经成为新常态。

琳琅满目的计算机辅助翻译软件或平台各有所长,差异明显,为现代译者提供了多元选择。限于实际条件,一些单机版CAT 软件和免费在线翻译平台目前仍是不少译员使用的主要工具。如何借助这些软件或平台完成翻译工作以及不同CAT 工具在功能和用户友好性方面的差异成为困扰许多新译员的实际问题。目前,针对CAT 软件功能的对比研究成果丰硕,其中不少学者探讨了SDL Trados、Déjà Vu、memoQ、Wordfast、雅信、译马网等国内外常用CAT 软件在术语管理功能、翻译记忆库功能、对齐功能以及项目管理功能、协作翻译功能等方面的异同。但是对于国内YiCAT云翻译平台却鲜有涉及,缺乏系统、深入的分析和评介。

本文选取Déjà Vu X3 单机版软件和云翻译平台YiCAT作为研究对象,以一份英语文档协作翻译为例,结合具体工作流程,从核心功能和用户体验两方面入手,对比这两款工具的操作流程、核心功能及其易用性,以期为“后CAT 时代”译者的工具选择和高校翻译技术教学提供借鉴和参考。

1 Déjà Vu和YiCAT简介

1.1 Déjà Vu简介

Déjà Vu 是法国Atril Solutions 公司研发的产品,是全球首个基于Windows 操作系统的计算机辅助翻译软件。软件界面简约、功能强大,曾经被业界视为最有潜力的CAT 软件。目前最新版本为Déjà Vu X3,分为免费版(Free)、专业版(Professional)、工作组版(Workgroup)和服务器版(TEAMServer)。Déjà Vu X3 专业版适用于自由译者、翻译公司内部译者、审校者;Déjà Vu X3 工作组版适用于项目经理、本地化管理者、翻译团队,可进行翻译项目创建、文件分割、译文合成等协作翻译操作;Déjà Vu TEAMserver 则是面向翻译团队的协作平台,主要适用于语言服务提供商(LSP)、高校以及政府机构。本文选择Déjà Vu X3 工作组版软件作为研究对象。

1.2 YiCAT简介

YiCAT 是上海一者信息科技有限公司自主研发的一款基于语料大数据的在线翻译管理平台,发展趋势良好,被称为业界“新秀”。该平台具有海量优质翻译记忆库与术语库资源、实时监督翻译项目进度、高效团队管理及多人协同翻译、译审同步、MT+PE 工作模式等特点,能有效帮助翻译企业、翻译团队和自由译者提高翻译效率。该平台分为团队版(含免费版和加强版)和企业版(含基础版、高级版和旗舰版)两个版本五种选择,本文选择团队加强版作为研究对象。

2 功能对比

借助翻译工具最大限度地实现翻译流程自动化,提高翻译效率,保证翻译质量,有效管理翻译流程,是所有译者使用翻译工具的初衷。“只要软件选择合理,使用得当,翻译流程就能得到优化”。“任务量大、周期短的翻译项目越来越多,单靠个人根本无法按期完成,必须依靠团队协作”。“面对繁重的翻译任务,特别是大型翻译项目时,由于翻译时间有限,规范化的翻译项目管理流程对提高翻译效率至关重要”。目前多数译者都借助翻译技术完成翻译任务。图1 为借助单机版翻译软件协作完成一个或多个文档翻译的主要步骤以及基本流程,云版翻译协作流程与此基本类似,具体步骤依据项目实施存在细微差异。

图1:单机版软件协作翻译流程

2.1 项目准备

本次翻译任务由1 名项目经理、3 名译员、1 名审校员完成一份新能源Word 文档(共15214 词)英汉翻译,要求交付Word 格式译文和Excel 格式术语表。

翻译项目准备阶段通常指项目文件夹准备、翻译记忆库准备、术语库准备、机器翻译API 准备和风格指南准备等。

2.1.1 项目文件夹准备

项目经理先创建总项目文件夹“新能源英汉翻译”,包含8 个子文件夹:01-参考数据(存放可参考的平行文本、术语表、风格指南等);02-源语文件(存放原文);03-项目文件(存放项目文件、子项目文件及对齐项目文件等);04-语言资产(存放翻译记忆库和术语库);05-分析报告(存放项目分析报告);06-外部审校(存放导出供外部审校的RTF 或XLIFF 等文件);07-审校(存放审校后的文件);08-终稿(存放最终译文)。

2.1.2 参考数据准备

项目经理通过在线查询,整理《新时代的中国能源发展》、《世界能源展望2021》等相关Word 英汉平行语料并存放于01-参考数据文件夹中,用于制作翻译记忆库;整理微软翻译风格指南用作此次项目的参考翻译风格指南。

2.1.3 翻译记忆库准备

多数情况下,翻译记忆库是原文和译文句句对照形成的语料库。翻译记忆技术是CAT 工具的核心,其实质是利用翻译记忆技术,将翻译过程中的术语匹配、译名统一、高度相似的句子再现等记忆工作由电脑完成。在翻译过程中,系统通过自动搜索翻译记忆库中相同或相似内容,给出参考译文,使用户避免重复劳动,只需专注于翻译新内容。本文以《新时代的中国能源发展》中英双语文档为例,描述翻译记忆库准备流程。

首先,对齐《新时代的中国能源发展》中英双语文档以制作翻译记忆库。Déjà Vu X3 软件集成了语料对齐功能模块,新建“新时代的中国能源发展”翻译记忆库,然后从“外部数据”选项卡“导入”区域选择“对齐”功能,分别添加《新时代的中国能源发展》英文和中文两个文档并对齐,对齐结果直接发送到新建的翻译记忆库文件中。

YiCAT 平台没有集成语料对齐功能,需要借助其他对齐工具完成。项目经理借助Tmxmall 语料对齐(上海一者信息科技有限公司研发)完成,设置双语语种并导入《新时代的中国能源发展》英、中两个文档,对齐后导出“新时代的中国能源发展.tmx”格式翻译记忆库文件。进入YiCAT 平台新建“新时代的中国能源发展”记忆库将该TMX 格式文件导入其中。

Déjà Vu X3 软件语料对齐功能模块支持双语文档对齐且能将对齐结果直接发送到该软件支持的目标翻译记忆库中,在该界面能够不断添加多个双语文档进行对齐,将多个文档中的内容整合生成一个翻译记忆库,最终生成“新能源英语英汉翻译”记忆库。Tmxmall 网页语料对齐平台,一次只能上传一个原文或者译文文档,生成“新时代的中国能源发展”、“世界能源展望2021”等翻译记忆库。该平台具有云端工具的优势,在网络中断或者断电等意外情况中,能够自动保存对齐结果;该工具对齐流程为“先段落对齐再句对齐”,界面分别用黄/绿色标记相邻段落中的不同句子,在检查环节中能够帮助使用者提升校对句对拆分的准确性。

2.1.4 术语库准备

术语库中存储术语原文、译文对照的术语对。术语库能够确保术语一致,配合CAT 工具和QA 工具,能够减少翻译时间,协助译员产出高质量且翻译一致的译文。术语管理是译前重要准备工作,个人或企业均需要进行术语收集、描述、处理、存储、编辑等管理工作,这对于术语信息存储、共享、循环利用意义重大,在翻译实践中发挥重要作用。本次翻译实践客户没有提供术语库,项目经理选择利用语帆术语宝进行术语自动提取,配合人工提取,共收集122 条术语,制作“新能源英语英汉翻译术语”Excel 格式术语表(包含两列,第一列为术语原文,第二列为术语译文)。

Déjà Vu X3 软件集成了术语库管理功能,项目经理新建“新能源英译汉术语库”,将Excel 格式术语表(仅支持.xls 格式)以外部数据形式导入“新能源英译汉术语库”中。YiCAT 云翻译平台中的“术语库管理”功能模块同样支持将Excel 格式术语库(支持.xls、.xlsx 格式,大小不超过10M)以外部数据形式导入术语库。

相较传统通过文字处理器和电子表格(如Microsoft Word、Microsoft Excel)进行简单术语管理的方式,二者都为精细化术语管理、在CAT 环境中直接调用、查询、编辑术语库、保证术语一致性等操作提供便捷。Déjà Vu X3 术语库管理界面支持术语编辑、查找、替换、拼写检查、另存为模板、按术语字母顺序排列、添加术语关系、统计等功能,“创建新术语库”导航提供13 种术语库模板、支持对术语条目进行关系和属性定义的预设置,可依据实际需要在术语条目下添加多种信息如同义词、反义词、注释、上下文等,支持个性化设置和管理术语库,适合对术语进行精细管理。YiCAT 术语管理界面支持术语查询、编辑、保存、删除、统计等功能,但术语库管理模块中提供的术语条目信息较少,仅包含序号、原文、译文、来源、备注、最后修改人、最后修改时间等信息,在个性化设置方面功能略显单一,不过能够满足像本次英汉翻译项目的术语管理要求。

2.1.5 机器翻译API 准备

Déjà Vu X3 支持调用9 种机器翻译引擎,且同一个项目支持调用多个机器翻译引擎。使用者需单独申请机器翻译API,获取账号和秘钥。本次翻译任务选择调用百度翻译API(平台提供每个月200 万字符免费翻译量,能够满足基本翻译需求),经百度翻译开放平台注册申请得到App Id和秘钥,该操作只需申请一次,将账号和密码添加于Déjà Vu X3 中,便可长期使用。YiCAT 云翻译平台支持21 种机器翻译引擎,创建项目时可以一键启用某一机器翻译引擎,本次翻译中选择“Tencent TranSmart-交互式机器翻译”。

2.2 创建翻译项目

本次翻译项目为单文件、单目标语文档协作翻译项目,项目创建阶段包括新建项目和预翻译两个流程。

在Déjà Vu X3 工作组版和YiCAT 平台创建项目步骤类似。不同的是,Déjà Vu X3 支持新建项目和根据模板新建项目两种方法,二者适用范围不同,前者适用于任何项目,后者适用于来自同一客户的项目或者不同客户的专业领域相似的项目。YiCAT 平台新建项目阶段支持设置项目截止日期(Déjà Vu X3 TEAMServer 支持设置项目截止日期),有助于实时在线监控项目进度;新建项目时还需要选择工作流包括翻译、翻译——审校、翻译——审校——校对、译后编辑,依据实情,本次项目选择“翻译——审校”工作流。Déjà Vu X3 则是通过翻译编辑界面的句段状态(已翻译、已校对、已核准等)体现翻译流程,无需单独设置。

预翻译是指自动翻译原文文件中的句段。项目经理在分配任务前,调用添加的翻译记忆库、术语库、机器翻译等资源进行预翻译,并设置对文中标记、原文重复句段的处理,方便后期项目分析、任务分配。项目经理完成项目创建,进入Déjà Vu X3 翻译编辑界面“预翻译”,进行语言范围、文件范围、起点范围、覆盖、匹配等内容的设置;设置“质量保证>锁定上下文匹配”,即将原文中重复出现且上下文一致的句段锁定。在YiCAT 项目创建阶段,项目经理进行“预翻译”设置,选择“用翻译记忆库进行预翻译”“用机器翻译进行预翻译”、“自动填充标记”、“将100%翻译记忆库匹配句段状态设置为已确认”。在“重复与锁定”设置时,选择“重复>自动填充重复句段”、“锁定>内部重复、100%记忆库匹配”,这样重复的句段除第一次出现外,其他相同句子会出现 图标,译员/审校只需修改第一句,此后相同句子会自动填充。

2.3 分配任务

创建好项目之后,项目经理就可以进行项目分配了。项目分析数据显示该待译文档共15214 个单词(重复句段7 句,重复单词52 个),待译文档与翻译记忆库精确匹配率为0。

Déjà Vu X3 工作组版提供“附属项目包”、“Word RTF”、“Trados RTF”“XLIFF”四种任务分配选项。项目经理以“可译单词”为分割单位,将任务以“压缩的Pack&Go 附属项目”形式分为3 份,点击“预览项目包”,对每个项目包进行微调(包括项目包名称、字数、百分比、包含的文件等),并导出翻译记忆库子库、术语库子库,将导出3 个子项目包分别发送给协作译员。

YiCAT 团队加强版进行翻译协作,最便捷的方式便是所有协作译员都通过YiCAT 平台完成翻译操作。项目经理将协作译员的YiCAT 账号和姓名添加至我的团队,以可译句段为分割单元进行任务分配,预览句段后分配任务给协作译员。

相比之下,Déjà Vu X3 工作组版任务分配以项目包形式进行,可将包含多个文件的项目整体分配,且支持手动调整每个项目包的细节信息,在精细分配方面更胜一筹。YiCAT云翻译平台任务分配在线进行,对于包含多个文件的项目,只支持以单一文档分配的形式进行,可以“按句段分”“按字数分”两种方式分配,本次实践以句段分配是为了保证句段的完整性。

2.4 翻译编辑

协作译员在Déjà Vu X3 工作组版和YiCAT 团队加强版中都可结合项目经理发送的预翻译译文、翻译记忆库、术语库、机器翻译进行译后编辑。

协作译员接收到项目包,在Déjà Vu X3 软件中依据“接收项目包——创建项目——翻译——返回项目包”流程进行翻译编辑,需要创建本地翻译记忆库、术语库分别存放项目经理发送的总项目翻译记忆库和术语库,参考完成翻译,确认全部句段后,将项目包返回给项目经理。

协作译员在YiCAT 平台打开翻译项目,结合项目经理添加的翻译记忆库、术语库以及该平台在线记忆库和术语库、机器翻译等资源,完成翻译,整个操作流程自动实时更新,方便项目经理在线查看。

协作译员在翻译过程生成新的原文译文对、术语对,需要与项目经理共享、交流,那么这两款CAT 工具是如何处理的呢?在Déjà Vu X3 软件中,项目经理创建项目之初,添加“新能源英语英汉翻译记忆库”、“新能源英语英汉翻译术语库”并设置为“不可写”,作为项目参考记忆库、术语库,同时添加“临时新能源英语英汉翻译记忆库”、“临时新能源英语英汉术语库”并设置为“可写”用于存储翻译过程中生成的新句对、术语对。相应的,协作译员如译员A在翻译时,分别创建两个记忆库、术语库,存储项目经理发送的项目记忆库、术语库以及翻译过程中生成的新句对、术语对,最后将所有内容返回给项目经理,共享、交流数据。项目经理在YiCAT 平台创建项目时添加“可写入”新能源英语英汉翻译记忆库、“不写入”的“新时代的中国能源发展”和“世界能源展望2021”记忆库以及“新能源英语英汉翻译术语库”(用于保证术语翻译一致性)、“临时新能源英语英汉术语库”(用于存储在翻译过程中的新术语对),这样,项目经理和协作译员都可实时查看更新的数据。

2.5 回收译文

项目经理需回收译员译文并发送给审校员。项目经理在Déjà Vu X3 软件中将回收的3 个返回项目包重新导入“新能源英语英汉翻译”项目中,在“合并外部查看数据”界面逐一核实,合成译文,全部句段状态显示为“已翻译”。在YiCAT 平台中项目经理在“项目管理”中查看“新能源英语英汉翻译”项目,进度显示100%,全部句段状态为“已确认”。

2.6 审校

项目经理合成译文之后,进入审校环节,一般分内部审校和外部审校两种方式。

在Déjà Vu X3 软件当中,项目经理有两种方式将任务发送给审校员:

(1)发送上一步骤更新的“新能源英语英汉翻译”项目包,审校员在Déjà Vu X3 软件中打开该项目包,审校后将句段状态设置为“已校对”;

(2)将项目以双语RTF 格式导出用于外部审校。该RTF 双语文档为富文本格式,共5 列(“序号(ID)”、“源语(Source)”、“目标语(Target)”、“批注(comment)”和“状态(Status)”),审校员直接修改目标语列中的内容,提交项目经理。

在YiCAT 平台进行审校工作,审校人员只需登录账号,在我的任务”区找到并完成审校任务。

2.7 生成译文和导出译文

项目经理接受审校员返回的项目包,或将返回的RTF文档导入“新能源英语英汉翻译”项目文件,在“合并外部查看数据”界面逐一检查核实,生成译文并导出译文;在YiCAT 平台项目经理在“项目管理”列表中找到该项目,导出目标文件。

这两款CAT 工具都能够完成文件格式转码,导出与源语文件格式(格式不复杂的情况下)相同的目标文件,省去人工进行格式处理的麻烦。相比之下,Déjà Vu X3 软件的优势在于可为多目标语言项目自动创建多目标语言文件夹;YiCAT 云翻译平台目前只支持单目标语翻译项目,其优势在于提供更多样灵活的导出格式(包括“目标文件”、“双语文件”、“QA 报告”、“原文”、“TMX 文档”格式)。

3 比较评介

笔者对比了在Déjà Vu X3 工作组版和YiCAT 团队加强版两个平台协作翻译一份英语文档的工作流程,现尝试从核心功能、用户体验等方面进行分析和评价。

就核心功能来看,单机版Déjà Vu 软件操作终端为电脑桌面,进行协作翻译最大的劣势就是成员之间难以实现语言资产实时更新、共享。虽然项目经理在分配项目时将翻译记忆库、术语库一并发给译员,但若要更新数据,则需要通过其他渠道沟通。而YiCAT 云翻译平台操作终端灵活,在任何浏览器甚至手机端皆可操作。项目所有参与者可实时查看更新翻译记忆库、术语库等;但是该平台在满足个性化、精细化的翻译记忆库、术语库管理需求方面有待提升,例如翻译项目、翻译记忆库、术语库中只支持单一源语与单一目标语对应等。就用户友好性来看,Déjà Vu 软件界面无官网链接或者帮助文档,且官方网站界面语言非中文,对新用户来说,有一定的入门难度,熟悉该软件需要花费的时间成本相对较高。YiCAT 为云翻译平台,操作简捷,网页中提供多类操作帮助信息,用户友好度较高。

“君子生非异也,善假于物也”,笔者建议新用户和高校教学可结合实际翻译项目和自身操作水平,灵活选取计算机辅助翻译工具,以便高质高效完成翻译任务。

猜你喜欢

句段译员项目经理
精彩句段一
精彩句段二
会议口译中译员的译前准备研究——一项基于上海译员的问卷调查
论机器翻译时代人工译员与机器译员的共轭相生
译员与翻译企业的劳资关系及其和谐发展
高速铁路通信信号系统集成项目经理能力及主要任务
论项目经理的职责与技能要求
浅议做好代建项目经理
浅谈项目经理如何做好后评价工作