APP下载

全球化背景下地方外宣翻译的平行语料库构建研究

2024-01-19张传钰 刘玉澄

校园英语·月末 2023年7期
关键词:外宣翻译

张传钰 刘玉澄

摘 要:本文以江苏省连云港市为例,研究平行语料库的构建过程,主要包括资料收集和整理、语料清洗和对齐、建立平行语料库以及语料库的维护和更新。在资料收集和整理阶段,需要确定语料库的主题和目标语言,并收集和整理相关的文本数据。在语料清洗和对齐阶段,需要进行数据清洗、预处理和对齐操作,以确保语料库的质量和可用性。在建立平行語料库阶段,需要使用自动或人工方法进行文本对齐,并对对齐结果进行校验和评估。在维护和更新阶段,需要定期更新和维护语料库,并对新增文本进行对齐和校验。本文还探讨了平行语料库在机器翻译和自然语言处理中的应用和作用,认为平行语料库可以提高机器翻译和自然语言处理的精度和效率,促进跨语言和跨文化交流和合作。本文研究对于平行语料库的建设和利用具有一定的理论和实践意义。

关键词:平行语料库;外宣翻译;语料库构建;语料处理

作者简介:张传钰(1990.08-),男,江苏连云港人,南京医科大学康达学院,讲师,研究生,研究方向:翻译,翻译学,教学法;刘玉澄(2002.01-),女,山东烟台人,南京医科大学康达学院英语专业本科在读,研究方向:翻译;翻译技术。

地方外宣翻译平行语料库是促进城市对外交流、文化交流和经济发展的重要工具。近年来,随着中国综合国力的进一步增强和“一带一路”倡议的实施,外宣翻译发生了新的变化, 呈现出新的特点。以连云港为例,连云港外宣翻译平行语料库可以为城市的发展提供重要的支持,包括推广和宣传城市资源、促进文化交流、跨语言交流和推动经济发展等。

首先,外宣翻译平行语料库可以为连云港的对外交流提供重要支持。连云港是一个重要的沿海城市,拥有丰富的经济、文化和旅游资源。通过建立外宣翻译平行语料库,可以将这些资源向国内外更好地推广和宣传。通过语料库中的双语数据,可以更方便地进行翻译和传播,从而扩大连云港的知名度和影响力,吸引更多的投资和人才进入连云港。

其次,外宣翻译平行语料库还可以促进文化交流和跨语言交流。业界认为,对于外宣翻译质量问题的讨论不应仅停留于对拼写、语法等“低级错误”纠错层面,而要从更为宽广的层面探索优化外宣翻译的途径增强外宣效果。语言是文化交流的重要媒介,通过翻译平行语料库,可以更方便地将连云港的文化资源进行传播,吸引更多的外国友人了解和体验连云港文化。同时,通过与外国文化进行交流,可以促进连云港的文化创新和发展,打造更具特色的城市文化。

最后,外宣翻译平行语料库还可以为连云港的经济发展提供支持。在全球化的背景下,跨国经济交流和合作越来越频繁,而语言交流是其中不可或缺的环节。通过建立外宣翻译平行语料库,可以更方便地进行商务翻译和跨语言交流,促进连云港与外国企业的合作和交流,推动连云港的经济发展。

一、平行语料库构建——资料收集和整理

语料库, 从字面上看, 就是语言的仓库, 专业的定义是“为语言研究和应用而收集的, 在计算机中存储的语言材料, 由自然出现的书面语或口语样本汇集而成, 用来代表特定的语言或语言变体。”地方外宣翻译平行语料库是指由地方政府或机构发布的外宣资料,通过翻译变成了其他语言版本,这些语料可以用于机器翻译等领域的研究。构建这样的平行语料库需要以下几个步骤:

第一步是收集和整理资料。需要找到地方政府或机构发布的宣传资料,如新闻稿、政策文件、宣传视频等。然后将这些资料翻译成需要的语言,例如英语、法语等。最好能够保持翻译的一致性和准确性,可以请专业人士或专业翻译人员进行翻译。

地方外宣翻译平行语料库的资料收集和整理是构建平行语料库的第一步。这一步骤的关键是找到适合的宣传资料和合适的翻译人员。

首先,需要确定需要收集的宣传资料类型。一般来说,地方政府或机构发布的宣传资料包括新闻稿、政策文件、宣传视频等。为了收集到全面、准确的资料,可以定期浏览地方政府或机构的官方网站,关注官方媒体发布的宣传信息,或者通过社交媒体等渠道获取信息。以下列举了连云港市的部分官方外宣渠道及对外交流交往资源:

连云港港口:连云港港口是中国东海岸最重要的港口之一,是中国“21世纪海上丝绸之路”的重要枢纽港口,拥有良好的航运网络和港口设施,是中国对外贸易的重要通道之一。

连云港市人民政府外事与侨务办公室:该办公室是连云港市政府机构,负责处理涉外事务和侨务工作,为外籍人士和华侨提供服务和支持。

连云港市文化广电旅游局:连云港市文化广电旅游局是连云港市政府机构,负责推广连云港的旅游资源和文化,吸引国内外游客前来旅游观光,为城市的对外交流交往提供渠道和平台。

其次,需要确定翻译人员的选择标准。翻译人员需要具备一定的语言能力和专业背景,能够准确理解原文并将其翻译成目标语言。为了保证翻译质量,最好选择有翻译经验、能够熟练使用翻译工具和技术的专业翻译人员进行翻译。

在资料收集和整理的过程中,还需要注意以下几点:

保持原文的一致性和准确性。对于原文中的错别字、语法错误、不准确的用词等进行修改和补充,确保原文质量。

翻译人员需要准确理解原文的意思,并根据目标语言的语言特点和习惯进行翻译。同时,还需要注意翻译的一致性和准确性,避免出现歧义和错误。

对于部分专业性很强的宣传资料,可以邀请相关领域的专业人士或者翻译公司进行翻译,以确保翻译的准确性和专业性。

资料收集和整理是构建地方外宣翻译平行语料库的关键步骤。需要通过科学、规范的方式来收集和整理宣传资料,并选择合适的翻译人员进行翻译,以保证平行语料库的质量和可用性。

二、平行语料库构建——语料清洗和对齐

第二步是清洗和对齐语料。对于翻译资料中的重复部分、错误信息、无关内容等进行清理,保证语料的质量和准确性。然后需要对原文和翻译文本进行对齐,即将原文和翻译文本一一对应,这一步可以借助一些工具来辅助完成。

地方外宣翻译平行语料库的语料清洗和对齐是构建平行语料库的重要步骤。语料清洗是指在语料库中剔除掉无效的数据,而语料对齐则是将源语言和目标语言的句子进行一一对应。

语料清洗的过程中,需要注意以下几点:

剔除无效数据。例如,一些翻译错误、缺失信息、格式不规范的数据可以进行剔除。

统一格式。将语料库中的数据的格式统一化,方便后续的处理和使用。

进行去重。由于宣传资料的发布可能会重复,导致语料库中存在相同的数据,因此需要进行去重处理。

在进行语料对齐的过程中,需要注意以下几点:

1.对齐的精度。需要确保对齐的精度尽可能高,避免出现误差。语料对齐是指将两个或多个文本之间的相应部分进行匹配和对齐。它是许多自然语言处理任务的基础,例如机器翻译、文本对齐和文本比较。提高语料对齐的精度可以提高这些任务的完成质量和效率。下面是几个提高语料对齐精度的方法:①使用更好的算法。语料对齐可以使用不同的算法,例如基于字符串匹配的算法、基于短语匹配的算法和基于神经网络的算法。不同算法的优缺点不同,选择适合数据的算法可以提高语料对齐的精度。②清洗数据。清洗数据可以去除文本中的噪声和错误,例如拼写错误和语法错误。这可以使文本更加规范,从而提高语料对齐的精度。③使用更多的训练数据。语料对齐的精度通常随着训练数据的增加而提高。使用更多的训练数据可以提高模型的泛化能力,从而提高语料对齐的精度。④使用词级别的对齐。在语料对齐时,可以使用词级别的对齐来更准确地匹配文本。词级别的对齐可以考虑到单词的含义和上下文,从而提高语料对齐的精度。⑤人工校对。在对齐的过程中,可以进行人工校对以纠正错误。人工校对可以提高对齐的准确性,但需要耗费大量的时间和人力资源。

2.处理语言差异。由于中英文语言存在差异,例如语序、句式等方面,可能会导致翻译不准确或不完整,需要进行适当的处理。在处理跨语言语料库时,语言差异是一个常见的问题。为了正确地处理跨语言数据,需要考虑以下几个方面:①语言学差异。不同的语言在语法结构、词汇、语义和文化背景等方面可能存在差异。了解和理解这些差异是处理跨语言数据的重要前提。②翻译。对于跨语言数据,可能需要进行翻译。这可以通过机器翻译模型或人工翻译来完成。但是需要注意的是,翻译可能会引起误译,尤其是在涉及多义词、语言的隐含含义、文化背景等方面的时候。③对齐。语言差异可能导致跨语言数据中的文本不对齐。对齐是指将两个或多个文本之间的相应部分进行匹配。它是许多自然语言处理任务的基础。对齐可以通过使用基于字符串匹配、基于短语匹配或基于神经网络的算法来完成。④数据清理。在处理跨语言数据时,需要清理数据以去除不必要的信息和错误。这可以通过自动或手动方法来完成。⑤语言模型的训练。处理跨语言数据的语言模型需要进行跨语言训练。这可以通过使用跨语言的预训练模型或从头开始训练一个跨语言模型来完成。

3.使用专业工具。可以使用专业的語料对齐工具,例如Trados、MemoQ等,来提高对齐的精度和效率。

三、平行语料库构建——建立平行语料库

第三步是建立平行语料库。将清洗和对齐的语料按照一定的格式和标准组织起来,建立平行语料库。语料库应该包括原文、翻译文本和元数据等信息,如文本来源、发布时间、翻译人员等。平行语料库的格式和标准需要根据具体的应用场景进行调整。

地方外宣翻译平行语料库的格式和标准是平行语料库的重要组成部分,它们决定了平行语料库的结构和使用方式。下面,笔者将从以下几个方面进行阐述。

格式:地方外宣翻译平行语料库可以采用多种格式,例如TMX、XLIFF、PO等格式。其中,TMX是一种行业标准的平行语料库格式,支持多种语言和工具之间的互操作性,因此较为常用。而XLIFF和PO等格式则适用于特定的翻译软件和场景。

标准:为了确保平行语料库的质量和可用性,需要遵循一定的标准。例如,对于平行语料库的命名和存储路径应该进行规范,以便于管理和维护。同时,平行语料库中的元数据、句子对齐等信息也需要进行规范化处理,以便于后续的信息处理和利用。

元数据:平行语料库中的元数据包括源语言、目标语言、创建时间、更新时间、创建者、描述信息等,可以通过这些元数据对平行语料库进行检索、分类和管理。

句子对齐:平行语料库的句子对齐是平行语料库的核心内容之一。需要进行精确的句子对齐,以确保源语言和目标语言的句子一一对应,没有遗漏或重复。

地方外宣翻译平行语料库的格式和标准对于平行语料库的构建、管理和使用都具有重要的作用,需要根据实际需求和情况进行选择和制定,以保证平行语料库的质量和可用性。

四、平行语料库构建——维护和更新

最后一步是语料库的维护和更新。平行语料库需要进行定期的维护和更新,包括对新发布的宣传资料进行翻译和对齐,对已有语料进行清理和更新等,以保证语料库的构建质量和可用性。

地方外宣翻译平行语料库的维护和更新是确保平行语料库长期可用和保持高质量的重要步骤。以下将从几个方面进行阐述。

监测和修复错误:在平行语料库的使用过程中,可能会出现一些错误,例如句子对齐错误、译文错误等。因此,需要对平行语料库进行监测和修复,以保证平行语料库的准确性和可用性。

添加新的数据:随着时间的推移,地方外宣翻译平行语料库需要不断地更新和添加新的数据,以满足新的翻译需求和语言变化。因此,需要建立定期添加新数据的机制,以确保平行语料库的时效性和覆盖范围。

统计和分析:平行语料库的统计和分析可以帮助用户了解平行语料库的内容和特点,以便于更好地利用平行语料库进行翻译和研究。因此,需要对平行语料库进行统计和分析,并提供相应的工具和接口,以便于用户进行数据挖掘和分析。

标准和规范的更新:随着翻译和语言技术的不断发展,平行语料库的标准和规范也需要不断更新和完善。因此,需要建立标准和规范的更新机制,以确保平行语料库的格式和标准与最新的技术和需求保持一致。

虽然地方外宣翻译平行语料库的构建包含多个步骤,需要耗费大量的时间和精力。但是,建立这样的平行语料库可以为机器翻译等领域的研究提供有价值的资源。

参考文献:

[1]黄友义.中国站到了国际舞台中央,我们如何翻译[J].中国翻译,2015(5):5-7.

[2]胡兴文,张健.外宣翻译的名与实:张健教授访谈录[J].中国外语,2013(3):100-104.

[3]王杭.茶文化外宣翻译中的语料库技术应用[J].福建茶叶,2018(2):449.

基金项目:本文系2022年度 “江苏省社科应用研究精品工程”外语类课题立项项目:《“一带一路”背景下的地方外宣翻译的平行语料库构建研究——以连云港为例》(立项号:22SWC-33)、2022年度 “江苏省社科应用研究精品工程”外语类课题立项项目(立项号:22SWC-33)、2022年度江苏省社科应用研究课题成果。

猜你喜欢

外宣翻译
生态翻译视阈下非物质文化遗产外宣翻译
国际传播视阈下的外宣翻译特点探析
浅析高校简介英译中“认同”的建构
江西省高校门户网站外宣翻译现状研究
英语实用翻译研究
顺应论视阈下的中国政府网外宣翻译研究
外宣翻译中中国特色词汇的翻译
跨文化意识下河北省非物质文化遗产外宣翻译的研究
汉英外宣翻译中的本土化顺应策略
外宣翻译“三贴近原则”指导下的河南省旅游翻译研究