石油化工文本机器翻译译文错误研究
2023-03-27任继超于艳英
任继超 于艳英
摘 要:在线翻译平台为译者带来了极大的便利性和快捷性,因此其功能的进一步完善成为翻译实践者关注和研究的对象。如今机器翻译软件无论在可涉及的文本类型、翻译速度及准确度等方面较以前都有了长足的发展和进步,但在具体文本翻译中,仍有一定的局限,甚至会出现各种失误或错误,尤其是在汉英翻译过程中。鉴于此,文章从《石油工业概论》书中选取了部分中文石油化工语料,借助有道在线翻译软件,对其进行汉英翻译,统计其中出现的错误类型,并对译文从词汇、句法等方面做了进一步分析。通过此过程,作者期望发现和总结现有在线翻译软件在处理科技类文本汉英翻译时常见的错误类型以及错误产生的原因,并基于此提出改进的方向和措施,从而对后续译者和翻译软件设计者有所启发。
关键词:石油化工文本;机器翻译;机译错误;错误分析
中图分类号:F74 文献标识码:A doi:10.19311/j.cnki.16723198.2023.05.023
0 引言
随着各种机器翻译技术的方法的不断演进,从启蒙尝试,到基于规则、基于实例的方法,再到基于语料库的统计方法,直到当前的神经网络方法,机器翻译质量不断提升,应用前景不断扩大。随着该领域技术的发展,出现了越来越多功能强大的在线翻译平台,如百度翻译、必应翻译、谷歌翻译、有道翻译等,其中有道翻译所占据的市场份额最为庞大。虽然机器翻译理论以及相关研究取得了不小进展,但“翻译本身的复杂性”“自然语言的复杂性”和“机器自身的局限性”使得译者不得不对译文进行后期的人工修改即译后编辑。本文以当前占市场份额最大的主流在线翻译平台有道翻译为翻译工具,以石油化工类文本汉译英译文为研究对象,分析梳理译文中典型错误类型,探究错误产生原因,并基于此提出译后编辑的建议及软件完善的方向,以期为从事相关领域的译者和翻译软件的研发者提供一些借鉴和启发。
1 机器译文错误研究现状
目前,即便机器翻译在技术上取得了较大的进步,但仍有很多错误出现在机器译文当中。有学者对近40年来发表的涉及机器翻译错误类型的论文进行了定量分析,将错误类型按出现频次做了如下归类:词汇层面(术语、词义等);句法层面(时态、语态等);语篇层面(语境、母语习惯表达偏差等)及其他错误(原文错误、格式偏差等)。罗季美、李梅以课题组的形式,对汽车操作手册的人工译文和机器译文进行抽样对比,并将错误进行标注统计,其研究结果发现:词汇错译高达84.13%,句法42.45%,符号4.95%。其中,词汇错译率中最高的是术语错译,占词汇错译的78.85%;句法错译率最高的是词序错误,占29.35%。陈胜、田传茂在对石油地质类文本进行了机器翻译译后编辑之后指出:译文错误主要反映在词义、词性、词序、句子结构、断句、名词语法标记、搭配、标点符号、字母大小写、信息完整性等方面。到目前为止,大多数译后编辑研究的数据及结论都是基于英译汉文本资料,本文将采用逆向研究的方法,探究机器翻译汉译英过程中易产生的错误类型及原因。
2 石油化工文本错误类型统计
本次研究使用的线上翻译平台为有道翻译,选取的中文文本来自《石油工业概论》。在机器翻译之后,将错误类型按词汇、句法和其它这三个错误类型的基础上,进一步进行细分汇总如表1。
由表1我们可以看出,在使用有道翻译对石油化工文本进行汉译英时,从词汇层面上来看,错误大多集中于对该领域内术语、准术语的翻译;句法层面的错误集中于错误的处理句子成分;而在其他层面,格式上的转化出现错误较多。下文将以案例形式进行译后编辑并梳理分析。
3 汉译英译文错误分析
根据上述统计结果,从实例出发,进一步分析错误产生的原因,并进行译后编辑。
3.1 术语、准术语翻译错误
现行基于大数据语料库和深度学习机制的机器翻译平台,其大数据语料库的语料量、扩充速度和自我更新能力是影响翻译功能的重要指标项。上述语料库的语料量不足或功能缺陷,会导致译文质量的下降或显著的翻译错误 [6 ]。机器翻译只能依据其先确定词和词组的意思,再按语法规则形成句子的翻译顺序进行翻译,致使生成句子中的词汇未结合相关上下文语境。
例1 块锥入度
有道译文:piece of cone into the degrees
译后编辑:block cone penetration
“块锥入度”是石油化工术语,指的是硬度足以保持其形狀的润滑脂在25℃时,测得润滑脂的锥入度。因为后台语料库并未包含此术语,翻译之后得到偏离原意的结果。
3.2 词性错误
例2 视密度
有道译文:depending on the density
译后编辑:observed density
该此例中,同样是由于后台语料库未包含足够多该领域术语,翻译引擎依据自身语法规则进行翻译,将“视”理解为动词,错误的用“取决”来进行翻译。而这里的“视”实际上是形容词,表示“可视”“可以观察到”的意思,用来修饰密度。
3.3 汉英句式转换错误
相比较汉语,英文更注重结构上的完整性,汉语中可以省略的部分,在对应英文中,需要根据英文语法及表达习惯进行增补。
例3 地下信息是分不同阶段收集的。在钻进过程中,同时收集岩心和中途试井、泥浆测井的数据。
有道译文:Underground information is collected in different stages. During drilling, data were collected from both core and in-course tests, as well as mud logs.
译后编辑:Underground information is collected at different stages. While people drilling, data were collected from both core and in-course tests, as well as mud logs.
原汉语句子中是可以省略主语的,因为主语是人。而现在机器译文句子当中,整句话的主语只能是与主句一致的“data”,句子变得逻辑不通。按英语语法,现在分词或过去分词短语,其主语要和主句的主语保持一致,否则不能省略。
3.4 句子成分处理错误
汉语中一些词既可以作为动词也可以作为介词,而机器翻译往往不能正确识别其词性,而将真正的谓语翻译成句子的其他成分,使译文无法传达正确的原文信息。
例4 连续油管用一个长长的可弯曲钻杆代替传统僵硬的需要不断接单根的钻杆。
有道译文:Coiled tubing uses a long, bendable drill pipe instead of the traditional rigid drill pipe that requires continuous connection.
译后编辑: Coiled-tubing technologies replace the traditional rigid, jointed drill pipe with a long, flexible coiled pipe string.
例句中的“用……替代”中的“用”英语语法本来应用作状语,“替代”才是本句当中的谓语,而机器翻译将第一个出现的动词“用”作为谓语,而将本来的谓语变成了介词短语。
3.5 漏译
通过翻译实践发现,使用机器翻译进行段落翻译时经常出现漏译,一次性输入翻译引擎中的文本越长,漏译出现的频率越大。
例5 一旦降低到泡点压力,溶解气开始从油中溢出,逸出的气有很大的压缩膨胀性,因此由生产导致的压力下降将减弱。
有道译文:Once the bubble pressure is reduced, the dissolved gas begins to escape from the oil, and the escaping gas has a great deal of compressibility and expansibility, so the pressure drop caused by production will be reduced.
译后编辑: Once the bubble point is reached, the dissolved gas begins to escape from the oil, and the escaping gas has a great deal of compressibility and expansibility, so the pressure drop caused by production will be reduced.
該例中,机器翻译将“降低到”中的“到”字省略,直接按“降低”进行翻译,造成与原文意思上的出入。原文“泡点压力”是最终要降低到的一个值,而不是这种压力本身要降低。
3.6 汉英格式转换不当
符号是科技类文体传递信息的重要载体,合理的转换是确保译文质量的前提。机器翻译未能根据英汉习惯和表达上的差异,进行相对应的格式转换。
例6 《石油工业概论》
有道译文:Introduction to the Petroleum Industry
译后编辑:Introduction to the Petroleum Industry
在使用常见的标点符号时,英文和中文是存在差异的,如句号、顿号(表示并列时,中文使用顿号,英文使用逗号)、省略号(中文居中六个点,英文在下方三个点)以及书名号等符号的使用。句号和顿号机器翻译一般可以转化,而对于书名号这种需要对字体进行格式上进行的处理(斜体),翻译引擎往往不能识别转化。
4 汉英机器翻译平台目前的缺陷
(1)准确性不够。无论是词汇,还是句法,在线翻译平台在处理文本时都会出现问题,特别是存在较多专业术语以及长难句时,错误更容易出现。
(2)专业性不足。翻译专业性的文本,特别是科技类文本往往需要后台专业词库的支持,当后台词库中未涉及所翻译文本领域的语料,所翻译的译文必然达不到要求。
(3)技术性的局限。在线翻译平台对一次所翻译文本的字数有一定限度的要求,如处理大型翻译任务,还需要译者提前进行文本的切分,且在字数限度内的文本,翻译质量也会随着一次所输入文本量的增加而降低。
5 善译后编辑的方法与建议
通过本次机器翻译译后编辑实践,为译者和在线翻译平台分别提出提升译后编辑质量和效率的建议:
5.1 译者
(1)熟悉相关领域的专业原理。在对某领域专业文本进行翻译时,需要在掌握源语和目的语的基础上,对该领域还需要有一定程度的了解。译者在现实中面对不同领域的翻译任务时,可以在翻译前请教擅长相关领域的译者,或自行上网了解涉及所翻译领域的基本原理、专业术语、最新发展趋势等。
(2)了解常见的错误类型。机器翻译错误存在一定的规律性、系统性问题,可以有针对性地进行检查,提高工作效率。
(3)进行系统的译前编辑。译前编辑方法经实践验证,多在了解双语差异对比的基础上在录入原文前,对译文进行适当处理,减少软件对于原文理解的偏差。
5.2 在线翻译平台
(1)需要进一步拓展其后台专业词库,可以按不同领域进行划分,避免一些缩略语以及不同学科之间存在交叉的术语发生混淆,以提升专业术语翻译的准确度。
(2)在不影响翻译正确率的前提下,拓展后台所能翻译文本字符数的容量,最好可以推出直接对文件整体翻译的功能,后台系统可以自主对文档进行切分与合并。
(3)设立译文打分机制,也就是用户反馈机制。在用户使用翻译平台后,对生成的译文质量进行打分,用户可根据实际使用时的体验提出意见,平台可收集并作为进一步完善功能的参考。
6 结语
各种在线翻译平台的涌现和不断完善,不仅给普通人的生活带来了巨大的便利,也给翻译从业者的工作带来了相当大的变化。机器翻译不但极大地提高了翻译工作的效率,同时凭借其庞大的后台语料库和其不断自身学习、不断迭代的能力,也进一步拓宽了译者的翻译领域和工作边界。但是,相较于人工智能目前的发展水平,人類语言的复杂性和模糊性,加之人类思维的多维性就注定了借助人工智能的机器翻译目前的局限性。本文以有道在线翻译软件为工具,对石油科技文本进行了汉译英翻译,分析梳理了译本中常见的错误类型,并在此基础上分析总结了错误产生的深层原因,以期为从事相关领域翻译的从业者和从事翻译软件的研发者提供一些借鉴和启发。
参考文献
[1 ]李沐,刘树杰,张东东,等.机器翻译 [M ].北京:高等教育出版社,2018:5153.
[2 ]张政.机器翻译难点所在 [J ].外语研究,2005,(05):5962.
[3 ]朱慧芬,赵锦文,诸逸飞.在线机器翻译的译后编辑原则研究——以“八八战略”为例 [J ].中国科技翻译,2020,33(02):2427.
[4 ]罗季美,李梅.机器翻译译文错误分析 [J ].中国翻译,2012,(5):8489.
[5 ]陈胜,田传茂.在线翻译平台汉英翻译的问题及译后编辑——以石油地质文献为例 [J ].中国科技翻译,2021,34(01):3134+49.
[6 ]蔡欣洁,文炳.汉译英机器翻译错误类型统计分析——以外宣文本汉译英为例 [J ].浙江理工大学学报(社会科学版),2021,46(02):162169.
[7 ]黄越悦.浅谈机器翻译中译前编辑的应用 [J ].湖北函授大学学报,2017,30(03):175176+179.