MT在论文摘要翻译中的应用研究
2016-03-28涂王贝唐尔龙
涂王贝,唐尔龙
MT在论文摘要翻译中的应用研究
涂王贝,唐尔龙
随着互联网的普及,MT(机器翻译)也被广大网民广泛使用。基于语料库的翻译软件由于庞大的存储信息,使得机器翻译篇幅短、语言简洁的论文摘要成为可能。但是机器翻译的译文质量不高,仍然要通过译前消歧、译中比较、译后润色三阶段的人工干预,才能解决翻译中存在的切分歧义、语义歧义、文化现象不对应等问题。
MT;论文摘要;人工干预
论文摘要是学术论文必不可少的组成部分,是对文章的高度概括。一篇好的摘要不仅能使读者在最短时间内了解文章的内容,而且还可为读者提供快捷的网络检索。在国际化趋势日益加强的今天,摘要的英文译文也担当着同样的角色。然而,许多中文文章的英文摘要往往文字错误百出,翻译质量低劣,这不仅影响了刊物的质量,也极大地降低了国际上对中国学术水平的信任度,从而影响了国际学术交流的效果。
近几年来,随着中外学术交流的发展,对于如何翻译出质量上乘的论文英文摘要,学术界也进行了诸多探讨。笔者通过总结近10年对论文摘要英译的研究发现,以往的研究者大多侧重于对翻译中的英译错误和英译策略的归纳和总结,如王高生的《论文摘要的撰写及英译》[1],王慧博的《汉英摘要翻译的话语分析理论研究》[2],陈吉荣、赵永青的《论文摘要英译的翻译显化》[3],曾剑平、叶卫华的《社科学术论文摘要的编译》[4]94-98,邓军涛、许明武的《科技论文摘要汉译英典型问题探究》[5]等等。目前,虽然互联网已经普及、大数据时代已然来临,但学术界对于如何利用机器辅助翻译论文摘要,从而提高翻译的准确性仍是鲜有提及。
机器翻译(Machine Translation,简称MT)是利用计算机实现一种自然语言文本到另一种或多种自然语言文本的翻译。[6]1机器翻译在诞生初期的优势就存在于词对词的翻译,进入21世纪后,随着互联网的飞速发展,基于语料库的翻译软件由于强大的存储功能和搜索引擎使得翻译软件能有效降低词语错误的频率,同时还能为句子翻译提供多种句型参考。
然而现阶段的机器翻译还不能达到自主地处理自然语言的翻译过程,目前机器翻译在可读性、连续性、语法性等方面都面临诸多挑战, 对于翻译的文本也有一定的选择性。因此,机器辅助翻译在翻译实践中运用的更为广泛。社科学术论文摘要既有科技语体严谨、客观的特点,也有文学语言的修辞特色。此外,由于社科论文摘要所概括的研究对象具有较强的社会性和复杂性,摘要中不可避免地会使用表示创作者的主观倾向或者态度的形容词或副词。[4]94因此,仍然需要人工辅助才能进行准确翻译,翻译前需要对原文进行切分、断句,翻译后要对译文进行修改润色,才能达到理想的翻译效果。本文尝试在分析MT优势的基础上,探讨如何将MT应用于论文摘要翻译,从而为提高论文英文摘要的质量提供有益的借鉴。
一、MT的普及与优势
上世纪互联网诞生,时至今日,互联网已经渗入到生活的方方面面,给人们的生活带来巨大便利和变革。根据中国互联网络信息中心2016年1月发布的统计报告显示,截至2015年12月,中国网民规模达到6.88亿,互联网普及率达到50.3%,中国居民上网人数已过半[7]。随着网民数量的激增和社交网络的兴起,互联网已经成为一个能够相互交流沟通、相互参与的互动平台,而这个平台已经跨越了民族、地区、国家的限制。随着互联网时代的来临,互联网产业及相关产业也迅猛发展,跨语言交流需求激增,因此翻译的任务也随之激增,传统的单打独斗式的个人翻译已不能满足需求,使用机器进行翻译的各种翻译软件应运而生、蓬勃发展。
机器翻译的研究自计算机诞生之初就已被提出。但是,直到20世纪80、90年代,随着语料库的发展而产生的第三代MT方法才使机器翻译进入了繁荣时期,继而涌现出大量机器翻译系统。进入21世纪后,随着机器翻译系统的不断发展和成熟,使得机器翻译系统从科研院所走向市场,推出了众多的在线翻译软件,使翻译工作者的工作量大大减轻,也使广大网民体验了自助式的翻译服务。
机器翻译所具有的信息量大、更新快、翻译时间短、成本低、易操作等特点使机器翻译深受大众欢迎。笔者在网上做了一个关于机器翻译的问卷调查,共274人参与,结果显示,71.56%的受访者表示了解机器翻译,其中6.9%的受访者对于机器翻译非常熟悉,68.97%的受访者使用过机器翻译。而其中广大年轻网民对于这些新兴事物更为熟悉。根据国家统计局对年龄段的划分,18-40岁为青年,41-65为中年,66岁以上为老年。笔者设置4个年龄组别:青年网民(A组,18-28岁)、中青年网民(B组,29-40岁),中年网民(C组41-55岁)和中老年网民(D组56-65岁)。受调查的A组和B组对于机器翻译的了解程度为84.36%,要远远高于C组和D组15.66%,其中B组的受调查者对于机器翻译的熟悉程度最高,为88.24%表示了解,5.88%非常熟悉。
就本文要讨论的论文摘要的英译而言,目前论文摘要英译的典型错误有:(1)词不达意;(2)词语搭配错误、词语使用错误;(3) 语法错误:句子结构不全、句式紊乱等;(4)中式英语,僵化对译。[8]
翻译软件在诞生初期的优势就存在于词对词的翻译,进入21世纪后,随着互联网的飞速发展,基于语料库的翻译软件由于强大的存储功能和搜索引擎使得翻译软件能有效降低上述第一种和第二种错误的出现频率,同时,还能为句子翻译提供多种句型参考。具体来说,MT对于论文摘要的翻译具有以下的优势。
(一)专有名词标准化
专有名词的翻译一直是翻译工作者的一大难题,对于很多人名、地名、单位名称等,多个翻译者可能有多个翻译版本。专有名词翻译应统一标准,翻译软件的强大的搜索功能使统一翻译标准不再困难。例如一篇研究利用核磁共振提高摄像质量的论文中提到:核磁共振这一技术的诞生让我们燃起对未知的探解,重新看待获取影像的途径。“核磁共振”在日常生活中也有接触,有些场合翻译为MRI,如医院的核磁共振检查,有些地方则翻译为NMR。使用多个在线翻译软件对“核磁共振”进行翻译,有道词典、金山词霸、Google翻译、百度翻译等都将这一翻译统一为 “Nuclear Magnetic Resonance”简称NMR。
(二)新兴词汇概念化
学术论文是学者对自身研究领域的前沿知识的科学研究,都会涉及到该领域最新的研究成果。传统的翻译人员是熟悉两种语言和文化的语言学习者,只是对两种文化中的常识性知识和文学性知识有所了解。对于其他领域,尤其是理工科领域,鲜有涉及,更别提这些研究领域的最新成果和最新概念了。而翻译软件由于其存储量大、更新快的特点,弥补了人工翻译的局限。
例如,在一篇介绍计算机研究领域的论文摘要中谈到:“DFA的最小化是有限自动机应用及实现方面的重要问题之一。”由于专业知识的限制,笔者对于这句话中的DFA和有限自动机无法理解,只能求助于翻译软件。DFA想必是业内已经达成共识的对某一术语的缩写,可以套用这一英文缩写。而对于“有限自动机”Google翻译软件将其翻译为 Finite Automata。由于海量的存储,翻译软件能翻译任何领域的专有名称。
另外,对于时下流行的新词,翻译软件同样与时俱进。在处理类似“低头党、剩女”等这类新词时,还可以借助于中国日报英语点津的新词(http: //language.chinadaily.com.cn/chineseterm.shtml) 的网络辅助翻译资源,或句酷( http: //www.jukuu.com) 类双语语料库,或通过搜索引擎查找特定的信息然后进行人工翻译等。
(三)提供多种句型参考
由于语料库的强大记忆功能,翻译软件不仅在词汇翻译上有强大的优势,而且能提供多种句型供译者选择,这样能在一定程度上突破译者的思维局限。
例如:一篇谈新闻摄影构图的文章摘要中提到:作为一种构图方式,虚实共生可以帮助新闻摄影分清主次,表达动静,起到“以少胜多”的作用,并且可以提升图片的艺术水平和美感。整个句子结构简单,翻译难度不大。如何翻译“以少胜多”,多种软件提供了多种翻译版本。Google翻译和百度翻译都翻译为“less is more”, 金山词霸是对此进行了解释“use the few to defeat the many”,但是提供了很多含有该词语的双语例句,供译者参考、比较和选择。
二、MT翻译论文摘要的人工干预
美国著名语言学家奈达(Nida)的观点,翻译可以分为三个层次:第一个层次是源语言与目标语言之间的词汇和语法结构的映射;第二个层次是根据交际原则来生成目标语言;第三个层次是基于特定文化背景的翻译。[9]3目前机器翻译优势仍限于词汇的转换,也就是说仅能处理第一层次的翻译任务。学术论文摘要翻译与一般的文学翻译存在区别。学术论文属于议论文,文章重论述,具有客观性、严密性等特点,而论文摘要更是具有高度的概括性,用简洁的语言介绍文章的主体内容。相比较于文学翻译的复杂性和模糊性,比较适合机器翻译。但是由于论文摘要篇幅短小,语言简练,尤其是人文学科领域的论文摘要更是言简意赅,使机器翻译遭遇短板.
机器翻译究其原理,是借助语料库的技术,包含处理不同文法结构、词汇辨识、惯用语的对应等,实现自然语言的自动翻译。一般来说,两种语法规则相近的语言较为适合机器翻译,如英语和法语。但是汉语和全球其他语言之间并没有太多的共通之处,汉语是最大的符号集。英语和汉语之间的语法规则、形态变化、语用形态等方面都存在巨大差异。影响英汉机器翻译的最大障碍是由于语法和句法差异导致的词语顺序不一致。理想的机器翻译是可以完全代替人脑进行语言的分析、转换、重组等过程,但是目前的翻译软件还远远达不到这个水平。因此,现阶段,机器翻译都需要人工辅助才能完成。
同样在网络调查中,88.75%的受访者表示机器翻译的译文效果不理想。由于机器翻译软件无法处理复杂的语法、文化内涵等问题,因此,人工介入必不可少。在笔者的网络调查中,93.75%的受访者表示机器翻译的译文需要人工进行修改。要想使机器翻译的译文达到理想的状态,需要通过以下三个阶段来实现:
(一)译前消歧
无论是人工翻译还是机器翻译,在翻译之前都要对原文本进行分析。分析阶段一般分为词法分析、句法分析、语义分析、语境分析等几个步骤,其中以词法分析和句法分析为主。[9]43在机器翻译的分析阶段进行人工干预的主要目的是对文中难以解决的、产生歧义的地方进行消歧。 因此,我们首先对于原文中可能出现歧义的地方进行干预。
1.切分歧义。 汉语和英语不同,不存在词的形态变化,在表达时以汉字为最小单位,没有分割标志,人在阅读汉语文本时,根据自身的语言和文化知识进行切分理解。而机器翻译目前还不能达到人脑的自动分词水平,因此汉语的自动分词是使用机器进行汉翻英或其他语种的一个难题。比如“政治局面对我方有利”使用软件翻译时可能存在着多种切分情况:
政治/局面/对我/方/有利;
政治局/面对/我方/有利;
政治/局面/对/我方/有利。
以汉语为母语的读者对于这句话的理解一看就知道是第三种情况,但是目前的机器软件无法做到这一点,况且,第二种断句情况我们并不能判断为错误,如“政治局/发出/新的/号召。”
2.语义歧义。汉语属于意合语言,本就存在着多音字、多义词,由此造成很多歧义现象。如一篇名为《男女大学生消费观同异性调查与分析》的文章,旨在研究大学生不同的消费观念。其中的“同异性”就存在歧义,既可以理解为性别的同异性,也可以理解为消费观念的相同性和不同性。因为文章前面已经将男女大学生在性别上加以区分,因此,此处应该做后者理解,翻译应为“commonness and difference”。
(二)译中比较
自上世纪90年代,机器翻译进入新的繁荣期后,机器翻译软件蓬勃发展,大量的翻译软件不断涌现。时至今日,为广大网民熟知的翻译软件有Google翻译、有道翻译、百度翻译、金山词霸、雅虎翻译、海词等。通过问卷调查发现,参与问卷调查的274名网民主要倾向于使用有道翻译(48.86%)、Google翻译(25%)、百度翻译(22.73%)这三款翻译软件。
笔者对这些翻译软件在单词、专业术语、句子、段落、网页等方面的翻译进行对比试验,结果发现:在单词翻译方面词典类在线工具具有先天优势。便是有些生僻的词也不在话下,而且释义周详,不同词性的释义都一一列举。如金山词霸包含147本版权词典,完整收录《柯林斯高级英汉双解词典》和80万专业词条。有道词典完整收录《柯林斯高级英汉双解词典》、《21世纪大英汉词典》等多部权威词典数据,总共覆盖3700万词条和2300万海量例句。在句子和段落的翻译方面,Google 翻译的结果的可读性最强,最符合真实的语言规则。在网页翻译方面,有些翻译软件不能提供网页翻译,如雅虎翻译,其他几款软件比较的结果得出,Google 翻译和有道翻译的中文网页的准确性比较高,排版布局也没有错乱。
例如,一篇题为《乡情与政治》的论文摘要中提到:民国时期,旅沪皖人遍及上海社会各阶层。他们虽身在沪滨,但心系桑梓,时刻关注着家乡的时势发展和政局变迁。将这句话输入有道翻译和Google翻译分别得到以下译文:
Anhui tour during the period of the republic of China, Shanghai people in Shanghai all social strata. They are in Shanghai, but heart is the native place, paying attention to The Times development of hometown and political change.(有道翻译)
Republic of China, Shanghai and Anhui people across all sectors of the Shanghai community. Although they are in Shanghai coast, but the heart of the homeland, always concerned about the current situation of development and political transition home.(Google翻译)
两处译文中都存在语序、语法等多处错误,如对“旅沪皖人、心系桑梓”的翻译都不准确。但有道翻译的译文的第一句就存在严重的语法错误,第二句的“时事发展”也没有翻译准确。Google翻译的译文更为连贯、更符合语法规则。但是对“身在沪滨”的翻译过于刻板,通过对原文的理解,“沪滨”并不是确指上海的海滨,这里通过上海所处的地理位置来确指上海这个城市。因为前一句也提到了“旅沪皖人遍及上海社会各阶层”,就说明了安徽人并不一定都集中在上海的沿海地带。因此,此处翻译将“coast”省略更为妥当。
由此可见,在翻译的过程中,并不是将原文直接输入某个翻译软件那么简单,要通过对多个翻译软件的译文进行对比,这样也能发现更多的问题,然后对这些问题进行人工修改、润色,这也就进入翻译的下一个阶段了。
(三)译后润色
虽然经过前两个阶段的人工干预,但是机器软件翻译的译文往往还是会存在错译、误译等问题。机器不能像人脑一样对原文进行全方位的理解和分析,如前面提到的“身在沪滨”的翻译,就需要译者根据自身对原文的理解来对译文进行修改。同时,两种语言中的文化现象也使得翻译软件无法处理。随着社会的不断发展,各种新鲜事物不断涌现。与新的科学技术成果有固定的翻译术语不同,社会中出现的新的文化现象往往为某一文化所独有,需要一段时间为其他文化居民所理解和接受。翻译所要传达的是语言背后的文化内涵和它的使用者的精神,因此绝非唾手可得之事,甚至“越是简单的文字越不好译,往往易稿多次,还是不能满意”。[6]22
例如,大学生村官是20世纪90年代出现的一个新鲜团体,指的是到农村(含社区)担任村党支部书记、村委会主任助理或其他村“两委”职务的具有大专及以上学历的应届或往届大学毕业生。一篇研究大学生村官论文首先介绍“大学生村官是近年来国内新出现的一个独特团体”。将这句话输入Google 翻译,除了存在语序错误外,大学生村官直接按照字面翻译为“student village”,让人无法理解。因此,需要译者通过对原文的理解、解释,然后进行翻译,笔者认为可以翻译为college-graduate village official”。
就目前的机器翻译技术来说,机译系统的译文参照原文进行理解一般可以做到,但难以达到直接输出译文稿而无需人工润色的质量,所以后编辑处理在许多情况下都必不可少。只要人工后编辑的工作量远远小于直接从原文翻译的工作量,那么机器翻译的优势就表现出来了。[9]42
三、总结
通过以上的探讨可知,随着语料库的发展,广大在线翻译软件为论文摘要翻译提供了多种便利,但是没有人工干预的译文往往漏洞百出、无法理解。因此要保证译前消歧、译中比较、译后润色三个阶段必不可少,这样才能省时省力的得到较为理想的译文。机器翻译是个跨学科课题,涉及计算机语言学、自然语言理解与处理、翻译学等多个领域,要想提高机器软件的翻译的水平,需要各个领域的专家学者共同努力。希望通过本文,有越来越多的研究者能够重视机器翻译在英文摘要翻译中的优势及其应用方法,从而切实提高英文摘要的质量和水平。
[1]王高生.论文摘要的撰写及英译[J].中国科技翻译,2005(2):9-12.
[2]王慧博. 汉英摘要翻译的话语分析理论研究[J].南昌教育学院学报外语研究,2011(8):161-163.
[3]陈吉荣,赵永青.论文摘要英译的翻译显化[J].西安外国语大学学报,2012(1):122-125.
[4]曾剑平,叶卫华. 社科学术论文摘要的编译[J].中国翻译,2013(3).
[5]邓军涛,许明武.科技论文摘要汉译英典型问题探究[J].中国科技翻译,2013(2):11-14.
[6]李正栓,孟俊茂.机器翻译简明教程[M].上海:上海外语教育出版社,2009(9).
[7]中国互联网络信息中心.第37次中国互联网络发展状况统计报告:http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201601/t20160122_53271.htm.
[8]曾祥发,张洁.浅析论文摘要英语翻译错误[J].中国中医药现代远程教育,2008(6):602-604.
[9]刘建刚,张艳莉.实用文体伪翻译现象研究[J].上海翻译,2007(2).
责任编辑:李应青
On the Application of MT of Translating Abstract
Tu Wangbei, Tang Erlong
With the popularity of Internet, MT(machine translation) has been widely used. Owing to the huge storage of the corpus-based translation softwares, it is possible to translate the short, concise abstract by MT. However, the translation quality is not satisfying, so it is necessary for the translator to intervene in pre-translation, the process of translation and post-translation in order to solve the problems like segmentation ambiguity, semantic ambiguity, and not-corresponding cultural phenomenon.
Machine Translation; abstract; translator’s intervention
H319.3
A
1673-1794(2016)04-0039-05
涂王贝,安庆师范大学外国语学院讲师,硕士,研究方向:翻译理论与实践;唐尔龙,安庆师范大学外国语学院讲师(安徽 安庆 246011)。
教育部英语国家级特色专业项目(TS12154);安庆师范学院青年科研基金项目(SK201414)
2015-12-17