机器汉译英翻译在论文摘要中的应用反思
2018-01-29杜民荣高曌宇
□杜民荣,高曌宇
(1.山西广播电视大学,山西 太原 030027;2.中北大学信息商务学院,山西 晋中 030600)
论文摘要是对整篇论文的高度总结和概括,读者通过阅读论文摘要就可以清楚作者所要表达的含义,并且优质的论文摘要可以提高论文的检索率。随着全球化的发展,各国之间学术交流的频率越来越高,论文作为学术交流的重要手段之一所占据的地位越来越重要,摘要的地位也不容忽视,现在的很多论文在进行摘要翻译时仅仅是利用机器软件进行翻译,翻译的结果很容易出现语法不通、句子不顺畅等问题,致使翻译质量不高。如何翻译出质量过硬的英文摘要,已经成为很多学者专家的重要研究课题。本文通过研究机器翻译的发展,总结机器翻译的优势,以此探索利用机器翻译在论文摘要翻译中的应用,进而提高翻译质量。
一、机器翻译的发展及优势
机器翻译就是利用翻译软件将一种自然语言翻译成另外一种自然语言,汉译英即为将中文翻译成英文。机器翻译是1949年美国人WarrenWeaver提出的,5年后在美国乔治敦大学进行了机器翻译的成果展示。最初机器翻译是基于规则进行翻译的,但是语言是没有规则可以套用的,所以翻译的结果不能令人满意。再就发展到基于实例的发展,即为准备一个例句库,将要翻译的句子与例句进行对比,将不一样的内容进行替换,但是其结果并没有比基于规则的翻译强很多,再后来随着统计模型的应用,基于统计的机器翻译得到了飞速的发展,Google翻译就是基于统计模型进行翻译的。到了2014年,随着深度学习热潮的来临,机器翻译已经进入了神经网络机器翻译时代,这种翻译根据现有的平行语料学习,理解句中细微的语言特征。
就目前的机器翻译结果来看,机器翻译存在的最大问题就是语义的歧义性,自然语言在词汇、语法上往往会存在歧义,此外,文化的差异等也会带来歧义性,例如在《科技进步与对策》中一篇题为《中美国家科技决策体系:国家、部委和项目层面的比较研究》的论文摘要中提到:美国科技决策体系为典型的“自下而上”式决策结构,上层决策主体多元而分散,存在政治分肥;下层执行主体清晰,决策独立集中。[1]将这句话中的“政治分肥”进行翻译时即为“pork barrel”!这就是仅仅进行了字面翻译,没有理解摘要内在的含义,由此可以看出,机器翻译还是不够准确,需要人工参与。
但是相较于人工翻译,机器翻译的速率更快,效率也有显著的提高,在进行翻译时,用户仅需要将要翻译的内容粘贴到翻译软件上即可。机器翻译的语料库是非常丰富的,并且能够紧跟时代的发展,当前的所流行的新词、热词都能够包括进来。随着数据挖掘技术发展,机器翻译将能够从海量信息中分析提炼出最佳的翻译结果,这是机器翻译所追求的最终目标。因此可以将机器翻译的优点归纳为:
(一)能够将专用名词的翻译标准化
目前很多专用名词的翻译存在多个版本,不同翻译者产生的翻译版本也是不同的,所以对于专用的名词应该统一翻译标准。通过机器翻译就可以实现专用名词翻译的标准化。例如在《影像研究与医学应用》中一篇题为《法医临床鉴定中的磁共振成像技术应用》的论文摘要中提到:通过在法医临床伤者鉴定中,利用磁共振成像技术,从而有效地对伤者的具体患伤时间段、患伤的隐匿性损伤以及积液的具体性质进行分析,存在较高的可靠性,从而有效的在当前的临床法医鉴定中,提供了更加可靠的客观性成像依据[2]。这句话中的“核磁共振”在医学类的论文摘要中经常遇到,有时将其翻译为MRI,有时将其翻译为NMR,通过机器翻译软件,如谷歌翻译、百度翻译等可以看出都将“核磁共振”翻译成了NMR,这样人们在利用机器翻译时能够统一的将“核磁共振”翻译成了NMR,实现了专用名称的统一化处理。
(二)能够将最新的流行词汇进行贴切翻译
论文摘要尤其是科技论文摘要,往往包含了学者对最新科技的研究,同时,社科类的论文中往往是目前的社会现象进行研究,这样利用人工在进行翻译时会受到文化和译者学术水平的影响,而通过机器翻译可以利用其存储容量大、数据库更新速度快等优点实现对最新词语的翻译。
例如在《机械设计与制造》中一篇题为《核极化的特征选择算法在LSSVM中的应用》的论文摘要中提到:在研究多参数高斯核和核极化的基础上,提出了核极化优化多参数高斯核的特征选择LSSVM算法[3]。这句话中的LSSVM是最小二乘支持向量机的缩写,这在计算机类论文中是约定俗成的缩写形式,但是对“高斯核”、“核极化”的翻译就需要借助与机器翻译,通过谷歌翻译可以将其翻译为“gaussian kernel”、“Nuclear polarization”。
此外,在人人自媒体的时代,网络词汇也是层出不穷,例如在《计算机研究与发展》中一篇题为《莫做微信时代的“低头族”、“容器人”》的论文摘要中提到的:“低头族”、“容器人”都需要借助与机器进行翻译[4]。
(三)能够提供多种句型的翻译供用户选择
机器翻译的语料库的记忆功能是非常强大的,这样在进行翻译时不同的翻译软件可以翻译得到不同的结果,这些结果可以供用户进行选择。例如在《染整技术》中一篇题为《“虚实相生”水墨意境在平面设计中的构建》的论文摘要中提到:我国水墨画历来备受人们的喜爱,越来越多的平面设计师将水墨元素运用到作品中,追求一种虚实相生的意境[5]。翻译“虚实相生”时可以通过机器翻译得到翻译结果,经常会用到的翻译软件为“Virtual reality”,有道翻译为“false or true complement”,谷歌、百度翻译为“Virtual and reality”。在进行机器翻译时并不能把作者想表达的情感发挥出来,此外双语的双语翻译可以供翻译人进行比较、选择。
二、机器翻译论文摘要需要人工干预
翻译的最初目的是将源语言翻译成目标语言,随着人们需求的提高,翻译的最终目的是要与特定的环境相匹配。目前的机器翻译仅仅能够完成源词汇和目标词汇之间的映射转换,还不能做到信、达、雅。学术论文与一般的文学翻译还是存在一定区别的,前者是以议论文居多,文章更多的是进行事实的客观陈述,摘要更是对论文高度的概括,讲求的是严谨,所以在用机器进行翻译时并不能真正地做到语法、语义等通畅,因此在机器翻译时需要人工进行干预。
此外,通过网络调查也发现,很多用户认为机器翻译不能真正地理解自然语言,以及所处的语言环境,翻译时不能达到理想效果,因此在翻译时需要人工的参与,人工参与翻译主要可以分为三个阶段:一是翻译前消除歧义;二是在翻译过程中要进行多款翻译软件的比较,不能单纯地依赖于一款软件;三是翻译完要进行编辑。
(一)译前消歧
不管是通过机器还是人工进行翻译都需要在翻译前对原文进行分析,分析的主要目的是消除语法、语义上的歧义,使得译文更加符合特定的语境。
汉语和英语是在词的形态上存在不同,在汉语理解方面人们一般不会特意地进行语句的分割,会根据自身的语言习惯和文化进行语句的分割和理解,可是在利用机器进行翻译时并不能做到自行分词,机器翻译会对一句话存在多种分词,例如在《党政研究》中一篇题为《网络政治参与对中国社会政治稳定的影响》的论文摘要中提到:网络政治参与也对我国的民主机制和社会政治稳定等方面提出了严峻挑战[6]。在利用机器翻译时就有了以上多种切分方式:
网络/政治参与/也对我国的民主机制和社会政治/稳定等方面提出了严峻挑战
网络政治/参与也对我国的民主机制/和社会政治稳定等方面/提出了严峻挑战
网络政治参与/也对我国的民主机制和社会政治稳定等方面/提出了严峻挑战
在进行人工翻译时能够根据第三种理解情况进行翻译,而机器翻译还能智能的理解语义,因此需要人工进行断句。
(二)译中比较
随着计算机技术的发展,机器翻译的软件也是层出不穷,比如谷歌翻译、百度翻译、有道翻译等等。在翻译的过程中不能将原文直接输入到翻译软件中直接进行翻译,这样会在语法、语序等方面存在一定的问题,因此需要在机器翻译完后,通过人工修改使得译文顺畅,具有可读性。
例如在《数字技术与应用》中一篇题为《基于蚁群算法的多农业机器人路径规划研究》的论文摘要中提到:针对多机器人群体作业容易出现路径冲突和碰撞的问题,本文基于蚁群算法,设计和研究了多农业机器人路径规划和导航系统,实现了多农业机器人移动路径的实时动态规划和自主导航功能,为机器人进一步发展提供了一定的理论基础[7]。有道翻译和谷歌翻译对其翻译分别为:
有道翻译:For multi-robot group homework easy path conflict and collision problems, this article is based on ant colony algorithm, the design and research the agricultural robot path planning and navigation system, implements the more agricultural real-time dynamic mobile robot path planning and function of autonomous navigation, for robot provides a certain theoretical basis for further development
谷歌翻译:Aiming at the problem of path conflict and collision in multi-robot group operation, this paper designs and studies the multi-agricultural robot path planning and navigation system based on ant colony algorithm, and realizes the real-time dynamic planning and autonomous navigation function of multi-agricultural robot moving path. The further development of the robot provides a certain theoretical basis.
英语和汉语的断句是不一样的,汉语在表达时可以通过多个逗号形成一段话,但是英文是不可以的,主谓宾形成一句话后应该以句号结束,而通过上述两种机器翻译结果可以看出,不管是谷歌翻译还是有道翻译都是一逗到底,不符合英语的写作规范。此外,在翻译的过程中存在多处的语法、语序的错误,有道翻译的第一句就不准确,直接就是汉语和英语直接的词与词的翻译,整个翻译缺乏逻辑性,对“实时动态规划和自主导航功能,为机器人进一步发展提供了一定的理论基础”翻译不准确,通过翻译分不出主语在哪儿。虽然谷歌翻译的连贯性加强了,但是在翻译时还是略显呆板,对于最后一句“为机器人进一步发展提供了一定的理论基础”,完全可以根据语境来翻译,可是机器还是按照字面进行硬性翻译,完全可以根据前后文的语境翻译为“The study of path planning provides a theoretical basis for further development of robots.”。
(三)译后审校
通过以上的阐述可以看出,在进行论文摘要的中英文翻译时机器翻译的译文中出现错误是不可避免的,并且机器翻译不会像人工翻译考虑上下文的衔接,以及上下文之间的联系,仅仅是进行两种语言的映射。此外,翻译不能单纯地认为是两种语言之间的转换,要充分地考虑背后文化对其影响,要将文化内涵反映出来,而机器翻译不能兼顾形和神,所以在翻译完后需要人工的审校和润色。例如《网红经济热现象分析》的摘要提到:网红经济作为一种以网络为平台、以社交媒体为传播载体的粉丝经济,是新经济的组成部分。网红作为一种能够被无限拓展的商业媒介,网红经济更成为互联网新经济业态多元化的一个缩影。[8]其中提到的“网红经济”直接输入到百度翻译中翻译为“Net red economy”,这个翻译太直白了,无法满足翻译所要求的不仅语句通顺,还得具有可读性,因此通过对原文的理解以及对网上相关的信息的调研,可以将其翻译为Wanghong economy/Internet celebrity economy。
例如在《潘天寿艺术的孤独与静美》的摘要提到:它也许是“大江阔千里,孤舟无四邻”的广袤和寂寥,也可能是“寻寻觅觅,冷冷清清,凄凄惨惨戚戚”的悲戚和哀婉。[9]其中“寻寻觅觅,冷冷清清,凄凄惨惨戚戚”就不能直接翻译,虽然这种叠字不容易翻译,但是在翻译时要尽量根据语境进行翻译,做到生动、形象。
由此可以看出,现在的机器翻译能够做到对一般词汇或者语句的翻译,但是翻译完,还需要人工参与进行修改和润色,所以人工在机器翻译中还是起着非常重要的作用的,只不过是通过机器翻译的参与使得整个翻译工作的效率得以大幅度的提高。
三、总结
通过机器翻译在论文摘要翻译中的应用可以看出,随着大数据挖掘以及人工智能技术的发展,机器翻译的效果会越来越好,但是人工干预还是非常有必要的,不然翻译出的译文会有语法、语义不通等问题,因此在利用机器翻译时要通过人工对翻译前的摘要进行消除歧义,在翻译过程中要利用不同的翻译软件进行对比,最后要进行润色,使得译文能够符合语境。希望今后越来越多的学科的学者和专家深入到机器翻译的研究中来,使得机器翻译的优势得到发挥,有效地提高论文摘要翻译的质量和水平。