APP下载

翻译过程的非线性与机辅翻译的有限性

2013-07-18唐烨

大陆桥视野·下 2013年5期
关键词:机器翻译非线性语料库

唐烨

摘 要 本文从非线性这个概念入手,论述了翻译过程的非线性过程的内涵,并举例说明了由此而导致的机器翻译存在的有限性,指出由于英汉两种语言之间的差别,使得翻译过程不是简单地一一对应的过程,而是一种复杂的多因素影响的结果,如语境因素及文化差异。而这些问题在目前的机器翻译中没有得到有效地解决,致使机器翻译的适用范围有一定的局限性。

关键词 非线性 机器翻译 语料库 文本类型

一、引言

随着全球化的发展和科学技术的进步,翻译工作也面临着越来越大的挑战。全球文化和科技的交流,极大地拓宽了翻译市场。科技的迅猛发展,也使翻译工作由传统的人工作业逐渐向计算机作业转变。然而机遇和挑战并存,机器翻译虽然方便快捷,但是目前来看还缺乏准确性,使用的范围不够广,从质量上无法满足时代的需求。为了分析计算机翻译有限性的原因,本文先提出了一个非线性的概念,然后通过对汉英语言的对比,分析翻译过程的非线性过程,并借以说明机器翻译的有限性,并通过机器翻译和笔者翻译来进一步对比证明。

二、翻译过程的非线性

1.非线性的定义。非线性是一个数学的、物理的概念,要谈非线性,首先要从线性这个概念说起。所谓线性即linear,是指量与量之间按比例、成直线的关系,在数学上可以理解为一阶导数为常数的函数,其画在函数图上会呈现一条直线,见图1。

线性意味着方程的解与方程本身是一种一一对应的关系。以y=2x+1为例,x=1时,y只有唯一解,即y=3。线性也意味着系统的简单性,但世间万物的自然现象就其本质来说,都是复杂的,非线性的。非线性即non-linear,是指两个变量间的关系,是不成简单比例(即线性)关系的,也就是说其画在函数图上不会呈现单一一条直线,有可能会是折线或者呈曲线状。如图2所示为一个非线性函数,y=x3-9x。

非线性意味着一种非一一对应的关系,是复杂的、曲折性的。我们在处理非线性关系时,就要考虑到多方面的因素,翻译活动即是如此。

2.翻译过程的非线性定义。“翻译是以符号转换为手段、意义再生为任务的一项的跨文化交际和活动”,而翻译的过程即是解释符号意义的过程。而英汉之间的翻译就是解读英语和汉语这两种语言符号的过程。汉语是有别于英语的语言符号系统,因此两者之间存在的巨大差别,是我们在翻译过程中碰到的主要障碍。汉字是人类历史上最古老的表意文字之一,它具有形象化、表意为主表音为辅较强的稳定性等特征。而汉字的这些特征,是英语这一拼音文字不可比拟的。下面我们从语音和语法方面对现代汉语和现代英语之间进行一个概略比较,见表1。

从上表1可以看出,汉语和英语的语音系统,尤其是语法系统,差别很大。由于汉语与英语之间相去甚远,汉语和英语这两种符号之间的翻译就不可能做到一一对应,更不可能像一次线性函数方程一样找到唯一解。也就是说,翻译的过程是一种非线性的过程。要准确地进行翻译,不仅要理解句义、理解词义,更要理解语境,理解两种语言之间存在的文化差异。而对于语境和文化之间的理解和解析,只能通过译者的揣摩,这一点通过机器是无法做到的。

三、基于语料库的机器翻译

1.机器翻译的概念。所谓机器翻译(machine translation)是指把一种自然语言生成另一种自然语言的计算机系统,是在没有人工干预的情况下,由机器进行语言之间的转换。通常我们利用计算机的计算能力来分析源语中的话语结构,并将其分割成为易于翻译的单元,从而在目标语中以相同的结构重新创建话语。而机器翻译则是基于语料库而建立起来的。

2.语料库的概念。那什么是语料库呢?语料库的英文是corpus,有“集合”、“全集”之意。因此,在通俗意义上,语料库就是语料收集的仓库。而作为专业术语,不同的人对此有不同的说法,在这里我们采用《语言学和语音学词典》中的定义。语料库是“语言资料的收集,通常是经加工后带有语言学信息标注的语料文本,可以被用作语言描述的起点或验证语言假设的方式”。由此看来,语料库作为语言样本的集合,不仅仅包括一些文本文件,还包括电子文件。语料库是真实的,译为语料的收集取自于真实的语言材料,取自于正在“使用中”的语言,来自于我们的工作、生活,来自于各种正式的、非正式的环境,能够反映语言变化的规律,代表和体现了无限真实的语言环境。因此,我们也可以说语料库是人们长期生活积累下来的习惯性话语,翻译的工作就是将一种语言迅速对应到另一种语言的习惯性话语上,译出让受众都能理解的文本。

3.基于语料库的机器翻译。在本文中,我们主要讨论的是基于语料库的机器翻译,因此分析基于语料库的机器翻译的模式,将更有利于我们了解机器翻译的过程,以找出其局限性。基于语料库的机器翻译主要有以下两种模式:基于统计的翻译方法和基于实例的翻译方法。基于统计的机器翻译方法是把翻译问题看作是一个噪音信道问题,源语言经过一个噪音信道而发生了扭曲变形,因而在信道的另一端展现为另一种目标语言,翻译的问题实际上就是如何根据观察到的目标语还原成为最可能的源语。实质上是采用了一种概率计算的方法,把源语和目标语看成两种对应的模型,通过统计分析映射来解决翻译问题。而基于实例的方法是把翻译看成是一种解码过程。系统根据已有的翻译样例分析源句和目标句,计算匹配程度,并查找出和源句词汇和表达最相配的目标句。以此类推,直至生成完整的句子。

由此可以看出,基于语料库的机器翻译在翻译过程中完全依赖于语料库的健全程度,分析时是基于单个词语或单个句子,并从语料库中调用相应的对齐词语或句子。然而翻译时需要考虑的语境和文化因素是无法靠语料库进行解读的。由于翻译过程经常依赖于超语言信息,这些信息用计算机术语很难捕捉,换言之,正确理解自然语言在很大程度上依赖于人类的语言直觉。从这个意义上来讲,机器翻译具有一定的有限性。

4.机器翻译的有限性。由以上分析可以看出,翻译的非线性过程意味着在翻译时我们要更多地考虑到两种语言之间的文化差异和语境,而机器翻译则是基于一种规则,按照程序的指令进行翻译,无法将文化因素考虑进去。因此,我们可以认为机器翻译的可译度应该与文本的体裁类型密切相关。文本的文学程度越高,即所包含文化的因素越多,机器翻译的可译度越低;相反,文本越偏向自然科学等陈述事实的文体,包含文化的因素越低,机器翻译的可译度越高。下面将分别以科技文体和文学文体为例,讨论机器翻译的可译程度。

例1.As a technology bringing together several fields including physics, chemistry, biology and computer sciences, nanotechnology will, theoretically, enable you to make everything we can make today.

谷歌翻译译文:作为一个汇集多个领域,包括物理,化学,生物学和计算机科学技术,纳米技术,从理论上说,让你做的一切,我们今天可以。

有道词典译文:作为一项技术,召集几个领域,包括物理、化学、生物学和计算机科学、纳米技术,从理论上讲,使你能够让一切,我们可以让今天。

SYSTRAN译文:作为带来几个领域包括物理的技术,化学、生物和计算机科学,纳米技术,理论上,将使您做我们可以今天做的一切。

笔者修改译文:纳米技术,集多学科于一身。包括物理,化学,生物学和计算机科学技术。从理论上讲,纳米技术可以制造出现有的所有东西。

将三种机器翻译的译文进行对比发现,机器翻译对专业名词的翻译不会出现错误,因为可以直接调用语料库中的专业词典信息,而无需考虑文化因素的影响。而机器翻译时基本不会改变原文语序,导致句子的理解有不恰当的地方。但是笔者根据机器翻译结果只需进行小部分调整语序即能完成。

例2. While the present century was in its teens, and on one sunshiny morning in June, there drove up to the great iron gate of Miss Pinkerton's academy for young ladies, on Chiswick Mall, a large family coach, with two fat horses in blazing harness, driven by a fat coachman in a three-cornered hat and wig, at the rate of four miles an hour.(W.M.Thackeray:Vanity Fair, Ch.1).

谷歌翻译译文:而在本世纪是在其十几岁,和1六月,天气晴朗早晨,有驾驶起来的伟大的铁闸门的陆平克顿的年轻女士,奇西克购物中心,1大型家庭教练2炽烈线束脂肪马,中国科学院,驱动由脂肪车夫在三个角的帽子和假发,在每小时4英里的速度。

有道词典译文:而现行的世纪的青少年,在一个早上吹拂在六月,那里开到大铁门的平克顿小姐的年轻女子学院,句购物中心,一个大家庭的教练,有两匹马具脂肪燃烧,驱动在三角帽的语意连贯和假发,四英里每小时的速度。

SYSTRAN译文:当前世纪是在它的十几岁之内和在一个阳光照耀早晨在6月时,那里驾驶了到Pinkerton小姐的学院巨大铁门小姐的, Chiswick购物中心,一位大家庭教练的,有二匹肥胖马的在燃烧的鞔具,驾驶由一位肥胖马车夫一顶三角帽子和假发的,以四英里每小时的率。

笔者修改译文:当时我们处在这个世纪的前十几年。六月里的一天早上,天气晴朗,阳光明媚。契息克林荫道上平克顿女子学院的大门前来了一辆宽大的私家马车。拉车的两匹肥马套着雪亮的马具,驾车的马夫带着假发和三角的帽子,赶车速度1小时4公里。

而机器翻译的文学文体时,基本上只是翻译出单个词语的意思,脱离了整个语境,句子成为了词语的简单堆叠。笔者需要结合语境经过大量加工修改,才能完成。

通过以上对比可以看出,机器翻译存在的有限性表现在:(1)对于句法复杂的句子处理时,过于简单化,使句子失去了原有的语义关系。由于英语句法结构的复杂性,机器无法准确确定某一词语在句子里的依附关系。如第一篇文本中“make everything we can make today”,机器翻译时,无法分析出这句话中“we can make today”是“everything”的同位语,导致译文将这一小句翻译已成了两个毫无关系的句子“让你做的一切,我们今天可以”;(2)由于语义存在的模糊性,使翻译出的句子脱离了语境意义。由于每个词语放在不同的语境中都会产生不同的意义,因此在翻译时需要结合语境考虑,而机器翻译做不到这一点。如第二篇文本“Chiswick Mall”一词中的“mall”不再是原意“百货商场”而根据语境和上下文,这里指的是“林荫道”。

由此可见,机器翻译在处理文学类文本时难度相对较大,而对于非文学类文本的可译度较高。主要原因在于后者所使用的语言具有句法结构相对简单、词性较为单一,形式较为规范等特点。因此,机器翻译目前更适用于“科普文献、金融商业交易、行政管理备忘录、法律文书、说明书、农业及医学资料、工业专利、宣传册、报纸等”。机器翻译要克服这些局限性,实现全自动翻译,译文质量达到专家水平还需努力。虽然目前机器翻译在一定的专业领域,尤其是科技领域中已经广泛成功的使用,但是在大部分文学作品的翻译中,机器翻译的准确度是非常低的。目前的大部分机器翻译还是基于孤立的句子为单位,因此机器翻译未来的发展方向还是要努力考虑语境因素,将范围扩大到句群甚至整个语篇,这样语意间的转换才会更为准确。这样不仅能提高翻译的速度,更重要的是能提高译文的质量。

五、结束语

本文从介绍非线性这个数学概念出发,将这个概念引入翻译中,由此讨论了基于语料库的机器翻译,及由于翻译过程的非线性而造成的机器翻译的有限性,并通过科技文本和文学文本两个例证对比证明了机器翻译的适用范围存在着一定的局限性。机器翻译要实现真正意义上的全自动翻译,必须跨过对语言的浅层次分析而进入深层次的分析领域,努力考虑语境、篇章因素。机器翻译要达到高质量、高精确性的译文,还有很长的路要走。

参考文献

[1]Hutchins, W. J. & H. L. Somers. An Introduction to Machine Translation[M].London:Academic Press,1992,3.

[2]陈海东.计算机翻译存在的困难及解决方法新探.广东科技,2009,第219期:87-88.

[3]陈宏薇.高级汉英翻译.北京:外语教学与研究出版社,2009.24-25.

[4]刘杨.语料库与机器翻译.大众文艺,2009,第19期:23.

[5]许钧.翻译论.武汉:湖北教育出版社,2003,75.

[6]余国良.语料库语言学与应用.成都:四川大学出版社,2009.

猜你喜欢

机器翻译非线性语料库
《语料库翻译文体学》评介
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
大数据背景下石油科技翻译
大数据背景下石油科技翻译
电子节气门非线性控制策略
基于SolidWorksSimulation的O型圈锥面密封非线性分析
机器翻译不可盲取
四轮独立驱动电动汽车行驶状态估计
工业机器人铝合金大活塞铸造系统设计与研究