APP下载

基于语料库的《唐诗三百首》英译本研究

2014-03-21

关键词:唐诗三百用词词汇量

(上海外国语大学 研究生部,上海200083;四川师范大学 外国语学院,成都 610101)

唐诗代表了中华诗歌的最高成就,更是世界文化发展史上最具文采的巍峨耸立的高峰。唐诗选本众多,根据孙琴安考证,至辛亥革命为止,古代唐诗选本共有六百余种选本,其中目前尚存的有三百余种[1]自序,1。孙渚所编《唐诗三百首》是其中流传最广、影响最大的一部唐诗选本。正如光绪十一年(1885)四藤吟社主人在重刊《唐诗三百首补注》时所作《序》中称:《唐诗三百首》“风行海内,几至家置一编”[2]1。

《唐诗三百首》自刊行以来,除在国内翻刻流行外,也成为国外传播最广的唐诗选本,其中影响最大的译本有两个:一个是1929年出版的宾纳(Witter Bynner,1881-1968)与江亢虎(1883-1954)合译的《群玉山头:唐诗三百首》(TheJadeMountain:AChineseAnthology,BeingThreeHundredPoemsoftheTangDynasty,618-906)[3],这个译本是以孙渚所编《唐诗三百首》为底本,也是现有最早的唐诗选本全译本,在国外影响甚大;另一个是1988年由中国对外翻译出版公司发行的许渊冲等编译的英汉对照《唐诗三百首新译》[4],这个译本以喻守真版《唐诗三百首》为底本,译者全部是中国人。这两个译本由于译者的身份差异、译者的文化背景和翻译立场的不同而呈现出不同的特色。

以往对这两个译本的英译研究主要集中在译本的细节,如对原诗意象处理[5],对于音韵的处理[6],对原诗数字的处理[7],对原诗中色彩词的处理[8]。研究视角也限于传统的文艺批评视角,忽略了对于两个文本整体的实证性客观描述。

对于两个译本的比较,传统的定性分析方法趋于印象式批评,或者因为在进行文本细读的时候时间精力所限,无法对整个文本进行全面的细读,只能挑选某些具体的篇章甚至是段落来进行研究,这样的研究结果的科学性和可信度会为研究方法的主观性和研究对象的片面性所影响。本文利用翻译相关语料库软件建立小型的《唐诗三百首》原文本及两个对应译本的双语平行语料库,通过对本项目小型语料库的分析,统计出两个译本的独特词、特色词,考察译者翻译策略的差异。另外,通过在小型语料库中提取原文高频词的对应译文及文化负载词的相应译文,考察译者的文化翻译意识。通过上述量化分析,找出《唐诗三百首》两个著名英译本在词汇上的差别,以管窥豹,探微两位译者的翻译策略、翻译风格及翻译文化取向。通过上述分析,归纳出译者的风格,同时,从量化分析得出的译本差异出发,反思两个译本的差别及其在英美世界影响力的差异,为中国典籍的英译提供一些实用性启示。

一 研究背景与方法

本文对两个平行译本的研究从词汇入手。词汇量(vocabulary)在本文中主要指词汇的广度,即一个文本中出现过的单词量。单个词汇多次重复出现只计一次。译者在译文中使用的词汇量越大,说明译者的词汇越丰富,用词丰富是译文多样化的一个方面。从词汇角度来衡量的话,译文的长度体现在译文使用的总词数上,这里的总词数指的是译文的总用词量,译文一共有多少词汇,即单个词汇多次重复出现计多次,与词汇量完全不同,总词数的值应大于或等于词汇量的值。译文的总词数越多,则译文的长度越长。译文可读性体现在词汇方面,主要指译文词汇的常用程度,或称难易度,词汇越不常见,则阅读难度越高,译文的可读性就随之下降;反之,译文词汇越常见,阅读难度越低,译文的可读性就随之上升。当然,除了词汇这个因素以外,影响译文可读性的语言层面因素还有句长和句子结构等。

译者的风格反映在词汇层面主要考察的是高频词、独特词和特色词。所谓高频词指的是“在一个文本里使用频率特别高的词语。用一个词语在整个文本中所占的百分比或者该词语在整个词频中所处的前后位置来决定该词语是否为高频词”[9]5;所谓独特词就是指“在一个文本中词频达到一定水准而在另一个类似文本或其它多个类似文本中词频为零的词语”[10]269;所谓特色词,指的是“一个文本中词频较高而另一个文本或多个类似文本词频较低的词语”[9]112。这三类词结合起来研究,能为译者的词汇风格研究及翻译策略研究提供科学、有说服力的数据。

在研究译文难度方面,本文采取推断统计学的方法,随机抽取《唐诗三百首》中14首诗①及宾纳、江亢虎译本(下文简称“宾译本”)中的对应译文和许渊冲编译的译本(下文简称“许译本”)中对应译文作为研究样本,利用SPSS统计软件进行配对样本T检验。在进行配对样本T检验之前需要收集配对样本的数据,因此,使用语料库相关软件Concordance3.0,ConcappV4以及文本预处理软件Text PreProcessing对样本进行分析处理。

在研究译者的词汇风格、翻译策略方面,本文利用自建小型《唐诗三百首》原文本及两个对应译本的双语平行语料库,使用语料库相关软件Concordance3.0和AntConc对语料进行分析处理。

二 研究结果

(一)译文难度

1.用词丰富度

译本用词丰富与否,主要看作者用词的变化,译本中词汇变化主要反映在译本的词汇量上,词汇量越大,译本用词就越丰富。作者首先通过语料库软件Concordance3.0对两个译本抽取的14份样本译文进行了词汇量统计,得出如表1数据。

表1.宾译本、许译本抽样词汇量统计表

接下来根据表1中的配对数据研究宾译本和许译本的词汇量是否存在差异。假定许译本与宾译本的词汇量没有显著差异,即设定原假设H0:μ1=μ2,备择假设H1:μ1≠μ2。运用SPSS统计软件进行配对样本T检验后显示P值为0.479,远远大于0.05,在差分的95%置信区间内,没有充分理由,因而不能轻易否定原假设,即许译本与宾译本在词汇量上没有明显差异。也就是说,没有充分理由表明这两个译本中某一个译本的用词要比另外一个丰富,两个译本的词汇丰富度旗鼓相当。

2.译文长度

译文的长度细化到最后一个意义单位就是译文所使用的总词数,同样利用语料库软件Concordance3.0对两个译本抽取的14份样本译文进行了总词数统计,得出如表2数据。

表2.宾译本、许译本抽样总词数统计表

下面根据表2中的配对数据研究两个译本的总词数有无明显差异,通过这个研究能够看出两个译本在译文的长度方面是否有明显差异。假定宾译本与许译本的总词数没有显著差异,即设定原假设H0:μ1=μ2,备择假设H1:μ1≠μ2。运用SPSS软件进行配对样本T检验,结果P值为0.770,远远大于0.05,也就是说在差分的95%置信区间内,没有充分理由因而不能轻易否定原假设,即许译本与宾译本在总词数上没有明显差异。也就是说,没有充分理由表明这两个译本中某一个译本的总词数要比另外一个多,从抽取的样本推断两个译本的总长度没有显著差别。

3.用词难易程度

在证明了两个译本在译本总长度,词汇丰富度方面没有明显差异之后,本文进一步通过词汇对译文的难易程度进行研究。通过语料库软件ConcappV4,将两个译本样本的词汇分别与英语最常用2000词及英语次常用3000词进行比对,得出两个译本样本所有词汇在英语常用5000词汇中的数据,结果如表3。

表3.宾译本、许译本抽样词汇难易程度统计表

接下来根据表3中的配对数据研究许译本和宾译本的词汇难易程度是否存在差异。假定许译本与宾译本的词汇难易程度没有显著差异,即设定原假设H0:μ1=μ2,备择假设H1:μ1≠μ2。运用SPSS软件进行配对样本T检验,输出结果显示P值为0.003,远远小于0.05,在差分的95%置信区间内,有充分证据否定原假设,也就是有充分证据表明这两个译本的用词难易程度有着显著的差别。

另外,宾译本的样本均值是85.3571,标准差是6.84563;许译本的样本均值是80.5714,标准差是5.68012。即许译本样本均值小于宾译本样本均值,许译本样本标准差小于宾译本样本标准差。说明许译本用了更多英语常用5000词之外的词汇,用词难度要大于宾译本的用词难度,而且用词难度比较均衡,相比之下较少受具体诗篇内容、形式、体例等因素的影响;宾译本的用词难度则小于许译本,用词难度相比之下变化比较大,可能受到具体诗篇内容、形式、体例等影响较大。

4.平均句长

译本的阅读难度除了受词汇难度的影响以外,也受句长的影响,一般说来,平均句长越长,说明句子结构越复杂,译文的难度就越大。为了更全面的考察两个译本的阅读难度,作者进一步研究了两个译本抽样样本的平均句长。利用文本预处理软件Text PreProcessing分别对两个译本的样本进行了分析,得出了各个样本的平均句长值如表4。

表4.许译本、宾译本抽样平均句长统计表

将表4中的数据录入SPSS软件进行T检验,得知宾译本抽样样本句长均值为37.2171个词,许译本抽样样本句长均值为36.3850个词,这说明许译本的句长要略小于宾译本,但是差异不到一个词,即由于平均句长所带来的句型结构变化的可能性极小,对译本难度的影响也极小;许译本抽样样本句长的标准差为5.23723,这个值小于宾译本抽样样本句长标准差5.91795,这说明许译本的句长变化没有宾译本大,也就是说,许译本的句长更整齐,而宾译本的句长更参差。

(二)译者风格

译者的风格在词汇层面的体现即是译者的用词特色,包括了译本中的独特词和特色词。

1.独特词比较

笔者首先使用concordance3.0分析宾译本与许译本的独特词。宾译独特词共计2776个,按照使用频率由高到低的降序排列,得出表5。

表5.宾译本独特词前20位降序表

从宾译的独特词来看,宾译多采用意译法,不追求字面的绝对相等,而追求效果的近似。如:

例1.原文:开轩卧闲敞——孟浩然《夏日南亭怀辛大》

宾译:And open my window and lie down in peace.[3]114

许译:And by the open windows, I lie in the nook fair.[4]22

例2.原文:潭影空人心。——常建《破山寺后禅院》

宾译:And the mind of man touches peace in a pool……[3]7

许译:Shaded pools bring my heart to peaceful climes.[4]260

除此以外,唐诗中的“静”、“安”等等都被宾纳译作“peace”。如:“闲爱孤云静爱僧”译为“The lone cloud rather, the Buddhist peace”,“永安宫”译为“the Palace of Eternal Peace”,“山中习静观朝槿”译为“I have learned to watch in peace the mountain morning glories”。

宾纳的独特词中有大量的意象名词,如“wildgeese/wildgoose”,“valleys”,“monkeys”,“thatch”,“phoenixes”等等,说明宾纳在英译唐诗的过程中有意对这些意象进行了保留。对于一些英语中不常见的意象则采用了归化的策略,如将原文本中所有的“琵琶”都译成了“guitar”,用“angels”来翻译“神女”、“仙人”、“群帝”。同时,从宾译的独特词中也可以看出,宾译为了让目标读者的阅读顺畅,进行了一些增译,这也是宾译译文稍长于许译的原因之一。如:

例3.原文:寄书长不达,况乃未休兵。——杜甫《月夜忆舍弟》

宾译:Yet if missives in time of peace go wrong --

What can I hope for during war?[3]150

当然,宾译中也存在一些误译。如将所有的“汉”都译成了“China”:“汉使”译为“the envoy of China”, “汉地”、“汉家”译为“China”。

笔者使用同样的方法分析后,得出许译独特词共计1630个,按照使用频率由高到低的降序排列,得出表6。

表6.许译本独特词前20位降序表

从表6中可以清晰看出,许译本中缩略语占了相当大的比例,这些缩略语的使用达到了两个效果:一是保留原诗句子简短的特征;二是用这种方法将诗句中的两个音节变成一个音节,让两个对句的音节最接近,满足英诗中音节与音步的需要。如:

The children don’t know me, whom I meet on the way,

“Where d’you come from, reverend sir?” they smile and say.

—— Coming Home[4]7

将“do you”缩写之后,两行的音节均为12个。

2.特色词比较

与独特词研究同样有意义的是特色词的研究。在原文本相同的情况下,译者的风格更多地体现在特色词中。笔者使用AntConc软件对两个译本进行了对比分析,找出两个译本的特色词如表7。

表7.宾译本、许译本独特词前20位降序表

从表7中可以看出,宾译本的特色词主要集中在三类:其一,冠词,如“the”,“a”,“an”;其二,介词,如“of”,“to”,“on”,“in”,“at”,“toward”;其三,代词,如“this”,“that”,“my”。这些特征一方面说明宾纳译文比较正式,长度较长;另一方面也说明宾纳译文符合译入语重形合的语法规范。另外,宾译本的特色词中有大量的全大写词,如冠词“THE”,“AN”;介词“OF”,“TO”,“ON”,“IN”和“AT”;代词“MY”。这些全大写的词都是出现在诗歌标题中,说明宾译本的标题多为介词引导的名词性标题。

许译本的特色词中有大量的字母,这些字母都是与前面字母同时使用构成缩写,也就是说许译本中大量使用缩写,这一特征也使得许译本的句长要比宾译本的句长更短,从形式上更接近原文的行文高度浓缩的特征。同时这些缩写的使用也使得对句的音节更接近甚至完全相等,成功地在译入语中再现了原诗音韵方面的特色。

三 研究结论

根据以上的研究结果,我们可以得出如下结论。

1.《唐诗三百首》的两个译本,即《唐诗三百首新译》和《群玉山头》,在词汇量上没有明显差别。

2.《唐诗三百首》的两个译本在译本长度上没有明显差别。

3.《唐诗三百首》的两个译本相比之下,《唐诗三百首新译》的句子更加整齐,《群玉山头》句子长短更富于变化。

4.《唐诗三百首》的两个译本相比之下,《唐诗三百首新译》的词汇难度要明显大于《群玉山头》的词汇难度,且前者的词汇难度较平均,后者的词汇难度差异较大。词汇难度越低,文本的可读性就越高,因此,宾译本的词汇可读性总体上要优于许译本,但是宾译本中会有某些诗篇译文用词较为生僻,给读者造成阅读障碍,而译本中某些诗篇译文极其简单,读者阅读非常顺畅;许译本的词汇可读性总体上低于宾译本,但是整体的用词难易程度比较均衡,这样会导致许译本的读者被客观划定在具有一定词汇水平的读者群,而且这类读者的阅读感受会一直较为流畅,因为整个译本没有较大的词汇难度变化。

5.《群玉山头》从目标文本读者的接受出发,采用自由诗形式,多归化译法,译文详尽,句长参差,富于变化,对于原文中的意象,尽量保留或移植;《唐诗三百首新译》恪守“意美”、“音美”、“形美”之“三美”原则,采用“以韵译韵”的方法,译文简洁,句长相对统一、工整。

比上述结论更为有意义的是,通过推断统计学,我们意外地发现,母语、身份、背景、时代完全不同的译者在这两个译本的词汇量和译文的长短上并没有呈现出显著的差别,并没有体现出非常明显的母语优势。但是,译者的母语、身份、背景以及翻译目的的悬殊在词汇难度、句长分布方面得到了充分的体现。许渊冲先生作为一个将毕生心血倾注在中英文学互译、中法文学互译方面的翻译家,身体力行他自己提出的诗歌翻译“三美”原则[11],殚精竭虑将唐诗的形式之美在译文中体现出来,因此译文显得非常整齐,句长平均,少有变化。另外,许先生坚定地将中国文化和文字之美尽可能地在译文中呈现出来,因此译文词汇中会有较多富含中国文化意象的词,与英文常用5000词比较而言会有点生僻。而宾纳的合作者江亢虎深谙唐诗在中国家喻户晓、耳熟能详的蒙学读本地位;宾纳本人也明确认为要把“古代诗人那种活生生的简朴无华的风格传达出来……西方人就可以学到更多的东西”[9],想让更多的美国人予以借鉴。于是,宾纳译本的目标读者是美国普通民众,因此其译文词汇显得非常平易近人,通俗易懂,词汇难度的分布也不像许译本那么均匀,这样的特点使得这个译本受众群更广:无论是哪个层次的读者,只要掌握了英语常用的5000词汇,都能欣赏这个译本中的某些译文。这也能解释为什么后来英美出版的许多唐诗译本中译者都会提及曾经参考过《群玉山头》,这个译本“甚至成为了当今《唐诗三百首》电子文库的英文母本。众多西方读者正是通过这个选本认识和欣赏唐诗的精华部分”[11]。这个现象在中国大力推进中国文化“走出去”国策的背景下尤为值得重视。

当然,除了词汇之外,两个译本还有许多方面值得我们去仔细研究,本文也只是定量实证分析的一个粗浅尝试。翻译本身的跨学科性质就决定了翻译研究的多元模式,传统的翻译研究与语言学、文学、跨文化交际结合紧密,现代的翻译研究同样需要借鉴其他相关学科的研究方法、研究手段,汲取相关学科的最新研究成果,得出更多实证性、定量的科学的研究成果,从而更加科学真实地描述翻译。

注释:

①14个抽样样本依次为:《送杜少府之任蜀州》(王勃),《在狱咏蝉并序》(骆宾王),《杂诗》(沈佺期),《回乡偶书》(贺知章),《登幽州台歌》(陈子昂),《望月怀远》(张九龄),《次北固山下》(王湾),《凉州曲》(王翰),《登鹳雀楼》(王之涣),《凉州词》(王之涣),《夏日南亭怀辛大》(孟浩然),《过故人庄》(孟浩然),《春晓》(孟浩然),《宿建德江》(孟浩然)。

参考文献:

[1]孙琴安.唐诗选本提要[M].上海:上海书店出版社,2005.

[2](清)陈婉俊.唐诗三百首补注[M].北京:中华书局,1959.

[3]BYNNER W, KIANG K H.TheJadeMountain:AChineseAnthology,BeingThreeHundredPoemsoftheTangDynasty,618-906[M]. New York: Alfred A. Knopf, Inc, 1929.

[4]许渊冲,陆佩弦,吴均陶.唐诗三百首新译[M].北京:中国对外翻译出版公司,1988.

[5]李夷平.唐诗英译的意象再现形式及策略研究[D].沈阳:沈阳师范大学,2013.

[6]章国军.许渊冲译《唐诗三百首》之音韵美及意象美赏析[J].语文学刊,2007,(4):88-91.

[7]查金萍.TheTranslationofNumeralsinXuYuanchong’s300TangPoems[D].合肥:安徽大学,2012.

[8]贾冰.唐诗色彩词英译的语料库辅助研究[D].太原:太原理工大学,2012.

[9]冯庆华.思维模式下的译文词汇[M].上海:上海外语教育出版社,2012.

[10]冯庆华.母语文化下的译者风格[M].上海:上海外语教育出版社,2008.

[11]许渊冲.文学与翻译[M].北京:北京大学出版社,2003.

猜你喜欢

唐诗三百用词词汇量
强化诗词用词的时代性
《唐诗三百首》《宋词三百首》《元曲三百首》导读注译版本新近出版
《唐诗三百首》该被抛弃吗
苍凉又喧嚣:《我与地坛》中的用词
用词类活用法扩充词汇量
写话妙计之用词准确
Receptive and Productive Vocabulary in Language Teaching
汪曾祺小说的用词特点赏析
文武双全
On Mo Yan