APP下载

基于语料库的《红楼梦》两个译本对比研究

2009-08-31郑振隆

文教资料 2009年19期
关键词:红楼梦

郑振隆

摘要:建立语料库进行语言研究的方法得到了人们的普遍认可。本文作者从翻译语料库对翻译研究的重要意义入手,重点介绍了以自建的《红楼梦》部分译文平行语料库为基础的翻译批评研究,通过Antconc,Word, smith等语料库软件分析得到中文文本和英文文本这两者的词频、字数、词汇类别等信息,进行了双语间的比较,找出了两种语言文本的差别以及其中的翻译现象。作者认为可以对不同版本译文之间和原文译文之间进行全面的对比分析,通过定量分析和功能阐释,获得各种客观的研究结论。

关键词:《红楼梦》 平行语料库 翻译批评 文 本

1引言

“随着科学技术的不断发展、计算机的广泛应用,通过建立语料库进行语言研究的方法得到了人们的普遍认可。这种通过利用语料库储存数据大、计算机运行速度快、语料库工具能准确地对大量数据进行检索统计的研究方法更有利于研究者对语言进行系统、全面的对比分析,通过定量分析和功能阐释相结合,从而获得各种客观实用的研究成果”(Biber,2000:233)。鉴于此,笔者自建语料库对《红楼梦》的翻译文本进行批评研究,以具体的数据为基础,对其中的规律性,尤其某些经常为翻译批评忽视的特点进行了探讨,以判其得失。笔者利用《红楼梦》原文和译文Txt纯文本,通过Antconc,Wordsmith等语料库软件分析中英文文本的词频、字数、词汇类别等信息,进行双语间的比较和两个译本直接的比较,以期找出两种语言文本的差别,以及其中的翻译现象。

2创建小型的《红楼梦》平行语料库的可行性

语言研究者已经可以自行建立中小型语料库,进行与语言相关的研究,包括翻译研究。根据用途,笔者自建的语料库规模不需要很大,因为研究对象不是一般的自然语言资源,也就是说,进行翻译批评研究的语料库是专用语料库。同时,与大多数现有语料库不同的是,自建的翻译语料库是平行语料库,即是把汉英两种语言中完全对应的文本输人计算机,并通过对比分析找出两者的对应关系。

笔者选择语料库统计软件WordSmith Tools和Anteonc,并且选用分词软件ICTCLAS,应用北大分词标准。笔者所创建的语料库的所用文本取自陈文伯出版的《英汉成语对比与翻译》中的《红楼梦》成语译例,包括霍克斯译本(以下简称霍译)和杨宪益译本(以下简称杨译)两个版本。汉语原文约为3000字,英语译文每个版本约4000字。

3《红楼梦》语料库在翻译批评中的实际应用

自建语料库语料以电子文本形式储存。并且通过计算机自动处理或者人机互助加工,进行词汇密度、词频、句子长度、搭配模式、特定词汇的使用及使用频率的比较研究等,致力于多维度、多层面的翻译批评工作,比如:考察原作和原作者的语言风格和模式,考察译文和译者的语言风格和模式,考察某种原语对译文模式的影响,考察不同翻译家对相似文本的不同处理和把握,在资料和数据充足的条件下,进行译者的认知过程和翻译策略等问题的探索。

3.1词频(Wordfrequency)

词频指各词形(wordform)在文本中出现的频数,词频统计是语料库分析中一个基本的统计手段。词频统计可以用于教材设计、文本分析和计算语言学等,其结果也可以用于其他更为复杂的统计之中。在翻译研究中使用词频统计对原文的用词风格,译文的用词风格乃至文体进行研究也有一定的帮助。下文以《红楼梦》和两个译本比较为例,简要介绍自建语料库进行的词语分布(pars—hag)和词频统计的研究。

在该项研究中用到Edict Virtual Language Center提供的在线Word Frequency Text Profile。首先,笔者使用E—dict的profile 3,将《红楼梦》霍译与杨译译文粘贴在指定的方框内,文本分析软件自动将输入的文本分别与英语中的最常用2000词表和学术词表作对比,结论如下:

(1)文本中分布的总词数4357;

(2)分布在最常用2000词表中的总词数=3622(83.13%);

(3)分布在学术词表中的总词数47(1.08%);

(4)不属于述两个词表的总词数688(15.79%)。

第二步,对杨译译本进行类似处理,得出的四项相关数据如下:(1)3602;(2)2952(81.95%);(3)29(0.81%);(4)621(17.24%)。

根据以上数据,基本可以认为霍译用词更学术化一点,行文更书面化,而杨译次之。

笔者采用按照词的频率递减排列列表,见下表:以上第一列是频数,第二列是百分比,第三列是类符(types,指语篇一共有多少个不同的词)。限于篇幅,上表仅为原始表格的极小一部分,但仅从这一部分表格就可以发现不少问题。of在两个译本中出现的频数差异比较明显,霍译中出现频率较多,达到3.0%,这可以证明,霍译使用的语言较为复杂,杨译次之,因为书面语言或学术语言中of出现的频率一般仅次于the。再对比一下形符类符比。霍译的为0.327,杨译的为0.351。通过这以上这个简单的例子可以说明词频表能在一定程度上使研究者从整体把握译文发现一些局部的具体分析容易忽视或无法证明的问题。

3.2中英文版本词频对比

词频统计一般可以产生三种词频表(wordlist),一种按照词的字母顺序排列(sort alphabetically),一种按照词的频率递减排列(sortmost~equentwordsfirst),还有一种按照词的频率递增排列(sortleastfrequentwordsfirst)。这三种词频表各有所长,都可能是进一步研究所需要的。这里笔者采用第二种列表,见下表:

把两个文本用Antcone软件进行词频统计,产生了一些有趣数据。Antcone中出现的有关这两个文本的前100个出现频率最高的词的词频(以词的频率大小排列)能帮助我们了解文本出现的频率异常高的词汇。在对以上资料进行分析后,笔者发现,《红楼梦》的“道”频率异常高,仔细分析发现,出现的“道”中有28个是表示“说”的意思,只有1个表示“路”。这说明了《红楼梦》白话文的一个重要特点——“道”字的特殊用法。

从中英文两个版本的词频对比中,可以看到词汇层面的不对应。对应词(又称“对等词”)指某一语言中的一个词与另一语言中的一个词是对等的,尽管词形和词义不完全一致。如英语的“basketball”和汉语的“篮球”为对应词。本语料库中,频数相仿的词汇中难以找到对应词,可以看出译文与原文的巨大差异。

3.3词汇类别统计

语言学并不是语料库检索软件应用的惟一领域,它也可以用于翻译批评领域来分析原语文本和译入语文本。笔者欲进一步探讨语料库检索软件在分析翻译文本中的应用,因此选用《红楼梦》两个英文译本,对其文本用wordsmith软件统计,它提供了有关这个文本的一些简略统计数字:

在这个文本中,形符数(tokens)指语篇一共有多少个词。类符形符比(type/tokenratio)指形符与类符的比率,即用词的变化性。从其字节数、形符数和句子数可以判断这是个较短的文本,将其类符形符比与标准类符形符比数比较,可以推断两个译文的词汇变化量都为中等程度,因为单纯的形符数和类符数不能反映语篇的本质特征,但两者的比率却在一定程度上反映了语篇的某种本质特征,即用词的变化性。平均词长为4,因而可以推断这个文本属中等难度水平,句子较长,篇幅较短。

4结语

从以上的各种分析来看,《红楼梦》的英文翻译文本难度适中,语言得体。这种译本易于阅读,不失严谨,对阅读者来说较合适。我们还可以得知,译者灵活翻译,不追求严格的形式对等,使译文流畅,达到功能对等,是一种较好的翻译。

本研究只是小范围、试验性的尝试,但还是可以看到。自建语料库进行研究,有助于客观地分析原著和译者的风格,也有助于原文和译文的对比分析,能为翻译批评提供可靠的量化依据,能令人信服。但是该翻译批评研究还有不少问题需要进一步探讨和探索,比如统计软件的功能有限。此外,语言外的因素如文化因素研究尚差强人意。我们不能让语料库的优越性挡住了眼睛,看不见在翻译研究中,质的分析往往比数量的分析更加重要(廖七一,2000:384)。

参考文献:

[1]Biber,D.et al.Corpus Linguistics [M].Beijing:For-eign Language Teaching and Reach Press, 2000.

[2]陈文伯.英汉成语对比与翻译[M].世界知识出版社,2005.

[3]廖七一.语料库与翻译研究[J].外语教学与研究,2000,(9):380-384.

[4]卡特福德著.穆雷译.翻译的语言学理论[M].北京:旅游出版社,1991.

[5]肖维青.自建语料库与翻译批评[J].外语研究,2005,(4).

猜你喜欢

红楼梦
论《红楼梦》中的赌博之风
从《红楼梦》看养生
话中话:《红楼梦》直接引语中的元话语分析
《〈红楼梦〉写作之美》序
《红楼梦》(四大名著大字本)
论改琦《红楼梦图咏》的观看之道
茹志鹃与《红楼梦》
《红楼梦》中侠义抒写述论
《红楼梦》(纪念版)
别样解读《红楼梦》