基于语料库的张爱玲自译散文语言特征探究
——以英语原创作品自译为汉语作品为例
2024-04-01李兰
李兰
(北方民族大学 外国语学院,宁夏银川 750021)
如果有作家翻译自己的作品,国内外翻译界均统称为自译(Self-translation)。国外对自译的概念早有界定。Mona Baker 编著的《翻译研究百科全书》中Grutman 把自译定义为:翻译自己作品的行为或者是这种行为的结果[1]。Tanquiero 也认为自译与翻译相同,也是一种双语转换行为,所以自译和翻译可以互为参照[2]。两者虽有不同,但都认为自译是翻译的特殊形式。相较国外,国内学者虽然对于自译的研究稍晚,但对自译行为、自译者、自译作品,以及自译特征等方面均进行了研究,同时也对自译的概念及内涵给出了各自的界定和阐释。学者陈吉荣认为,自译指的是由作者承担的一种特殊策略性、进程性的翻译行为和这种行为的结果,是作者在用另外某种语言翻译自己作品的文本信息和写作意图[3]。学者黎昌抱也在文学自译研究综述中指出,自译是一种特殊的翻译形态,通常指文学作品的自译[4]。
大部分读者对作家张爱玲的认识可能源自她一生所创作的众多脍炙人口、享誉中外的小说。殊不知,张爱玲其实还是一位成果颇丰的女翻译家,而且张爱玲的翻译活动对其小说创作风格具有很大影响,甚至在其文学道路发展的转折时期起到了至关重要的作用。在这些翻译作品中,张爱玲对自己的部分作品进行了中英自译,即她把自己的汉语原创作品自译为英文作品进行发表,同时也把部分自己用英文创作的作品自译为汉语进行发表。这种自我翻译行为集创作与翻译于一身,作者既是创作者又是翻译者,这种现象在文学和翻译两个领域中都是非常特别的,因此值得研究。
国外学者多聚焦于张爱玲文学原创作品的研究,少有人提及其翻译领域;国内学者对张爱玲的研究更为全面,不仅热衷于研究其原创文学作品,对其翻译作品和自译作品也展开了研究。在翻译方面,从翻译风格、女性主义等方向聚焦于张爱玲翻译的《老人与海》;在自译方面,从翻译策略、译者风格等方向研究了张爱玲把汉语作品自译为英语作品的过程。虽个别学者也研究了她的英自译汉作品,但多集中于《五四遗事》单个作品的研究上。相比之下,基于语料库对其英自译汉作品尤其是散文的语言特征进行的研究还显不足。
因此,本研究以此为出发点,借助语料库语言学的研究方法,以张爱玲的5 篇英自译汉的散文为语料(以下简称 “自译散文”),参照和对比其5 篇原创汉语散文(以下简称 “原创散文”)和翻译他人的汉语散文《爱默森选集》节选(以下简称 “译他散文”),从词汇和句法两个方面选取指标进行分析,旨在研究和分析张爱玲自译散文的语言特征。
1 研究内容与研究方法
本研究以张爱玲的5 篇自译散文为语料,参照和对比其5 篇原创散文和译他散文,词汇方面以类符形符比、高频词和单现词为参数,句法方面以平均句长、逻辑连接和时态标记为参数进行数据统计分析。具体研究问题如下:
(2)与原创散文和译他散文相比,自译散文的语言特征在句法上有何具体表现?
根据以上研究问题,本研究自建张爱玲散文语料库,由自译散文、原创散文和译他散文《爱默生选集》三个小型类比语料库组成。其中,自译散文语料库中包含了所有张爱玲最初以英文发表然后又自译为汉语的散文,共5 篇,包含12 078 词;原创散文语料库包含5 篇张爱玲创作的汉语散文,包含12 048词;译他散文语料库节选自张爱玲在1953 年翻译的美国Mark Van Doren 编著的《爱默森选集》,共12 981 词。
对收集好的张爱玲散文文本进行初步清洗整理后,使用Corpus Word Parser 汉语分词软件对所有文本进行分词标注,再进行人工检查更正,最后使用AntConc 和EXCEL 对各参数进行统计分析。
2 研究结果与讨论
2.1 词汇语言特征
本研究对文本语料的类符/形符比、高频词和单现词三个参数进行了数据统计,进而描述词汇语言特征。
2.1.1 类符形符比
类符/形符比(TTR)指的是一个文本语料中,类符(type)与形符(token)的比率。类符是指文本语料中不同的词,形符是指文本语料中所有的词。Baker认为,类符/形符比值的高低与写作者词汇使用的丰富程度和多样性成正比[5]。也就是说,TTR 值越大,该文本语料中不同的词汇使用越多,也就是越丰富,反之则越少。由于各语料中文本长度大致相同,用TTR来衡量词汇丰富度具有一定意义。表1 为张爱玲自译散文、原创散文和译他散文的TTR 比值。
表1 自译散文、原创散文和译他散文的TTR 比较
由表1 可知,自译散文的TTR 值最高,译他散文TTR 值最低,原创散文在两者之间。换言之,张爱玲的自译散文的汉语词汇使用最丰富,译他散文的汉语用词丰富度最低,而其原创散文的汉语词汇丰富度居中。这也说明,在相当容量的语料库中,张爱玲在其自译散文和原创散文中倾向使用更多的不同词汇,而译他散文倾向于使用更少的词汇。这个结果表明:译他散文库中词汇丰富度有限,可能有更多的词是重复使用的。
2.1.2 高频词
有效的注视点要求视网膜中央凹对准注视目标超过200ms,考虑到视觉任务的处理耗时,操作者的视觉注意处于用户界面局部区域并进行任务加工时,注意转移速度慢,注视点停留时间可能会更长,因此本研究认为注视点停留时间大于某一阈值也可以反映操作者正在关注注视点所在位置区域.
词频指的是文本语料中某一个词语的使用的频次和频率。为了进一步验证译他散文是否有更多的词重复使用,利用Antconc 把自译散文、原创散文和译他散文三个语料库的词频表导出(见图1)。
图1 自译散文、原创散文和译他散文的词频表前50 频率比较
由图1 可知,张爱玲自译散文的前50 个高频词汇重复使用率最低,译他散文的前50 个高频词汇重复使用率最高,而原创散文的前50 个高频词汇重复使用率居中。这表明:张爱玲在自译时会使用更多不同的词汇进行解释,其自译词汇语言特征与原创散文的词汇特征最为相似,而张爱玲的译他散文更倾向于反复使用部分相同的词汇,也就是多次使用更少的词。这说明,张爱玲在英自译汉的过程中,为了让读者更好地了解自己原作的风格和内容,会选用更丰富、更宽泛的词语进行传达。有趣的是,王蓉和李利在对张爱玲由中自译英的研究中也发现:张爱玲会选用更多、更丰富的词语传达原作的韵味[6]。
2.1.3 单现词占比
单现词是指文本中只出现过一次的词语,单现词占比也就是文本中使用频数为1 的词在整个文本全部词语中的所占的比例。单现词是另一个可以表示语言中词汇丰富程度的数据,单现词越多语言中的词汇丰富程度越高[7]。表2 为三个语料库中的单现词比较。
表2 自译散文、原创散文和译他散文单现词比较
由表2 可知,张爱玲的自译散文的单现词数最多,占比也最高;原创散文的单现词略微次之,占比与自译散文相差无几;译他散文的单现词数最少,占比也最低。从单现词使用来看,张爱玲的自译散文的词汇丰富度更高,原创散文大致相当,而译他散文的词汇丰富度最低。这与前文类符形符比和高频词表所体现的词汇特征是一致的。
2.2 句法语言特征
句法层面,本研究通过对文本语料中的平均句长、连词和时体标记三个参数进行统计分析,进而描述句法语言特征。
2.2.1 平均句长
平均句长指的是文本语料中平均每个句子的长度,可以用文本总词数除以文本总句数计算出一个语料的平均句长,可以用每句平均多少词来表示。除却别的影响因素,文本的平均句长越长,语句所含的信息量越大,句法复杂度会增加,可读性也会相对降低。因此,平均句长可以在一定程度上反映句法复杂度和文本可读性[8]。通过WORD 和EXCEL 统计文本中的标点符号,进而计算文本中总的语句数量。表3为以词为单位对三个语料库的平均句长进行比较。
表3 自译散文、原创散文和译他散文平均句长比较
由表3 可知,张爱玲的自译散文平均句长最短,原创散文的平均句长相比略长,而译他散文的平均句长最长。也就是说,张爱玲的自译散文和原创散文句式更简短,而对于译他散文,她则倾向于用更长的句式进行他人作品的翻译。同时也表明张爱玲的自译散文从句长表现出的语言特征更接近原创散文,用词简练,文本可读性高。这一结论支持黎昌抱和李菁关于文学自译作相对更通俗易懂的观点[9]。
2.2.2 连词
连词是一种具有多层连接功能的虚词,既可以连接词和短语也可以连接小句和句子,还可以连接句子和句组。按意义,连词可以分为联合连词和偏正连词两大类,其中联合连词包括表示并列、连贯、递进和选择关系等小类;而偏正连词又包括表示因果、转折、条件、假设、让步、目的关系等多个小类[10]。而Quirk 曾提出,连词会增加句法的复杂度[11],表4 为三个语料库的连词比较。
表4 自译散文、原创散文和译他散文的连词比较
由表4 可知:张爱玲的自译散文、原创散文和译他散文对于连词的使用,虽然在量上有区别,但就总体而言,偏正连词使用率高于联合连词;使用频率最高的均为并列、转折和因果关系连词,总体趋势大致相同,用词习惯是趋向一致的。这一结论支持汉语翻译于非翻译语料库在连词频率总体使用上趋势大致相同。
同时,可知张爱玲的译他散文语料库中连词使用量最高,频率也最大,其次是自译散文,原创散文最低。此外,张爱玲自译散文的连词使用与其译他散文更趋近一致,与原创散文有一定差距。汉语连词与英语的连接词相比使用频率相对较低,但张爱玲的自译散文和译他散文的连词使用频率都高于原创散文。这可能因为其自译与译他的原作语言为英语,在原文的影响下,使得张受玲的自译和译他连词使用频率较高。翻译汉语语料中起语法功能的介词连词助词等词类使用频率比原创汉语文本高,被称为虚词显化[12]。本研究结果支持翻译汉语比非翻译汉语连词使用频率更高,翻译显化的结论。
2.2.3 时体标记
汉语在语句中多使用动态助词 “着、了、过” 来表示行为发生的时间或者状态。其中,“了” 的时体覆盖面更广,它既可表达行为的结束也可表示行为持续和状态持续,而 “着” 只能表示动作和状态的持续,“过” 只能表示动作的完成和结束[13]。表5 分别统计了自译散文、原创散文和译他散文中时体标记助词“着、了、过” 的使用情况。
表5 自译散文、原创散文和译他散文中 “着、了、过” 的使用情况比较
由表5 可知,张爱玲的原创散文时体标记助词使用次数最多,与自译散文和译他散文有明显差异,自译散文中的时体标记使用数量少于原创散文,而译他散文中的时体标记使用最少。张爱玲的原创散文实体标记助词使用频率最高,译他散文和自译散文中的时体标记助词使用频率都远小于原创散文。也就是说,张爱玲的译他散文和自译散文中的时体标记使用情况趋向一致,总体都少于原创散文。学者胡显耀在《当代汉语翻译小说规范的语料库研究》一文中提出,翻译小说文本的时体标记使用少于非翻译小说文本,有模糊源文本时体标记的趋势,呈现出翻译简化的特征[14]。因此,从语句中的时态标记来看,张爱玲的自译散文与译他散文相似,两者都表现出了简化的共性。
3 结束语
综上所述,基于自译散文、原创散文和译他散文三者的类比,揭示同一笔者张爱玲英自译汉的作品中呈现的相对语言特征。从词汇方面来看,自译散文的TTR 值大于其原创散文和译他散文;高频词汇使用率低于原创散文和译他散文;单现词使用占比最大,与原创散文大致相当,但远高于译他散文。综合TTR、高频词表和单现词占比三个统计结果,可知:张爱玲的自译散文词汇丰富度大于其原创散文和译他散文,且自译散文的词汇总体语言特征与原创散文更趋近一致,用词丰富多样。从句法方面来看,自译散文平均句长小于原创散文和译他散文;自译散文衔接连词使用率高于原创散文,但低于译他散文;自译散文时态标记助词 “着、了、过” 使用频率最低,与译他散文使用情况相差无几,原创散文使用率远高于前两者。由此可见,张爱玲的汉语自译的散文语句简短,行文简洁,与汉语原创散文语言风格相似,但在连词使用和时态标记上,更接近译他散文,呈现出翻译的显化和简化的特性。这说明,张爱玲的英自译汉散文虽然在语言风格上与汉语原创散文的语言风格具有一致性,尤其是在遣词造句的发挥上更具自主性;但文章整体结构也会受到源语文本语言的影响和翻译规范的制约,表现出一定的翻译共性。