刘宇昆译著及原著词汇特征对比分析
2020-09-26宋欣阳
内容摘要:本文选取《三体》译者刘宇昆的译著及其原创作品,通过语料库统计分析手段,试图探索母语译者的译文与其原创作品在词汇层面的异同之处,进而归纳和揭示母语译者的选词特点,供中文译者参考。通过分析发现,译著词汇密度和丰富程度不及原创作品,但平均词长和可读性高于原创作品。
关键词:《三体》英译 语料库 译者风格
随着中外文化交流日益频繁,越来越多优秀中文文学作品在海外获得广泛传播和认可,中国科幻作家刘慈欣所著《三体》系列便是其中典型代表。而该系列科幻小说能够在英文世界风靡,英文版译者刘宇昆功不可没。他不仅翻译中文科幻文学作品,还是一位成功的英文科幻小说原创作者,曾多次荣获科幻文学界著名奖项“雨果奖”、“星云奖”。本文通过自建语料库探究刘译本词汇特征,并将其译著与原创作品进行比较分析,意图发现刘译文的典型特征。
一.刘宇昆译著及原创作品选取及语料库创建
语料库翻译学以语言理论和翻译理论为研究上的指导,以概率和统计为手段,以大规模双语真实语料为对象,采用语内对比与语际对比相结合的方法,为研究翻译、语言特征提供了新的视角。
本文选取刘宇昆的两部译著:Pan Macmillan 2016年出版的三体译本《The Three-Body Problem》和2017年出版的《Death's End》。以及他的两部原创科幻文学作品:《The Grace of Kings》(Saga Press,2015)和《The Paper Menagerie and Other Stories》(Saga Press,2016)。采集到上述文本后,首先对其进行了清洁降噪和词性赋码处理,清除其中多余的文本、标点、空格、空段等,降低文本噪音,后使用CLAWS词性赋码器进行自动词性赋码,得到初步语料库数据,并使用WordSmith等软件进行检索,着重分析词汇特点及其成因。
二.刘宇昆译著及原创作品词汇特征
1.词汇密度
标准化类符/形符比(STTR)是衡量词汇密度(lexical density)的常用方法。形符(token)指语料库中所有单词,而类符(type)指语料库文本中任何一个独特的词形(word form)。类符/形符比指的就是文本中使用的不同词语的比率,反映了文本中词语的丰富度和变化度[3]。
通过WordSmith语料库分析软件发现,标准类符/形符比(STTR)从高到低依次为《The Three-Bod
y Problem》(译著)、《Death's End》(译著)、《The Paper Menagerie and Other Stories》(原创)、《The Grace of Kings》(原创),表明同一作者的原创作品词汇密度略高于译著,其中STTR最高的《The Grace of Kings》分别比译著《The Three-Body Problem》和《Death's End》高+3.03和+2.28,而布朗语料库科幻小说类别下的形符/类符比为4.48,同样略高于译著,说明译著词汇不及原创作品丰富。虽然译著词汇密度可能受原著影响,但考虑到刘宇昆的另一部译著《Folding Beijing》(作者为科幻作家郝景芳)STTR比为43.18,同样低于原创作品,这从某种程度上排除了原著用词单一对译者造成影响的可能。因此可以认为,刘译著词汇丰富程度不及他自己的其他原创作品,且略低于英文原创科幻小说。
2.词类分布
词类分布能够体现文体特征。本文对刘宇昆两部译著和两部同类型、字数相仿原创作品的词类分布及词汇密度进行了统计比较,并汇总了实词数量及比重。
经统计分析发现,名词和动词出现次数最多,两者之和占比几乎均超越50%。除名词、动词之外,表格还统计了形容词和副词等英语实词,这类词语表示实在的意义,且意义稳定。实词占比越高,就可以认为信息负载度越大,文本也越难,反之越简单。从表中可以看到,两部原创作品的实词比重显著高于两部译著,说明原创作品用词更为丰富,而译著相对较低。由此可见,即使母语译者,也难免受原文行文、语法等方面限制,为还原原著本意,功能词使用较多,词汇丰富程度受到影响。
3.词长分析
文本单词长度也从一个侧面反映了作者的行文风格和选词倾向,有助于识别翻译语言与目标原创语言的差异。本文使用Python自然语言处理(NLTK)模块对刘宇昆译本和原创作品的单词词长进行了统计。经分析发现,两部译著的平均词长(单词中所含字母数量)为4.63和4.68,略高于兩部原创作品(均为4.37),初步判断作者在译著中倾向于使用长度较长的单词。经过进一步统计发现,两部译著短词(由1-3个字母)占比分别为:77.41%和76.5%,两部原创作品则为:78.8%和79.73%;而从包含15个字母以上的长词占比来看,两部译著分别为0.21%和0.31%,而两部原创作品为0.08%和0.09%,由此可见,作者在翻译过程中,倾向于选择长单词表述原文含义,而创作原创作品时,则多使用简短的单词。
4.文本难度和可读性
“可读性(Readability)”又称为易读性,主要关注文本的表述风格,即语言特征(如词汇和句法)对读者阅读理解文本的影响。本文采取使用通用的Flesch–Kincaid可读性测试,对比分析刘宇昆原创与翻译作品可读性。
经过对每个作品5次随机采样,使用Flesch–Kincaid可读性测试公式计算求得刘宇昆《三体》译本及其原创作品平均可读性指标后,通过对比发现,两部译著的可读性得分均略高于参照读本——美国刊物《Readers Digest》,均对应美国8到9年级中学生阅读水平;从可读性得分看来,《三体》译本易于阅读,理解难度不高。这一方面符合原文科幻小说文体语言平实、受众广泛的特征,另一方面也符合西方读者对译文通俗易懂的期待。而本文选取的另外两部刘宇昆原创作品,其可读性得分显著低于两部译著,并分别低于参照文本-4.5和-15.7,表明其词汇和句法较为复杂,阅读理解难度稍大,其中同属长篇科幻小说的《The Grace of Kings》对应8到9年级中学生阅读水平,而科幻短篇小说集《The Paper Menagerie and Other Stories》阅读难度较大,对应美国大学生阅读水平。
三.词汇特征分析及结论
通过语料库统计分析,本文发现刘宇昆译著及原创作品在词汇使用方面具有以下特点:第一,译著词汇密度略低于原创作品,且不及其他英语作者同类型原创作品;第二,译著实词所占比重不及原创作品,译者受到原文影响,灵活性和生动程度不及原创作品;第三,译著使用长词较多,而原创作品更倾向于使用简短词汇;第四,译著可读性高于原创作品,更为通俗易懂。
然而,本文仅从类符/形符比、词汇密度、词长、可读性等方面进行初步分析,要揭示刘宇昆的译著与其原创作品,以及其他译者译著更深层次的关联与区别,还需进行更微观、细致的刨析。
参考文献
[1]刘宇昆[EB/OL].[2020-04-10] https://zh.wikipedia.org/wiki/%E5%88%98%E5%AE%87%E6%98%86
[2]王克非,胡显耀.基于语料库的翻译汉语词汇特征研究[J].中国翻译,2008(6):16-21,92
[3]梁茂成、李文忠、许家金.语料库应用教程[M].外语教学与研究出版社,2010,9
[4]王立松,赵晗.自建语料库的汉英翻译新闻词汇特征分析[J].天津大学学报(社会科学版),2018(4):335-338
[5]赵秋荣,肖忠华.基于语料库的翻译研究:现状与展望——第四届“基于语料库的语言对比与翻译研究”国际学术研讨会综述[J].中国翻译,2015(02):70-72
[6]Flesch, R. A New Readability Yardstick[J]. Journal of Applied Psychology,1948(3):221-233
[7]王蕾.可读性公式的内涵及研究范式——兼议对外汉语可读性公式的研究任务[J].语言教学与研究,2008(6):46-53
基金项目:太原工业学院2019年院级科学基金资助项目(2019RW07:基于英汉双语平行语料库的译者风格研究——以刘宇昆译《三体》为例)
(作者介绍:宋欣阳,太原工业学院外语系讲师)