基于语料库的《中华人民共和国宪法》英译本词汇特征研究
2017-09-02雷威
雷威
摘要:本文基于语料库的研究方法,以《美国联邦宪法》为参照,对《中华人民共和国宪法》英译本的词汇特征进行研究。从两部宪法的标准型符/类符比,词汇密度,名词化和高频词着手,本文发现中美两国根本大法在词汇特点上存在着差异。未来在相关的法律翻译中,应该注意词汇的选择与使用,使译文在能够更好地符合英语母语者的阅读习惯,从而更好地促进交流。
关键词:语料库;《中华人民共和国宪法》;《美国联邦宪法》;词汇特征
宪法是国家的根本大法,是其他法律的立法依据和立法基础,其翻译的准确性不仅直接影响其法律效力,而且也为其他法律的翻译提供参考。法律翻译中词汇的准确性是影响译文质量和文体风格的一个重要因素。
此前就有学者对法律英语的词汇特点进行过详细的研究。李建波(2003)澄明了美英法律英语词汇之间的差异,并总结出法律英语词汇的基本特征。刘建军(2008)分析了法律英语词汇的特征及其对法律英语翻译的影响。马慧(2015)着重分析了法律英语词汇的特点,为法律英语翻译的开展打下了坚实的基础。
针对宪法的词汇特征研究多依赖于定性研究,基于语料库的研究较少,而语料库能够为后续分析提供真实数据。基于语料库的研究方法往往能够得出直觉上难以发现的普遍规律。因此,本文基于语料库方法,对《中华人民共和国宪法》英译本(下简称为《中国宪法》)和《美国联邦宪法》(下简称为《美国宪法》)的词汇特征进行了对比研究。
一、研究方法
本文运用定量和定性的研究方法进行词汇特征对比研究。首先建立语料库,检索并统计数据,进而对数据进行进一步的分析。具体步骤如下:1.获取语料。下载《中国宪法》英译本和《美国联邦宪法》,整理文本并加工生成语料。剔除非正文信息(如脚注,序言等)。2.编辑文本。用TextEditor对收集的文本进行格式编辑。编辑后,用词性标注器CLAWS5对文本进行词性标注。3.使用相应软件检索语料获取数据。检索所需的语料,导出文档,作后续数据分析。
本文中所用到的研究工具有如下:1.TextEditor(格式整理工具);2.词性标注器CLAWS5(词性标注);3.Antconc(檢索语料);4.Readability Analyzer(统计文本的易读性。包括类符/型符比,标准类符/型符比及文本的阅读难度)。
二、研究数据与结果分析
本文建立了名为“宪法”的语料库共计14149词,包含了《中国宪法》和《美国宪法》两个子库,分别有9486词和4663词。本文从标准型符/类符比,词汇密度,名词化和高频词四个方面来分析《中国宪法》英译本的词汇特征。
(一)标准类符/型符比
类符形符比(Type/ Token Ratio,简称为TTR),指的是一定语料中类符(type)和形符(token)数量之间的比率。类符指的是语料中不同词形的词,而形符指语料中所有的词。类符和形符数量的比率能在一定程度上反映了文本用词的变化性。通常,超过1000词的语料会使用标准类符/形符比(STTR),即计算每个文本每1000词的类符/形符比,将得到的若干个类符/形符比进行均值处理。Readability Analyzer统计两个子库的类符数、形符数、TTR和STTR。《中国宪法》分别为1199,9486,0.1264和0.1299;《美国宪法》分别为958,4663,0.2054和0.2042。
以上统计显示,两个子库的类符相差不大,可是《中国宪法》的型符却是《美国宪法》的近两倍。《美国宪法》的TTR和STTR远高于《中国宪法》,因此,可以看出《美国宪法》中词汇运用更丰富。这可能是因为《中国宪法》的译者考虑到法律文本翻译的特殊性在词汇选择上尽可能统一,避免不必要的变化。因此,在《中国宪法》英译本的用词的变化性远低于《美国宪法》。
(二)词汇密度
词汇密度是指在一定语料中实词所占的比例。根据胡壮麟(2002)的分类,实词包括名词、动词、形容词和副词。词汇密度可以反映文本的信息容量和难度。词汇密度偏高表明该文本的实词使用比例较大,从而信息容量也较大,难度相应也增加。本文旨在通过比较《中国宪法》英译本和《美国宪法》的词汇密度,得出其在信息容量和难度上的差异。以下统计了两个子库的各类实词数量及比例。
《中国宪法》:名词3378(35.6%),形容词1035(10.9%),动词1040(11.0%),副词90(0.95%)。总计5543(58.4%)。
《美国宪法》:名词1403(30.1%),形容词184(3.9%),动词797(17.1%),副词97(2.1%)。总计2481(53.2%)。
从以上统计我们可以看出,在两个子库中,名词的使用率都是最高的,这很大原因是因为英语中,尤其是在正式文体中,名词化的大量使用。《中国宪法》的形容词的使用率是《美国宪法》的近3倍,这是由于《中国宪法》原文是中文,中文主要是依赖于形容词做前置定语来起修饰作用,而英语则相对灵活多样。动词和副词的统计在一定程度上也反映了名词化的大量存在,动词大量转化为名词使用,相应的,修饰动词的副词则要转化为修饰名词的形容词。
总的来看,《中国宪法》的词汇密度要高于《美国宪法》,因此信息量也较大,难度也相应地更高。同样作者用Readability Analyzer测得《中国宪法》的文本阅读难度为57.7,平均词长为4.90;《美国宪法》分别为36.1和4.30,这也验证了《中国宪法》的篇章难度略高。
(三)名词化
简单说,名词化可以理解为动词或形容词用作名词的现象。名词化在正式写作中是很常见的,在学术英语和学术话语中更为常见(Hinkel,2002)。名词化在英语中通常由动词或形容词加后缀构成,但在英语中,动词或形容词后缀派生种类很多。本文对名词化形成的几种常见后缀进行了词频统计分析(*ing,*ence,*sion,*tion,*ment和 *al)。《中国宪法》分别为85,20,87,258,106,62频次。总计618频次(6.5%)。《美国宪法》分别为16,15,12,127,55,16。总计247频次(5.2%)
从以上统计的名词化我们可以看出,《中国宪法》(6.5%)较《美国宪法》(5.2%)有更明显的名词化使用,它体现了严格和正式的《中国宪法》的文体特征。这表明译者在翻译过程中注重名词化的使用,注重翻译的简洁性和紧凑性,用较少的句子词汇传达更多的信息。
(四)高频词
统计词频是语料库研究方法的一个基本手段。语料库中高频词的分布是比较稳定,如果排序上出现明显变化都可能是有特别意义(Sinclair,1991)。通常情况,语料库的高频词表(keyword list)主要是虚词,少部分实词则反映出语料关注的焦点集中明确。两个子库中前20个高频词中的实词:
《中国宪法》:People(316),State(168),National(114),Congress(100),China(75),Republic(71),Law(116),Committee(57),Autonomous(55)
《美国宪法》:States(83),United(53),State(51),President(36)
从以上统计我们可以看出,在前20个高频词中,《中国宪法》有9个实词(45%),《美国宪法》仅有4个实词(20%),因此《中国宪法》所关注的焦点相比而言更加集中明确。例如,law出现了66次,强调了宪法的国家地位;autonomous出现了55次反映了国家非常重视地方自治问题,把其写入根本大法。《美国宪法》则强调了地方州(41次)的地位,总统(36次)的权利地位义务等。
值得我们注意的是,虚词shall和may在《美国宪法》中使用频率是非常高的分别为191次和33次,通过检索发现在《中国宪法》中都是各25次,可以看出使用的差异之大,尤其是在shall的使用上。李克兴(2007)指出“shall”的重要性,在法律英语中是不容忽视的,它是法律英语文体的一个独特特点。然而,《中国宪法》使用频率却是如此之低。今后的法律翻译,应该注意法律文体的这一特点。
三、结语
本文基于语料库方法,以《美国宪法》为参照,对《中国宪法》英译本的词汇特征进行研究。研究发现:《中国宪法》英译本的标准类符/型符比较低,词汇使用不如《美国宪法》丰富;词汇密度较高,篇章难度略高;名词化使用更频繁,文体正式简洁紧凑;关键词中实词比例较高,所关注的焦点相比而言更加集中明确,但是虚词shall,may使用上,未能充分体现法律文体的特点。因此,未来在相关的法律翻译中,应该注意词汇的使用,使译文在能够更好地符合英语母语者的阅读习惯,从而更好地促进交流。
参考文献:
[1]Hinkel E.Second language writers' text:linguistic and rhetorical features[M].Lawrence Erlbaum Associates,2002.
[2]Hu,Zhuanglin.Linguistics:An Advanced CourseBook[M].Beijing:Beijing University Press,2002.
[3]Sinclair,J.Corpus,Concordance,Collocation[M].New York:Oxford University Press,1991.
[4]李劍波.论法律英语的词汇特征[J].中国科技翻译,2003,16(2):16-21.
[5]李克兴.英语法律文本中主要情态动词的作用及其翻译[J].中国翻译,2007(6):54-60.
[6]刘建军.试议法律英语词汇的特点及其对法律英语翻译的影响[J].湖北中医药大学学报,2008,10(3):76-77.
[7]马慧.试论法律英语的词汇特征[J].牡丹江教育学院学报,2015(6):17-17.
[8]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.