汉英立法文本句长比较研究
——以中美宪法为例
2017-11-03余新兵
余新兵,张 蕾
(广州商学院 外国语学院,广东 广州 511363)
汉英立法文本句长比较研究
——以中美宪法为例
余新兵,张 蕾
(广州商学院 外国语学院,广东 广州 511363)
本研究以中美两国的宪法文本为语料,比较分析其句长,结果显示:两样本的句长没有显著差异。这一发现表明尽管在普通文本中,汉语的平均句长小于英语,但汉语立法文本与英语立法文本在句长特征上趋同。这种趋同演化现象可能是语言接触和法律移植两方面因素共同作用的结果。
句长;宪法;趋同演化;语言接触;法律移植
一、引言
句子作为语言运用的基本单位[1],无疑是语言研究的焦点之一。当然,语言学诸多分支对句子研究的侧重点不一样,如句法研究关注句子的生成规则,语义研究聚焦句子的意义,语用研究则分析句子如何在实际运用中表达交际意义,凡此种种,不一而足。句子长度研究就是其一。Troia指出一般而言,句子越长就越复杂[2]370,Perera认为平均句长可以作为衡量句子复杂度的一个重要指标[3]。由于作为文本外在显性特征的句长或多或少地与文本的一些内在特征存在关联,比如文本作者的个人言语特征等,句长研究引起了很多法律语言学学者的关注[4-6]。很多研究者将句长作为一个重要的区分性指标来判断存疑文献的作者[7-9]。
句长作为文本的显性特征,相对容易把握、比较客观,不过由于长短本身就是一组相对的概念,句长研究一般出现在需要进行比较的场合,如对比语言学。就不同语言的句长研究而言,已经有不少重要的研究成果。Kornai发现英语新闻报道的句长中位数高于15个单词[10]188。刘宓庆指出:汉初以至于今,汉语行文一直恪守长短相间的模式,“中长句”长度虽一再扩展,但适中度仍在15字至18字之间[11]81。连淑能认为“总的看来,英语句子比汉语句子长得多”[12]64,即汉英在句长方面存在重大差别,这一点似乎已成为语言学界的共识。
就特殊用途语言比如法律英语的句长研究而言,诸多学者均指出法律英语惯用长句,其平均句长远远超过普通英语文体[13-17]。陈建平指出“长句是法律英语的句法特点之一”[18]16,据其统计,在英语法律文件中,句子的平均长度约为271个单词,虽然这个数字明显偏高,有必要进行进一步的验证,但是法律英语里句子普遍较长已经成为共识。
以上研究成果可以归纳为以下三点:1)句长是文本重要的外在显性特征,句长研究是对比语言学、作者鉴别等领域的重要议题;2)就普通文本的语别而言,英语句长大于汉语句长;3)就语域而言,法律英语的句子普遍长于日常英语。
这些研究主要集中在法律英语或者以英语为主与其他语言的对比中,学界对一般文体的汉语句长已有大致结论,但对法律汉语的句长尤其从汉英对比角度的研究非常少,这种不平衡的局面亟须改变。立法文本是一种典型的法律文本,本文以其为例,拟回答以下两个问题:1)汉语立法文本的句长与一般汉语文本的句长有无显著差异?2)汉语立法文本与英语立法文本在句长方面有无显著差异?即汉英普通文本的句长差异是否也存在于法律文本中?
二、研究设计与数据
针对上述两个研究问题,以下几个相关问题颇为关键:一是立法文本分为行政立法、刑事立法、民事立法和宪政立法文本,在这么多具体类型中,究竟哪一类型能代表整个立法文本呢?二是句子的标准,即什么才是一个完整的句子?更具体地说,书面语中句子的起始和结束标志是什么?三是句子长度以什么为单位进行度量?我们的解决方案如下:
(一)文本的选择
本研究以宪法文本为基本语料。文本选择理据如下:
首先,各国宪法一般都规定着一个国家的基本制度、政权组织形式、国家机构、公民基本权利和义务等。各国宪法在基本内容和整体结构上的这种类似性,保证了以宪法文本为基础的法律文本句长研究不受其内容因素的影响。
其次,宪法具有最高法律效力,普通法律的内容都必须符合宪法的规定。与宪法内容相抵触的法律无效。这一点被近现代实行宪政制度的国家所公认,许多国家的宪法对此都有明文规定。为保证其最高效力和最高权威,宪法制定程序极其严格。宪法的制定过程用“字斟句酌”来形容毫不过分。一个国家的宪法不仅能体现其立法水平,也能最忠实地反映其法律语言使用现状。宪法不仅有极高的法学研究价值,也有极高的语言学研究价值。
为了研究的方便,我们选取中国宪法和美国宪法作为汉语立法文本和英语立法文本的样本。现行中国宪法于1982年12月4日通过,历经1988年、1993年、1999年和2004年四次修订。修订的方式包括:1)增加,比如1999年宪法修正案,增加规定“中华人民共和国实行依法治国,建设社会主义法治国家”;2)删减,比如1993年宪法修正案,删去“农村人民公社”的提法,确立“家庭联产承包为主的责任制”的法律地位;3)更改,比如1993年宪法修正案,用“社会主义市场经济”取代“计划经济”,用“国有经济”“国有企业”取代“国营经济”“国营企业”。这些修订方式在语言上以零星的词语、短语和句子变化为主。考虑到完整性,我们以2004年修订后的版本为准。
美国宪法于1787年签订并于1789年生效。200多年间,已经诞生了27条修正案,这些修正案与主文一起属于宪法的组成部分。宪法修正案虽然在内容上与宪法主文相对独立,但在语言风格上两者却高度类似,故不包括修正案并不影响英语立法文本的代表性。
(二)句子的定义
何为句子?这个问题貌似简单,实际上却难以有一个适用于所有语言的所有模态的通用定义。我们的研究明显以书面语为对象,故而从书写形态上对句子进行定义。
按照Halliday & Matthiessen的定义,从书写角度判断,句子是一串以大写字母开头、句号结尾的单词组合[19]6。潘文国考察了英语里多种对句子的定义,然后将其综合简化为:表达一个完整意思,在书面上用句号、问号或感叹号结束的语言片段叫句子。可以是简单句,也可以是复合句或复杂句;可以是双部句,还可以是单部句,如“Good morning. Many happy returns of the day”等[20]190。这个定义非常具有可操作性,因为只需要凭借标点符号我们就可以判断句子的起始位置。依照以上标准,在美国宪法里,我们发现既有长达60个单词(计标点,以下同)的句子,比如美国宪法的序言:
(1)We the People of the United States,in Order to form a more perfect Union,establish Justice,insure domestic Tranquility,provide for the common defence,promote the general Welfare,and secure the Blessings of Liberty to ourselves and our Posterity,do ordain and establish this Constitution for the United States of America.
也有仅有12个单词的句子,比如其第一条第三款中有:
(2)The Senate shall have the sole Power to try all Impeachments.
而关于汉语句子的定义,学界一直有音句和义句之分[21],比如“关关雎鸠,在河之洲”从音句的角度看是两句话,而从义句的角度看是一句话。而且更为麻烦的是:义句的判断标准比较主观,因为不同的人对何为完整意义的感受并不完全一致。潘文国表示只能下一个似乎不很科学而且有弹性的定义:口头上有较长停顿的,书面上以句号、问号或感叹号结束的语言片断[20]196。我们接受潘文国的这一标准,而且这一标准也与一般人的认知相吻合。在中国宪法里,我们发现既有长达198个字的长句,比如序言第七段第四句:
(3)中国各族人民将继续在中国共产党领导下,在马克思列宁主义、毛泽东思想、邓小平理论和“三个代表”重要思想指引下,坚持人民民主专政,坚持社会主义道路,坚持改革开放,不断完善社会主义的各项制度,发展社会主义市场经济,发展社会主义民主,健全社会主义法制,自力更生,艰苦奋斗,逐步实现工业、农业、国防和科学技术的现代化,推动物质文明、政治文明和精神文明协调发展,把我国建设成为富强、民主、文明的社会主义国家。
也有仅有16个字的短句,比如序言第七段里有:
(4)我国将长期处于社会主义初级阶段。
从立法技术看,法律条文的基本单位是条或款。一般而言,每一条(或每一款)肯定包含一个完整的句子,但每一个句子则不一定构成完整的一条(或一款)。有时候一款可能包含两个或更多句子,比如第一条第二款就有两个句子:
(5)社会主义制度是中华人民共和国的根本制度。禁止任何组织或者个人破坏社会主义制度。
有时候,为了逐项列举,条款下面还包括更次级的立法单位——项或目,这样就容易产生超长句,比如中国宪法里规定全国人大常委会职权的第六十七条那个句子长度达到766个汉字。相应地,美国宪法里规定国会权力的第一条第八款也是一句话,长度达到456个单词。当然,这类超长句在总体分布里只是特例。
(三)句子的长度单位
我们确定依据标点符号的使用判断句子的起始和结束位置之后,接下来的一个问题是句子长度以什么标准或单位衡量。对于英语而言,这个问题比较简单,一般的句长研究以单词为衡量单位,而汉语里对词的定义众说纷纭[22],难以取得一致。我们采用“字本位”[23-24]的观点,认为汉语里语素的地位不亚于词的地位。我们将一个语素(汉字)作为句子长度的衡量单位。当然,由于英语里的词和汉语里的字实际上是完全不同的两个概念,严格意义上讲,两个不同种类的实体是没有办法直接进行比较的,除非统一在一个尺度之内。我们以此为单位进行比较,主要出于两点考虑:一是目前我们还没有找到一个统一的尺度,我们必须妥协,否则只能裹足不前;二是我们分别采用词与字为单位的做法符合句长研究的惯例,实践中我们统计文本长度也是按英语以单词、汉语以汉字的惯例来执行的,比如办公软件Office Word就是如此。
(四)句长研究的其他问题
需要强调的是,在立法文本里,不是所有的文字都以句子的组成部分出现。我们虽然不能断言句号是句子是否成立的标准,但从书写实践来看,所有的句子都必须要有完整的标点符号才得以完成。立法文本里常见的章节标题、条款序号等,往往只是名词短语或数字序号,其使用仅出于程序性目的,而且结构上不是句子,也不是句子的必要成分。其实,即便结构上是句子,但作为标题出现时按照书写规则不能够加句号,与本研究前文里的句子定义不符,所以,章节标题不能作为句子计入。
标点符号是书面语中句子的必要组成部分,在标准书面英语中,标点符号的使用绝不是随心所欲的,比如Carey[25]22就对句号的使用作了如下论述:
Stopsshouldbeusedassparinglyassensewillpermit:butinsofarastheyareneededforanimmediategraspofthesenseorfortheavoidanceofanypossibleambiguity,oroccasionallytorelieveaverylengthypassage,theyshouldbeusedasfreelyasneedbe.Thebestpunctuationisthatofwhichthereaderisleastconscious;forwhenpunctuation,orthelackofit,obtrudesitself,itisusuallybecauseitoffends. (译文:句号在能够表情达意的情况下应该尽量少用,但是,当需要断句时,或避免歧义时,或化解一个过长的段落时,句号还是应该该用就用。使用标点符号的最高境界是读者感受不到标点符号,凡是读者觉得标点多了或是少了,往往就是因为标点符号运用不恰当。)
就本研究而言,标点符号被统计在句长数据之中,而且,最重要的标点符号是句号(对应英语里的full point、full stop或period),其主要功能是标志一个句子的结束。我们依据句号判断哪些单词(汉字)或单词(汉字)组合构成一个完整的句子,并在此基础上计算句子的长度。
(五)数据整理
我们的数据分别来自中华人民共和国宪法2004年修订之后的最新版本和TheConstitutionoftheUnitedStatesofAmerica。我们发现,两个样本里除了极少数超长句外,绝大部分的句长数据是高度重合的。为了更确切地反映两者的情况,我们对两个样本的数据进行了描述性统计,结果如表1所示:
表1 中美宪法的句长描述性统计
语别句子数量平均句长标准差标准误句长美国宪法875495405114524548334中国宪法3404502655881662318978
通过表1的数据,我们发现:1)两个样本中,句子的平均长度在50±5个单位之间,具体而言,美国宪法英语文本的平均句长为55个单词,而中国宪法汉语文本的平均句长为45个汉字;2)两个样本中,过短和过长的句子都是少数,尤其是长度超过100个单词或汉字的句子更是罕见,一般出现在需要逐项列举的场合。
三、结果与分析
针对第一个问题,即汉语立法文本的句长与一般汉语文本的句长有无显著性差异?我们以刘宓庆关于汉语句长适中度在15至18字之间的论断为标准,取其中间值16.5,与本研究中的中国宪法文本句长数据进行比较。我们采用的统计方法是单一样本T检验,结果(t=8.943,df=339,p=0.000)显示,中国宪法作为一种典型的汉语立法文本,其平均句长为45个汉字,与一般汉语文本15—18个汉字的平均长度之间存在显著性差异。更具体地讲,汉语立法文本的句长显著长于一般汉语文本。这一点与英语的情况类似,即英语立法文本的句长显著长于一般英语文本的句长。这种类似的现象说明:无论是在英语里还是在汉语里,语体因素对句子长度的影响都是显著的。
针对第二个问题,我们比较两组句长数据的重合度发现,仅以本研究的数据而言,汉英立法文本的句长差不多。我们从统计学上进一步检验这一结果,Levene方差齐性检验(F=0.128,p=0.721)的结果表明两组句长数据的方差相同。我们可以对两部宪法的平均句长进行独立样本T检验,零假设是两组数据的均值没有显著性差异。我们得到如表2所示的结果(t=1.441,df=425,p=0.150),我们据此可以维持零假设,即两组数据在句长方面没有显著性差异:
表2 中美宪法句长比较独立样本T检验
F值显著性概率t值自由度双尾T检验显著性概率均值差均值差的标准差句长(中国宪法美国宪法)0128072114414250150992755689012
统计检验结果表明:汉英立法文本在句长方面并无显著差异。在这个指标上,语言间的同质性大于异质性并无解释力。如果一般文体的句长有差异而法律文本无差异,说明法律作为语域因素起了决定性作用。我们认为可以借用进化生物学里的趋同演化理论(convergent evolution)来解释这种现象。在进化生物学中,趋同演化指的是:两种本来不具亲缘关系的动物长期生活在相同或相似的环境中,它们为应对需要而发展出具有相同功能的器官的现象,即同功器官。比如蝙蝠从陆生到进化发展出翼状前肢,能够飞行捕食空中的小昆虫,这种翼状前肢与昆虫和鸟的翅膀有本质区别,但两者的飞行功能却是一致的,故在形态上有趋同倾向。在我们的研究中,法律汉语与法律英语本为两种异质语言,但由于它们皆被运用于类似的法律语域中,或者说它们的语言生态环境类似,因而某些形式特征得以趋同演化[26]。近代以来,这种趋同演化对法律汉语而言主要是输入型的,即法律汉语的语言特征受普通法系的法律文化和法律语言的双重影响。法律文化输入的主要是概念和原则,比如宪政、选举、法人、行为能力、公司等西方法律术语已经成为法律汉语中耳熟能详的名词,法律语言的形式特征比如长句、同义反复等也难以避免地被输入并对法律汉语产生深远的影响。当然,随着中国政治、经济和文化的发展,不排除这种以输入为主的局面逐渐转向以输出为主,真正实现中国文化“走出去”。但在目前,法律汉语仍体现出明显的与法律英语趋同的特征。
四、结语
本研究将宪法文本作为典型的立法文本,分别以字和词作为汉英立法文本的长度单位,比较了汉英立法文本的句长。我们取得了两个重要发现:第一,同英语情况类似,汉语立法文本的句长显著长于一般汉语文本;第二,汉语立法文本与英语立法文本的句长并无显著性差异。本研究的局限在于所得结论凭借的语料还不够全面,如果借助规模更大、涵盖更多法律文本类别的语料库,得出的结论将更具说服力。但正如前文所言,我们依据的宪法文本皆是各自领域内无数专家学者反复斟酌的产物,无论在形式还是内容上,毫无疑问具有难以替代的代表性。所以,我们认为,本研究的结论依然具有较高的可信度。
[1]张朋朋. 语言的基本单位是“句子”[J]. 汉字文化,2006(3):20-24.
[2]Troia G A. Instruction and Assessment for Struggling Writers Evidence-based Practices[M]. New York:Guilford Press,2011.
[3]Perera K. The assessment of linguistic difficulty in reading material[J]. Educational Review,1980,32(2):151-161.
[4]Sigurd B,Eeg-Olofsson M,Weijer J V. Word length,sentence length and frequency:Zipf revisited[J]. Studia Linguistica,2004,58(1):37-52.
[5]Jayaram M. Distribution of stuttering in sentences:Relationship to sentence length and clause position[J]. Journal of Speech & Hearing Research,1984,27(3):338-341.
[6]Martin E,Roberts K H. Sentence length and sentence retention in the free-learning situation[J]. Psychonomic Science,2013,8(12):535-536.
[7]Yule G. On sentence length as a statistical characteristic of style in prose with application to two cases of disputed authorship[J]. Biometrika,1938(30):363-390.
[8]Mannion D,Dixon P. Sentence-length and authorship attribution:The case of Oliver Goldsmith[J]. Literary & Linguistic Computing,2004,19(4):497-508.
[9]Lehtonen M. On sentence length distribution as an authorship attribute. Information Science and Applications[M]. Springer Berlin Heidelberg,2015.
[10]Kornai A. Mathematical Linguistics[M]. London:Springer-Verlag London Limited,2008.
[11]刘宓庆. 英汉翻译技能指引[M]. 北京:中国对外翻译出版公司,2006.
[12]连淑能. 英汉对比研究[M]. 北京:高等教育出版社,1993.
[13]Mellinkoff D. The Language of the Law[M]. Boston & Toronto:Little Brown & Company,1963.
[14]李克兴,张新红. 法律文本与法律翻译[M]. 中国对外翻译出版社,2006.
[15]陶博. 法律英语——中英双语法律文书制作[M]. 上海:复旦大学出版社,2004.
[16]马小丰. 英语法律公文的语言风格及特点[J]. 外语学刊,1995(3):30-34.
[17]季益广. 法律英语的文体特点及英译技巧[J]. 中国翻译,1998(5):32-35.
[18]陈建平. 法律文体翻译探索[M]. 杭州:浙江大学出版社,2007.
[19]Halliday M A K,Matthiessen C M I M. An Introduction to Functional Grammar[M]. London:Arnold,2004.
[20]潘文国. 汉英语对比纲要[M]. 北京:北京语言文化大学出版社,1997.
[21]王艾录. 义句与音句[J]. 汉语学习,1991(4):18-22.
[22]Packard J. The Morphology of Chinese:A Linguistic and Cognitive Approach[M]. Cambridge:Cambridge University Press,2004.
[23]Bloomfield L. Language[M]. New York:Holt,1933.
[24]徐通锵. 语义刍议——语言的结构基础和语法研究的方法论初探[J]. 语言教学与研究,1991(3):38-62.
[25]Carey G. Mind the Stop:A Brief Guide to Punctuation with a Note on Proof-Correction[M]. London:Penguin Books Ltd,1971.
[26]张春辉. 语言演变的稳定性和趋同性[J]. 湖南科技大学学报:社会科学版,2016(4):135-138.
AContrastiveAnalysisofSentenceLengthinChineseandEnglishLegislativeTexts:ACaseStudyonChineseandAmericanConstitutions
YUXinbing,ZHANGLei
(SchoolofForeignLanguages,GuangzhouCollegeofCommerce,Guangzhou511363,China)
This article,based on authentic data from Chinese and American constitutions as two samples of typical legislative texts,measures the length of each sentence before an independent-samples T-test is carried out. The statistical test demonstrates that there is no significant difference between the two samples in terms of sentence length. This finding reveals that legal Chinese resembles legal English in sentence length,in spite of the fact that the sentence length of ordinary English texts is much longer than that of ordinary Chinese texts. Our explanation to this convergent evolution is the result of joint effects of language contact and legal transplantation.
sentence length;constitutions;convergent evolution;language contact;legal transplantation
H030
A
2095-2074(2017)02-0018-06
2016-11-22
国家语委“十三五”科研规划2016年度科研项目(YB135-5);国家社会科学基金一般项目(16BYY064);2016年广州商学院校级科研项目(XJYBXM014)
余新兵(1978-),男,湖北黄冈人,广州商学院外国语学院讲师,广东外语外贸大学外国语言学及应用语言学研究中心博士研究生;张蕾(1978-),女,湖北黄石人,广州商学院外国语学院讲师。