2009—2018年《国务院政府工作报告》英译本句法特征的语料库探究
2019-08-22同济大学
同济大学 叶 铖
提要:作为我国重要的政治文本,《国务院政府工作报告》(以下简称《报告》)在中国与世界的交流中发挥着关键作用。本研究选取2009年—2018年(近十年)发布的《报告》、《报告》英译本及美国政府《国情咨文》作为研究对象,开展基于平行语料库及可比语料库的文本比对,考察《报告》英译本与平行或可比语料在句法特征层面的差异,并探究差异产生的原因。分析指出,近十年各份《报告》英译本体现的句法特征与汉英语言自身差异、《报告》行文特点及政治文本严格的英译要求有关。
1.引言
21世纪以来,随着中国改革开放日益深化,中国在国际政治、经济等舞台上扮演愈发关键的角色,对外交流日趋频繁。作为中国重要的政治文本,一年一度的《国务院政府工作报告》(以下简称《报告》)对上年度的政府工作进行汇报,并对当年度的工作计划进行部署,对国家发展起到深远影响,同时是中国政府对外宣传的重要媒介,也是国际社会获知中国政治、经济等情况的权威信息来源。因此,《报告》的英译在中国与世界的交流之中发挥着举足轻重的作用。
《报告》英译的相关研究已经引发国内学者的广泛关注(胡峰笙等 2012;武光军、赵文婧 2013;童孝华 2014;陆仲飞、王大伟 2016)。在语言描述和应用研究日趋深入与精细的学术背景下,随着统计方法和工具的完善,特别是大型语料库的建立,以及语言和数据分析软件的开发应用,越来越多的学者转向语言定量研究,开展定量篇章对比分析、语言对比调查研究和语言对比实验研究等(许文胜 2015:41-42)。例如,朱晓敏(2011a)结合语料库工具技术,分析了意识形态在2000—2009年《报告》英译中所起的作用;武光军(2014)基于语料库,探究了2011年《报告》英译本的词汇及句法特征;李晓倩、胡开宝(2017)利用语料库技术,考察了2000—2014年《报告》英译文中的主题词及其搭配。已有研究视角多元,分析层次多样,研究成果切实有效解决《报告》英译过程中的汉英双语转化问题。然而,同时基于平行语料库及可比语料库,并从句法特征层面展开的分析尚未得到国内学界足够的关注。
本研究选取2009—2018年发布的《报告》、《报告》英译本及美国政府《国情咨文》(以下简称《咨文》)作为研究对象。其中,《报告》作为《报告》英译本的平行文本,《咨文》作为《报告》英译本的可比文本。《咨文》是美国总统在国会发表的年度报告,内容主要为当年度的国内外状况及美国政府行将采取的政策措施。《报告》和《咨文》均是中、美两国政府的施政纲要,二者具有较为合理的可比性(李晓倩、胡开宝 2017:82)。本研究采用语料库技术开展文本对比分析,探究研究对象的句法特征,聚焦平均句长、句子数、被动句式使用情况、无主句翻译、复合句使用频率及常用结构,分析《报告》英译本与平行或可比语料在这些方面的差异,并探讨差异产生的原因。
2.研究设计
针对《报告》、《报告》英译本及《咨文》的平行、可比文本的定量分析,以及在此基础之上的定性分析,本节对本研究使用的工具和具体研究步骤进行介绍。
2.1 研究工具
本研究主要使用4款语料库软件:WordSmith、AntConc、Passive Voice Detector及Readability Analyzer。
2.2 研究步骤
本研究实施步骤主要分成自建语料库及利用语料库软件分析文本两个环节,具体如下:
(1)下载近十年的《报告》(下载地址:http://www.gov.cn/guowuyuan/baogao.htm)、《报告》英译本(下载地址:http://www.xinhuanet.com/english/home.htm)及《咨文》(下载地址:http://en.m.wikisource.org),并保存在Microsoft Word 2007之中(文件扩展名为docx)。
(2)清除文本自带格式,并删去多余的空行和乱码等。
(3)将经过处理的文本保存在“记事本”当中(文件扩展名为txt,编码为UTF-8),至此完成语料库建设工作。
(4)启动所需软件,导入某年度的《报告》、《报告》英译本或《咨文》文本,软件将自动对文本进行处理并展现分析结果。本研究将通过表格形式对结果进行呈现,并据此展开相关讨论。
3.句法特征探究
翻译语言的句法特征可从句法总体特征和典型语句结构的应用特征两个层面来理解。其中,句法总体特征包括平均句长、翻译文本的复合句使用频率等,典型语句结构的应用特征涉及包括被动句式在内结构的使用频率和语用功能等(胡开宝 2011:99-100)。本节将对近十年《报告》、《报告》英译本及《咨文》的平均句长、句子个数、被动句式使用情况、无主句翻译、复合句使用频率及常用结构展开分析。
3.1 平均句长
平均句长是指翻译文本语句的平均长度,可以反映翻译文本语句的复杂程度以及翻译文本的可读性,其计算方式以句号、问号和感叹号为标记(胡开宝2011:99)。表1对近十年各份《报告》英译本和《咨文》的平均句长进行数据呈现。
表1 近十年各份《报告》英译本和《咨文》的平均句长(单位:词)
Butler(1985:21)指出,可以根据句子长度将句子分为三类:短句(含1词-9词)、中长句(含10词-25词)及长句(含25词以上)。表中数据显示,近十年各份《报告》英译本及《咨文》的平均句长均在10-25词,表明两类文本倾向使用中长句;此外,任意一份《报告》英译本的平均句长均高于同年度发布的《咨文》,表明前者使用长句更为频繁,文本句法更为复杂。
根据美国证券和交易委员会编写的写作手册,英语句子平均长度应为15-20词,且长句不超过三项信息,否则会违反“简明英语”中“限制句子长度”的基本原则(李长栓 2012:66)。关于“简明英语”,简明英语运动组织(Plain English Campaign)给出的定义是:作者在考虑读者并使用恰当语气情况下写出的言简意赅的信息1。表中数据显示,除2013年以外,其余各年份《报告》英译本中的平均句长均多于20词;除2009年以外,其余各年份《咨文》中的平均句长均少于20词且多于15词。这表明近十年《报告》英译本的平均句长基本均超过合理范围,违反简明英语的基本原则,而《咨文》则更遵循这一原则。本研究随机从2012年《报告》英译本中选出一例典型的长句,并附其原文如下:
表2 2012年《报告》英译本中的一例长句及其原文
图1中的实例显示,译文中使用一个句子涵盖了原文中6个短句所传递的信息,承载信息量较大且较为复杂,在一定程度上降低了文本的可读性。此类句法复杂的长句在《报告》英译本中出现的频率较高,使得文本的平均句长得到增加。本研究认为,该现象的产生跟《报告》的行文特点及政治文本严格的英译要求有关。贾毓玲(2003:27)指出,《报告》句子偏长,句型结构单一,多用并列短句或并列谓语,“一逗到底”,连接成分使用不多,层次不太明显。同时,在政治文章的翻译中,译者掌握忠实的标准要严格得多,因为政治文章涉及国家大政方针、基本政策等,稍一疏忽,后果严重,所以必须紧扣原文(程镇球 2002:100)。因此,译者在处理《报告》中的较长结构时多对照原文句型进行翻译,以力求稳妥,致使《报告》中的句式特点在其英译本中得到保留。
此外,Wang & Qin(2010:168-171)指出,翻译文本的平均句长高于可比语料中的英文文本,说明翻译过程中添加相关信息,从而出现“显化”(explicitation,亦称“明晰化”)特征,即将原文的隐含信息进行明确表述。本研究也对近十年《报告》英译本中由句法特征体现的显化现象进行一定探究。政府公文中的隐含信息大多属于引号里的内容(朱晓敏 2011b:74),据此,本研究利用AntConc进行检索,获取《报告》中带有引号的汉语词组,例如“三农”、“走出去”、“三个代表”、“四个全面”、“五位一体”等,并对其加以分析。本研究随机从2009年、 2010年及2015年《报告》中选出典型三例,并附其译文如下:
表3 2009年、2010年及2015年《报告》中带有引号的汉语词组及其译文
本研究发现,近十年《报告》英译本中由句法特征表现的显化现象可归为三类:1)对原文进行解释说明性翻译(如表3中的第1个句子);2)翻译时添加背景信息(如表3中的第2个句子);3)翻译时重复同义词组(如表3中的第3个句子)。
3.2 句子个数
句子个数是研究句法特征的一个重要指标(朱晓敏 2011b:75)。依照《中华人民共和国国家标准 GB/T 15834-2011 标点符号用法》,句末点号为句号、问号和叹号。据此,在本研究中纳入计算的中文句子均为以上述三类标点符号结尾的字符串;同时,参照英文文本平均句长的计算方式,所有纳入计算的英文句子均为以句号、问号及叹号结尾的字符串。本研究对近十年各份《报告》及其英译本的句子个数进行统计,具体结果见表4。
表4 近十年各份《报告》及《报告》英译本的句子个数
表中数据显示,近十年各份《报告》英译本的句子个数均多于同年度的《报告》,表明译文中的句子个数得到增加。通过观察《报告》英译本及其平行语料,本研究发现,这一现象产生的原因是译者采用了分译的翻译策略。分译涉及包括从词到句、段的所有语言单位,翻译时需要单列出来的部分都属分译(徐秀梅、宫钦言 2005:24)。本研究随机从2012年《报告》及其英译本中选出一例典型的分译(见表5):
表5 2012年《报告》英译本中的一例典型分译
原文中的各个分句均属并列关系,然而在译文当中,译者将部分分句独立成句,再分别翻译。徐秀梅、宫钦言(2005:25)指出,英语是以综合型为主并逐渐向分析型过渡的语言,汉语是以分析型为主的语言,这种不同反映在句子结构上,就体现为英语重形合(hypotaxis)、汉语重意合(parataxis)。汉语具有隐性的语法关系,英语具有显性的语法关系。因此,汉译英过程中适当采取分译策略,可以使语意更为明晰、逻辑更为清楚。
3.3 被动句式使用情况
英语中,当句子主语所指的人或物是动作的承受者或遭受者时,动词的形式就是被动语态;被动语态在英语(特别是科技英语)中广泛使用(刘明东 2001:1)。虽然汉语动词无形态变化故无语态概念,但语态概念所表达的主谓关系属于句法范畴,因此汉英在主被动语态上的概念,理论上应基本一致(任学良 1995:501);其中,汉语被动句式的标记词汇有“被”、“给”、“为”、“让”、“叫”、“受”、“挨”、“遭”等(郭鸿杰、韩红 2012:361)。本研究对近十年各份《报告》及《报告》英译本中的被动句式使用情况进行统计,具体结果见表6和表7。
表6 近十年各份《报告》中被动句式使用情况
表7 近十年各份《报告》英译本中被动句式使用情况
表中数据显示,近十年各份《报告》均未使用被动语态,远低于其英译本被动语态的使用频率。本研究认为,这与现代汉语和《报告》自身的特征有关:王力(1985:88)指出,被动式所叙述,若对主语而言,是不如意或不企望的事,如受祸,受欺骗,受损害,或引起不利的结果等等。因此,被动句式在现代汉语中的语义功能及使用频率都较为有限。鉴于此,对政府工作进行总结及规划的《报告》应会避免使用被动语态。针对《报告》英译本中出现的被动句式,本研究发现其使用多发生于以下5类情况:
表8 近十年各份《报告》英译本中的5类被动句式
表8中的实例显示,《报告》英译本被动句式的使用情况灵活多样,可以满足译者多种翻译需求。
此外,姚雪梅(2010:191)指出,被动句作为英语中的一个重要句式,能够对信息进行重新编码和解码,在句子和语篇的建构中具有信息重组的语用功能,其中包括主题确立、主题连接和焦点凸显三个方面。为将《报告》英译本和《咨文》中的被动句式使用情况进行对比,本研究对近十年各份《咨文》中的被动句式个数进行了统计,具体结果见表9。
表9 近十年各份《咨文》中被动句式使用情况
表8和表9显示,除2010年、2011年及2012年以外,其余各年份里,被动句式在《报告》英译本中的占比均高于在同年度《咨文》中的占比。本研究认为,相较于英语本族语者所写的可比语料,《报告》的翻译文本在大多数情况下更能在句法层面上体现信息重组的语用功能,且能够更为有效地标记句子主题、衔接前后语篇以及聚焦话题的信息中心,而该现象产生的原因是《报告》行文特点带来的多样翻译需求。
3.4 无主句翻译
张书健、李玲(2010:42)指出,汉英语言形态特征差异的重要表现形式之一是汉英句式的无主句现象:无主句在汉语中普遍存在,而英语中的主语一般必不可少;朱晓敏(2011b:75)进一步表示,除省略句、祈使句及感叹句以外,讲究理性的英语原则上不省略主语。依照Li & Thompson(1981),汉语句子属主题显著并非主语显著,即突出主题,因此易省略主语;而《报告》是对过去政府工作的回顾及对未来工作的计划,契合这一特征,故无主现象出现频率较高。通过观察,本研究发现《报告》中出现的主语均为“我们”,因此本研究对该词及其对应英文单词“we”进行考察,并统计二词在近十年《报告》及《报告》英译本中的词频,具体结果见表10。
表10 近十年《报告》及《报告》英译本中“我们”和“we”的词频对比
表10显示,近十年《报告》中“我们”的出现频次远低于其英译本中“we”的词频,表明后者存在大量添加主语“we”的翻译现象,例如:
表11 2014年《报告》英译本中大量添加主语“we”的情况
表11中的实例显示,原文中并未出现“我们”,而译者在译文中添加6个“we”,既符合英语的基本特征,又能将句内逻辑及句际逻辑表示清楚;同时,添加主语“we”能够避免句子成为以动词开头的祈使句,从而规避英文祈使句表达命令、要求等含义的强烈语气,并防止出现动作执行者变为听话者而非说话者的语意曲解,符合《报告》对政府自身工作做出汇总及部署的行文特点。
此外,“we”还具备一种用法“royalwe”,或称“majestic plural”(Lakoff 1990:190)。这种情况下,“we”是西方皇室人员用于指称自己的代词,有别于普通人使用的“I”,从而体现皇室的“权威”,类似于中国古代帝王使用的“朕”。随着社会历史的发展,“we”逐渐带上“权威”的特性。朱晓敏(2011a:77)指出,《报告》译者深知自己工作的重要性,因此在运用语言形式时,无论有意还是无意,都必然会考虑到所用语言形式体现的社会意义和意识形态意义。《报告》代表中央人民政府,而中央人民政府是中国的权威,因而在译文中添加“we”还能增加文本的权威性。
3.5 复合句使用频率
根据句子结构,英语句子可分为简单句、并列句及复合句;其中,复合句由一个主句和一个或一个以上的从句构成,主句与从句之间通过复合连接词(如“which”、“whether”、“so that”等)连接(薄冰 2000:9-11)。胡开宝(2011:99)指出,复合句的应用频率在很大程度上体现翻译语言的复杂性,且可通过计算所有连接词使用频率之和求出。据此,本研究利用WordSmith 6.0的Concord功能检索近十年各份《报告》英译本及其可比语料《咨文》当中的复合句连接词,对两个语料库中的复合句使用频率进行考察,具体统计结果见表12和表13。
表12 近十年各份《报告》英译本中的复合句使用频率
表13 近十年各份《咨文》中的复合句使用频率
表中数据显示,复合句在近十年各份《报告》英译本中的所占比例均远低于在同年度《咨文》当中的占比,表明前者的文本复杂性低于后者。本研究认为,这一现象由汉英本身差异、《报告》行文特征及政治文本严格的英译要求共同导致。张思洁、张柏然(2001:13)认为,汉语以意驭形,词语或语句间的连接主要凭借语义或语句间的逻辑关系实现,而英语以形制意,词语或语句间的连接主要依仗连接词或语言形态手段。所以,汉语文本的外在形式较为松散;同时,《报告》句式单一,连接成分不多,句际层次不够明显,使得语篇外在逻辑形式更为模糊;此外,《报告》的严肃语体要求译者在翻译过程中做到慎重、严谨,因此,译者大多选择参照原文句型堆砌句内成分(如谓语动词)或采用分译策略明晰语意及逻辑(已在上文作具体分析),从而大大减少连接词的使用,例如:
表14 2011年《报告》英译本中并列短句堆砌的翻译现象
表14的实例当中,译者在不添加连接词的情况下,对照原文“一逗到底”的并列短句堆砌形式作出译文,降低了文本复杂性,削弱了句际逻辑关系。本研究认为,此类译法的高频出现及分译策略的大量采用,致使近十年各份《报告》英译本中的复合句使用频率低于近十年同年度的各份《咨文》。
3.6 常用结构
对典型语句结构的应用特征进行分析是翻译语言句法特征探究的一个重要层面。其中,典型语句结构是指目的语语言特有的语句结构或受源语语言影响而频繁应用的目的语语句结构(胡开宝 2011:100)。表7数据显示,近十年各份《报告》英译本中复合句数的占比不高,因此,本研究继续对其常用结构进行考察。
AntConc可以计算观察语料库中主题词相对参照语料库的主题性,即某个单词在两个语料库之间的频率差异显著性。本研究将近十年各份《咨文》作为参照语料库,确定同年度各份《报告》英译本中的主题词,并依据主题性对其排序。本研究发现,除2015年、2016年及2018年外,并列连词“and”的主题性在其余各年度的《报告》英译本中均排在首位,且数值相对较高(见表15)。
表15 2013年《报告》英译本中主题性排位前10的主题词
分析结果表明,近十年各份《报告》英译本使用并列结构较多。进一步观察发现,《报告》英译本中的“and”多被用于连接各个以谓语动词开头的短句,例如:
We will keep to the path of peaceful development; firmly uphold the authority of the multilateral architecture and see that it works effectively; oppose protectionism in its different forms; become more involved in global governance; and steer economic globalization to see it become more inclusive,mutually beneficial,and equitable.(选自2017年《报告》英译本)
武光军(2014:120)指出,常用并列结构主要是因为汉语原文句法特征的迁移:汉语偏向使用流水句,即善用并列结构连接多个主谓、主从难辨的分句,这点印证了前文提到的“《报告》多用并列短句”、“一逗到底”等观点;此外,本研究认为,前文提到的政治文本严格的英译要求也是造成这一现象的重要原因。然而,从属结构是现代英语最重要的特点之一(连淑能 1993:64);从属是将某些成分转化为修饰成分,是写作应当遵循的基本原则(Crews 1974:88)。因此,《报告》英译本频繁使用并列结构的句法特点与现代英语的特征不符。
4.结论
基于以上平行语料库及可比语料库的对比分析,本研究发现,相较于同一时段发布的《报告》或《咨文》,近十年各份《报告》英译本具有如下句法特征:平均句长相对《咨文》较长,长句使用更为频繁,句法更为复杂,体现显化特征,但部分复杂长句不符合简明英语原则,导致文本可读性降低;句子个数相对《报告》较多,使得语篇含义及逻辑相较原文更为清晰;被动句式使用频率相对《报告》较高,且除个别年份以外,均高于《咨文》使用频率,反映译者利用被动语态应对多种文本语境下的翻译需求,更为有效地体现了被动句式信息重组的语用功能;相较于《报告》,《咨文》添加了大量主语对应词“we”,切合英语语言特征,明晰动作发出对象,且增添了文本权威性;复合句应用频率相较《咨文》偏低,语言复杂性、语篇层次及外在逻辑相对不高;相较于《咨文》,《报告》使用了较多并列结构,与多用从属结构的现代英语特征不符。
注 释
1.http://www.plainenglish.co.uk/free-guides.html