基于历时语料库的学术写作中“被”字句欧化现象研究
2022-03-20王坤
王 坤
(商丘学院 外国语学院,河南 商丘 476000)
早在十九世纪初我国就出现了汉语欧化现象。时至今日,随着经济全球化进程加快,中西方接触的广度与深度不断加强,印欧语尤其是英语对汉语的影响及冲击日益加剧。“欧化”已成为现代汉语最显著的特点之一。王力认为:“所谓欧化,大致就是英化,因为中国人懂英语的比懂法德意西等语的人多得多。”[1](P334)“欧化语法现象”则指现代汉语在印欧语言、特别是英语的影响和刺激下产生或发展起来的语法现象[2]。
汉语中的“被”字句自古有之,但受印欧语(主要是英语)的影响,其表达的语义韵、使用频数等发生了变化。作为一种常见的欧化语法现象,“被”字句在相关研究中多有论述,如王力[1](P199-208)、贺阳[2](P226-252)等。近年来,基于语料库的汉语欧化语法研究成为新的发展趋势,胡显耀、曾佳、郭鸿杰、韩红、朱一凡、胡开宝、夏云等均借助语料库的方法对“被”字句的使用进行了探讨[3-6]。然而目前尚未有学者对学术写作中的汉语欧化现象展开论述,且现有的汉语欧化研究仅关注语言本身,忽略了对语言使用者的考察。在学术写作中,中国汉英语言研究者在“被”字句使用上有何历时变化及共时差异?造成这些差异的原因是什么?长期英语接触环境是否会对中国英语语言研究者的母语输出产生影响?基于以上问题,本研究通过自建学术期刊历时语料库,采用共时和历时结合的研究方式,探讨中国汉英语言研究者在“被”字句使用上的历时变化、共时差异及差异产生的原因,以便更客观系统地检验长期英语接触环境是否对国内英语语言研究者的母语输出产生影响,展示近年来现代汉语学术写作在“被”字句使用上的发展变化,从而为汉语欧化研究和语言接触研究提供新的视角。
一、“被”字句的欧化现象
本研究中的“被”字句是指带被动标记“被”的被动句,也是现代汉语中最具代表性的被动结构[5]。目前对“被”字句的欧化研究主要围绕其语义韵和频数的变化展开。“被”字句早在古代汉语中就存在,但不多见,且基本上用来表示“不如意、不幸或不愉快”的消极语义。王力对汉代至唐代语言材料的考察[7](P417-434),崔宰荣对唐宋时期作品的考察[8],贺阳对部分明清小说“被”字句的研究[2](P229-232),均表明从西汉至五四前“被”字句一直受这种消极语义约束。五四以后,受西方语言的影响,“被”字句原有的消极语义约束逐渐消解,非消极义“被”字句随之大量出现,谢耀基、贺阳、朱一凡、胡开宝的研究均证实了这一点[2](P234),[5,9]。郭鸿杰、韩红、夏云基于原生汉语及翻译汉语语料库的研究也证实英汉语言接触之后[4,6],“被”字句的中性及积极语义特征显著增加。Xiao R.等人基于兰卡斯特当代汉语平衡语料库(LCMC)的研究还显示“被”字句的语义韵在不同文体中表现有所不同,研究“被”字句的语义韵时需考虑文体的差异[10]。
此外,学者普遍认为五四以来,“被”字句在汉语书面语中使用频率明显增加。谢耀基认为汉语语法欧化最明显的表现是表示被动的“被”字句普遍使用起来,且表示的也不限于不愿意或不愉快的事情[9]。王克非研究指出由于翻译的影响,汉语中被动式的使用频率和范围都比从前扩大了,但不认同汉语句法欧化这一说法[11]。郭鸿杰、韩红基于语料库的考察发现在英语影响下,现代汉语“被”字句使用频率、语义功能、句式结构等方面都发生了显著变化[4]。
上述研究主要从语义韵及频数变化等方面探讨了汉语“被”字句的欧化现象,但目前此类研究数量有限,研究广度、深度有待加强。从研究对象上看,研究取材多为文学性文本,其他类型文本研究尚不多见,且专门对“被”字句或被动句式展开论述的研究相对较少,因而有必要对非文学文本中的“被”字句展开研究。从研究角度来看,目前研究大多从翻译角度研究翻译文本中的“被”字句欧化现象或对翻译文本及原创文本中汉语“被”字句的使用进行静态比较,单一汉语原创文本中“被”字句的欧化现象研究寥寥无几。从研究思维模式上看,相关研究仅聚焦于语言本身,未考虑语言使用者的因素。不同生活、学习或研究背景的人在汉语欧化程度及表现形式上也会存在差异,这一现象值得探讨。针对以上问题,本研究将对中国语言类期刊和外语类期刊历时语料中“被”字句的使用进行共时和历时的梳理、统计及对比,更客观地展示中国汉英语言研究者在“被”字句使用上的异同及背后的成因。
二、研究设计
本研究自建学术期刊历时语料库,两个子库历时语料分别选自中国语言类核心期刊《语文研究》及中国外语类核心期刊《现代外语》。选定这两种期刊语料的原因如下:首先,国内英语语言研究者因长期直接接触英语,母语书面表达中可能与其他研究者存在差异,本研究将以“被”字句的使用为例进行探讨。相比之下,国内汉语语言研究者长期从事汉语语言研究工作,汉语表达较纯粹,受英语影响也较小,故可作为有效的参照对象。上述所选两种期刊论文代表着中国汉英语言研究者较高的研究成果,能客观反映两者在汉语书面表达中存在的差异。其次,《语文研究》创刊于1980年,《现代外语》创刊于1978年,两刊刊载内容均以语言学研究为主,因而语料具有代表性及可比性。为确保历时语料的平衡性,避免历时连续采样而造成的各阶段差异模糊,本研究取自然年每十年的后五年为一个考察阶段,即1985—1990年为第一阶段,1995—2000年为第二阶段,2005—2010年为第三阶段,2015—2020年为第四阶段。
本研究旨在考察我国汉英语言研究者在“被”字句使用上的异同,因而《现代外语》中非英语语言类论文均被排除,不在考察之列。语料收集完毕后,统一转化为txt文本格式,进行文本清洁,只保留论文中文摘要和正文,去除关键词、脚注、参考文献、图形、公式、英文例子等内容。另使用Corpus Word Parser、Antconc 3.5.7、Chi-Square Calculator等软件对历时语料进行分词、词性标注、检索与统计等加工处理,并辅以必要的人工筛选、标记,以确保结果的客观性及准确性。语料库概况见表1。
表1 学术期刊历时语料库概况
三、研究结果和讨论
(一)CRC和MFLC语料库中“被”字句使用频率共时比较及历时变化
利用Antconc 3.5.7检索CRC和MFLC语料库中的“被”字句,对不符合条件的语料进行人工筛选、剔除,统计两个语料库中“被”字句在每个阶段的使用频率,然后按阶段对两个语料库使用频率进行卡方检验。如表2所示,在选取的四个阶段,MFLC语料库中“被”字句每一阶段的总体使用频数和标准频率均明显高于CRC语料库,且差异具有统计学意义。由此表明1985—2020年间中国英语语言研究者在“被”字句使用频率上远高于汉语语言研究者。这一差异显然是由两者英语语言接触方式及强度上的不同造成的。中国英语语言研究者长期浸染在英语使用环境中,从听、说、读、写等多层面直接接触英语,英语掌握程度较高,受其影响汉语欧化程度也更高,汉语语言研究者则主要通过翻译文本等书面语与之接触,且接触强度不大,书面表达方式受英语影响较小。此外,Xiao R.等人的研究证实英语被动句使用频率几乎是汉语被动句的10倍[10]。受英语被动句式的影响,国内英语语言研究者在学术写作过程中“被”字句使用频率也较高,明显超过汉语语言研究者。
表2 CRC和MFLC语料库“被”字句使用频率及共时对比
从历时角度来看,如表2所示,1985—2010年间MFLC“被”字句使用频率稳步增长,CRC也呈现出相似的变化趋势。值得注意的是,CRC和MFLC“被”字句使用频率均在2005—2010年达到最高,而在此后的2015—2020年阶段,开始有所下降,但使用频率依然高于1985—1990年和1995—2000年阶段。这一现象发生并非偶然,与中国的社会发展背景密不可分。改革开放以来,中西交流日益频繁,层次愈加深入,英语教育在中国逐渐普及。2001年中国加入WTO及2008年北京奥运会的成功举办,更是再次掀起了国内英语学习的热潮,英汉接触强度得到空前发展。Thomason研究认为两种语言如果具备足够的接触强度和接触时间,语言中的任何特征(词汇、句法、音系、形态)均可从一种语言移入另一种语言[12](P12-13)。汉语“被”字句自古有之,但在改革开放以来英汉长期高强度接触下,受英语句法影响,汉语“被”字句使用频率持续增加,对国内英语语言研究者来说,表现尤为突出。2015—2020年,CRC和MFLC“被”字句使用频率开始下降,说明学者们已普遍意识到汉语欧化问题。近年来,随着中国经济迅速发展,综合国力和国际影响力不断加强,汉语的国际地位稳步上升,与此同时汉语欧化现象引起了国内越来越多学者的关注,仅在2011—2020年间就发表了相关主题论文69篇,占了相关论文总数的60%,在众人对汉语欧化问题的持续关注下,学术写作中汉语恶性欧化现象有所缓解,汉语使用趋于规范。但今后学术写作中“被”字句使用频率是否会持续下降?该问题还有待日后更多语料加以验证。
(二)CRC和MFLC语料库中“被”字句搭配行为的比较
为考察每一阶段CRC和MFLC语料库“被”字句的搭配行为,利用Antconc搭配词(collocates)功能统计“被”的右侧5个形符跨距内的动词出现频次和搭配强度,选取两库中每一阶段搭配频次最高的5个动词进行分析,结果如表3所示。由表3可以看出,CRC和MFLC“被”字句在四个阶段搭配频次最高的5个动词中均包括“认为”“称为/称作”。此外,“视为”“视作”“看作”“看成”“当作”等同义表达在两库中出现频次也普遍较高。朱一凡、胡开宝研究发现新闻原创语料库(2006—2007)中“被”字句搭配频次最高的五个动词及每千字出现频次分别为:“称为(0.03)”“困(0.02)”“发现(0.02)”“认为(0.02)”“视为(0.01)”[5]。我们将其与同时段的2005—2010年CRC和MFLC统计结果对比,发现“被”字句高频搭配动词“认为”“称为/称作”“视为/看作”在原创新闻语料及学术论文中使用频率都很高,且新闻原创语料库中这些“被”字句高频搭配动词的使用频率与2005—2010年阶段MFLC极为相近,转化为每千字频次后,新闻原创语料库和MFLC对比结果为“称为(0.03/0.034)”“视为(0.01/0.025)”“认为(0.02/0.024)”。此外,1985—2020年,MFLC语料库“被”字句高频搭配的使用频率均明显高于CRC语料库,尤其是2005—2020年差异最为显著。
表3 CRC和MFLC语料库中“被”高频搭配的动词
语料统计过程中还发现一个有趣的现象:MFLC语料库“被”字句中存在一种CRC语料库少见的搭配形式,即“被……化”结构。该结构在MFLC中出现频次及每十万字频次分别为:1985—1990(2/0.57)、1995—2000(6/1.2)、2005—2010(13/1.85)、2015—2020(30/2.96),而该结构仅在CRC2015—2020年收集语料中出现过2次,具体搭配形式为“被焦点化”和“被前景化”。MFLC“被……化”结构具体搭配情况如表4所示。
表4 MFLC语料库中“被……化”结构具体搭配情况
王力认为现代汉语以“‘化’字做记号”的词,如“欧化、标准化”等,是受英语词缀-ize翻译的影响产生的[7](P306)。“被……化”结构在MFLC中使用频率日趋增加,2015—2020年间增幅尤为明显,而且每个阶段具体搭配词语不尽相同,使用范围不断扩宽。该结构大多可直接转化为英语“be……lized”结构,如“被语法化”对应“be grammatized”,“被话题化”对应“be topicalized”,“被数字化”对应“be digitized”。相比之下,该结构在CRC中就极为罕见。造成这一现象的原因主要为国内英语语言研究者在学术写作过程使用的术语或专业词汇大多来自英语文献,在转化为汉语的过程中,直接复制了原英语被动结构,例如“be palatalized”转为汉语就成了“被腭化”。可见国内英语语言研究者受英语被动句式影响,在“被”字句高频搭配动词出现频率及“被……化”结构使用上都与汉语语言研究者存在显著差异。
(三)CRC和MFLC语料库中“被”字句语义韵的比较
语义韵(semantic prosody)指语言单位在长期与其他词语搭配或用于特定的语境而逐渐形成的语用含义[3]。最基本的语义韵包括积极、消极和中性三种。王力指出汉语中“被”字句在汉语传统中基本上是表示“不幸或者不愉快的事情”[7](P430-433)。但五四之后,“被”字句的语义韵发生显著变化,积极义特别是中性义“被”字句比重明显增加。据贺阳的研究统计,在当代学术著作(1994—1996)中“被”字句的中性、消极及积极义占比分别达到50.4%、43.0%、6.7%[2](P234),这与本研究得出的CRC与MFLC语料库“被”字句语义韵分布特点大致相同。如表5所示,CRC及MFLC“被”字句同样也是中性义占比最大,其次为消极义,积极义使用频次最低。该语义韵分布特点的产生主要是因为学术界普遍认为学术论文应凸显“客观性”,故中性义“被”字句使用频率最高。此外,CRC及MFLC在“被”字句消极义和中性义使用频次历时变化规律上也颇为相似。1995—2000年CRC和MFLC在消极义“被”字句使用频次上有所下降,2000年以后又开始逐渐上升,尤其是CRC在2015—2020年增速迅猛,中性义“被”字句的使用则正好与之相反。这与之前统计的CRC和MFLC“被”字句使用频率变化规律似乎不谋而合。2015—2020年CRC和MFLC“被”字句使用频率的下降及2005—2020年消极义“被”字句使用率的回升反映出学者们在学术写作中汉语逐渐摆脱过度欧化,呈现出回归传统的倾向,也在一定程度上预示着汉语未来的发展趋势。
从差异方面来说,CRC和MFLC在“被”字句语义韵分布比例上略有不同。1985—2020年,CRC中性义“被”字句比例在一直明显低于MFLC,消极义分布比例则恰恰相反。英语被动句式常用来表达客观的、非人称的语义风格,以中性语义韵为主。受英语影响,汉语“被”字句的消极语义韵普遍消减,中性语义韵增强,国内英语语言学者这一群体与英语接触强度相对较大,受其影响更深,因而“被”字句语法化程度高于汉语语言学者。
表5 CRC和MFLC语料库“被”字句语义韵比较
(四)CRC和MFLC语料库中“被”字句形式特征的比较
根据Biber等人的研究,带有施事的被动结构称为“长被动”,不带施事的被动结构则称为“短被动”[13](P935)。表6显示,CRC和MFLC中长“被”字句使用比率远低于短“被”字句,但MFLC短“被”字句使用比率在同时期均高于CRC,长“被”字句则正好相反。从历时变化来看,1985—2020年MFLC短“被”字句使用比率持续增加,长“被”字句使用比率不断下降。相比之下,CRC长短“被”字句使用比率在四个阶段变动幅度都较小。
表6 CRC和MFLC语料库“被”字句形式特征
刘鼎甲、王克非、XiaoR.等学者的研究证实英语被动句一般不需要指明施事,英语长被动出现频次远低于短被动[10,14]。Quirk 等人也指出英语有过度使用被动语态的倾向,特别是正式文体中,通过隐晦施事达到“物称化”(impersonalisation)目的,因而大量使用无施事的被动语态[15](P807-808)。王力则认为汉语正常的被动式必须把主事者说出,因而较常采用长被动[16](P129)。据此,由表6可以看出,现代汉语学术写作中短“被”字句使用比率远远超过长“被”字句,逐渐趋向于英语被动句形式特征。此外,胡显耀、曾佳指出英语书面语和口语中短被动式占总被动式频率的90%[3]。与之相比,MFLC在1985—2020年短“被”字句使用比率从81%逐渐上升至90%,与英语短被动式使用比率相当,可见国内英语语言研究者受英语影响,“被”字句形式上更贴近于英语被动句式。
四、结语
本文基于学术期刊历时语料库对国内汉英语言研究者学术写作中“被”字句的使用频率、搭配行为、语义韵及形式特征进行了共时对比及历时演变研究。结果发现,从共时角度看,国内英语语言研究者在“被”字句及高频搭配动词的使用频率、中性语义韵及短“被”字句的使用比率上均明显高于汉语语言研究者,更趋同于英语被动结构特征。从历时角度看,在过去40年间国内汉英语言研究者在“被”字句使用频率和消极、中性语义韵使用比率上表现出相似的变化趋势。2010年以后“被”字句使用频率的下降及2000年以后消极语义韵的回升反映出国内学者普遍在一定程度上回归传统汉语。“被”字句高频搭配动词“认为”“称为/称作”在国内汉英语言研究者学术写作中使用比率一直居高不下,足见这些表达已得到汉语使用者的认可,成为常见书面用语。此外,国内英语语言研究者短“被”字句使用比率在40年间稳步增长,达到英语短被动式的占比,英语被动句式特征明显而汉语语言研究者在短“被”字句使用比率上相对稳定但依然以短“被”字句使用为主。
研究证实,受英语影响,中国汉英语言研究者“被”字句在使用频率、搭配行为、语义韵及形式特征等方面发生了显著变化,但近年来在一定程度上有回归传统的趋势。国内英语语言研究者因英语接触强度较高,“被”字句使用特征更接近英语被动结构,欧化程度也更高。然而,由于研究语料规模较小,且未涉及其他汉语被动手段的考察,因而对学术写作中“被”字句的使用研究尚不够全面,研究结果还有待未来更多语料加以验证和进一步深化。