中英工学期刊英文摘要共用高频词块的语步差异研究*
2017-03-29南京农业大学南京大学
南京农业大学 胡 新 南京大学 黄 燕
1 引言
词块亦称作语块,是指语言输入中出现频率较高、作为整体储存和提取的词语程式(Wray,2002:100-121)。语料库研究发现,词块在学术语篇中的使用频率很高,因此,对学术语篇来说,词块具有重要的研究价值。国外学者对学术语篇的词块研究主要包括:对学术语篇词块的跨学科对比研究(Cortes,2004;Charles,2007;Hyland,2008);对体现语篇功能的词块特征的研究(Thompson,2001;Hyland,2005;Hood,2010:1-29)。结果表明,在学术语篇中,词块的分布频率、形式结构及功能存在着鲜明的语域特征和学科间差异,恰当使用词块是决定二语学习者成功写作英语学术语篇的重要因素。近年来,国内外学者对二语学习者学术语篇的词块使用特征进行了相关研究(Cortes,2008;徐昉,2012;王敏、刘丁,2013;王丽,2014),以寻求二语学习者与本族语者在词块使用上的差异,并对造成差异的原因进行分析,厘清学习者的困难所在。但是,这些研究主要针对学术语篇的整体特征,缺乏对其组成部分具体特征的深入研究,为此,有学者将研究目标转向学术语篇中具有独立功能的相关组成部分,但主要集中于引言部分的词块研究(Durrant& Mathews-Aydinli,2011;Cortes,2013;王丽、李清婷,2014),而对摘要部分的词块研究尚不多见。
是学术论文的重要组成部分,高质量的英文摘要不仅能够增加论文被采用、被检索的机会,促进国内学术成果在国际的交流与传播;而且有助于提高国内期刊的总体质量,从而提升我国期刊的国际影响力。鉴于学术论文摘要的重要作用,以及相关研究的不足,本文拟通过语料库统计方法,从中国作者和本族语作者共同使用的高频词块出发,对比科技论文英文摘要中这些词块的使用差异,着重考察各语步上词块的形式结构和语篇功能对中国作者词块使用所产生的影响,为中国作者正确使用常用词块提供实证依据,从而更为细致、具体地指导中国作者的英文摘要写作。具体的研究问题是:(1)中国作者和本族语作者共同使用的高频词块在总体使用频率上是否存在显著差异?(2)词块的个体使用频率如何?是否存在显著性差异?(3)词块的形式结构和语篇功能分别对各语步上的词块使用频率有何影响?两者之间是否存在交互关系?
2 研究方法
2.1 语料收集
以 Journal Citation Reports(JCR)对 Web of Science(SCI)所收录期刊的统计数据为依据,从机械工程、通信工程、光学工程、电子工程以及计算机工程学科中,选取影响因子最高的期刊在2012—2013年所刊载的美国、英国的大学或科研机构产出的研究性论文的摘要,每种期刊随机选取20篇,总计100篇,共计16 835词,建成纯文本格式的英语本族语作者英文摘要语料库,简称本族语作者语料库(Native Speaker Corpus,NSC)。在语料选取过程中,除了遵循Wood(2001)对母语使用者的定义,即第一作者的名字为英美国家本族人常用名,且署名单位所在国家使用的第一语言为英语,我们还通过文献提供的作者简介核查其教育经历所在国是否使用英语作为第一语言,以避免把英语不是母语的作者误认为是本族语作者而对其摘要进行采样。
对于中国作者的语料选取,鉴于国内刊物的参差不齐,为了使研究结果具有引领性,分别从NSC语料库相对应的学科中选取国内的顶级刊物,即《机械工程学报》、《通信学报》、《光学学报》、《电子学报》、《计算机学报》,同样采集2012—2013中这些刊物所刊载的中国作者的研究性论文的英文摘要,每刊选取20篇,总计100篇,共计14 798词,组成纯文本格式的中国作者英文摘要语料库,简称中国作者语料库(Chinese Speaker Corpus,CSC)。
2.2 语步划分
由于当前尚无法实现对语步准确一致的自动标注,我们对所创建的两个语料库进行语步分析和人工标注。本研究中,语步的划分主要依据语言学家目前普遍认同的科技论文摘要的五语步模式:背景(B)、目的(P)、方法(M)、结果(R)、结论(CD)。从理论上看,虽然语步界限分明,但由于摘要文本的简洁性和概括性特点,作者或将两种语步合并在一个句子里,对于这种情况,我们按照句子主句部分所实现的语步功能来进行语步归类。我们将五个语步分别用不同的记号标示,即1B、2P、3M、4R、5CD,并将其标注在摘要语篇中相应语步的句首。
语步标注任务由三位多年从事学术英语研究的科研人员承担,首先,三人各自独立完成所有语料的标注,然后,集中起来核查每篇摘要每个语步标注的一致性,对有分歧的语步进行分析讨论后达成一致,确保了人工标注的信度。
2.3 词块提取及处理
使用AntConc 3.2.0软件,统计 NSC 语料库中的三词词块及其频数。鉴于摘要文本的语篇结构遵循有限的模式,各语步上惯用表达的使用率较高,且频数越高、文本分布越广的词块越具有研究价值,因此,本研究采取如下提取方法:用每个词块的原始频数除以语料的总词数,再乘以100万,得到标准频数。对于NSC语料库,标准频数大于178次/mw,且至少在3个不同文本中出现,一共提取出72个目标词块。对于CSC语料库,标准频数大于203次/mw,且至少在3个不同文本中出现,共提取出了85个目标词块。然后,检索出中国作者与本族语作者共同使用的目标词块,共计13个。
分别对这13个共用的目标词块按照形式结构和语篇功能进行归类。词块的形式结构参考Biber et al.(1999:1014—1015)将学术语篇词块分十二类的方法,由于摘要语篇字数有限,结构相对固定,本研究将其整合为五个大类:动词类、名词类、介词类、从句类和连接词类。词块的语篇功能采取Hyland(2008:4—21)分为三类的做法,即研究导向词块、文本导向词块和参与者导向词块。然后,从词块的形式结构和语篇功能方面,考察中国作者和本族语作者共同使用的目标词块在各语步上的频数分布情况,对比分析两者之间的差异。对于频数间的差异采用对数似然检验。
3 研究结果与讨论
3.1 词块总体使用频率对比
统计结果显示,中国作者和本族语作者共同使用的词块在CSC中出现的总频次为119,平均每百万8 042词;在NSC中出现的总频次为104,平均每百万6 178词。总体而言,中国作者的使用量大于本族语作者,且两者间的差异达到显著水平(log-likelihood=3.87,p ﹤ 0.05)。
3.2 词块个体使用频率对比
我们继而对检索出的13个共用高频词块在CSC和NSC中的使用频率及对数似然检验值进行了对比,表1列出了其具体情况。
表1.CSC与NSC中共同出现的各高频词块使用频率对比
续 表
从表1数据可以看出,中国作者与本族语作者使用无明显差异的词块共有11个,占总数的84.62%,表明中国作者在词块使用上与本族语作者具有一定的相似性。然而,中国作者仍有2个词块的使用频率显著高于本族语作者,它们分别是动词类词块“show that the”和“based on the”;另有2个词块的使用频率差异已基本达到或接近显著值,分别是介词类词块“in order to”和动词类词块“this paper presents”。
3.3 各语步词块结构及功能对比
为了更具体地考察词块的使用差异及其原因,我们深入到摘要的各个语步,对比中国作者和本族语作者共同使用的高频词块在各语步上的分布,分析词块的形式结构及语篇功能对中国作者的词块使用所产生的影响。
总体来看,在词块结构上,CSC和NSC中没有出现共同使用的高频连接类词块,进一步的语料检索发现,本族语作者对连接类词块(如as well as、such as the)的使用频率较高,而中国作者则更多地使用“and”这种简单的并列连词来实现连接功能,两者表现出明显的差异,同时也表明中国学习者对于连接类词块的习得及其有效输出有待进一步加强。在词块功能上,CSC和NSC中没有出现共同的高频参与者导向词块,此结果提示,在该类词块的使用上,中国作者与本族语作者之间存在较大差异。
接下来,我们进一步从各语步上考察CSC和NSC中共同出现的词块在形式结构和功能方面的差异。
1)背景语步
表2列出了背景语步上,中国作者和本族语作者共同使用的高频词块在结构与功能方面的具体情况。
表2.背景语步上词块使用情况对比
表2显示,背景语步上,中国作者和本族语作者共用的词块在形式结构和语篇功能方面均无显著差异。但值得注意的是,中国作者在此语步上的词块使用频率比其他语步明显偏少,其原因可能是受到国内期刊摘要写作的影响,国内期刊通常建议作者开门见山,直入主题,因此,中国作者大多会省略背景信息,将写作的重点放在后面几个语步上。
2)目的语步
表3列出了目的语步上,中国作者和本族语作者在词块结构及功能方面的使用情况。
表3.目的语步上词块使用情况对比
表3显示,目的语步上,两者在词块功能方面存在显著差异,中国作者使用文本导向词块的频率显著高于本族语者,而对研究导向词块使用不足,不足的原因之一是该语步对名词类词块“the development of”的较少使用所造成的。语料库对比发现,本族语作者对“the development of”的使用主要集中在目的语步和背景语步,在目的语步上,其搭配框架为“名词/人称代词主语+谓语动词+宾语”结构,如“This paper explores/describes the development of”和“We discuss the development of”,此时,development意指“研制、开发”,行使“宣布研究目的或特征”的语用功能;在背景语步上,其搭配框架为介宾结构,如“with/in/for the development of”,此时,development意指“发展”,用来交代开展相关研究的必要性。中国作者使用“the development of”的数量总体非常有限,且分布在背景语步和结论语步,虽然在背景语步的搭配框架及其交流目的与本族语作者基本相同,但中国作者更倾向于在介词与development之间插入形容词来加强语气,如“for further development of”、“with the rapid/fast development of”;在结论语步上,其搭配框架表现为动宾结构和介宾结构,但都意指“发展”,用来补充说明研究前景或应用价值,如“improve the development of”、“such as the development of”。
此外,本族语作者在目的语步上较多使用具有研究导向功能的动词主动语态结构“this paper presents”,而中国作者除主动语态外,更倾向于使用动词的被动语态结构,如“is/was proposed to”、“is put forward”,因而导致对主动结构“this paper presents”的使用不足,这是造成中国作者研究导向词块使用不足的另一个重要因素。以往有关科技论文英文摘要的语步研究(如肖忠华、曹雁,2013)同样发现,中国作者在目的语步更多地使用了被动语态。原因可以归结为两个方面,其一,国内英语课堂教学对被动语态训练的过度强化;其二,国内期刊仍将避免使用主动语态纳入摘要写作要求。
另一方面,中国作者对文本导向词块的高频使用,主要是对介词类词块“in order to”的大量使用所造成的,原因是其句法灵活度低,表达意义直接,容易记忆和提取。
3)方法语步
表4统计了方法语步上,中国作者和本族语作者共用高频词块在结构及功能方面的使用情况。
表4.方法语步上词块使用情况对比
方法语步的交际功能主要是介绍研究所采用的具体方法和实验步骤等。表4的数据显示,此语步上,中国作者和本族语作者共同使用的词块结构和词块功能最为接近,表现出极大的相似性,揭示了中国作者和本族语作者对摘要的方法语步写作特点的普遍共识。
在NSC中,动词类词块“based on the”主要集中于方法语步,通过对相关实验依据的具体描述,更为客观地让读者自行判断方法的可行性。但值得注意的是,在3.2节观察到的“中国作者对based on the的使用频率显著高于本族语作者”的结论,在此语步却并未得到体现,此现象表明,“based on the”在CSC中的分布与NSC中存在显著差异。语料库的进一步分析发现,CSC中的“based on the”虽然使用的频率高,但中国作者较为均匀地将其使用于方法语步和目的语步,且在方法语步上的语用功能与本族语作者相同,而在目的语步上,则是首先阐明文章所提出的理念或方法是基于某种可靠的前提,给读者制造一种先入为主的印象,以加强读者对其后方法描述的认可度。
4)结果语步
表5列出了中国作者和本族语作者的共用高频词块在结果语步上的具体使用情况。
表5.结果语步上词块使用情况对比
续 表
表5显示,结果语步上,中国作者和本族语作者共用的词块在结构和功能上总体呈现出一定的相似性,都是以动词类词块及文本导向词块为主,但中国作者对这两类词块的使用频率明显高于本族语作者。进一步分析语料发现,此语步中动词类词块的高频使用主要是由中国作者对“show that the”的大量使用造成的,其原因与这类词块的常用性、简单性以及其具有较强的连接功能有很大关系。此语步上,中国作者倾向于表达成分间推导式关系,强调言语判断的准确性,因而,对实施语篇行为功能的文本导向词块“show that the”使用频率较高,这恰恰成为中国作者高频使用动词类词块的重要原因。相比而言,本族语作者的表达方式则更加多样化,如使用“(these results)suggest that the”、“(it)is shown that”等。
5)结论语步
表6显示了结论语步上,中国作者和本族语作者的共用词块在结构与功能方面的差异情况。
表6.结论语步上词块使用情况对比
总体看来,中国作者在结论语步的词块使用频率明显高于本族语作者,且与结果语步具有一定的相似性,同样表现为高频使用动词类词块和文本导向词块。然而,与结果语步不同的是,中国作者此语步所使用的词块在结构和功能上与本族语作者存在较大差异。在结构上,中国作者仍以动词类词块为主,本族语作者则以名词类和从句类词块为主;在功能上,中国作者仍以文本导向词块为主,本族语作者则以研究导向词块为主。中国作者对“show that the”的大量使用依然是造成动词类词块及文本导向词块高频使用的主要原因。由此可见,中国作者较为重视此语步的构建,力求通过在摘要末尾对研究结果的重要性进一步强调,来增强文章的说服力。这也充分体现出中国人的写作特点:收尾时再次强调往往能增加文章对读者的感染力,是一篇好的作品所不可缺少的重要元素。而本族语作者则认为,结论语步与结果语步的交际目的具有一定的重复性,应将其精简以缩短摘要篇幅。因此,本族语作者往往借助于少量行使研究导向功能的名词类词块或从句类词块(如that the proposed),简单直接地向读者表明研究结论。
4 结语
本文采用语料库方法,对比分析了科技论文英文摘要中,中国作者和本族语作者共用的高频词块在各语步上的使用差异,着重考察了词块的形式结构和语篇功能对中国作者词块使用产生的影响。结果发现,词块的结构和功能是影响词块在各语步使用频率的重要因素,且两者之间存在着交互关系。目的语步上,中国作者对名词类词块“the development of”及动词主动语态结构“this paper presents”使用较少,导致了此语步上研究导向词块的使用不足,而对介词类词块“in order to”的大量使用则导致了文本导向词块的出现频率较高。结果语步和结论语步上,鉴于交际目的的需要,中国作者较多使用实施语篇行为功能的文本导向词块“show that the”,从而导致对动词类词块的高频使用。背景语步和方法语步上,中国作者和本族语作者共用的词块结构和词块功能无显著差异。
本研究表明,有必要将词块教学法纳入到学术英语写作教学中去,按照形式结构和语篇功能对词块进行分类,系统讲授,以帮助中国学习者恰当使用词块,提高学术英语写作水平。在研究过程中,我们还发现中国作者和本族语作者语料库中出现的高频参与者导向词块各不相同,这表明中国作者和本族语作者在参与者导向词块的使用上存在显著差异,本文尚未对其进行系统分析,未来将收集更多相关语料,对这一现象作专题研究。
Biber,D.,S.Johasson,G.Leech,et al.1999.Longman Grammar of Spoken and Written English.Beijing:Foreign Language Teaching and Research Press.
Charles,M.2007.“Argument or evidence?Disciplinary variation in the use of the Noun that pattern in stance construction”.English for Specific Purposes 26(2).pp.203-218.
Cortes,V.2004.Lexical“bundles in published and student disciplinary writing:Examples from history and biology”.English for Specific Purposes 23(4).pp.397-423.
Cortes,V.2008.“A comparative analysis of lexical bundles in academic history writing in English and Spanish”.Corpora 3(1).pp.43-58.
Cortes,V.2013.“The purpose of this study is to:Connecting lexical bundles and moves in research article introductions”.Journal of English for Academic Purposes 12(1).pp.33-43.
Durrant P.& J.Mathews-Aydinli.2011.“A function-first approach to identifying formulaic language in academic writing”.English for Specific Purposes 30(1).pp.58-72.
Hood,S.2010.Appraising Research:Evaluation in Academic Writing.Basingstoke:Palgrave Macmillan.
Hyland,K.2005.“Stance and engagement:A model of interaction in academic discourse”.Discourse Studies,7(2).pp.173-192.
Hyland,K.2008.“As can be seen:Lexical bundles and disciplinary variation”.English for Specific Purposes 27(1).pp.4-21.
Thompson,G.2001.“Interaction in academic writing:Learning to argue with the reader”.Applied Linguistics 22(1).pp.58-78.
Wood,A.2001.“International scientific English: The language of research scientists around the world”.In J.Flowerdew & M.Peacock (eds.).Research Perspectives on English for Academic Purposes.Cambridge: Cambridge University Press.pp.71-83.
Wray,A.2002.Formulaic Language and the Lexicon.Cambridge:Cambridge University Press.
王丽,2014,二语学习者学位论文引言中非毗邻式词块的使用特征,《外语与外语教学》第5期:61—66。
王丽、李清婷,2014,二语学习者学位论文引言中词块的结构、功能以及语步特征,《解放军外国语学院学报》第4期:32—39。
王敏、刘丁,2013,中国学习者英语学术论文手稿中立场标记词块使用研究,《现代外语》第2期:190—197。
肖忠华、曹雁,2014,中外作者科技论文英文摘要多维度语步对比研究,《外语教学与研究》第 2期:260—272。
徐昉,2012,中国学习者英语学术词块的使用及发展特征研究,《中国外语》第4期:51—56。