APP下载

国际期刊论文摘要语步的句法复杂度
——以应用语言学为例

2021-10-16康梦超

沈阳大学学报(社会科学版) 2021年5期
关键词:复杂度句法语料库

姜 蕾, 康梦超

(东北大学 外国语学院, 辽宁 沈阳 100819)

摘要是学术论文体裁中的重要次语体,因其在结构和功能上的独立性和自含性成为一种独立的学术语篇体裁。摘要被认为是论文的“浓缩(distillation)”“精华(crystallization)”和“概要(summary)”,高度概括研究内容,展示研究结果和意义,以实现介绍和推广研究的目的。因此,学术写作研究十分关注对摘要的语篇分析。学术语篇体裁分析最常用的方法是语步分析。语步的概念最早由斯韦尔斯提出,指“话语或语篇中执行连贯交际功能的语篇或修辞单位”[1]。因为特定的语步承载特定的语篇和修辞功能,所以语步分析能够发现构建不同语步、实现不同交际和修辞功能时所使用的语言的特征,即功能和语言形式的对应。

使用语篇分析的方法研究学术语篇中作者在实现不同修辞功能时所使用的语言形式是学术写作研究的重要话题。一些研究对比分析了不同学科期刊论文摘要的语篇结构和语步差异[2-4];一些研究对比分析了不同语种期刊论文摘要的语步差异[5-6];一些研究着重考查了论文摘要如何通过恰当的语言形式实现语步功能或劝说目的[7-8]。这些研究主要从词、词块或短语层面讨论了表达不同交际或修辞功能语步的语言特征。也有一些研究关注论文摘要的句法特征,如论文摘要的人称、时态和语态[9],论文摘要中表达评价性态度的that从句[10],但对实现修辞功能所对应的句法特征的研究相对较少。此外,只分析个别语言特征不足以表现语言特征的共现性及语言特征之间如何相互作用以达到特定的交际目的。与专注单个特征的分布和功能的研究相比,一次性研究语言中多种特征的分布和共现更具有效性和启发性。本研究以应用语言学期刊为例,从多个维度考查摘要中不同语步的句法复杂度特征,以期对学术英语写作教学、测试和研究提供启示。

一、理论框架

论文摘要的语步模型在过去几十年的探索中得到不断发展。斯韦尔斯认为,摘要的结构应该与学术论文的宏观结构一致,由引言(Introduction)、方法(Methods)、结果(Results)和讨论(Discussion)4个语步组成,即他提出的IMRD模型[1]。巴蒂亚修正了该模型,提出目的、方法、结果和结论的四语步模型[11]。之后,桑托斯提出五语步模型,认为应用语言学期刊论文的摘要包括研究背景、研究内容、研究方法、研究结果和结果讨论5个部分[12]。在前人理论的基础上,海兰德也提出了自己的摘要五语步模型,他的模型与桑托斯的模型类似,虽然二者用的术语不尽相同,但表达的意思大致相同,语步顺序也一致,即先描述研究背景(Introduction),然后说明研究目的(Purpose)、描述研究方法(Method)、呈现研究结果(Product),最后总结和讨论结果(Conclusion)[2]。摘要的五语步模型得到了研究者的普遍认可,许多研究均采用海兰德的五语步模型为理论框架,如:姜峰和海兰德[13]的研究。

二、研究设计

本研究以海兰德的五语步模型为框架,分析应用语言学国际期刊论文摘要中不同语步的句法复杂度特征,并尝试回答以下两个问题:

(1)应用语言学国际期刊论文摘要中不同语步有哪些句法复杂度特征?

(2)句法复杂度指标在应用语言学国际期刊论文摘要中的不同语步间是否存在显著性差异?

1.语料收集

基于2019年SSCI期刊JCR排名,本研究选取10个高被引应用语言学国际期刊作为研究对象,逐一浏览每个期刊发表在2016—2020年间的论文题目和摘要,以每个期刊每年选4篇为原则,共选取200篇论文的摘要作为语料,建成应用语言学国际期刊论文摘要语料库(以下简称“摘要语料库”),总计35 140个词符,详见表1。本研究仅选取实证性研究论文摘要,因为实证性研究论文的语篇结构高度规约化,非实证性研究论文的语篇结构则较为随性,会因研究目的不同而有所差异。摘要作为论文的浓缩版,其语篇结构势必受到论文语篇结构特征的影响。

表1 摘要语料库

2.语步标注

语步标注可以以短语、小句、T单位和句子为基本单位,需要人工完成。基本单位越小,越便于解读语步嵌套现象;基本单位越大,人工标注的一致性越高。研究者们建议以句子为语步的基本单位进行标注,因为句子能够表达一个完整的意思,遇到语步嵌套的情况可标注该句子最基本的功能。短语、小句、T单位这些较小的基本单位更适用于对少量文本进行质化分析。因此,本研究以句子为基本单位,采用海兰德的论文摘要五语步模型(详见表2)对摘要语料库中的每个句子进行语步标注。

表2 海兰德五语步模型

为保证语步标注的准确性,在正式标注前进行了语步标注练习。两位标注者先对摘要语料库之外的20篇国际期刊论文摘要进行标注,并计算标注者信度,Cohen’s Kappa系数是0.88,表明两位标注者之间具有良好的一致性。正式标注包括3个步骤:①由标注者1对摘要语料库中的所有文本进行标注;②标注结果由标注者2审核;③不一致的标注由两位标注者讨论确定。

3.句法特征提取

本研究采用陆小飞等人提出的5个句法复杂度指标:句长、名词化、限定小句、非限定小句及主句谓语动词前置词数量[14]。这5个指标涵盖句法复杂度的不同维度:句长和主句谓语动词前置词数量体现句子的整体复杂度;限定小句的数量体现限定性从属结构的复杂度;非限定小句的数量体现子句复杂度;名词化则体现短语复杂度。详见表3。这些指标在学术语篇中十分常见,而且使用自动检索时具有很高的信度。

表3 句法复杂度指标及其描述

首先使用克莱茵和曼宁开发的斯坦福句法分析器(Stanford Parser)对文本中的每个句子进行句法拆分[15];然后使用Python程序分析所有拆分的句子,并对5个句法复杂度指标进行检索和统计。为保证Python代码的准确性,语料分析前进行了初步试验。本文对摘要语料库之外的Journal of English for Academic Purposes期刊中的50篇摘要进行人工统计,再用代码对这部分语料进行检索和统计,将人工统计和代码检索结果进行对比,计算该代码统计/检索每个指标准确性的F值(1)F值指精确率(precision)与召回率(recall)的调和平均数。精确率指代码检索出的指标有多少比例是正确的,也叫查准率;召回率指语料库中所有相关指标有多少比例被代码正确检索出来,也叫查全率。F值介于0~1之间,F值越大说明代码准确性越高。本文以斯坦福句法分析器的平均F值0.867为参照标准,高于该值则说明准确性良好。,结果表明该代码具有良好的准确性(句长F=1.00,名词化F=0.96,限定小句F=0.94,非限定小句F=0.90,谓语动词前置词F=0.94)。使用Python代码对摘要语料库中的数据进行正式检索时,还辅助了人工筛查,例如:在名词化的检索结果中,人工剔除了quality和section这些非派生名词化的单词,人工筛查进一步提升了数据的准确性。

三、研究结果

首先,对不同语步的5个句法复杂度指标进行描述性统计,提取和分析每个语步的句法复杂度特点;然后,使用单因素方差分析(ANOVA)和均值分析(ANOM)探究句法复杂度指标在不同语步间是否存在显著性差异。

1.不同语步的句法复杂度特征

不同语步句法复杂度的描述性统计详见表4,数据表明不同语步表现出不同的句法复杂度特征。引言语步谓语动词前置词最多;目的语步句子最长,非限定小句数量最多;方法语步句子最短,名词化结构和限定小句最少;结果语步限定小句最多,非限定小句最少;结论语步名词化结构最多,主句谓语动词前置词最少。

表4 不同语步句法复杂度的描述性统计

2.句法复杂度的语步间差异

本研究使用方差分析法与均值分析法探究不同语步之间在5个句法复杂度指标上是否存在显著性差异,结果见表5。

表5 不同语步之间的句法复杂度差异

方差分析结果显示:不同语步在句长、名词化、限定小句和主句谓语动词前置词4个句法复杂度指标上均存在显著性差异(p<0.010);在非限定小句方面,不存在显著性差异(p=0.406)。均值分析结果显示:在应用语言学国际期刊实证性论文摘要中,在p<0.050的条件下:目的语步的句长(mean=26.73,SD=8.61)显著大于5个语步总体平均句长(mean=23.67,SD=9.21),方法语步的句长(mean=21.71,SD=9.25)则显著小于5个语步总体平均句长;结论语步使用的名词化数量(mean=1.73,SD=1.18)显著多于5个语步总体平均名词化数量(mean=1.35,SD=1.26),而方法语步使用的名词化数量(mean=1.11,SD=1.16)显著少于5个语步的总体平均名词化数量;结果语步使用的限定小句数量(mean=0.81,SD=0.95)显著多于5个语步总体平均限定小句数量(mean=0.59,SD=0.84),方法语步使用的限定小句数量(mean=0.27,SD=0.58)显著少于5个语步总体平均限定小句数量;对于主句谓语动词前置词引言语步(mean=5.88,SD=5.01)和方法语步(mean=5.53,SD=5.13)的数量显著多于5个语步谓语动词前置词总体平均数量(mean=4.85,SD=4.65),目的语步(mean=3.65,SD=3.32)和结论语步(mean=3.61,SD=3.53)的数量显著少于5个语步谓语动词前置词的总体平均数量;对于非限定小句,均值分析结果显示没有与非限定小句的总体均值(mean=0.70,SD=0.89)之间存在显著性差异的语步。方差分析的结果与均值分析的结果相互佐证。

四、研究发现

数据分析的结果显示,应用语言学国际期刊实证论文摘要中,不同语步表现出不同的句法复杂度特征,测量的5个句法复杂度指标在不同语步之间存在显著差异。这表明作者在表达不同的修辞功能时倾向于使用不同形式的复杂的句法结构。

1.使用长句表明研究目的

长句更多地使用于目的语步,通常用于表明研究目的、论点及假设。研究目的一般较为抽象, 作者为清楚地表述研究目的,会顺带描述研究方法的部分信息,以使研究目的具体化。如下述例1,不但表明了研究目的,也描述了参与者、数据提取方法、数据分析方法等信息。正如有些学者在研究中指出的,目的语步与方法语步经常嵌套,提供的信息较为丰富[17-18]。美国心理学会也曾建议,实证研究论文的摘要在描述研究问题时,如有可能,应尽量使用1个句子。因为句子越长,所呈现的信息越多,更有助于实现目的语步的交际功能。摘要语料库中包含212句目的语步,平均每篇1.06句,基本符合美国心理学会的要求。

例1 The present study examines differences in syntactic complexity in English writing among lower intermediate and intermediate secondary education writers by means of quantitative measures of syntactic complexity, and compares the scores on the selected syntactic complexity measures with holistic ratings of learners’ overall writing quality.(摘要语料库:AW9)

2.使用名词化说明研究结论

名词化更多地使用在结论语步,用来进一步解释、延展研究结果,对结果作出推断,说明研究的理论意义或实践意义。有研究发现,作者在陈述研究意义时,通常使用表示价值取向的implication及contribution[14],以及pedagogical implication of、the implication of、the general conclusion of、the application of、the discussion of等名词性短语[19]。在摘要语料库中,实现结论语步的句子有201句,其中包含implication(s)的句子有54句,占约27%,是最典型的名词化形式。

3.使用限定小句陈述研究结果

限定小句常用在陈述研究发现、结果、观点或所完成的任务的结果语步,V+that句式是最常见的限定小句。摘要语料库中结果语步总计421句,使用AntConc检索发现,V+that结构共出现114次,占27%,最常用的动词有show、suggest、reveal和indicate。使用that从句补全信息是结果语步最突出的语言特征,这个发现与其他学者的研究结论一致[19-20],“Results showed…”“It was found that…”“A main conclusion reached is that…”这些结果语步常见句型均包含限定小句。此外,结果语步也频繁使用其他从属结构,摘要语料库中共出现152次从属结构,常用的从属连词有as、while(whilst)、whereas、when以及although。

4.使用较多的主句谓语动词前置词介绍研究背景和研究方法

主句谓语动词前置词增多让句子看起来更加复杂,这类复杂句式常用于介绍研究背景与动机的引言语步。在说明前人研究的不足时,作者通常在句首先使用一个从属小句对前人的研究作出肯定,再用主句说明研究空白。把前人的研究与现在的研究结合起来,再指出研究空白可以凸显研究主题的重要性,并帮助作者构建更加权威的学术身份。这种处理方式使得引言语步使用较多的主句谓语动词前置词。方法语步的主句谓语动词前置词也相对较多,可能是因为在表明实验步骤时需要对实验条件进行限定,表明使用的理论基础、描述参试者或语料库信息,如:数量、年龄、性别等,例2和例3便属于这种情况。

例2 Using a focused Swalesian move analysis combined with corpus-based methods, the study examines the rhetorical moves in different phases of EAP lessons and frequent lexical phrases used to signal discourse organization in each phase.(摘要语料库:JEAP3)

例3 Three sizeable subcorpora, representing the Common European Framework of Reference B1, B2, and C1 levels, were then selected for investigation.(摘要语料库:AL3)

5.方法语步较简洁

研究发现,与其他语步相比,方法语步在多个维度上表现出简短和简洁的特点,通常由多个短句来实现。摘要语料库中,实现方法语步的每个短句仅描述研究方法的一个方面,信息较少,句长较短,如例4。为实现方法语步,学者们需要描述研究中所涉及的参与者身份特征、数据来源、数据收集或实验设计步骤,以及所用的统计分析方法。学者们倾向于使用多个句子分别描述研究方法的不同方面,因此基本上每个句子长度适中,有的句子甚至偏短,且偶尔会和目的语步嵌套。此外,名词化结构和限定小句也少用于方法语步。肖建安和王志军曾指出,名词化除了使语篇更具公允性与客观性外,还可增加句子的信息密度[21]。因方法语步包含多个句子,每个句子仅描述研究设计的某个方面,故方法语步对句子信息密度要求较低,降低了名词化使用频率,也不需要使用从属小句增加单个句子的信息量,句法结构相对精悍,如例4。

例4 Scores were then compared for both summary writing tasks.(摘要语料库:AW3)

6.目的语步和结论语步较少使用谓语动词前置词

目的语步和结论语步在谓语动词前置词这个维度上体现出简短性和简洁性。目的语步通常把表研究的(research-oriented)动词放在靠近句首的位置,确保读者能够清楚地理解该句的修辞功能,即陈述研究目的。在摘要语料库中检索“study”和“article”后发现,212句实现目的语步的句子中有182句把表研究的动词放在靠句首的位置,约占80.7%,其中最常见的句型为This study investigates/ed、examines/ed、explores/ed、is to,这导致目的语步的主句谓语动词前置词数量明显更少。在结论语步的句子中,表示价值取向(value-oriented)的动词,如:suggest、contribute、conclude、demonstrate通常也出现在靠近句首的位置,并且主语较短,一般为单个名词或代词,如we、findings、results、paper、research,或与这些词相关的名词短语,如these findings、this result等,见例5。本研究发现非限定小句在不同语步之间不存在显著差异,可能因为本研究使用的语料库较小。

例5 This result suggests that raters with linguistic expertise were more attentive to accuracy whereas non-trained raters were relatively more attentive to fluency.(摘要语料库:LL11)

本研究的发现有助于增强对论文摘要不同语步句法特征的了解,深化对语言形式与功能之间联系的理解。很多学者在研究中发现,语言形式与修辞功能之间在词汇和短语维度上存在联系,本文的研究证明在句法维度上语言特征与特定的修辞功能之间也存在联系。这些研究的结果表明,学者在表达特定修辞功能时使用的语言在短语、小句及句法复杂度层面都表现出一定的倾向与特点。这个发现可以为学术英语写作教学、测试和相关研究提供一定的启示。值得注意的是,虽然句法复杂度通常被看作衡量二语学习者语言能力发展的重要指标,然而高水平的写作者应能在特定的体裁中表达特定的修辞功能时使用恰当的复杂句法结构。教学中若只强调句法形式的复杂性,学习者可能会忽视语言形式与功能之间的联系,导致为增加文本的复杂度而错误地刻意使用复杂句法结构。

五、结 论

本研究以应用语言学国际期刊的200篇实证性论文的摘要为语料,考查了不同语步在句法复杂度不同维度上的特点,结果显示不同语步在句法复杂度的多个维度上均表现出显著性差异。该研究结果表明,复杂的句法结构与修辞功能之间存在着明显的形式-功能联系,此发现为以功能为导向的句法复杂性研究提供了有力证据。此外,本研究从句法维度入手,是对以往基于词汇、词块和短语的研究的补充,拓展了学术英语研究以功能为导向的研究视角,对于学术英语写作教学具有很重要的启示。

然而,本研究也存在一定的局限性,其结论仅限于针对应用语言学国际期刊论文200篇摘要的5个句法复杂度的考查,对于结论的泛化需要采取审慎的态度。未来研究可以进行不同学科间的对比分析,以及期刊论文其他部分的句法复杂度特征的讨论。句法复杂度是一个多维概念,拥有多个测量指标,未来研究可以考查更多的句法复杂度指标。此外,本文所用语料规模较小,未来研究可以收集更多的语料。

猜你喜欢

复杂度句法语料库
数字经济对中国出口技术复杂度的影响研究
基于语料库的清末民初日源外来词汉化研究
述谓结构与英语句法配置
毫米波MIMO系统中一种低复杂度的混合波束成形算法
Kerr-AdS黑洞的复杂度
非线性电动力学黑洞的复杂度
句法二题
诗词联句句法梳理
运用语料库辅助高中英语写作
语篇元功能的语料库支撑范式介入