学术文本中的特征性句干研究:其型式与功能分布特征*
2021-03-17东华大学李晶洁
东华大学 李晶洁 庞 杨
提 要: 本文基于JDEST语料库,探讨特征性句干的型式结构与话语功能的分布特征。研究表明,特征性句干是学术写作的构建基石,具有一定程度的规约性,可包括7类主要型式结构,人称主语结构、非人称主语结构、It前置结构、存在句式、As前置结构、Wh-词结构、以及其他;实施26类典型学术话语功能,其中语篇导向功能15类、参与者导向功能6类及研究导向功能5类。此外,特征性句干的使用高度依赖于局部文本环境,由环境内各种不同性质的共选合力生成,是形式、意义与语境的制衡结果。
1. 引言
短语学已成为独立的语言学学科(Granger & Paquot 2008: 27),其研究对象涵盖广泛,包括搭配、扩展意义单位、程式语、词束、多词单位等丰富内容。各类短语实体的性质、特征、提取方法各不相同,是从不同角度对短语学本质的探析。
句干(sentence stem)是一类特殊的小句级别的短语单位,它包含主谓结构,是句子的核心。句干曾在心理学研究中颇受关注,经常用于句子补全实验(sentence completion task),即研究者依据场景设计不同类型的句干让受试者填补句干之后内容,以此来分析被试在语言认知活动中的信息处理方式或对被试做人格评估(如Booth & Happé 2010; Kircher et al. 2001; Joyce & Piper 1998等)。虽然句子补全实验的内部差异很大,但都有一个共性发现: 即很多句干对其后续命题内容有一定的预见性,而且这种预见性并非来自句干中的个别单词,而是句干作为整体产生的效应。可惜的是,句干在心理学研究中多被视为实验手段,未有明确定义,各研究者也因对其认知不同,选用的句干形式大相径庭。通过查阅相关文献,我们发现心理实验中的句干更像是句子的开启语,明确始于句首但结束的位置却因具体研究而异,例如Thetypicaltherapysessionwill be(Joyce & Piper 1998)的谓语部分只给出了意义较模糊的willbe,而Youcan go hunting with a knife and(Booth & Happé 2010)则包括明确的谓语动词和方式状语。
对句干的系统研究源自语言学领域。Pawley & Syder(1983)最早提出词汇化句干的概念,将其定义为“结构与词汇内容均固定或半固定的小句级别的短语单位”(同上: 191-192)。该研究首启了小句级别短语单位研究。然而,语言实体的词汇化呈连续统态势,词汇化和非词汇化之间并无明确界限,完全固定的词组只是词汇化过程中的极端例子。例如,在学术写作中asnotedabove的出现频率很高,据Google Scholar统计,超过182万篇论文使用了该序列,但即便如此,asnotedabove也并非完全词汇化,其变体形式包括aswasnotedabove, aswenotedearlier,aspreviouslynoted,asnotedearlier等,正是这些数量庞大的部分词汇化句干在学术写作中起到了重要作用。基于实证研究,Granger & Paquot(2008)提出篇章句干的概念,并将其定义为“由主语和动词构成、用于实现篇章功能的常规化句子片段”(同上: 44),但Granger & Paquot仅给出了篇章句干的定义,并未对其进行具体研究。张乐和李晶洁(2012)借助平行语料库技术提取篇章句干,但过程涉及大量人工,不适合应用于大规模的句干研究。李晶洁和卫乃兴(2017)发现句干具有多功能性质,除篇章功能之外,还可实施人际功能和概念功能。故此提出了功能句干的概念,将其定义为“学术英语文本中复现的包含主谓结构的连续词汇-语法序列,具有一定范围的形式变体,联结于特征性(characteristic)话语功能”(同上: 59),但该研究只讨论了功能句干的自动提取方法,并未对句干的功能性做细致描述。
在英语教学领域,已有研究表明句干匮乏是制约学生英语流利写作和独立写作的重要因素。Flowerdew & Li(2007)在调查中国理工科研究生的英语论文抄袭情况时发现,中国学生的语言借鉴(language re-use)远超出了程式语和专业术语的范围,很多借鉴的语言都是小句级别的框架语表达。其中受访的10名被试更是明确表示,他们会在写作之前阅读相关论文,并从中摘抄其认为“好的”且“有用的”词语表达,建立所谓的“潜在语言素材库”(同上: 449),这其中便不乏大量的句干式序列,如Inthisarticle/Inthispaper/Herewereport...,Thisfigurerevealsthat...,Figure2depictsthe...,Infigure1,theobservedtorquereversaleventisreproducedby....,ThefitshowninFigure1correspondsto...,等等(同上: 449-457)。细心的学生还会标明句干的具体功能,如ThefitshowninFigure1correspondsto可用于解释数据。我们姑且不论学生的这种借鉴行为是否构成抄袭,但至少说明一点,此类句干对学生的论文写作有益,且从某种程度上,已然成为论文写作的必需资源。可惜的是,我们的学生对于此类资源的学习和积累甚少,才会不得不摘录、借鉴他人文章中出现的句干。这是连学生自己都意识到的问题,更应引起我们语言研究者和教师的关注。
综上所述,句干是句子构建的核心,而句子是构成语篇的基本单位。很多句干表现出强烈的学术语域特征,是论文写作的规约表达,更是学术语篇典型意义和功能的启动语,本文将此类句干称为“特征性句干”(characteristic sentence stem),重点描述其结构与功能特征。特征性句干可实施多种话语功能,尽管研究内容纷繁多样,但句干的使用却具有因循性特征。掌握这些句干,新手作者的论文写作就会事半功倍。因此,特征性句干研究不仅是对现有短语学研究的一种补充,还可以为非英语本族语者和新手作者提供框架式词语表达,优化其写作行为,具有学术英语教学价值。
2. 语料库与研究方法
2.1 语料库
JDEST学术英语语料库是国内首个专门用途语料库,扩展后的库容为6 831 693形符,词汇总量为208 410类符。该库共涵盖40个学科领域,分别为15个社会科学学科和25个自然科学学科,其文本语料均已更新至2000年左右发表的国际学术期刊的研究论文。JDEST不仅包括广泛的学科领域,而且文本元信息标注也十分详细,因此本文使用该语料库作为特征性句干研究的数据源。语料构成与基本数据详见表1。
表1. JDEST语料库的总体统计数据
2.2 技术过程与参数标准
本文采用自行研制的短语序列提取方法(见Wei & Li 2013),对赋码的JDEST语料库进行数据检索,并设计识别特征性句干的量化参数标准。数据处理与分析按照以下三个步骤进行:
首先,使用我们新开发的句干识别方法,自动提取JDEST语料库中所有长度为2—7词的特征性句干。该方法包括五个主要步骤,即词性赋码、切词、形式识别、典型性计算和阈值设定。其中典型性计算是提取方法的核心,我们共设定三个参数标准来判断句干的典型性,分别为频数阈值(F≥5)、内部黏着力(MI≥3)和文本分布域(D≥3)。频数参数用于初步判断待抽取的句干是否为学术文本的复现表达;内部黏着力参数从序列内部的构成单词着眼,计算句干出现的显著程度;分布域参数则用于筛除文章分布过于集中的句干。只有同时满足这三个标准,即累计频数不低于5次,新MI值不低于3,以及至少在3篇文本中出现的句干,才会被最终确定为特征性句干。具体算法参见李晶洁和卫乃兴(2017: 202-214)。
然后,通过机助人工的方式,创建特征性句干的“学术话语功能数据库”。该库功能强大,不仅记录所有特征性句干的结构、频数、分布信息以及话语功能,还建立句干与文本的直接关联,记录每个句干每次出现的文本位置和所在句子信息等。图1显示该数据库的数据存储结构(以As前置句干为例),“学术话语功能数据库”包括两部分内容。第一部分记录特征性句干的词性码、内部黏着力和频数信息,如ascanbeseenin后面的[‘IN_ MD_VB_ VBN_IN’, 4.2484, 25](图1);第二部分针对每个句干,给出其在语料库中每一次出现的上下文语境。对于频数较高的句干,系统会以词语索引行的形式集中展示句干出现的局部语境。研究者可参照第二部分的索引行信息来判断该句干的主要学术话语功能。
第三,参照Hyland(2008)的话语功能模型,将特征性句干划分为研究导向(research-oriented)、语篇导向(text-oriented)和参与者导向(participant-oriented)三大功能类别。每类导向功能下设多个子功能(详见第4章)。在话语功能认定的过程中,我们发现部分特征性句干可执行多项功能。例如,句干itcanbeconcludedthat既可用于实施“总结”功能,其中的can又可表达“可能性”的立场功能。为方便之后的短语型式识别和数据统计,对于此类句干,我们只认定其最直观、最突出的话语功能,如上述句干最终被认定为主要实施“总结”功能。
第四,基于“学术话语功能数据库”,概括每个子功能下最频繁出现的短语型式。具体而言,我们将句干置于局部文本环境中,即词语索引展示的句干左右两边较大的微观语境,观察其左右两边的共现词语和结构,初步概括句干的型式特征,再将初选型式放至更多的词语索引环境中修正,直至最终确定句干的短语型式,并找寻对应的句干实例。
内容1:
{…….
‘ascanbeseenin’: [‘IN_ MD_VB_ VBN_IN’, 4.2484, 25],
‘as described above’: [‘IN_VBN_IN’, 5.1252, 46],
‘as discussed in section’: [‘IN_ VBN_IN_NN’, 5.0498, 14],
‘as I have argued’: [‘IN_ PRP_VBP_VBN’, 5.2533, 5],
‘as illustrated in’: [‘IN_VBN_IN’, 5.1270, 90],
‘as indicated above’: [‘IN_VBN_IN’, 6.3956, 9],
‘as is evident from’: [‘IN_VBZ_JJ_IN’, 5.4380, 5],
‘as is often the case’: [‘IN_VBZ_RB_DT_NN’, 6.3862, 10],
‘as is the case with’: [‘IN_VBZ_DT_NN_IN’, 6.2074, 21],
‘as is well known’: [‘IN_VBZ_RB_VBN’, 3.4133, 6],
……}
内容2:
{…….
‘ascanbeseenin’:
[‘As can be seen inthe figure, the generalized gamma distribution represents well the observed data in comparison with the Rayleigh distribution, particularly for large rolling amplitudes.’,
‘Although,as can be seen inthe upper panel of Figure 1, associations between hostility and values for social threat and anger were slightly larger for Worst compared to Usual Self, the hostility x target interaction was not statistically significant, multivariate F(1, 436) = 1.96, p > .16.’,
……],
‘as described above’:
[‘We note that the latter relationship justifies Venkatraman and Bravman’s explanation for the deviation between their Al data and the prediction of Eq. (2)as described above. ’,
‘To complete the synthesis of these tetraenols, the upper dienophyllic units were addedas described above. ’,
……],
……}
图1. “学术话语功能数据库”的原始态数据示例
3. 数据分布与结构特征
按照上述步骤,本文从JDEST中提取出5 002条不同的特征性句干,是为类符数,共有84 010 条使用实例,是为形符数。这些序列在学术文本中高频出现,是不可或缺的特征性功能的实现手段,对应于具体的话语功能,如itisalsoworthnotingthat(提醒读者注意),theseresultsareconsistentwith(分析数据),therearealimitednumberofstudies(指出研究空白),itisforthisreasonthat(推理)等。按照主语类型及句式结构特征,我们将特征性句干分为如下类别: 人称主语结构(如wearenotconcernedwith,wecanconcludethat等)、非人称主语结构(如efforthasbeenmade,studiesareneededtodetermine等)、It前置结构(如itcanbeconcludedthat,itisfairtosaythat等)、存在句式(如thereisevidencetosuggest,thereisnoreasontobelieve等)、As前置结构(如asoutlinedin,asstatedabove等)、Wh-词结构(如whatitmeanstobe,whatweknowabout等)、以及其他(包括祈使句、状语从句等结构)(如tosaytheleast,ifpossible等)。表2显示特征性句干的主要结构类别及频数。
表2. 特征性句干的结构特征及分布信息
非人称主语、人称主语和It前置结构的句干数量较多,无论形符数还是类符数都远多于其他结构。其中,人称主语和It前置结构的句干复现度较高(即形符数/类符数),均达到16,表示平均每个句干在学术文本中循环使用超过16次。如此高的数值说明,这两类句干已经凝练成为高度程式化的学术表达。人称主语结构中以第一人称代词主语(即we和I)居多,共16 708 例,占人称主语总数的53.01%。It前置句干的形符数为15 716,也十分高频。传统观点认为,软科学领域的论文具有较强的作者显现度,而硬科学则相反(Hyland 2009: 14)。本节以第一人称代词句干(用we/I-句干表示)和It前置句干为例,比较两类句干在硬科学和软科学文本中的频数分布,(1)基于维基百科全书上的学科分类,我们抽取了JDEST中23个属性明显的学科文本组成两大科学领域: 自然科学和工程学为一组,称之为硬科学,包括12个学科;人文社科领域为另一组,称为软科学,包含11个学科。其他学科的属性较为模糊,不易确定学科分类,故不予考虑,如农学、生态学、图书馆学、环境科学等。以调查硬科学和软科学领域中的作者显现度。数据结果如图2所示。
图2. It前置句干(左图)和we/I句干(右图)的频数分布
图2中,It前置句干的数据分布显示于左图,we/I-句干于右图。方框代表硬科学领域,圆圈代表软科学领域。X轴代表累计文本容量,即文本的单词总数,Y轴代表句干的累计频数。表3为T检验数据。先以左图为例,图中方框的分布略高于圆圈,表示硬科学领域论文中It前置句干的使用频数略多于软科学领域;而表3的T检验数据显示,P=0.143>0.05(显著性水平),说明这种“略多”不具备统计学上的显著意义。换言之,尽管在此次取样中It前置句干在硬科学文本中使用偏多,但其总体分布在两大学科领域中却无明显差异。然而,右图中的圆圈分布明显高于方框,说明we/I-句干在软学科领域的使用比在硬学科中频繁,T检验数据更进一步说明这种差异具有显著性(P<0.001<0.05)。这一结果表明,尽管硬科学论文也表现出一定的作者参与度,但至少在2000年左右发表的学术论文中,软科学论文中we/I-句干的使用频率仍明显高于硬科学。而另一方面,It前置句干在两大科学领域中的分布频数却极为相近,这说明无论是软科学还是硬科学,研究者都会同样使用It前置结构表述命题和态度,以突显研究结果的客观性。
表3. 硬科学和软科学频数分布的T检验数据
4. 特征性句干的学术话语功能
本文所说的学术话语功能(academic discourse function)是指学术语篇的特征性意义或功能;它高度依赖于所发生的局部文本环境。研究发现,特征性句干总是与周边语境中的共现词语交互作用以实现某一功能,形式相近的句干发生于不同语境,可能实施不同的话语功能。比如wenotethat是数学论文的常见表达,通常搭配表示“原因或条件”的状语(如And,for|T|=2,wenotethat[equation] ...),用于指明作者在某种条件下注意到的现象或进行的逻辑推导。虽然类似表达在软科学文本中也常出现,但通常搭配情态动词(如weshould/mustnotethat)用于提醒读者注意其后命题,实现作者/读者互动。两者虽然形式相近,但用于不同学科文本中或当周边语境的搭配词发生变化时,其话语功能也大相径庭;而形式不同的句干发生于相同语境,则可能表达同一功能,如短语型式AC I/we MODAL V(如inthispaper,weintendto)和This PAPER Vs(如thispaper/studyaimsto)虽然形式不同,但在实施“宣布研究特征”的功能时却是对等的互逆结构(Swales 1990: 160)。因此,缜密观察局部文本环境、概括共现型式是将特征性句干与话语功能连结的关键环节。
语料库提供的词语索引是我们观察、概括序列型式和功能的便捷工具,我们将句干置于局部文本环境中,即词语索引所展示的句干左右两边的微观语境,观察句干的搭配词语和所在的句式结构,概括其共选型式特征,并基于语义最终确定句干的学术话语功能。我们初步确定了特征性句干主要实施的26类学术话语功能。其中,过程/行动表述、状态说明、实体/概念表述、属性/特征说明、及时空定位侧重于客观命题意义的表达,属于研究导向;确定性/可能性标识、意图/能力标识、重要性/必要性标识、引起读者注意标识、评判/态度标识、指令侧重于主观态度意义的表达,是参与者导向;而呈述观点/事实、援引、篇章内部指示、呈述发现/结果、宣布研究特征、逻辑关系标识、信息来源标识、聚焦、总结、比较/对比、推理、提出质疑、举例、阐述方法/步骤,以及界定则侧重篇章信息的组织,是语篇导向。表4显示各话语功能的频数信息,按照形符数降序排列。
表4. 学术话语功能的频数分布信息
4.1 语篇导向的学术话语功能
由表4可见,语篇导向的学术话语功能是三类功能导向中的最大类别,包含15类不同的话语功能,囊括的句干数为34 558例(形符数),占特征性句干总频数的41.14%,将近半数。从语篇构成的角度看,15类话语功能可包含两类不同的语言资源,体现了学术作者的不同写作策略。其中,呈述观点/事实、呈述发现/结果、阐述方法/步骤、宣布研究特征、聚焦、总结、推理、提出质疑、举例以及界定(共计10类)为一类。此类话语功能常用于组织和启动命题,在提示命题开始的同时将其定位,揭示该命题所述内容在整个研究或文本中的位置和作用。从此种意义上讲,此类话语功能就像锚点一样,将一个个命题有理有序地固定于学术语篇中,是为“定位研究”类话语功能。而另一组话语功能,包括援引、篇章内部指示、逻辑关系标识、信息来源标识以及比较/对比(5类),则主要用于关联命题,或指向文本内部的其他命题,以揭示命题内容之间的逻辑关系,或指向文本外部,指明当前命题与其他文本之间的联系。此类话语功能就好似隐形的线一般将文本内容关联贯通,使语篇内部成分之间,以及不同语篇之间相互呼应,为“关联研究”类话语功能。
数据显示,“定位研究”类话语功能的种类比“关联研究”类话语功能丰富,其下句干的数量也是“关联研究”类的1.6倍(21 286/13 272)。在所有“定位研究”类话语功能中,“宣布研究特征”的主谓搭配特征最为明显,我们归纳如下: 其一,PAPER类名词(包括article,thesis等)倾向于和研究行为类动词共选形成句干,如thispaperdescribes,thispaperexamines等。其二,STUDY类名词(包括research,project,program等)多与表示主旨、目标、结果意义的动词词组共选,描述研究目标及方法特征,如thisresearchfocusedon,thisstudyisdesignedto等。其三,PURPOSE类名词(包括objective,aim等)与be 动词结构共选,指明研究目标,如thepurposeofthisstudywas/isto,theobjectiveisto等。总体而言,“宣布研究特征”句干具有较突出的共选行为,其搭配型式包括数量有限的词汇与语法变体,以及随之衍生出的序列变体被称为规范(norm)句干的聚合平行序列。例如,前两类共选型式在学术文本中出现频数很高,可被视为“宣布研究特征”的规范句干(Swales 1990: 160),而其聚合平行变体PREPweV(如inthispaper,weintendto),尽管出现频数不如两者高,却实现着与其相同的功能,也是学术写作重要的可选资源。新手作者可灵活调用上述句干以启动“宣布研究特征”的话语功能,并根据语境选择合适的句干及变体,可在较大程度上提高语言表述的流畅性与适切性。
4.2 参与者导向的学术话语功能
学术论文的功能不仅在于实现知识的建构,也是确认和协商学科内部社会关系的重要途径,因此参与者导向的话语功能是学术作者常用的话语策略,用于表达作者的态度和立场,或与读者进行互动。本文概括了6类参与者导向的话语功能: 确定性/可能性标识、意图/能力标识、重要性/必要性标识、提醒标识、评判/态度标识以及指令,其涵盖的句干数量为33 485例,占特征性句干总数的39.86%(见表4)。
参照Hyland的学术语篇互动模型(2005: 177),我们将参与者导向的话语功能分成两类: 确定性/可能性标识、重要性/必要性标识、意图/能力标识和评判/态度标识为“立场”类,而提醒标识和指令为“介入”类。立场是一种文本“声音”,是学术作者浸入其作品并在文中展示其态度、观点、判断、承诺的话语功能。作者表达立场的方式可以是明显的,即作者亮明身份,将其个人权威直接烙印在论据上,如weexpectthat(意图标识),weareinterestedin(态度标识)等;也可以是隐晦的,即作者将自己藏匿于文本中,用看似客观的语言形式来传递其观点,如itishardlysurprisingthat(评判标识),itisclearfromfig. #that(确定性标识)等。介入则聚焦于读者。作者通过介入资源建立与读者之间的适当关系,引导其参与文中命题的论证过程,从而影响读者对所述命题、观点等的解读,如weshouldnotethat(提醒标识),letus(指令)等。与面对面交流不同,学术语篇是一种特殊的面向读者的“独白式”对话,既要突出作者本人的学术立场和观点,又要营造和谐的对话空间,潜移默化地影响、说服读者。参与者导向的话语功能句干恰好可以为新手作者提供此类便捷资源,帮助其在论文写作中实施积极有效、且易于被读者接受的话语功能有力发声、推进研究。
“确定性/可能性标识”是最高频的参与者导向的学术话语功能,用于表明作者对所述命题或事件成真的可能性判断。数据显示,此类句干通常与局部文本环境中的其他词语交互作用,共同实现“确定性/可能性”评判,表现出对微观语境的高度依赖。例如,我们发现itispossiblethat,itislikelythat等“可能性”句干的后接从句中经常出现情态动词(如Itispossiblethatstressreversalswouldnotoccurandthefatigueproblemwouldbeentirelyacademic.)。很大程度上,此类句干与从句中的情态动词,尤其是will,would,may和can形成扩展搭配,实施“可能性”的立场话语功能,其共现频率之高,值得引起我们英语教学者与研究者的关注。
4.3 研究导向的学术话语功能
研究导向的学术话语功能是三类功能导向的最小类别,下设5类话语功能: 过程/行动表述、状态说明、实体/概念表述、属性/特征说明和时空定位,其下句干数量为14 144例,仅占特征性句干总数的16.85%(详见表4)。
总体而言,研究导向句干的词汇重复率很低,平均每个句干在语料库中仅出现10.42次(14 144/1 358),远低于其他两类话语功能句干: 语篇导向句干平均每词出现18.5次(34 558/1 868),而参与者导向句干平均每词出现20.12次(33 485/1 664)。我们认为,产生此种现象是因为研究导向句干的功能复杂性和学术语篇的高信息密度特点所致。功能上,研究导向的话语功能句干用于传递命题信息,同时表述研究内容、发现、对象、实验、乃至其他涉及的客观事物、群体等,从而实现丰富多样的命题和指称意义。为实现诸多此类功能,研究导向句干的用词和结构不可能单一化。换言之,功能的多样性决定了其形式的复杂性。纷繁多样的研究内容要求学术作者在有限篇幅内展示大量与研究相关的命题信息,而作为表述命题内容的核心组块,研究导向句干也需要灵活变化,以准确描述多样化的研究内容与结果。
然而需要说明的是,虽然与其他两类功能导向句干相比,研究导向句干的用词变化性较大,词汇重复率总体较低,但仍有一些句干在语料库中高频出现,显示出一定的规约性,如activitywasmeasured,algorithmisused,correlationswerecalculated, #oftheparticipantswere,differenceis(not)statisticallysignificant,childrenwerepresentedwith,informationisavailable,等等。这些高频句干多为“过程/行动表述”类句干,具有较强的学术语域特征,通常出现在“阐述研究方法”或“分析数据”的章节中。可见,学术研究的具体内容虽然繁杂多样,但研究者使用的研究方法却相对集中,自然对生成结果的表述也会有相通之处。例如,心理学、语言学和教育学是相近的学科领域,虽然其下研究形形色色,但都常涉及对人做实验,因此句干activitywasmeasured,participantswereinstructedto,childrenwerepresentedwith,studentswereaskedto等在三个学科的论文中均高频出现,且都是被动形式。这些句干的使用与研究对象本身并无直接关系,而是因为研究者使用了相似的研究方法。这也说明相近学科领域的研究者对科学研究方法的认知是相似的,而作为推进研究的主体框架结构,这些学科的研究导向句干也会表现出一定的规约性和因循性。
5. 结论
本文概括与描述了特征性句干在学术文本中的典型结构与话语功能特征。本次研究共提取出5 002个不同的特征性句干,合计使用84 010次。结构上,特征性句干包括人称主语、非人称主语、It前置结构、存在句式、As前置结构、Wh-词结构等主要类别。其中,非人称主语、人称主语和It前置结构的句干数量最多。传统观点认为,软科学领域的论文具有较强的作者显现度,而硬科学则相反。本文以we/I-句干和It前置句干为例,比较了两类句干在硬科学和软科学领域论文中的使用情况。结果显示,软科学的确比硬科学更多使用we/I-句干,但却和硬科学同样频繁地使用It前置句干。
特征性句干的使用高度依赖于局部文本环境,是环境内各种不同性质的共选合力产生的结果,实施特征性的学术话语功能。研究表明,特征性句干密切关联于26类学术话语功能,并在很大程度上,与具体的话语功能形成明确的形式意义配对。某种意义上,话语功能是特征性句干在具体语境中的用法体现,对应于具体的句干形式,指向形式与意义的共选。例如前文所述,在执行“宣布研究特征”的话语功能时,PAPER类名词倾向于和“研究行为类”动词搭配形成句干(如thispaperdescribes),而STUDY类名词却多与表示主旨、目标、结果意义的动词组成句干(如thisstudyisdesignedto)。可见,句干形式的选择与意义表达紧密相关,在学术语篇中,特征性句干的意义边界相对清楚,不仅更易于我们观察形式和意义的关系,而且词语选择的微妙差异更能突显意义表达的精致性。
特征性句干是学术文本中典型意义的启动语和框架语,掌握此类句干,学生的论文写作会事半功倍,但困难在于这些句干有别于传统意义上的固定或半固定词组,学生很难从现有的字典或教科书中找到对它们的解释及具体用法的介绍。因此,我们希望本研究提取的学术话语功能句干及其功能分类,能够帮助新手作者更加自如流畅地表述研究内容。此外,特征性句干还可为课程设计者和教师提供新的视角和方法去组织材料、设计教学内容,对学术英语教学提供直接助益。但毋庸讳言,本文只是对特征性句干的初始研究,对句干的功能识别也存在一定主观性。在后续研究中,我们将尝试建立学术话语功能的客观认定标准,进一步优化对句干的型式与功能描述。同时,我们还将继续改进特征性句干的计算和提取方法,以提高提取结果的准确率和召回率。