变异语言学视角下英语情态构式多元定量研究
2022-04-12李思雨 戴雅宁 孟庆楠
提要:本研究采用基于语料库的变异语言学视角,借助COHA语料库,对影响must、have to、have got to三种构式变体选择的主要因素及其在美式英语中的历时演化路径进行定量研究。结果表明:在1810—2009年,美式英语在表达“必须”这一含义时,出现了must逐渐被have to取代的趋势;影响must、have to、have got to三种变体选择的主要因素按照重要性排序依次为“时态”“体裁”以及“年代”。此外,通过进一步分析三种变体的演化规律,本研究认为英语中存在主要情态动词逐渐被半情态动词1取代的趋势。情态动词must的部分含义正逐渐由半情态动词have to表达,而半情态动词have got to的使用频率却呈下降趋势。
关键词:主要情态动词、半情态动词、多元定量研究、构式交替
1 引言
语言是联系社会成员的工具,人们通过语言传达思想、表达情感,由此社会才成为一个联系紧密的整体。然而人的交往活动并不是按照一成不变的规则进行的,沟通方式需要根据环境、人群、主题等进行适当、灵活的调整。因此交际时,为了达到某种目的、传达某种意愿、表达某种情感,说话人常常需要根据情况改变语言方式,从而使沟通更加顺畅有效。情态系统就集中体现了这种语言的变化方式,成为许多语言学家、哲学家及逻辑学家长期研究的课题。
情态是一个语义概念,可以由多种语法类别来实现,并且存在“一义多形”的现象。例如:should与ought to、shall与be destined to、will与be willing to等,每组中的词具有相似的语义及语用功能,可称之为“构式交替”现象。Perek(2015)指出,如果仅关注构式本身,而非探索构式之间的关系,就无法处理构式交替现象。Gries(2003)提出每个构式都存在基于自身功能而形成的范畴,不同构式范畴有重合的可能,但事实上差异多于共性。结合语言“经济性”原则,笔者认为两个或多个具有相似语义、语用功能的构式并不完全相同。语言使用者对几个相似构式的选择会受到语言内外部因素的限制,例如主语的有生性、时态、小句的取向、体裁、年代、说话人职业、社会阶级和性别等(孟庆楠、罗卫华 2020)。
语言学家对情态的研究取得了丰硕成果,国外学者的研究主要涉及以下三个方面:对情态系统整体进行研究(Depraetere amp; Reed 2006);从语义及语用层面对语义相近的情态动词加以区分(Cappelle et al. 2019);分析近代英式英语中表达义务、认识的情态动词及半情态动词的变化规律(Smith 2003)。但这些研究缺乏对影响情态动词选择的句法层面因素的讨论,且缺乏大量可靠数据支持。国内学者则侧重于英语情态语用方面的研究,如与英语教学紧密结合的英语情态研究(高秋萍 2009)、利用情态理论系统分析法庭上的交叉质询(王振华 2004)等,但缺乏对情态系统历时演化路径的深入探讨。
2 研究背景与研究问题
英语情态系统不断变化,主要情态动词的使用频数不断减少、意义趋向单一化;而半情态动词的使用频数日益增加,因此主要情态动词面临被半情态动词取代的风险(Krug 2000;Leech 2003)。关于must与have to的区别,很多研究者从语义、语用层面进行分析,得出must与have to都表示“必须,必要”,但是must通常为“内在驱动”,即说话人本身的主观需要;have to通常为“客观必须”,及客观因素促使“不得不做”某事。同时,Close amp; Aarts(2010)利用当代英语口语历时语料库(DCPSE),通过语义标注,将情态动词的语义分为认识情态和义务情态,随后进行频数的统计和对比分析,得出情态动词must的使用频数减少与半情态动词have to的使用频数增加存在一定关联。这为研究情态系统历时变化提供了窗口,为后来研究者探究情态动词使用频数减少是否与半情态动词使用频数增加有必然联系提供了参考。但该论文得出的结论是基于当代英语口语语料库的,此结论在书面语中是否依然成立不得而知。金婷茹(2018)对语料进行层次聚类分析,从而区分must和have to,但是侧重于对比中国英语学习者与本族语学习者在学习、运用情态表达时存在哪些不同,同时忽略了对have got to的研究,也缺乏对情态系统历时变化的深入探讨。
基于以上背景,笔者将借助离线版美式英语历时语料库(COHA),重点探讨以下三个问题:(1)must、have to及have got to三种构式变体在美式英语中具体呈现怎样的分布情况及历时演化规律?(2)对must、have to及have got to三种构式变体选择影响显著的因素有哪些,重要程度如何?(3)以must为代表的主要情态动词是否正在逐渐被以have to为代表的半情态动词所取代?
3 理论框架及研究方法
本研究采用基于语料库的变异语言学研究范式。该研究范式的基本假设为:语言使用者所具有的内在语法知识是动态的、概率化的,语言的变异现象也具有概率属性(Bod et al. 2003)。由“概率语法观”(Bresnan 2007)可知,语言使用者在选择不同构式变体的时候,会被诸多语言学内、外部因素所影响。本族语使用者,或许可以在不了解must、have to及have got to细微差别的情况下,在特定的语境中正确选择、使用这三种构式变体,但却无法道出这三种构式变体之间的细微差别。大型历时语料库为探索制约三种构式变体使用的因素提供了帮助。
基于上述理论框架,本研究采用了多因素分析的研究方法。与传统的语言使用频数的描述性方法不同的是,这种新式研究方法会随机抽取适量语料库数据,随后推测出影响构式交替的因素,从而进行人工标注。利用统计学软件,基于回归分析和分类模型等探索性方法,从多个变量中筛选出对特定构式变体选择影响最为显著的因素,而非把统计各种语言变体形符频数作为最关键的研究因素。最后,结合相关语言学理论,解读其蕴含的功能根据。多因素分析比单因素分析、本族语使用者内省式分析等研究方法更加客观、科学,不仅能全面细致地刻画语言现象,还能考察语言特征,并探索这些语言特征与语境变量是如何相互影响的(许家金 2020)。
4 语料来源与标注
为了探究19—20世纪美式英语中have to、have got to、must之间的细微差别,并快速提取相关语料,本研究选用离线版本的COHA语料库。COHA语料库是一个包含约4亿词的大型历时语料库,涵盖了小说、杂志、报纸和非虚构四种体裁,涵盖题材广且具有代表性,能够较为全面地反映美式英语在19—20世纪的变化特征。该语料库中的语料已进行了词形还原及词性标注,便于检索、提取、分析含有关键词及其搭配词的语料。本研究所涉及的反应变量为表达“必须”“不得不”的义务情态动词及半情态动词,即:must、have to及have got to。研究仅关注表达义务的情态动词must和半情态动词 have to、have got to,对于must作名词、must表示推测(如 must have done、must be+名词等)及have to、have got to中的have是实义动词等情况均不讨论。
首先,笔者通过 Perl 编程,对语料进行了初步筛选,发现符合本研究要求的含有must、have to、have got to的语料分别有400,000余条、190,000余条、1,800余条。出于可操作性和含有must和have to的符合条件的语料比例大致为2∶1的情况,笔者按照2∶1的比例分别抽取含有must和have to的语料。抽取0.4%的包含must的语料(包含陈述句、疑问句),得到包含1,600余条语料的原始数据样本;按0.2%抽取含有have to的语料(包含陈述句、疑问句),得到380条原始语料。考虑到含有have got to的语料总数较少,为了对其进行详细的研究,笔者按12%抽取,得到216条原始语料。手动标注部分变量时,笔者删除了表示认识情态的must以及have是实义动词的have to、have got to等不符合研究要求的语料。此外,笔者还删除了离线版本语料库中的乱码语料。经过严格筛选后最终得到符合本研究所有要求的1,791条语料,其中包含情态动词must的语料有1,065条,包含半情态动词have to的语料有517条,包含半情态动词have got to的语料有209条。同时,笔者核对了语料库中的原文,结合关键词的上下文语境,对少数较难标注的语料逐一进行了标注。在选取和标注影响三种构式变体的变量时,笔者参照了其他学者对 must、have to、have got to 的研究,同时学习了Szmrecsanyi et al.(2016)对相关变量的分类及标注方式,最后选择了9个可能影响该组情态构式变体的预测变量。为便于后续分析,笔者将变量的因素水平大多设置为三个,如表1所示。
5 数据分析与讨论
在对所有变量都进行标注后,笔者运用R软件,对数据进行条件推断决策树和随机森林分析,探究影响must、have to和have got to三种构式变体选择的主要因素。
5.1 影响三种构式变体选择的多因素分析
条件推断决策树模型的算法原理是:首先进行卡方检验,根据结果决定选取分类特征,如果该分类特征对反应变量的影响显著,则可选取该分类特征进入决策树模型,从而构建最佳决策树模型,将进入模型的数据进行分类和预测。与反应变量关联最紧密的变量被选取作为第一个分类变量,其他变量根据与反应变量的相关性程度,依次参与模型构建。本研究采用的方法是,在R统计软件中加载 {party} 程序包,使用ctree 函数构建条件推断决策树模型,对全部数据进行统计。笔者将上节所标记的9个变量作为模型的预测变量,反应变量为构式变体类型。由于该变量为分类型变量,因此在条件推断决策模型中,呈现结果时,在最底端使用条形图的形式。图1中的椭圆节点代表预测变量,顶部是节点序号。每个椭圆节点下会有两个分支,分支上标记的是预测变量分裂的条件。模型最底端的条形图即为叶节点,代表符合每种分裂条件组合的数据集,条形图顶部有节点序号及数据总量,底端条形图浅灰色部分、深灰色部分、黑色部分分别代表have got to、have to以及must所占比例,笔者将这三种构式变体简记为g、h、m。预测变量在树形图中所处的层次越高,意味着其对反应变量的影响越大。通过将显著性水平设置为0.05,将末枝最少数据总量设置为30,笔者构建了四层条件推断决策树模型,以便于最后呈现的可视化结果清晰直观、方便解读。数据统计后的结果如图1所示。
由条件推断决策树统计结果可知,决策树模型整体具有高度显著性(P lt; 0.001)。笔者利用混淆矩阵(confusion matrix),得出模型分类准确率为71.1%,远高于基准分类准确率59.5%(计算方式:1,065 / 1,065+517+209)。即该决策树模型根据变量特征正确分类的构式变体数量,占整个数据集中构式变体数量的71.1%。
由图1可知,最终共有六个预测变量被选取进入了条件推断决策树模型,分别为:体裁、年代、时态、动词的语法及物性、主语的代词性和动词的动态性。通过观察决策树的顶部节点可知,影响三种构式变体选择最显著的因素是“时态”。在构式变体所在语句为“现在时”的情况下,多倾向于使用must来表达“必须”的含义,而在其他情况下,则更倾向于使用have to这一能够进行屈折变化的表达。从条件推断决策树的第二层来看,影响构式变体选择的次要因素是“年代”和“体裁”。由节点2的统计数据可知,在表达“过去”和“将来”含义的语料中,1884年以前,have to的使用频数明显高于另外两种构式,而have got to的使用频数也高于must;而在1884年以后,have to所占比例进一步升高,must的使用频数也呈上升趋势,have got to却几乎消失。这一历时演化路径在图形中部的节点8处依然能够得到体现,虽然受体裁影响,have got to所占比例较高,但是总体上have got to的使用频数在历时演变中呈下降趋势,而must和have to的使用频数则呈上升趋势。在节点15中,1954年前,must所占比例最高;1954年后,have got to的使用频数变化并不明显,而must所占比例却呈明显下降趋势,have to的使用频数依然呈上升趋势。由此可以推断,在美式英语历时演化的进程中,时态并不会对三种构式变体的选择产生决定性影响,不管三种构式变体是哪种时态,在表达“必须”这一含义时,must可能正逐渐被have to所取代,这一现象也与Close amp; Aarts(2010)的观点一致。
除了“年代”这一关键预测变量,“体裁”也在构式变体的选择中起到了关键作用。由节点7的数据可知,在小说这一非正式语体当中,have got to的使用频数高于另外两种构式变体,而在报纸、杂志、非虚构等正式语体当中,have got to的使用频数大幅下降,must所占比例显著上升。这一变化趋势在节点19的数据当中也得到了显著体现,在杂志和报纸中,must的使用频数已经略高于其他两种语体,在非虚构语体中must的使用频数则更高,占据绝对优势。由此可见,在正式语体当中,当表达“必须”这一含义时,倾向于使用must。同时have to也有微弱的上升趋势,并且根据上文的分析,have to在历时演变中更占优势,而have got to虽然在历时演变中不占优势,甚至有逐渐被取代的趋势,但是在非正式语体当中,使用频数依然较高。
从图1也可以看出,动词的动态性、主语的代词性、动词的语法及物性这三个预测变量也进入了条件推断决策模型。由节点4的数据可知,当三种构式后的动词为动态动词时,多倾向于使用have to,当后接静态动词时,have to依然占据主导地位,因此笔者推测动词的动态性并不起到决定性作用。而另外两个变量却对构式变体的选择起到一定作用。由节点12的数据可知,在小说体裁中,若主语为代词,must和have to所占比例上升,must的使用频数更是占据较大优势,而have got to的使用频数则显著下降。由此可见,当主语为代词时,倾向于使用更正式的表达,即must和have to。由节点16的数据可知,在1954年之前的报纸、杂志、非虚构中,关于动词的语法及物性,若构式变体后接系动词be或是用于标记时体特征的助动词be/have,那么must的使用频数占绝对优势。
笔者标注的所有预测变量没有全部进入条件推断决策树模型当中,为了能够全面、直观地反映各个预测变量的相对重要性,笔者通过在R软件中加载{party}程序包,使用cforest 函数构建随机森林模型,对全部数据进行了随机森林分析,并将各个预测变量按照重要性进行排序,结果如图2所示。
由随机森林分析的统计结果可知,随机森林模型整体具有高度显著性(P lt; 0.001)。模型的分类准确率为76.6%。笔者通过分析对比两个模型后得出:在四层条件推断决策树中出现的变量,在随机森林分析模型中也位于相对重要性排序的前列,只有“动词的语法及物性”和“主语的代词性”这两个预测变量在重要性排序上变化比较大。由此可推断这两个变量对于构式变体的选择并不起到决定性作用。从图2中也可以看出,在条件推断决策树模型当中,“年代”和“体裁”两个变量均处于第二层,但在随机森林分析模型当中,“体裁”的相对重要性更大,这也说明表达“必须”含义的must、have to、have got to这三种构式变体的选择,在历时演变中受到体裁这一因素的影响更为显著。笔者认为,这可能是由于在美式英语发展的过程当中,对于新闻、报纸等体裁的语言表达有了更严格的规范,因而也就对这三种构式变体的选择更为慎重。
5.2 主要情态动词向半情态动词转变的总趋势
根据前文的分析,总体上看,若以1884年为时间节点,1884年后,must的频数及相对频数大幅增加;若以1908年为节点,1908年后,must的频数及相对频数也大幅增加。但若以1954年为节点,1954年后,must的频数及相对频数呈现出明显的下降趋势,have to的相对频数却呈现出明显的上升趋势。基于must和have to在1954年后频数及相对频数变化呈现近似互补的态势,笔者推测,情态动词must在1954年后可能逐渐被半情态动词have to取代。笔者又通过在线版本的COHA,利用List项下的POS,分别设置verb.modal及verb.INF,对情态动词must 和半情态动词have to的标准化频数变化趋势进行验证,发现must的标准化频数(即每百万词中must的频数)确实在1900年前后呈现下降趋势(如图3所示),而have to的标准化频数却一直呈现增长趋势(如图4所示)。因此,从相对频数变化趋势近似互补的情况来看,半情态动词have to极有可能正逐渐取代情态动词must。王娟(2007:84)指出:“英语情态动词的语义特征主要表现在说话者的主观性上。早期情态动词的主观性较弱,在从弱主观性演变为强主观性的过程中所产生的联想不是和某一事物的特征相关,而是和说话者所要表达的意愿、态度相关,如must 和 may 它们语义演变的过程中,主观性都得到了加强。”由此可知,must主观性加强,必定有一个词来承担其原有的语义及语用功能。have to与must意义相近,且很多研究表明,表达相同含义时,must倾向于表达“主观驱动”而have to则更强调“客观必须”。因此,笔者推测:半情态动词have to很有可能正在逐渐取代情态动词must的部分含义,使must的情态意义得以加强。这也与现代英语语法化的理论相符合,即现代英语中出现了新一代助动词,取代了情态动词的一些功能。
6 结语
本文通过变异语言学视角,探究了英语情态系统中的情态动词must和半情态动词have to、have got to在美式英语中的历时演化规律,并探究了对三种构式变体选择影响较为显著的因素。由研究结果可知:(1)美式英语中,must在1810—2009年使用频数正在不断下降,have got to虽然在小说语体中仍然占据很大的比重,但是在历时演变中其使用频数正在不断降低,而have to使用频数呈上升趋势;(2)影响三种构式变体选择的最主要因素是“时态”,随后依次为“体裁”和“年代”,除此之外,本研究选取的其他预测变量对三种构式变体选择产生的影响并不明显;(3)1954年之后,半情态动词have to正逐渐取代情态动词must的部分含义。
本研究借助条件推断决策树和随机森林分析实现了对三种构式变体历时演变的可视化,能够直观、细致地刻画其演变规律和影响其选择的因素,但仍然存在一些不足。have to和have got to都是半情态动词,表达的含义相近,但是在历时演变中两者的变化规律却截然不同。根据Biber et al.(1999)的研究,have got to在英式英语对话中比较常见,本研究使用的语料均来自美式英语语料库,且不包含对话这一体裁,所以本研究中包含have got to的语料较少,研究不够充分,后续研究可以结合英式英语语料库进行深入探讨。另外,半情态动词have to正逐渐取代情态动词must部分含义的总趋势仍需搭配词转移研究的印证。若后续研究能够通过大型语料库,探究must与have to后接的搭配词存在由must转移至have to的趋势,研究结果便能更加让人信服。
注释
1 关于本文中的半情态动词,学界有不同称法,Rachel amp; Traugott(1997)采用quasi-modal(准情态动词)这一术语,Quirk et al.(1985)采用semi-auxiliaries(半情态动词)这一术语。本文采用Biber et al.(1999)建议的术语,即semi-modal(半情态动词)。这几种术语的区别与联系详见Krug(2000)。
参考文献
BIBER D, JOHANSSON S, LEECH G, et al. Longman grammar of spoken and written English [M]. London: Longman, 1999.
BOD R, HAY J, JANNEDY S. Probabilistic linguistics [M]. Cambridge, MA.: The MIT Press, 2003.
BRESNAN J. Is syntactic knowledge probabilistic? Experiments with the English dative alternation [C]//FEATHERSTON S, STERNEFELD W. Linguistics in search of its evidential base. Berlin: Mouton de Gruyter, 2007: 75-96.
CAPPELLE B, DEPRAETERE I, LESUISSE M. The necessity modals have to, must, need to and should: using n-grams to help identify common and distinct semantic and pragmatic aspects [J]. Constructions and Frames, 2019, 11(2): 220-243.
CLOSE J, AARTS B. Current change in the modal system of English [C]//LENKER U, HUBER J, MAILHAMMAR R. English historical linguistics 2008. Amsterdam: John Benjamins, 2010: 165-182.
DEPRAETERE I, REED S. The handbook of English linguistics [M]. Oxford: Blackwell, 2006.
GRIES S. Multifactorial analysis in corpus linguistics: a study of particle placement [M]. London: Continuum, 2003.
KRUG M G. Emerging English modals: a corpus-based study of grammaticalization [M]. Berlin: Mouton de Gruyter, 2000.
LEECH G. Modality on the move: the English modal auxiliaries 1961-1992 [C]//FECCHINETTI R, KRUG M G, PALMER F R. Modality in contemporary English. Berlin: Mouton de Gruyter, 2003: 223-240.
PEREK F. Argument structure in usage-based construction grammar [M]. Amsterdam: John Benjamins, 2015.
QUIRK R, GREENBAUM S, LEECH G, et al. A comprehensive grammar of the English language [M]. London: Longman, 1985.
RACHEL N, TRAUGOTT E C. Scope and the development of epistemic modality: evidence from ought to [J]. English Language and Linguistics, 1997(1): 295-317.
SMITH N. Changes in modals and semi-modals of strong obligation an epistemic necessity in recent British English [C]//FECCHINETTI R, KRUG M, PALMER F R. Modality in contemporary English. Berlin: Mouton de Gruyter, 2003: 241-266.
SZMRECSANYI B, GRAFMILLER J, HELLER B, et al. Around the world in three alternations: modeling syntactic variation in varieties of English [J]. English World-Wide, 2016(37): 109-137.
高秋萍. 英语论说文中的情态问题[J]. 课程·教材·教法,2009(10):60-64.
金婷茹. 中国英语中必然类情态动词must和have to变异形式的多因素分析[D]. 大连:大连海事大学,2018.
孟庆楠,罗卫华. 变异语言学视角下英语边缘情态动词构式多元定量研究——以情态need和实义need为例[J]. 外语教学与研究,2020(5):688-700.
王娟. 英语情态动词语义演变的动因及合理性探析[J]. 苏州大学学报(哲学社会科学版),2007(6):82-84.
王振华. 法庭交叉质询中的人际关系——系统功能语言学“情态”视角[J]. 外语学刊,2004(3):51-59.
许家金. 基于语料库的历时语言研究述评[J]. 外语教学与研究,2020(2):200-212.
通信地址: 116026 辽宁省大连市 大连海事大学外国语学院