APP下载

学习者语料库研究的多因素统计方法转向

2022-04-12李元科 何安平 黄灵敏

语料库语言学 2022年2期

提要:国际上学习者语料库研究的统计方法正在经历变革,由单因素方法转向多因素统计建模的趋势十分显著,但国内学者对此关注不足。本文首先剖析单因素统计方法的短板,阐释多因素统计建模的优势所在。接着汇报基于我国英语高考作文库的两项研究:(1)运用多分类逻辑斯蒂回归建模法研究10项细颗粒句法指标协同影响成绩的机制;(2)运用结构方程模型研究目标语词块在COCA中的频率、搭配强度和准确性协同影响成绩的复杂路径关系。最后指出语料库研究者亟须提升统计素养,这既是研究语言系统复杂性的迫切需求,也是提升语言研究科学性的必要前提。本文对新文科背景下开展语言学的跨学科研究有一定启示作用。

关键词:学习者语料库、多分类逻辑斯蒂回归、结构方程模型

1 引言

起始于20世纪末的学习者语料库研究如今已发展到了新的阶段。新趋势之一是统计方法的革新:从单因素分析转向多因素建模。近年来,一些国际学者通过多因素统计建模法,研究学习者语言的多维度特征如何影响写作成绩,这正成为学习者语料库研究的新热点。然而,国内学者对这些重要转变的关注程度尚显不足。基于此,本文首先梳理国际上学习者语料库研究在统计方法方面的变革趋势,反思以往多用单因素方法有何短板,进而阐释多因素建模的优势,最后展示使用多因素建模法开展国内英语高考作文库的句法和词块研究案例,旨在阐明将多因素统计建模法应用于我国英语学习者语料库研究的可行性和教研价值,以期推动其在国内语料库研究中得到更广泛的应用。

2 学习者语料库研究的统计方法变革

据Paquot amp; Plonsky(2017)发表的评估学习者语料库研究统计方法和研究质量的元分析(meta-analysis)报告,在1991—2015年发表于60多种国际期刊和146本编著的共计378项学习者语料库研究中,使用单因素统计方法的研究所占比例高达84%,依次为卡方(23%)、t检验(20%)、相关分析(17%)、方差分析(14%)和对数似然检验(10%);而使用多因素统计方法检验不同自变量协同影响因变量的研究所占比例却非常低,其中回归分析仅占6%,聚类分析和判别分析各仅占2%(Paquot amp; Plonsky 2017:79)。报告指出,研究者普遍存在过分倚重单因素统计方法,缺乏查验结果是否满足统计假设,以及缺乏报告效应大小等问题,这些在一定程度上体现了研究者“统计素养的缺失”(lack of statistical literacy)(Paquot amp; Plonsky 2017:67)。

研究者过分倚重单因素统计方法有可能是因为以往研究大多采用“中介语对比分析”(Granger 1996)的范式,即与英语本族语者相比,学习者对某种语言特征是否存在过多使用、过少使用和错误使用的问题,故研究者较多通过单因素统计方法检验不同群组的使用是否存在统计学上的显著差异。一些学者批评这类研究仅停留在浅层描述层面(Gries 2015b;Paquot amp; Plonsky 2017;Evert 2018;许家金 2020)。

单因素统计方法的局限性与其方法本身的短板不无关系。单因素统计方法的短板之一是无法检验不同自变量如何协同影响因变量。例如,以往较多采用的相关分析虽然可以获得各自变量与因变量之间的相关系数和显著性,或者用方差分析虽然可以检验各自变量在不同水平是否有显著差异,但是所得到的都是每个自变量单独影响因变量的情况,无法得知多个自变量协同影响因变量的总体效应。然而,学习者语言的不同子系统(如词汇、短语、句法、衔接等)之间的协同性会影响语言水平(Norris amp; Ortega 2009;Verspoor et al. 2012),且各子系统内部的不同维度特征之间同样存在协同性或竞争性(郑咏滟、冯予力 2017;郑咏滟 2018)。探究这些复杂关系必须使用多因素统计方法,才能深入剖析学习者语言的多维度特征协同影响语言能力的复杂机制(Gries amp; Wulff 2013;Gries 2015b)。短板之二是单因素方法和一些多因素方法都无法对自变量是通过何种路径对因变量产生影响开展分析,即它们无法揭示自变量是直接影响因变量,抑或是通过影响某些中介而间接影响到因变量。例如,近年来,一些国际学者使用自然语言处理工具(如CollGram、TAALES),将学生英语写作中的N词组合(n-gram)与英国国家语料库(BNC)或当代美国英语语料库(COCA)中的词块进行比对,从而得知学生使用了哪些英语本族语的词块,并通过这些工具测量出写作者所用英语本族语词块的比率和它们在BNC或COCA中的频率均值和搭配强度均值等,最后探究它们与写作成绩之间有何关联。研究表明:写作者使用COCA词块的比率越高则分数越高(Bestgen amp; Granger 2014);词块在COCA中的搭配强度MI均值越高分数也越高(Bestgen amp; Granger 2014;Granger amp; Bestgen 2014;Kim et al. 2018;Paquot 2018;Garner et al. 2019);托福独立写作的两词词块在BNC笔语库的频率均值越高则分数也越高(Kyle amp; Crossley 2016)。但由于这些研究采用的统计方法多为相关分析、方差分析、线性或逻辑斯蒂回归分析,缺乏路径分析,因此仅仅得知这些指标对写作成绩有影响,却无法解释它们是通过怎样的路径对成绩产生了影响。

针对以上短板,国内外不断有学者呼吁学习者语料库研究亟须变革统计方法。例如,Gries(2015a:71)认为,语料库驱动的研究以频次和分布等概率数据为基础,鉴于数据的复杂性,若想在语料库数据分析方面取得重大进展,必须致力于提升统计方法。而多因素统计方法是推动(学习者)语料库研究继续向前发展的“最重要建议”(Paquot amp; Plonsky 2017:85),因为“多因素统计方法既是语言描写技术,也有很强的理论解释力”(许家金 2020:1)。

纵观近五年国际上学习者语料库研究可发现,使用多因素统计方法渐成趋势。例如,Kim et al.(2021)运用结构方程模型研究写作者的认知特性(注意力、工作记忆)以及写作过程中的停顿行为(停顿的平均时长、相邻两次停顿之间的平均词长)与文本特征(作文平均长度、成绩)之间的复杂路径关系。结果显示,虽然写作者的注意力对作文成绩无直接影响,但是注意力通过影响写作过程中“停顿的平均时长”而对作文成绩产生的间接影响却达到了显著水平。换言之,注意力与作文成绩是间接相关,而写作停顿的平均时长是建立它们之间关系的中介。又如,Duan amp; Shi(2021)运用混合效应模型(mixed-effects modeling)研究学生学术英语写作能力发展与所用词块的搭配强度、结构、功能和语际一致性(congruency)有何关联。通过对31名中国大学英语学习者开展两年半的跟踪,该研究发现学习者所用词块的搭配强度、结构以及两者的交互对推动学术英语写作能力的发展起了重要作用,但词块的功能和语际一致性对写作能力发展的影响并不显著。

除了以上方法,多因素统计方法还包括多元线性回归、逻辑斯蒂回归、聚类分析、随机森林等,它们助力语料库研究在描写深度、预测语言选择机制及揭示多维度特征协同影响语言能力的复杂性等方面都有所突破和创新(许家金 2020)。可见,国际上学习者语料库研究正在转向使用多因素统计建模法,它们正逐渐取代“中介语对比分析法”而成为一种新范式。但目前在国内类似研究还不多见,只有Zhang amp; Li(2021)、张懂(2019,2020)等。在下一节笔者会展示将多因素统计建模法应用于高考英语作文库的两个研究实例。第一例使用多分类逻辑斯蒂回归(multinomial logistic regression,简称MLR)探究多种句法细颗粒复杂度指标如何协同影响作文成绩;第二例使用结构方程模型(structural equation modeling,简称SEM)研究学生使用目标语词块的频率、搭配强度和准确性协同影响作文成绩的复杂路径关系。

3 运用多因素统计建模法开展高考英语作文库研究的两个实例

下面介绍笔者基于英语高考请求信作文库(简称作文库)开展的句法和词块的两项研究。该作文库(见表1)总库容是120,871词次,它包含2016年广东省900名高三毕业生在英语高考中撰写的求助外教修改个人简历的请求信。他们的成绩介于11—25分,分别属于五个分值等级中的三档(11—15分)、四档(16—20分)和五档(21—25分)。各分值样本数均为60篇。

3.1 使用MLR研究多种句法特征协同影响作文成绩的机理

MLR是处理因变量为多分类(即至少有三个水平)变量的一种回归分析方法(温忠麟 2016:246),它不但可以检验出对因变量有显著影响的若干个自变量,还可以对它们协同预测因变量模型的效果展开评估。

考察的10项句法特征源自高中英语课程标准(中华人民共和国教育部 2020:181-183)要求掌握的四种从句句型(状语从句、宾语从句、限定性定语从句和非限定性定语从句)和六种名词性短语结构(形容词+名词、所有格+名词、名词+名词、名词+动词分词形式、名词+介词短语、动词名物化)。笔者首先使用自然语言处理技术(TAASSC)(Kyle 2016)将这些句法特征在每篇作文中的比率自动提取出来1。然后用EXCEL将它们在900篇作文中的比率(简称指标)汇总。接着在SPSS平台上使用皮尔逊相关分析,对10项指标之间的相关系数展开检验,结果显示任意两项指标之间都不存在共线性问题(r lt; 0.7)(见附录1)。因此继续在SPSS平台上使用MLR,将10项句法指标作为自变量,将作文的分档作为因变量,通过“逐步向后删除法”(stepwise backward elimination),将显著影响作文分档的指标提取出来,结果见表2。

表2的似然比检验结果显示,状语从句、动词名物化、形容词+名词、名词+名词、名词+介词短语这五项结构的比率显著影响作文的分数档次(P值均小于0.05)。而其余五项句法特征(宾语从句、限定性定语从句、非限定性定语从句、所有格+名词、名词+动词分词)的比率则对作文分档未有影响(P值均大于0.05)。为检验表2中五项指标构建的预测作文分档模型(简称预测模型)的效度,笔者进一步用MLR产出四项评估结果,分别为此模型与仅截距模型(intercept-only model)的似然比检验、拟合优度、效应量和预测准确性,结果见表3。

表3显示,预测模型在四项效度评估中都达到标准。首先,表3中的似然比检验结果显示,与仅截距模型(即不包含表2中五项显著指标的模型)相比,预测模型显著提升了准确预测作文分档的效果(P = 0.000 lt; 0.05)。接着来看表3中的拟合优度,皮尔逊卡方的显著性值(0.963)和偏差卡方的显著性值(0.984)都大于0.05,表示用此模型来预测作文分档的结果与它们的实际分档在总体上并无差异,可得知“模型的总体预测效果理想”(Petrucci 2009:200)。再看表3中的效应量,依据“麦克法登效应量介于0.2和0.4之间是评估模型能够较好解释因变量方差的基准”(Petrucci 2009:200),此效应量(0.216)达标。最后,看表3中的预测准确性,与基准比率(33%)2相比,虽然此模型预测四档作文的准确率(33%)一般,但是它准确预测三档作文的比率(72%)和五档作文的比率(59%)都远超过基准。换言之,表2里五项句法特征对预测三档和五档请求信作文有较高的准确率。

在用MLR建立数据模型之后,笔者在三档和五档作文里对表2中五项预测性句法特征开展批量提取和质性分析,发现它们在不同水平作文之间的比率差异与写作者的语用得体性和词汇能力有协同关联。以表2第一行的状语从句为例,鉴于之前TAASSC的分析结果显示,它在五档作文的比率是三档的2.5倍,笔者手动提取了这两个分档作文中的所有状语从句,发现它们的差异主要归因于if-状语从句的使用率:if-状语从句在五档的频次是三档的1.73倍。进一步观察五档作文里的401例if-状语从句,有70%以上(287例)出现在I+will/would+appreciate+it+if-状语从句句型中,如I will appreciate it if you can do me a favor,表达“间接请求”(Economidou-Kogetsidis 2011)。反观三档作文,此类if-状语从句仅有2例;而表达“直接请求”(Petrucci 2009:200)的语例却很多,例如:I hope that you can help me有33例,I hope that you can give me a hand有22例,I want you to help me有19例,I need you to help me有17例。由此可见,五档作文者多用更为礼貌得体的间接请求类句式,他们的语用能力明显优于三档作文者。又例如,表2第二行的动词名物化在五档作文中的比率是三档的4.8倍,两者的差异主要归因于该话题作文关键词apply的名物化形式(application)的使用率。Application在五档作文中的频次(412次)是三档(79次)的5.2倍。对apply进行名物化后形成的正确搭配application forms在五档作文中有24例;在三档作文中却无一例。相反,三档作文含有大量把apply误用为修饰语的错误搭配,如apply book(38例)、apply letter(12例)、apply forms(8例)、apply paper(5例),可见动词名物化及其搭配能够映射写作者运用词汇的水平。

此项研究展示了基于语料库的语言特征分析与MLR建模深度融合的优势。首先是使用TAASSC自动测量出细颗粒句法特征在三个分档作文中的比率。其次是使用MLR检验得知有五项句法特征显著影响了作文成绩,并利用MLR验证了它们预测作文成绩模型的效度达标。最后将这五项预测性句法特征带回到文本里开展质性分析。结果表明,不同水平学习者使用这些句法结构与他们的语用能力和词汇能力之间具有协同性。

3.2 使用SEM研究目标语词块的频率、搭配强度和准确性协同影响写作成绩的复杂路径关系

SEM综合了因子分析、回归分析和路径分析(许宏晨 2019),它不但能够测量自变量直接影响因变量的效应,还能够测量自变量通过影响某个(些)中介变量间接影响因变量的效应(即检验中介作用)。在本例中笔者使用SEM研究目标语四词词块的频率、搭配强度和准确性对写作成绩的影响。由于本研究具有探索性,故将目标语词块的频率作为自变量,将写作成绩作为因变量,将搭配强度和准确性作为中介变量,做出四条路径假设(见图1):(1)目标语四词词块的频率直接影响写作成绩的效应是怎样的?(2)目标语四词词块的频率通过影响搭配强度间接影响写作成绩的效应是怎样的?(3)目标语四词词块的频率通过影响准确性间接影响写作成绩的效应是怎样的?(4)目标语四词词块的频率依次通过影响搭配强度和准确性从而影响写作成绩的效应是怎样的?通过SEM测量出不同路径的效应大小和显著性来验证最理想的路径。

首先使用CollGram(Bestgen amp; Granger 2014)从作文库(见表1)的每篇作文中提取出所有连续性的四词组合(如if you can help),然后通过此工具将它们与当代美国英语语料库(COCA)中的四词词块进行比对,从而得知写作者使用了哪些目标语词块。接着使用CollGram测定每篇作文所有四词组合中目标语所占比率,它表征写作者准确使用四词词块的程度(简称准确性)。接下来通过CollGram测量出每篇作文所用目标语四词词块(类符)在COCA总库中的频率均值(简称目标语词块的频率)和MI3均值(简称搭配强度)。最后,笔者将目标语词块的频率、搭配强度和准确性的结果导入SEM分析工具Process 3.5(Hayes 2018),对上述四条路径的效应开展分析,结果见表4。

如表4所示,路径(1)未达到显著水平(P gt; 0.05),表明目标语词块的频率对写作成绩无直接影响。路径(3)也未达到显著水平(P gt; 0.05),表明目标语词块的频率通过影响准确性而间接影响写作成绩也不成立。路径(2)和(4)都达到了显著水平(P lt; 0.05),而且后者的效应(5.732)是前者(2.397)的两倍多,可见路径(4)与语料库数据的拟合最佳,表明目标语词块的频率需要通过影响搭配强度和准确性从而影响写作成绩。

语言学理论和二语研究结论都能为路径(4)提供“学科理论的解释”(温忠麟、刘红云 2020:95)。首先,基于使用的语言学理论认为,不同语言成分在一起共现的频次是影响它们之间搭配强度的关键因素(Gries amp; Ellis 2015:231;蔡金亭、陈家宜 2019:5),在词块层面,它体现为若干个单词在一起共现所组成词块的频次会直接影响到它们之间的搭配强度。MI作为一种搭配强度的算法,语料库研究者发现高频词的搭配通常被赋予的MI值较低,而低频词的搭配被赋予的MI值较高(Gries amp; Ellis 2015:237)。其次,二语认知加工研究表明,词语之间的搭配强度与可预测性有密切关联(Durrant amp; Doherty 2010),搭配强度越高的词块在通过其内部的前面单词来预测后面单词的准确率就会越高(Jiang amp; Nekrasova 2007;Ellis et al. 2008:388),而且高强度搭配词块还能作为一个整体来吸纳、储存、记忆和输出,从而提升语言产出的正确性(Wray 2002:72)。最后,词汇搭配的准确性正向影响写作成绩也已经被证实(Bestgen amp; Granger 2014;Crossley et al. 2014)。

此项研究展示了将SEM应用于语料库语言特征分析的优势。一是使用它开展路径分析揭示了词块的多维度特征是通过怎样的路径关系影响到写作成绩,它突破了以往研究存在的偏重描写但对深层机理探索不足的局限性。二是研究者可将路径分析的结果与语言学理论和二语研究的结论开展互鉴,这有助于对学生语言的多维度特征协同影响写作成绩的复杂机理作出更加科学的诠释。

4 结语

本文通过文献综述和案例分析,阐述了融合自然语言处理技术和高阶统计深挖句法和词块的多维度特征协同影响写作成绩的理论意义和实用价值,这对新文科背景下开展语言学跨学科研究有两点启示。第一,学习者语料库研究的复杂性不亚于心理学和认知科学等其它学科的研究,语料库研究者同样需要借鉴相关计量技术。这既是语言系统复杂性所决定的,也是提升语言研究科学性所必需的(Gries 2015a:50;Gries 2015b:173)。第二,语料库研究的新趋势是与高级统计相融合,逐步形成一种新的数据驱动路径(Hunston 2017):有别于传统语料库统计是从某些词语切入,新范式是从数据切入,通过建立数据模型来揭示语料库更深层次的共选和关联本质。诚然,新旧融合的研究范式应该是“计量分析+可视化+人类解释”形成的三位一体,而不是没有任何解释力的数据模型(Evert 2018)。研究者在建立数据模型之后,有必要回归文本作质性分析,或者将模型结果与语言学理论和实证研究结论开展比对,这不但有助于对数据模型作出具有理论支撑的诠释,而且还能对现有理论进行补充、修正或完善,以提升其科学性和在语言教学和理论研究中的实用价值。

注释

1 由于非限定性定语从句的比率和动词名物化的比率未能由TAASSC提供,故通过手动分析获得。前者采用与TAASSC一致的从句比率计算公式,即每种从句数量除以所有小句的总数;后者采用与TAASSC一致的名词短语结构比率计算公式,即每种名词短语结构的数量除以所有名词短语的总数。

2 由于此作文库里三个分档的作文数量均等,因此每个分档用于评估预测准确性的基准比率都是33%(100%/3)。

3 MI是Mutual Information(互信息)的缩写,它是测量搭配强度的一种算法。MI值越高,则搭配强度越强。

参考文献

BESTGEN Y, GRANGER S. Quantifying the development of phraseological competence in L2 English writing: an automated approach [J]. Journal of Second Language Writing, 2014, 26(1): 28-41.

CROSSLEY S, SALSBURY T, MCNAMARA D. Assessing lexical proficiency using analytic ratings: a case for collocation accuracy [J]. Applied Linguistics, 2014, 36(5): 570-590.

DUAN S, SHI Z. A longitudinal study of formulaic sequence use in second language writing: complex dynamic systems perspective [J]. Language Teaching Research, 2021: 1-34.

DURRANT P, DOHERTY A. Are high-frequency collocations psychologically real? Investigating the thesis of collocational priming [J]. Corpus Linguistics and Linguistic Theory, 2010, 6(2): 125-155.

ECONOMIDOU-KOGETSIDIS M. “Please answer me as soon as possible”: pragmatic failure in non-native speakers’ e-mail requests to faculty [J]. Journal of Pragmatics, 2011, 43(13): 3193-3215.

ELLIS N, SIMPSON-VLACH R, MAYNARD C. Formulaic language in native and second language speakers: psycholinguistics, corpus linguistics and TESOL [J]. TESOL Quarterly, 2008, 42(3): 375-396.

EVERT S. The hermeneutic cyborg: Sinclair Lecture at Birmingham University [EB/OL]. (2018-06-25) [2022-07-15]. https://www.birmingham.ac.uk/research/activity/corpus/news/2018/sinclair-lecture-2018.aspx.

GARNER J, CROSSLEY S, KYLE K. N-gram measures and L2 writing proficiency [J]. System, 2019, 80: 176-187.

GRANGER S. From CA to CIA and back: an integrated approach to computerized bilingual and learner corpora [C]//AIJMER K, ALTENBERG B, JOHANSSON M. Languages in contrast: text-based cross-linguistic studies. Lund: Lund University Press, 1996: 37-51.

GRANGER S, BESTGEN Y. The use of collocations by intermediate vs. advanced non-native writers: a bigram-based study [J]. International Review of Applied Linguistics, 2014, 52(3): 229-252.

GRIES S. Quantitative designs and statistical techniques [C]//BIBER D, REPPEN R. The Cambridge handbook of English corpus linguistics. Cambridge: Cambridge University Press, 2015a: 50-71.

GRIES S. Statistics for learner corpus research [C]//GRANGER S, GILQUIN G, MEUNIER F. The Cambridge handbook of learner corpus research. Cambridge: Cambridge University Press, 2015b: 159-181.

GRIES S, ELLIS N. Statistical measures for usage-based linguistics [J]. Language Learning, 2015, 65(S1): 228-255.

GRIES S, WULFF S. The genitive alternation in Chinese and German ESL learners: towards a multifactorial notion of context in learner corpus research [J]. International Journal of Corpus Linguistics, 2013, 18(3): 327-356.

HAYES A. Introduction to mediation, moderation and conditional process analysis (2nd edition) [M]. New York: The Guilford Process, 2018.

HUNSTON S. Corpus Linguistics in 2017: a personal view [EB/OL]. (2017-07-24) [2022-12-29] http://www.birmingham.ac.uk/cl2017.

JIANG N, NEKRASOVA T. The processing of formulaic sequences by second language speakers [J]. The Modern Language Journal, 2007, 91(3): 433-445.

KIM M, CROSSLEY S, KYLE K. Lexical sophistication as a multidimensional phenomenon: relations to second language lexical proficiency, development, and writing quality [J]. The Modern Language Journal, 2018, 102(1): 120-141.

KIM M, TIAN Y, CROSSLEY S. Exploring the relationships among cognitive and linguistic resources, writing processes, and written products in second language writing [J]. Journal of Second Language Writing, 2021, 53(3): 1-15.

KYLE K. Measuring syntactic development in L2 writing: fine grained indices of syntactic complexity and usage-based indices of syntactic sophistication [D]. Atlanta, GA.: Georgia State University, 2016.

KYLE K, CROSSLEY S. The relationship between lexical sophistication and independent and source-based writing [J]. Journal of Second Language Writing, 2016, 34: 12-24.

NORRIS J, ORTEGA L. Towards an organic approach to investigating CAF in instructed SLA: the case of complexity [J]. Applied Linguistics, 2009, 30(4): 555-578.

PAQUOT M. Phraseological competence: a missing component in university entrance language tests? Insights from a study of EFL learners’ use of statistical collocations [J]. Language Assessment Quarterly, 2018, 15(1): 29-43.

PAQUOT M, PLONSKY L. Quantitative research methods and study quality in learner corpus research [J]. International Journal of Learner Corpus Research, 2017, 3(1): 61-94.

PETRUCCI J. A primer for social worker researchers on how to conduct a multinomial logistic regression [J]. Journal of Social Service Research, 2009, 35(2): 193-205.

VERSPOOR M, SCHMID M, XU X. A dynamic usage-based perspective on L2 writing [J]. Journal of Second Language Writing, 2012, 21(3): 239-263.

WRAY A. Formulaic language and the lexicon [M]. Cambridge: Cambridge University Press, 2002.

ZHANG X, LI W. Effects of n-grams on the rated L2 writing quality of expository essays: a conceptual replication and extension [J]. System, 2021, 97(2): 1-14.

蔡金亭,陈家宜. 基于使用取向的英语动词论元构式二语研究[J]. 北京第二外国语学院学报,2019(5):4-16.

温忠麟. 心理与教育统计:第二版[M]. 广州:广东教育出版社,2016.

温忠麟,刘红云. 中介效应和调节效应方法及应用[M]. 北京:教育科学出版社,2020.

许宏晨. 第二语言研究中的结构方程模型案例分析[M]. 北京:外语教学与研究出版社,2019.

许家金. 多因素语境共选:语料库语言学新进展[J]. 外语与外语教学,2020(3):1-10.

张懂. 语料库量化方法在构式语法研究中的应用[J]. 现代外语,2019(1):134-145.

张懂. 英语与格构式变体的多变量分析及其心理现实性研究[J]. 外语教学与研究,2020(1):40-52.

郑咏滟. 高水平学习者语言复杂度的多维发展研究[J]. 外语教学与研究,2018(2):218-229.

郑咏滟,冯予力. 学习者句法与词汇复杂性发展的动态系统研究[J]. 现代外语,2017(1):57-68.

中华人民共和国教育部. 普通高中英语课程标准(2017年版2020年修订)[M]. 北京:人民教育出版社,2020.

通信地址: 510631 广东省广州市 华南师范大学外国语言文化学院