专业学生情态序列主题性年级趋向*
2021-09-09江西师范大学龙绍赟上海外国语大学黄宝荣
江西师范大学 龙绍赟 上海外国语大学 黄宝荣
提 要:“参照语料库可以是多种文体的混合语料,而且越大越好。……”(Mike Scott,2016:112)。本文以BaREnloB为参考语料对比探析了中国英语专业学生语料库WECCL(1.0)四个年级大学生议论文中情态序列使用的年级趋向。研究发现:1)方差分析与稳健性检验表明,BIS、LOG_L与LOG_R各指标基本呈现显著的年级差异,类认知序列除外。2)方差分析均值图发现:就认知序列而言,BIS与LOG_L随年级上升而上升,在三年级达到高峰值,四年级跌入低谷;而LOG_R随年级上升而缓步上升,四年级达到高峰值;就义务序列而言,BIS与LOG_L随年级上升而逐步下降,但在二年级有些反复,出现高值;而LOG_R随年级上升稳步向下,时急时缓;而在类认知序列方面,尽管BIS、LOG_L与LOG_R的变化趋势基本趋于一致,随着年级的上升基本平缓不动,稍有波动,只在四年级时达到最好,但并不存在显著的年级区别。3)参数检验与非参数检验结论基本不相同,有些结论完全相反。
1.引言
情态动词研究近年来备受国内外学者关注(如Aijmer,2002;Biber et al.,1999;Coates,1983;de Haan,1997;Hunston,2004;Mindt,1993;Palmer,2001等),其中单就主题性的或语言其他特征研究纷繁多样,还有进行实证操作的研究。国外鲜见以“情态序列(modal sequences)”命名的研究,而国内自2008年以来,出现了不少专以情态序列为题或为关键词的论文(如刘文艳,2009;刘陈艳,2013;龙绍赟,2009,2011,2012,2013,2014,2016;梁茂成,2008;冯莎,2017;张正厚等,2016;张红琼,2014等)。总体来说,因所用语料大小、语体各异,得出的结论不够一致,且不涉及效应量,因此科学性不够强。况且,国内从年级的视角对学习者情态序列总体进行发展特征的探究凤毛麟角,有研究(如龙绍赟,2013)因参照语料库较小,且语体单一,可靠性不太高,因此需要进一步的探讨。
1)情态序列及其教学与研究启发
情态动词常与助动词以及实义动词构成“主语+情态动词(+助动词)实义动词”类属序列,此类属序列可能是类连接(colligation),可能是搭配(collocation),可能是“主语(+认知情态副词)+情态动词”,也可能是“情态动词+动词(的完成体/进行体)+(状语/补语)”等,这些都叫做情态序列(Hunston,2001,2004)。因为情态动词大多一词多义,且词义往往重叠(Aijmer,2002;Mindt,1993),反复无定,加之所处语言文化与语言习惯的不同,语义容易混搭,导致意义混淆,使得语义只能在具体语境中予以衡定(Bybee&Fleischman,1995;Hunston,2004;Kratzer,1981;Mindt,1993)。因此,在语言学习中,情态序列学习比孤立情态动词学习与研究的意义更强大(Hunston,2004;Sinclair,1995)。
情态序列的概念也得到Firth和Sinclair的启发与认同。Firth(1957)和Sinclair(1991,2004)认为词语的意义由“词项序列(lexical sequences)”决定。Sinclair(1995)还认为套语(phraseology)能最充分地解释词汇运用。他发现,在不同的短语搭配中,“must”可以获得不同的语义。据此可得:学习情态动词时,不能孤立地学习独立的词项,而应在具体的语境中对情态序列的多种具体含义进行具体分析。
2)认知情态/序列、类认知情态序列、义务情态/序列
Biber et al.(1999)、Coates(1983)、de Haan(1997)、Larreya(2004)、Palmer(2001)等把情态大致分为两类:认知情态与义务情态。认知情态关注语气的肯定程度、叙事的真值评价或个案的可能性,而义务情态表达主语承担的责任与要求或主语可实施的行为(Biber et al.,1999;Coates,1983)。
常见的情态序列有:a.无灵主语或there或其他引导词+情态动词;b.情态动词+静态动词;c.情态动词+动词的进行体/完成体;d.情态动词(+认知情态副词)+实义动词。只要句法搭配中出现表1中4种结构,我们就可以据此认定并证实情态语义序列在句中出现。
表1列出了常见的认知情态序列,如:NN1 CAN VBI VVN[The ground can be made(wet)]表达的是典型的真值判断。像PPY MUST VVI就是典型的义务情态序列,因为you must make涉及有灵主语、动态动词等。而像COULD XX VVI(could not do)就是类认知情态序列,因为不结合上下文具体的情景无法同时判断这是表达“禁止”“意愿”“能力”还是“可能”,本文权称为“类认知情态序列”,略为“类认知序列”。
表1.情态动词句式与情态语义的对应关系
3)情态序列与情态意义的对应关系
Biber et al.(1999)、Coates(1983)、Wärnsby(2003)等认为,情态序列与情态语义类型之间存在简单的对应关系,可通过序列句式预测情态动词的情态语义。具体概括如表1。
我们认为,给定语料中,认知情态序列出现越多,一定程度上可以预测义务情态序列出现越少,反之亦然。基于这种认识,运用语料库序列提取与加工技术,我们就可以比较精准地判断出语言的认知语义表述形式。
2.研究设计
本研究以WECCL1.0议论文为观察语料,以BaREnloB为参照语料(大于观察语料库6倍以上),以主题性的三大考察指数BIS、Log_L与Log_R(效应量的一种变体,具体解释见2.3.3),同时增加考察变量(类认知序列)历时考察中国专业学生对于情态语义表述的特征表现,进一步从主题性的角度(唯一测量指标)探究专业学生在情态序列上的发展特征,以期更科学、更全面地揭示中国大学生书面语中情态语义表述现状,验证并发展之前有关本主题的研究,更有效地为情态动词的教学等提供适切的进一步理论启发,提高情态动词习得效果。
1)研究假设
(1)受语言认知规律的影响,中国英语专业学生议论文中认知情态序列的使用会随着年级的升高而升高,义务情态序列会随年级上升基本呈现下降的趋势,类认知情态序列的变化大体上与认知序列的变化趋于一致,受到社会及文化环境影响,上述频率在某些年级存在细微的差异。
(2)主题性结果指标BIS、Log_L与Log_R所呈现的数据与图表中,BIS与Log_L基本相似,Log_R会有不一样的表现。
(3)同一组数据,参数检验与非参数检验结论会有所不同。
2)研究问题
基于上述假设,本研究旨在解决如下问题:
(1)专业大学生议论文中的认知情态序列是否会随着年级升高而升高,义务情态序列是否会随着年级升高而降低,类认知情态序列是否会随着年级升高而升高?
(2)参数检验与非参数检验结果是否有所不同?
3)语料、预处理及分析程序
(1)语料
①观察语料:本研究使用的学习者语料来自WECCL1.0(文秋芳等,2001)专业学生议论文作文子库。为了便于观察认知情态序列使用情况,研究者试用分库软件把本语料中赋码后带有标记题头的文件析取出4个不同年级的语料子库,组成本研究中的“学习者议论文年级语料库”,具体见表2。
表2.观察语料库、参照语料形符等具体情况
续 表
②参照语料库:为了形成对比,研究中使用了学术程度不同的语料库,分别为:1.BAWE,2.RA,3.ENS,4.LOCNESS,5.BNCessay。遂命名为BaREnloB。
BAWE由牛津布鲁克斯大学、雷丁大学和华威大学于2004—2007年间创建。语料包括本科生或研究生撰写的2 761个学术文本,共计6 506 995词次,本研究随机选取了英语学术语料库(BAWE)中的2 062个文本,共计5 251 926词次。
RA(Research articles)语料是作者学生自创①此库由学生彭玉娜于2014年为完成硕士论文时自我编制完成,在此表达感谢。,从2002—2014年应用语言学的3个国际期刊:Applied Linguistics,Studies on Second Language Acquisition and System中抽取来的共39篇文章。作者大多数来自英语国家,其中一小部分是非母语人士,主题全部为应用语言学和二语习得。
ICNALE自2007年开始由日本神户大学石川慎一郎(Shin'ichiro Ishikawa)教授主持开发建设,所有的文本均基于两个给定的作文题目,作文长度为200~400词。该语料库收集了东南亚几个国家的英语学习者的写作语料和英语本族语者的写作语料。本研究选用该语料库中的英语本族语者子语料库(ENS1和ENS2),此处合称ENS。
英语本族语大学生议论文语料(LOCNESS)(Louvain Corpus of Native English Essays)是由比利时Louvain大学Sylvine Granger教授于1995年主持建立的英美本族语大学生作文语料库,共包含297个文件。
英国国家语料库(British National Corpus,简称BNC)是由英国牛津大学出版社、兰卡斯特大学英语计算机研究中心以及大英图书馆等联合开发建立的大型语料库。本文由本库开发INDEX选取的BNC essay包括英美大学生撰写的主题议论文,共包含10个文本库。
从上文可以看出,本研究所用参照语料库:a.总量大,是学习者语料库的6倍,就最小的grade 4而言,达到313倍,符合国际通用规范与标准(Berber-Sardinha,2000)。b.学术性强。像BAWE、BNC essay以及RA就是较为典型的学术性程度不一的语料库。
根据Scott(2016)的研究,就关键词产生的好坏而言,无关乎参照语料库大小之以及是否奇怪与正常;就关键词的产生精准值(precision value)②精准值是在Oakes之后计算的“实际上相关的检索条目的比例”(获得的相关条目的数量除以检索条目的总数)(Scott,2016:85)。精准值衡量的是实际相关的检索项的比例(获得的相关项的数量除以检索项的总数)(Oakes,1998:176)。而言,没有所谓的不合格的参照语料库;参照语料库可以是多种文体的混合语料,而且越大越好,当然最好在标准之内。同时,他的研究还得出结论:参照语料文本的语体不同,所得出的关键词也会有所不同。
同时,本研究的参照语料库为最近二十几年之内的学术与一般议论文所得出的关键词基本同质,其主题性数据基本可信、有效。
(2)语料预处理
为了方便考察语料中情态序列的句法特征,本研究运用Aarts&Granger(1998)和To-no(1999)的方法,我们利用PowerGrep对经过CLAWS tagset7处理文本进行预处理,例示见表3。
表3.文本处理方法例举
处理后,再利用相关软件对文本中的所有认知类、义务类以及类认知情态序列逐一进行提取,以便获取各大主题性数据。
(3)语料处理方法
为便于理解与解释结果,下文介绍几种Wordsmith7.0中统计技术涉及的术语:
BIS:BIC Score的缩写(参见Wilson,2013),属Bayes Factor,有效替代了统计学中的统计显著性指标p值,适合于比较小型的语料库。
Log_L:Log Likelihood test的缩写,Ted Dunning(1993)设计的算法,统计意义上比卡方检验更合适的主题性测量,尤其适合与参考语料库对比时的长文本。
Log_R:log ratio的缩写,Andrew Hardie(2014)设计的算法,强调主题性效应强度而不是它的统计意义,数据可以理解为语料库统计效应量,“2”这个值意味此条目频率在新词列表中比在对照语料库多4倍,“3”意味着条目频率是对照语料库的8倍,以此类推,比似然对数更易理解。
主题性:观察语料中出现的关键词突显程度的指标,可以是上述三种算法的综合。“关键”词必须满足:a)频次等于或高于用户设定的最小频次;b)与参考语料库中的频率相比,小于或等于用户指定的p值;c)主题性强度等于或高于用户设定的最小对数比。
本研究获取了三大主题性数据,再进行基于年级的对比,意在发现其年级趋向。
本文序列处理具体方法如下:
(a)创建主题词表:基于赋码及正则表达法处理后的语料库,以具体的情态动词/情态动词赋码(CAN、COULD-MD等)作为参照词表,基于3—8跨距分别创建相应的情态序列词丛列表,然后使用WordSmith的keyness等功能进行逐一对比并观察该情态序列词丛列表,进行主题词(KeyWords)分析;根据该分析结果(BIS,Log_L,Log_R等)确定具体的情态序列,分别得出学习者语料库中各情态序列的所有词丛(含认知情态序列、义务情态序列以及类认知情态序列)的频率(以每100词为单位计算)。
(b)词丛归并:删除非认知序列形式后,诸如NN1 SHOULD VBI,NN2 SHOULD VBI等认定为是认知情态序列,诸如CAN XX VVI,COULD XX VVI等认定为是类认知情态序列,诸如PPY CAN VVI,PPIS2 CAN RR VVI等认定为义务情态序列,然后依据实际出现的序列按主题词词丛归类,最终得到学习者语料库中类/认知和义务等情态序列。
(c)依主题性结果(BIS,Log_L,Log_R)按年级排布:对四个年级中使用频率较高的三类情态序列依“主题性”按年级排列,得到四个年级中三类情态序列的频率差异数据。
(d)绘制图表,做差异分析:绘制图表,进行各类差异分析(含非参数检验与参数检验等),找出数据的变化规律,解决本文的研究问题。
本研究以BIS、Log_L或Log_等主题性数据说明学习者语料与本族语对照语料中认知等情态序列的使用差异,如果该序列主题性为正,则表明学习者相对于本族语者过多使用此序列,反之,则过少使用,其绝对值越大,差异越大,“/”意为不存在数据,没有对比序列。
3.研究结果
1)认知序列三大主题性的年级差异
为了了解学生对于认知情态的总体把握状况,基于参照语料库“BaREnloB”的对比,本文比较了“学习者议论文年级语料库”的主题性结果(BIS,Log_L,Log_R)(以下类同),然后根据实际出现的序列结合自己拟定模板进行数据归并及重新组合后,得到表4,再依据单元方差分析均值图得出图1(以下类同)。
表4.认知序列三大主题性的年级差异
图1.认知序列三大主题性的年级差异
由图1可以看出,weccl.0议论文年级语料中,认知序列的BIS与LOG_L变化基本趋于一致:随着年级的上升稳步向上,在三年级时达到峰值,随后急剧下降,在四年级时到达底部。LOG_R随着年级的上升缓步向上,在四年级达到高峰值。
正态检验发现认知类主题性均呈正态分布,方差齐性检验发现三大类数据方差齐性。单元方差分析发现,三大类主题性值均存在显著的年级差异(BIS:F=3.333,P=0.034;LOG_L:F=3.318,P=0.034;LOG_R:F=4.073,P=0.016),多重分析发现差异均在四年级与一、二、三年级之间,虽显著性值都很低。
未假设方差齐性时,只有LOG_R的Dunnette C值存在显著的年级差异。Welch,Brown-Forsythe检验发现,除LOG_R的Welch有差异外,其余均无差异。
非参数Kruskal-Wallis检验发现三大主题性值都不存在显著的年级差异,与参数检验方差分析的结论恰好相反。
就LOG_R而言,无论方差齐性与否,参数检验与非参数检验结果均有影响力,尤其是序列NN2 SHOULD VBI,说明群体的责任意识一直较强。
2)义务序列三大主题性的年级差异
表5.义务序列三大主题性的年级差异
由图2可以看出,weccl.0议论文年级语料中,义务序列的BIS与LOG_L的变化趋势趋于一致,随着年级的上升基本朝下发展,只在二年级时反而平缓上升达到最高值。LOG_R随着年级的上升稳步向下,但时急时缓。
图2.义务序列三大主题性的年级差异
正态检验发现义务类主题性全部呈正态分布。单元方差分析发现,只有LOG_R值存在显著的年级差异(F=5.346,P=0.006 6<0.05),且方差齐性(levene值=0.337,P=0.287>0.05),显示这个维度上主题性效应强度一致,但其他两项(BIS与LOG_L)没有显著的年级差异,且方差不齐性。
均值相等性检验发现BIS与LOG_L只有Welch值存在显著的年级差异,分别为0.036和0.034,而LOG_R的Welch与Forsythe值均存在显著性差异,且P都为0.001。
非参数Kruskal-Wallis检验发现,三类主题性都存在显著的年级差异(BIS&LOG_L:χ2=13.42,Asymp.sig.=0.004;LOG_R=9.398,Asymp.sig.=0.024)
就效应量(LOG_R)的意义表明参数检验都有影响力,但影响力越来越低。但有些序列,尤其是序列PPIS2 SHOULD VVI始终在低年级且居于高位,而PPIS2 CAN VVI在全年级居于高位,且越来越高,表明随着年级的增长,责任意识的逐步减弱,能力意识的逐步增强。
3)类认知序列三大主题性的年级差异
表6.类认知序列三大主题性的年级差异
由图3可以看出,weccl.0议论文年级语料中,类认知序列的BIS、LOG_L与LOG_R的变化趋势基本趋于一致,随着年级的上升基本平缓不动,但在四年级时达到最好。
图3.类认知序列三大主题性的年级差异
正态检验发现类认知类主题性全部呈正态分布,四个年级的三大主题性的Kolmogorov-Smirnova与Shapiro-wilk值的显著性值均为0.00。
方差齐性检验也发现全部齐性。单元方差分析发现,三大主题性值均不存在显著的年级差异。未假设方差齐性时,发现所有值都不存在显著的年级差异。均值相等性检验发现三大主题性值的Welch与Forsythe值均不存在显著性的年级差异。
非参数K-W检验还发现三大主题性值均不存在显著的年级差异。
单就效应量(LOG_R)而言,发现有些序列都有了有影响力的结果,但影响力越来越低,如COULD XX VVI与CAN RR VVI,而带有认知倾向的PPHS2 COULD VVI与PPHS2 CAN XX VVI根本不出现影响力,表明个人意识虽然一直较强,但群体意识还是较差。
4.数据分析与讨论
1)数据梳理及其意义
吴明隆(2003)、秦晓晴(2015)等认为,数据出现非正态或方差不齐性时可以进行数据转换或非参数检验。均值相等的稳健性检验,因Welch与Brown-Forsythe值近似F分布,而且对数据方差是否齐性没有更高要求,所以比方差分析更为稳妥(Algina et.al.,1997;Brown&Forsythe,1974)。非参数条件下的数据,如果符合参数检验条件,也可以进行相应的参数检验。
本文进行的数据分析过程简述如下:先进行数据正态性检验,再进行方差分析,同时进行方差齐性检验。如发现方差问题,再进行未假设方差齐性的条件下四个值(Tanhane,DunnetteT3,Games-HOWELL,Dunnette C)的检验①不假设方差相等的多重比较检验有Tamhane的T2、Dunnett T3、Games-Howell和Dunnett的C。当方差不相等时,适合使用如下检验:Tamhane T2。基于t检验的保守成对比较(Dmitrienko,Tamhane&Bretz,2009);Dunnett T3。基于学生化最大值模数的成对比较检验(Dunnette,1990);Games-Howell。有时会变得随意的成对比较检验(Games&Howell,1976);Dunnett C。基于学生化的范围的成对比较检验(Dunnett,1955)。,同时进行均值相等的稳健性(Welch,Brown-Forsythe)检验,最后对所有数据再进行非参数Kruskal-Wallis检验,无论方差齐不齐性。
本研究数据检验结果如下:
(1)三大类数据皆呈正态分布(所以不必对数据进行对数等转换)。
(2)方差齐性状况:三大类主题性数据中,各项都方差齐性(所以不必进行数据转换),除去义务类的BIS与LOG_L方差不齐性。三大类主题性数据的变化强度(Log_R)趋于一致,显示在Log_R这个维度上主题性基本一致,年级间的效应强度没有差异。
(3)方差齐性条件下的方差分析结果:认知类全部主题性值、义务类的LOG_R存在显著的年级差异,且多重分析都发现四年级与一、二、三个年级之间都存在显著差异,类认知类除外。这表明,与本土语言使用者相比,中国各年级学生在认知类、义务类情态序列使用上存在显著性年级差别。认知类序列的主题性随年级越来越大,义务类却越来越少,这说明学习者语言使用趋势正在向本族语者靠近,且达到统计学上意义,且效应强度也有了显著性改变。
(4)方差不齐性条件下的均值稳健性检验结果:只有类认知各主题性值不存在显著性的年级差异,认知类只有LOG_R的Welch值存在显著的年级差异,义务类的BIS与LOG_L只有Welch值存在显著的年级差异,但LOG_R的Welch与Brown-Forsythe值存在显著的年级差异(见上文分析),这说明认知序列的使用无形中越来越多,义务序列的使用越来越少,且效应明显。说明学生随着年级的增加,学生对于真值的判断与评估意识增强,简单叙述加武断意识的减弱,而类认知也许因定义模糊等原因无法发现差异。
(5)非参数条件下的K-W检验结果:基本不能验证上述均值相等的稳健检验性分析结果以及参数方差分析结果,但类认知类除外。非参数检验与参数检验因检验的灵敏性、精确性、应用范围、可靠性差距等的原因无法等同,只因适用条件不一,所以结果也不同。
2)分析结果与讨论
(1)分析结果
基于学生议论文年级语料库的主题性数据,并结合研究假设与问题,本文总结如下:
A.参数检验的方差分析发现认知序列三大主题性值存在显著的年级差异,四年级分别与一年级、二年级、三年级3个年级都存在显著的区别,这表明中国英语专业本科生英语议论文中的认知情态序列基本随着年级升高而升高,且效应强度也存在差别。虽趋势有些反复,单元方差分析发现,义务序列在四年级与其他三个年级存在区别,这表明中国英语专业本科生英语议论文中的义务情态序列会随着年级升高而降低,虽然二年级时有些反复达到最高。方差齐性条件下的方差分析、均值相等的稳健性检验分析发现类认知序列三大类主题性数据值都不存在显著性的年级差异,表明中国英语专业本科生英语议论文中的类认知情态序列不会随着年级升高而升高,呈现一种无法预知的趋势。部分支持假设一。
B.参数检验与非参数检验结论基本不相同,有些结论完全相反。如对于认知序列,非参数检验发现与参数检验方差分析的结论正好相反;对于义务序列,非参数检验发现,三类主题性都存在显著的年级差异,与均值相等检验结果不完全相同;对于类认知序列中,非参数检验发现所有值都不存在显著的年级差异,与方差分析一样。部分否定假设二。
(2)讨论
上述结论再一次证实:中国专业学生对于情态序列的认知有一定的规律:随着年级的升高,认知序列的使用越来越频繁,越来越趋近于本族语者使用特征,而义务序列的使用却越来越少,符合中介语特征:不同层次学习者中介语的质量存在差异,虽尚未达到自然语言的程度,但总体而言,均已构成独立自足的系统(Corder,1973;Brown,1987)。
中国学生认知情态习得所体现的中介语特性可以具体表述如下:
(a)系统性:学习者在习得认知情态序列的过程中,认知类情态序列的主题性都随着年级的上升而上升,义务类情态序列的主题性都随着年级水平的上升逐渐下降,虽然由于社会文化等具体情景原因在某个阶段有所反复。这种趋势的表现已成为一种普遍共识:义务类情态动词仅表示义务、责任,而认知类情态序列表示价值判断和真值评价。情态序列习得的这种规律性已然标准化我们的认知,几成系统,完全可以理解为“系统性”。
(b)不完备性:中介语在结构的复杂度、优先使用的功能以及语言类型的差错上与自然语言存在差异。在情态序列使用上,中介语特点表现较为明显。认知序列的BIS与LOG_L随年级上升而上升,在三年级达到高峰值,四年级跌入低谷,而LOG_R随年级上升缓步上升,四年级达到高峰值;义务序列的BIS与LOG_L随年级上升而逐步下降,但在二年级有些反复,出现高值;而LOG_R随年级上升稳步向下,时急时缓;类认知序列的BIS、LOG_L与LOG_R的变化趋势基本趋于一致,随着年级的上升基本平缓不动,稍有波动,只在四年级时达到最好,但不存在显著的年级区别。可以看出在情态习得的整个过程中,序列的习得会有些程度不同的反复,这本身也是一种规律:“认知情态动词是由义务动态情态演化而来……因而常有反复”(束孟卿,2009),出现语言反复现象。总体上随着学习层次的提高而更吻合认知规律,更习惯自然地表现出对于事件的价值判断与真值评价,但同时又表现出特别明显的中国学生情态习得中所体现的中介语特性。
(c)不稳定性:在语言习得过程中,学习者不断学习和内化语言输入,优化其认知结构,产生新的信息,是不断发展的过程,中介语的不稳定性体现在这种动态的发展进步中。本文的不稳定性主要体现在认知序列、义务序列各指标的波动及显著年级差异上,这种在各维度各阶段上出现的逆转与语言结构反复现象就是学生认知上出现的不稳定性表现。也许语言的潮汐现象可以有效说明其原因(龙绍赟,2012)。
不完备性、不稳定性也可以从效应量(LOG_R)看出,对于认知序列和义务序列,LOG_R的参数检验发现了有影响力的结果,随影响力越来越低,如COULD XX VVI与CAN RR VVI在所有年级都有影响力,虽然越来越小。
5.结语
本研究借鉴了前人的方法,使用Claws7赋码文本后,利用PowerGrep和语料库工具WordSmith(7.0),对比分析了中国英语专业学习者议论文中的情态序列主题性数据,基本验证了本文假设。本文认为中国学生情态习得体现了中介语特性:系统性、不完备性、不稳定性。对于情态动词的教学具有一定的启发作用(龙绍赟,2012,2016)。
基于主题性(keyness)的序列研究方法是当前语料库较复杂的研究手段,可用于观察词法与句法序列。本研究从年级视角援引主题性数据BIS,LOG_L,LOG_R等指标,特别指出可利用LOG_R作为效应量来衡量学生情态序列习得的阶段性特征。本文突破了以往研究束缚,援用程度不同学术语料库作为参照语料,一定程度上弥补语料库研究难以参照多文体语料库的不足。不过,如果能自我创建动态监控语料库以观察学生的情态序列使用模式,同时,如能更为科学地定义、规范与抽取各种序列结构与组合(模板),尤其是类认知序列,研究则更具科学性。再者,鉴于参照语料库的不同的学术性程度,可以考虑进行不同学术参照文本与同一年级作文文本的对比来看学生语言不同学术性表现,相信对学术英语教学与习得会有更大启发与参考。