N元词组对中国学生英语应用文写作质量的影响初探
2021-07-14麦春萍张晓鹏
麦春萍 张晓鹏
(北方民族大学外国语学院 宁夏·银川 750021)
0 引言
在过去二十年中,学界对第二语言学术写作质量与句法复杂性之间的关系进行大量深入的研究,发现句法复杂性与二语写作质量密切相关(Crossley et al.,2016ab,Cumming et al.,2005,2006;Grant&Ginther 2000;Kim&Crossley,2016,2018;Schoonen et al.2011;V gelin et al.2019)。随着语料库语言学的不断发展,语言学家指出,语言主要由语法化的词汇组成(Lewis,1993)。按习语原则,语言使用者倾向查出大量预制短语或固定搭配,这些短语和搭配构成了语言产出中的单一选择。换言之,无论是口语还是书面语,人们的语言使用包含了大量的N元词组短语,例如习语、搭配、预制词组等。考察N元词组短语在语言发展中的作用,尤其是对第二语言写作质量的影响具有重要的意义。Coxhead&Byrd(2007)建议,在二语学术写作教学需要重点关注N元词组短语的使用上,并进一步指出二语学习者使用N元词组短语是提高语言产出流利的主要因素。然而,少有研究考察N元词组短语如何影响二语写作质量,目前仅有Garner et al.(2019)考察了N元词组短语的频率和连接强度对韩国英语学习者英语议论文写作质量的影响,发现关于N元词组频率和连接强度可有效预测二语写作质量。鉴于此,本研究试图考察N元词组短语与中国英语学习者英语实用文体写作质量之间的关系。
1 文献综述
N元词组包括词块、搭配、预制词组等。基于使用的语言学习理论认为,N元词组的使用频率和其构成词之间的关联强度是语言使用是否地道的两个计量指标。日常使用的较高频率的N元词组更有可能被存整体储存,在语言产出中会降低提取难度。N元词组的连接强度是其组成成分之间共现概率的量化,可反映语言使用自然地道的程度。学界常采用互信息(MI值)和t值量化N元词组的连接强度(Ellis,Simpson-Vlach,&Maynard,2008;Ellis&Simpson-Vlach,2009;Evert,2004,2009)。MI可有效衡量由低频词组成的N元词组的连接强度,而t值可有效衡量由高频词组成的N元词组。Hsu(2007)发现中国英语学习者议论文写作质量与N元词组频率呈正相关。Granger&Bestgen(2014)发现中级二语言学习者倾向于使用t值较高的N元词组,而高级二语学习者倾向于使用MI值高的N元词组,他们还发现二元组的MI值与二语写作质量之间呈正相关。Garneretal.(2019)也指出,N元词组的使用频率和关联强度可有效预测韩语英语学习者议论文的写作质量,即得分较高的论文包含了更多连接强度更高的二元组和三元组。尽管现有的研究很大程度上提升了我们对N元词组与语言使用关系的认识,尤其是对书面语产出的影响,但此类研究数量有限,并且主要囿于对二语议论文写作质量的考察。到目前为止,鲜有研究考察N元词组的频率和联想强度测度与其他文体写作质量的关系。不同体裁的文本语言特征不同,因此很有必要分析其他文体中N元词组的使用与写作质量有何关系。
2 研究设计
本研究回答以下两个研究问题:N元词组使用频率在多大程度上可预测二语实用文体的写作质量?N元词组关联强度在多大程度上可预测二语实用文体的写作质量?
2.1 文本选择
本研究抽取中国大学二年级、三年级学生限时作文50篇(见表1),文本为求职信,是一种常用的实用文体。被试用300单词完成写作任务。所有文本由研究者进行评分,总分10制,其中内容占60%,语言使用占40%。
表1:二语实用文体写作文本描述性统计
2.2 文本分析
研究采用自然语言处理软件TAALES 2.0来分析目标文本(Kyle&Crossley,2015)。提取了每篇文本中所有N元词组的使用频率和联系强度。所有频率和连接强度指标值来自英语本族语COCA语料库(Davies,2009)。使用目标语N元词组使用参数可有效检测二语文本中N元词组使用特征。
2.3 N元词组频率指标
本研究采用COCA学术子库中出现的二元组和三元组的原始频率和对数频率。以往研究显示,高水平的二语写作者倾向于使用频率较低的单词和N元词组,N元词组频率与二语词汇水平显著相关(Garner et al.,2019)。
2.4 N元词组连接强度指标
本研究采用COCA学术子库中出现的二元组和三元组的t值、MI值和P值。前两者是对N元词组中单词之间双向关联关系的度量指标,后者是对N元词组中单词之间单向关联关系(右向)的度量指标。此三类指标衡量第一个词和后两个词的连接强度。以往研究显示,此两类指标与二语词汇水平显著相关(Granger&Bestgen,2014)。
3 结果分析
首先,研究对N元词组频率和连接强度指标与使用文体写作质量进行Pearson相关分析,检验此类指标是否与文本写作质量显著相关。其次,使用逐步回归模型分析N元词组频率和连接强度指标对文本写作质量的预测效应,然后使用5折验证检验回归模型的可靠程度。
3.1 N元词组频率的预测作用分析
在4个频率指标与实用文体写作得分显著相关(见表2),说明写作质量较高的文本包含更多实用频率更低的 N元词组。由于二元组和三元组对数频率和原始频率存在贡献文体,逐步回归分析中只包含与写作质量相关系数最高的两类对数指标。逐步回归结果显示,二元组和三元组频率对数可有效预测应用文写作质量差异的14%(r=.37,R2=.137)(见表3)。5折验证结果显示,该模型可以解释应用文写作质量差异的13.4%差异(r=.366,R2=.134),说明此模型可靠。
表2:N元词组频率与写作质量相关系数
表3:N元词组频率与写作质量相关系数
3.2 N元词组连接强度作用分析
在4个N元词组关联强度指标中,二元组连接强度(MI值)、三元组连接强度(MI值)和三元组连接强度(t值)与使用文体写作得分显著相关(见表3),说明写作质量较高的文本倾向于包含更多由低频率词构成的 N元词组和右向关联度高的 N元词组。这5类与写作质量显著相关的指标不存在共线关系,因此均参与到逐步回归分析,结果显示二元组连接强度(MI值)和三元组连接强度(t值)可有效解释约8%的写作质量差异(r=.276,R2=.09)。5折验证结果显示,该模型可以解释应用文写作质量差异的9%差异(r=.30,R2=.09),说明此模型可靠。
4 讨论
本研究初步考察了N元词组与中国大学生英语实用文体写作质量的关系。结果如下:第一,二元组和三元组对数频率和原始频率与写作质量显著负相关,二元组和三元组频率对数可预测应用文写作质量差异的14%;第二,二元组MI值、三元组MI值、三元t值与使用文体写作得分显著相关,二元组MI值和三元组t值可解释8%的写作得分差异量。
4.1 N元词组频率对写作质量的预测作用分析
第一个研究问题考察N元词组频率在多大程度上可以预测二语应用文写作质量。研究发现,二元组和三元组原始频率和对数频率与写作质量呈负相关。该结果与已有发现相同,N元词组频率反映了其在日常语言产出中使用的多寡,使用频率高的N元词组频率容易接受,难度相对较低,反之使用频率低的N元词组频率,难度较大,容易被用在学术语篇,适合比较正式的体裁(Bestgen&Granger,2014;Durrant&Schmitt,2009;Groom,2009)。本研究中写作任务需要学习者描述求职的缘由,自己的条件、特长、求职目标。将自己的基本信息、教育背景和工作经历做一个简单的介绍,描述自己的求职目标,职业发展等。文本所需较多的学术词汇才能达成交际意愿。因此,评分员对文本质量的考察较多关注词汇使用是否适合目标文体。频率较低的N元词组正好偏向学术化语言,适合应用文的学术文体。回归分析显示,二元组和三元组频率对数可有效预测应用文写作质量差异的14%,就词汇和短语层面,N元词组频率是影响应用文写作质量的首要因素。
4.2 N元词组连接强度对写作质量的预测作用分析
第二个研究问题考察N元词组连接强度与二语应用文写作质量的关系。研究发现,二元组MI值、三元组MI值、三元组t值与使用文体写作得分显著正相关,说明得分较高的文本倾向于包含由低频词构成的二元组和三元组,包含较多右向关联度高的二元组和三元组。关联强度越高说明词汇共现的概率越大,常被作为固定词块使用的机会就越高,可反应语言使用的地道程度。该发现与上述N元词组频率的作用一致,MI值较高的N元词组倾向于包含频率较高的词汇(Gablasova,Brezina,&McEnery,2017;Garner,Crossley,&Kyle,2018)。多元回归结果显示,二元组连接强度(MI值)和三元组连接强度(t值)可有效解释9%的写作得分差异量,说明评分员对文本质量的考察较多关注N元词组中词汇共现概率的高低,使用的地道性是对写作质量影响的重要标准,这与Garneretal.(2019)的发现基本一致,得分较高的文本中N元词组的MI值较高,含更高级的词汇。本研究含发现,三元组t值与写作质量存在正相关关系,有效预测写作得分2%的差异量,说明写作得分较高的文本倾向于包含较多的由高频词构成的三元组。综合回归分析显示,就频率和关联强度对写作质量的预测而言,评分员主要关注的是频率作用,因为频率可直接反应N元词组使用的多寡,是否适合目标文本文体的语言要求。
5 结论
本研究考察了N元词组与二语应用文写作质量之间的关系。结果表明,二元组和三元组对数频率和原始频率与写作质量显著负相关,可有效预测应用文写作质量差异的14%;二元组MI值、三元组MI值三元组t值与使用文体写作得分显著相关,可有效解释9%的写作得分差异量。上述结果显示,N元词组频率和关联强度是影响二语应用文写作质量的重要指标。今后的研究还可以考察N元词组使用与其他变量(如句法复杂性等)对其他不同文体(如记叙文等)写作质量的影响,借此全面评估N元词组对语言产出的影响效应。