基于CQPweb的数据驱动学习在英语写作教学中的应用研究
2021-01-05罗琴琴
罗琴琴,石 敏
(西南石油大学,四川 成都 610500)
一、研究背景
基于语料库技术的数据驱动学习(data-driven learning,简称DDL)倡导发现式、探索式的学习方式,该方法由Johns正式提出,其主要思想是学习者作为研究者,基于大量的语料库数据观察、归纳语言使用现象,自我发现词语搭配、语法规则及语用特征。[1]DDL体现了建构主义学习理论和自主学习理论中以学习者为中心的思想, 强调学习者对语言知识的主动探索和对所学知识意义的主动建构。此外,Schmidt的注意假设理论亦为DDL提供了重要的理论基础。他认为注意是将输入转化为吸收的必要条件,而频率和感知凸显性即显著性是影响注意的重要因素[2]。一方面,某种语言形式出现的频率越高,就越有可能被注意到,而语料库索引行中不断复现的语言形式更容易引起学习者的注意。另一方面,语料库通过共现,将语境中的关键词居中凸现,能有效提升学习者对语言形式的注意程度,更有助于学习者的长时记忆,从而促进学习者将输入内化为自己的语言知识, 进而转化为输出。
近年来DDL在语言教学中的应用研究发展迅猛,相关研究成果均证实了其应用于二语教学的可行性与积极意义[3-7],其中,DDL应用于二语写作教学的成果颇丰。研究表明, DDL模式在二语写作过程中的应用特别是写作修改阶段的应用,能帮助学习者更准确地修改词汇语法错误,还可帮助其进行词汇替换、改进连接词的使用、搭配查询等从而提高学习者的写作文本质量。[8-10]但考察语言知识是否被习得,关键要看学习者能否将在当前任务中掌握的语言知识有效应用于新任务。目前,大多数研究均关注DDL用于写作修改的即时反应,而即便学习者在写作修改时错误率明显降低,文本语言质量提高,也不能充分说明其对二语写作具有促进作用。另一方面,由于传统语料库及其检索工具操作复杂,不易被教师和学生掌握, 且因版权问题很多语料库资源无法实现资源共享和在线使用,影响了DDL在国内写作教学中的应用推广。
CQPweb 是第四代基于网络的语料库分析系统,集语料库与分析工具于一体,从而降低了语料库使用的技术门槛,使得普通教师和学生也能如平日浏览网页一般轻松使用语料库。它目前能实现的两大主要功能可以较好地辅助学生写作:首先,查询字词、语言结构等,以获取大量语言实例或相应结构的出现频次, 并可按学生语言水平级别、写作题材等分别呈现查询结果;其次,计算特定词语在语料库中的典型搭配。[11]由许家金2012年主持创建的北京外国语大学多语种在线语料库检索平台(BFSU CQPweb)是国内第一个CQPweb系统,为广大教师和学生进行DDL模式的学习提供了平台。Frankenberg-Garcia的研究证实来自多个语料库的语言实例比单个语料库的例子、词典释义更有助于学习者理解新单词、改正二语错误。[12]此外,英汉、汉英双语平行语料库可以为学习者验证关于语言表达的直觉。在英语写作过程中, 学习者经常要面对如何用目标语表达母语中的概念, 学习者可以结合英汉平行语库中的大数据选出词性、意义都较合适的词汇。
本研究以学生可随时随地登录使用的BFSU CQPweb为语料库检索平台,通过对学习者进行引导性的纠错反馈,探讨基于CQPweb的DDL在写作教学中的应用是否比传统模式更能提高学习者写作语言的准确性、复杂性、流利性,并通过问卷调查和访谈,了解语料库应用于写作的积极作用以及学生在运用过程中面临的挑战,从而为DDL在写作中的推广应用提供参考借鉴。
二、研究设计
笔者利用网络语料库检索平台BFSU CQPweb对成都某高校非英语专业学生进行了一学期的写作训练,并对该平台的使用情况进行了问卷调查、访谈和总结。
1. 研究问题。本研究试图回答以下两个问题:(1) 基于CQPweb的DDL在写作教学中的应用是否能促进学习者英语写作语言准确性、复杂性、流利性的发展?(2) 从学习者角度看,CQPweb在写作中的应用有哪些积极作用,使用过程中有哪些困难,总体评价如何?
2.研究对象。本研究选取的对象为成都市某理工科大学非英语专业大一学生。笔者根据第一学期末的大学英语四级考试成绩,最终选定实验组学生26名,控制组学生25名,分别来自由同一教师讲授的两个大学英语平行教学班。学生的四级总成绩分布为400-424分(总分710分),总体英语水平相当,且学期末均要再次参加四级考试,因此都有较强的学习动机。实验前的写作前测表明实验组和控制组在英语写作语言准确性、复杂性、流利性方面没有显著差异。
3.实验过程。实验持续一个学期,包括以下四个阶段。
第一阶段:培训。培训的目的是让学习者学会在该语料库平台上进行简单检索和复杂查询,对作文中的词汇语法错误(如搭配错误、介词使用错误、词性误用、同义词或易混词用词错误、连动式错误、不定式错误、时态错误等)以及句法错误进行修改;对用词不地道或过于简单概括的词汇、短语(如过多使用下义词good, important等)进行替换或者润色,对连接词缺失、误用、过度使用的地方进行改进;对句型结构进行改写等。
第二阶段:写作训练,共完成5篇作文,每篇步骤如下:(1)任务布置与上交。教师在课堂上布置写作任务,并在内容、篇章结构上给予引导。学生课下完成写作任务,并按时上交。(2)教师引导性反馈。教师对需要由学生利用语料库或在线词典进行修改的地方进行标注,同时鼓励学习者对作文中自己不太满意但教师未作修改标记的地方进行润色。(3)学生自主修改。要求实验组学生利用BFSU CQPweb平台上的语料库资源对教师标注的地方进行修改或润色,并将语料库查询结果进行归纳总结后作为修改依据记录下来,保留修改痕迹,便于同伴和教师查看。控制组学生则参照在线词典进行修改。(4)教师评阅并课上集中点评。
第三阶段:期末作文测试与评分。期末作文测试和前测一样都是议论文,选择学生非常熟悉的话题要求在40分钟内完成。 两次测试均不涉及背景知识,仅是反映受试的语言能力, 以提高测试效度。作文评分主要从准确性、复杂性、流利性三方面进行检测。其中,准确性指标包括无错的T单位数与T单位总数的比率和错误总数与T单位总数的比率。T单位指由一个主句和任何依附于该主句的从属性句子所构成的单位,是评估语言产出表现的基本方法[13]。复杂性检测包括词汇复杂性和句法复杂性[14]。流利性检测主要是统计限时作文的总词数,具体评价指标见表1。最后,统计两组学生上述三方面的得分,并使用SPSS进行独立样本t检验。
表1 语言准确性、复杂性和流利性的评价指标
第四阶段:问卷调查与访谈。学期末对实验组学生进行问卷调查,问卷设计和选项参考Huang的研究问卷,采取Likert 6分量表进行计分[6]。问卷收集完成后,将通过不记名调查所获得的26份有效问卷数据录入,并使用SPSS17.0对其进行统计。为深入探究学习者的态度及原因,笔者从实验组中随机抽取5名学生进行一对一访谈。在对定量数据结果进行分析时结合访谈内容进行讨论,以便更客观、更准确地阐释语料库的应用对学生写作产生的影响。
三、结果分析与讨论
1. 实验组与控制组写作成绩的比较。实验收集了实验组和控制组共51名学生的两次成绩,并对收集到的数据进行描述性统计分析和独立样本t检验。
(1)实验组与控制组写作语言准确性比较。从表2可以看出,实验组在前测中写作语言的准确性与控制组无显著差异(P>0.05),这表明在实验开始时两组学生写作中的语言运用能力基本相当。但后测中实验组学生作文中的无错T单位数与T单位总数的比率明显高于控制组(P=0.009<0.05),而且错误总数与T单位总数的比率明显低于控制组(P=0.018<0.05),说明实验组学生作文中语言的准确性更高。CQPweb的词频、搭配分析等功能可帮助学习者全面掌握词汇的具体用法、典型搭配等,更有助于扩充学习者的词汇深度知识。[15]实验组学生在平常写作修改过程中,通过自主检索语料库、分析索引行、归纳总结语言使用规则加深了对作文中语言错误的认识,同时索引行中不断复现的词汇或语法形式一定程度上提升了学习者对地道表达的注意力。Schmidt认为没有注意就没有习得,注意不但是学习的必要条件,也是长期记忆进行编码的必要条件。[2]学习者对学习材料的注意程度越强,就越能促进其对语言表达的长期记忆。因此在写作测试中会努力回避写作训练中出现过的错误而采用记忆中的准确表达方式。控制组学生由于还是采取传统的参照在线词典的方式,词典中有限的例句不足以提升学生对错误或正确表达的注意程度,且正如Frankenberg所说,词典的一个局限在于其提供的语言范例通常都不会重复出现,因此学习者普遍对错误或地道表达的印象不深,致使相同错误重复出现,不利于语言产出能力的提高。[16]这一点在访谈中也得到了印证,一位同学提到:虽然费时,“但正因为时间用得多,且都经过了自己的分析思考,对错误的印象也就更深刻,写作时会不由自主地想起以前犯过的错误以及修改的方案”,因此语料库对写作能力提高帮助还是很大的。
表2 实验组与控制组写作语言准确性比较
(2)实验组与控制组写作语言复杂性比较。复杂性测量包括词汇复杂性和句法复杂性。词汇复杂性使用类符形符比(TTR)来测量,即文中非重复词汇与文章总词汇的比率;句法复杂性测量(C/T)主要检测每个T单位平均包含的子句的数量。从表3可以看出,在前测中,实验组与控制组在这两个指标上均无显著差异,说明两组学生在写作语言复杂性方面水平相当。后测结果表明,基于CQPweb的DDL模式在提高学生者写作语言复杂性方面无显著成效。
表3 实验组与控制组写作语言复杂性比较
首先,在词汇复杂性方面,实验组TTR均值高出控制组0.353 6,但差异不显著(P=0.154>0.05)。在写作训练中,教师反复强调变换使用词汇的重要性,学生也均有多样化变换用词的意识,因此两组学生在后测中的TTR值均高于前测,但实验组与控制组在后测中差异不显著。原因在于:一方面,学生的词汇运用能力发展需要长时间的积累和训练,而本研究持续的时间仅为一个学期;另一方面,TTR主要反映学生词汇运用的多样性,未反映出词汇难度及用词特征。对实验组和控制组学生的作文文本进行比较,发现控制组学生作文中较多使用上义词即较抽象的词汇如good、important、true、bad等,而实验组学生作文中的具体形容词如critical、significant、vital、harmful等出现频率更高。这可能与实验组学生平常受到的训练相关,在BFSU CQPweb 平台上学习者可以通过复杂检索方式查出某一具体名词前的所有形容词及其例句,从而对自己作文中过多使用的抽象形容词进行准确替换;而在线词典只是罗列某一词汇的近义词等,不能一一给出具体的语言实例,也不足以引起学习者的注意,不利于学习者将输入转化为输出。在某些动词的使用上,实验组学生使用think的频率明显少于控制组,能变换使用其同义词claim、argue、believe等。其次,在固定搭配、短语的使用上,实验组学生似乎搭配意识更强,作文中灵活使用短语表达如have easy access to sth.、have positive impacts on sth.等,控制组学生作文中则多用get/obtain sth.、affect/influence sth.等。
在句法复杂性方面,实验组与控制组学生也无显著差异。大多数学生在写作训练中仅使用了关键词检索功能,未充分运用CQPweb语句进行句型检索。这一点和刘萍等的结论一致,即句型检索表达式编写困难,学生不太适应CQPweb的复杂检索模式。[17]学生在访谈中也表示“较少使用句型检索功能”。究其原因:一方面是学习者缺乏足够的语料库检索操作培训;另一方面是在整个写作阶段,学习者均是单人独立写作为主,虽有教师的引导性反馈,但缺乏同伴间对于技术使用的互动合作,不利于激发其充分利用技术改进其写作质量的兴趣。
(3)实验组与控制组写作语言流利性比较。在语言使用的流利性上,实验组与控制组存在显著差异(P=0.036<0.5)。流利性揭示的是二语写作者在语言输出时的舒适程度,流利性检测主要是比较计时作文的总字数。从表4可以看出,实验组在这个指标上明显优于控制组,说明实验组学生在规定时间内写出的作文篇幅更长,表明网络语料库在写作修改过程中的应用更有助于学习者语言流利性的发展。流利性需要学习者利用记忆系统来提取已有的语块,因此要保证语言产出的流利性,语言信息应进入长时记忆。[13]语料库在其检索工具的配合下,能将某一语言形式集中呈现,这种基于语料库索引行的特殊呈现方式,可以使学习者毫不费力就注意到出现频率较高的语言现象,也更有利于学习者的长时记忆。
表4 实验组与控制组写作语言流利性比较
2. 问卷调查意见。学期末发放问卷26份,共收回有效问卷26份。
(1) CQPweb应用于英语写作的积极作用。学习者普遍对于DDL在写作中的应用持积极态度(表5)。特别是“有助于掌握词汇的搭配及用法”96%都表示“同意”,该结论与Huang的调查结果一致,学生在该项上的M值均排在第一位,学习者通过对语料库索引行进行观察、分析,不仅可以修改搭配错误,而且还能附带习得目标词汇在不同语境中的多样化用法。[6]
表5 CQPweb应用于英语写作的积极作用(N=26)
表5中M值最低的是“有助于完善作文内容”,说明学习者在使用语料库过程中,获得的关于作文内容方面的帮助很少。原因在于:一方面教师未对写作内容的修改做强制性要求,给予的引导性反馈均是针对语言方面的问题,学习者自然就忽略了这一点。正如学习者在访谈中所说, “对未经标注的地方进行修改,对我来说较为困难”。另一方面有些语料库文本生词过多,索引行句子不完整,也影响了学习者对索引行内容的理解,所以在写作训练阶段,学习者很少从内容上来改进作文质量。
(2) 学习者在CQPweb运用过程中遇到的困难。尽管大多数学习者都赞同DDL应用于二语写作过程的积极作用,但学习者在运用语料库过程中仍遇到不少困难。 如表6所示,M值最高的是“对索引行进行分析太耗费时间”,说明“太耗时间”是困扰学习者使用语料库的首要因素。M值最低的是“检索结果呈现的句子数太少”,仅有23%的学习者认为“句子数过少”是导致语料库应用困难的因素,但在Yoon & Hirvela对中级水平语言学习者的调查中,62%的学习者认为“句子数过少”是影响他们使用语料库的主要因素。[18]该结果差异可能与语料库的选择相关,在本研究中学习者在BFSU CQPweb平台上可以对多个语料库进行检索,当一个语料库不能提供足够多的索引行时,他们可以对其他语料库进行查询以获取更多语言实例。
表6 学习者在CQPweb运用过程中遇到的困难(N=26)
(3) 学习者的总体评价。学习者对CQPweb应用于写作教学的总体评价如表7所示:所有学习者都不同程度认同CQPweb是非常有用的写作参考资源,77%的学习者认为以后在写作中还会继续使用语料库。访谈中有学习者表示,“语料库的使用能较好地提高我的作文质量,当不太确定某一词汇或短语的用法时,还是会选择通过语料库去查询”“该平台可以随时随地登录使用,例句很多,写作中可以模仿借鉴……因此以后写作中还会继续使用”。当然也有一名学习者认为,“对语料库索引行进行分析太麻烦,而且时常会碰到生词,有些词在语料库中根本检索不出来,因此我更愿意使用词典”。27%的学习者认为查词典更简单、方便、省时。但是基于语料库的学习资源呈现方式能强化语境中复现的语言型式,帮助学习者内化他们所需要的图式,更有利于学习者作文中的语言产出。 所以,对提高学习者写作中的语言应用能力而言,语料库所起的作用更大。
表7 学习者的总体评价
四、结论
本研究对BFSU CQPweb平台在大学生英语写作修改过程中的应用进行了研究,并对其效果进行了实证分析,发现语料库的应用能够显著提高学习者作文中语言的准确性和流利性,但量化数据表明在复杂性上实验组与控制组没有显著差异。一方面,学习者写作语言复杂性的提高是一个缓慢、长期的过程,需对学习者进行长时间的训练;另一方面,本研究中词汇复杂性测量主要检测学习者词汇运用的多样性,未考虑词汇难度及用词特征。写作文本分析结果表明,实验组学生词汇运用更具体,搭配意识更强。在句法复杂性方面,学习者缺乏句型检索技巧,不熟悉复杂检索模式,一定程度上影响了学习者的学习效果。因此要真正提高DDL的应用成效,教师应注意以下两点:第一,重视对学习者加强语料库检索的培训,特别是复杂检索模式,让其熟练掌握句型检索的CQPweb语句。第二,在写作过程中,合理设计以结对或小组为单位的协作写作活动,学习者共同解决单个成员无法解决的技术或语言问题,一定程度上有助于减少学习者的认知负荷,增强其充分利用CQPweb等网络资源提升写作质量的兴趣。相较于单人独立写作,同伴间的协商互动更有助于写作能力的提升。
问卷调查结果表明大多数学习者都认为BFSU CQPweb的使用有助于掌握写作中词汇的搭配以及固定表达、习语的用法等,尽管有些因素影响了学习者利用语料库进行写作错误修改的积极性,但总体上他们对语料库的应用持积极态度。需要说明的是,本研究也有局限性:首先,本课题主要关注学习者作文中的语言问题,忽略了对学习者写作中其他因素如内容等的关注。Kennedy 和 Miceli证实语料库的应用可培养学习者的认知和元认知能力,激发学生的想象力并帮助学生进行创造性的写作。[19]因此后续研究可进一步探讨语料库在培养认知能力、协助学习者进行创造性思维、完善写作内容等方面的作用。 其次,Hsieh研究显示,网络资源辅助的协作写作有助于学习者更好地协商互动和二语写作水平的提升[20],而本研究仅关注了网络语料库CQPweb的应用,忽略了同伴互动与小组协作在二语写作中的促进作用,后续研究可运用协作写作的理念与方法,对语料库辅助的协作写作活动及成效进行深入研究。