六级、雅思、托福写作测试的反拨效应机制对比研究*
2022-11-01重庆大学
重庆大学
肖 巍 辜向东
提 要: 本文探讨和对比了六级、雅思、托福写作部分的反拨效应机制。研究发现: 总体上,成就型考试使用以考试价值为中介影响语言学习和应试备考;工具型考试使用直接影响语言学习;考试设计以考试价值为中介影响语言学习,以价值和期望共同作为中介影响应试备考。工具型考试使用对语言学习、考试设计对考试价值、考试价值对应试备考的影响上,三项考试存在显著差异。本文证实了反拨效应在写作测试上的特定性,以及在不同考试之间的变异性。
一、 引言
写作是二语/外语学习中的一项重要产出性技能。国内外一些大规模、高风险考试,如大学英语六级(以下简称六级)、雅思、托福等,均包含一定权重的写作测试。六级写作要求考生根据试题提供的信息在30分钟内完成一篇作文(150—200词)。雅思写作要求在60分钟内完成两个任务: 任务一要求对所呈现图表中的信息进行描述、总结与解释(150词);任务二要求对某一观点、论证或议题进行回应(250词)。六级和雅思均采用纸笔考试。托福则采用机考形式,时长50分钟,包含综合写作与独立写作两个任务。在综合写作中,考生基于一段文本(230—300词,阅读时间3分钟)和听力(230—300词,时间2分钟),在20分钟内完成摘要(150—225词);在独立写作中,考生要在30分钟内完成一篇作文(300词)。
考试对教和学带来的影响被称作“反拨效应”(Alderson & Wall, 1993)。目前,学界对于反拨效应的本质、维度、影响因素、作用机制等,进行了较为深入的理论构建(Watanabe, 2004;Green, 2007;Xie, 2010)。实证上,对反拨效应的强度、方向、特定性等,亦进行了较为充分的现象描述(Hu & Trenkic, 2019;Saif et al., 2021;Ali & Hamid, 2020)和一定的机制探索(Xie & Andrews, 2013;Xie 2015;Dong 2020;肖巍等2014)。然而,对于写作测试的反拨效应机制及其考试间变异,目前所知甚少。以六级、雅思、托福写作测试为例,三者在作答形式(纸笔/机考)和任务数量(单任务/双任务)等特征上存在不同。不同考试对考生的影响是否存在差异,需通过实证调查加以廓清。为此,本文拟以六级、雅思、托福三项考试的写作部分为代表,研究写作测试的反拨效应机制,并探讨该机制在不同考试之间的异同,希冀拓宽反拨效应研究的视野,深化学界对反拨效应特定性和变异性的认识,同时为优化我国外语写作测评体系提供参考。
二、 文献回顾
1. 理论研究
自Alderson & Wall(1993)提出反拨效应假设以来,相关理论研究不断演进。Hughes(1993)提出的3P(participants-processes-products)模型认为: 反拨效应遵循“参与者-过程-产出”的作用机制。考试影响参与者的认识和态度,对考试的认识和态度进一步影响参与者的行为,这些行为最终影响学习产出。Watanabe(2004)探讨了反拨效应的本质,界定了反拨效应的五个维度,即强度(intensity)、方向(direction)、意图(intentionality)、长度(length)和特定性(specificity)。Green(2007)整合了反拨效应机制中诸多因素的交互作用以及反拨效应本身的多维度特征,认为考试特征(如考试设计、题型)、考生特征(如考试动机、对考试的期望、对考试的认识)等一系列因素共同影响反拨效应的强度、方向和变异性(variation)。Xie(2010)借鉴了教育心理学中的期望价值理论(Expectancy-Value Theory)研究反拨效应。该理论认为: 个体在完成任务时的选择、持续性和表现受到两种信念的影响: 一是完成该任务的期望(即“我能否做到?”),二是认为该任务的价值多大(即“我是否想做?”)。个体对任务要求的认识影响其对任务的期望和价值判断,进而影响其行为(Wigfield & Eccles, 2000)。
考试作为教育教学中的一项任务,其对考生的影响亦可通过期望价值理论加以解释。对于一项考试,考生可能有不同的使用方式,主要包括成就型考试使用(achievement test use)和工具型考试使用(instrument test use)。成就型考试使用指考生以内在愉悦体验为考试目的,如体验英语学习的乐趣、证明自己的英语水平等;工具型考试使用指考生以实用价值为考试目的,如评优评奖、升学就业等(Xie 2010;Zhan et al. 2021)。考生的考试使用方式和对考试设计的认识会影响其对考试的期望和价值判断,进而影响其行为,包括应试导向的备考行为和正常的语言学习行为。根据期望价值理论,可以对反拨效应机制各因素之间的关系进行假设,并通过结构方程模型加以验证。
2. 实证研究
考生是考试最终的被测群体,他们的声音对于测试开发、改革和效度验证至关重要。学界通过问卷调查、访谈、有声思维等方法,研究考试对考生学习行为和语言能力有何影响,反拨效应的强度和方向如何(Cheng et al., 2010;Zhan & Andrew, 2014;Damankesh & BaBaii,2015;Allen,2016;辜向东2007;辜向东2020)。由于反拨效应的复杂性,一系列教育、社会、心理和情境因素也被作为中介变量纳入考察(Al-Amin & Greenwood, 2018;Saif et al., 2021;Ali & Hamid, 2020)。此外,反拨效应具有特定性,不同技能的反拨效应可能不同(Knoch et al., 2020)。在写作测试方面,Green(2006)研究了雅思培训班的特征,发现培训时对雅思写作所需语言技能的覆盖面较窄。Qi(2007)研究了高考英语写作的反拨效应,发现写作教学并未按照考试开发者的意图进行,未充分体现高考写作任务的交际特征,反而更强调写作的考试情境特征和评分员的偏好。Xie(2015a)研究了大学英语四级考生对四级写作的认识及其写作策略,发现相比激进策略,考生更倾向采用保守策略,即通过写长、规避语法错误等方式取得高分。Kim(2017)研究了托福网考对韩国考生的反拨效应,发现大部分考生存在背模板、参加应试培训等行为,且在计分方式、时间限制、任务指令等方面存在一定的不适应。
囿于研究手段,上述研究多为对反拨效应的现象描述,未探及反拨效应的作用机制。近年来,有学者采用结构方程模型的方法,整合分析反拨效应各因素之间的关系,开展机制探究(Xie & Andrews, 2013;Xie, 2015b;Dong, 2020;肖巍等,2014)。Xie & Andrews(2013)研究了大学英语四级考试设计和工具型考试使用对应试备考行为的影响,以及期望和价值的中介作用。他们发现: 持工具型考试使用方式的考生更认同考试的价值,较高的考试价值则会驱使考生投入备考;对考试评价较高的考生更有信心考好,较高的自我效能感则进一步促进备考投入。然而,他们的研究并未考察成就型和工具型两种考试使用方式对语言学习和应试备考两种行为分别有何影响。Xie(2015b)研究了分数权重和测试方式对大学英语四级考生备考行为的影响,发现考生对分数权重较高的部分投入较多,且对考试的评价越高,其应试备考投入越多。Dong(2020)研究了高考英语的反拨效应机制,对考试认识、学习过程和学习结果诸因素之间的关系进行了建模。其研究发现: 考生对考试效度、影响和重要性的认识会影响学习活动,不同类型的学习活动对学习产出有着不同的效果。肖巍等(2014)研究了2007年大学英语四、六级改革后其反拨效应机制的历时变化,发现在改革后一至一年半,正面反拨效应明显,显现出重视教材学习、淡化应试备考的趋势;此后负面反拨效应有所回升,但总体上继续朝重教材、轻应试的方向发展。
综上可见,目前反拨效应研究以现象描述居多,机制探究较少。现有几例机制研究仅关注单项考试,未涉及不同考试间的变异性以及不同技能的特定性。在写作测试方面,目前还未发现对不同考试写作部分反拨效应机制的对比研究。为此,本文拟选取六级、雅思、托福三项考试的写作部分为代表,开展反拨效应机制对比研究。具体讲,以期望价值理论为视角,考察成就型考试使用、工具型考试使用和考试设计对考生语言学习和应试备考行为的影响,以及期望和价值两个中介变量的作用。本文研究问题如下:
1) 成就型考试使用如何影响考生行为?三项考试之间有何异同?
2) 工具型考试使用如何影响考生行为?三项考试之间有何异同?
3) 考试设计如何影响考生行为?三项考试之间有何异同?
三、 方法
1. 受试
为保证问卷数据质量,本研究只邀请参加过三项考试中的某一项考试的考生填写针对该考试的调查问卷。最终有效人数为: 六级考生455人,雅思考生157人,托福考生107人。基本信息见表1。
表1. 受试基本信息
2. 数据收集工具
我们基于期望价值理论,并参考前人相关研究(如Cheng et al., 2010;Xie, 2010;Xie & Andrews, 2013;辜向东,2007),设计了写作反拨效应调查问卷。三项考试的问卷题目相同,只是个别题目的题干表述略微不同。例如: 调查考试目的,三项考试问卷的表述分别为“你参加六级/雅思/托福考试的目的”。问卷经历了三轮修改和两轮试测,最终定稿投入使用。问卷采用Likert五级量表计分,调查考生认识的计分方式为“1=完全不同意”到“5=完全同意”,调查考生行为的计分方式为“1=从不”到“5=总是”。问卷构成及各部分的信度系数为: 成就型考试使用(Cronbach’s α=.838)、工具型考试使用(α=.700)、考试设计(α=.732)、考试期望(α=.882)、 考试价值(α=.882)、语言学习行为(α=.809)、应试备考行为(α=.789)。所有因子的信度系数均大于0.7,说明问卷信度较高。
3. 数据分析
首先,使用SPSS24进行探索性因子分析和信度分析,使用Amos24进行验证性因子分析,剔除质量较差的题目,确保问卷的信度和效度。其次,使用SPSS24对各因素进行描述统计和方差分析,在单因素层面探讨三项考试写作部分反拨效应的异同。最后,使用Amos24进行结构方程建模,从整体层面探讨三项考试写作部分反拨效应机制的异同。
四、 结果
1. 单因素对比
对三项考试的单因素对比分析如表2第2至6列所示,其中,第2至4列分别为六级、雅思、托福的均值,第5列为方差分析的F值(显著性用星号表示),第6列为两两对比的事后检验结果(仅列出存在显著差异的对比,方差齐性时使用LSD方法,不齐性时使用Tamhane方法)。结果表明: 三项考试在反拨效应各因素上均有显著差异。
表2. 三项考试写作部分反拨效应单因素对比
具体讲,在成就型考试使用上,六级(均值3.32)低于雅思(3.69)和托福(3.63),而在工具型考试使用上,六级(3.51)高于雅思(2.64)和托福(2.77),这说明雅思和托福考生更倾向于以英语考试推动自身英语学习和检验英语学习成效,而六级考生更多是以英语考试为工具实现升学、求职等目标。考试设计上,六级(3.65)和托福(3.61)低于雅思(3.92),说明雅思考生对考试设计的认可度更高。考试期望上,六级(3.01)低于雅思(3.76)和托福(3.72),说明雅思和托福考生更有信心考出好成绩。考试价值上,六级(3.30)低于雅思(3.80)和托福(3.93),说明雅思和托福考生更认可考试价值。语言学习上,六级(3.01)低于雅思(3.27)和托福(3.11),应试备考上,六级(2.65) 同样低于雅思(3.27)和托福(3.05),这说明六级考生的语言学习和应试备考投入均较少。
2. 模型对比
基于期望价值理论和相关反拨效应研究,我们构建了写作反拨效应机制模型(见图1),使用极大似然法进行拟合。模型各拟合指标为: CMIN/DF=2.990,CFI=0.916,GFI=0.906,RMSEA=0.06,满足CMIN/DF小于3、CFI和GFI大于0.9、RMSEA小于0.08的惯例,该模型可以接受(荣泰生2009)。模型中,所有路径系数的p值均小于0.05,即路径系数均达到显著性水平。跨群组不变性检验显示,结构残差的p值小于0.05,说明三项考试写作部分的反拨效应机制存在显著差异。
图1. 写作反拨效应机制模型(每条路径所标注的系数依次为六级/雅思/托福。所有路径均达显著性水平。存在考试间差异的路径以加粗表示)
六级考生的成就型使用对六级考试价值具有较弱正面影响(β=.38);考试价值对语言学习具有较弱正面影响(β=.34),对应试备考具有微弱正面影响(β=.12)。工具型使用对语言学习行为几乎没有影响(β=.09)。考试设计对考试价值和期望均具有较弱正面影响(β=.31/.37); 考试期望对应试备考具有微弱正面影响(β=.15)。可见,六级考生的成就型使用动机越强,其对六级的价值越认同;对六级价值越认同,语言学习和应试备考投入越多。考生对六级写作的考试设计评价越高,越认同考试价值并期望考出好成绩;期望越高,语言学习和应试备考投入越多。然而,工具型考试使用对语言学习投入的提升作用微弱。
雅思考生的成就型使用对雅思考试价值具有中等正面影响(β=.53);考试价值对语言学习和应试备考均具有较弱正面影响(β=.34/.38)。工具型使用对语言学习有中等正面影响(β=.46)。考试设计对考试价值和期望均具有中等正面影响(β=.56/.56);考试期望对应试备考具有十分微弱的正面影响(β=.04)。可见,雅思考生的成就型考试使用动机越强,其对雅思的价值越认同;对雅思价值越认同,语言学习和应试备考投入越多。工具型使用动机越强,语言学习投入越多。考生对雅思写作的考试设计评价越高,越认同考试价值并期望考出好成绩;然而,考生期望对于应试备考投入的提升十分微弱。
托福考生的成就型使用对托福考试价值具有中等正面影响(β=.46);考试价值对语言学习和应试备考均具有中等正面影响(β=.50/.44)。工具型使用对语言学习有较弱负面影响(β=-.38)。考试设计对考试价值具有微弱的负面影响(β=.-.13),对期望具有微弱的正面影响(β=.25);期望对应试备考具有微弱正面影响(β=.26)。可见,托福考生的成就型使用动机越强,其对托福的价值越认同;对托福价值越认同,语言学习和应试备考投入越多。工具型使用动机越强,语言学习的投入越少。考生对托福写作的考试设计评价越高,越期望考出好成绩,但对考试价值的认同反而更低;期望越高,应试备考投入越多。
为了检验各路径在三项考试之间的差异是否显著,我们对每一条路径分别进行了考试间的配对检验(见表3)。结果表明,三条路径存在考试间的显著差异,即: 工具型使用→语言学习,考试设计→考试价值,考试价值→应试备考(在图1中以加粗表示)。其中,工具型使用对语言学习的影响上,六级几乎没有影响,雅思为中等正面,托福为较弱负面。考试设计对考试价值的影响上,六级为较弱正面,雅思为中等正面,托福为微弱负面。考试价值对应试备考的影响上,六级仅有微弱正面影响,而雅思为较弱正面,托福为中等正面。
表3. 三项考试写作部分反拨效应路径系数对比
五、 讨论
1. 成就型考试使用对考生行为的影响
本文发现: 成就型考试使用以考试价值为中介,影响语言学习行为和应试备考行为。成就型使用动机越强,行为投入越多。成就型使用包括促进英语学习、了解自己英语的强弱项、证明自己的英语水平等,与英语学习的长远目标和内在动机高度相关。学习者一旦确立长远目标,就会调动各种学习资源,投入更多时间精力(Pintrich, 1999;Zhan et al., 2021)。然而,在具体作用路径上,三项考试既有相似,又有不同。
首先,成就型使用越强,考生越认可考试价值,且这一影响不存在考试间差异。该发现与期望价值理论的假设相符(Wigfield & Eccles, 2000)。成就型使用方式较为明确和一致,主要是将考试作为衡量自身英语水平的标尺、检验长远目标完成情况和促进长期英语学习的手段。既然考生选择参加某项考试,就表明考生认可其价值。因此,成就型使用动机强烈的考生无论参加何种考试,都倾向于赋予考试较高价值。
其次,考生越认为考试有价值,越会加大语言学习的投入,且这一影响不存在考试间差异。根据期望价值理论,一项任务有价值,参与者就愿意完成该任务(Wigfield & Eccles, 2000)。写作反拨效应机制同样遵循这一规律。考生既然认可考试价值,就会重视考试,投入更多精力学习。
再次,虽然三项考试的价值对应试备考的影响均偏向正面,但雅思和托福的影响更大。这一差异可能与考试任务特征和考生对任务的熟悉度有关。六级写作仅有一项任务,且题型较常见,考生较为熟悉;而雅思和托福均有两项写作任务,且雅思任务一和托福综合写作题型相对不常见,考生不熟悉,可能会进行针对性训练。Saif等人(2021)发现: 首次参加托福考试的考生,备考时会更加期望了解考试本身;参加过托福的考生由于已熟悉考试任务,备考时更关注提高英语水平。Dong(2020)发现: 高考英语的重要性对应试备考的影响不大,可能是因为考生对高考英语已较为熟悉。这一发现与本研究中的六级数据相似,而与雅思和托福不同。考虑到中国考生对高考和六级的熟悉度通常高于雅思和托福,可以推断: 考试价值对应试备考的影响可能因任务熟悉度而显现出一定差异。
2. 工具型考试使用对考生行为的影响
工具型考试使用无需以价值或期望为中介,而是直接影响语言学习。工具型使用对语言学习的影响在三项考试间差异较大,雅思为中等正面影响,托福为较弱负面影响,六级几乎没有影响。工具型使用与短期目标和外在动机有关,包括评优评奖、升学就业等(Pintrich 1999;Zhan et al., 2021)。由单因素对比可知,在三项考试中,六级考生的工具型使用较强,成就型使用较弱,雅思和托福则正好与六级相反。行为投入方面,雅思和托福考生的语言学习和应试备考投入均高于六级。由于六级考生英语学习的内在动机不强烈,行为投入较少,其语言学习投入与工具型考试使用之间可能不存在关联,由此可解释为何六级考生的工具型使用对语言学习行为几乎没有影响。这一点与Xie & Andrews(2013)的发现基本一致。他们对四级的研究发现: 虽然工具型使用通过考试价值的中介影响应试备考,但总效应幅度仅为0.003,几乎没有影响。
雅思和托福考生的工具型使用对语言学习的影响一正一负。由于雅思考生的应试备考和语言学习投入在三项考试中均为最高,托福考生的应试备考高于六级考生,但语言学习与六级考生无差异,我们推断: 考生会因考试特点调整自身的行为投入。若应试备考收效不高,考生可能减少应试备考转而加大语言学习投入。Knoch等人(2020)发现: 应试备考对口语具有一定提升作用,但对写作的作用不大,考生会根据备考效果动态调整备考策略。多项针对雅思的研究也表明: 雅思应试培训对提高成绩的作用十分微弱(Green, 2006;Hu & Trenkic, 2021)。因此,对于雅思而言,即便是持工具型考试使用方式的考生,也可能加大语言学习投入,减少对提升分数作用不大的应试备考。相比雅思,托福的一大特点是采用机考形式。这可能导致托福考生过于注重针对机考的训练,一定程度上忽略了语言学习投入。Saif等人(2021)对中国托福考生的访谈发现: 考生同时具有提升语言水平和熟悉托福考试形式的需求,且难以在二者之间平衡投入。这一定程度印证了本文的发现。由于工具型考试使用对语言学习的影响具有非常大的考试间差异,表明其背后可能有着复杂的机理,需要后续更加深入的研究加以厘清。
3. 考试设计对考生行为的影响
考试设计以考试价值为中介影响语言学习,以价值和期望共同作为中介影响应试备考。考生对考试越认可,行为投入越多,这一点与Xie(2015b)对四级考试的研究发现相似。但在具体作用路径上,三项考试存在一定的差异。
首先,考试设计对考试价值的影响存在考试间差异,对考试设计越了解,六级和雅思考生越认可考试的价值,而托福考生则越不认可考试价值。这可能与托福采用机考形式有关。从单因素对比可以看出,考生认为雅思和托福的价值高于六级,且托福略高于雅思,但托福的考试设计显著低于雅思,且略低于六级。诚然,机考具有很多传统纸笔考试所不具备的优点,但其在熟悉度、真实性、感知有用性和感知易用性等方面仍存在一些问题甚至质疑(Kim, 2017;Nikou & Economides, 2017),可能导致了解托福写作设计的考生反而不认可其价值(尽管这一负面影响十分微弱)。
其次,考试设计对考试期望的影响不存在考试间差异。对考试越了解,越有信心通过考试,这一点与Pintrich(1999)的理论构建和Xie & Andrews(2013)的实证发现一致。完成任务时,对任务要求的认识是决定自我效能的重要因素(Gist & Mitchell, 1992)。因此,对考试设计的充分了解是提升自我效能的重要保障。虽然对考试设计的了解并不意味着对考试所需知识技能的掌握,但能够帮助考生减轻考试焦虑,加强对备考行为的调控和管理,将更多精力投入到提升语言水平当中,从而提升考试期望(Saif et al., 2021)。
再次,考试期望对应试备考行为的影响不存在考试间差异。考生越认为能够考出好成绩,对应试备考的投入越多。不过,相比考试价值,考试期望对应试备考行为的影响较弱。Zhan等人(2021)也发现: 受到中国传统文化影响,中国考生通常较为内敛,期望较低且对语言使用的影响较弱。这可能与期望的特点有关。期望是对自身有能力完成某项任务的自我评估,与行为之间的关系较为复杂。Bandura(1982)认为: 任务过于简单、期望较高时,可能会抑制学习行为;任务略难、期望略低时,反而能够促进学习。此外,期望是考生对自己能力的一种信心,而相信自己有能力并不一定意味着行为投入。相比之下,价值对行为投入的驱动更为强烈。一项考试如果具有较高价值,即便考生能力有所欠缺,也可能尽力去尝试考好。而对于价值不高的考试,即便考生具备所需的能力,也不一定有较高的行为投入。
六、 结论
本文通过多群组结构方程建模,探讨和对比了六级、雅思、托福写作部分的反拨效应机制。研究发现: 总体上,成就型考试使用以考试价值为中介影响语言学习和应试备考;工具型考试使用直接影响语言学习;考试设计以价值为中介影响语言学习,以价值和期望共同作为中介影响应试备考。工具型考试使用对语言学习、考试设计对考试价值、考试价值对应试备考的影响上,三项考试写作部分存在显著差异。研究结果证实了反拨效应在写作测试上的特定性,以及在不同考试间的变异性。
本文是探究不同考试同一技能反拨效应机制异同的一次有益尝试。理论上,本文聚焦于写作测试,对比了其反拨效应机制在不同考试之间的异同,加深了学界对反拨效应特定性和变异性的认识,对写作测试的效度验证具有一定启示。方法上,本文使用的多群组结构方程模型可以对多个模型进行对比,不仅可用于反拨效应机制在不同考试之间的对比,还可用于反拨效应机制的历时研究(如肖巍等,2014),为类似研究提供了思路和借鉴。实践上,本文的发现既可为考生写作学习与备考提供指导,也可为国内考试写作部分与国际考试之间的对接对比和优化写作测评体系提供参考。
本文的不足之处有二: 一是囿于时间精力,未涉及期望价值理论框架中其他可能影响反拨效应的重要因素,如考试焦虑、考试代价等;二是本文问卷调查数据虽然丰富,基于结构方程模型的整合式分析与探索也较为全面,但仍可能存在研究手段单一造成的局限。今后,可将考试焦虑等因素纳入反拨效应机制研究当中,并结合访谈、学生日记等质性数据进行轨迹等效建模、关键点分析、微变化分析等,以期对反拨效应机制进行更为精准的研究。