短文听写题型不同的作答方式对CET-4 考生答题过程的影响研究
2015-02-20时春燕
时春燕
( 河南城建学院 外国语学院,河南 平顶山467036)
一、引言
听写是外语教学和测试中传统的方法之一,复合式听写是部分听写的一种,1997 年首次出现在CET-4 听力理解部分,占总分值的10%。自2013 年12 月起,听写题型又作了局部调整,新四级考纲要求指出:听力理解部分测试学生获取口头信息的能力。新复合式听写( 短文听写) 由原来的单词和句子听写改为单词及词组听写,要求考生在听懂短文的基础上用所听到的原文填写空缺的单词或词组,短文播放三遍,但对其考查目标的解释较为笼统和模糊。
关于听写的研究大多承认它是一种综合型语言水平测试,要求学习者同时运用几种不同的语言技能,包括语音、语法、词汇和书写等[1]29-35,[2]31,[3]。然而,由于综合型测试的分数报告多采用传统的单项技能分,构念效度的模糊性问题由此而生。不同类型的测试任务关注构念的不同侧面,因此仅用一个综合得分来描述考生在听、说、读、写测试中的表现,分数的意义和解释可能受到影响[4]64-68。为此本研究根据学生在听写题型中常出现的拼写、语法等问题,设计了听写不同的任务类型( 用英文或母语作答,是否提供语境) ,来探索不同的作答方式对考生答题过程有何影响,以对听写测试的效度进行验证。具体研究问题如下:( 1) 不同作答方式的四组考生总体成绩有何不同? ( 2) 不同作答方式考生的实际答题过程与试题指令是否一致? ( 3) 不同作答方式所考查的语言技能和策略有何不同? ( 4) 不同作答方式下影响考生答题过程的因素有何不同?
二、研究设计
1.研究方法
追述法是用来揭示考生答题过程常用的方法,通过对个体思维、感受、推理及心理状态的观察和反思来推断这些过程决定行为的方式( Numan,1992)[5]。数据来源于受试对其答题过程的自我陈述( 口述报告) ,与内省法、有声思维的区别在于数据的收集是在受试的心理活动发生同时还是发生之后进行。
2.实验对象
研究的对象选自两个教学班的36 名非英语专业本科生,有着7 年的英语学习经历和相同的教育文化背景,包括较高水平( high) 、中等水平( medium) 和较低水平( low) 的受试各12 人,对被试进行分组,主要依据学生听力前测的复合式听写分数和其英语老师对他们听力水平的评估。根据不同的作答方式将36 名受试分成四组,如下所示。
表1 受试分组情况
四组受试采用同一篇短文的单词听写,以为了验证受试在答题过程中是否理解和掌握所听到的口头信息,测试表现是否受其二语产出能力的限制,如拼写、语法等,以及所提供的语境的影响。实验材料选自四级考试样卷的复合式听写试题的单词部分有8 个空,每空1 分,共8 分。
3.数据收集和分析
数据的采集共分为五个阶段: 培训、试测、即时追述、追述访谈和数据转录。即时追述是正式实验的主要阶段,每位受试在答题结束后马上口述完成每一题项时的思维过程,研究人员鼓励受试讲出答题中的任何想法,这一阶段没有时间限制。随后,受试回答研究人员提出的关于答题过程中思维策略的问题,访谈题目大多由“是什么”“怎么样”的半结构式开放性问题组成,目的是帮助受试回忆更多的有关信息。研究人员对这两个阶段都进行了录音。对录音进行转录和校对后,两位研究者分别对数据进行编码分析,一致性达82%。两周后其中一位研究者再次对部分数据进行分析,一致性为87%,两位研究者对有分歧的地方进行讨论直到达成一致。对口述报告采取定性和定量数据分析相结合的方式。
三、结果与讨论
1.四组受试总体的测试结果
对四组受试的单词听写得分进行单因素方差 分析,结果显示,组1 与组2( p = 0. 7 6 4 >0.05) 、组1 与组3( p =0.764 >0.05) 、组1 与组4( p =0.881 >0.05) 之间的差异并不显著,第三组受试的分数高于其他组,第四组受试的分数虽然较低,但并不是实验前预测的最低,说明语境对单词听写的影响并不大。不同水平受试的单词听写得分总体差异并不显著,从组内来看,第三组和第二组高水平的受试得分明显高于低水平的受试,说明这两组单词听写的作答方式具有较好的区分度。
表2 四组受试听写的得分
2.四组受试实际答题过程与试题指令的对比
对比第一组受试的答题过程与试题指令发现,他们每一遍的实际表现与指令的提示并不一致,受试没有去看或忽略指令内容。
第二组受试的试题指令给出可选用中文或英文作答,同时有指令的中文版。从追述报告来看,当第一遍录音播放时,大部分受试一听到空格处的读音就会记下单词或为首的字母,但并不十分理解含义;播放第二遍时,他们对没有填出来的地方特别注意或修正这些单词;播放第三遍时,受试基本上填完了空格处的单词并进行了核查,他们也会用剩余的时间试图去理解短文的意思。可以看出第二组受试的作答过程与指令要求也不一致,一位受试提到他会大概看一下指令,还有一位只看了中文的指令以节省时间。受试大部分仍使用英文作答,只有2 处是用中文作答,有5 处受试同时写了英文和中文。报告显示这些受试在所听单词的读音不确定的情况下才会根据意思写下中文,或为了有助于记忆。大部分受试认为他们通常根据听到的发音就写下单词似乎更容易,因为一个英文单词可能有不同的中文意思,需要联系上下文来确定其含义,这会增加他们的认知负担,影响下一部分的听力。
第三组的试题指令为中文,要求全部用中文作答,通过分析第三组受试的口述报告发现,录音播放第一遍时,大部分受试会先记下他们听到的英文单词,想它的意思或译为中文。如果对单词特别熟悉或能很快反应出来,他们会直接写下来中文,注意力仍在单词上而大意了解得不多;播放第二遍时,他们将记下的英文单词转为中文;第三遍时,他们主要检查或确认单词,尤其是没有填出来的地方。可以看出大部分受试由于习惯根据听到的读音来写下英文,所以听完一处首先记下英文单词或字母然后再转为中文,原因和第二组一样。其中有2 处受试听清楚了单词并拼写出来,但忘记了或不确定它的含义,如这名受试讲到:
第41 空我写了”exchange”这个词,但我不确定它的中文。英文的发音是有固定字母组合的,所以这个用英文简单些( M2,G3) 。
也有的受试( L2) 认为对他来讲用母语容易些,他能理解听到的许多单词却拼写不出来,根据听到的发音加上大意或常识可大概推断出单词的含义。例如,一位受试( L1) 在38 空写的“谈判”,他以前学过这个单词也比较熟悉,英文却写的是”nigociate”,很显然拼写错误,第三组由于要求用中文作答,因此只要意思正确即可得分。
第四组受试的听写指令表明只会听到单词朗读,每一遍的要求没有变。从口述报告分析来看,当录音播放第一遍时,受试根据所听的读音记下单词或字母;播放第二遍时,受试补充完善这些单词,或进行确认、检查;到第三遍时,空格处的单词已基本完成,只有一名受试在听之前看了指令。第四组受试大部分只是通过单词的读音来完成空格而没有想它的含义。其中一位受试陈述到:
我觉得语境对我没有多大帮助,听之前我不会去读语篇。在听的时候我很紧张,我会努力去听讲的是什么,注意力主要在空格的地方( H3,G4) 。
有的受试认为用语境可以联系上下文来推断空格处的信息,另外可以在录音播放前浏览语篇来做好准备。例如一位受试讲到:
我认为有语境的话会更容易,有的单词可能不太熟悉,即使听清楚了也无法确定,根据语境你可能知道空格处需要什么,在脑海里搜索相似发音的单词,也许就能填出来,而且也不会有名词单复数这类形式上的错误( M1,G4) 。
也有的受试认为单词听写没有语境会更好,录音里一个单词可能与其他单词连读过去,听不清楚或无法辨别,可以看出第四组受试对于语境作用的看法并不一致。
3.听写所考查的四组受试的语言能力
依据Bachman 和Palmer[6]44-51描述语言能力的模型和Buck[7]对于听写能力构念的大致框架,并通过对第一组受试口述报告的分析,短文听写考查的语言能力可分为语言知识和策略使用两方面。第一组受试考查的语言知识包括了语音、词汇、拼写、语法等,受试的注意力主要放在空格处单词的发音而不是含义,有的受试不能区分较相似的语音流,如“effect”“effort”“officers”“officials”等。虽然大部分受试能清楚地听到空格处单词的发音,但单词拼写错误和没有填出的占40%。第二组受试大部分选用的仍是英文作答,语音的感知和单词识别对受试的答题表现同样起非常重要的作用,单词拼写错误约占39%。受试在7 处写了中文,口述报告的分析也显示第二组受试单词的语义理解(28 次) 多于第一组受试(23 次) 。第三组的作答方式要求用中文完成,除了语音感知和单词识别外,受试更加注重去理解语义和篇章大意,不会受到他们二语产出能力的阻碍,但对所听内容的正确理解要求更高,因为在2 处受试提到能拼写出英文单词却不懂或忘了含义。第四组所考查的语言知识和第一组大致相同,对语音的感知、单词识别、正确拼写要求高,但相比其他三组,受试很少考虑所听内容的语义。第四组受试的听写没有任何书面和听力的语境,主要是依据所听的单词发音来填出空格,所填单词的拼写错误约占34%。从第一组受试口述报告的分析可看出受试在答题过程中使用了不同的策略,这些策略可进一步分为认知策略( 推理、预测、语境化、翻译,即有意识的理解、储存和使用语言知识的心理活动) 和元认知策略[8]。
表3 四组受试认知策略的使用频率
表3 显示了四组受试认知策略的使用频率,其中推理策略的运用较多。从受试的表现和报告来看,当受试不了解某个单词的含义,仅靠所听的发音来推断,单词的拼写基本上都不正确,第一组受试在7 处仅通过发音来写的单词无一个正确; 第二组受试在8 处仅通过发音填写的单词中只有1 个正确;第四组受试在5 处仅通过发音填写的单词中只有2个正确,这些正确答案都是因为受试对此单词非常熟悉却忘了它们的含义。第三组受试会通过单词的发音并联系其在句中的含义来推断答案。因为当受试运用语境化策略时,注意力不会只放在抓取某个单词,而会关注上下文的连贯和衔接。第三组受试使用推理和语境化策略较多,也许和他们用母语的作答方式有关,倾向于考虑更多的语境线索以完成任务。第四组听写由于没有语境,因此没有预期和语境化策略的运用。相比来看,第三组受试认知策略的运用最多,也说明了受试对输入信息的理解比其他组要高。
表4 四组受试元认知策略使用频率
从表4 可以看出四组受试元认知策略的使用频率,其中理解评估使用较多,然后是理解监控[9]。第三组受试元认知策略的使用多于其他三组,说明受试更多去对听写的信息加工过程进行计划、监控、调节和评价。第四组受试的听写没有语境,并无听前准备和选择性注意策略的使用,整体策略的使用都较少。
总体来看,受试元认知策略的使用频率要高于认知策略,可能是受短文听写测试方法的影响,尽管他们会使用推理、语境化来帮助理解并填出答案,但除了第三组受试,其他组并没有充分去运用这些策略来理解语篇的信息。
4.四组受试答题过程的主要影响因素
口述报告的分析也发现一些对受试答题过程有影响的因素,这些因素与听解能力并不直接相关,但会阻碍对受试听力水平的评估。
表5 受试提到的影响答题过程的主要因素及其频率
有的受试认为注意力失败会影响答题效率( 表5) ,如一位受试在报告中讲到:
我似乎听到后面的单词但没听清楚,我的思维还纠结于上一个空“environment”,所以接下来的内容没听进去……( H2,G1)
语速、时间限制和心理状态等也同样有影响作用,这些因素有些与受试自身密切有关( 如注意力失败、心理状态) ,有的与测试任务相关( 如语速、时间限制) 。但第三组受试受到这些因素的影响较少,第四组最少。可能因为第三组受试需要考虑更多的语境含义,所听内容的信息加工更深入,也能较长地停留在工作记忆中,答题过程也更有效。第四组受试只听到单独的单词并写下来,注意力、语速等因素的影响也最小。
此外,受试还提到其他给答题过程带来影响的因素。第四组的3 名受试认为录音材料中男女声朗读有差异,第二遍录音中女士的发音相比男士来说更清晰,音调高好听一些,而男声低沉,在读第一遍时,他们觉得听不大清楚或反应不过来。第二组的2 名受试和第三组的1 名受试也提到了这个问题。还有的受试认为短文中空格之间的间距对答题表现也有一定影响,第一组的3 名、第二组1 名和第三组3 名受试讲到题号37 到38,38 到39,43 到44 空之间的间距相邻比较近,还专注在上一空时,下一个已经过去了,注意力很难快速切换到下一空上面。
四、结论
综上所述,从考试结果来看,四组考生听写的总体得分差异并不显著,在答题过程中每一遍的表现与听写指令之间并不一致,听第一遍时习惯于捕捉空格处的单词,而不是试图去理解含义,这对试题指令的合理性也构成了威胁。而考生对用母语作答和语境的作用受到他们做题习惯和听力水平的影响。使用母语作答的第三组考生在答题过程中倾向使用更多不同的策略对输入的信息和短文大意更好地去理解,没有受到二语( 英文) 产出的影响,并受与构念无关的因素影响较小,证明听解测试的效度较高。而第四组受试在没有语境的情况下,对语义的理解和使用的策略也是最少的,听写没有较好的效度和区分度。
因此,为更好地对学生的听力水平做出评估,本文所尝试的短文听写的不同任务类型可提供一定的启示,同时,在评分标准上不应过于强调语言形式的准确性,重点是看学生是否理解掌握了输入的口头信息,并且要提供足够的语境有效地帮助学生的理解。本文对听写题型答题过程的研究也为测试者如何降低影响测试效度的潜在威胁提供了建议,但是还需要更多相关研究进行丰富和细化。
注释:
本研究基于前期研究成果( 《复合式听写题型受试认知和元认知答题过程的追述法研究》,参见《中国应用语言学》,2012 年第4 期) ,在对第一组按四级考查方式作答的9名受试口述报告进行分析、探讨听写题型效度的基础上,收集分析了四组采用不同方式作答的36 名受试的追述报告和访谈数据,以重新思考这个问题,进一步验证了前期研究的结论。
[1] BACHMAN L F,PALMER A S. Language Testing in Practice[M]. Oxford: OUP,1996.
[2] BUCK G. Assessing Listening[M]. Cambridge: CUP,2001.
[3] GOH C M. A cognitive perspective on language learners'listening comprehension problems[J].System,2000,28(1) ,55-75.
[4] HEATON J B. Writing English Language Tests( New edition) [M].Beijing: Foreign Language Teaching and Research Press,2000.
[5] KAGA M. Dictation as a measure of Japanese proficiency[J]. Language Testing,1991,8(2) : 112-124.
[6] NUMAN D. Research Methods in Language Learning[M].Cambridge: CUP,1992.
[7] OLLER J W,STREIFF J V. Dictation: a test of grammarbased expectancies[J]. ELT Journal,1975,30(1) : 25-36.
[8] PURPURA J. An analysis of the relationship between test-takers'cognitive and metacognitive strategy use and second language test performance[J]. Language Learning,1997,47 (2) : 289-325.
[9] 丁展平. 等级式听写和选择式听写作为英语测试手段的研究[J].西安外国语学院学报,2001,(3) :60-64.
[10] 金 艳,张晓艺. 技能综合对语言测试构念效度的影响[J].外语电化教学,2013,(154) :3-10.