APP下载

完形填空试题的考点效度分析

2014-02-16

苏州教育学院学报 2014年5期
关键词:效度考点正确率

高 燕

(山西大学 外国语学院,山西 太原 030006)

完形填空试题的考点效度分析

高 燕

(山西大学 外国语学院,山西 太原 030006)

完形填空试题由于在命题、实施、评卷、结果分析等方面具有客观、便利等优点,因而被广泛应用于外语教学和测试中。但是目前充斥市场的绝大多数完形填空试题效度不高,主要原因就是试题的考点层次不高,效度偏低。根据李筱菊提出的完形填空考点层次理论设计一道完形填空试题,并选择某高校的学生进行试测,重点分析了答题正确率和失分原因,从实证的角度得出通过提高考点层次来提升完形填空试题考点效度的方法。应着重培养学生在高层次考点上的能力,从而提高英语学习者的综合英语水平。

完形填空;考点效度;试测;正确率

一、完形填空试题简介

完形填空(cloze test)作为一种考试形式是从19世纪末开始得到应用的。我们现在所采用的完形填空是以19世纪50年代泰勒的实践为基础设计的,根据的是格式塔心理(Gestalt psychology),即补全心理。[1]就是说,人们根据脑子里对事物的完整概念,看见不完整的事物,便会在思想里把它补全起来,应用于语言现象。同样,人们对于不完整的语言也有这种补全心理。完形填空正是基于此原理设计的试题形式。这种形式一出现就受到心理学界和语言教育界的关注。最初人们利用完形填空试题只是为了测量语言材料的可读性和受试者的阅读理解能力,后来发展为用于综合语言能力的测试。曾经有研究证明完形测试结果与综合语言水平考试的结果高度相关。当时形成的对完形填空的基本认识是:这是一种可靠并且有效的阅读材料难度检测与阅读理解方式,可以用来作为标准化综合性语言水平测试的组成部分,也可以用来配合课堂语言教学。[2]因此,迄今为止,完形填空这种题型被广泛地用于国内各种英语考试:如大学英语专业八级考试(TEM 8)、大学英语专业四级考试(TEM 4)等等。

二、完形填空考点效度分析

完形填空的操作手段是删除篇章中的一些词语并评价读者对删掉词语的反应。经典完形填空理论认为,完形填空具体删什么词,不影响考试的结果,因而是无关重要的。李筱菊却认为,完形填空具体删出的项目,在很大的程度上决定了完形填空试题的质量。因此,她提出了完形填空考点效度的概

念,并将其考点划分为四个层次:word单词层次,phrase词组层次,sentence句子层次,discourse语篇层次。李筱菊在《语言测试科学与艺术》中详细指出:W(word)单词层次是最低的层次。光看单词,无须看单词之外的上下文就能决定所填的词。单纯考拼写、单纯考词法变位或单纯考构词法的题目,属于这个层次;P(phrase)词组层次中,所要填的词,和它前后的词有固定的搭配关系,只要看空缺前或后的词便能决定该填什么;S(sentence)句子层次要求空缺处要填的词在本句内决定,不用超出句子的范围;D(discourse)语篇层次中,空缺处填什么词,光看本句不成,要超出句子在语篇层次上考虑才能决定。这四个层次中单词层次为最底层次,其次是词组层次,句子层次,最高是语篇层次。[3]

考点层次的高低,对题目的效度很有关系。层次越高,意味着考点的效度越高。D层次考点的题目显然比W层次考点的题目效度更高,更能测试出受试者运用语言的真正能力。而且,高层次的考点,在考高层次的能力(含知识)的同时,必然也考到低层次的能力(含知识)。也就是说高层次能包含低层次,但低层次却不能反过来包含高层次。即:一个语篇层次的考点,在考查语篇层次的能力的同时,自然也考到了句子层次、词组层次和单词层次的能力。句子层次的考点,在考句子层次的能力的同时,也自然考到词组层次和单词层次的能力。但是单词层次的考点,则只能考到单词层次的能力或知识,不能考到它以上的任何层次的能力。因此,李筱菊提倡完形填空要着力使考点层次尽可能地高。另外,她提倡应提高考点层次的原因是完形填空不同于语法测试和词汇测试,它有语篇语境。这也是完形填空优于低层次试题的方面。如果仍就用它去测试一些句子以下层次的考点,实际上是一种资源浪费。基于这种理论,我们应尽量使删去的词,即考点,靠近语篇层次,从而提高完形填空试题的效度。

三、试测设计

首先,作者挑选了一篇题目为Global Warming的科普类文章,从中删去一些词,考点分别涉及词汇意义区分(第7题),属于单词层次;词组搭配(第10,14,17题),属于词组层次;非谓语形式(第1,6,18题),连词(第19题),情态动词的谓语形式(第12题),形容词比较级形式(第15题),属于句子层次;以及根据意义和上下文判断的试题(第2,3,4,5,8,9,11,13,16,20题),属于语篇层次。

在这20道题的完形填空当中,涉及语篇层次考点的有10道,涉及句子层次考点的有6道,涉及词汇层次考点的有3道,涉及单词考点的只有1道。也就是说,80%的考点都在单词和词汇层次之上。

在试测中,作者抽取了某高校同等水平学生74名。测试时间设在上午。

四、结果分析

整篇完形填空满分20分,平均分只有9.9。也就是说平均每人的得分还不到50%。可见这篇完形填空对于学生来说难度较大。各个考点的正确率统计可见图1。

图1 各个考点层次的正确率

由此可以看出:第一,总体来看,正确率偏低。第二,语篇层次的得分率明显低于其他三个层次的得分率。句子层次除了第12、第19题正确率较低(分别为26%和27%)之外,词汇层次与单词层次均处于中等水平。得分率基本为50%。第三,该完形填空答题正确率最高的是句子层次的第18题,正确率达到87%;其次是句子层次的第6题和第15题,正确率达到80%;正确率最低的是语篇层次的第2题和第4题,正确率都只有14%。

该篇完形填空试题难度较高,主要体现在以下几个方面:第一,生词较多。这是在各个层次都失分较多的一个原因。其中单词层次的正确率也只有57%。例如,考题第7题,旨在考察表示“前总统”中“前”这一含义的单词,要求区分former、formerly、previous、before这四个单词。但是有一半的学生在此失了分。第二,语篇层次的考题较多。正确率最低的两个考点就出在这一层次。传统的教学使我们对语法、句法、词汇等知识掌握的牢靠程度明显高于对语篇语境的了解程度。在课堂上,经常会遇到学生提问:“老师,这个词在上篇文章中后面是加to的,这篇怎么加了in呢?”这就是很典型的忽视语境的表现。20世纪80年代之后兴盛起来的交际英语教学却并非如此。巴克曼和徐强提出的交际英语能力学

说,都包括语篇能力的部分[4-5]。第三,图1显示,句法层次除了个别题之外,正确率比词汇和单词层次还高。这是因为:句法层次的考题虽然比单词和词汇层次的考题难,但是由于涉及的基本语法知识在课堂中已经详细讲授过,所以答题的正确率较高(如第18题)。该题目考察了两个动词在句子中的连接形式:要么采用动词不定式来连接动词原形,要么将第二个动词改为动名次形式。其次是第6题和第15题。它们分别考察了现在分词作伴随状语这种非谓语形式和形容词的比较级形式。由于对这些句法知识掌握得比较牢靠,所以正确率很高。但是当词汇量加大,主要考察对语境的整体把握时,正确率就明显降了下来。

五、结论

上述实验中以语篇层次为考点的题目错误率较高,说明学生运用语篇语境知识做题的能力较差,而只是注重了词汇、语法等较低层次的知识训练。这种对较低层次能力考察的题型一般是单项填空之类的题型,而要想考察到较高层次能力的考点,只有完形填空之类的有语篇的题型才能做到。但是,如果我们对市场上大量的完形填空试题进行分析的话,就会发现:绝大多数试题的考点都属于低层次,超出句子层次达到语篇层次的题目很少,或一道也没有。如果拿这些考试的结果作因素分析,很可能会发现单项填空试题和完形填空试题考察的是同样的因素。也就是说,完全可以把完形填空试题拆开来成为一句一句的单项填空试题。这就使得完形填空的语篇语境完全失去了存在的意义,也就丧失了完形填空试题特有的效度。

因此,完形填空就要与单项填空的考点区别开来,应当充分利用其有语篇语境的优点,不仅考查句子或句子以下层次的考点,还要有相当量的题目考察语篇层次的考点。尽量提高考点的层次,从而有效地控制完形填空试题的质量。

这样的高质量的试题可以引导学生更为注重综合英语水平能力的提高,不仅重视词汇语法知识,还更应着重培养语篇、语境、语义,甚至文化常识等综合知识,达到灵活运用,从而提高英语的综合水平。因此,从这个角度来讲,这样的高质量的试题对于从应试教育向素质教育的转型具有重大的意义。

[1] TAYLOR W L. Cloze procedure:a new tool for measuring readability[J].Journalism Quarterly,1953(30):415-433.

[2] 武尊民.英语测试的理论与实践[M].北京:外语教学与研究出版社,2002:115-126 .

[3] 李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,1997:250-260.

[4] BACHMAN L F, PALMER A.Language testing in practice[M]. Oxford and New York:Oxford University Press,1996.

[5] 徐强.交际法英语教学和考试评估[M].上海:上海外语教育出版社,2000:1-24.

(责任编辑:施建平)

A Validity Analysis of Cloze Test

GAO Yan
(Foreign Language College, Shanxi University, Taiyuan 030006, China)

Cloze test, as a type of language practice and testing in foreign language teaching and testing, has been widely used for its convenience and objectiveness. However, it does not have high qualities and high validity, which are mostly caused by the low validity of testing points in a cloze test. Therefore, this paper determines to design a cloze, based on the theory of validity of testing points proposed by Li Xiaojv, and pretests it on a group of students from a certain university. After that, it makes a detailed analysis of how to improve the validity of testing points of a close test in terms of its accuracy rate and the causes of losing scores.

cloze test;validity of testing points;pretest;accuracy

H319

A

1008-7931(2014)05-0082-03

2014-04-02

高 燕(1979—),女,山西晋中人,讲师,硕士,研究方向:应用语言学及英语语言测试研究。

猜你喜欢

效度考点正确率
考点展示
考点展台
不等式(组)考点大扫描
门诊分诊服务态度与正确率对护患关系的影响
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
统计常见考点追踪
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
被看重感指数在中国大学生中的构念效度