浅析提高英文写作测试的效度与信度方法
2016-10-21刘铭
刘铭
【摘 要】学习外语的目的主要是为了更好地交流,写作测试作为一种综合性测试,不仅可以从词汇、语法、用法等语言基本要素上测试学生,还能测试出学生的逻辑推理能力、语言表达能力、信息分析能力,以及对文体的掌握能力等等。然而,尽管写作测试具有如此多的优点,却因为写作测试的评分不客观,造成信度较低,且不经济,所以写作测试仍被许多人提出异议。因此,提高写作测试的信度显得十分必要,本文从题目设计与评分阅卷两个角度出发,对提高写作测试的信度提供了可供借鉴的方法。
【关键词】写作测试;效度;信度;题目设计;评分阅卷
一、效度与信度
效度(validity),即有效性,是指测量工具或手段能够准确测出所需测量的事物的程度。也就是说,效度是用来评价测量结果与测试者想考查的内容相吻合的程度,二者成正比,測量结果与要考查的内容越吻合,效度越大;反之,则效度越低。写作测试的主要测试方法是让被测试者写一篇文章,它最大的优点是效度高。因为写作测试作为一种综合性测试,不仅考查被测试者的输出性技能(productive skill),即产出性技巧,学生利用自己所掌握的知识所生产出来的产品,还能考查他们的接收性技能(receptive skills),即学生已经掌握的知识内容以及能掌握的知识范围;再者,写作测试能同时测试语言的各个层次和范畴,不仅能测试被测试者的语法、用法和语法等外语语言学习者必须掌握的要素,还能测试出他们的语言表达能力、逻辑推理能力、语体掌握能力以及分析组织能力。一场考试只有测试出了测试者打算测试的内容,才是一场有效的考试。在许多入学考试,诸如研究生入学考试中,一篇作文就足以看出被测试者的语言运用能力,其效度要比多项选择题高得多。
信度(reliability),即可信度,是指测验结果的稳定性、可靠性和一致性,也就是说在测量信度时,要保持变量的唯一性,以检测出这一测试的可靠程度。受主观因素及外界因素影响越大,信度越低;反之,信度越高。作文测试作为一种主观测试,不论从题目设计还是阅卷评分的层面,都无法客观化,加之被测试者可以回避自己的弱势,这也就造成了写作测试信度较低的局面,以至许多测试将写作测试排除在外。比如,对同一篇作文的评分,十个阅卷老师因各自评分标准的差异,就有可能造成他们十个截然不同的分数。再者,评阅老师在评分过程中也经常受外界因素的影响,如,在一些大型考试中,阅卷老师被要求一天至少要评阅上百份试卷,此时,阅卷老师打出的分数更加没有信度可言。通常说来,有效度一定有信度,而有信度不一定有效度。而在写作测试中,因其是主管测试,故存在着较大争议。为了解决这一问题,测试者需要从题目设计与阅卷评分等方面来思考。
二、题目设计
写作测试分多种测试方式,如:单句写作、组句成章、有指导的写作以及文体测试。单句写作属于外语学习的第一阶段,在一定程度上测试语法、句型和词汇。单句测试可以最大程度提高写作测试的信度,因为它能测出让被测试者写一篇文章无法测试出来的问题,即被测试者无法回避自己没掌握的语法、词汇及句法等,单句测试还属于客观性测试,方便阅卷的客观性和方便性。为了提高可信度,在一些测试中测试者可以采用如例1中A句排列句子顺序,主要考查语法结构;B句用括号内词语的正确形式填空,主要考查词汇;C句改写成否定式,主要考查句法,D句填写划线句子,考查逻辑思维能力:
例一:
A. for, solve, to, you, is, it, impossible, the, question
B. ______, he passed the exam. (luck)
C. He must have been there.
D. He was late for school, because __________________.
单句写作只是外语学习的初级阶段,学习者还需要组句成章,即将信息的次序进行排列,使文章行文自然,符合逻辑。为了提高信度,降低阅卷难度和经济消耗,测试者在设计题目时,可以给出选项,如例二可以直接让被测试者写出答案EDCAFB,也可以提供选项A.EDCFBA B.CAFBDE C.FECBAD D.EDCAFB:
例二:
A. For its sake, we are willing to sacrifice everything, clean air, pure water, good food, our health and the future of our children.
B. But as our technological achievements have grown in the last twenty, so pollution has become a serious problem.
C. We make “increasing industrialization” our chief aim.
D. The fact is that pollution is caused by man---by his desire for a modern way of life.
E. What can explain and solve this problem?
F. There is a constant flow of people from the country into the city, eager for the benefits of modern society.
组句成章还可以采用例三的测试方法,选择三道四篇内容相同,难度相当的文章,把每篇的第一句放在第一组,第二句放在第二组,一次类推,让考生从每一组中选出一个句子,组成一篇文章,这样有利于考查考生的逻辑思维能力。
三、评分阅卷
写作测试的评定方法有机械法、印象法和分析法,每一种方法的采用都要根据题目设计的实际来选择。机械法,也叫计算错误发,是指数出文章中的错误,按数目扣分,该方法的评分标准容易被掌握,但是却忽视了写作自身的优势,只注意到文章本身的语法、词汇及句法等错误点,却忽视了文章的逻辑与作者的思想表达。印象法是指评卷人根据自己对文章的总体印象给文章打一个总分,因为结果容易受到各种个人因素的影响,那么评分人能否一致的理解和掌握评分标准,是提高评分信度的关键。分析法是指阅卷人将作文分解成若干部分,按照一定标准,对每一部分进行评分,最后给出总分,为了提高信度,这就要求每一个评分员在评分前就有统一的标准。
参考文献:
[1]蔡基刚,汪中平,英语网考的写作效度和信度研究[J],外语界(3期),2009.
[2]冯瑞龙,朱宇,从写作测验信度研究看开放式测评的发展趋势——概化理论的视角[J],海外华文教育(2期),2014.2.