APP下载

评分员如何提高四六级英语作文评卷质量

2018-11-09鹿军红

科教导刊 2018年26期
关键词:英语作文

鹿军红

摘 要 大学英语四六级考试的作文评卷采用网上阅卷的方式,评分员已经成为影响网上阅卷质量的重要因素之一。本文介绍了四六级英语作文的阅卷流程,分析了几种常见类型作文的评阅方法,最后对相关的统计参数做了分析,以此供评分员及改卷机构参考,从而提高英语作文的阅卷质量,提高考试的公正性和准确性。

关键词 评分员 英语作文 评卷质量

中图分类号:G642.475 文献标识码:A DOI:10.16400/j.cnki.kjdkz.2018.09.022

Abstract The essay marking of the CET-4 is based on online scoring. The scorer has become one of the important factors affecting the quality of online scoring. This paper introduces the scoring process of four or six English essays, analyzes the evaluation methods of several common types of essays, and finally analyzes the relevant statistical parameters for reference by scorers and reorganization institutions, thus improving the scribble of English composition quality; improve the fairness and accuracy of the exam.

Keywords scorer; English essays; quality of assessment

目前,在全国大学英语四六考试中,英语作文的评阅采用网上阅卷的方式,评分员则采用整体式评分法(Global Scoring)对英语作文进行评阅。由于评分员对评分标准把握不一,严厉与宽松程度不同,同时受到语言能力、欣赏习惯、心态情绪等主观因素的影响,导致评分结果产生差异,有时同一篇作文,不同的阅卷员给出的分数相差很大。一些评分员主观随意性太大,一些评分员评卷经验不足,或评卷态度不认真,都会造成准确性不高,评卷质量差。提高阅卷员英语作文评卷质量对于保证考试的公正性和准确性,提高考试的信度至关重要。笔者多次参加大学英语四六级考试作文的评卷工作,本文通过笔者的体会对这一问题加以研究。

1 阅卷流程

从阅卷流程来看,首先选拔认真负责的英语教师参加阅卷,然后进行相关培训。考试组织方提供评分标准及样卷,样卷的评分量表分为1~3、4~6、7~9、10~12、13~15 分,共五档,每档中有三个分值。

阅卷教师先学习评分标准,分析评分样卷,试评后开始进入正评。评分员根据评分标准,对照样卷进行评分,如果认为与某一档样卷相似,则定为该分数档,若认为稍优或略于该分数则可加一分或减一分。打分采取整体式评分方法(global scoring),亦被称作“印象评分法”,即评分员根据阅后的总体印象打分,而不是按语言点的错误数目扣分。

阅卷系统采用计算機辅助阅卷方式,打分数据能够通过计算机进行快速统计分析。主要统计指标有:相关系数(R)、均分(Avg)、离散(Std)、主客比(P)、速度(Speed)、综合(Integration)等。这些数据不仅能够为考试机构进行质量监控提供支撑,也便于评分员进行自我检测和修正。

2 评阅方法

2.1 分档

改好作文最关键的是划分好档次,要对评分样卷(Range-finders)认真学习领会,了解掌握每个档次作文的基本特征,例如最高分档就要求表达思想清楚,文字连贯通顺,基本没有语言错误,我们称此类作文“漂漂亮亮”。次高档的作文略差,有少量的语言错误,我们称作“明明白白”。中档作文表达思想不够清楚,文字勉强连贯,但总体还说得过去,我们称“马马虎虎”。到了5分档的作文就有些“稀里糊涂”,表达不清,语言错误严重。最低档作文几乎没有一句完整的句子,语言支离破碎,简直是“一塌糊涂”。

评分标准的表述是原则性的,评卷员在实际评阅的过程中,所遇到的作文是五花八门,千差万别,需要在短时间内判断出一篇作文的真实水平,要从各个方面进行甄别、权衡,这往往需要大量的实践。一般而言,新阅卷员由于评卷经验不足,往往片面地看待一篇作文,打分不够准确,造成脱档或跨档。

看到一篇作文,我们通常从这样几个方面进行考量:(1)思想内容:切题还是偏题;(2)流畅程度;(3)句子结构;(4)语法正确;(5)词汇短语。

评卷员应该从这些方面进行综合判断,给出一个总体印象分。经验丰富的评分员往往使用一项以上的标准作为打分依据,而新评分员往往对其中某一项给予突出的重视,对作文的水平做出片面的判断,出现打分的偏差。作文多种多样,以下我们仅就几种常见类型的作文做一些分析。

2.2 几种常见类型的作文分析

(1)高分作文。句式表达灵活多样,读来自然流畅。能够使用连接词以及替代、省略、照应等方式增强句子间的衔接和全文的连贯。能正确使用一些高级词汇。

(2)有些作文很通顺,语法错误少,但句式简单,用词简单。这类作文应属中档,说明考生没有驾驭复杂句式的能力,对高级词汇掌握不够。有的考生试图使用一些复杂的句子结构,但组织不够恰当而显得有些混乱。

(3)有些作文语法错误多,连贯性差,却使用了一些高级词汇。这说明了此类学生词汇量较大,阅读能力可能较好,可给予中档评分。还有一些学生试图使用一些高级词汇,但一用就错,要么用法错误,要么拼写错误,此类作文不能归于高档作文。

(4)有严重的语法错误或拼写错误的作文。有的老师一看到作文中有严重的语法错误或拼写错误就难以容忍,给予极低的分数。这时应该看看文中有无完整的句子,是否真得在表达一些思想,分数能否再高一些。好作文多看错误,从高分酌减;差作文多看优点,从低分酌加。

(5)套卷。有些学生死记一些句子或模板进行套用,还有些同学把考试指令中给出的词汇反复套用,有时简直是生搬硬套。批改这类作文的要点是:特别注意学生临场所写的几句话,这几句话往往反映出他的真实水平。

(6)笔迹潦草。一些学生书写太过潦草,写得“龙飞凤舞”,难以识别。遇到这类试卷,不要随意给予低分,要有耐心去认真辨识,看出其真实水平,说不定还是一份好卷。相反,书写得工工整整,也不要被此所迷惑,误给了高分。

在实际阅卷的过程中,评卷员一定要对一篇作文作多角度的判断权衡,掌握各个档次作文的特征,不断地总结经验,练就一双“火眼金睛”,成为一名优秀的阅卷员。

3 相关参数分析

计算机辅助阅卷可以即时提供统计数据,这样能够对评分员的打分数据及质量进行有效的监控,评分员也应该根据这些反馈数据,及时修正偏差,努力提高自己的各项评分指标。以下对这些统计参数做一分析:

3.1 相关系数(R)

相关系数R的取值范围是-1≤R≤+1,R的绝对值越大,相关程度越高,这里是指客观分与作文分的相关性。由于客观成绩已经由机器改出,一般而言,学生的客观成绩高,作文得分也应与之相应,两者呈正相关关系。因此相关系数高的阅卷员评卷的准确性就高。R值是衡量评卷质量的首要指标。

提高R值的关键首先在于以认真的态度准确评好每篇作文。实际上,评分过程是一个根据评分要求对学生作文按照优劣进行“排队”的过程,如果好作文给了低分而差作文却给了高分,排序反了,则系数会迅速下降。其次,要敢于给出高分作文。把握高分作文的特征,敏锐地发现高分作文,如果学生的客观成绩也很高,这时的系数就会很快上升。另外,打分标准要统一,如果早上一个标准,下午一个标准,或者今天一个标准,明天又变了,这样就会产生排序错乱,总体R值肯定不高。

3.2 主客比(P)

对一份试卷而言,由于客观分已由机器评出,客观分除以作文分就是主客比。个人的主客比的平均数应与小组或阅卷点保持接近。对于一个小组而言,要想提高小组的R值,使每位成员P值保持同步是关键中的关键,因为大家拧成了一股绳,整个小组齐步走,步调一致,相关系数自然高涨。对整个阅卷点而言也同样如此。

3.3 离散度(Std)

离散度是评价评卷质量的第二个重要指标,离散值趋中为最好。离散过低,表明给分过于趋中,没有拉开档次,该给高分的没有给上去,该给1分的却给了2或3分。在各类考试中,作文评分容易出现趋中倾向,有时因为时间紧、任务重,为赶速度,评卷员会给一个平均分附近的分数,所谓打‘保险分,这样就会造成离散度过低。

如果离散值低,打开离散的关键是:敢于给出高分作文,一定要敏锐地发现高分作文,试想一个作文本来能得13分,你却给了10分,这样就把好学生给亏了。

如果離散值过大则正好相反,是因为本来不够好的作文却给了高分,高分区和低分区太多,降低的方法也正好相反。

3.4 均分(Avg)

个人的均分应该和小组或阅卷点的保持接近。过高表明改卷过于宽松;过低则表明过于严厉。小组成员之间均分保持接近,同主客比一样,对于小组整体的相关系数的提高非常重要,因为大家步调一致,整体作文的排序不会错乱。

3.5 速度(Speed)

一般阅卷点对阅卷老师有时间上的要求,如每份试卷的阅卷时间平均不低于60秒。有的老师评卷过慢,给分犹豫不决,摇摆不定,要知道评得慢不一定评得准,掌握每个档次作文的基本特征才能评得既快又准。当然一扫而过的不负责任的过快阅卷,也是不可取的。

3.6 综合(Integration)

综合指数是以上各个指标的综合,其中相关系数占比最大(50%),其次为离散度占30%,其余占20%。综合指数反映出一个阅卷员的整体评卷质量,要提高综合指数就要提高各个分项的质量。

3.7 分布图(Distribution Graph)

改卷软件中还会提供个人的评分分布图,分布图反映了评卷分数的分布构成,分数构成应服从正态分布,图形最好是一条呈钟形的平滑曲线。有的评卷员的分布图呈锯齿状,如10分多于9分。有的呈火箭形,如6分给得太多,突出向上,这些都是不好的打分习惯造成的。分布图反映出一位评分员的打分习惯,组长应帮助组员及时分析,使组员了解并纠正自己不好的打分习惯。

4 小结

阅卷员应本着为每位考生负责的态度认真阅好每篇作文,努力做到客观公正,同时也要不断总结改卷经验,提高阅卷的准确性和可信度。组长或阅卷点也应根据统计数据对阅卷员进行监督指导,及时纠正阅卷中的偏差。阅卷点也应该加强评分员培训管理工作,培养出一批优秀的阅卷员,建立一支稳定,经验丰富,专业能力强的评分员队伍,这样,才能充分保证评卷质量,使考生得到准确公正的分数。

参考文献

[1] 李清华,孔文.外语写作测试评分研究综述[J].外语测试与教学,2011.4.

[2] 陈建林.大规模英语考试作文评分标准效度验证[J].中国考试,2016.1.

[3] 陆远.写作测试公正性研究——作文评分员偏颇研究综述[J].外语测试与教学,2011.4.

猜你喜欢

英语作文
英专和非英专学生英语作文中的错误的对比研究
提高高中生英语写作能力之我见
巧用多媒体,提高教学效率
高三第二轮复习英语作文专项的针对性训练
浅谈初中英语写作教学
浅谈初中英语作文课程与任务型教学模式
中外大学生英语词汇学习的语料库研究