改革考试方法的探讨与设想
2014-04-29石新华
石新华
【摘要】 本文设想将学生考试试卷题型一律改为判断题、选择题,只需要学生完成涂题卡,再由机器读卡完成阅卷,即把人工阅卷改为机器阅卷,将老师从枯燥乏味的阅卷中解放出来.
【关键词】 传统试题;0-1试题;期望分数;候选答案;及格分数比例
一、引言
考试是对学生学习的一种检验.广义地说,考试是教育单位进行资格水平认定的一种手段.阅卷是纸答考试的必要环节.然而阅卷工作的枯燥乏味是所有一线教师都有切身体会的.笔答考试的题型大致有填空、选择、判断、计算、证明、作图等等,那么枯燥乏味主要来自计算题,尤其证明题.但是长期以来人们始终认为填空、选择、判断不能取代计算题和证明题.本文拟将计算题分解成若干小题,并用选择题取而代之,作为一种尝试展开讨论,以辨明真伪.
二、设想和论证
我国大学四六级英语考试早已采取100%的选择题型,国际上的TOEFL、GRE等英语水平考试已经实现了标准化试题.并且实现了计算机阅卷,替代了人工阅卷,使阅卷人从枯燥、乏味的劳动中解放出来,避免了久坐导致对腰椎、颈椎和眼睛的伤害.
传统的数学试题题型有填空题、选择题(其中包括单选和多选)、判断题、计算题(包括少量的作图)、证明题.仅从阅卷的角度,前三种题型是简单而轻松的,尤其是选择题和判断题.
选择题与判断题的本质是一样的,单项选择题是给出的四个答案,其中只有一个是正确的,要求指出正确的答案;判断题是只给出一个答案,该答案可能正确,可能错误,要求指出正确的答案.
很难比较这两种题型本身的难易程度,即解决这两种题型的困难程度,并不取决于题目给出候选四个答案,还是给出候选的两个答案,而在于:(1)题中所给的错误答案与正确答案的相似程度;(2)考生对概念理解的透彻程度和计算的准确程度.
从这种意义上来说,这两种题型都是值得推崇的,并且考生所作出的结论的真伪性是确定的,而不是模糊的,传统题型的结论具有模糊性.例如.一题满分10分,那么考生可能得分0分或10分,也可能得2分、5分或8分等;而选择判断题型,考生得分只有两种情况0分或满分,不可能有第三种结果,我们暂且将选择判断题型称之为0-1题型,我们说它具有确定性,是指考生答题的结果属于真或不属于真,二者必居其一.若广义而言,答题的结果对于真的隶属程度为0或100%,不存在0,1之间的数字,对于这种0,1状态的事物的判断和处理,不仅计算机、电子技术可以大展拳脚,人脑处理起来亦得心应手.
我们可将传统题型和0-1题型作一比较和分析,以窥其利弊.
一个要求考生作出结论并完成计算过程的题目,考生在试卷上面的书写可能五花八门,恐怕远远超出A,B,C,D四种候选答案,由此带来阅卷的艰巨性.
有人说,考生可能会受到给出的A,B,C,D四种候选答案的诱导,因而较容易地选中正确答案.然而,实践告诉我们,在传统题型与0-1题型混杂的试卷中,选择题的得分率并不显著高于计算和证明,它应当取决于出题的技巧,取决于我们对考生会犯各种各样错误的估计、了解或推断,取决于我们对人的思维规律和认识规律的掌握.
我们不否认正确答案对学生的诱导作用,同时也应当看到那些似是而非的错误答案,迎合了部分学生的错误思维、错误理解的假答案,同样对考生有诱导作用,概念稍一模糊,计算存在漏洞,使学生难以防范,而坠入“陷阱”.
另一方面,仅就适合改成选择题的计算题而言,“制造”一道计算题一挥而就,而需要两个以上的选择题才能取代它,而每一个选择题都需要“编造”三个以上(一般为四个)候选答案,除去一个正确答案外,倘若那些错误答案确实反映了考生的错误概念、错误理解、错误思维,那么这就是一道好的选择题.假答案的错误性应当具有隐蔽性,即迎合了考生的错误,便是选择题的成功.
从组织考试的角度来看,(1)0-1型试题比传统试题的出题难度要大,而工作量的加大也是显而易见的.但出题的工作总可以远远先于考试日期进行,题库是一个非常好的模式.为保证试题内容的严密性,避免过早确定试题内容,可临时从题库中调题,组成试卷.(2)使用0-1型试卷,即使尚未实现计算机化而组织人工阅卷可较大地提高工作效率.因为阅卷人既不需要阅读考生根据不同的思路写出的证明过程,思考各种不同的证明方法,也不需要逐一阅读烦琐的计算过程,选中答案得分,未选中不得分,一目了然.(3)由于真伪界限分明,既可以避免由于阅卷人的疲劳、疏忽而产生的误差,也可以避免人为的误差,使卷面成绩臻于公正.我们不仅承认,而且认可,不同的阅卷人对于同一道计算题或证明题所给分数之间的1至2的误差,并且为此耗费了许多的时间和精力.
对此每一个做教师的人都有不同程度的体会,不论是高考阅卷,还是期末阅卷都足以使人烦腻.从这个角度看0-1试卷是值得推崇的.
三、试题举例
如何排除顾此失彼的忧虑呢?仅举一例,便可看出我们和读者的共同忧虑.我们知道计算题(暂且不说证明题)是用来测试学生的计算能力,那么0-1试题能否替代这种功能?
请看计算题:
四、分数的变化
约定:x为试卷总分,n为候选答案的个数,r为及格分数比例,A为及格分数.
一般来说,x的取值范围:100≤x∈ Z ;n的取值范围:2≤n∈ Z ;r的取值范围需要进一步讨论;A的表达式为A=A(r,n,x).
让我们看一下0-1型试题卷面总分与及格分数的变化.
假设0-1型试题的候选答案是四个,对于一个什么都不懂的考生,答对一个题的概率是25%,而传统试题他得0分的概率几乎是100%,可以根据0-1型试题的这个特点,认为考生完成0-1型试题比完成传统试题容易达到及格,这是一种误解.鉴于这种原因,我们可以适当地提高0-1试题及格的标准,即满分是100分的试卷的及格分数要高于60分.
面对全部由候选答案是四个的单选题组成的试卷,既然一个最差的考生的期望分数都不低于25分,那么索性将25分视为0分,如果试卷满分仍然是100分的话,那么在25分和100分之间只剩下75分的距离,而75分的60%恰为45分,再加上那个被视为0分的25分,可得到70分.因此我们可以将70分定为及格分数,即
(100-25)×60%+25=70.
将70分定为及格的标准是根据考生应该完成而且能够完成的最高分数的60%的原理.当一个考生正确地完成了试卷规定的全部题目即可得到总分(满分),如果考生完成了这个总分的60%,我们就认定为及格.
一般地,设x为卷面总分,则及格分数应为
(x-0.25x)× 60%-0.25x =0.7x.
这是传统的及格分数的标准.其实及格分数在总分中占的比例也是人为规定的,“60”并不是神秘的数字,根据出题人的意图完全可以改变这个比例.譬如,在不扣除随机分数的情况下,设想将其定为65%或70%等等,具体数字分析见表(一).