APP下载

标准分原理在英语教学实际数据分析中的应用

2011-12-31牛园园

考试周刊 2011年11期

  摘 要: 目前世界上主要施行两种分数制度,即原始分制度和标准分制度。在各种考试中,我们习惯采用各种原始分累计为原始总分,按原始总分进行排名。这种方法从数字的大小看好像是合理的,但是认真分析就可以发现问题。比如,有甲乙两名学生,6门考试学科中有4门成绩相同,甲比乙的英语口语成绩高10分,而乙比甲的英语写作成绩高11分。当用累计的原始总分进行排名时,乙优于甲。但从试卷分析上看,英语口语试卷难度很大,而英语写作试卷难度一般。如果按各学科的成绩分别排名,英语口语学科中甲优于乙数百名;而英语写作学科中乙仅优于甲十余名。很显然,比较甲、乙两人在全体考生中所处的地位,甲比乙优秀;但结果是乙优于甲。当我们使用原始分制度进行统计时,这类问题很容易出现;但如果采用标准分制度,就能很好地反映出甲乙两名学生的问题。因此相对于原始分制度来说,标准分制度更为合理。
  关键词: 原始分 标准分 原始分制度 标准分制度 实际数据分析
  
  一、原始分和标准分的概念
  1.什么叫原始分?
  所谓原始分是指在一次考试后,从试卷的卷面上直接得到的分数。原始分数,我们都非常熟悉,可是审视一下原始分制度就会发现其中有许多不足之处。
  (1)没有绝对的参照点。在教育测量(考试)中,难以找到学生成绩的绝对参照点。如某生英语口语80分,英语写作85分,很难找到这两科的绝对参照点,因而也就难以比较他哪科学得更好,很可能他的英语口语成绩处在班级前几名,而英语写作成绩刚达到班级的平均水平。但作为学习结果的考试,还是有一个参照点来反映学生掌握知识和学习能力的基点的,这个参照点就是零分。但零分并不是绝对的参照点,而是人为确定的,它只是个相对的参照点。
  (2)原始分数不具等值性(等距性)。一般的考试原始分数都是以一分为单位的,但这一分的意义在不同的科(次)考试中是不同的。同是一分,在试题难度小、分数偏高的学科中的价值较低;而在难度大、分数偏低的学科中的价值则较高。因此考生在同一次考试中相同的分数差异,并不能说明其能力差异相等;不同考生在两次考试中成绩提高幅度相同,也不能表明他们提高的能力相同。
  (3)具有不确定性。任何测量都有误差,而考试作为一种教育测量,有误差不可避免,也更难以控制。引起误差的主要原因有命题、考试过程中的环境、考试者的行为、被试者的动机及评分等环节。在原始分数制度下,任何一个环节出现误差都会影响分数的准确性,因此,原始分数只能是真实分数的最佳估计,而不是其确切的真实分数。
  (4)具有孤立性。单就某一原始分数而言,我们无法确切地解释被试的行为。如某生英语口语考试成绩为80分,仅凭这个孤立的分数我们无法得知该生的英语口语学习状况,即无法知道与其他同学相比,他的分数是高还是低,然而我们却习惯地认为80分表示学得不错。试想如果该生所在班平均分为90分,我们能作出这样的评价吗?
  从上面的分析我们可以看出原始分数有许多缺点,以原始分数来评价学生乃至老师是不公平也是不科学的,也表明实施标准化考试采用标准分记分的必要。
  2.什么叫标准分?
  在原始分的基础上,按一定的规则推导出来的分数即为导出分。其目的就是进一步解决原始分没有解决的问题,或者说,是为了更好、更科学地解释分数的含义,进行分数的组合,实现分数的等值化。导出分的种类有很多,最常用的是百分等级和标准分数。标准分是指通过原始分转化而得到的一种地位量数。也就是说,某一个原始分的标准分,代表了该原始分在所有考生的原始分中的地位。标准分实质上体现了原始分数的排队,考生因为原始分不同,而排在不同的位置上,标准分就是某考生原始分所排队位置的分数体现。因此,无论试题难或易,无论整体原始分偏高或偏低,整体标准分都没有什么变化。
  二、为什么要使用标准分
  根据教育统计学的原理,原始分转换成标准分的意义可以从下列比较中反映出来。
  1.单个标准分能反映考生成绩在全体考生成绩中的位置,而单个原始分则不能。
  例如某考生英语考试的原始成绩为85分,这无法说明其这科的成绩如何,因为这与试题的难度有关,与总体考生的分数有关。如果某考生该科的标准分为650,即Z分数为1.5,则通过查正态分布表,查得对应的百分比为0.93319,于是我们知道,该考生的成绩超过了93.319的考生的成绩,这就是分数解释的标准化。
  2.不同学科的原始分不可比,而不同学科的标准分是可比的。
  不同的学科,由于试题的难易程度不同,各学科的分数价值也就不同。例如某考生的英语口语原始成绩为80分,英语写作原始成绩为70分,从原始分看,其英语写作成绩优于英语成绩。但如果这次考试全体考生的英语口语原始分平均为86分,而英语写作原始分平均为60分,则该考生的英语口语成绩处于全体考生的平均水平之下,而英语写作成绩处于全体考生的平均水平之上,即该生的英语写作成绩实质上优于英语口语成绩。从标准分的角度来衡量,其英语口语标准分小于500分,而英语写作标准分大于500分。由于标准分代表了原始分在整体原始分中的位置,因此是可比的。
  3.不同学科的原始分不可加,而不同学科的标准分之间具有可加性。
  既然不同学科的原始分不可比,那么也就不可加。多学科成绩,只有在各科成绩的平均值相同、标准差也相同的条件下才能相加,否则是不科学的。各学科原始分的平均值及标准差一般都不相同,而各学科的标准分的平均值及标准差都基本相同,因此各科的标准分是可加的。
  三、标准分怎样计算
  根据教育统计学的原理,标准分Z是原始分与平均分的离差以标准差为单位的分数,用公式表示为:
  Z=X-X-/S
  上式中,X为原始分数,X-为原始分的平均数,S为原始分的标准差。
  Z分数是以一批分数的平均数作为参照点,以标准差作为单位表示距离的。它由正负号和绝对数值两部分组成,正负号说明原始分是大于还是小于平均数,绝对数值说明原始分距离平均分数的远近程度。一批分数全部转换成Z分数后,它们的整个分布形态并没有发生改变。Z分数准确地刻划了一个分数在一批分数中的相对位置,但是,由于Z分数有负值,常带有小数,不易被人理解和应用。因此人们在Z分数的基础上进一步转换,从而发展起了一系列其他形式的标准分。转换通式为:
  Z′=αZ+β
  在上式中,Z′为其他形式的标准分,α是转换方程的斜率,β是转换方程的截距。
  标准分有如下性质:
  1.平均值为0,标准差为1;
  2.分数之间等距,可以作加减运算;
  3.原始分转换为标准分是线性转换,不会改变原始分的分布形状,也不改变原来分数的位置次序。
  通过转换后得到的标准分Z在一般情况下都带小数,而且会出现负值,实际使用时不太方便,所以还要对Z分数进行线性变换(T变换):
  T=500+100Z
  这就是我们通常所说的标准分。这种标准分的平均值为500,也就是说,如要某考生的标准分为500,则该生的成绩处于此次考试的中间位置。
  当然,这是在假定原始分呈正态分布的前提下进行的。如果原始分的分布不条例正态分布的要求,则要先进行正态化处理,再转换为标准分,转换后的数称为正态化标准分,这就是我们在成绩通知单上所见到的标准分数。
  四、原始分与标准分的数据比较分析
  下表为我院09级某班学生考试的成绩,从下表的统计中我们可以通过比较学生英语各科得分来得出其总分和总标准分,以及其最后的排名。
  
  通过比较分析,我们可以看到数名同学的总分排名和其标准分排名不同,比如第0986241号同学的总分排名为第18名,但是如果按标准分排名的话,其排名实际应为15名。由此可以看出,单纯的数门课程总分并不能完全真实地反映学生的总体真实水平。
  五、在实际数据分析中使用标准分的意义
  原始分与标准分相比存在着很大局限性:
  1.原始分制度没有反映考生成绩在考生团体中的位置。
  原始分没有参照点,因而没有可比性。学生在得知自己的考试成绩后,无法明确自己在全体考生中处于什么位置。从这个意义上说,原始分的含义不明确。
  2.不同科目或同一科目在不同层次考试之间分数可比性差。
  我们知道,原始分数往往受试题难度和区分度大小的影响。题目难原始分就偏低,题目易原始分就偏高。由于各学科每次考试难度不同,导致分数分布不同,原始分数的“1分”不等值,则出现反映同一水平的分数在两个考试中可能不同。
  3.原始分数不宜直接相加。
  在对考生考试成绩的分析过程中,我们一般是习惯性将其各科成绩相加,用得到的总分来评定考生水平。但不同的学科试卷难易程度不同,试卷易的学科考生得分高,试卷难的学科考生得分低,因此试卷难易不同的学科的分数价值不同。原始分的合成不能反映各科分数的分值,原始分不具备可加性。要进行各科考试分数的合成和比较,就必须把原始分转化为标准分,使各科标准差之间及平均数之间恒定且各科分值相同,这样才能使各科成绩的总分趋于科学、合理。
  4.在教育评价时,常提供不客观、不准确的信息。
  由于原始分存在以上种种局限性,因此在教育评价的时候,常常不能准确地提供客观信息。
  因此,在实际的课程考试中我们应该采用标准分计分。采用标准分后,可以消除原始分的不可比性问题,使各门课程间有一个统一的比较标准,给课程考试带来有利性和科学性。然而由于标准分应用的复杂性,要全面推广标准分还有一定的困难。因此我们要广泛宣传、大力推广,让大家更多了解标准分的意义和作用,争取早日在课程考试中实现标准分评价。
  
  参考文献:
  [1]孙国耀,黄迺本.用标准分评定考试成绩[J].中山大学学报论丛,2004,(5).
  [2]王进忠.标准分及其应用[J].教学与管理,2001,(1).
  [3]黄光扬.教育测量与评价[M].上海:华东师范大学出版社,2002.
  [4]卢纹岱.统计分析[M].北京:电子工业出版社,2000.
  [5]李琳,石伟,黄玲娟,唐利强.在高等院校课程考试中采用标准分的探讨[J].湘潭师范学院学报,2005,(3).