关于高校讲课竞赛评审机制的思考
2012-04-29徐翠霞樊小东
徐翠霞 樊小东
摘要:本文由“青年教师讲课竞赛”中5位评委对10位选手的一组评分数据引发对高校讲课竞赛评审机制的思考,分析评委评分的严厉程度、一致性程度,说明评委是否为合格的评委;评委筛选后的统计结果与未筛选结果不一致,说明不合格评委的评分影响选手的最终结果。在高校的各类竞赛中,一般不会对评委的评分质疑,竞赛组织者先要考量评委的评分能力再作统计,才能使选手得到公平、公正的成绩。
关键词:高校;讲课;评审机制
中图分类号:G640文献标识码:A 文章编号:1002-4107(2012)08-0052-03
教学是基础,《国家中长期教育改革和发展规划纲要(2010—2020年)》在第七章高等教育的发展任务中明确提出“全面提高高等教育质量”和“提高人才培养质量”的目标,“把教学作为教师考核的首要内容”;为了进一步深化本科教育教学改革,提高本科教育教学质量,大力提升人才培养水平,教育部、财政部决定在“十二五”期间继续实施“高等学校本科教学质量与教学改革工程”。为了探寻培养教师教学能力的有效措施,不少学校开展教师讲课竞赛、师范生说课竞赛等,特别是青年教师,他们站在高校教学的前线,他们的教学质量影响学校的发展,所以学校往往以开展青年教师讲课竞赛的方式来强化他们的教学基本功训练,提升其教学水平。教师在进行讲课比赛时可以互相交流教学经验与体会,从而集思广益、取长补短,优化课堂教学,推动教学改革。但是,在竞赛评审过程中发现存在一些问题。本文是笔者由某届“青年教师讲课竞赛”中5位评委对10位选手的一组评分数据(见表1)引发对高校讲课竞赛评审机制的思考。该教学竞赛的评分由几部分组成,因为最终结果选取的是总分,所以本研究以每位评委给每位选手打的总分为研究对象,满分为100分。
由于讲课竞赛的评价主体由多位评委组成,各个评委对选手的评价和排名并不完全一致,有时甚至大相径庭,造成这种差异的原因,既可能与评委的客观评价能力有关,也可能与评委的主观评判公正性有关[1]。但是组织竞赛的单位在邀请评委时都是凭借主观判断,没有实质性的客观评判条件,一般选择的条件是评委本身是教学能手,对课堂教学有一定的了解,基本不会考虑评委的打分能力。所以竞赛评委的评价质量直接影响到赛事的成败,面对一组数据,统计员只是把有限的评委评分加加减减,定量地评定青年教师的讲课成绩,然后按分数排名选出获奖者。赛后,教师只能知道自己是否“中奖”,对于评委打分和评分统计方法一无所知。竞赛的结果只能说使教师对自己的教学水平有一定的了解,但不一定很客观。评审机制存在漏洞,因此,在竞赛组织过程中对评委的评价行为本身进行元评价,考量其评价质量,进而发现问题并进行调控,是一个非常必要的研究课题。
从广义上讲,教师讲课竞赛评委评价行为的规范性及其评价质量的高低可以从多个侧面进行考量,可以从以下几个方面考虑。
一、评委评分的严厉程度
对评委的评分进行描述性统计,获取5位评委的标准差和全距,标准差越小,表示评委间的评分差距越小,数据较集中,从全距(最高分—最低分)可进一步看出,评委的全距越大评分跨度越大,区分度越高。如评委4的标准差最大为6.71317,他的全距为23,说明该评委能清楚地区分选手的讲课能力等级,高分与低分相差大,评分相对其他评委比较严厉。而评委5的标准差最小,只有3.32666,是5位评委中最低的,全距10也是最小的,表1中的原始数据打分最不严厉,也可以看出他的评分分数普遍偏高,最高分是98,最低分为88,最高分和最低分都是5位评委中最高的和最低的,打分最不严厉。
二、评委的一致性程度
评委的打分一致性是竞赛组织者考虑的一件事情,希望评委们的打分都能一致,好的都是高分,而不好的都是低分。每个人都存在感性的一面,评委在打分时,虽然有表格限定,每个项目有最高分和最低分的限制,但在每位评委心中都有一把单位距离不同的“理性尺子”,难以统一定量,有时还会受其他因素的影响,如第一印象、自身的教学观点等,所以每位评委对同一选手的讲课评分或起评分不能一致。虽然多位评委可以在一定程度上减小误差,甚至评委足够多时误差可以相互抵消,并且理想的状态是评委们的评分能够一致,由于现实因素,不可能有大量高水平评委同时一起打分。
采用经典测量理论,可以根据5位评委对10位选手讲课的打分,使用SPSS16.0 软件计算,求其两两之间的相关系数,相关系数越高,表明他们的评分一致性程度越高。从表3可以看出,只有评委5不能与其他4位评委的打分一致,不仅没有形成显著相关,而且形成负相关,意味着评委5与其他评委的意见相反,其他评委认为讲课不好的,得分低的,评委5会认为好,得分高;而其他评委认为好的相应地他打低分。其余4位任何两者之间至少是显著相关(p<0.05),p值越小,说明显著性水平越高,在这里显现为评委的评分一致性越高。从表4也可看出,评委1、评委2、评委3和评委4的表现非常出色,如果选用评委评分的算术平均分作为每一位选手的最终得分,他们各自的评分与选手讲课最终得分的斯皮尔曼相关系数都是显著相关(p<0.01),在这里可以看出评委5的评分能力存在问题,因为只有评委5与选手的最终得分不能一致,形成负相关为-.137,明显不能与其他评委形成一致观点。
三、评委的筛选
在教育系统中,讲课竞赛聘请的评委都是教学经验丰富的优秀教师,参考的只能是这些评委的教学能力和教学经验,但他们的评价讲课能力却没有等级评价或有一个公认、一致的标准。
在任何一项竞赛中,组织者都希望评委本着“公平、公正、公开”的准则执行,希望评委都能正确地评价每一位选手,打上“公平、公正”的分数。所以在实际操作中邀请评委时,除了要考虑其教学能力、对教学的认识和对课程的了解,还要考虑其评价能力的高低,排除不合格的评委,才能让竞赛更公平、更公正。
如果把5位评委对10位选手的讲课打分分别排序,然后统计每位评委打分排序为1—5位时的次数。为了使展示时一目了然,采用直方图表示(如图1—5),横坐标表示排序的位数(第1、2、3、4、5位),纵坐标表示评委的10个评分中在该位数的次数。理想的状态是评委的分数都集中在第3位,即中位数(如图6),从图中可以发现,评委5的评分分布最不合理,直方图耸立在数轴两边,中间如低谷,正好与理想状态相反,直接看出评委5的评分水平最差。而评委2在图中的分布靠近中位数,水平比较好,评委1和评委4的直方图很难看出水平高低。
这是表面观测,为了进一步鉴别评委的水平,采用“向中位数靠近程度”的量化方法。以评委1为例,根据图1,10个选手分数被排在第1位到第5位的次数如下。
1,3,2,3,1 。
被排在第1位的评分次数是1,第1位与第3位(中间位数)的位次之差是1-3=-2;类似地,被排在第2位的分数次数是3,第2位与第3位的位次之差是2-3=-1,依此类推,并把这些差数与相应的次数列出:-2(1),-1(3),0(2),1(3),2(1)。以P代表偏离中位数的程度,计算方式如下。
P1=(|-2|×1+|-1|×3+0×2+1×3+2×1)÷10 ÷2=
0.5
根据图2-5记录的数据,以类似的算法求出其余四位评委的偏离值。
P2=0.2 , P3=0.65 , P4=0.8 , P5=0.85
由此看出,P值越小越好,偏离中位数程度越小,水平越好。P=0说明是位顶尖高手,毫无偏心;P=1说明是位百分之百偏心的评委,或是水平极差。根据计算结果,5位评委的水平比较为P2<P1<P3<P4<P5,进一步说明评委2的评价水平是5位中最高的,而评委5是最差的。
四、统计方法的比较
从实用性考虑,往往采用算术平均分统计,也就是每位评委的评分重要性是一样的。但在很多统计方法中会采用去掉最高分和最低分,即去掉极端数据。比较两种方法,发现各位选手的讲课最终得分非常相关,相关系数是0.983,具体可见表5,只有第7名和第8名有变化,其他排名都一致,说明未去极端值和去掉极端值的评分方法几乎不影响选手的最终排名。
在统计结果前先筛选符合条件的数据,剔除“老好人”、打分随意的不合格评委的分数后再进行统计,发现评委筛选和未筛选结果有明显差别,具体见表6。前三甲中,第二名和第三名的位置发生变化,而在任何竞赛中前三甲是最受关注的,也是竞争最激烈的,所以前三甲的结果是最重要的,第八名和第九名也发生位置变化。
高校培养人才,教学是关键。学校举办教师讲课竞赛的目的是促进教学,使教师间进行教学交流,但组织者往往过于看重结果而忽视过程,重视对竞赛教师的评价而忽略对评委评价能力的评价。再看整个高校的评审机制,缺乏客观有效规范的操作模式,为了完善评审机制,应做到以下三点。
首先,在评委选择上要邀请评分跨度大的评委,避免“老好人”、过分严厉或者评分不符合一般规律的评委,他们的评分或者不能说明问题,或者影响竞赛者的真实成绩。
其次,在统计结果的过程中,要先对所有评委的评分进行分析,类似于对评委进行评分能力考核,发现有问题的评委要剔除后再统计。这些评委也要被打入“黑名单”,以免以后的竞赛浪费资源。
第三,有条件的话可以在评审前对评委评分进行培训,按照规范化操作,如监考等工作都会对监考教师进行考前培训。培训中举例说明每一个评分等级的细则,用实例辅助说明,让评委对打分有一个参照。
上述所讲的评委的严厉程度、一致性程度都能从某一方面说明评委是否为合格的评委。通过上述方法,希望对评委有个客观的评价,并能使竞赛的组织者更好地办好竞赛,选好评委,采用合理的统计方法,客观合理地评价每位参赛者。高校在办学过程中,为了加强管理,体现“公平、公正、公开”的原则,会发现涉及学生、教师、课程、专业、项目等各类评审评选,本文以“青年教师讲课竞赛”的一组评审数据为例,希望借此为评委的选择及结果的统计提供参考。
参考文献:
[1]丁福兴,牟艳杰.青年教师讲课竞赛决赛评委的元评价
研究[J].教育理论与实践,2010,(6).