教育测量与评价应实现科学化发展
2019-11-15雷观凤大理大学教育科学学院
■雷观凤/大理大学教育科学学院
教育测量,是针对教学效果或者针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。而教育评价正是是根据一定的标准,对教育事物或者现象的价值进行系统的调查,在获取足够多的资料事实(定性的和定量的)基础上,作出价值分析和价值判断的过程。教育测量与评价是是为了学生能力的发展,尤其是评定语文学习成绩而进行的测量活动。在应试教育指挥棒的影响下,现在的教育测量与评价成了选拔人才和评定学生成绩的专属大道,学生能力、知情意的发展退至教育边缘,素质教育的落实很多时候成了一句空话。下面将以某乡镇小学教育测量与评价事例来阐述当今教育测量与评价中出现的弊端。
某小学期中考试为了鼓励先进,给考试成绩优异的同学颁发奖状。某同学语文数学分别都只考了七十多分,折合成绩却是全班的第一名。少部分同学偏科现象严重,某一科目不及格,也被授予了学习之星称号。很显然,案例中的老师采取的是常模参照评价,评价并不科学,。从教育测量和评价的合理科学性上来考量,这种评价是极其片面的,持这种评价观念的教师乃至领导可能只关注班级中的所谓“优生”(其实也并非真的优秀)而忽略了教育当中的基本标准参照点和学生的潜力发展水平,有可能会给教育带来极大的负面效果。
在应试教育大环境的背景下很多学校进行着假素质教育,领导老师们特别重视学生的考试成绩,除了教师的单元考外,学校每月都会举行月考。从三年级起学校就会对年级进行分班,把年级前四十名左右的分在实验班,其他同学分在普通班(各普通班成绩相当)。学校会在期中和期末考试后根据学生的考试成绩表彰一批学生,表彰的方式是按学生语文数学英语三科成绩的总和(一二年级取语文数学两科成绩的总和),有学习之星(即三好学生)、卫生之星、纪律之星、进步之星等。每个班学习之星名额一般是6-8名,其他方面之星一般评1-2名。
从教育测量和评价的结果来看,学校领导和老师采取的是常模参照评价,只考虑学生在班级中的相对位置。从传统的标准参照方面来说,一般以60分为一个标准值,60分为合格,60-70分为一般,80-90分为良好,90分以上为优秀。按这种评价方式普通班被评为学习之星的同学甚至某科都不及格,因为这种评比只取班级学生总成绩靠前的前几名。仔细一考量不难发现,这种评价极具弊端,对于普通班的学生来说可能平均分不到七十分就能评为学习之星,更有甚者,偏科的学生某些科目甚至都没及格也能评为学习之星。 这样的表彰是否还有意义,这值得领导老师们深思。这种表彰似乎成了形式,为了表彰而表彰,树立起的榜样不具有典型的代表性。
另外对于进步之星评比的数量分配极不合理,评比方式很随意,并未明确规定是从学习上、劳动上还是纪律上,或者综合评选,教师往往凭自己的主观臆断。也就是说只有在老师面前有过“表现”的同学才有可能被评为进步之星。对于那些默默努力取得了进步却未被老师发现的同学而言,他们永远不可能被评上进步之星。所评选数量至少也让老师难以抉择,有时候甚至变得随意,只能默默的安慰自己下次再评选另外两个未被评上的同学。
这种只以班级常模作为参照而忽略了标准参照和学生潜力水平的个评价方式极大的限制住了测量的效用,评价流于形式“走得太远,以至于忘记了当时出发的原因”,原本的榜样激励作用根本不可能发挥到极致,更有甚至,可能在一定程度上会误导学生的正确学习观。评价者即学校的领导老师应结合标准参照评价,将学生的的表现与既定的教育目标或行为相比较,以评价他们在多大程度上达到该标准。
教师更应该结合潜力参照,将学生的实际水平与其自身潜力水平(潜力)相对比,以评价学生有无充分发挥自身潜力为出发点,正确认识学生的知识能力水平,进一步因材施教,让学生真正获得发展。简而言之,评价者应将三种测量与评价有机的结合起来,如有时间和经历最好将每次的测量和评价做成柱状图或者曲线图,让教师以及学生和家长都能客观合理的评判测量结果,真正发挥测量的实效。
从测量与评价在教学中的运用时机上来看,我上述案例所在学校形成性测量、诊断性测量和终结性测量都实施,但这并不意味着教育效果收效颇丰。由于测量后评价的一刀切,致使测量失去了其本身的功用。
形成性测量是在教学过程中实施的,相当于单元测验,目的本是教师借此获得教学过程中的连续性反馈,作为修正教学的参考。但是在实际的教育教学中,教师常常仅把测验结果作为判断学生掌握知识的第一手资料,有些老师会及时调整教学策略和进度,优秀教师甚至会针对学生个体差异因材施教,让学生真正得以发展。这种类型的评价功能可谓发挥了教育判断功能、改进教师教学功能和促进学生学习的功能。但也有的教师不按常规出牌,形成性测量结果一出来就忙着学生排名,个可谓除了简单的表扬批评别其他。有些老师甚至抱着“以分数论英雄”观念,将测量结果好的同学安排坐在教室前面,将测量结果差的同学安排坐在教室后面,每次测量后都不厌其烦的对学生进行座位调整。这种做法表面看似能让孩子形成了一种你追我赶的积极学习氛围,感觉有那么点公平的道理。从全面发展全体学生的角度来看,这中做法极大的挫伤了某些智力暂处于中等偏下孩子的自尊心,他们很努力却可能永远坐在教室的最后一排,成为成绩优异孩子嘲笑的对象。这种残酷的纯竞争思维不利于孩子心理的健康成长,也极大的曲解了教育的内涵--促进全体学生的全面发展。试想,万一孩子偏科,他是不是每次课前得换座位?滑稽!当然,并不是每个老师都会用这种极端的伪公平的方式,但凡有一个任课老师产生了这种分数至上的教学理念,对孩子的负面影响不言而喻。
诊断性评价在实际教学过程中似乎比较少运用,就是开学前的摸底考试也仅仅是为了分班而已,谈不上有什么实际效用。诊断性评价的使用还可以是对经常表现出学习困难的学生所做的评价,是对个人的问题及其原因进行诊断。针对学困生,大多数教师是比较忽略的,一来本身教学任务重,心有余而力不足,二来学困生的形成一般都跟家庭或多或少有联系,有这样那样的原因,本就不讨人喜欢,许多教师干脆直接把责任推给了家庭教育。这样诊断性测量极少使用,就算无形中测量了,教师也不能予以科学合理的评价,更别提评价后的改进工作的实施。
终结性测量是学校领导老师最注重的环节,这就好比到了秋天,大家都等着丰收累累硕果。果子结得怎样直接关系到教师的绩效以及学校的声誉。对测量的重视,并不意味着评价的科学与合理。考得好的班级教师自然受到表扬,排名末尾的教师自然脸上无光,采取的标准依然是常模参照,终结性评价一般以年级为参照点。领导会在年级内排名,排名靠前的班级,任课教师奖励性绩效自然就高。这种年级内学校排名的方式是片面的,名次总有高低,第一名未必就真的说明达到了教学目标,也不意味这收获到了肥硕的知识之果,这显然不能科学合理的了解到教育的实效。学校的声誉也与终结性测量结果息息相关,以县为单位,期末成绩考得好的学校,自然受到表彰,评比的方式还是常模参照,即以县为单位谁靠前,说明谁的教育质量佳。功效如前所述。
其实,教育测量与评价的功能不仅仅是教育判断功能,还有改进教师教学的功能、促进学生学习的功能、行驶教育管理的功能。但在实际的教学中后三种功能往往会被忽视或者淡化。
教育测量是为了了解学生的发展,尤其是为了评定学生的学习成绩而进行的测量活动;教育测量是关注学校的教与学双方共同作用的结果;教育测量关注学生的多方面的发展。而教育评价是指按照一定的评价标准和教育目标,利用测量和非测量的种种方法系统地搜集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并未为教育决策提供依据的过程。教育测量是教育评价的基础,教育评价是对测量结果的解释与运用。斯塔费尔比姆曾说:“评价最重要的意图不是为了证明,而是为了改进。”作为教育工作者,我们的理念决定了我们的行动,我们的行动决定了孩子们学习的未来。教育测量与评价是教育教学中的重要一环,采取合理的测量方式,科学的评价教育测量结果,将测量与评价的功效发挥到极致,教育才能成为真教育。