教育测量与评价:教育质量改革的风向标
2013-04-29白水
白水
教育测量与评价,由来已久。据《学记》记载,我国西周时期,就初步建立有一套系统的测量评价方法。隋炀帝时,我国开始实行了科举制,通过分科考试来选取人才。此举对世界文化有很大的影响,国外教育界都认为,教育测量与评价起源于我国古代的科举制度,只是由于我国封建制度的束缚,使得这门学科未得到应有的发展。
“教育测量”这一名词,最早是由被称为教育测量的鼻祖的美国心理学家桑戴克在1904年提出来的,但作为一门学科,近半世纪才得到迅速的发展。这是因为,随着教育的不断发展,社会需要追究教育质量的优劣,教育本身需要提出办学确有成效的证据。同时随着计算机的普及,统计学、心理学的发展,这门学科也就得以不断发展且日趋成熟了。
教育测量与评价的演变及发展
教育测量起源于古老的考试制度。中国是最早创设考试的国家,可谓教育测量的发源地,但作为一门科学,教育测量学却是西方现代心理学、教育学、统计学等学科理论与实践结合的产物。
19世纪末20世纪初,随着实验心理学和心理测验理论的发展,欧美学者对教育测量的基本形式——学校教育考试进行了积极改革和研究。1909年,行为主义学习论首创者桑代克运用心理测验方法和统计学原理,编制了第一批标准化教育测验,使教育测量走上了科学化的道路。此后,美、英、法等国家的测验运动逐步兴盛,心理测验与教育测验相互影响,并在学校教育背景下不断融合。各种各样基于行为主义学习方式的测验或考试成为检测学生学业成绩、了解教学效果的有效工具。20世纪40年代前后,欧美等国家的一些测验理论专家开展了测验的统计数学模型研究,进一步丰富、完善了教育测量学科内容,并在20世纪50年代前后形成了经典测量理论体系。
测量,通常是指人们对客观事物进行某种数量化的測定。教育测量是对学生的学习能力、学业成绩、兴趣爱好、思想品德以及教育措施上许多问题的数量化的测定。
评价,是指判断某事物的价值或某行为是否值得做的过程。教育评价,是按照一定社会的教育性质、教育方针和政策所确定的教育目标,对所实施的各种教学活动的效果,完成教育任务的情况以及学生学习成绩和发展水平进行科学判断的过程。
由于教育测量的对象,多属于人的心理属性,如记忆能力、推理运算、思维能力等,故我们只能依据人的外显行为,比如通过学生对试题的反应和一些行为表现,运用推理、判断的方法来间接测量出他的知识水平、智力高低和品德好坏。因此,教育测量一般是间接测量。由于教育测量没有统一的量表,各科各次考试试题难易不同,评分标准不同,使得教育测量的度量单位是相对的。但是教育质量客观上确有优劣之分,这种明显的差异完全可以予以数量化。美国测量学家桑戴克与麦柯尔指出:“凡存在的东西都有数量。”“凡有数量的东西都可以测量。”因此,教育测量是可行的。
教育测量的目的在于了解学生的发展变化及其影响因素,为教育评价和教育决策提供依据。学习方式是影响学生发展的主要因素之一。学习方式的演变不断推动着教育内容、教育方式以及教育结果测量范式的改变。可以说,任何教育测量及评价都是基于“学习”概念的理解。教育测量理论作为教育测量的原理和法则,其发展以及在教育活动中的应用,也受到学习方式变革的影响。
进入2l世纪以来,随着学习观念的进一步深化发展,学习概念的各个方面都发生了深刻变化;学习与自然因素、社会环境因素更加密切地交融在一起,影响学习的因素日趋多样化、复杂化。承载学习活动的学习方式亦由具体的单维形式演变成了抽象的多维系统,学习者在学习中的自觉主动性、独立体验性、交互合作性及探索创造性得以充分展现和提升,“学到什么”渐渐在学习的本质中被淡化,“如何学习”、“学会学习”则逐步凸现而成为其核心。学生学习水平的表达已不是某种单维的表征性结果,而成为了一种映射学习主体价值、学习过程与方法以及各种“内在外在”影响因子的多维度、整合性“成就空间”。要实现这种“成就空间”的衡量和解释,至今为止的任何一种测量理论和方法都是无法胜任的,因此,测量理论的发展也必然进入一个多维化、整合化时期。
国外教育质量监测发展
在美国,20世纪90年代以来,为了提高中小学教育的质量,国家在制定全国和各州的课程标准、改善评价体系方面进行了许多改革尝试。美国国内将这种改革称为“基于标准的教育运动”。其中影响最大的是美国国家教育进展评估(简称NAEP),又称为国家教育报告卡,其首要目标是向美国公众报告学生的教育状况。2001年,美国推出“美国中小学教育法案”,即《不让一个孩子落伍》法案,得到了国会两党议员的高度认可。该法案确立了NAEP评估模式。
在日本,随着2l世纪教育改革特别是课程改革的力度不断加大,通过全国学力调查考试加强对中小学教育质量的监控,提高学生的学力水平,成为日本教育当局越来越重视的重要课题。虽然从上世纪80年代开始日本文部省已在全国开展了“教育课程实施状况调查”、“特定课题调查”等学力抽样调查,日本各地方教育部门也纷纷举办了地方性的学力考试,但这些抽样的或地方性的学力调查影响范围有限,缺乏统一的评估标准,难以全面掌握中小学生的总体学力水平。在这种背景下,日本从2007年起恢复了中断43年之久的全国学力调查,并将其制度化,以后每年都将举行这一调查。
20世纪末以来,澳大利亚加大了教育改革的力度。1989年,澳大利亚教育部召开了教育改革会议并发表赫巴特宣言,对教育权威者和学校提出要求:使学生达到较好的教育结果,并缩小学生学习结果间的差距。为了进一步提高学校教育质量,1999年澳大利亚发表阿得雷德宣言,重点指出学生发展和其学习结果的重要性。2007年,澳大利亚公布了一份综合性的全国学校改革计划——《澳大利亚学校教育的未来》,开始制订统一的全国学校教育框架,改革中小学课程,并对中小学的核心科目进行全国统一考试。从2008年起,澳大利亚所有3、5、7、9年级的学生,将参加全国读、写、算的统一考试。各州与地区当局还研究把全国考试扩展至其他年级和学科,而未来的考试将随机选择学生,而不是要求全体学生参加测试,以避免师生陷入应试教育的陷阱。
教育测量与评价的国内现状
在当前的教育改革中,关于“升学教育”与“素质教育”的讨论相当热烈。在中学教育中,为什么升学指挥棒如此之灵,其原因之一就是对学校和教师的教学的评价不科学。评价时,只看平均分、及格率、优分率、升学率的高低;而忽略了基础的差异、学习质量相对提高或降低的幅度、是否增加课时数等等因素。于是一些条件稍好的学校或教师,往往采取一些非常措施,不断地加课,不断地加大作业量,使学生节假日都不能休息。其结果造成了一种高分的假象,但学生进入高一级学校后不久,不少人又因学习方法呆板,成绩急剧下降。另一方面,更多的学校和教师的积极性却被挫伤,学生的学习积极性也大受影响。
改革开放以来,我国的教育测量与评价理论研究和实践也取得一定的进展。教育统计、教育测量、心理测量、教育评价等课程得到恢复和一定的重视。为了尽快缩短与国外的差距,我国有关部门采取“请进来”和“走出去”的办法,了解国外的科学发展动态,翻译与编写了一些教科書,以适应高校教学与科研的迫切需要。与此同时,在老一辈专家的带领下以及有关部门的支持下,国内一批教学与科研人员大力开展考试学、教育测量、心理测量、教育评估、教育评价、教育统计学的理论研究和实际工作;成立了全国性的教育统计与测量、心理测验、教育评价、考试学、人才测评等学术团体;促进我国教育测量、教育评价的理论研究与实际工作的发展,体现了“教育测量与评价”学科重要的社会价值和应用领域。
然而,从我国教育科学学科专业建设、学位点建设的实际情况来看,应该说,教育测量与评价的理论研究还不能适应我国教育实践的需要。许多人对教育测量与评价学科重要性的认识还不到位。特别在教育学科分类和有关学位专业目录中,找不到教育测量与评价学科的名称。这与国外的情况很不一致,值得人们深思。
教育测量与评价在教育改革中的角色定位
(一)反馈者
教育本身是一个系统。在教育系统中,学校、教师、学生、教育方案、课程、教材、教学训练、考试评价等都是这个系统的组成部分。显然,我们期待教育方案、课程、教学等都能给学生带来某种变化,但不是说所有的教育方案、课程、教学都同样有效地改变学生,也不是所有的学习者会按同样的方式发生变化或有同样的变化程度。因此,当我们根据教育目标和计划,把教育方案、课程、教学等因素(输入条件)作用于学生身上后,需参照教育目标和计划,对教育效果(输出)及其输入条件的妥当性予以测量评估、价值分析和判断。然后,把这一测量与评价过程所获得的信息反馈给教育者、学习者以及有关教育决策者,以便改进教育的策略与方案,更有效地达到教育目的。可以想见,在教育系统运转过程中,除了对教育效果(输出)要进行测量与评价外,还要针对影响教育效果的诸因素(输入)进行客观的分析和评价。教育测量与评价在教育系统中对实现教育目标起着十分重要的作用。
(二)助推器
学校教育考试制度和评价制度是教育制度的一个组成部分,但教育考试和教育评价具有很强的导向功能。俗话说,考试是根指挥棒,就是这个意思。但由于考试特别是像高考这样的关键性考试具有指挥棒的导向作用,因此,在升学竞争激烈、教育观念落后的情况下,“应试教育”倾向就会出现,教育就会偏离正确轨道,这对培养跨世纪人才和提高中华民族的整体素质来讲,显然是不利的。正是在这种教育与社会发展背景下,我国政府要求所有学校都要全面推进素质教育,并且启动了国家新一轮基础教育课程改革方案,把课程改革、教与学的方式改革以及考试评价制度改革等统筹起来。
(三)多棱镜
教育测量与评价对于教师来说是必不可少的。在教书育人过程中,教师需要作出一系列决策和判断,需要对学生的性格、能力、成就、态度、兴趣、潜能及发展等进行较全面的了解,这就需要采用教育测量与评价多种方法,以弥补教师非正式观察之不足。教育测量与评价的技术手段不再是唯一的书面考试,而是涉及到测量与非测量的一整套评价技术。测量与评价的内容,不再是应该牢记和不该死记硬背的内容,而是涉及更广泛的教育目标。既然学生的发展是生动活泼、多样性的,那么,测量与评价的方法及其结论也应当是丰富多彩、多样化的、个别化的;测量与评价的目的,不再局限于给学生分等级排名次,而是对学生的发展和潜能进行系统的调查,发现学生的优点与长处,指出学生的缺点与不足,更重要的是要促进学生确立信心,认识自己的相对优势与弱势,明确自己的努力方向。测量与评价的指导思想是为了创造适合学生发展的教育环境,而不仅仅是为了选拔适合精英教育的学生。因此,现代教育测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用。教育测量与评价的知识是教师必备的专业知识修养;评价学生的能力是教师职业能力的重要组成部分。在教育教学过程中,科学运用教育测量与评价的有关技术方法,是所有成功教学的基础。