教育评价的第三方化
2014-05-28张勇
张勇
2013年“两会”期间,全国政协副秘书长、民进中央副主席、中国教育学会副会长朱永新教授提交了《关于发展“第三方”教育考试与评价体系的提案》,引起轰动,各大媒体纷纷转载。十八届三中全会关于考试与评价改革的内容中,再次提出教育考试与评价的第三方化问题。中国教育评价与考试的第三方化之路浮现了出来。
教育评价的第三方化,肇始于西方,源自人类的科学化思想和客观公正理念,对教育科学化,及对教育测量评价的有效性、可靠性、可信性的内在追求。同时也是教育科学化高度发展,对教育评价科学客观公正的追求,以及教育分工专业化客观要求等所决定。
人类教育产生之始,教育实施、教育评价、教育咨询同时伴生,三者一直相伴发展。教育测量评价的是教育实施成效,教育评价结果则需要教育咨询来转化而促进教育实施的改进与发展。教育的这种内在原生性功能结构,决定了教育评价由测量、评价、诊断三种基础功能构成一个完整的基础系统结构,教育评价的其他功能(如选拔、导向、预测等)则是在此基础上延伸、转化和合成出来。教育评价的这种内在系统结构,是教育评价第三方化的客观原因之一。
学校的出现,使得教育实施、评价、咨询得到了积累和长足发展。从大约公元前400年至19世纪末这段历史时期,在人类教育评价史上称作“考试时期”。在这段时期,教育实施的内容主要还局限于文法、修辞、逻辑等;教育评价(此时称考试)的方式主要有“口试”(问答)和“论文”(笔试)。此时教育测量还未产生,对口试和论文,是依靠施教者或管教者通过观察和阅读,进行人工评分(我国的科举采用的也是这种模式),这种评价有很大的主观性、随意性、随机性。从理论和技术角度来看,也就无客观性和公正性可言,更无教育评价第三方化的可能。
基于客观公正理念的“第三方评价”于15世纪的欧洲在社会、经济领域产生并得到了长足发展,并很快延伸到其他领域。到18世纪,“第三方评价”的理念和思想形成完整的系统。
教育评价不但关乎教育发展,更关乎受教者的命运和社会经济政治的发展,对其有效性、客观公正性的追求成为学者和学人的梦想。
18到19世纪的科学革命浪潮,奠定了人类的科学化思想。实验心理学和教育统计学的发展,为解决教育评价的主观性、随意性、随机性提供了理论和方法。随着教育科学化的萌芽,教育评价也开始了客观化、数量化和标准化之旅,走上了科学化、有效性、可靠性、可信性的征途。教育评价的第三方化也由此奠定了基础并成为可能。
20世纪初至30年代,教育评价进入了“测量时期”(心理测验、智力测验时期), 测量理论的形成和测验技术(纸笔测验)开始在教育中得到广泛应用,评价的中心任务是“用科学的方法,求客观的标准,以矫正主观方法的弊端”, 强调以量化的方法对学生学习状况进行测量。测量技术的科学性和专业化要求,导致实施教育功能的学校和教管部门无力承担测量评价功能,第三方专业机构开始从教育测量的角度登场,解决教育评价的客观化、数量化问题。
20世纪30至50年代,进入了“描述时期”(目标中心时期),美国的泰勒(Tyler,R)提出了以教育目标为核心的教育评价原理(泰勒原理),并提出了
“教育评价”(education evaluation)的概念,从而把教育评价与教育测量区分开来。这一时期的特征是对测验结果作描述,评价的目标不再是学生本身,而是什么样的学习目标模式对学生学习最有效,由此形成了教育评价的“泰勒模式”(行为目标模式)。教育评价理论和技术的实施,使得第三方专业机构从评价的角度再次登场。
随着泰勒模式的推广,大学入学的标准化测试开始,基于客观公正理念的“第三方评价”思想和方法也得到系统的导入和实施。
20世纪50至70年代,进入了“判断时期”(标准研制时期),以泰勒的学生布鲁姆为主,提出了对教育目标进行评价的问题,这一时期注重了价值判断问题,目标参考测验也在这一阶段发展起来,并使“泰勒模式”成为主流模式。美国教育学家斯克里文(Scriven,M.)、斯塔克(Stake,R.E.)和开洛洛(Kellogg,T.E.)等人对教育评价理论作出巨大的贡献,斯塔夫宾(D.L. Stufflebeam)提出“CIPP模式”,斯克里文提出“目标游离模式”,推动了评价标准的发展。这个时期是如此的重要,以致学者们把1967年界定为美国教育评价发展的转折点。在这段历史时期,教育测量标准、评价标准以及教育评价的标准化问题都得到了空前地解决,致使第三方教育评价成为主流模式。
20世纪70年代后,进入“建构时期”(结果认同时期),这一时期在非常关注评价结果的认同问题、关注评价过程、强调评价过程中评价给予个体更多被认可的可能。重视评价对个体发展的建构作用,因此又称为“个体化评价时期”。80年代以来,项目反应理论把教育评价引向了计算机化和因人施测的方向,模糊评价法发展了教育评价的数据处理技术,以古巴(Egong Guba)和林肯(Y.S.Lincoln)等人为代表,他们认为评价就是对被评事物赋予价值,评价本质上是一种心理建构。
20世纪80年代中期,美国哈佛大学的加德纳(Howard Gardner)教授提出的“多元智能理论”革新了传统智力测试(教育测量评价的核心基础理论),使得传统的教育评价受到巨大的冲击,“多元智能模式”浮出水面,一个新的教育评价历史时期拉开序幕。
伴随着对教育科学化与对教育测量评价的有效性、可靠性及可信性的内在追求越来越高,伴随着教育测量评价的科学化程度、和对教育客观公正的需求程度、以及教育分工专业化客观要求等越来越高,对教育评价研发、实施、咨询等科学化、专业化程度要求也越来越高。导致教育实施、评价、咨询走向高度分工,致使教育评价的第三方化——委托独立的、专业的第三方教育评价或咨询机构,实施教育评价和教育咨询成为彻底的必然和普遍模式。
第三方教育评价有着独特的优势:独立性,第三方评价与被评价方无隶属和利益关系,因而能不受干扰地进行评价,可以避免在发现问题、分析原因和做结论时避重就轻、主观评价。客观公正性,第三方评价的独立性有助于保障评价过程的公正、公开,从而提高评价结果的公信力。进步性,由于社会化性质,需要在竞争中求生存和发展,因此更加关注评价产品和服务质量的不断提升与创新,以及评价技术的不断完善与进步,具有较强的发展潜力。专业性,第三方评价机构拥有专业的评价人才和技术,在评价内容的选择、评价指标的制定、评价数据的处理、评价结果的判断等方面拥有相应的理论基础和专业化工具,可大大提高评价的科学化水平,且有利于增强评价结果的可信度和权威性。
第三方教育评价对我国而言,是舶来品。目前国内已出现独立的第三方教育评价机构和考试研发机构——公众教育研究院和公众考试研究院,已开发了科学的教育评价系统(ACTS、ICTS)和考试系统(TAST),并在国内十多个省份进行了推广,现已取得良好的效果,不仅得到了国内教育界的广泛认可,也获得美国知名院校及学者的认可,为中国教育评价和考试走一条“第三方”的道路做出了探索。
评价是教育的牛鼻子。中国教育评价如何继续迈向科学、公正?改革之路就在第三方。