教育评价的第三方化

2014-05-28张勇

湖北教育·综合资讯 2014年1期

张勇

2013年“两会”期间，全国政协副秘书长、民进中央副主席、中国教育学会副会长朱永新教授提交了《关于发展“第三方”教育考试与评价体系的提案》，引起轰动，各大媒体纷纷转载。十八届三中全会关于考试与评价改革的内容中，再次提出教育考试与评价的第三方化问题。中国教育评价与考试的第三方化之路浮现了出来。

教育评价的第三方化，肇始于西方，源自人类的科学化思想和客观公正理念，对教育科学化，及对教育测量评价的有效性、可靠性、可信性的内在追求。同时也是教育科学化高度发展，对教育评价科学客观公正的追求，以及教育分工专业化客观要求等所决定。

人类教育产生之始，教育实施、教育评价、教育咨询同时伴生，三者一直相伴发展。教育测量评价的是教育实施成效，教育评价结果则需要教育咨询来转化而促进教育实施的改进与发展。教育的这种内在原生性功能结构，决定了教育评价由测量、评价、诊断三种基础功能构成一个完整的基础系统结构，教育评价的其他功能（如选拔、导向、预测等）则是在此基础上延伸、转化和合成出来。教育评价的这种内在系统结构，是教育评价第三方化的客观原因之一。

学校的出现，使得教育实施、评价、咨询得到了积累和长足发展。从大约公元前400年至19世纪末这段历史时期，在人类教育评价史上称作“考试时期”。在这段时期，教育实施的内容主要还局限于文法、修辞、逻辑等；教育评价（此时称考试）的方式主要有“口试”（问答）和“论文”（笔试）。此时教育测量还未产生，对口试和论文，是依靠施教者或管教者通过观察和阅读，进行人工评分（我国的科举采用的也是这种模式），这种评价有很大的主观性、随意性、随机性。从理论和技术角度来看，也就无客观性和公正性可言，更无教育评价第三方化的可能。

基于客观公正理念的“第三方评价”于15世纪的欧洲在社会、经济领域产生并得到了长足发展，并很快延伸到其他领域。到18世纪，“第三方评价”的理念和思想形成完整的系统。

教育评价不但关乎教育发展，更关乎受教者的命运和社会经济政治的发展，对其有效性、客观公正性的追求成为学者和学人的梦想。

18到19世纪的科学革命浪潮，奠定了人类的科学化思想。实验心理学和教育统计学的发展，为解决教育评价的主观性、随意性、随机性提供了理论和方法。随着教育科学化的萌芽，教育评价也开始了客观化、数量化和标准化之旅，走上了科学化、有效性、可靠性、可信性的征途。教育评价的第三方化也由此奠定了基础并成为可能。

20世纪初至30年代，教育评价进入了“测量时期”（心理测验、智力测验时期），测量理论的形成和测验技术（纸笔测验）开始在教育中得到广泛应用，评价的中心任务是“用科学的方法，求客观的标准，以矫正主观方法的弊端”，强调以量化的方法对学生学习状况进行测量。测量技术的科学性和专业化要求，导致实施教育功能的学校和教管部门无力承担测量评价功能，第三方专业机构开始从教育测量的角度登场，解决教育评价的客观化、数量化问题。

20世纪30至50年代，进入了“描述时期”（目标中心时期），美国的泰勒（Tyler，R）提出了以教育目标为核心的教育评价原理（泰勒原理），并提出了

“教育评价”（education evaluation）的概念，从而把教育评价与教育测量区分开来。这一时期的特征是对测验结果作描述，评价的目标不再是学生本身，而是什么样的学习目标模式对学生学习最有效，由此形成了教育评价的“泰勒模式”（行为目标模式）。教育评价理论和技术的实施，使得第三方专业机构从评价的角度再次登场。

随着泰勒模式的推广，大学入学的标准化测试开始，基于客观公正理念的“第三方评价”思想和方法也得到系统的导入和实施。

20世纪50至70年代，进入了“判断时期”（标准研制时期），以泰勒的学生布鲁姆为主，提出了对教育目标进行评价的问题，这一时期注重了价值判断问题，目标参考测验也在这一阶段发展起来，并使“泰勒模式”成为主流模式。美国教育学家斯克里文（Scriven，M.）、斯塔克（Stake，R.E.）和开洛洛（Kellogg，T.E.）等人对教育评价理论作出巨大的贡献，斯塔夫宾（D.L. Stufflebeam）提出“CIPP模式”，斯克里文提出“目标游离模式”，推动了评价标准的发展。这个时期是如此的重要，以致学者们把1967年界定为美国教育评价发展的转折点。在这段历史时期，教育测量标准、评价标准以及教育评价的标准化问题都得到了空前地解决，致使第三方教育评价成为主流模式。

20世纪70年代后，进入“建构时期”（结果认同时期），这一时期在非常关注评价结果的认同问题、关注评价过程、强调评价过程中评价给予个体更多被认可的可能。重视评价对个体发展的建构作用，因此又称为“个体化评价时期”。80年代以来，项目反应理论把教育评价引向了计算机化和因人施测的方向，模糊评价法发展了教育评价的数据处理技术，以古巴（Egong Guba）和林肯（Y.S.Lincoln）等人为代表，他们认为评价就是对被评事物赋予价值，评价本质上是一种心理建构。

20世纪80年代中期，美国哈佛大学的加德纳（Howard Gardner）教授提出的“多元智能理论”革新了传统智力测试（教育测量评价的核心基础理论），使得传统的教育评价受到巨大的冲击，“多元智能模式”浮出水面，一个新的教育评价历史时期拉开序幕。

伴随着对教育科学化与对教育测量评价的有效性、可靠性及可信性的内在追求越来越高，伴随着教育测量评价的科学化程度、和对教育客观公正的需求程度、以及教育分工专业化客观要求等越来越高，对教育评价研发、实施、咨询等科学化、专业化程度要求也越来越高。导致教育实施、评价、咨询走向高度分工，致使教育评价的第三方化——委托独立的、专业的第三方教育评价或咨询机构，实施教育评价和教育咨询成为彻底的必然和普遍模式。

第三方教育评价有着独特的优势：独立性，第三方评价与被评价方无隶属和利益关系，因而能不受干扰地进行评价，可以避免在发现问题、分析原因和做结论时避重就轻、主观评价。客观公正性，第三方评价的独立性有助于保障评价过程的公正、公开，从而提高评价结果的公信力。进步性，由于社会化性质，需要在竞争中求生存和发展，因此更加关注评价产品和服务质量的不断提升与创新，以及评价技术的不断完善与进步，具有较强的发展潜力。专业性，第三方评价机构拥有专业的评价人才和技术，在评价内容的选择、评价指标的制定、评价数据的处理、评价结果的判断等方面拥有相应的理论基础和专业化工具，可大大提高评价的科学化水平，且有利于增强评价结果的可信度和权威性。

第三方教育评价对我国而言，是舶来品。目前国内已出现独立的第三方教育评价机构和考试研发机构——公众教育研究院和公众考试研究院，已开发了科学的教育评价系统（ACTS、ICTS）和考试系统（TAST），并在国内十多个省份进行了推广，现已取得良好的效果，不仅得到了国内教育界的广泛认可，也获得美国知名院校及学者的认可，为中国教育评价和考试走一条“第三方”的道路做出了探索。

评价是教育的牛鼻子。中国教育评价如何继续迈向科学、公正？改革之路就在第三方。

猜你喜欢

教育评价的第三方化

猜你喜欢

杂志排行

湖北教育·综合资讯的其它文章