管办评分离何以从纸面走向现实
2016-04-20
2015年早些时候,教育部下发了《关于深入推进教育管办评分离促进政府职能改变的若干意见》,这标志着深化教育督导体制改革、转变教育管理职能和部署构建“政府管教育、学校办教育、社会评教育”的新格局正式上路。但是如何构建政府、学校、社会的新型关系、如何将教育管办评分离从纸上蓝图变为现实等问题还需进行深入探讨。在日前由北京大学中国教育财政研究所主办的“管办评分离背景下的教育评价新视野”国际研讨会上,来自国内外专家学者就这些问题进行了讨论。
教育评价的落脚点仍是学生发展
多年来,评估就像飞机已经飞出去了,但一些部件还没有安装好,技师也没登上飞机,这很危险。我们拿什么来评价一个地区、一所学校的教育是好还是差?评价的落脚点只能是以学生发展为本。
谈及教育评价,辽宁省大连市西岗区教育局局长李生滨从教育管理者和教育评价需求方的角度,讲了一个真实故事。
有一次,李生滨去一所学校听一堂研究性学习的课。那堂课上,老师讲完海豹的故事后,问学生有没有不同意见。一个孩子举手了,老师问:“为什么图片上有的海豹长斑,有的海豹不长斑?”这个小孩回头看图片时,恰好看到长斑的那只海豹是小海豹,于是孩子很自信地回答:“海豹小的时候长斑,长大了就不长斑了。”孩子回答完毕,老师带着同学们一起鼓掌。老师说:“你看这位同学知识多渊博,研究得多透彻,我们大家应该向他学习。”
“实际上,海豹中确实有一种背部灰黑色且分布有不规则棕灰色或棕黑色斑点的斑海豹。这究竟是老师无知,还是老师无法应对当下的知识爆炸?这个问题怎么来解决?这样的事情在学校的课堂里经常出现。”李生滨疑惑地发问,“不管怎样评价,我个人认为还是要把学校教育落实到课堂中去,课堂中的问题,我们怎么去解决?评估能否把这些问题反映出来,进而反馈回去找到解决的办法?”
日常教育管理中积累的大量鲜活案例,使李生滨意识到:教育评价不是一把简单的“双刃剑”,而更像是一个“多棱锥”,既有导向的功能,又有激励的作用,既有避免伤害无辜、伤害自身的功能,又有促进实现课程标准现代化、课程内容科学化、评估标准和评价工具科学化等现实需求的功能。
有此困惑之人,不只是李生滨。今年5月,江苏省教育评估院副院长袁益民在英国与世界39位评估学科专家编写《评估的未来》时,对世界教育评价,大家给了一个形象比喻:多年来的评估,就像飞机已经飞出去了,但一些部件还没有安装好,技师也没登上飞机,这很危险。
“教育评价不论是为学生发展提供信息,还是为经费投入方提供各个项目的绩效信息,或者是为政府管理和决策提供教育质量水平、教育公平实现程度等信息,其最终的落脚点还是以学生发展为本。”北京大学中国教育财政研究所教育评价中心主任黄晓婷说,“现在的教育评价已不是原来单一考学生,而是拓展到了考试成绩之外的道德品行、心理抗压能力、问题解决能力、批判思考能力等非认知领域,我们不希望我们的学生是草莓族,一压就扁。”
“其实,发展中国家所面临的最大挑战就是教育质量问题。如果没有教育质量,这些国家就没有办法进入到中等收入国家的行列,同时也更难成为高收入国家。”从事教育评估40年的世界银行东亚与太平洋地区教育部门前主管魏爱德认为,一个好的教育评价体系,就可以识别出这些问题。
世界一些国家在教育评价领域的先行先试,对于中国这样的后发国家,或许有一定的路标价值。就教育评价而言,目前世界大部分国家的教育评价测试都是筛选功能,主要把后进生淘汰出局。而新加坡的做法则与之相反。新加坡是借助教育评价工具精确找到“有问题的孩子”或者后进生,并投入人均6倍以上的经费,将后进生送入一些特殊学校,而特殊学校的校长都是精挑细选出来的最优秀的校长,以确保这些后进生能获得好的教育。
这或许是新加坡这样的一个连水资源都要从马来西亚进口的小国家,为什么能始终保障他们有充足的、技能超常的人才资源的秘密。因为,新加坡利用教育评价工具尽量将人的潜力发挥到极致。
事实上,关注学生发展正成为国内一些机构开展教育评价的重要监测点。在应试教育环境下,传统的学校教育管理和评价往往很难“发现”学生分数之外的成长。
一次入校评估,给成都市教科院副院长秦建平留下了深刻印象。在成都市近郊的双流县一所农民工子弟校进行教育测评时,秦建平发现,这所学校学生的行为习惯“很特别”:虽然教室、走廊都看不见垃圾桶,但整个学校非常整洁干净。原来,学校学生每天产生的垃圾都是用一个小塑料袋自己装走,中午或放学时自己扔到学校指定位置的两只大垃圾桶里。结果,测评组对该校学生行为习惯的评价分在全县最高。
谁能成可信赖的教育评价第三方?
评估,说到底是一部分人到另一部分人家里去翻箱倒柜,并且离开后还不能阻止他们说什么。我们有时评估的目的很正确,但往往是拿着勺子去刨地,拿着锄头去吃饭,拿的工具是错误的。
10多年前,袁益民就有这样一个梦想:中国能否建立一个类似于英国质量保障署一样的独立、专业、权威的教育评估部门,监管教育质量。它具有专业的不可替代性,既不是中介机构,也不是研究机构。
10多年过去,各类教育评估机构如雨后春笋般诞生。以上海浦东新区为例,2005年时,教育类的社会组织、专业化组织仅9家,而今达到47家。即便教育评估机构发育较快,但在教育管办评分离的大背景下,与会的专家学者和教育管理者们心中都有一连串的问号:我们评估机构到底是谁?世界范围内的教育评估是怎么做的……
“教育评价是一个世界性难题,是一门专业性很强的科学,不是政府行政措施所能完成的。在中国之所以具有特殊性,就在于教育评价在中国教育中实际上有指挥棒的作用。因此,教育怎么评价,在一定程度上是影响和决定如何办教育的,尤其是对基础教育影响更为明显。”国家教育咨询委员会委员谈松华说,教育评价在中国整个教育制度建设中是一个薄弱环节,现在中国教育评价主要是通过考试测评,而考试测评又更多地侧重在学业知识的考评上,它很难去全面评价学生和学校,更难全面评价地方教育部门,所以需要建立一种能适应学校、教师、学生发展的科学评价制度。
相对于内地刚刚起步的教育评价,香港在教育评价方面的探索已经先行一步。在香港,从一开始就不是由政府推动的,而是委托考评局。在香港,考评局是具有法律意义的独立法人,独立于教育局之外,是一个社会公共机构,所以考评局从一开始就是第三方。
“第三方机构能不能是私立的?是不是一定要公立?第三方机构能不能是一个赚钱机构?”香港考评局总监罗冠中先生连续发问:“我想恐怕还不行,我看了这么多国家和地区的第三方机构,大部分都是非营利机构。假如有一个大财团,通过风险投资,以第三方机构的身份出来做教育评价,行不行?我表示怀疑。”
事实上,上海浦东10年的管办评分离改革对于“摸着石头过河”的其他地区,具有一定的借鉴意义。早在10年前,浦东根据自身地域特点,启动了管办评分离改革。彼时的浦东新区,基础教育学生46.7万人,中小学幼儿园632所,若算上分校、分园,学校总数超过1 000所,且校际差异较大,既有全国、全上海市顶尖的重点学校,又有典型的农村学校。这种现状,使得浦东的教育局长不可能像其他区县教育局长那样,经常逐个学校指导工作,甚至有的校长除了开大会外,三五年都难得见局长一面。
“客观的现实,倒逼我们浦东只能选择放弃精细化管理,选择‘小政府、大社会的管理模式,试图构建一个政府宏观管理、学校自主办学和社会专业评价的教育管办评分离之路。”浦东新区教育局基教处刘文杰介绍说,改革之初,浦东新区对管办评中各方的角色进行了简单梳理,把区域事业规划、资源配置、公共财政投入、政策设计、质量监控、服务平台建设等属于政府职能的,划归政府;把教职工聘任、课程开发、教育教学组织、自我评价等属于学校职能的,让给学校;把知情权、参与权、监督权以及社会对教育的评估等属于社会职能的,还给社会;把可供多元选择的教育服务、多元多层次国际教育、民办教育等市场职能的,划转给市场。
在此基础上,政府以购买服务、通过持续给项目等方式培育教育评估、教育培训服务等专业化的社会中介组织。截至目前,浦东新区额外投入财政专项经费5 850万元,实施了65个委托管理项目。“在推进第三方教育评估方面,我们有一套完整的招投标制度,教育局和第三方委托机构之间是一种协议关系、契约关系,第三方评估机构依据协议对学校开展初态评估、中期评估、终结性评估,然后进行前后比较,通过观测被评估学校在同类学校中是否有明显进步,来反映我们额外的委托管理经费的实际效益。”刘文杰说。
然而,对于管办评分离背景下的第三方教育评价中的一些误区,一些学者有着清醒的认识。“评估,说到底是一部分人到另一部分人的家里翻箱倒柜,然后离开后还不能阻止它说什么。所以,我们评估的意愿和评估的结果有时相去甚远。我们有时目的很正确,但往往是拿着勺子去刨地,拿着锄头去吃饭,拿的工具是错误的。”袁益民说,“质量保障实际是一个连续题,更多的不是需要赞扬我们的被评者,也不是需要给出改进意见,更多的是要靠被评者自己回答我们学校在哪里?它正往何处去?但是,我们一些评估被扭曲了,学生的很多压力是地方政府给教育系统施加的,教育系统再把压力转给学校,学校再传递给老师,老师再传递给学生,最终可能使我们的评估无效、失范、失真甚至失信。”
合理的机制和明确的责任,是培育可信赖的第三方教育评价的重要环节。袁益民对此作了一个类比:“南京古长城几百年后,甚至几千年后,人们都知道每块砖是谁负责的,这样质量就有保障。”
第三方评价怎么评?
第三方评价须先要了解为什么要做评估,并制定一个评估战略,同时还要了解谁要参与到这个评估中来,以及一项评估产生的信息交由谁来接收和使用。然后运用一套科学、及时、准确的评估体系,在恰当时间内给需求方提供足够透明且有用的评估结果。
谈到第三方教育评价,国内很多人对于欧美国家的做法大多耳熟能详,而对于香港则了解不多。其实,1997年香港回归后,就启动了以“终身学习、全能发展”的系列教育改革。其中,推动评核机制建设以辅助教与学,成了这一时期香港教育改革的一个亮点。其评核机制的基础功能是辅助教与学、提供学历证明及筛选。在评核形式上,分为校内自评和校外第三方评核两种,前者主要是通过评估帮助学校教师了解学生的学习进度,及早识别学生的学习需要,以便及早针对学生的学习问题提供适当的帮助。
与大陆高考侧重升学的功能不同,香港的文凭考试成绩是要伴随学生终身的,不论学生申请公务员、私营机构职位,都必须填写文凭考试的成绩。
“要让第三方机构去评价管和办的质量,就必须确保第三方机构自身的质量。而第三方测评机构的质量保证来自其合理的组织架构、运转经验积累和评核的专业性、权威性。每一行都有其自身的专业性,不能说我从小学考试考到研究生,我百战沙场,我就是考试评核专家,就可以说三道四,就可以任意评说。”罗冠中坦言,香港的评核也面临不少挑战,比如每年考评结束后向社会发布很厚的评估结果报告,只向外公布合格率,更详细的结果则一般由学校“内部掌握”。但现实是,每所学校成绩好的都喜欢把自己的好成绩告诉他人,所以如何真正让学校保得住密,就是个不小的难题。
让香港考评局感到头疼的,远不止于此。比如,在全港性系统评估中进行年度与年度之间的评核结果比较时,就面临一个两难选择:虽然对所有学生进行的普测比抽样评测的效果最好,但是成本很高,可能会对学校正常的教育教学造成干扰,还有可能导致原意是促进教学最终却无意中变成了指挥教学的“指挥棒”。
对于世界各地现行的第三方教育评价,魏爱德总结了一条经验。魏爱德认为,第三方评价必须先要了解为什么要做评估,并制定一个评估战略方案,同时还要了解谁要参与到这个评估中来,以及一项评估产生的信息交由谁来接收和使用。然后运用一套科学、及时、准确的评估体系,在恰当时间内给需求方提供足够透明且有用的评估结果。同时,第三方机构离政治影响越远越好,每一次评测都要考虑用户的需求,评测结果能得到很好地推广和使用。此外,评估体系要能告知对象的现状是什么,并持续跟踪一系列指标的变化。
魏爱德总结的经验,或许是管办评分离背景下第三方教育评价的发展路向。
事实上,近几年随着计算机技术的快速发展,大数据已被大量引入教育评估。6年前,重庆市教育评估院建立了数据平台,并搜集了大量数据,既有学生发展、学校硬件、教师人数、学生人数等常态数据,又有学生综合素质评价的动态数据,而且从这些动态数据中能看到学生每一天的变化,既能看到学生的兴趣特长,又能看到他们对某种价值观的认同度,还能看到学生心理健康、学业负担指数、师德师风指数变化,看到学生家长的相关状况等。同时,通过一些模型评测不同学校、区县的教育质量发展现状。
“当你看到琳琅满目的数据时,也会看到我们在评价教育质量时不是一个简单的分数概念,其中既包括师生成长的数据,也包括教学设备对学习成绩影响等所有的数据。这个系统现在可以支撑到每个区县,甚至每所学校,我们可以给每所测评学校提供一份报告,帮助学校改进教育教学。”重庆市教育评估院院长龚春燕介绍说,“借助这个大数据平台,我们做了义务教育均衡发展等评估模型。今后,一所学校要办多大规模,不是哪个领导说了算,而是用这个模型去计算和统筹。”
英美等国家也正在通过引入大数据技术推进新类型教育评估的相关实验。据英国的培生集团教育专家格雷戈瑞博士介绍,欧美国家的许多教育评估机构目前正在用数据技术,跟踪学生实时的学业进展,并进行隐性评价,而且会去跟踪学生在一个学期或一年的进展,观察他们掌握技能的状况,同时对学生学习规律、怎样进一步改进学习等方面展开隐性评估。这种隐性评估既不是说把学习和评价分割开,也不是以考试为目的,而是自然而然地将考试整体纳入到学习过程中。
“先把评价做起来,边做边探索”
评价正面临一系列悬而未决的难题——如何把好的教育和特色教育评价出来;如果政府职能不转变,评价是否会把学校绑得更紧、管得更死,进一步收窄学校自主发展的空间;如何尊重评价的独立性,支持学校开展自我评价,等等。但是,我们提倡先做起来,边做边探索。
“理想很丰满,现实很骨感。”这是不少与会学者的相似感受。
研讨会上,教育部政策法规司司长孙宵兵说:“当前中国教育面临的最重要问题,就是质量评价问题。我们的学校大家都在办学,我们的教育行政部门都在管理,按照一个什么样的要求进行办学?按照什么样的要求进行管理?我们办学的标准是什么?管理标准是什么?好学生应该是什么样子的?核心问题还是没有解决质量评价问题。所以,我觉得今后教育研究的一个中心任务就是要聚焦于质量及其评价的问题。”
不只是孙宵兵有此困惑。国家教育发展研究中心教育体制改革研究室主任王烽认为,从宏观上来说,政府评价教育的初衷,主要是要保证我们的办学方向、提高财政资金的使用效率以及保证公共教育的基本质量和公平。但是,在实际的评价中也会面临一系列悬而未决的难题——如何把好的教育和特色教育评价出来;如果政府职能不转变,即便成立一个评价机构,赋予其很多评价职能,那么评价是否会把学校绑得更紧、管得更死,进一步收窄学校自主发展的空间;如何尊重评价的独立性,支持学校开展自我评价……
“政府管理部门不是专业机构,但可以利用专业化评价检测结果,实施管理,调整政策。政府不宜自己出去搞评价,评价也不应进入政府的权力清单。”王烽提醒说,“我们的教育评价应当给学校预留足够的自主发展空间。一般而言,好的学校没有统一的标准,好的学校各具特色,好的学校需要个性发展。所以,政府出台的质量标准应是基本质量标准,不应是高的质量标准。如果一个高的质量标准,大家都追求的话,所有学校就很有可能都办成一个模样。”
面对这些问题,中国现阶段的教育评价究竟如何做,才算科学合理呢?王烽就此建议,检测和评价要分开,检测以政策改进为目的,就是要对政府提供的教育服务进行检测,弱项在哪里,以便政策改进;学校评价则要以学校改进为目的,将关注和支持的重点转向相对薄弱的学校。同时,要明确评价的结果是提供给政府和学校使用,而不是发布到社会上去,避免因大尺度的信息公开而影响学校正常的教育教学行为。
王烽的担忧不无道理。东南沿海某省教育评估院负责人透露:“目前委托我们做评估的,绝大多数都是教育行政部门,既有教育厅层面的,也有地方教育局,但没有学校。在这种情况下,我们开展的项目中有大部分是流于运动式的评估,评估的结果经常和县市区年度教育考核等绩效挂钩,所以在这些地方政府或地方教育行政部门政绩思维和急功近利思想引导下,往往就会出现一些和实际评估相左的评价结果,而且对于自上而下的外部评估,学校有时疲于应付,甚至烦不胜烦。”
“我们提倡先搞起来,自己先评价起来。因为教育规划纲要要求每个学校要提出自己的教学质量评价报告。2010年以后,很多高校对各自的本科质量进行了自我评估,大多数高校的自评分都是85分以上,于是社会上有议论说学校自己说自己好。实际上,他们现在自评是85分,等所有学校都自己做起来了,都开展自评了,我们教育行政部门如果认为有必要再进行统一规范,就可以再制订相应的测评标准。目前最重要的是,先把评价做起来,边做边探索。”孙宵兵说。