中小学办学质量评价标准的国际经验与启示
2022-03-30王晓芳熊和妮黄锦辉吴丹丹
● 王晓芳 熊和妮 黄锦辉 吴丹丹
随着教育问责不断增强以及以学校办学自主权为核心的管理体制变革,结果导向(output-orientation)逐渐取代投入导向(input-orientation)成为教育问责的主流趋势。与此同时,学校也被认为是实现教育效能、教育公平与教育质量等政策目标最关键的责任主体。[1]如何督导、监控、评估、进而提升学校办学质量已成为世界各国和各地区持续关注的焦点。近年来,在世界范围内,学校质量评估呈现出日益标准化(standardization)趋势:制定学校办学质量评价标准并开展“基于标准”(criteria-based)的学校质量监控评估被许多国家和地区作为增强学校问责力度和提升学校评估有效性、专业性的重要途径。[2]2020 年10 月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》将“改革学校评价”作为重点任务加以部署,并明确提出“国家制定义务教育学校办学质量评价标准”。构建并运用质量标准已成为我国现代教育治理的重要手段。在这一政策背景下,分析不同国家和地区学校办学质量评价标准的制定与实施经验、总结归纳其特点和趋势,对于制定学校质量的国家与地方标准、完善中小学校评价体系、改进学校办学质量评估制度等,具有重要参考价值。
本研究选取了八个国家和地区的学校办学质量评价标准作为研究对象:美国纽约州《学校和学区效能诊断工具》(Diagnostic Tool for School and District Effectiveness,DTSDE,2012)[3],加拿大安大略省《学校效能框架》(School Effectiveness Framework,2013)[4],英国英格兰《学校督导手册》(School Inspection Handbook,2019)[5]、英国苏格兰《我们学校有多好?》(How Good Is Our School?,2015)[6],爱尔兰《审视我们的学校2016:小学质量框架》(Looking at Our School 2016:A Quality Framework for Primary Schools,2016)[7],荷兰《小学教育督导框架》(Inspection Framework Primary Education,2019)[8],澳大利亚昆士兰地区《通过学校评估提高学生成绩:校长的工具箱》(Improving Student Outcomes Through School Reviews:A Toolkit for Principals,2020)[9],新西兰《学校评估指标:致力于改进与学习者成功的有效实践》(School Evaluation Indicators:Effective Practice for Improvement and Learner Success,2016)[10]。本文从标准制定实施主体、形式结构、指标设计、运行机制等角度对八个国家和地区的学校办学质量评价标准进行分析,总结中小学办学质量评价标准的国际经验、特点、理念和趋势。
一、学校质量标准制定实施主体的国际比较
学校办学质量评价标准的制定实施主体关乎学校质量评估的权力划分和责任分担,并影响学校质量标准的权威性、独立性和专业性。由于教育治理体制的差异,不同国家和地区的学校质量评价标准的制定与实施机构有所不同。[11]在八个国家和地区中,制定学校办学质量评价标准并将其付诸实施的机构可分为三类(见表1):一是国家或地方教育行政部门,例如美国纽约州教育局;二是国家或地方独立设置的教育督导机构,如爱尔兰教育部督导局;三是独立设置的学校评估专门机构,如英国英格兰的教育、儿童服务与技能标准局(OFSTED),新西兰教育评估办公室(Education Review Office)。澳大利亚昆士兰比较特殊:昆士兰教育局教育改进分部负责开展学校评估工作,但其运用的是第三方研究机构澳大利亚教育研究理事会(Australian Council for Educational Research)所开发的学校办学质量评价标准与指标框架。
表1 学校办学质量评价标准的制定实施主体
在所考察的八个国家和地区,学校质量评价标准的制定实施主体均具有较强的政府色彩,是政府推行教育评估、学校问责改进与教育督导等政策的重要机构。而且,政府机构参与主导学校质量评价标准的制定,不仅直接影响学校外部评估或督导,也对学校自我评估产生辐射作用。[12]例如,新西兰教育评估办公室尽管是独立于教育行政部门之外的教育评估机构,但是所开发的《学校评估指标》不仅是实施学校督导的框架,同时也成为学校自评的指南。[13]同样的情形也可见之于爱尔兰、荷兰、英国苏格兰等国家和地区。
尽管学校质量评价标准的制定与实施主体以政府机构为主,但在学校督导和质量评估活动中秉持独立性却是大部分评估机构所强调的。例如,英国英格兰所设立的OFSTED 直接向议会负责,强调该机构是独立且公正的。英国苏格兰地区的“教育苏格兰”(Education Scotland)隶属于苏格兰政府,但作为执行机构(executive agency),他们在对苏格兰政府负责的同时仍强调“保障督导、评估和报告的独立性”。[14]而作为独立设置的学校评估专门机构,教育评估办公室与新西兰教育部两者在学校质量评估标准的制定与实施层面构建了合作伙伴关系并非隶属关系,这也有助于保持评估机构的独立性。[15]可见,尽管是政府机构,但是学校质量评估机构的独立性获得了承认。
此外,专业人士深度参与也提升了学校质量评价标准制定与实施主体的专业性。专业人士是许多国家和地区研制学校质量标准的重要参与者。例如,新西兰《学校评估指标》的研制工作虽然是由教育评估办公室主导,但经历了“初步研究—专家审核与咨询—个案研究—最终确定”等多个阶段,且在完成初步研制后向高校研究者等专家征集建议,进一步论证指标的合理性与有效性,最终才确定该评价标准。[16]此外,专业人士也成为学校质量标准实施过程中的重要参与者乃至主导者。爱尔兰教育督导局尽管是教育部的分支机构,但是作为负责中小学评估并对此提出政策建议的独立而专业机构,爱尔兰教育督导局的督导员均由包括校长、副校长等在内的有经验的教师担任,他们均是在课程设计、学校评估、学校管理与教育研究等方面有丰富经验的专业人员。
二、学校质量标准形式结构的国际比较
可操作性是办学质量标准及其建构的指标框架是否得当的重要维度;而学校办学质量评价标准的可操作性往往受指标框架的形式结构的影响。[17]在形式结构层面,本研究所考察的八个国家和地区的学校办学质量评价标准指标框架呈现如下特点。
首先,八个国家和地区的学校办学质量标准在形式上呈现“由抽象到具体”的树状分级结构,大致由二至三层指标构成。例如,爱尔兰《审视我们的学校2016》包含由“维度-领域-标准”构成的三层指标结构:2 个一级指标也称作“维度”(dimension),“教与学”“领导力与管理”;每个一级维度又分为若干二级指标也称作“领域”(domains),共有8 个领域;每个二级领域又可细化为若干个三级指标也称作“标准”(standards),共设置32 个标准。[18]同样的,美国纽约州也构建了包含三个层级的树状结构指标框架,具体示例可见图1 所示的一级指标或维度“制度和组织”(systemand organization)及其下辖6 个二级指标、15个三级指标所构成的树状结构指标框架。[19]以树状结构的形式来呈现指标框架有助于形成逻辑自恰、体系完整、层次分明、操作性强的学校质量评价标准。
第二,许多国家和地区(英国英格兰和苏格兰、美国纽约州、加拿大安大略省、爱尔兰、荷兰)的学校质量评价标准对指标框架的末级指标进行条规式和关键词的阐释以及可操作化的分解。这主要通过设置具体观测项目或监察点而实现,并多以列举式、描述性、介绍性和肯定式的语言及措辞进行论述。尽管英国英格兰《学校督导框架》只设置了两级指标,但是二级指标的作用主要在于对一级指标进行阐释,以提升评价指标的可操作性:例如,一级指标“领导力与管理效能”包含18 个二级指标,而这些二级指标均是较为具体的描述,可被视作学校具体办学活动的观测点,如“学校领导与管理层的学校愿景与发展目标,以及如何将其传递给教职员工、家长和学生”。[20]相类似,加拿大安大略省《学校效能框架》分别从学校、课堂和学生三个层面对每个二级评价指标的评估标准进行详细论述。例如,二级指标“测验与课程紧密联系”在学校层面的标准之一是“预期、目标、标准和测验是一致的并同步规划”,在课堂层面的标准之一是“教师与学生共同建构标准”,在学生层面的标准之一是“积极规划并设定个人化的学习目标”[21]。简言之,尽管学校质量评价标准的指标框架的层级只有二至三级,但是通过对每个末级指标进行详细的规范性描述、列举和阐释,可以将原本高度抽象和概括的学校质量评价标准转化为可观测、可衡量的具体监测点,这就大大提升了学校质量评价标准及其指标框架的可操作性。
三、学校质量标准指标设计的国际比较
学校办学质量标准的指标设计旨在从标准化与结构化的视角出发回答“如何衡量学校办学质量”的关键问题。评价指标设计及其背后所蕴含质量理念是评估、问责并改进学校教育质量的依据,也对学校办学发挥着“指挥棒”的导向作用。[22]指标设计反映了不同国家独特的教育质量观,并带有国家教育制度、政策导向、价值理念和社会文化的深刻烙印。一般而言,学校评估关注的质量领域包括:对结果的评估,对课堂层面的过程因素的评估,对学校层面的过程因素的评估,以及对学校环境的评估。[23]八个国家和地区的学校办学质量评价标准(见表2)与上述四个主要领域相契合,遵循CIPP 模型即“情景(context)-投入(input)-过程(process)-产出/成果(product)”的演进逻辑。[24]
表2 八个国家和地区学校质量标准一级指标
(一)超越唯学业成绩,以学生全面发展为结果导向
在绩效主义与教育问责的政策背景下,以学生发展为本、将学生发展放在首要位置是学校办学质量评价标准的核心要义,其他过程性指标应直接或间接服务于学生发展这一根本目的。[25]对结果的评估是学校办学质量评估的首要内容;而且,结果性评价指标所涵盖的内容包括学生学业成就、个体性和社会性发展、毕业去向等,而不仅局限于考试成绩。[26]多个国家和地区学校质量标准明确将学生发展视作衡量学校办学质量的一级指标,强调以结果导向为标准来评判学校办学质量,同时也超越了唯学业成绩的取向,以全人育人理念从多个角度全方位评价学生发展水平。如英国英格兰强调在对学校整体效能做出最终判断之前,学校督导员必须评估学生“精神、道德、社会和文化层面的发展水平”,并将“个人发展、行为和幸福”与“学生学业成就”共同纳入学校质量督导标准的一级指标。[27]
在许多国家和地区,社交能力、学生学习体验与幸福感、职业准备或就业能力(employability)构成衡量学生全面发展水平的关键指标。美国纽约州专设一章“社会情感学习”(social emotional learning)作为“学校效能诊断工具”的一级指标,并将其详细分解为多个维度,指导学校从制度建设、文化培育和伙伴关系等多个层面保障“社会情感学习”的实施,以确保学生都能发展必需的社会情感学习技能。[28]在衡量教育结果方面,爱尔兰不仅关注学习结果,也看重学生学习体验,要让学生“享受学习过程、具有较强学习动机、具备较高学习预期目标”,同时“有目的性地参与有意义的学习活动”“反思学习过程并且培养对自身学习的主人翁意识和责任感”“掌握终身学习必备的技能和态度”等。[29]英国苏格兰在评价学生“成功与成就”时,特别强调学生幸福感、教育公平和教育融合,以及学生创造力和就业能力的增强:学校应确保所有儿童与青少年的幸福,“使他们感到安全、健康、有收获、受鼓励、进取、受尊重、有责任感和被包容”;而创造力与就业能力包含创造性技能、数字创新、数字能力和就业技能等。[30]荷兰也同样重视培养学生的职业能力,让学生为毕业之后的职业选择或继续深造等奠定基础、做好准备。[31]
(二)关注处境不利学生群体的发展,凸显教育公平与教育融合理念
教育公平和融合(inclusion)理念已成为各个国家和地区学校教育共同的价值导向。在秉持学生全面发展的成果导向的同时,八个国家和地区均将对教育公平和教育融合的追求融入学校质量标准的指标框架之中。不同国家和地区对教育公平和教育融合有不同的理解,其所构建的教育公平的实现路径也有所差异。
爱尔兰主要从“机会公平”的视角理解教育公平,强调给予全体学生平等的受教育机会,要求学校必须在领导力和管理层面,通过建设多元化校内外课程、营造包容性和多样化的学校社区、建立融合性的学校政策以及确保学校教育互动贯彻教育机会公平的原则等多种方式,“培育致力于教育融合、机会公平和每个学生整全式发展的承诺”。[32]新西兰考虑到学生的多样性日益提升以及不同学生群体之间的学业成绩的长期差异,侧重于从“结果公平”的视角来评价学校教育公平程度,致力于提升特定学生群体(如毛利与太平洋岛居民、社会经济地位较低社区的学生)的学业成绩,缩小不同群体之间的质量差距。[33]英国英格兰侧重于从“弱势补偿”的视角出发,给予处境不利的学生群体强烈的关注,在阐释“学生个人发展、行为和福祉”(personal development behavior and welfare)的具体评价标准时,特别关注处境不利学生、后进生、有特殊教育需求的学生、残疾学生等特定群体的学业成就是否能够达到相应的水平、是否在原有基础上取得较大进步,从而判断学校教育质量高低。[34]美国纽约州同样关注特定学生群体(如残疾学生,英语学习者与多语言学习者,无家可归和流动人口,行为不良、无人照管、受虐待和受迫害的学生等)的学习和发展,并侧重于从“微观公平”的视角出发,考察学校是否建立特定学生群体的支持机制,以及在课程设置与教学实践中对特定学生群体是否采取有针对性的支持策略,以保证教育公平。[35]同时,美国纽约州、英国苏格兰将教育公平扩展至教育的全纳性或融合程度,从学校教育多样性和丰富性来理解教育公平,认为学校教育应理解、尊重和欢迎多样性并拒绝歧视,“残疾、性别转换、婚姻、民族、怀孕、种族、宗教或信仰、性别和性取向不应成为学生参与和学业成就的阻碍”[36],致力于实现全体学生均可享受公平的教育,并取得高质量的教育成就。
(三)“课程-教学-评价”三位一体,考察学校教育的过程质量
从过程视角来考察学校办学质量水平是各个国家和地区学校质量标准的另一共同点;而学校教育最核心的过程因素是课堂层面的学习与教学的质量。[37]因此,多数国家和地区从微观视角考察学校教育的过程质量,强调应围绕学生学习建构紧密联结、系统有机、协调一致的“课程-教学-评价”。例如,加拿大安大略省就强调“建立课程、教学和评价的联结和一致性,以回应学生多样化的学习需求”[38];英国英格兰也把“教学、学习和评价”作为学校质量标准的一级指标[39]。在各个国家和地区构建的学校质量标准体系中,“课程-教学-评价”的评价指标呈现如下特点。
在课程供给与开发建设层面,国家课程标准是学校课程质量的评价标准的依据。例如,新西兰明确指出课程内容应严格遵照《新西兰课程》(The New Zealand Curriculum)及新西兰国家教学大纲(Te Marautanga o Aotearoa,毛利语)所要求的广度和深度。[40]澳大利亚昆士兰也强调学校课程开发和“系统性课程实施”(systematic curriculum delivery)均应以澳大利亚国家课程或者其他核准的课程为参照。[41]此外,多个国家和地区十分强调学校课程的统一性与连续性、深度与广度、多样性与回应性、以学生需求为中心等特征。美国纽约州针对“有效课程”设定了“课程统一性和连续性”“深度与广度”“适切性、挑战性与愉悦性”“课程聚焦与组织”“活动与素材”“评价、调整与灵活性”等指标,来衡量有效的学校是否为学生提供严谨、连贯和适切的课程。[42]新西兰除了强调依照国家课程的相关规定之外,也明确学校课程应具备多元文化的“回应性”(responsive)。[43]英国苏格兰从“理念与设计”“课程开发”“学习路径”“学习、生活和工作技能”等多层面对学校课程进行规定,并强调课程设计与开发应该将学生需求放置在中心位置,并考虑地方与国家的宏观背景。[44]
如何理解和评价学校的教学质量?有效教学、学生参与、探究教学、创新教学、差异化与个性化教学等成为各个国家和地区学校质量标准中浮现出的共同主题词。美国纽约州对一级指标“有效教学”的阐释最为详细和全面,分别从教学环境、课堂管理、学科与教学知识、课堂教学、运用技术激发学生参与、有针对性的教学策略、课堂评价和反馈等七个方面设定了有效教学的具体标准。[45]除了强调“有效的教学实践”以促进学生学习效果的最大化之外,澳大利亚昆士兰将“个性化的(differentiated)教学与学习”纳入评价学校质量的一级指标,着重考察教师是否识别和回应学生的多样化学习需求,并进一步调整课堂教学策略和活动。[46]荷兰也明确提出学校应该为有需要的学生在教学、支持和监督等方面提供额外支持。加拿大安大略省特别强调“学生参与”(student engagement)并将其作为衡量学校教育质量的一级指标;在教学方面,强调学校教学应面向21 世纪,呈现出合作、创新和创造的特点,强调教学应该建立在学生探究基础之上,教学与评价也应是差异化的,以回应学生个性化需求。[47]
服务学生学习的评价被视作课程与教学的内在组成部分。在八个国家和地区中,加拿大安大略省最为看重评价的导向作用,将评价作为衡量学校办学质量的一级指标乃至首要标准,并明确“评价”与学生学习之间的关系,主张评价应成为“对学习、为学习以及作为学习的评价”(assessment for,as and of learning)。[48]英国苏格兰也将“有效运用评价”作为评判学校质量的重要标准,评价被认为是学习与教学的内在组成部分,运用多种评价方式,为了解学生学业进展提供可信赖的证据。[49]
(四)聚焦学校领导力与管理效能,提升学校内部治理能力
学校层面的过程要素往往与“将学校建设成为学习、社会交流和专业的空间”紧密相连。[50]而除了课程与教学等微观教育过程之外,衡量学校办学质量的另一“过程”标准是学校层面的领导、组织和管理活动。八个国家和地区的学校质量标准均将领导、管理、组织和文化等学校组织层面的评价维度作为一级指标,特别是聚焦学校领导力和管理效能,考察学校内部治理能力。尽管各个国家和地区倾向于将学校内部治理独立设置为一级指标,但是领导力、组织、管理和文化等维度在具体评价内容上呈现出全方位覆盖的特点。典型的是英国英格兰的做法,详细阐释了一级指标“领导力和管理效能”(effectiveness of leadership and management)的具体内容,涵盖学校愿景、课程设计与管理、教师专业发展、家校合作、资源利用、安全保卫等多个方面。[51]除了全方位覆盖的特点之外,在各个国家和地区对学校内部治理能力的评估主要聚焦以下四个关键领域。
其一,不同类型和层面的领导力成为学校质量评价标准的重要指标。例如,美国纽约州强调教学型领导力,加拿大安大略省强调学校与课堂教学层面的领导力,英国苏格兰地区侧重学习领导与变革领导力等。第二个关键领域则是学校组织文化、氛围与环境。例如,美国纽约州强调学校应培育“确保成功的文化与氛围”,加拿大安大略省强调“营造安全、可接受、包容和健康的学习环境”,荷兰强调“安全氛围”“积极的教学氛围”等学校氛围的营造,澳大利亚昆士兰地区侧重于“营造促进学生学习的文化”,英国英格兰十分重视为学生提供安全保卫环境。第三个关键领域是资源管理的效率。荷兰、美国纽约州、英国英格兰、英国苏格兰、澳大利亚昆士兰地区等国家和地区均关注资源分配、利用和管理的有效性、针对性、长久性与公平性。第四个关键领域是教师合作文化与学校共同体的培育。爱尔兰、美国纽约州和加拿大安大略省均强调教师合作学习与专业发展,并倡导教师合作文化的形成,促进教师共同体的建设。
(五)强调学校自评机制建设,形成可持续性的学校改进
外部督导评估与学校自我评估(self-evaluation)相结合逐渐成为学校办学质量评价的发展趋势。学校通过自我评估对自身发展的问题和不足、面临的挑战、具备的优势条件等才能形成深刻认识;而学校自我评估可以超越外部评估带来的问责压力,真正致力于学校改进的发展性目标,促进学校改进的可持续性。因此,各个国家和地区均将学校自评机制建设和能力提升作为衡量学校办学质量的重要标准。将学校自评机制和能力纳入学校办学质量标准也反映了从“元评估”的视角考察学校评估过程的发展趋势。[52]
许多国家和地区均把学校自我评估与学校可持续性的自我改进紧密联结,将“以学校可持续性改进的自我评估”作为衡量学校领导力与管理水平的重要标准。美国纽约州把学校评估能力与机制建设视作“学校制度和组织”的重要组成部分,并将其视作学校办学的制度化和规范化的日常活动,二级指标“持续评估和持续改进”(ongoing evaluation and continuous improvement)所考察的内容涵盖学校领导者与管理者对于自身学校评估和改进的整体把控能力,如设定长期与短期目标、目标执行力和完成程度、评估数据的收集及分析的能力等。[53]新西兰学校质量评价标准一级指标“致力于改进和创新的评价、探究和知识构建”(evaluation,inquiry and knowledge building for improvement and innovation),强调完善的学校评估制度的重要性,其包括“创造评估、探究和知识建设的条件”“使用适当的方式进行评估”“评估、调查和知识建设有助于参与外部评估并为更广泛的教育界做出贡献”等具体指标,强调完备的自评条件、科学的评估方法以及自评与外部评估的联结。[54]英国苏格兰更是明确将“致力于自我改进的自我评估”作为回答“学校领导力和改进路径有多好”的首要标准,他们侧重于考察学校自评的合作模式(collaborative approaches)的建立,强调不同利益相关者是否理解、认同学校自评的理念和目标,并积极参与学校自评活动;同时,考察是否将自我评估建立在数据与证据资料分析的基础之上。[55]
(六)构建多方合作伙伴关系,倡导协同支持网络与教育生态的建设
学校办学质量保障是一项系统性工程;作为重要利益相关者,家长与社区也是评判学校办学质量高低的重要主体。围绕学生学习和发展这一共同责任,学校需强化与校外各方主体的合作伙伴关系、构建协同支持网络、建设良好的教育生态环境。学校能否激发家长等多方主体的共同责任理念而形成制度化、体系化和高效的多方合作伙伴关系,也成为衡量学校办学质量的重要标准。[56]
许多国家和地区均将家长及社区参与、家校合作、学校社区伙伴关系列为衡量学校办学质量的一级指标,凸显出构建多方合作伙伴关系、建立“强有力的教育联结和关系”(educationally powerful connections and relationships)的重要性。“有效地支持孩子学习和学校改进”是加强学校与多方主体的教育联结的根本目的。除此之外,不同国家和地区考察合作伙伴关系的侧重点也有所不同。例如,美国纽约州侧重家长和社区参与的制度建设,特别是双方信息沟通机制、参与赋权机制与关系运营机制的完善。[57]英国苏格兰、澳大利亚昆士兰将合作伙伴关系从家长和社区延展至“第三方机构、公共机构以及商业组织”“其他教育和培训机构、地区企业机构和社区组织”等潜在的合作伙伴和更广泛的社群,致力于协同支持网络的建设。此外,加拿大安大略省、美国纽约州、新西兰等均强调互利互惠、合作文化和共同提升的合作伙伴关系,质量评价标准会评估学校是否为家长提供学习机会、资源和支持,帮助家长支持学生学习。
四、学校质量标准运行机制的国际比较
通过考察八个国家和地区构建的严谨、规范、完整的学校质量评估程序,我们可以发现许多国家和地区的学校办学质量评价标准的实施和运行机制呈现四个特点。
(一)学校质量评价决断以等级评定制和标准达标制为主
学校办学质量评估“不仅在于识别好学校所具备的特征(即设定标准),更在于基于这些特征对学校的实际表现做出判断”[58]。根据学校办学质量标准及其指标体系,评估主体须对学校的办学质量和水平进行评价诊断。无论是学校改进式的过程性评估还是问责式的奖惩性评估,无论是学校自我评估还是外部督导评估,对学校办学质量进行评估决断都是必不可少的重要环节,进而形成对学校办学质量和水平的结论性判断。一般而言,学校评估决断大致有分类、分等、给分、分配等四种形式[59]。八个国家和地区对学校办学质量的评估结果的决断形式大致可分为两种模式:一是等级评定制,二是标准达标制,以等级评定和标准达标方式对学校质量高低做出决断。
所谓等级评定制是遵循分类逻辑的一种学校评估决断方法,根据学校办学质量评价标准的指标体系,将学校在不同指标上的具体表现纳入不同类别,形成一定的等级结构(如,优秀-良好-中等-较差)。[60]采取这一学校评估决断模式有美国纽约州、英国英格兰、英国苏格兰、荷兰、澳大利亚昆士兰地区等,其中,尤以四分等级最为多见。例如,纽约州将学校办学质量评估结果分为四个等级——高效能(highly effective)、有效(effective)、发展中(developing)、低效(ineffective),并详细阐明具体指标不同评定等级的表现和标准,对学校在每个三级指标层面是否达到相应的等级水平进行细致的规范。同样的,英国英格兰在所有学校督导评估决断中也采用四点评分标准(fourpoint grading scale)对学校质量高低进行评定:第一等级“卓越”(outstanding),第二等级“良好”(Good),第三等级“需要改进”(requires improvement),第四等级“不合格”(inadequate)。[61]
除了通过评定等级的方式进行学校评估决断之外,也有一些国家和地区采用的是标准达标制的模式作为评价学校质量结果的一种形式。“标准达标制”的特点是评估主体没有设定具体评价等级,而是根据学校办学质量指标的要求,对二级指标或三级指标的具体要求进行详细论述,列举相应的实践和做法以作为合格的标准,考察学校的表现是否达到相应的标准和要求。采用标准达标制的有新西兰、爱尔兰两个国家。新西兰在设定指标框架和层级的同时,并没有建立相应的等级评定制度,而是以“有效实践”的方式阐明二级指标的具体要求并形成一定的评价标准,但并没有进一步细化学校表现的不同等级与水平。[62]爱尔兰同样采用标准达标制,无具体评价等级,详细阐释二级指标的标准,并区分“有效”与“高度有效”两类结果。[63]
(二)学校质量标准成为学校自我反思、评估和改进的参照标杆
学校质量标准是全方位评估学校办学环境、过程、投入和成果的重要依据。运用学校质量标准对学校进行的督导和评估可以区分为“高问责”和“低问责”两种取向:前者强调基于质量标准对学校的问责与管控,而后者则侧重于借助质量标准促进学校改进。[64]八个国家和地区在学校质量标准的运用层面均强调:学校质量标准不应成为僵硬机械和“一刀切”的学校评估、排序和问责工具,也并非“自上而下”地审查学校办学情况的列表清单或检查表。相反,学校质量标准及其延伸的评价指标体系应发挥指导参照、激发反思的功能,进而实现促进学校自我评估、自我改进的目的。
例如,爱尔兰强调《学校质量框架》应被视作“自我反思和改进的赋能者,而非固定不变的清单”,特别强调学校质量标准的首要功能在于成为促进学校领导者与教师的自我反思(self-reflection)、集体反思(peer-reflection)与结构性反思(structured reflection)的工具,进而提升教师的教育教学能力,改善学校领导与管理效能。[65]荷兰也明确在《学校督导框架》中设定“基本质量”(back quality)和“自定维度”(self-defined factor)两种方式,以此在保证基准线的同时,促进学校参照质量标准和提升自我评估的效能并追求卓越。[66]澳大利亚昆士兰地区同样也将学校质量标准作为促进学校“自我反思”(self-reflection)的工具:学校可以对照质量标准,而找准自己的定位,识别自身在改进路径中所处的位置,以及未来可以采取的改进策略。[67]英国苏格兰设定学校质量标准的目的同样在于促进学校自我评估的有效性,并提出学校质量标准旨在帮助学校“向内看、向外看、向前看”:向内看(looking inwards)是指通过有效的自我评估了解自身;向外看(looking outwards)是指学习他者的经验并反思自身的理念和实践;向前看(looking forwards)是指探索学生的未来发展,寻找实现未来目标的路径。[68]
正是基于将学校质量标准视为学校自我反思、评估和改进的参照与标杆而非一一对照的列表清单,许多国家和地区明确指出,学校质量标准的运用和设施应是灵活的、有针对性和有选择性的。英国英格兰尽管对学校质量标准的五大领域均设定了相应的“评分描述”(grade descriptor),但是也强调这些评分描述并非对照表,评估者应根据自身的专业判断做出最佳拟合的结论。[69]英国苏格兰也认为,学校质量标准应发挥工具箱的作用,不同利益相关者群体都可以在运用时进行改编和调整,以此形成“合作探究和讨论的学校自评路径”。[70]爱尔兰更是明确指出,尽管《学校质量框架》试图对学校办学情况进行全面规范,但是,具体实施过程中,应允许评估者或评估对象对学校质量标准进行有针对性、适切性的选择,才能使评估标准与学校的特定情况、目的和要求相契合。[71]
(三)以证据为本的质量评估路径,并强调证据来源的多样性
学校办学质量评价标准是指引评估者寻找、收集、分析相关证据的指南;若无证据支撑,质量标准也将停留在理念倡导上,而无法真正对学校质量做出科学客观的判断。通过考察八个国家和地区的学校质量评估的程序及其对证据资料的描述,我们可以发现:量化数据与定性判断等多样的数据资料的收集、分析,进而形成相互印证的证据链,是各个国家构建的以证据为本或证据驱动(evidence-driven)的学校质量评估的重要特征。
典型的如,英国苏格兰对学校质量评估过程所建构的“证据的三角互证”(triangulation of evidence)模型,强调学校质量评估过程及其结论的形成应建立在可靠证据的基础之上,并进一步提出了三种证据来源:一是各领域的量化数据(quantitative data),如学生学业成绩、出勤率等;二是各利益相关群体的评价(people's views),应通过调查、访谈、会议等方式收集教职工、学生、家长的看法;三是对学校办学活动的直接观察(direct observation)。[72]不同来源的证据资料相互印证并经综合分析而最终得出学校质量高低的判断。美国纽约州学校效能诊断构建了也强调学校和审查人员应根据DTSDE 收集丰富而多样的资料,如围绕学校办学而浮现的各种量化数据,通过问卷调查、审查校内文件、访谈、焦点团体访谈、学生座谈、观察、课堂观察、听取报告等多种活动收集的证据。[73]英国英格兰同样对“证据的收集和记录”从程序和内容上均做了详实的规定。例如,督导员需利用各种机会收集和记录与学生学业表现有关的正式的或非正式的证据,通过实地观察和访问课堂等方式收集学校课堂教学、学习和评估的资料,与学生、家长、学校管理者以及其他人员进行会谈等。[74]简言之,在制定学校质量标准及其指标体系之后,学校质量评估过程需要多样化的证据支撑,才能获得可靠的评估结果以及相应的改进建议。
(四)注重学校质量评估后的反馈与跟进
学校办学质量评估的根本目的在于推动学校质量改进和办学效能提升。因此,如何将评价结果与评估对象(即学校)以及家长、社区、地方教育行政部门等利益相关者反馈就显得十分重要。本研究所考察的八个国家和地区都明确表明,制定学校办学质量评价标准并据此开展学校评估,根本目的在于鉴别学校质量水平、识别学校发展困境,进而协助学校(特别是薄弱学校)提升办学效能与质量。因此,许多国家和地区均注重学校质量评估后的反馈与跟进,将结果反馈、提出改进建议和跟进学校改进计划纳入制度化的评估程序之中,成为必不可少的环节。
例如,英国英格兰在学校评估程序中设置了“提供反馈”(providing feedback)的专门环节,要求在评估结束之后学校督导者必须与学校校长、领导者、管理者等召开评估反馈的专门会议,督导者必须将评估结果、判断依据以及相应的细节与与会人员交流,同时提出相应的改进建议。[75]荷兰同样在评估程序中设置了“反馈会议”(feedback meeting),以此确保评估结果获得学校的认可和重视,并在促进学校改进中发挥作用。[76]澳大利亚昆士兰对“评估后”的反馈、跟进等进行周全的设计。评估小组需要与学校管理层进行交流,反馈评估的主要发现和结论以及改进策略,并在之后协作学校制定改进的行动方案。同时,评估小组成员将定期对评估到学校进行追访和跟进,确保学校改进方案的制定、实施及其成效。[77]美国纽约州要求评估人员必须基于DTSDE 对每一所薄弱学校,形成有针对性的评估总结报告,称之为“DTSDE 现场需求评估最终报告”。该评估报告必须就所评估的薄弱学校的改进方向和内容提出具体、可行、可操作的建议。纽约州还发布了一份指南性文件,对评估人员如何提出改进建议进行规范和指导。[78]
五、讨论与启示
学校评估以及伴随评估结果而采取问责与改进措施已成为许多国家和地区监控和提升学校教育质量的重要途径。世界各地学校评估的话语体系也逐渐从强调督导(inspection)向重视质量(quality)转变。在质量话语的浪潮中,标准化和结构化学校评价指标进而设定质量标准成为学校评估所倚重的关键工具:设定以质量标准、规范和期待为核心的评估框架是学校评估的首要环节,并将影响到学校评估是否能够发挥促进学校质量提升的目标。[79]本文详细考察了八个国家和地区学校办学质量评价标准的制定实施主体、形式结构、指标设计、运作机制,为完善我国中小学校办学质量评价标准体系提供可资借鉴的建设思路。
首先,学校质量标准制定与实施机构可采取“政府主导、相对独立、坚持专业”的建设路径。八个国家和地区将学校质量评价标准的制定与实施纳入政府学校评估问责与教育督导政策,评估机构凸显政府主导色彩,同时强调标准制定与评估实施的专业性、权威性和相对独立性。政府主导质量标准的制定与实施已成为许多国家的共同选择。[80]但在强调政府主导的前提下,也应通过完善组织建制、明确权责划分、构建专业评估队伍等方式来保障标准制定与实施机构的相对独立性以及其评估活动的专业性。[81]
第二,学校质量标准的形式结构可借鉴“领域-维度-指标-具体监测点”的由抽象到具体、层层递进、逐级分解的树状结构呈现模式,以实现学校质量理念和指标的具象化、精细化和可操作化。八个国家和地区均设置了二至三层的树状评价指标,并辅之以具体监测点对指标含义进行详细论述。树状结构的质量标准体系有助于明晰和理顺评价指标之间的逻辑关系,形成自成一体、逻辑自恰的质量标准。同时,以描述性、列举式、案例式或条规式的国际通行写法对末级指标均进行详细规范和阐释,可将质量理念和评价标准转化为可观测、可衡量的具体监测点,在评价指标与纷繁复杂的办学实践之间建立强联结,进而可提高评价指标的可理解性、增强评价过程的可操作性。
第三,学校质量标准的指标设计可遵循“投入-过程-产出(成果)”的基本逻辑[82]。将学校教育成果和学校教育过程两者纳入学校质量评价领域是国际上通行做法[83]。本文所考察的八个国家和地区也同样遵照这一逻辑,并反映了指标设计的全面和综合的特点,囊括学生发展,课程教学评价,学校管理、组织和领导,合作伙伴关系,学校自我评估和改进等多个领域。但是,这一指标设计的思路也可能使得评价指标体系过于庞杂、下设指标过多,评价结果难以综合,且指标之间易于重叠。[84]鉴于此,在指标设计和选择上,我们可采取“综合评价,分别设计,特色灵活”的开发路径:“综合设计”强调鉴于学校办学活动的复杂性与质量标准的多元性,应坚持系统性思路,构建全面而综合的质量标准体系;“分别设计”则针对重点领域(如学生发展、课程教学、学校管理、合作关系),分维度、分领域地开发相应的子指标体系以及相应的子标准;“特色灵活”则强调学校质量标准应构建并囊括特色指标和不同侧重点,并将其设定为可选指标,让地区或学校可根据自身情况灵活选择或做相应调整。[85]
第四,学校质量标准的运行机制可从以下四个方面加以完善。在评价决断层面,可借鉴八个国家和地区学校质量评估决断形式,不宜采用侧重于奖惩问责的纯量化的指标打分制,而可采取等级评定制,同时对每个评价领域及其具体指标设定相应的绩效标准,设定相应的合格基准线与卓越标准。在质量标准的功能定位方面,评价指标的运用应着眼于提升学校质量意识,主要发挥指导参照、激发反思的功能,进而促进学校自我评估、自我改进,而非对学校分类排名、奖惩问责。在评价依据层面,应坚持“证据为本”评价理念的同时强调多样化的证据支撑,注重全面、客观、准确地收集学校教育质量的相关信息,并倚重专业评估者的专业判断。在评价结果运用层面,评估机构应加强评价结果的反馈力度,形成评估者与评估对象互动协商的评估机制;提高评价结果在一定范围和限度内的公开程度,满足利益相关群体的知情权并形成一定的社会监督力量;评估机构应针对评估的每所学校出具相应的学校办学质量诊断书、改进书或建议书,并实时跟进以协助学校精准改进。[86]