上海市基础教育质量评价改革十二年实践
2023-04-20汪茂华
汪茂华
【摘 要】上海市教育质量评价体系的探索与形成涵盖了丰富的内涵,主要包括:功能定位、评价指标、评价模式、评价实施系统、评价结果运用、效能支持系统。这一套体系已在上海市取得显著成效,主要表现在:义务教育优质均衡状况、学校办学活力、教师课程领导力、人民群众教育获得感、学生学习状况方面。
【关键词】教育质量评价 “绿色指标”综合评价 义务教育质量评价改革
2011年3月,上海召开了21世纪以来的第二次基础教育工作会议。会议指出,上海基础教育必须在“教育价值观念”“教育质量评价”“学生培养模式”“教师专业发展”“教育管理方式”五大方面实现转型发展。其中,对教育质量评价提出了“要从过度注重学科知识成绩,转向全面而多样的综合评价”的要求。为了贯彻落实会议精神,同年11月,上海市教委公开发布了《上海市中小学生学业质量绿色指标(试行)》的实施意见,开启了基础教育质量评价的实践探索,十二年来,已形成具有地方特色的教育质量评价体系。
一、明确了教育质量评价的功能定位
为何要开展教育质量评价?如何开展教育质量评价?整个教育系统必须首先达成共识,才能保证教育质量评价不偏离正确的方向。
1. 导向建立正确的价值观念
教育质量评价是教育价值观的体现,有什么样的评价指挥棒,就有什么样的办学导向。上海市基础教育质量评价指标包括十大方面,这十大方面体现了教育质量的构成性,它包含学生的学业水平、品德行为和身心健康等诸多领域的发展。教育质量具有关联性,包括影响学生发展的个体、教师、校长、家庭等各方面的相关因素。教育质量具有发展性,包括学业水平及相关因素的进步和均衡化程度。
2. 诊断上海基础教育的发展状况
开展基础教育质量评价的目的不是为了对学生进行选拔,也不是对区县和学校进行排名,而是为了全面了解教育质量的现状水平。提高基础教育质量的重心就是要解决学业成就背后的关键问题,通过质量评价可以将这些遮蔽的问题“暴露”出来,发现自身的不足,为进一步改进教学和调整策略提供科学依据,突破以学科知识传授为主的单一质量追求,更加关注以人的全面且多样发展为特征的全面质量。
3. 改进教育决策、学校管理及教学行为
教育是一个复杂的系统,教育质量的现状水平是多种因素共同作用的结果。其与省市(区域)教育政策的制定、教学研究的指导、学校的教育管理、教师的课堂教学、家庭的养育方式以及学生的个体特质等状况都紧密相关。不能简单地将质量评价结果的压力全部传导到学校和教师身上,因此,改进行动要从多层面、多维度、多视角切入。
随着工作的不断推进,教育质量评价项目的名称从2011年的“上海市中小学生学业质量绿色指标综合评价”修改为2015年的“上海市中小学学业质量绿色指标综合评价”,这一名称转变的背后,体现的是对教育质量评价功能定位的认识更加明确。调查信息从学生层面获取,但其结果指向的并不是个体学生,而是整个区域的教育行政决策、教学研究指导及学校教育治理。
这十二年来,我们始终把握好“高关注”与“低利害”之间的关系。一方面要求区、校高度重视质量评价,认真组织学生、教师、校长和家长参与调查活动,但强调不突击、不作假,常态化开展;另一方面不将评价结果与校长、教师绩效和学校评先评优挂钩,要求学校不得将评价结果与教师绩效、职称评聘等挂钩,消除校长、教师的后顾之忧。
二、完善了指向立德树人的评价指标与内容
2011年,从教育质量的内涵、基础教育转型发展中存在的问题和已有的教育评价实践出发,上海市研制了“学业水平”“品德行为”“身心健康”“学业负担”“学习动力”“师生关系”等十大指标(简称“绿色指标1.0”)。根据《教育部关于全面深化课程改革落实立德树人根本任务的意见》《义务教育学校管理标准(试行)》《关于深化教育体制机制改革的意见》等相关文件要求,顺应国家和上海教育改革的新形势,2018年开展了评价指标的修订完善,目前已形成“绿色指标2.0”。
1. “绿色指标2.0”体现了“德智体”向“德智体美劳”五育并举的转变
一是在原来仅包括“行为规范”“亲社会行为”这两个二级指标的“品德行为”下增加了“国家认同”和“国际视野”这两个二级指标,同时也将一级指标的名称修改为“品德与社会化行为”指标。二是在“学生学业水平”指标下增加了“学生艺术素养”。从2018年起,小学和初中都增加了艺术学科测试,体现出對学生美育的关注。三是在2021年新一轮的调查内容中增加了对学生劳动观念的调查。
2. “绿色指标2.0”适时更新调查内容,回应教育热点
根据《关于组织责任督学进行“五项管理”督导的通知》《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》《关于减轻中小学教师负担进一步营造教育教学良好环境的若干意见》等文件的精神,在2021年的学生问卷中增加了“校外补习”“作业实施”“课后服务”等内容,在教师问卷中增加了“身心健康”“职业幸福感”“教学资源应用”等内容,在家长问卷中增加了“学校家庭教育指导”“家长教育理念”“家长学业参与”等内容,体现出新时代教育发展的新特点与新要求。
三、构建了注重“科学”和“效率”的评价模式
1. 建立了“三年一测”的测评制度
在评价改革初期,为了让区县和学校明确质量评价的指标和内容,熟悉质量评价的程序和办法,2011—2014年,每年都对四、九年级的学生及教师开展调查。但教育质量的水平状况带有稳定性,存在的问题也带有长期性,很难在一年期间有很大的改变,因此“一年一测”的测评制度不是很合理。从2015年起,将评价的频次修改为“三年一测”,即以三年为一个周期,一年开展九年级测评,一年开展四年级测评,最后一年不测评。
此外,这种测评模式又建立了五年一个循环的学生纵向发展追踪数据库。由于三年一轮,九年级的测评年份为2015年、2018年、2021年等,四年级的测评年份为2016年、2019年、2022年等,因此,凡是在小学参加过四年级测评的学生,到了初中正好能参加九年级的测评,这为增值性评价的开展提供了重要的基础,为追踪、分析学生在学习上变化发展的趋势,检验基于课程标准的课程与教学实施成效,科学制定教育发展政策和有效提供公共服务给予了信息支撑。
2. 建立了“信息互证”的评价策略
为了增强调查设计的科学性,增加调查结果的真实性和可靠性,研究者设计了跨级调查。即对同一个监测指标,从不同的调查对象获取评价信息。如对教师教学方式的调查,不仅会让教师自评,也让学生进行评价。对校长课程领导力的评价,不仅让校长自评,也让教师进行评价。此外,从2015年起,还增加了家长问卷,这就让从学生层面获取的信息和从家长层面的信息实现了互证,同时,也拓展了部分信息获取的来源。
3. 建立了矩阵取样的设计方法
随着评价指标的增加,调查内容也在不断丰富,让同一个调查对象完成对所有调查问题的回答,既不合适也不科学。因此,对调查内容进行矩阵取样设计来缩短学生作答的时间,增强其参与的动机。以学生问卷为例,将所有的调查内容分成A、B、C三组,不同的组之间既有相同的内容,也有不同的内容,这样可以通过相同的内容作为桥梁,对不同对象的调查结果进行等值处理,全面刻画出学生总体在这些评价指标上的表现。每一名样本学生也不必参与所有学科的测试,而是将测试的学科分成四个组合,组合一为语文和科学,组合二为数学和英语,组合三为艺术和科学,组合四为艺术和英语,每名学生只随机参与其中一组科目的测试。这种测试科目的矩阵取样有效降低了调查对象的负担,提高了测评的效率。
四、形成了规范的评价实施系统
教育质量评价的实施涉及测评工具研制、考务管理、阅卷评分、数据分析和报告撰写等环节。从近十多年的实施情况来看,每一个环节的实施质量都会影响到整个评价工作的品质。为了保证评价工作的顺利开展,在评价实施的每一个环节都建立起了比较规范的工作流程。依据工作流程及其要求来开展工作,成为一种制度要求。
1. 建立了测评工具研制流程
如在学科评价工具研制中,建立“测试框架研制—试题编写—学生访谈—试题修订—预测试—试题分析—专家审议—试题组卷—试卷定稿”等规范化程序。问卷编制时,依照“核心概念界定—试题编写—对象访谈—问卷试测—试题修订”的流程开展问卷研制。
2. 形成了评价数据处理方法
通过学科测试、问卷调查、现场观测获得的数据资料,运用测量学、统计学的方法进行处理。综合运用经典测量理论和项目反应理论对评价数据进行处理,如采用安哥夫(Angoff)法和书签(Bookmark)法进行学业水平标准设定,运用多层线性模型统计教育质量的均衡程度等。
3. 开发了评价报告生成系统
系统研究PISA、TIMSS、NAEP等大规模教育评价项目数据库建设的经验,开发了集学科测试类、调查类、管理类数据存储与查询分析及报告生成等功能于一体的平台。在此基础上建立了“一区一报告”“一校一报告”制度。
4. 形成了评价数据解读的维度
教育质量评价数据可以从空间维度,以市、区各项指标的均值作为参照,重点解释学校在空间结构上的运转秩序和发展活力。从时间维度,以本校历年指标结果作为参照,重点解释学校在纵向时间上的发展周期和变化趋势。从主体维度,分析指标数据之间的关联,重点解释校长、教师、学生、家长之间的彼此协调与相互配合,共同促进学生发展的状态。
五、建立了评价结果运用的路径
加强对评价结果的运用是教育质量评价功能发挥的落脚点,评价结果的解析与改进实践更是对中共中央、国务院《深化新时代教育评价改革总体方案》中“完善评价结果运用,综合发挥导向、鉴定、诊断、调控和改进作用”这一要求的现实回应。
1. 围绕调查数据开展专题分析
分别以学生层面的学业发展、品德发展、身心健康等指标作为结果变量,深入挖掘影响这些结果的因素及其作用的路径与机制,形成影响学生学业成绩的因素分析、师生关系与学业成绩的关系、学习自信心的中介作用等一系列文章,为教学行为改进和教育决策制定提供了比较充分的信息。
2. 加强对薄弱学校的支撑,提供教学改进服务,发挥评价的“增值”功能
针对薄弱学校的情况,整合市、区、校三级教研的力量,在学生学习习惯、教师教学方式、学校教学管理、家校溝通合作等方面开展深度调查。发现原因后,提出有针对性的改进措施,组织专业力量对学校的教学改进提供相应的支持。
通过行政引导,形成了“提升质量、促进公平、过程科学”的教学改进目标共识,厘清基于数据的决策步骤,在评价数据和学校使命与目标间建立联系。采取“问题确认—专家指导—过程调控—展示交流”的路径,促进教学改进的持续深度探索。
3. 对区、校在教学改进实践中形成的经验进行总结提炼
利用绿色指标综合评价的数据,分析区、校在不同年度间的纵向发展情况,找出在各个方面都进步比较明显的学校。深入学校进行访谈和调查,全面了解学校在课程开发、课程实施、课程管理和课程评价中的做法,分析各个环节中提升学业质量的关键举措及其作用的机理,开展展示交流活动,对区、校在改进实践中的经验进行辐射推广。
六、构建了评价效能发挥的支持系统
要发挥教育质量评价的导向、诊断与改进功能,需要对影响成效的要素进行分析,对改进的成效进行再评估。
1. 开发教师研训课程,提升教师数据素养
教师读不懂评价结果报告,数据素养相对欠缺。教育质量评价报告中一般包含教学质量现状水平的描述,不同群体差异的呈现,不同变量间关系的分析,涉及百分比、平均分、标准差、影响系数、效应量、显著性等统计参数或专有名词。对于一些常见的参数,教师比较熟悉,但是对于比较陌生的统计参数,教师就很难理解这些参数所代表的意义,更不用说通过这些指标与教育教学中的问题、现象建立起必要的关联,因而也就造成了漠视数据、用错数据的状况。对于一些具有数理统计基础的教师来说,选择合适的方法,建立起正确分析数据的模型也并非易事。
对标新时代教育评价改革总体方案,从“改进结果评价、强化过程评价、探索增值评价、健全综合评价”对教师评价能力的要求,采用文献研究、专家咨询和问卷调查相结合的方法,厘清了教师数据素养的内涵及其表现特征。围绕数据素养内涵及其要求,形成了主题式、模块化、任务驱动的体现研修课程特色的开发路径;以课程纲要编制为抓手规范课程开发,构建“案例分析→程序操作→原理解读→实践操作”四个环节的研修课程,以过程评价和目标激励来激发教师学习动机,促进教师数据分析能力的提升。
2. 對改进的过程进行评价,对改进的成效进行评估
各学校在开展教学改进的过程中,开展了教研活动、案例研究,但也存在针对性不强、有效性不高、推广性较弱的特点,其原因一方面是对问题的成因分析缺乏必要的方法和研讨的机制,另一方面是对成效的分析缺乏有效的技术支持和必要的条件保障。
聚焦改进过程及其成效,研发支持工具。围绕问题解决的过程,针对数据驱动教学改进的核心环节,分别设计了支持性、诊断性、评估性调查工具。采用“内涵分析—特征提取—行为外显”的技术路径分别设计了表单、观察量表、调查问卷等,为改进目标清晰化、改进过程可视化、改进结果可测化提供了可靠的途径与方法。
同时,根据教学改进的目标,形成了包含“六要素”的数据采集指南,即“问题领域需要的数据”“想要从数据中获得的信息”“来自报告和其他渠道的学校数据”“需要收集的数据”“新数据来源”“数据收集人员”,从而提高数据采集的有效性和数据使用的针对性。
七、打造了多方协作的评价工作平台
1. “绿色指标”综合评价实施以来,引起了多方关注
2012年,国家教育体制改革小组办公室发布的《教育体制改革简报》(2012年第31期),以“上海构建‘绿色指标评价体系引导学生全面健康发展”为题,全面报道了上海的评价实践。2012—2013年,前来学习交流的地区涉及20多个省级行政区。2014年2月,“绿色指标”作为地方经验,在教育部中小学教育质量综合评价改革研讨会上作典型交流。2014年4月,合肥市人民政府和上海市教委签署合作框架,全面引入上海的“绿色评价”,采用上海同样的指标体系和测评工具开展了测试,完成了数据分析和报告撰写,反馈了教育评价的结果。
为了提升教育质量评价的水平,发挥质量评价的效能,相互借鉴学习各自的经验,2016年7月,召开了海峡两岸及港澳地区中小学教育质量综合评价会议。来自我国香港、澳门、台湾的研究者分别就质量评价系统构建、教育质量评价面临的挑战及解决的办法、四地之间的合作等话题展开了热烈对话和经验交流活动。
2. 长三角携手共建已成共识
2019年12月,中共中央、国务院印发《长江三角洲区域一体化发展规划纲要》,纲要中指出,要“研究发布统一的教育现代化指标体系,协同开展监测评估,引导各级各类学校高质量发展”。2020年11月21日,长三角三省一市负责本省教育质量监测的相关人员在上海市教委教研室召开了“长三角基础教育质量评价研讨会”,与会人员都一致同意“长三角要整合专业力量,联合开展评价项目研究,形成有国际影响力的区域教育质量评价体系”。
目前,已着手在三大方面开展合作。一是开展基础教育质量评价的课题研究,不断完善评价指标框架及评价模式;二是合作探索网络环境下交互式测评系统研发,特别是结合2022年版义务教育课程方案及各学科课程标准,深入研究学科核心素养的评价,提高基础教育质量评价的信度和效度;三是持续推进评价结果的应用实践,开展“教育质量评价结果应用”主题征文活动,举办长三角基础教育质量评价论坛,开展评价技术培训活动。
八、教育质量评价的成效显著
1. 提高了义务教育优质均衡状况
通过对评价结果报告的解读、反馈以及对评价数据的进一步分析,市、区明晰了区域教育发展的短板及其影响因素,尤其是影响义务教育优质均衡发展的薄弱环节。通过行政介入、教研跟进,有效提高了教育均衡状况。2019年与2012年相比,随迁子女民办小学与公办小学在优秀水平上的人数比例差异,小学语文从相差30%缩小为13.8%,小学数学从相差23%缩小为12.4%,说明不同类型学校办学水平的差异得以缩小。2021年与2018年相比,由区层面的因素造成上海市义务教育阶段学生学业成绩的差异,五个学科均在5%以内;由学校层面的因素造成学习成绩的差异,语文、科学及艺术学科均在20%及以下,数学和英语均在30%以内(见图1)。其中,由区层面的因素导致学生学业成绩差异的比例,中学语文下降了0.5%,中学数学上升了0.7%,中学英语上升了1.8%,中学科学上升了0.4%,中学艺术下降了2.2%;由学校层面的因素导致学生学业成绩差异的比例,中学语文下降1.4%,中学数学下降了3.4%,中学英语下降5.6%,中学科学上升了0.7%,中学艺术下降了3.3%。总体来看,区域均衡发展程度有了比较明显的提升。
2. 激活了学校的办学活力
从学校对评价结果的使用来看,“绿色指标”能够帮助学校找到闪光点和待改进之处,激活了学校的办学活力。基于全市大规模学业质量评价报告,全市900多所学校形成了校本化的教学改进方案,并开展了教学改进行动。较高水平的学校,通过对评价数据的分析,肯定了办学经验,明晰了未来的突破口;处于较低水平的学校,通过加强教学常规建设、激发学生的学习动机等多种举措,提升了学校办学品质;区域教研团队组建学校发展共同体,通过专业研修,提升了区域整体实力。教学改进路径得到广泛应用,改进成效显著。区、校实践使得从“数据衡量教学”走向“数据指导教学”的理念得到了落实。
3. 提升了教师的课程领导能力
首先,转变了教师的教学质量观念。“绿色指标”对学生发展的全面关注,引导教师全面看待学生的成长,突破以分数论英雄、以成绩论成败的传统评价观念。全面考查学生发展状况,既关注学生当下的学业表现,又关注学生的进步状况。2021年的调查结果显示,93.2%的教师在课堂上尽可能创造机会让学生向教师提问,91.7%的教师认为思考和推理过程比具体的课程内容更重要。其次,增强了教师应用数据改进教学的能力。建立基于实证数据改进教学的机制,使“教学→检测→分析→改进”逐步成为教师的自觉行为。许多学校的教师能够灵活地运用数据来改进教学,在教学内部建立起了“检测→分析→改进”的循环。最后,提高了教师关注学生学习过程的能力。教师在关注学生全面发展的过程中,及时把握每一个学生在学习进程中出现的状况并加以补救或矫正,提高了教师敏锐洞察学生学习过程的能力。
4. 提高了家长对学校教育的满意度
通过数据分析,部分学校发现家长对学校教育满意度不高的状况,在实践中通过改进作业品质、师生关系、家校沟通等举措来开展改进行动。全市四年级家长对学校教育满意度较高的人数比例从2016年的87.4%上升到2019年的96.2%,九年级学生家长对学校教育满意度较高的人数从2015年的82%上升到2021年的94%,显著提升了人民群众的教育获得感。
5. 优化了学生的学习状况
师生关系得到明显改善。以九年级为例,对师生关系评价较高的学生人数比例,从2015年的78%上升到2021年的96.7%。2021年的调查结果显示,97.4%的学生认为老师处理事情很公平,97.7%的学生认为老师关心每一位学生,97.7%的学生认为老师经常鼓励自己,97.3%的学生认为老师对学生很友好,96.2%的学生反映和老师是朋友。参加校外学科补习的学生人数比例大幅下降。2018年参与校外学科补习的人数比例为72.1%,2021年降为39.6%。学生的睡眠状况明显好转。九年级学生每天睡眠时间达到8小时及以上的人数比例从2015年的16.4%上升为2021年的27.9%。
教育质量综合评价是一个不断完善的改革实践,其深化与发展要始终立足于落实立德树人的根本任务,促进学生的健康成长,服务于教师的专业发展,提升学校的办学质量。
〔作者单位:上海市教师教育学院(上海市教育委员会教学研究室)〕
责任编辑:孙昕