运用增值评价助推教育公平和质量提升
——以包头市普通高中学业质量增值评价为例
2021-12-28包头市教育督导评估中心
● 包头市教育督导评估中心 董 军
中共中央、国务院印发的《深化新时代教育评价改革总体方案》中提出,坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性。
2017年9月,包头市运用信息化技术手段,采用“从入口看出口,从起点看变化”的增值评价理念,在全市公办普通高中启动第一轮学业质量增值评价实践探索,并于2020年高考结束后,首次发布了普通高中学业质量增值评价报告,将评价结果纳入了高中学校办学质量综合评价体系中。本文尝试以包头市增值评价组织实施工作和《2020年包头市普通高中学业增值评价报告》的数据,来探析增值评价如何推进普通高中育人方式的改革,改变唯分数、唯升学的单一评价方式,引领社会树立科学的教育质量评价观,进而推动教育公平发展和质量提升的积极导向作用。
一、基本情况
(一)监测对象与内容
包头市普通高中学业质量增值评价,第一轮监测对象为30所公办普通高中(一批次招生学校18所,生源条件相对较高;二批次招生学校12所,生源条件相对较低)2017年秋季高一年级的学生。监测内容为学生的学业成绩(高考科目)、学生认知能力和学生、教师、校长相关影响因素。(如表1)
表1 招生批次与学校代码对应表
(二)监测方式与目的
监测以统计分析学生学业成绩增值表现为主,辅以学生认知能力测试和学生、教师、校长在线问卷调查。监测期内要形成起点、学年和高考三个阶段六个评价报告和学生发展指数报告、两次问卷调查数据。
不同阶段的评价报告,主要是基于客观数据呈现的学业成绩增值变化情况来评价学生的进步程度,进而反映学校在一定时间内的办学效能。学生发展指数报告和问卷数据重点是通过对学生认知能力、学习动机等发展指数和学习背景因素,以及学校管理和教师专业发展、教学表现等学业影响因素的分析,为学校和教师提供多维度的教育教学改进视角与思路。
(三)数据来源与分析方法
学业起点报告数据来源于基线测试(高一学生认知能力纸笔测试)与高考科目对应的中考成绩,作为评价的“基准”(即“前测”),此后又分别采集学生高一学年末、高二两学期、高三上半学年和高考成绩作为“后测”,用以判断学生“后测”结果相对于“前测”的进步程度。
《2020年包头市普通高中学业增值评价报告》的数据是以30所高中学生的中考成绩为“前测”、高考成绩为“后测”,对文理科分别统计分析形成的学业评价报告。文理科“前测”与“后测”的匹配学生样本量分别为5058人和7301人,占有效高考人数的比例分别为86.31%和92.06%,具有代表性。
本增值评价各阶段学业报告中的总分和各科目均使用多水平线性回归模型计算其增值,以学生个体的“前测”成绩预测学生“后测”应达到进步值。例如,学生A和B语文起点成绩分别是67分和79分,预测高考成绩分别为87分和92分,实际高考成绩为93分和95分,则学生A和B语文学科的增值分别为6分和3分,虽然学生A和B的语文高考成绩均高于预期,但是,学生A的进步幅度更大(示例以分数直观呈现易于理解,实际算法较为复杂,非简单地直接比较分数高低或差值)。
二、结果分析
《2020年包头市普通高中学业增值评价报告》从全市、学校、学科层面出发,以翔实的数据对不同层次的学校、不同等级的学生高考文理科总分和各科目增值表现进行了统计分析,客观反映出学校的进步程度和办学效能。下面笔者以高考文理科总分增值数据为例进行分析。
(一)不同层次学校的增值表现
从文理科总分成绩整体增值趋势来看,分别有70%的学校增值达到或超出预期,高起点和低起点学校均实现不同程度的进步(增值)。(如表2)
表2 不同层次学校增值情况分布
从评价结果来看,分数结果评价与增值评价的差异明显。以分数结果来衡量学校时,高起点与低起点学校的高考成绩与招生批次显著关联,生源质量相对较好的一批次学校高考成绩也相对靠前,而生源质量相对较差的二批次学校的高考成绩普遍靠后;以增值评价来衡量学校时,低起点学校进步幅度(增值)与高起点学校有了“平视”的机会。例如,高考文科均分相对靠前的学校都是一批次招生学校,较中考(起点)相对位置没有显著的变化;如以进步幅度(增值)进行比较,则一些二批次招生学校增幅显著高于一些一批次的学校。
(二)不同层次学生群体增值表现
从不同等级潜力生的高考表现来看,高分段和低分段学生群体增值不够突出。以中高考人数匹配后的理科为例,660分以上和600分以上(不含660分及以上)两个高分段的潜力生分别为47人和399人,其中分别有21人和209人高考成绩达到或超出预期,占比为44.68%和52.38%,且两个高分段的学生所在学校的增幅普遍低于市均值;中考处于后端的潜力生,只有48.23%的学生高考成绩达到二本及以上,增幅普遍未达到预期。(如表3)
表3 理科总分不同等级人数分布比例
从学生的学业进步程度来看,各科目不同增值分区间的学生比例与其学校的起点(招生批次)没有太直接的关联。例如,“学校2-8”与“学校1-1”生源差异较大,前者起点和高考成绩(总均分)与后者相差都在160以上,而“学校2-8”文理科总分增值分区间达到平均进步程度及以上水平的学生比列却高于“学校1-1”(如下图)。
图 不同层次学校增值分区间学生比例分布(%)
(注:学生增值分区间由高到低分为三类:增值分≥0.75,即学生增值分区间为[ 0.75,+∞)。它描述了在某一科目上进步程度高于平均水平的学生所占的比例,比例越高,表示该校在这一科目上的教学效能越高;-0.75<增值分<0.75,即学生增值分区间为( -0.75,0.75 )。它描述了在某一科目上进步程度符合平均水平的学生所占的比例;增值分≤-0.75,即学生增值分区间为( -∞,-0.75 ]。它描述了在某一科目上进步程度低于平均水平的学生所占的比例,比例越低,表示该校在这一科目上教学效能越高。)
三、结论与思考
基于以上结果分析,可以发现,增值评价具有较为合理的评价理念及科学的统计方法,相对单一的分数结果评价,其在很大程度上对学校评价更加客观公平,同时也为教学改进提供了一定的导向。
(一)增值评价更能体现全面性
传统意义上,人们往往仅以高考分数和升学率来衡量高中学校办学质量和学生学业发展水平。而增值评价计算增值需要对每个学生的每个科目的成绩增效进行运算,学校的增值实际是由学生个体增值“累加”而成,学生增值越显著,学校办学效能就越突出。所以,增值评价可以引导学校评价从“关注高起点学校和高分段学生”向“关注全体学生的学业发展”转变,由单一的分数结果评价向“关注学生进步幅度”和“学校对学生进步助益程度”转变。
(二)增值评价更能体现公平性
学生成绩的好坏不仅取决于学校的教学质量,还有许多不可控的因素在起作用。往往起点条件好、生源质量高的学校一般都具有高考成绩好的“天然优势”。例如,在上述30所学校中,一批次学校相对拥有较高的起点和较好的生源条件,办学条件和师资力量也相对较好,学生获得校外资源与培训的机会更多,如果单纯以分数结果评价,这类学校排序一般都要靠前。因而使用增值评价对学校而言更公平,因为其减少了学校起点因素、生源因素和外部条件所带来的影响,是一种更为公平的评价方式。
(三)增值评价更能激发竞争意识
目前,单一的分数结果评价机制过于强调甄别和选拔功能,忽略了评价的激励和改进功能。例如,上述30所学校的中高考成绩排序比较,没有发生显著的改变,而采用增值评价衡量办学效益时,“学校1-1”和“学校1-2”等一些传统优质的学校排序发生较大幅度的改变,甚至个别学校为负增值,这必然会让传统优质的学校产生危机意识,而诸如“学校2-8”和“学校2-9”等生源起点低、相对薄弱学校则有了信心。因此,增值评价有助于促进学校良性竞争、优化绩效考核,更好地激发学校的办学活力、调动教师的主动性与积极性。
(四)增值评价不仅仅只关注结果
虽然目前的增值评价仍然主要是基于分数成绩的评价,但在技术层面完全可以既关注结果,也关注过程。包头市增值评价的起点和四个阶段的报告重点就是关注过程性评价,发挥诊断和导向功能,形成学生学业发展曲线,帮助学校和教师找准教学出发点,发现学科增值薄弱点。例如,在高考学业增值报告中,对不同等级潜力生的变化分析,可以引导学校“育峰(高分段学生培养)”和“托底(低分段学生培养)”并重。
总之,增值评价技术的运用,可以引导学校在原有基础上努力取得更大的进步,这种“因校施评”的评价方式,使每一所学校无论起点高低都有了发展的空间和努力的希望,更有利于推动教育公平和教学质量的提升。