基于“数据循证”的学校教学质量评价
2023-01-12李明超李学斌
李明超,李学斌
(上海师范大学教育学院,上海 200234)
教学质量评价是推动学校教学发展的“指挥棒”。然而,“唯分数、唯升学”等顽瘴痼疾仍然制约着学校教学质量评价的发展,使其难以满足基础教育改革的需要。面对这种境况,2020年10月,中共中央、国务院印发《深化新时代教育评价改革总体方案》,指出要“科学有效改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”。①中共中央、国务院:《深化新时代教育评价改革总体方案》,载中华人民共和国中央人民政府官网:http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm,最后登录日期:2022年6月26日。基于上述背景,本文在基础教育评价改革实践基础上,试以“数据循证”为据,从数据循证的价值意义、现实困境、原因探析、方案建构、实践路径几个方面作以探讨。
一、数据循证是教学质量评价的应然构成:价值论证
循证研究的基本概念来源于医学领域,后来逐渐演化成通过科学研究来寻找客观证据和确证行为有效性的研究范式。②李华,程晋宽:《循证学校改革:美国基础教育改革路径探索》,《教育研究》2019年第10期,第62-73页。本文所论的“数据循证”,指的是以教学质量相关数据作为证据而开展研究的一种方法。具体而言,它以数据科学为支撑,系统采集教学质量相关数据并形成全教学数据链;应用多元数据指标及多维数据分析方法,开展精准教学质量评价;它旨在将教师的教学投入、学生的学习实效与客观数据相结合,以充分发挥集合教学数据的诊断、反馈、激励等功能。可以说,数据循证具有多维价值,是教学质量评价的应然构成。
1.数据循证推动教学质量评价更具客观准确性
数据循证采集“时间上连续紧密、空间上相互关联、价值上丰富多元”的教学相关数据,为教学质量评价提供了最真实可靠的原始数据,使评价本身更具说服力。
2.数据循证促进教学质量评价更具集合反馈性
集合数据克服了单一数据的失真性,其背后蕴含着学生的学习态度、思维方法、自我效能感等因素,对其进行挖掘分析,能有效促进学校教学质量的提升。此外,数据循证建构了具象化、可视化的教学质量呈现技术,提高了评价反馈的效能。
3.数据循证助推教学质量评价更具立体发展性
数据循证有效弥合了评价与教学之间“共时性”间断、“共域性”间隔的矛盾,通过分析教学的历时性数据,能将教学质量的过去、现在和未来有机连接在一起。同时,多样化的数据循证方式澄明了教师之教与学生之学的交互生态效应,驱动教学质量评价与师生的学习成长相连接,为构建良性教学质量评价文化奠定了基础。
二、数据循证的现实样态:困境呈现
如今,在“互联网+”教育背景下,学习者的学习过程和学习结果都能够转化为学习数据①郑红苹,崔友兴:《“互联网+教育”下循证教学的理念与路径》,《教育研究》2018年第8期,第101-107页。,但数据循证不足成为制约教学质量评价的桎梏。
1.评价数据“碎片化”
以学生阶段性学习绩效为例,该学习绩效或零散地简单记录,或存在大量数据谬误与缺失,或数据没有经过分类整理,只有单一学业总分,而缺失对各知识板块及学生学业绩效的系统数据分析,稀释了数据背后的价值。
2.数据指标“单一化”
纵观我国基础教育几十年的发展历程,评价指标单一的陈弊由来已久,如“平均分”经常成为唯一或主要指标,其他数据评价指标缺失或不足,从而遮蔽了从不同数据指标发现问题,以及在综合分析中寻找“评价生长”的可能。
3.数据循证维度“片面化”
一些教学质量评价者常局限于特定数据指标,或执拗于班级之间的“优胜劣汰”,或困守于自身数据评价“围城”之中,丧失了与外部同类数据共享、交流的机会,致使教学质量评价走向封闭。
4.数据分析方法“简单化”
一方面,多源异构的数据不能实现及时集约,亦不能转化为显性结果,致使教学质量评价仅限于模糊的话语解释,而缺少直观数据图景作为依托;另一方面,传统的教学质量评价一定程度上依然停留在“观感”程度,评价结论的得出较为随意,因而往往导致学校教学决策失误。
由此可见,在当前的学校教学质量评价中,数据缺失、指标单一、维度局限、方法简单等表征弱化了教学质量评价的效能,在其之下暗含的是“数据循证不足”这一实质问题。数据循证不足导致数据价值误读,加剧了教学与评价之间的分裂。
三、数据循证不足:审视归因
笔者认为,“主观性”评价文化及其统摄下的同质性、单向度、封闭式、割裂化等评价文化样态,是导致数据循证不足的重要原因。
1.教学质量评价关注数据结果,缺乏个体关怀
在教师“同质化”的视域下,学生只有“总分”不同,而并无其他不同。因而,教师往往更关注“成绩”本身而缺失了学生立场,这就不难理解为何在数据采集时,往往只有总体分数呈现而缺失系统数据。但事实上,学生的学习基础、学习兴趣、学习风格千差万别,在教学评价时应更加关注“差异化”和“个性化”。而不少评价者一方面不能通过数据的指示作用,发现每位学生身上的闪光点,使教学逐步走向“个性定制”;另一方面缺乏对潜质学生的人文关怀,使数据循证仅停留于“工具理性”,而失去了应有的“价值理性”。
2.教学质量评价单向聚焦,缺少多维通览
马尔库塞在其代表作《单向度的人》中批判了“耽于惯例,缺乏变革与超越”的观念与行为方式。就数据循证来说,不少评价者囿于评价视野窄化,缺乏数据指标体系意识,更难以将其作为评价载体,故常常执念于单一数据指标,并以之作为衡量教学质量优劣的标准。殊不知,不同数据指标可以揭示不同教学现象,阐释不同教学规律,数据指标理应丰富而立体、异质而多维。否则,单向度的指标聚焦只能使数据循证片面、失真,大大削弱教学质量评价的信度。
3.教学质量评价固守封闭,怯于开放改进
数据循证以密集数据为坚实依托,因而需要始终保持开放的格局,以尽可能获取教学过程中的完整数据链条,并借助复杂精确的数据算法,挖掘数据背后的潜在价值。而多年来,学校教学质量评价常以一所学校、一个班级为评价参照单位,失去了由内而外的开放格局。囿于本体数据样本的局限,不少评价者对教学质量或沾沾自喜,或妄自菲薄。总之,封闭式的数据循证方式易使评价主体失去客观坐标,走向评价虚无,最终无益于学校教学质量的提升。
4.教学质量评价交错割裂,缺失整体视域
所谓割裂化,就是将整体的评价领域分为截然不同的部分而使之失去同一场域的整体性。具体说,一是缺失对原有评价策略的梳理与检验。有的评价者缺乏纵向研究的视角,不能通过数据循证检验原有评价策略成效,为后续评价改进助力。二是缺失对学校整体教学质量进行评价的意识。学校是一个教学综合体,各学科之间彼此相连,共筑整体教学生态。而在基础教育教学质量评价中,缺乏科学标准、系统规划、整体协调的教学质量评价屡见不鲜,“各自为战”的惯性评价方式加之有失专业的数据分析方法,导致数据循证走向个体化、形式化、简单化。因此,就更加需要精准、科学的数据处理与评估方法,以实现各教学集体的综合协调。
综上所述,加强数据循证是克服“主观性”教学评价文化的应然要求。应借助大数据的精准分析,为教学质量评价提供有力支持。最终,促进教师充满个性、创造性地开展教学活动,推动学生更加积极、主动地开展学习活动。
四、化“循证不足”为“循证生长”:方案建构
建构系统的数据循证方案,既要有前瞻的视野,又要有精细的理路。一方面,要从学理层面把握数据循证评价的出发点,使其符合教育逻辑价值;同时根据教学评价发展规律找到立足点,使其符合发展价值。另一方面,方案建构要与学校教学质量评价现实需求相契合,提供系统化、多维度、可实践的具体措施,使其具有实践价值。
1.数据循证的国内外经验
通观当下的基础教育课程评价实践,“素养为重”成为当代教育评价的特征。①朱丽:《从“选拔为先”到“素养为重”:中国教学评价改革40年》,《全球教育展望》2018年第8期,第37-47页。一方面,教学质量评价落地的关键在于“人”①李政涛:《把新时代教育评价改革深化到“评价能力”的提升那里去》,《中国教育学刊》2020年第12期,第8页。,要坚持“立德树人”,确保育人目标实现。②靳玉乐,朴雪涛,赵婷婷,刘小强,司林波:《笔谈:新时代教育评价改革与制度创新》,《大学教育科学》2021年第1期,第13-25页。另一方面,国际上数据循证展现出新的发展特点:其一,大数据推动教学测评走向可视化、精准化、智能化。③张华:《迈向素养本位教育评价观》,《教育发展研究》2019年第6期,第3页。如以“多层线性模型”为代表的教育质量分析模型,整合学习数据对学生进行多维、全面、深入的大数据教育评价。④张生,王雪,齐媛:《人工智能赋能教育评价:“学评融合”新理念及核心要素》,《中国远程教育》2021年第2期,第1-8页,第16页,第76页。其二,大数据助力教学测评指标完善。如PIRLS(Progress in International Reading Literacy Study)、PISA(Programme for International Student Assessment)、PIAAC(Programme for the International Assessment of Adult Competencies)、GEM(Global Education Monitoring)等国际测评体系,提升了测评框架构建及指标体系研制科学水平;PISA开展了关于国际测验的增值评价研究;美国PARCC(The Partnership for Assessment of Readiness for College and Careers)评价体系开展了关于核心课程实施效果及指标完善的研究等。⑤刘磊明:《国际大规模教育评价的逻辑反思》,《教育研究》2020年第1期,第75-85页。其三,大数据赋能评价范式转变。按照吉姆·格雷的观点——“‘数据密集型评价’即为第四范式”⑥戚业国,杜瑛:《教育价值的多元与教育评价范式的转变》,《华东师范大学学报(教育科学版)》2011年第2期,第11-18页。,数据的“价值二元性,使得在教育评价中实现人文观照成为可能”。⑦刘志军,徐彬:《综合素质评价:破除“唯分数”评价的关键与路径》,《教育研究》2020年第2期,第91-100页。
2.循证方案阐释
本文试以多元数据指标体系、立体交叉的数据分析维度、多因素统计分析方法来实施教学质量评价,并由此提出相应的教学改革措施。研究中,笔者选取样本具有代表性的青岛市J小学(以下简称“J小学”)1—6年级学生期末学业绩效作为研究样本。
一是采用多元数据指标体系支撑评价。概化理论认为,任何测量都存在误差,不能用单一“真分数”去测量。因而,笔者借助“真分数”“平均率”“优秀率”“低分率”“板块得分率”“Z分数”“T分数”等多个数据指标进行综合分析,同时建立与数据循证理论相对应的评价指标体系。二是建立立体交叉的数据循证维度以夯实评价。数据循证可以基于不同领域,涵盖个体、学科、学校、区域等范畴;可以根据不同对象,建立学科、年级、班级之间的横向、纵向分析甚至跨学科、跨学段交叉分析。由此,可实现数据循证的整体性、多维度、开放性。三是引入“多因素统计分析”验证评价。本文根据多因素统计分析法建立数据循证评价模型,通过统计描述和假设检验,科学辩证分析数据结果。本文选取了语文、数学、英语三门学科,同时提取能体现每门学科教学质量的“核心板块数据”,进行相应的编码、匹配。通过多因素统计分析来评价学科教学质量及学校整体教学质量,为后续学校教育教学改革决策提供支持。概言之,本文将具体的循证方法内嵌于循证路径之中,形成层叠统摄的数据循证及教学质量评价脉络。
五、基于“数据循证”的教学质量评价:实践路径
1.学校教学评价措施回顾
基于数据循证的教学质量评价要秉持历史与发展观念,对既有评价措施进行回顾,为后续评价改进提供参考。J小学在2020—2021学年引进信息化平台,并以此为依托进行教学评价改革:一是开发评价框架并导入智能评价平台。二是建立学生成长积分体系,积分来源于评价框架各维度。三是将学习习惯纳入评价。梳理并形成涵盖倾听、表达、思考等八个方面的“学习好习惯”。四是引入家长评价、学生评价,通过App客户端、电脑终端进行交互评价。五是借助智能化评价平台,以“雷达图”生成学生学业质量报告。
2.数据循证:发现教学潜在问题
(1)学校数据循证:站位整体,检验教学质量及评价改革是否有成效
首先,数据来源与处理方法。山东省青岛市J小学共1397人,数据采自1—5年级学生期末学业绩效,6年级共228人参加区域(市南区)统一质量检测。删除极端数据后,最终选取1128名学生作为研究样本。从系统中调取2020—2021学年(共两个学期)每位学生的语文、数学、英语总成绩及各模块成绩,分别计算核心模块得分率(核心模块得分率=该模块实际得分/该模块总分),并将其作为主要指标;分别计算出每位学生的第二学期与第一学期学业绩效及得分率差值,将所有数据导入SPSS系统,进行数据处理及统计学检验。
其次,分析结果。数据经检验,不服从正态分布。故采用中位数(四分位数间距)进行统计描述,采用非参数检验进行组间比较,结果见表1。表1显示,关于数学计算得分率和英语总分,第二学期较第一学期有所降低。关于语文阅读得分率、数学总分、数学应用加探索得分率、英语阅读得分率、英语写作得分率,第二学期均较第一学期有所提高,差异有统计学意义。
表1 J小学学生各学科绩效及核心模块得分率
为探讨不同年级间教学质量的差异,将相关指标分年级进行比较,结果见表2。表2显示:第二学期与第一学期相比,除了二年级语文阅读得分率差值有所上升外,一、二年级的各项指标均下降;三年级语文各项指标升高,数学、英语各项指标均呈下降趋势;四、五年级提升的指标数高于下降的指标数。
表2 不同年级学生第二学期与第一学期绩效及核心模块得分率差异
为控制因第一学期与第二学期期末检测难度差异对评价结果可能产生的影响,比较教学改革前后之2019—2020学年(表3中简称2020学年)和2020—2021学年(表3中简称2021学年)各自两个学期成绩的差异,结果见表3。表3显示:教学改革前后两学年,2020—2021学年两个学期英语写作得分率差值,较2019—2020学年两个学期该项目得分率差值有所提高;其余变量指标较2019—2020学年两个学期成绩及得分率差值均有所降低。
表3 2019—2020学年及2020—2021学年第二学期与第一学期绩效及核心模块得分率差异统计
(续表)
综上所述,从多因素统计分析输出的结果来看:一方面,该校前期进行的教学评价改革并没有取得预期效果,需加强反思;另一方面,不同年级、不同学科、不同学科板块存在教学不平衡现象,需要从学校层面加强干预和指导。
(2)学科数据循证:多向比较,检验不同集体之间教学发展是否均衡
首先,横向比较。对于教学质量评价,班级之间常以“平均分”作为裁定教学质量高低的“试金石”,学生个体之间常以“总分”作为优劣的判定标准。实际上,多元数据指标还应包括“优秀率”“低分率”“板块得分率”“及格率”“良好率”等维度。通过不同数据指标的分析,才能综合了解同一学科的不同教学集体(班级、年级等)之间的教学质量形态。
其次,纵向比较。“Z分数”“T分数”等标准分数可用于增值评价。以三年级语文学科为例,通过图1中呈现的“Z”分数,可以纵向查看该年级各个班级近6个学期的增值情况。结合一到六年级各个学科近6个学期的“Z分数”折线统计图,可以发现:各年级中有的班级持续进步,有的班级由负转正,有的班级则从高位不断下降。
图1 三年级(语文)近6个学期各班级Z分数变化统计图
最后,综合比较。标准差是对一组数据分散程度的度量。由表4可知:横向看,不同年级标准差整体呈现拉大趋势;纵向看,2020—2021学年第二学期与2020—2021学年第一学期相比,三、五年级标准差有所缩小,说明年级内各班教学更加均衡;一、二、四年级的标准差有增大趋势,说明相关年级需要关注班级之间的教学质量平衡问题。
表4 2020—2021学年语文学科期末测试各年级标准差
(3)个体数据循证:关照公平,检验学生端教学成效
2019年2月,中共中央、国务院印发《中国教育现代化2035》,把“提高教育质量,促进教育公平”作为教育改革发展的重要目标。①中共中央、国务院《中国教育现代化2035》,载中华人民共和国中央人民政府官网:http://www.gov.cn/xinwen/2019-02/23/content_5367987.htm,最后登录日期:2022年6月26日。但教育公平“不是让所有学生的成绩完全一样,而是让所有学生都达到国家规定的、较高的学业成就标准”。②杨挺,龚洪:《论教育中的程序公平与实质公平》,《中国教育学刊》2015年第8期,第9-13页。因此,学校要格外关注潜质生的发展,这是实现“评价生长”的重要方面。从表5来看,2020—2021学年第二学期,该校潜质生人数较2019—2020学年第二学期大幅增长,前者潜质生人数已经达到了后者的两倍以上,尤其一年级潜质生人数较多。由数据分析可知,该校急需出台必要的潜质生帮扶措施,以实现教学质量公平。
表5 J小学近3个学期各年级潜质生人数统计表
(4)区域数据循证:秉持开放,检验学生学业绩效与其他学校是否存在差距
区域统一质量检测由学科专家根据学科知识要点及学情统一命题,能较为客观地反映一所学校的整体教学质量。学校要结合多个数据指标进行综合分析,找到自身优势与不足,寻找教学质量改进和发展的空间。以语文学科为例,对J小学六年级毕业学生参加的区域统一检测部分数据进行分析。由图2可知,“线性标准分T”显示该校学生学业绩效不够均衡;由表6可知,从“平均分”“优秀率”两项指标来看,该校教学质量较区域总体偏弱。“低分率”较区域有优势,说明该年级潜质生帮扶意识较强。
图2 J小学毕业年级语文学业绩效线性标准分统计图
表6 J小学毕业年级语文学业绩效各指标上线数据
(续表)
3.评价生长:基于“数据循证”的教学措施改进
(1)学校加强教学供给侧
一是重塑教育逻辑。当下,基础教育改革的旨归在育人,这也是教育改革的逻辑起点。对教育的本质理解将在根本上成为教师改进教学的行动起点。二是推进信息技术赋能。一方面,可加强信息技术平台建设,提高其与教学的融合程度;另一方面,可完善操作理路,提高教师使用的悦纳感。三是打造高效“教—学—研”实践共同体。打通教师教学、学习、研究之间的理路,通过互助合作培养学术团队,使其最终转化为教育教学发展的重要成果。①伊列雷斯:《我们如何学习:全视角学习理论》,孙玫璐译,教育科学出版社2014年版,第120页。
(2)教师以“全视角”省察教学
一是进行“理解的教学”。针对数据循证发现的问题,教师要及时反思教学。二是进行“精准教学”。“精准教学是一种借助信息技术跟踪、记录和分析学生学习过程数据,为教师教学设计、教学决策、教学指导、个性化干预和学生学习补救及改进提供依据的教学形式。”②安富海:《精准教学:历史演进、现实审视与价值澄明》,《课程·教材·教法》2021年第8期,第56-62页。表7截取的是《2021年青岛市市南区小学毕业年级学业水平质量检测(语文)》阅读部分的各分项数据。从中可以看到,该校和全区平均值差距在0.3分左右,在“句式转换”“提取信息”两项上与区域差距较大,这就需要教师在相关教学项目上采取更精准的教学策略。三是进行“有效教学”。即明确哪些策略能较好地适用于学生③马扎诺:《教学的艺术与科学:有效教学的综合框架》,盛群力,唐玉霞,曾如刚译,福建教育科学出版社2014年版,第4页。,比如明了“波纹环状教学设计模式”④M.戴维·梅里尔:《首要教学原理》,盛群力等译,福建教育科学出版社2014年版,第249-251页。以及“镶嵌任务支持”“理解监控”等教学策略的实践路径,并将其应用到教学之中。
表7 J小学毕业年级学业质量检测(语文)阅读部分各分项数据
(续表)
(3)关爱学生发展的“全生命周期”
一是转向学生“增值发展”。数据循证要逐步由“横向对比”转向“纵向增值”,由“重知识掌握”转向“重生命成长”,引导学生关注自身的提升与发展,找到成长进步的闪光点。①B.S.布卢姆,《教育评价》,邱渊,王钢译,华东师范大学出版社1987年版,第228页。二是获取“生命成长密码”。一方面,可走近潜质生,以“爱”育“人”;另一方面,家校可携手增强提优转化的内动力。三是链接生命发展的“全域数据”。可利用信息技术,将过程性数据与结果性数据相结合,实现对学生发展的全生命关切。
核心素养时代,分数既不应该成为学生追求的命根,也不应该是教育教学的终点,反而应是“评价生长”的起点。学生的阶段性学业绩效隐含多重价值,可构成“三位一体”:通过数据循证,检验学校已有改革成效;评估学校教学质量,发现潜在教学问题;针对教学质量短板,探究改进策略。结合当下基础教育课程改革发展趋势,数据循证成为改进学校教学质量评价,以及实现学校和学生可持续发展的重要媒介。