诊断试题命题质量评价和管理建议
2023-05-30彭和强郑浩
彭和强 郑浩
高考是对学生高中阶段学习成果的终结评价。《高考评价体系》中,明确了“立德树人、服务选材、导向教学”的核心价值和功能。其中“导向教学”意为:高考要为高中一线教学指明方向。
诊断考试是地方教育管理部门对学生高中特定时段学习效果的过程性评价。过程性评价对一线教学也有着极其重要的导向作用,但却没有特定标准可参照。如果诊断试题不能进行有效的考核评价和约束,试题的质量难以得到有效保障,一线教学也就容易迷失方向,这将与高考评价体系中的“导向教学”理念背道而驰。
基于以上思考和分析,试图找到能够有效评价和考核诊断考试命题质量的途径。
一、研究对象和方式
研究对象为绵阳市某年级的93名学生,以历次考试测试数据为基础。
因每次考试均按照全市排名划定A0、A优、B优分数线,且每次划线人数基本相当,故参照上线情况进行统计分析,具有较强统计参照价值。通过上线人数、超线差值、置信度三方面进行统计分析,能够较好检验诊断考试与高考之间的关联度,从而检验诊断试题质量。
二、诊断考试与高考的关联度分析
1. 上线人数的关联度
从历次考试各层次上线人数看(表1),A0和A优上线人数波动幅度较大;B优上线情况除三诊外,均稳定保持在75~76人。
从历次考试上线结构来看,无论哪个层次的上线人数,高考都与该年级的一诊最为接近,说明二者关联度最强;而三诊测试结果与高考差异最明显,B优上线人数也产生较大差异,说明二者关联度较差。
2. 超线差值的关联度
学生考试成绩与当次优生线之间存在一定差值,可稱为超线差值ΔM。理论上,如果所有学生高考超线差值ΔM1与诊断考试超线差值ΔM2之间的差值ΔE(即ΔE=丨ΔM1-ΔM2丨)无限接近于0,则表明当次诊断考试关联度越高。但客观上讲,因学生个体存在成绩不定因素,做到无偏差自然不可能。但大量统计对分析诊断考试有效度也有积极意义。
表2以A优线为参照,统计研究对象4次统考与高考之间ΔE值的大小分布情况。ΔE低值区分布人数越多,表明试题与高考关联度越高。
通过表2数据分析可知,一诊、二诊考试ΔE≥15的人数相对较少,表明其关联度较高。三诊考试ΔE≥15的人数显著偏多,其关联度相对较差。
3. 置信度分析
置信度也可直观分析出两种数据之间的关联度。将历次诊断考试与高考上线情况进行叠加,并进行上线与未上线统计,得到各层次和各次考试之间的列联表。运用卡方公式,得到随机变量K?的观测值k,再根据观测值k对照表,得到诊断考试与高考之间的置信度。置信度越高,表明高考与当次诊断考试的关联度越高。分A线和B线两个层次进行置信度分析。
从A线分析来看(表3),二诊、三诊置信度较低,尤其是二诊,置信度仅60%~75%,说明当次诊断考试是否上A线与高考是否上A线之间缺乏必要联系,考试关联度和有效性不足。一诊置信度较高,达到95%~97.5%,即当年一诊是否上A线很大程度上决定高考是否上A线,两者之间关联度较高。
从B线分析来看(表4),诊断考试和高考B线之间置信度整体较A线偏高,尤其一诊考试达到99.9%,关联度很高。但二诊测试仍不足85%,关联度偏低。
三、结论与建议
1.一诊试题质量较高
无论是A0、A线、B优线,与高考之间的关联度均最大。即学生在一诊考试中是否上线,上什么层次的线,很大程度上决定学生在高考中的上线情况。表明当年一诊试题质量高,教学指引性较强,对各个层次学生复习指导价值较大。
2.二诊、三诊试题质量较低
二诊、三诊仅在B线与高考有较大关联度,而A0、A线与高考之间关联度较小。说明这两次诊断性考试对中后段学生的测试有效度较高,具有较强指导价值和意义,但是对中前段学生的测试有效度较低,指导意义不大。
3.加强命题管理的建议
(1)加大诊断试题命制投入
高考试题命制的人力、财力、时间投入,都比诊断考试多,因而试题更加严谨合理。诊断考试的命题者多为一线教师,且命题待遇偏低、时间不足,难以更高标准保障诊断试题质量。
故加大诊断考试投入力度,能更高标准保障过程性检测质量,从而提高日常教学、高考复习的针对性、指导性,更有利学科人才培养。
(2)强化命题质量监督和管理
试题质量不能仅从平均分、区分度、是否存在学科争议、学科认知错误等方面评判。市级教育科学研究部门应建立完善命题有效性追踪制度,并合理运用测试所得大数据,根据上线人数、越线分差、置信度等分析诊断试题的效度、方向指导性价值等,建立量化考核评价机制并进行倒追奖惩。
影响学生诊断成绩和高考成绩的因素还有教师教学风格、学生考试身心状态等。本研究对象数量偏低,无法完全规避上述因素带来的质量评价差异。通过更大范围数据统计和分析,建立量化考核评价机制,能更有效对试题质量进行评价,是一种行之有效的命题质量管理途径和手段。