用数据说话:区域教学质量评价中的技术改进①
2018-02-09曹建军
曹建军
摘要学科教学质量评价的诊断功能对于规范学科课程实施、提高学科教学质量具有重要价值。区域教育评估者要提高实证研究设计与数据处理能力。雷达图、指数表、分组图有利于多途径深入能力维度分析,准确发现教学问题;以学科素养为中心内容的评价则为教师改进教学提供了抓手;评分项分数解释法为数据的深度开发与利用提供了可能。
关键词教学质量评价;雷达图;指数表;分组图;学科素养;评分项分数解释法
中图分类号G63
文献标识码B
文章编号1002-2384(2017)09-0022-04
学业水平测试的目的并非只为给出成绩来评价学生的发展水平,它的主要功能还包括评价学科的学和教,即利用学生学习情况间接评价教师的教学情况,提出改进教学的建议。这种诊断功能对于规范学科课程实施、提高学科教学质量具有重要价值。定量分析由于其准确性与确定性,在学科诊断中尤其不可或缺。这就要求区域教育评估者要树立实证分析思想,不断提高实证研究设计与数据处理能力,努力做到用数据说话。
一、多途径深入能力维度分析,准确发现教学问题
能力维度分析是学科评价能力立意的必然要求。在测试中,我们不仅会从知识维度,也会从“了解、理解、掌握、运用”四个由低到高的能力层次进行考查。通过数据整理,我们就可以在知识和能力两个维度较为全面地了解情况。
1. 运用“雷达图”进行直观对比
“雷达图”是将测试各内容分析所得的数字或比率,就其比较重要的项目集中画在一个圆形的图表上,来表现各项测试内容的情况,能比较直观地反映各项指标的变动情形及其好坏趋向。因此,借助“雷达图”可以直观地对知识的不同领域、能力的不同层次进行优劣分析与对比。
(1)知识维度
例如:某次测试对“二次函数”“概率”“圆”“相似”四个知识领域进行考查,由于各知识领域总分不同,为了便于比较,可以将具体分值转化为难度系数(即得分÷总分),于是得到如下 “知识领域难度指数表”(见表1)。表中数值越大,说明学生在这一领域的水平越高。
由图1可知,全区学生对四个知识领域的总体掌握情况较好,但不同领域表现不均衡。学生对“圆”的内容掌握最好,“概率”也较好,但“相似”与“二次函数”的内容则相对较弱,而这两块内容都是学业水平测试最重要的内容之一,这说明平时的教学还没有达到课程实施的要求。
通过图2,我们还可以将学校与学校、学校与全区的情况进行直观对比,发现差距。由图2可知,K校在“圆”这一知识领域发展较好,但各领域的发展水平都低于全区水平。
(2)能力维度
例如:某次测试从“了解、理解、掌握、运用”四个由低到高的能力层次对某一知识领域进行考查。由于各能力层次总分不同,为了便于比较,同样将具体分值转化为难度系数,于是得到“能力维度难度指数表”(见表2)。表中数值越大,说明学生在这一层次的能力水平越高。
由图3可知全区学生在該知识领域的了解、理解能力水平发展较好,但掌握水平发展不够,运用水平尤其欠缺,未来教学工作中能力发展的任务较重。
由图4可知S校学生在“运用”层次的能力水平与全区水平相近,其余层次的能力发展水平都要高于全区水平。
2. 运用“指数表”进行初步分析
用“雷达图”可以直观反映整体中各部分的发展水平和优劣,但如果要进行深入分析,仍需借助“指数表”(此处系指“能力维度难度指数表”)。如在某次测试中,经数据整理制作了“能力维度难度指数表”(见表3)。
分析“指数表”有如下发现—
一是各能力层次的总体情况(即纵向分析)。“了解”层次各校数值比较接近,所以差异不明显;“理解”层次各校水平也较接近;“掌握”层次大部分学校的难度系数都在0.8以上,说明全区总体水平较好,但差异较显著;各校“运用”层次的数值相比前三个层次较低,说明全区总体水平欠佳,且各校差异也较显著。
二是学校在各层次的发展情况(即横向分析)。由于“了解、理解、掌握、运用”这四个层次的难度是从小到大排列的,而大部分学校各自在四个层次上的差异并不特别明显,可见发展都较为均衡。但“运用”层次与前三个层次还有一定差距,所以各校要加强学生运用能力的培养。
三是其他异常现象(实际是横向分析中发现的问题)。进一步分析,我们还可以发现“理解”与“掌握”两层次出现倒挂现象,即学生在能力要求较高的“掌握”层次得分高,而在能力要求比较低的“理解”层次反而得分低。这一方面说明教师对知识技能的掌握落实情况较好,但从另一方面也体现了部分教师对概念理解教学的重视程度不够。对表中数据进一步分析可知,倒挂现象甚至还发生在生源优质学校,可见这是普遍现象。这也说明许多教师对如何促进学生理解的教学研究还不太到位,因此,亟须区级层面对此加以引导,这显然也是课程实施中需要研究的基本问题。
3. 运用“分组图”深入明确问题
将全体学生按水平差异(如测试得分)由低到高平均分组,仍按“了解、理解、掌握、运用”四个能力层次分别计算各组难度系数,并画出折线图,得到“不同水平能力分组难度情况图”(见图5)。图中每一条折线代表某一能力层次各组的难度系数变化情况。endprint
有了分组图后,则更能直观说明前面所说的倒挂现象。在图5中,除水平最差的第一、二组外,其余小组的学生在这两个层次都不同程度出现了倒挂现象,且水平越高越明显。另外,随着学习水平的提高,各组的理解水平并没有提升太多。
结合平时的调研等定性研究手段可知,这一“奇怪现象”在日常教学中并不奇怪,这是由于教师在教学过程中重视技能教学,忽视技能背后概念的理解,即教师希望通过反复操练来矫正学生对概念的理解。这种教学方式在短期内确实能提高学生的解题能力和考试成绩,但从长远的角度看,存在着很大的弊端。解决以上问题,需要教师转变教学观念,重视概念教学,设计促进学生理解水平提升的教学活动。
二、以学科素养作为评价中心内容,为教师改进教学提供抓手
教育评价不应单纯地评价学生掌握知识的“多寡”和技能的“高低”,而应以学科素养作为评价的中心内容,着眼于学生的终身可持续发展。
比如:在一次七年级数学学业水平测试中,我们根据学期课程目标,确定本次测试主要从概念理解、运算求解、逻辑推理、几何直观、空间观念、模型思想、数据分析等七个方面对学生的数学素养进行考查。其中,又根据本阶段课程目标的重要程度,将概念理解确定为核心素养,将运算求解与模型思想确定为重点素养,将逻辑推理确定为次重点素养。我们根据测试结果建立雷达图(见图6),对全区以及各个学校的学生数学素养进行评价,以改进数学教学。例如:从全区情况来看,学生在运算求解这一本学期重点素养上表现优秀,在几何直观、空间观念、数据分析这些非重点素养上也表现较好,但学生在概念理解、模型思想这两个重点素养与逻辑推理这一次重点素养上仍有较大发展空间。
关注学科素养的评价使我们对教学的改进更有针对性,因为学科素养其实是学科教学的目标点,与知识相关,更是能力的显化。这让教师对课程实施有了明确的抓手,更易于操作实施。
三、采用“评分项分数解释法”,加强数据的深度开发与利用
(2)建立評分项分数解释对应表。这样通过分值与学生学习情况的对应分析,既有助于诊断学生的发展水平,又能评价教师的教学,即利用学生学习情况间接评价教师的教学情况,提出改进教学的建议。如例题中评分项1可以建立如下评分项分数解释对应表(见表4)。
(3)根据测试数据形成评分项得分分布表,诊断全区的学与教情况;形成各校关键得分点得分分布表,诊断各校学与教情况;形成分数解释总表,明确诊断学生的学习情况。例如:某位学生得5分,可由分数解释总表对应得出其学习情况是“能建立函数与方程的联系,能熟练掌握二次方程的解法,但完全不会数形结合解决自变量的取值问题”。这样教师可以进行更有针对性的矫正,实现真正的因材施教。
我们为了追求测试数据价值的最大化,在一次测试中采用评分项分数解释法给整份试卷设置了73个评分项,相当于给每个学生、每个班级、每所学校提供了一个有73个项目的“诊断报告”,这些数据为学校对学生的学和教师的教的评价提供了精准研究的可能。这也是我们的教学研究从基于经验的判断到基于数据的分析的一种重要尝试。
注释:
① 本文系浙江省杭州市2016年度教育科学规划课题“基于动态问题链的‘双径共振数学教与学的研究”(课题编号:16G0313)的研究成果。endprint