合理设计难度强化试题局部区分功能
2014-09-19邹丽华
邹丽华
(大连教育学院 学习质量监测中心,辽宁 大连116021)
难度和区分度是评价试题质量的两个重要统计指标。一般情况下,对于兼顾学业水平和选拔测试的中考,尤其是对于承载选拔进入重点高中或一般高中的难题和中等难度的试题,比较重视试题难度指标,容易忽视试题区分度指标。从题目得分率与总分关系,探究题目局部区分功能,其重要意义在于评价试题的“公平选拔”作用。
一、题目区分度与难度的关系
1.鉴别指数与题目难度的关系
在经典测量理论(CTT)框架下,难度指标通常以通过率或得分率表示,用难度系数(p)大小表示试题的难易程度。难度指标是一个反向指标,难度系数越小,试题就越难。区分度又称为鉴别力,是指题目对不同水平考生的区分程度,用鉴别指数(D)或相关系数(r)的大小表示区分程度。从经典教育测量与统计理论相关研究结果看,鉴别指数和题目难度不是彼此独立的,中等难度水平的试题,D值可以最大。[1]表1是具有不同难度系数(p)的项目所对应的可能的最大D值;最大D值与难度系数(p)的关系之间呈倒U型关系,即接近0.5难度水平的题目的鉴别度值大于难度在两端的题目。
表1 最大D值与项目难度的关系
区分度指标不仅会受到难度指标影响,同样也会受到样本容量和被试同质性程度的影响。如果被试学业水平整体较好,试题难度相对要小些,鉴别指数D会小;如果被试学业水平整体上表现都不是很好,试题难度相对要大些,鉴别指数D也不会大。以选拔为目的的测验,接近于0.5难度水平的各个试题更为可选,题目更能较精确区分考生间差异。
2.试题区分度与难度的关系
以大连市内五区考生试卷为样本,选取近四年来中考物理试题的全部126道题目,进行数据统计与分析,得到题目鉴别指数与难度系数之间的关系,见图1。
图1 中考物理试题鉴别指数与难度系数关系
图1显示,鉴别指数和难度系数关系基本上呈倒U型,即中等难度的题目可能产生最大的区分度,但并不意味着中等难度题目的D值一定大于简单题或难题,即使p值小于0.4或大于0.7的题目也可能具有比较理想的D值;难度系数在0.9以上的题目D值普遍偏低。总之,尽管区分度与题目难度总体上符合倒U型数量关系,但并不存在着一一对应的关系。因此,在中考物理学科命题过程中,单凭通过控制试题难度难以实现对区分度的控制。
二、试题局部区分功能的差异
试题局部区分功能类型可以划分为全程区分、高端区分、低端区分、中高段区分和中低段区分,区分程度可划分为强区分、中度区分和弱区分。[2]由于难度和区分度指标的局限性,以及题目难度与区分度的实际关系并非呈倒U型关系,作为整体指标的难度与区分度很难反映题目的局部特征与功能。不同难度试题的局部区分功能存在差异,区分度和难度相同或相近的两道试题的局部特征也存在着差异。
CTT理论框架下难度与区分度的估计对样本的依赖性很大。计算题目的难度和区分度指标一般基于总体或总体的代表性样本,以反映总体特征。以2010年中考物理试卷中具有相同的计算题型和测试能力的第24题和第25题为例,采用市内五区考生试卷样本数据进行统计分析,结果见表2。
表2 两个题目统计结果
两个题目通过率与总分的关系见图2。可以看出,两条曲线并不重合,尽管两题难度系数、区分度指标均接近,但考生通过率的变化趋势不尽相同。难度系数和区分指标相同或接近的题目,同一考生群体的通过率却存在着差别,即局部区分度功能存在差异。
图2 题目24和题目25通过率随总分变化曲线对比
三、试题难度和局部区分功能的设计
通常,对兼顾学生水平测试和选拔两种功能的中考命题来讲,题目区分度不做要求。简单题要求学生达到课标基本要求即可,但对承载选拔任务的中等试题和难题要有较好区分度及局部区分功能。因此,命题必须重视难题和中等难度试题的局部区分功能的设计及调整。
1.试题难易程度的划分
大连中考的区分功能表现在将适合升入示范高中和适合升入一般高中的学生区分开来。根据录取率确定难度系数节点是构建合理难度分布模型的关键。近年来,大连示范和一般公办高中录取率分别稳定在30%和55%左右,因此重点高中与一般高中的选拔难度系数节点为0.30和0.55。由于大连市中考试题难、中、易分值比为1:2:7,相应各部分试题的难度系数分别为[0.2,0.4]、(0.4,0.7]、(0.7,1.0]。[3]在此基础上,结合近几年中考物理试题难度分布,合理建构大连区域中考物理试题难度分布模型。[4]构建合理难度模型的目的是为中考水平测试和选拔服务。在选拔不同类型学校的节点处附近设置与能力水平相近的高区分度试题,才能更好地落实公正选拔,减低录取误差。
2.试题局部区分功能的设计
选拔测验中相同难度试题,不论是简单题还是难题,区分度越高越好。区分度越高,越能把不同能力水平的考生区分开来,越有利于选拔。对于难度系数在0.80~1.00,即属于学业水平考试部分的试题,区分度低的试题也可以保留。
总分就是对所研究的能力、特质或结构的一种初步、近似的测量结果。物理试题编制要求:一是承载“1”部分的难题必须设置在高能力水平处考查,这样才能保证得分越高的考生,其能力水平也越高,避免用简单题区分高能力水平的考生。二是难题必须在高端强区分,中等难度题至少在中高段中度区分。区分功能较强的试题,难度系数应设置在0.2~0.8为宜,保证鉴别指数在0.2以上。过难或过易的试题对测验分数的变异性影响较小,对测验信度和效度几乎不起作用。
3.试卷区分功能的调整
试卷难度分布影响考试结果的分数分布形态,试卷的区分结构更多针对被试群体进行分层区分,难度分布和区分结构影响试卷区分功能。选取、编制难度合适,并具有一定区分功能的试题,有利于测量能力较高考生之间的个体差异,有利于公平、公正地选拔考生。试卷设计不仅要考虑试题难度分布状况,还要通过调整区分结构来实现对某段考生的更高效的区分,如要对全体考生发挥均衡的区分作用,就要设计全程区分类型题目或均衡配置各种区分类型题目的比重。
四、试题高端区分功能的实现
大连市中考物理近四年承担选拔功能的试题分布在选择题、简答题和综合题三种题型。以2013年中考物理试卷中五道难题为例,题号、题型、考查内容、满分值、难度和区分度等内容详见表3所示。依据项目区分度评价标准确定这五道试题的相关程度。[2]
表3 五道题目难度系数和区分度
从表3选择不同题型且D值相差较大的第14、29、32题,由实测原始分数,绘制题目得分率随物理总分变化的关系曲线,即题目难度曲线,见图3。
图3 三道题目难度曲线
由图3可见,在选拔重点高中的节点难度系数0.3左右的这三道难题,整体上均对高分考生具有较好的区分,其中第29题和第32题两题性能较好。第29题对考生具有较强的区分功能表现在高分段(70分~88分),对70分以下的考生无区分;第32题对考生的区分主要体现在中高分数段(50分~90分),对50分以下的考生弱区分;第14题是一道多选题,有一定的猜测度,该题只对80分以上的考生有较好的区分,在曲线低端和中段的得分率变化不是随总分增加呈现上升的趋势。换句话说,得分高的考生在该题上的得分不一定高,该题目区分不利于公正选拔考生。因此,区分度指标作为整体指标说明题目鉴别能力,很可能是有效的,但对题目局部区分功能的探讨能很好地说明题目对哪一目标群体区分更有效。
总之,对于水平考试要更多地关注难度分布,局部区分功能设计主要是通过题目难度分布的调控来实现。对于兼顾学业水平测试和选拔功能的中考来讲,首先要依据课标内容要求命制合适难度的题目,同时也要考虑难题和中等难度试题的局部区分类型,确保达到公平公正合理选拔考生的测试目的。
[1]安妮·安纳斯塔西,苏珊娜·厄比纳.20世纪心理学通览—心理测验[M].江苏:浙江教育出版社,2008(8):243.
[2]邹丽华.区分度在中考试题质量分析中的应用[J].大连教育学院学报,2011(4):27-30.
[3]赵娟.中考试题命制应注意的几个问题[J].大连教育学院学报,2013(1):43-44.
[4]邹丽华.中考物理试题难度的设置与控制[J].物理通报,2013(3):107-109.