APP下载

中小学教师资格考试测试结果的统计分析研究

2015-07-05余仁胜赵轩

中国考试 2015年1期
关键词:分数线教师资格学科知识

余仁胜 赵轩

1 引言

从广义上讲,考试是一个获取信息并反馈的过程,只有很好地把握考试的信息反馈作用,才能有效调节和改善这个系统的整体功能。为使考试更加科学化,需要运用教育测量的方法对其进行分析。具体地说,就是研究如何收集、整理、归纳和分析考试中的各项数据,并对其进行定量分析,用以发现和表明某些特征和规律。每次考试带给我们的信息,不仅仅是简单的考生成绩,需要通过统计分析,发现隐藏在分数背后的信息。对考试结果进行统计分析,是考试流程中的一个重要步骤,是促进考试更加科学化、规范化必不可少的手段。[1]

中小学教师资格考试(以下简称“教师资格考试”)是检测申请人是否具备从事教师职业所必需的教育与教学能力的水平考试。做好教师资格考试测试结果的统计分析,可为各级教育行政机关、各级教育考试机构、师范院校、教师培训机构以及考生等提供不同的评价报告。统计分析的结果,可以为各级教育行政机关了解考生整体情况提供参考;可以为考试主管部门了解试题试卷质量,进一步改进考试命题提供依据;可以为各类师范院校和教师培训机构了解自身教学水平和教师培养情况提供信息;可以为考生了解自身教育教学能力发展情况,有针对性地进行提高提供帮助。

本文阐释中小学教师资格考试目前采用的测试结果统计分析内容和方法,以期为进一步完善教师资格考试测试结果的分析,拓展考试数据的开发提供参考和借鉴。

2 教师资格考试统计分析的内容与方法

2.1 教师资格考试分数转换方法

教师资格考试包括幼儿园、小学和中学三个教师类别,分笔试和面试两部分。其中幼儿园笔试科目为《综合素质》和《保教知识与能力》。小学笔试科目为《综合素质》和《教育教学知识与能力》。初级中学、高级中学笔试科目均为《综合素质》、《教育知识与能力》和《学科知识与教学能力》。

教师资格考试笔试每个科目满分均为150分。教育部根据考试标准和当次考试情况,确定各科目全国统一的合格分数线。由于各个科目难度存在差异,其合格分数线不尽相同。为统一各科目的合格分数线,采用线性转换的方法,将考生0~150分量表上的原始成绩换算为0~120分量表上的转换分,并使各科目的合格分数线统一转换为70分。

分数转换方法如下:设某科目原始成绩合格分数线为A(0<A<150),若考生在该科目的原始成绩为x(0≤x≤150),则转换分y(x)(0≤y(x)≤120)的计算公式为:

举例来说,设两个科目的合格分数线分别为A1和A2,则转换分y(x)关于原始成绩x的函数图像如图1所示。

通过上述线性转换,各科目的合格分数线均转换为70分,且转换不改变考生成绩的高低顺序。原始成绩低于合格分数线的考生,换算后的转换分在70分以下;原始成绩高于合格分数线的考生,换算后的转换分在70分以上。

2.2 各类考生群体通过情况分析

对于某考生,如果在其报考的学段中各个科目的成绩转换分均达到70分以上,则视为通过。如果有至少一个科目的成绩转换分未达到70分,则视为未通过。

对于考试总体情况的分析,最直观的就是考生群体的通过率,即达到合格线的考生人数占参加考试人数的比例。在此基础上,还可分析对比历次考试考生通过率的变化。

教师资格考试统计了全国、试点省份、各教师类别各次考试的通过率以及各群体历次考试通过率的变化情况。以全国总体情况为例,参加各次笔试和面试的考生人数、通过人数以及通过率列于表1中。此外,还可通过柱形图(如图2所示)比较直观地观察各次考试参加考试的人数以及通过人数的变化情况。

图1 教师资格考试分数转换示意图

表1 2011—2013年教师资格考试全国考生通过情况统计表

图2 2011—2013年教师资格考试全国考生通过情况统计图

2.3 经典测量理论下的试题试卷质量分析

基于经典测量理论(Classical Test Theory,CTT),教师资格考试的试卷分析包括平均分、标准差、信度、偏度等指标;试题分析包括平均分(难度)、标准差、区分度等指标。其中,试卷信度采用克龙巴赫法计算,试题区分度用相关系数计算。[2][3]

2.3.1 试卷分析

教师资格考试各科目的试卷分析包括最低分、最高分、平均分、标准差、信度以及偏度等数据。以全国总体情况为例,统计数据见表2。此外还可通过折线图的形式直观呈现考生分数分布情况(见图3)。

为考查各学段公共科目试卷难度的一致性,还对历次考试各类别公共科目的笔试成绩进行了相关计算,见表3。从表3可以看出,5次考试的两个公共科目成绩间的相关系数均在0.5左右,说明各类别公共科目成绩的一致性较高。

2.3.2 试题分析

为了解试题难度与质量,提高命题质量,计算了教师资格考试所有试题的平均分、难度、区分度与标准差。表4是2013年下半年物理学科知识与教学能力(高级中学)科目试题的统计分析结果。

图3 综合素质(幼儿园)成绩分布

表3 教师资格考试公共科目相关系数统计表

此外,为分析单项选择题的命题质量,进行了选项分析,如表5所示。将全部考生按该科目总成绩高低分为4组,每组人数占全部考生人数的1/4左右。表中列出了各分数区间选择各选项的人数比例。P表示未选。带*的为正确答案。

表5某题的选项分析结果显示,选择正确选项A的考生只占25%;选择错误选项C的考生高达40%,且成绩越高的考生组别选择C选项的人数比例越高。据此,可初步判断该题目可能存在某些设计上的问题或者错误,应将该题目交由命题组重审并修正。

表4 2013年下半年教师资格考试物理学科知识与教学能力(高级中学)试题统计分析

表5 选择题选项分析示例

2.3.3 项目功能差异分析

项目功能差异(Differential Item Functioning,DIF),是指对于某个特定项目,如果来自同一目标特质的两组平行被试组中,显现出不同的统计特性,那么该项目就存在功能差异。[4]教师资格考试将全部考生按照男女生、是否师范生、是否在校生等不同背景因素进行了分组统计,以考察各个组别间是否存在功能性差异。

DIF统计中,采用STND(Standardization)方法,计算公式如下:其中pfk和prk分别表示目标组和参照组在第k个分数上的得分率,k表示第k个分数水平的加权。STNDp-DIF取值范围在-1~1之间,负值表示项目有利于参照组,正值表示有利于目标组。一般认为取值在-0.1~0.1之间时,是应该容纳的取值误差;取值在-0.1~0.1之外时,目标组和参照组之间存在DIF。以综合素质科目男女生DIF为例,其中男生为目标组,女生为参照组,见表6。对于取值在-0.1~0.1之外的试题,将对其加以分析是否存在功能性差异。

2.4 项目反应理论在教师资格考试中的应用

目前,在教师资格考试的统计分析中,仅对部分科目的试题应用项目反应理论(Item Response Theory,IRT)进行了分析。其主要目的是为今后的题库建设与计算机自适应考试提供理论参考。与传统的CTT相比,IRT具有项目参数更加精确,能力分数分布优于测验分数分布,从而使分数分布更加合理等优点,但也存在着能力单维性假设难以满足,个别项目上参数值较差等问题。[5]因此,为保证统计分析数据的稳定性和可靠性,现阶段教师资格考试的试题试卷分析中,主要还是使用CTT方法进行分析。

表6 综合素质科目男女生STNDp-DIF值

下面以数学学科知识与教学能力科目为例介绍IRT方法在教师资格考试中的应用。

2.4.1 采用模型

采用三参数Logistic模型对实测数据进行分析,并考察实测分数与拟合分数的一致性,具体模型如下:

其中i表示小题号,θ表示被测的能力值,Pi(θ)表示能力为θ的被试答对第i题的可能性。a为区分度参数,一般取值范围在[0,3];b为难度参数,一般取值范围在[-3,3];c为猜测参数,取值范围在[0,1]之间。

2.4.2 统计结果

数学学科知识与教学能力科目选择题的三参数Logistic模型的参数估计与检验结果见表7。

χ2值反映了该参数下的模型拟合度,χ2值越低,拟合度越好。P值反映了在该参数假设下的显著水平,一般来说,P<0.01时,说明是较强的判定结果,拒绝假定的参数取值;0.01<P<0.05时,说明判定结果较弱;P>0.05时,说明结果更倾向于接收假定的参数取值。从结果来看,除第1题P值为0.03,其他题目的P值均在0.05以上,说明模型的整体拟合良好。

将三参数Logistic模型的难度与区分度参数估计结果与CTT方法相应的统计结果进行对比,见表8。

其中,b值越高,说明题目越难;CTT下的难度值越低,说明题目越难。表8显示,IRT模型分析结果与CTT下的统计结果基本相符。

表7 数学学科知识与教学能力科目选择题的三参数Logistic模型分析结果

表8 三参数Logistic模型分析结果与CTT方法统计结果对比

2.4.3 局部独立性检验

采用Q3指标法进行题目的独立性检验,定义

其中uik为第k个考生在第i个题目上的得分,Pi(θk)为该考生在该题目上的正确反应概率。根据定义可以计算出每个考生在每个题目上的d值,然后定义

其中r为两个题目i、j之间d值的相关系数。一般认为Q3的绝对值大于0.2时,两个题目之间存在相依关系,否则认为其相互独立。

数学学科知识与教学能力科目选择题间的Q3指标的计算结果见表9。

可以看出,试题间不存在相依关系,符合IRT局部独立性假设。

表9 数学学科知识与教学能力科目选择题Q3指标

3 关于教师资格考试统计分析方法的思考

教师资格考试社会影响大,考试的质量和公平性备受关注。质量和公平性的评判需要科学的依据,因此对考试结果做出科学的分析和判断显得尤为重要。目前,教师资格考试测试结果的分析主要还是基于CTT理论,其优点在于数学模型简单,易于理解和接受,且计算简便,适用性广。[6]但是随着国内考试技术的发展,基于IRT理论的题库、计算机自适应考试必将成为未来的发展方向,因此利用IRT理论对试题进行分析、进行分数等值处理、进行主观题的多级评分是进一步研究的方向。此外,加强教师资格考试的效度研究,加强考试能力结构的分析,充分发挥考试对教育、教学和教师培养的评价功能,是下一步努力的方向。

[1] 陈雪娟.也谈试卷质量分析[J].数理统计与管理,1994(2).

[2] 张敏强.教育测量学[M].北京:人民教育出版社,1998.

[3] 朱德全,宋乃庆,等.教育统计与测评技术[M].重庆:西南师范大学出版社,2010.

[4] 董圣鸿,等.三种常用DIF检测方法的比较研究[J].心理学探新,2001(3).

[5] 杜洪飞.经典测量理论与项目反应理论的比较研究[J].社会心理科学,2006(6).

[6] 闫成海,等.高考数学中考试评价的研究——基于CTT与IRT的实证比较[J].华东师范大学学报(教育科学版),2014(3).

猜你喜欢

分数线教师资格学科知识
通向学科育人的学科知识观
品读
湖南省2021年教师资格认定时间确定
我省近两年普通高校专升本选拔考试第二批招生院校录取最低控制分数线对比
2017年-2018年专升本院校录取分数线
中小学教师资格考试在即
学校德育要植根于学科知识的意蕴之中
陕西:中小学教师资格考试与认定分离
浅析教师资格定期注册制度