APP下载

“教考分离”教学成果评价体系建设之试题及试卷评价体系的建设

2015-10-29马平延安大学西安创新学院陕西延安716000

文艺生活·中旬刊 2015年10期
关键词:教考分离教考试题库

马平(延安大学西安创新学院,陕西延安716000)

“教考分离”教学成果评价体系建设之试题及试卷评价体系的建设

马平
(延安大学西安创新学院,陕西延安716000)

本文通过对“教考分离”考试模式的探索性改革的研究,重点分析分析“教考分离”教学成果中的试题及试卷评价体系的建设方法,试图通过难度、区分度、信度及效度四个技术指标来进行评价分析,进而可以以点带线、以线扩面,更加科学、合理的评估“教考分离”的教学效果,完善“教考分离”的实际作用。

教考分离;难度;区分度;信度;效度

成果评价体系建设是教考分离改革内容的核心领域。试题库建设是教考分离改革的重点,整个考试过程中的试题出卷、监考、流水批卷是保证笔试的重要环节。试题出卷是由试题库随机抽取而得;监考纪律取决于监考监管力度;规范化的评分标准是试卷批改给分的重要保证,流水批卷则有效规避了教师等人为因素带来的不公平性。期中,试题库中的试卷质量是考试过程中最重要、技术性要求最高的环节,必须通过各项试题及试卷的量化处理而得到。

为了使试卷量化评价科学有效并有代表性,我们引进了统计学的量化指标,即:难度、区分度、信度及效度。

一、难度(P)

简单的说就是试题的难易程度。而试题根据其类型我们又分为主观试题和客观试题,那么对这些试题的难度评价指标可具体为:(1)客观试题难度:P(客)=该题答对人数/参加考试总人数;(2)主观试题难度:P(主)=该题平均分/该题满分;(3)试卷整体难度:P(主)=试卷平均分/试卷满分。其中,P为难度,当P≥0.7时,说明试卷(题)为简单;0.4≤P≤0.69,说明试卷(题)难易适中;P≤0.39,说明试卷(题)难度高。由此可见P值越大,试卷(题)难度越低;P值越小,试卷(题)难度越高。

一般考试最好能把P值控制在0.5左右比较合适,因为难度过大或过小都会对考察对象失去考察的意义,即试题的信度就会降低。当然,在有特殊考察目的的考试中,如:选拔性考试,则可以适当加大考试难度进行考试。同时,学生某科考试成绩的平均分(A)及标准差(S)这两个技术指标(我们可以将这两个指标其视为辅助参照指标),也可以从一定程度上宏观地反映出试卷的难易程度,当我们将P、A、S这三个指标进行对照比较时可以较为可观的评价试卷的难易程度。

二、区分度(D)

目的在于将考生的考试水平区分开来,成绩上有较为明显的差距,从而避免某一区段分数的学生过于集中。区分度较高的试卷可以将优秀、良好、合格及不合格成绩的学生按照科学比例进行分配,具有较好的考核信度及效度。

通常来说区分与难度具有相关性。区分度较好的试卷就会具有一定的难度,同时,区分度也会被动的受到考生水平的影响,当考生考试水平等于或略高于试题难度时,试卷的区分度才会有所凸显。区分度指标计算方法如下:

1.单个选择题的区分度:D(单)=M-N(M为高分组的通过率,N为低分组的通过率;期中:通过率M=高分组答对该题人数/高分组人数;通过率N=低分组答对该题人数/低分组人数。

2.整个试卷(试题)的区分度:D(试)=2(XH-XL)/W;期中:XH为高分组的试卷(题)平均分,XL为低分组的试卷(题)平均分,W为试卷(题)总分值。当D=0时,表示无区分;D>0时,D值越大,表示试卷的区分度就越好;当D<0.18时,说明该试卷(题)区分度极差,可以废弃;当0.18<D<0.3时,表明试卷(题)区分度不太好,需要修改,无优胜略汰的能力;当0.3<D<0.4时,表明试卷(题)具有较好的区分度,可以作为大部分的考试试题来用;当D>0.4时,说明试卷(题)区分度很好。

三、信度(α)

主要是衡量同一试卷或平行试卷对考生反复考察时,所得考试分数的可靠性、稳定性及一致性。其可以很好地检验学生考试成绩的稳定性及真实性,并有效地反映试卷考察内容与教学内容的相关程度。具体指标计算如下:

α=(K/K-1)×(1-∑Si 2/St 2)

其中:K为试题的数量,Si 2为某一题试题的得分方差值,St 2为考试卷面总分的方差值。信度α的值越大,信度就越好,试卷的测评可靠性就越佳,当信度α≤0.7时,信度不佳,0.7≤α≤0.89时,信度较好,α>0.9时,信度最佳。

四、效度(V)

衡量考试有效性的指标,针对性的来说就是试题内容构成及其所占比例是否符合教学大纲所要求的考察内容及比例,即我们考察的是内容效度,若两者高度符合,则说明该试题效度很高,达到考试大纲考核要求。我们通常用学时构成比与分数构成比来做比对,从而评价试卷的效度问题。具体计算方法如下:

相关章节学时比=各章节学时/该课程总学时×100%;

相关章节试题分数比=各章节所占试卷分数/试卷总分× 100%;

当学时比与分数比符合度较高或一致时,说明试卷考核内容达到大纲要求,试卷考核效度高。

总体来说难度、区分度、信度及效度四个评价指标主要是用来评价试题库内试卷的重要指标,从而帮助我们分类、分析试题库内试卷质量,从而优化试题库的建设,提高对学生考察的力度及有效性。

[1]张杰,郝文武.浅谈高等学校教考分离的利弊及改进[J].延安大学学报(社会科学版)2000(01).

Q178-4

A

1005-5312(2015)29-0231-01

猜你喜欢

教考分离教考试题库
对标评价体系,促进教考一体
“教考分离”在体育院校田径专业中的实践与探索
中职学校教考分离后试卷分析的重要性
新形势下安全培训教考分离工作初探
对高职高专大学英语教考分离的思考
基于教考分离的课堂教学评价体系改革与实践
电路基础课程体系建设探索
项目反应理论在考试系统试题库中的应用
基于Quiz Creator的“机械图样的绘制与识读”随机组卷试题库的制作与研究
互动式大学物理教考分离题库设计