APP下载

计算机模拟临床病例考试试题的统计分析研究

2013-04-23康宁

考试·教研版 2013年1期
关键词:统计分析

康宁

【摘要】 计算机模拟技术在医学考试领域的研究和应用已经有多年的历史。考试后进行数据统计分析,可以对试题、试卷做出评价。对于存在问题试题,可以淘汰或修改,完善后重新补充到试题库,从而提高医学考试命题质量。

【关键词】 计算机模拟临床病例试题 统计分析 命题质量

【中图分类号】 G424 【文献标识码】 A 【文章编号】 1006-5962(2013)01(a)-0001-02

1 计算机模拟临床病例考试后对答题情况统计分析的重要性

以往考试结束后,只分析考生的成绩,评价都是从定性角度去分析,得出的结论比较笼统。目前采用数理统计对答题情况进行定量分析,从而得出一系列有关试题试卷的参数和数据,然后与规定的标准参数指标进行对比,这样就可以反映出试卷内容的偏差,从而合理给出试卷的评价1。计算机模拟临床病例考试把书本知识通过临床实践转化为技能。考试结束后,通过对答题情况统计,可以得到很多有效数据信息,分析后可以确定试题命题质量。

2 统计分析实例

现有一个专业计算机模拟临床病例考试,试题为不定项选择题,70个提问,100分,随机抽取200人答题数据,进行统计。

2.1 统计每个提问各选项答题数据,计算每个提问平均分

(1)汇总每个考生的答题数据;(2)汇总每个提问所有考生答题数据;(3)统计各提问内各选项考生选择数据;(4)计算每个提问每个考生得分;(5)计算所有考生在每个提问所得平均分;(6)对所得数据进行分析。

数据异常有三种:①平均分低于0.60为异常数据;②正确答案选择人数太少;③错误答案选择人数太多。

经过分析,数据异常见表1:

数据异常的分析:①参与考试的大部分考生对该知识点没有掌握;②命题老师出题错误;③题库答案录入时有误。

2.2 试题难度

非二分法的试题,应以考生在该题的平均分除以该题的满分。

难度:0.00-0.39为难,0.40-0.69为中等,0.70-1.00为容易。

通过分析,得到数据:

难题13道;难度中等试题21道;容易试题36道。

难题所占比例为18%,难度中等试题所占比例为30%,容易试题所占比例为52%。试题难易度分配比较合理。

2.3 试题区分度

区分度是试题区分考生水平的程度,试题区分度的高低意味着试题对于能力强与弱的考生在测验分数上的区别和鉴别度的高低 。

试卷区分度反映试题区分不同水平受试者的程度,即考生的不同水平,把优秀、一般、差三个层次的考生真正分别开。区分度高的考试,优秀、一般、差三个层次的考生都有一定比例,如果某一分数区间考生相对集中,高分太多或不及格太多的考试,区分度则低。

先将试题分数从高往低排序,前27%的考生为高分组,后27%为低分组。分别计算两组在该道试题的难度值P,P1=27%高分组的难度,P2=27%低分组的难度2。

区分度D=P1-P2

试题的区分度在0.4以上表明试题优秀,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。

按照区分度的算法,得到表2数据:

优秀试题53道,较好试题3道,需修改试题9道,淘汰试题5道。

这一标准并非绝对,根据考试性质有所不同。有些较易或较难的试题,其区分度往往偏小,这类试题只要科学无误,又是必考内容,在标准参照考试中仍可应用,不必摒弃。

2.4 信度

信度是测量考试结果一致性的指标,目的是测试结果是否稳定可靠。测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。一般采用分半信度。对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,再用公式计算整份试卷的信度系数。

求出相关系数r,再用斯皮尔曼-布朗公式进行校正,从而得出整个试卷的信度。

信度系数以1.00为最好,但实际测量都小于1.00。美国全国医学考试委员会曾规定:信度小于0.70,则该考试所得分数价值不大;信度大于等于0.70,则可以用于常规考试。由于技能病例考试难度大于其他类别考试,因此认为信度值达到0.60以上,即可。

通过计算:

n=200 ∑xy=203177.56 ∑x=6086.19 ∑y=6619.22

∑x2=188643.04 (∑x)2=37041714.51 ∑y2= 221989.08 (∑y)2= 43814042.79

r=0.55,α=0.71。说明ID这份试卷信度是比较好的。

2.5 效度

测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。

测试效度一般测试内容效度(content validity)。指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。要有良好的内容效度,必须在考试命题、组卷时就应由命题专家及组卷人员根据考试的目标,要求对试卷内容组成进行合理设计。

内容组成应包括,各病种病例的分数比例,试题内容按教学要求掌握分类的不同层次:了解、熟悉、掌握。按试题测试目标分类的不同内容归类:检查能力、诊断能力、处理能力和其它能力。按试题难易度的不同内容归类:难、中、易。

按照内容测试,ID这套试卷病种数多,覆盖面广,病例具有代表性。掌握层次了解、熟悉、掌握;测试目标:检查能力、诊断能力、处理能力和其它能力;试题难易度:难、中、易都有所涵盖。

本套试卷在命题组卷使用后,通过以上数据统计分析,可以得出结论:该套试题的命题质量总体良好。但是发现个别试题存在问题,为相关专业专家进行修正提供数据参考依据,经过进一步完善,补充进技能考试题库,可以更好的为以后其它考试所使用。

3 结语

计算机模拟临床病例试题需要在考试中得到检验, 只有通过试卷试题数据统计,提供给相关命题专家,经过分析研究,将不合格试题淘汰或修改,试题才能完善优化,试题质量才能真正得以提升。虽然考试后数据统计分析工作量巨大,但是对试题试卷的命题工作具有重要意义。因此, 试题统计分析是考试后需要继续深入研究的内容。

参考文献

[1] 刘百良.试卷质量分析的数理方法[J].数理统计与管理,1987(6).

[2] 万金凤.于试卷质量的分析方法[J].山西大学学报,2006,3.

猜你喜欢

统计分析
SPSS软件在教学统计分析中的应用
多元统计分析在企业经济效益评价中的应用
近年退役士兵培训研究内容的数据统计与评析
SQL生成器设计与实现
2004—2005年国家社会科学基金重大项目立项项目的计量研究
2015年各省区煤矿死亡事故统计分析
如何发挥新时期统计工作的作用之我见
以统计分析为基础的房地产税收优化分析
SPSS在高校图书馆服务体系中的应用研究