APP下载

组织学考试的质量测评

2015-08-11钱晓菁仇文颖徐园园陈咏梅

基础医学与临床 2015年4期
关键词:难易度区分度组织学

钱晓菁,仇文颖,徐园园,陈咏梅

(中国医学科学院 基础医学研究所 北京协和医学院 基础学院 人体解剖与组织胚胎学系, 北京 100005)



医学教育

组织学考试的质量测评

钱晓菁,仇文颖,徐园园,陈咏梅*

(中国医学科学院 基础医学研究所 北京协和医学院 基础学院 人体解剖与组织胚胎学系, 北京 100005)

目的了解北京协和医学院组织学的考试质量。方法对2006级至2010级临床医学专业八年制学生组织学考试试卷共393份进行教育测量学计算与统计学分析。结果组织学考试5年的成绩总平均分为79.5±12.9,学生成绩在各学年间无显著差异。试卷分析显示5年间试卷难易度在0.77~0.84之间小幅变化,区分度从0.26逐渐增加到0.34。信度和效度全部达到优秀水平。试题分析显示综合评价为优秀的试题从2006级的59.09%上升到2010级的88.89%,全部230道试题中优秀试题占72.17%。 2006级与2010级在试题难易度、区分度方面存在显著差异。结论组织学考试的质量整体较高,试题的质量也在逐年提高,但仍存在一些不足有待改进。考试质量分析为今后教学质量的提高和试题库的建设提供了重要参考。

考试质量分析;教育测量学参数;组织学

考试是教学的重要环节,以往对考试作用的认识大多只停留在它对学生学习效果的评价方面,把考试当成了教学的终点,因此也就忽略了对考试本身进行质量测评,忽视了考试质量分析对教学所起的反馈和引导作用[1]。考试质量分析不仅可以帮助教师了解学生对知识的理解和掌握情况,检查和评估教学效果;也可以帮助教师发现自身教学过程中的不足,引导教师总结经验教训,调整教学内容,提高教学质量;此外,考试质量分析还可以为教学管理部门提供有效的参考指标[2- 3]。

考试质量分析包括定性分析和定量分析,定量分析又可以分为考试成绩分析、试卷分析和试题分析3部分。在定量分析的基础上,结合教学工作的各个环节进一步进行定性分析,最终综合评价考试质量[4]。为了了解北京协和医学院组织学的教学与考试质量,更好地建设和完善组织学试题库,便于今后有针对性地提高教学质量,本研究对历年的组织学考试试卷进行了教育测量学评价与分析。

1 研究方法

将2006~2010级临床医学专业八年制学生组织学考试试卷共393份,每年每人每题的得分情况逐一录入EXCEL和SPSS表格。根据教育测量学要求,选择所需测量参数,如考试情况评价指标,包括平均分、标准差、正态性检验(偏度和峰值)、成绩分布频数等;试题评价指标,包括难易度(P)、区分度(D);试卷评价指标,包括难易度、区分度、信度和效度等[4- 5]。其中区分度计算采用两端分组法,分组时根据“考试成绩总体呈正态分布时,有显著差异的群体将位于首尾的25%~33%”和“在水平相近、数量偏小的样本中,分组参数应适当缩小”的原则[6],考虑到八年制学生人数较少的情况,采用25%作为分组范围,即高分组、低分组比例各占总人数的25%。信度计算采用克伦巴赫(Cronbach)α系数法,效度采用效标关联效度计算,以同批学生胚胎学的考试成绩作为效度标准。应用EXCEL和SPSS软件,对相关数据进行处理、计算和统计分析[4,7- 9]。

组织学考试属于课程考试,在教育测量中属于学业成就测量。此类考试以教学大纲作为标准,主要检测教学目标实现的程度,因此属于标准参照考试,与高考等选拔性的常模参照考试分属于不同考试类型[10],因此其评价标准也与主要源自于常模参照考试的经典教育测量学标准不同。参考测量学家伊贝尔(Ebel)等人提出的教育测量学测评标准,以及各医科院校对基础医学考试的评价标准[4,9,11- 14],结合自身特点,将试题难度、区分度、综合评价、信度和效度的评价标准分成若干级别(表1)。

2 结果

2.1 考试成绩分析

2006~2010级考试成绩分析各项数据(平均分、标准差、正态性检验的偏度、峰值等)如表2所示,所有学生的总平均分为79.5±12.9,不及格率平均为8.91%,高分段(95~100分)平均为5.85%,各年级成绩的频数分布基本呈正态分布。各年级人数分布最多的分数段:2006和2009级为90.0~94.5,2008级为85.0~89.5,2007和2010级为80.0~84.5。考试成绩经方差分析未发现各年级间存在显著差异。

2.2 试卷分析

5年考试试卷的信度、效度、难易度和区分度,见表3。各年级的试卷信度均大于0.8, 效度均大于0.4,均达到优秀水平;试卷难易度在0.77~0.84之间,均属于较易级别(0.75~0.90);区分度在0.26~0.34范围内变化,达到良好水平(0.2~0.4)。

表1 试题评价和试卷评价分级标准Table 1 The criteria for grades of test question and test paper evaluation

表2 5年组织学考试成绩分析表Table 2 Descriptive statistics of the test score for 5 years

表3 5年的试卷分析表Table 3 Values of the parameters of test paper for 5 years

2.3 试题分析

5年组织学考题共230道,难易度最低值为0.32,最高值为1.00。试题根据难易度分为4个等级,达到最难等级(P<0.4)的试题2道,占0.91%;较难试题(0.40~0.55)14题,占5.77%;较易试题(0.75~0.90)所占比例最大,为50.34%;中等试题(0.40~0.75)与最易试题(P>0.9)比例接近,分别为20.81%和22.17%。各年级的不同难易度试题的比例,见图1A,方差分析结果显示2006级分别与2008级和2010级之间有显著差异(P<0.05),其他各年级间均无显著差异。

全部试题区分度变化范围为-0.09~0.68,区分度等级为差、尚可、良好、优秀的试题所占比例依次为11.11%、17.02%、42.90%和28.97%。各年级不同区分度别试题比例,见图1B,区分度等级为优秀的试题逐年增加,从2006级的20.45%增加到2010级的42.59%;良好的试题比例基本在40%左右,变化不大;差和尚可的试题逐年减少,这两部分加在一起(即D<0.2)的试题比例,从2006级的40.9%降至2010级的11.12%。方差分析结果显示,2010级分别与2006级、2007级有显著差异(P<0.05),而在其他各年级之间无显著差异。

试题综合评价情况,见表4,全部试题中综合评价为较好(P<0.4,D>0.2)和差(P<0.4,D<0.2)的试题各有一道;优秀试题(P>0.4,D>0.2)占总体的72.17%。优秀试题在各年度也都占比最大,并且还呈现逐年增加的趋势;一般试题(P>0.4,D<0.2)则在逐年减少。

3 讨论

属于标准参照考试类型的课程考试其评价标准与高考等常模参照考试有所不同[15]。针对课程考试,有学者指出试卷的难易度应控制在0.51~0.84,区分度需大于0.13,试卷信度需大于0.62,平均分在52.87~86.54之间,标准差范围为4.61~14.99。而各试题的难易度应在0.4~0.9之间,大多数试题区分度大于0.2即可[3,10,13,15]。根据以上标准,发现组织学考试的大部分教育测量学参数的数值在参考范围内。5年试卷的信度和效度都达到优秀水平,说明考试的可信度高、有效性好,能够真实地反映学生水平。试卷各评价指标在各年度间数值变化幅度不大,各年级考试成绩也无明显差异,说明考试质量整体比较稳定。70%以上试题综合评价为优秀,提示试题质量整体较好。总体来说,近年的组织学考试质量较高。

A.difficulty; B.discrimination

comprehensiveevaluation20062007200820092010verygoodD>02P>045909(26)6591(29)7045(31)7273(32)8889(48)P>090(0)1724(5)323(1)313(1)1667(8)P:04~09100(26)8276(24)9677(30)9688(31)8333(40)goodD>02P<040(0)227(1)0(0)0(0)0(0)moderateD<02P>044091(18)3182(14)2727(12)2727(12)1111(6)P>097778(14)4286(6)4167(5)5833(7)6667(4)P:04~092222(4)5714(8)5833(7)4167(5)3333(2)badD<02P<040(0)0(0)227(1)0(0)0(0)

有学者指出一套试卷中难度适中、区分度较好的试题占70%以上为宜[12]。从2008级后优秀试题比例均符合该标准,并且在逐年提高。部分原因是增加了在认知层次上属于问题解决型试题[13]。此类试题虽然涉及一些看似学生尚未学过的临床现象,但通过运用所学基础知识经过综合分析,学生不难找到正确答案。此类试题更好地锻炼了学生的综合分析能力,而且可以提高试卷的质量,今后可将回忆、解释、问题解决3个认知层次的试题比例调整为7∶2∶1[13]。试题难度方面,最易、较易、中等、较难、最难各部分试题比例可为6∶41∶34∶13∶6[13],根据此标准,组织学考试中较易题和最易题比例偏高,中等以上难度的试题数量明显不足。如何调整各部分试题的比例,才能使考试成绩既能体现教学目标的完成情况,还能使各分数段学生分布更加合理,是今后需要深入研究的问题。

通过考试质量分析,不难看出想要使考试更科学、客观、质量更高,就要在出题时充分考虑试题难易度、区分度、与大纲相符程度、题量、题目类型和比例等多方面因素[5]。通过考试质量分析,不仅可以发现以往的不足,更为今后提高考试和教学质量提供了科学依据,还为试题库建设和标准化考试奠定了基础。

[1] 邓树权,李慧梅. 试卷分析与需注意的特殊问题 [J]. 四川解剖学杂志, 2005, 13: 40- 42.

[2] 吴红燕,程益群,孙业桓. 某医科大学2005-2010年试卷质量评估分析 [J]. 中华医学教育探索杂志, 2013, 12: 213- 216.

[3] 赵立新. 试卷质量的定量评价 [J]. 华南农业大学学报(社会科学版), 2004, 4: 136- 141.

[4] 王渊. 考试质量分析系统的设计 [J]. 医学教育探索, 2010, 9: 971- 974.

[5] 景汇泉,张颖,郭永松,等. 医学考试评价的研究进展 [J]. 中国高等医学教育, 2009: 36- 37.

[6] 文民刚,张立力,胡桂,等. 对教育测量学中几个重要评价指标的再认识 [J]. 中国高等医学教育, 2002, 2: 5,33.

[7] 王海,吕玉霞. 试卷分析常用指标及EXCEL操作方法. 2010年全国中医儿科学术交流大会暨第二届中华中医儿科高等教育论坛论文集[M]. 北京, 2010:74- 79.

[8] 刘敏钰. 运用SPSS、Excel进行试卷质量分析初探 [J]. 陕西教育学院学报, 2004, 20: 102- 105.

[9] 刘叔才,葛利荣. 医学考试质量评价指标体系的构建与实现 [J]. 中国社会医学杂志, 2008, 25: 202- 204.

[10] 余仙菊,彭如宽,卢凤娟. 教育测量理论在高校课程考试中的应用研究 [J]. 中国高等医学教育, 2006, 8: 23- 25.

[11] 夏平,徐邦生,姚健,等. 组织学与胚胎学试卷库的使用与评价 [J]. 解剖学杂志, 2012, 35: 128- 129.

[12] 高茵茵,秦鹏,于晓松,等. 中国北方13所医学院校基础医学试卷的试题综合评价 [J]. 医学教育探索, 2007, 6: 842- 844.

[13] 时瑾,毕洪然,孙宝志. 基础医学学科综合考试题库系统应用的效果评价 [J]. 中华医学教育杂志, 2012, 32: 617- 619.

[14] 李金平. 考试质量分析 [J]. 江南大学学报(自然科学版), 2004, 3: 430- 434.

[15] 张春辉,席卫文,朱汉祎,等. 以考核创新促教学改革之实践总结 [J]. 大学教育, 2013, 23: 109- 111.

新闻点击

单凭BMI值无法预测心血管疾病的风险

据美国国家科学院院报(PNAS)网站(2013-09-11)报道,4篇发表于欧洲心血管与心脏病学年会的研究指出关于肥胖对影响心血管疾病风险的奇怪之处。根据这些研究的发现,在部分情况下,拥有高的体质指数(BMI)反而比较安全,这和过去普遍认为BMI数值越高越容易罹患心血管疾病的看法大不相同。这些研究反倒是提出其他比BMI值更重要的心血管疾病因子,包括腰围过大、患代谢失调疾病。

根据法国提出的研究,BMI值过低(低于22)与过高(高于35)的心血管疾病患者面临较高的死亡风险,界于两数值之间的患者面临的风险则相对较低,即便本身拥有过重或中度肥胖的问题患者亦然。当研究者将患者的腰围数值纳入研究后发现,腹部肥胖问题与急性心肌梗死的发作息息相关,不论BMI值高低,只要患者的腰围增加的同时,所面临的死亡风险就会一并上升。腰围增加最多的前1/4患者在5年内都面临着提高44%以上的死亡风险。因此,研究者认为,腰围是一个更好的预测指标,人们应该要更重视腹部肥胖与腰围增加的问题。

丹麦的研究学者则发现,代谢失调的发生比BMI数值更能预测年轻女性罹患心脏病或缺血性脑卒中的风险。这是一项针对无心血管疾病病史的年轻育龄女性所进行的研究。结果发现,没有代谢失调症状且BMI值小于25的女性最不容易罹患心肌梗死与缺血性脑卒中;若代谢状况良好但BMI值大于25,风险也不会高。但不论BMI值为何,一旦出现代谢失调的症状,心脏病与缺血性脑卒中的发生概率就会大幅提高。

该研究刊登于新一期Medpage Today。

Measurement and evaluation of theory examination in histology

QIAN Xiao-jing, QIU Wen-ying, XU Yuan-yuan, CHEN Yong-mei*

(Dept. of Human Anatomy, Histology and Embryology, Institute of Basic Medical Sciences, CAMS & School of Basic Medicine, PUMC, Beijing 100005, China)

Objective To evaluate the quality of the histology theory examinations in Peking Union Medical College. Methods A total of 393 theory examination papers in histology for medical students in 8-year clinical medicine program from Grade 2006 to Grade 2010 were evaluated.Results The average score was 79.5±12.9. There was no significant difference among them. Analysis for these test papers indicated that theP-value of difficulty varied within the range from 0.77 to 0.84, and theD-value of discrimination increased from 0.26 to 0.34 during these 5 years. The reliabilities and validities for the examinations of all 5 years were satisfying. Further analysis for the test questions revealed that the percentile of high-quality questions increased from 59.09% (Grade 2006) to 88.89% (Grade 2010), and overall 72.17% questions reached the criteria of high quality. The quality of test questions were significantly improved in terms of difficulty and discrimination when comparisons were made between those from Grade 2010vs. Grade 2006. Conclusions The overall quality of examinations for all 5 years are high, with the quality of test questions improved continueusly. However, there are still problems remained to be solved. The evaluation of examinations will provide critical indications for the future improvement of teaching quality and construction of a reliable question Tank for histology examination.

quality analysis for examination; parameters in education evaluation; histology

2014- 12- 16

2015- 01- 13

北京协和医学院校级教学改革立项项目(2014ZLGC0106)

1001-6325(2015)04-0567-05

G642.474; R329

A

*通信作者(corresponding author):chenym70@126.com

猜你喜欢

难易度区分度组织学
张帆:肝穿刺活体组织学检查
浅谈试卷分析常用的几个参数及其应用
图形推理测量指标相关性考察*
浅谈初中课堂教学中的情境创设
关于课堂提问的再思考
浅观一道题的“区分度”
数学课堂中如何把握提问的科学性
泌尿系统组织学PBL教学模式浅析
单维参数型与非参数型项目反应理论项目参数的比较研究*
六种常用实验动物比较组织学共享数据库的初步建立