“3+2”助理全科医师培训《临床综合课程》结业试卷评价及相关因素分析
2015-06-02马秀华张东海黄东明赵留庄
马秀华,张东海,黄东明,赵留庄
首都医科大学大兴医院,北京 102600
《临床综合课程》是由首都医科大学全科与继续教育学院(以下简称“首医”)统筹主持的“3+2”助理全科医师培训工作中课时最多(45学时)、涉及内容较多的培训课程。该项目由北京市远郊区县7家教学医院(区域性医疗中心)具体实施,大兴教学医院承担了该门课程教学实施总负责任务。课程实施于临床轮转期间,具体内容包括人文教育课程(侵权责任法、执业医师法的解读以及医患沟通技巧,等)、全科医学概论,还包含内、外、妇、儿等二级学科的教学内容。由于该课程是首次执行,仅有初步的教学大纲,没有专用教材,课程承担单位多、教学内容多、范围广、课时少,而教学对象又为大专毕业生(加上该次培训2年,即“3+2”),因此在课程开展前针对上述因素进行了多次集体备课,确立了教学原则与具体思路。但究竟教学效果如何,需要评估以便为下一轮教学工作的改进提供依据。考试作为一种基本检测手段,不仅可检验学生的学习效果,而且可以评价教师的教学质量、发现教学中存在的问题[1-2]。为此,《临床综合课程》联合教研室对参加本轮培训的所有120名学员进行了统一试卷的课程结业考试,现对试卷中的客观试题(A型题)答题结果进行分析、报告如下。
1 对象与方法
1.1 对象及内容
1.1.1 考试对象 参加首轮“3+2”助理全科医师培训的全部120名学员。
1.1.2 试题来源、选用原则及评判 考试试题由联合教研室制定统一原则(教学大纲需掌握内容),由各教学单位承担课程的教师提供,建立题库后再随机抽调。课程负责人只组织试卷,不负责具体试题出题。试卷中的客观试题(A型题)共计50题,每题分值1分,按照教学大纲内容、教学课时统一分配各章节知识点试题所占分数,平均每学时1分。鉴于学员的培养目标与将来的工作性质,人文教育课程与全科医学概论(4学时)每学时各分配2分值,心血管系统疾病多分配1分值。考试由联合教研室统一组织、同一时间举行。试卷统一印刷,在考试前发放到各单位,考生就位后开始答题。考试结束后各考点将试卷交回首医教务处统一组织流水作业阅卷。
1.2 方法
1.2.1 用Excel 2000建立数据库 将各题的编号、分值和每名学生的成绩等数据录入计算机,利用Excel 2000的软件进行统计处理。
1.2.2 难度系数(P) 试题的难度是指试题的难易程度,多用难度系数(P)来评价。计算公式:P=该题的平均得分÷该题的满分值)[3]。
1.2.3 区别度(D) 区别度(D)是指能够区分成绩好的学生和成绩差的学生的能力,通过高分数段和低分数段学生的难度系数计算得出,即D=PH-PL(PH为成绩前27%学生的难度系数,PL成绩后27%学生的难度系数);该公式也可以换算为D=2×(高分段学生的得分之和-低分段学生的得分之和)/两组总人数满分之和[3]。
1.2.4 试卷信度(α) 主要用于评价该试卷检测结果的可靠程度,可以理解为被测者在测试中的实测值与真实能力的一致性。信度应该在0.9以上,低于0.7以下的试卷不能采用。该文采用的是Cronbach系数(α)。(α)=试题数/试题数-1×[(所有被测者第i题的方差-所有被测者总分的方差)÷所有被测者第 i题的方差][3]。
2 结果
2.1 成绩分析
该试卷客观试题满分为50分,120名学员中最高分为45分,最低分为24分。各分数段频数分布如表1所示。该次考试成绩主要分布于35分~40分,学员平均得分(38.0 ±3.9)分。
表1 120名学员客观试题考试成绩分布
2.2 试卷客观试题(A型题)分析
试卷信度(α)主要用于评价该试卷检测结果的可靠程度,试题的难度和区分度是评价试题质量的主要指标[3]。试题的难度是指试题的难易程度,并反映大部分学生对该题考查知识点的掌握程度,主要依靠难度系数(P)来评价。区别度(D)是指能够区分成绩好的学生和成绩差的学生的能力,通过难度系数计算得出。该试卷客观试题(A型题)的试卷信度(α)为0.99,难度系数(P)为 0.75,区分度(D)为0.19。该试卷客观试题(A型题)各试题难度系数数值、区别度指数数值以及两者的关系如表2所示。
表2 试卷客观试题的难度与区别度的分值分配关系表
该次考试为课程结业性考试,属于目标参照性考试[4],主要目的是了解学员对该课程基本知识的掌握程度,而非区别性考试。因此在试题选用上期望最终平均分为40分(A型题的总分50分),不要求过高的区别度。该试卷客观试题(A型题)的试卷难度系数为0.75,区分度为0.19,平均(38.0 ±3.9)分,即属于相对较易试卷,区分度尚可,试卷设计基本符合该次考察目的,也符合培训课程的目标。从信度=0.99可看,该试卷信度较高[1],适合于专业理论与能力的测验。
2.3 试题的难度与区别度
目标参照性测验的目的是测量考生达标情况,题目难度不要求统一,目标要求简单的测验,试题难度低一些。一般来讲,难度系数≥0.7属于较易题;0.4<难度系数≤0.7属于中等难度题;难度系数<0.4则属较难题[3]。难度和区分度之间具有如下的关系:难度系数越大,说明该试题难度越小,大部分学生都已掌握,则区分度较差;难数系数越小,说明该试题难度越大,大部分学生均未掌握,则区分度也较差;而难度适中试题的区分度则较好[1]。一般认为较好的试卷的试题难度分配,难、中、易试题的比例应当分别为20%、60%、20%[5]。该套试卷客观题部分不同难度试题比例为8%、20%、72%,属于较易试卷;该试卷区别度<0.15的试题达到35题(比例为70%),说明多数试题区别度不高,但在结业性测试中是允许P=1,D=0的试题出现[6]。所以,上述结果表明,该次测试符合目标参照性测验的标准。
2.4 对难度系数<0.4的试题分析
该次测试属于目标参照性测验,平均每学时采用1分值,理论上(试卷期望值)每道试题均应该有80%的学员掌握,因此有必要对难度系数<0.4的试题进行分析,目的是评估为什么学员对这些试题答错率较高,是试题的原因、教材的原因、教师的原因,或是学员的因素?原因何在?该试卷难度系数<0.4的A型题共4道。
2.4.1 试题一 肺炎链球菌肺炎的抗生素治疗停药指标是(P=0.38)?答案分别为:A.热退停药;B.热退3 d停药;C.热退5-7 d停药;D.症状体征消失停药;E.胸片病变消散停药。标准答案为B即热退3 d停药。
评价与分析:根据《共识意见》[7]:抗感染治疗一般可于热退和主要呼吸道症状明显改善后3-5 d停药,但疗程视不同病原体、病情严重程度而异,不宜将肺部阴影完全吸收作为停用抗菌药物的指征。对于普通细菌性感染,如肺炎链球菌,用药至患者热退后72 h即可;对于金黄色葡萄球菌、铜绿假单胞菌、克雷伯菌属或厌氧菌等容易导致肺组织坏死的致病菌所致的感染,建议抗菌药物疗程≥2周。对于非典型病原体,疗程应略长,如肺炎支原体、肺炎衣原体感染的建议疗程为10-14 d,军团菌属感染的疗程建议为10-21 d。《内科学》教材指出[8]:肺炎抗菌药物疗程至少5 d,大多数患者需要7-10 d或更长疗程,如体温正常48-72 h,无肺炎任何一项临床不稳定征象可停用抗菌药物。
此题的出发点不仅包括知识测试,也包括促使学员树立防止抗生素滥用的观念。考虑到学员将来的工作条件难以开展细菌培养以及药敏试验,因此在出题时既应考虑到考试的目的性,也应考虑到与实际工作结合。所以,该考题的出题角度应该有所变化,将上述方面均结合到,例如设置一个前提:当患者无肺炎任何一项临床不稳定征象时,应怎么办?
2.4.2 试题二 诊断输尿管结石的检查哪项不正确(P=0.23)?答案分别为:A、B超;B、泌尿系平片;C、静脉肾盂造影;D、泌尿系CT;E、腹平片。标准答案为E即腹平片。
评价与分析:中国泌尿外科疾病诊断治疗指南关于输尿管结石的诊断,推荐的方法学包括[9]:B超、尿路平片(KUB)、静脉尿路造影(IVU)、CT扫描,可选择的方法有逆行肾盂造影(RGP)、磁共振尿路成像(MRU)、放射性核素。B超可以发现2 mm以上的输尿管结石,简便、经济、无创伤,但易受腹腔脏器干扰;KUB可发现90%的输尿管结石,可大致确定结石的位置、形态、大小和数量。IVU一般与尿路平片结合应用。CT检查分辨率较KUB高,解决了KUB成像的组织重叠问题,不易受肠道内气体干扰,不受结石成分、肾功能和呼吸运动的影响,而且螺旋CT能够同时对所获得的图像进行二或三维重建,将横切面图像转换成类似IVU图像,可以清楚地显示包括阴性结石在内的结石的形态和大小。此外,针对肾绞痛患者,如果有条件可首选CT平扫,再依据CT结果适当选择其他影像学检查,以提高诊断准确率。但教科书指出[10],平扫CT很少作为结石患者的首选诊断方法。因此,对于基层医师首先选择的检查方法是B超及KUB。该题目的是既强调KUB的重要性,又希望学员注意与腹部平片的区别。腹平片无法看泌尿系全貌,照射距离和条件也不同。考虑输尿管结石而做腹平片,有时又需要重做KUB,会导致重复检查以及放射线损伤。因此,在下一轮教学过程中,特别是集体备课时应该强调此处。
2.4.3 试题三 蛛网膜下腔出血最常见的病因是(P=0.39)?答案分别为:A、高血压;B、血液病;C、脑动脉粥样硬化;D、先天性颅内动脉瘤;E、脑血管畸形。标准答案为D即先天性颅内动脉瘤。
评价与分析:根据1995年脑血管疾病分类,脑卒中包括蛛网膜下腔出血与脑出血。脑出血的最常见病因是高血压,蛛网膜下腔出血的最常见病因是先天性颅内动脉瘤[11]。该题从出题角度,没有问题,教材明确提及。但“蛛网膜下腔出血”与“脑出血”在教科书是分别论述的。学生答题正确率较低的原因,一方面为《脑出血》课程仅1学时,有的教师在讲解鉴别诊断时强调不足;该课程的设置题目为“脑出血”,并未列入“蛛网膜下腔出血”,所以学员回答“高血压”的比例较高。理论上讲,该题属于“偏题”,属于学员扩大自学内容,不适合于结业考试采用。对此,在下一轮教学时应该明确,但对于全科医师,需要掌握的基本点在什么层次需要探讨,这也包括测试方面的探索。
2.4.4 试题四 左侧偏瘫、右侧外展神经麻痹和右面神经周围性麻痹时,病变部位在(P=0.31)?答案分别为:A、右内囊;B、右中脑;C.右脑桥;D、右延髓;E、左延髓。标准答案为C即右脑桥。
评价与分析:该题是典型神经科脑干病变表现,难度不大,教材及讲课均会提到该脑干病变典型表现,实习时临床带教教师也会告知学生,属于必须掌握内容。分析原因:可能系学生解剖学基础知识太薄弱,导致答错率较高。因此,教师在教学过程中,既需要及时复习相关知识,对应掌握内容也需要不断强化。
3 讨论
3.1 试卷范围、选用A型客观题作为试卷分析的原因
鉴于该项工作首次进行,只有教学大纲而无专用教材,教学对象又为三年制专科毕业生,因此在课程开始前确定使用教材的范围为:以五年制本科医学生使用教材的相关章节作为“基础教材”,对应涉及的部分相关章节选定国内发布的相关疾病诊断和治疗指南作为教学“基本参考资料”,目的是提供最新的观点、知识。选用相关指南,既是为了规范诊疗行为,也是基于一项科研工作的结果[12-13]。教师以上述内容,并参照文献作进一步的修订来编写讲义,要求内容要适应助理全科医生教学工作,不能按照原来编排编写的讲义。试卷出题也要求限定于上述内容和范围。同时,试卷采用了客观题与非客观题混搭。但是,非客观题易于掺杂主观因素,因此仅选用客观题作为分析对象以减少环节上的误差。
3.2 考试中反映的教学问题及思考
3.2.1 教学工作要紧紧围绕“3+2”助理全科医师培训工作的对象 目前,我国基层卫生服务机构的全科医生来源主要有基层在岗医师转岗、大医院在岗医师进基层服务等两种临时措施以及国家鼓励的“5+3”模式[14]。而“3+2”助理全科医师培训的对象是经过三年学习的医学专科毕业生,目前已经在乡镇卫生院就业,将来从事基层全科医学工作的人群,实际上是专科后教育。由于专科与本科医学教育的培养目标的差异,学员在基础理论、基础知识等方面有一定的欠缺[15]。因此,在教学过程中要注意相关知识的复习。
3.2.2 如何在教学内容多、范围广、课时少的条件下更好完成教学任务 由于包含教学内容多,教学时间少,又穿插在临床轮转过程中,因而教学难度非常大。因此,要在第一轮确定的教学内容、教学思路、课程编排、教学方法等原则的基础上,继续在教学方法、教学思路方面更进一步深入探讨,同时也将对试题的考察范围进行研究。对课程建设继续深入研究,使下一轮教学活动更加规范化、科学化、系统化。
3.2.3 试卷本身的问题 该试卷客观试题(A型题)的试卷信度(α)为 0.99,难度系数(P)为 0.75,区分度(D)为0.19。而50道测试题中36道难度系数(P)为﹥0.7;35道区别度(D)<0.15,说明试卷区别度略低。尽管该项测验是目标参照性测验,这对联合教研室也有几点启发:将来的考试可以全部或大部采用客观题的形式,对试题的难度可以适当加大以适当增加区别度(该试卷仅4名学员低于30分及格线),强化集体备课以消除不同单位在教学工作中的差异。
考试是检验学生学习效果、评价教师教学质量、发现教学中存在问题的手段之一[1,2,16]。实际上,这种测量方式(信度、难度系数、区别指数)也用于其他医学指标测量、分析与评价,因为其具有较为良好的合理性、可行性[2,17]。我们将在下一步教学实践中继续应用这种评价模式。
“3+2”助理全科医师培训工作《临床综合课程》的教学与课程实施对于我们是新任务、新尝试、新问题。作为一项新工作,难免有不足和遗漏,因此需要不断总结经验、持续改进提高,为新的教学工作打下良好基础。
[1]张正祥,刘国庆,王廷慧,等.延安大学医学院药理学试卷分析[J].中华医学教育杂志,2008,28(4):120-122
[2]孙敏,王锦帆,祖勤,等.医学生学习中期评估测试实效分析[J].中华医学教育杂志,2013,33(4):617-620
[3]田考聪,彭斌.试卷质量定量分析系统中的几个参数及其应用[J].医学教育探索,2004,3(4):52-54
[4]张玲玲,梅忠义.对学生成绩评价指标体系中一些问题的思考[J].合肥工业大学学报:社会科学版,2006,20(2):19-21
[5]和永祥,王渊,徐俊丽,等.内科学考试试卷分析与评价[J].西北医学教育,2006,14(3):304-305
[6]刘新平,刘存侠.教育统计与测评导论[M].1版.北京:科学出版社,2003:133-156
[7]中华医学会呼吸病学分会.社区获得性肺炎诊断和治疗指南[J].中华结核和呼吸杂志,2006,29(10):651-655
[8]陆再英,钟南山.内科学(全国高等学校教材)[M].7版.北京:人民卫生出版社,2012:17-22
[9]那彦群,叶章群,孙光.中国泌尿外科疾病诊断治疗指南[M].2011 版.北京:人民卫生出版社,2011:13-14
[10]吴在德,吴肇汉.外科学(全国高等学校教材)[M].7版.北京:人民卫生出版社,2012:682-683
[11]贾建平.神经病学(全国高等学校教材)[M].6版.北京:人民卫生出版社,2012:171-197
[12]张东海.《中华消化杂志》参考文献20年前后资料比较[J].中华消化杂志,2012,32(3):184-186
[13]张东海.《中华消化内镜杂志》与《中华消化杂志》载文被引分析(2001-2010年)[J].图书情报工作,2012(增刊2):281-283
[14]冀涛.我国全科医生培养模式的思考[J].中华医学教育杂志,2013,33(2):185-187
[15]冯保庆,高月春,杨林.《本科医学教育标准》实施方略的研究与探讨[J].中华医学教育杂志,2010,30(1):143-146
[16]卢燕,王培玉,刘宝花.北京大学医学部八年制疾病预防医学期末考试试卷分析[J].中华医学教育杂志,2013,33(5):791-793
[17]孙瑞华,姚丽波,王月香,等.首都医学发展科研基金函评立项指标体系的分析与评价[J].中华医学科研管理杂志,2013,26(4):234-240