基于试卷质量分析的计算机基础题库建设实证分析

2011-01-13吴洁明

梧州学院学报 2011年2期

关键词：试题库区分度题库

吴洁明，陈佳

（1.2.梧州学院计算机科学系，广西梧州 543002）

基于试卷质量分析的计算机基础题库建设实证分析

吴洁明1，陈佳2

（1.2.梧州学院计算机科学系，广西梧州 543002）

考试的功能在于反馈和矫正，通过试卷分析，对考试命题的能力、学生掌握情况有更清醒的认识。在论述试卷质量分析方法的基础上，对基于试题库的“计算机文化基础”期末考试从试卷总体、模块、单个试题三个方面进行了定量分析，利用分析结果指导题库建设。

试卷质量分析；试题库；计算机基础

“计算机文化基础”是高校面向非计算机专业新生开设的一门信息技术应用基础课程，其学生人数众多，影响力大，是受益面最广的一门计算机基础课程，对学生后继专业基础课和专业课的学习，对培养学生的科学素养和全面素质起着重要的基础性作用。梧州学院对于该课程的教学也在不断地进行改革，充分利用现代教育技术与网络资源，构建网络教学平台，采用网上考试系统在线考试。好的考试需要一套好的题库作支撑，有足够多的优质试题为基础，尽可能减少偏题和怪题。试题库不是题目堆积的仓库，不能简单地将某一科目的练习题或考试题收集到计算机中形成试题库。优质的题库对规范教学行为、提高教学质量的推动作用是显而易见的。

1 建设试题库的意义

1.1 提高教学效果评价的科学性

以往该课程的考试，由任课教师自行命题，教师往往依靠个人的经验，不同教师所出的试卷难度相差较远。建立试题库后，从规范、标准的试题库中筛选、组合出符合要求的试卷，实现教考分离，有效地避免任课教师命题的盲目性和随意性，使命题更加科学与规范化。试卷的评定由计算机自动评分，杜绝了舞弊、加“人情分”现象的出现，体现考试的公正性和客观性，从而提高教学效果评价的科学性，对加强教学质量的宏观监控有重要意义。

1.2 减轻教师命题工作量

在传统的考试中，教师要准备一次考试，从搜集资料开始，选考题、考试、阅卷到最后统计分数，工作量十分繁重，其中不可避免地存在大量重复劳动，工作效率比较低。随着考试要求的不断提高，工作量将会越来越大，而且非常容易出错。建立试题库，能够将任课教师从繁重的命题工作中解脱出来，客观题完全由评分系统自动完成，打破了传统考试的旧模式，减轻了教师的工作负担，提高了工作效率。

1.3 增强学生学习主动性

传统的考试中，教师考前划分范围，圈出重点，致使部分平时不努力学习的学生考前找同学抄笔记、突击背题，就能轻松过关，有的分数还不低。这种投机取巧的现象，不利于学生对课程知识的掌握，极大挫伤了广大学生学习的积极性。建立了题库后，试卷由计算机自动生成，知识点能够涵盖课程的大纲要求，减少了猜题命中率，这必然促使学生加强平时学习的主动性。

2 试卷质量分析方法

考试实际上是一种教育测量，是衡量教学效果的最主要方式之一，测量结果只有客观的才是可靠的。高质量的试题是实现高质量考试的前提。根据教育测量学的理论，目前，衡量试卷质量的指标主要有：难度、区分度、信度和效度。其中，信度和效度主要用于试卷总体分析，对于单个试题来说，则主要分析其难度和区分度。本文重点分析难度和区分度这两个指标。

2.1 难度

难度是指试题的难易程度，主要是利用考生总体的得分反映试卷难易程度的检验指标[1]。对于单个客观题，其计算公式为：Pi=Ri/N，其中Ri为答对该题的人数，N为考生人数。对于一份试卷的总体难度，则用公式P=X/W 来计算，其中X为试卷的平均分，W为试卷满分值。一般来说，平均分过高，表明试卷难度低，平均分过低，表明试卷难度高。难度水平的确定是为了筛选题目。

2.2 区分度

区分度是对不同考生实际水平的鉴别程度。区分度高的试卷，能较好地反映考生的实际水平。对于单个客观题，其计算公式为：Di=Phi/Pli，其中Phi为高分组该题的通过率，Pli为低分组该题的通过率。一份试卷的总区分度，其计算公式为：

其中Di是第i题的区分度，Wi是第i题的分值，W是试卷满分值。美国测验专家R.L.Ebel根据长期经验提出了区分度的评价标准：D≥0.40评价为优良；0.30≤D≤0.39评价为合格；0.20≤D≤0.29评价为尚可；D≤0.19评价为较差，题目应淘汰[2]。

2.3 信度

信度是指考试结果稳定性、可靠性的指标，常用克龙巴赫系数法[3]，计算公式为：

其中n为试卷的试题总题数，si2是所有学生在第i题的得分方差，s2是学生总分的方差。期末考试教师自编的试卷，信度通常要求达到0.7，其值越接近1，表明试卷的可靠性越高。

3 计算机文化基础试卷分析

3.1 试题组成

本文以梧州学院2008机械制造及其自动化专业1班、2班为分析对象，由于学生在校期间必须参加全国高校计算机联合考试（一级），所以计算机文化基础的试题与全国高校计算机联合考试笔试试题的构成相同，共分为基础知识、操作系统（含网络）、文字处理、电子表格、数据库五大模块，每个模块的题量和分值也完全相同。在题型的设定方面，主要由选择题组成，试卷共82个小题，详见表1。

表1 计算机文化基础试卷组成结构

3.2 试卷总体分析

本次考试共有80名学生参加，最高分为96，最低分为59.5，平均分78.5，及格率98.8%。试卷的总体难度值为0.785，试题难度适中。试卷的总体区分度为0.365，信度为0.802，表明这是一份合格的试卷，成绩能真实反映学生的实际水平，试卷可靠。

3.3 模块分析

由于各模块的知识点相对独立，在实际教学中也是采用模块化教学方式，本文也按模块计算其平均分、得分率、标准差、方差等各项指标，结果如表2所示。

表2 各模块的统计参数

上述5个模块，难度值在0.684-0.808之间，难度适中，但模块四和模块五的得分率低于前三个模块，说明学生对电子表格、数据库相关知识的掌握略差于对计算机基础知识、操作系统和文字处理这三个模块。由于前三个模块在课堂讲授中是位于前面的章节，学生有较多的时间去学习，而且日常应用也多，如操作系统的操作和WORD文字处理。学生平常对电子表格和数据库的应用不多，较难理解相应的知识。模块的难度值与这也有一定的关系。

5个模块的区分度均大于0.3，表明本次考试区分度合格，其中模块五的区分度大于0.4，达到优良等级。

3.4 单个试题分析

本次考试，题目均从题库中选取，为了考察单个试题的质量，本文对试卷的82个小题还分别进行了难度和区分度的分析，其中难度统计数据见表3，区分度数据见下页表4。

表3 试题的难度统计表

表4 试题的区分度统计表

从表中可以看出，区分度≥0.3的试题有48个，试题优良题率（区分度≥0.3的题量占总题量的比例）为58.5%，有34个题目的区分度≥0.4，题目质量为优秀，应继续保留在试题库中。第2题等13个题目的区分度过低，属于要在题库中修改或被淘汰的题目。

难度值在0.8以上是容易的题目，难度值低于0.5的是难题。本次考试中，难题和容易题目的比例分别为11%和35.4%，得分率≥90%的题目有14题，占总题量的17.1%，得分率≤40%的题目有6题，占总题量的7.3%，比例适中。

4 结论

总的来说，本次考试试卷质量较好，能真实反映学生的实际学习水平，但个别题目还需要在题库中修改。考试是检查教学效果、检验教学质量的重要环节，在教学质量评价中占据重要地位。以试题库为基础的考试，其教学质量的测定更科学，具有较高的可信度，与传统的考试相比有明显的优势。每次考试后进行试卷质量分析，可以获得相关的分析数据，为积累优质题目、改进试题库提供科学依据。

[1]史东甲,余宇峰.试卷质量分析方法及其应用[J].内江科技，2007（1）.

[2]戴海崎.心理与教育测量[M].广州：暨南大学出版社,2004：117-118.

[3]王丽,张利庆.基于教学管理信息系统的试卷评价指标设计[J].黑龙江教育,2006（10）.

G642

1673-8535（2011）02-0083-04

2011-02-20

新世纪广西高等教育教学改革工程项目（2009B089）；梧州学院教育教学改革工程项目（wyjg2009A005）

吴洁明（1959-），女，广西藤县人，梧州学院副教授，研究方向：软件工程与计算机应用。

陈佳（1982-），女，重庆大足人，梧州学院讲师，研究方向：信息安全与图像处理。

高坚）