基于网络考试的试题库设计及组卷策略的研究

2014-11-26张徐

中小企业管理与科技·下旬刊 2014年11期

摘要：试题库设计及组卷策略是网络考试系统的核心内容，同样也是开发系统的重点和难点。根据试题库建库要求，运用试题库建库理论，设计基于网络考试的试题库逻辑结构，并在此基础上，提出基于人工设置参数的组卷策略，既能仿真人工组卷方法又能确保试卷的多样性和针对性。

关键词：网络考试组卷策略试题库

考试是教学活动的一个重要组成部分，也是检测学校教学效果和质量的重要手段。目前大部分学校还是采用传统的考试形式，大体上要经历任课教师出卷、教务部门组织印刷、统一安排考试、相关老师流水阅卷、最后任课教师上报分数、试卷统一归档等过程。整个考试过程繁琐，浪费了教学资源；同时教师个人组卷导致试卷的难易程度、考核知识点的全面性缺少客观性评价。因此，网络考试这种利用现代计算机技术、网络技术的考试方式是当前改革的主要方向，试题库设计及组卷策略是网络考试系统的核心内容。

1 试题库的设计和构建

试题库是按照一定的教育测量理论，在计算机系统中实现的某个学科题目的集合，它是严格遵循教育测量理论，在精确的数学模型基础上建立起来的教育测量工具[1]。试题库是构建网络考试的基础和前提。试题库在教学活动中的优越主要体现在两个方面，首先是管理优势，体现在试题库的高效性、经济性和保密性；其次是测量优势，体现在由试题库组卷的试卷具有内容质量高、测试结果可预控的特点。试题库的建设是一项艰巨的工作，需要相关人员的精心设计和认真实施。第一，所选题目的内容必须是优质的，而且要有一定的试题量，否则不利于抽题，这就需要保证经常由任课教师进行试题的补充和更新，同时还要建立题目的属性指标，包括试题编号、章节、知识点、难易度、区分度等。第二，每个题目都是相对独立的，都可以单独用于测试。第三，试题库一定要建立一个完善的组卷策略，否则充其量只能算是堆积试题的仓库。每道题目入库前都经过严格的筛选，试题的各类属性指标都要经过严格的测定。

1.1 试题库建库理论目前考试系统中试题的集合是按照一定的教育测量理论来实现，主要有两种：试题反应理论（IRT）以及传统测验理论（CCT），评价标准和指标主要包括项目难度、区分度、正确应答测验分数、信度等。

传统测验理论的上述指标相互制约、相互依赖。其中的项目难度、信度、区分度都依赖于考试学生的能力水平分布，而考试学生的分数又依赖于项目的难易程度，它们互为前提，不可避免的为该理论带来许多难以克服的困难。

试题反应理论在许多方面有其优点，根据题目反映理论所得参数具有不变性，可使得各个被试体的题目参数具有可比性，不过其技术更加复杂，实现难度更大。相比较而言，传统测验理论比较容易掌握。因此，本试题库在设计过程中，将两者结合起来进行考虑。

主要指标体系包括：

1.1.1 区分度。试题的区分度是指试题对于被试者的区分程度和鉴别能力。区分度高就意味着该题对于学习成绩不同的被试者有良好的鉴别和区分能力。所以测量专家把试题的区分度作为试题编制过程中筛选试题的主要指标与依据。

本试题库采用“两端分组法”进行区分度的计算，根据研究，试题得分基本呈正态分布的前提下，两端分组的最佳测量点是27%左右，因此，我们将某一试题得分前27%的测试者划入高分组，将得分后27%的测试者划入低分组，具体公式如下：

Qi=■（1）

公式中i为试题编号，Qi表示第i题的区分度，Hi表示高分组第i题的平均分，Li表示低分组第i题的平均分，Ci是第i题的分值。根据研究结果，试题的区分度如果能够大于0.4，那么说明这道题目是非常优秀的，所以很多系统将0.4作为试题区分度的典型值。

1.1.2 难度。难度是试题的难易程度。试题的难度，是评价试题拟定的好坏的指标之一，也是筛选试题的依据之一。确定试题难度的方法有多种，常用的一种方法可用如下公式：

Pj=1-■（2）

公式中j为试题编号，Pj表示第j题的难度，Sj表示全体测试者第j题的平均分；F■是第j题的分值。

由公式（2）可知，当有n个测试者参加测试时，用下面的公式可以得出试题的难度。

Pj=1-■（3）

公式（3）中，Xji为第i个学生、第j题的得分。

从难度的计算公式我们可以看出，测试者的得分和试题难易程度成反比。这样一来，难度系数的确定受测试者能力的影响，缺乏一定的客观性。

一般来说，试卷的总体难度最好在0.5左右。但也不可能每道试题难度都正好是0.5，否则又会使得分数分布呈双峰状态。为了保证试卷试题的适用性，不打击成绩差的学生的答题兴趣和信心，试卷中应该有一些基础性的、简单些的试题，同时为了更好的体现考试的区分功能，也应该有一些难度大的试题。因此，一套试卷中每道试题的难度均分布在0.35至0.65之间最好，这样试题对被测者有较大的鉴别力，而且可以使考试分数接近正态分布。

1.2 试题库建库基本要求网络考试系统利用计算机的数据库来建设和管理试题，由试题库随机生成试卷，使试题更加科学、规范，将人为因素降到最低，同时也便于教学质量的监控，符合目前高校教学改革的需要。真正做到了教考分离，反映了考试的公正性，广大教师也可以摆脱烦杂的命题工作。

试题库应满足以下几个基本要求：①合理设计题型，保证试题库能测试考生的综合能力。题库中的题型一般为两类：客观题和主观题。判断题、选择题和填空题等属于客观题，这类题型有标准答案，评分不受改卷老师的主观愿望转移。简答题、改错题、论述题等属于主观题，这类题型能测试出学生的知识掌握程度，如实反映学习效果。不过主观性题评分标准不统一，任课教师在主观题的判卷过程中，或多或少会带有自己的一些主观意向，因此，在设计试卷的题型组成前要综合考虑课程自身特点、课程教学大纲的内容和人才培养目标。②合理设置相应的技术指标，保证试题库题目质量。题目有多种属性（如科目，章节，课程代码，考核点，难度系数，选中频度，题干，答案，区分度，出题人，日期，题目分值等），特别要注意维护好每道题目区分度和难度等核心指标，这样系统就能参考指标进行更加有效筛选，从而保证组卷质量。③试题库题目必须全面，有一定数量的保证。试题库必须要能够覆盖课程教学大纲中所有的知识点，而且各章节、知识点、各种题型的题目数量分布要合理。同时要保证试题库中试题的数量，否则，则有可能造成考生试题重复率过高的现象，也不利于系统自动组卷。④试题库动态性。试题库应该具有动态可维护性，随情况的变化而变化。毕竟学科或者学科的内容都是不断更新的，因此要求题库中的试题可以随时被删除、添加、修改。因此，在设计试题属性结构时要求系统可进行功能扩充。⑤可扩展性：具体软件的设计和实施，必将是不完善的，同时客户的要求也可能需要新功能或改变，应预留一些可扩展接口，便于未来可能需要的改善和系统升级。

2 常见组卷方式与策略

组卷是一个成熟的网络考试系统的核心内容，如何根据一定的组卷理论和算法进行自动组卷，要综合考虑试题的各类自身属性（包括区分度、难度、分值、题型等）和外部命题规则的因素，这也是在线考试系统的研究重点。

2.1 组卷方式当前考试系统使用最多组卷方式分为自动组卷和交互式组卷两种方式。交互式组卷：任课教师控制试卷生成的整个过程，在题库中进行检索，选择考试试题，置上标志。最后系统统一抽取有标志的试题。这类方式缺点是效率低、教师介入度高、安全性没有保障。自动组卷是指在使用试题库的基础上，根据系统设定的选题约束条件，从库中抽取一组满足各项性能指标的试题，从而组成用于实际考试的试卷。这类方式的优点是效率高、知识点覆盖全面、多题多卷。

2.2 组卷策略目前大家经常使用的自动组卷策略包括随机抽取策略、回溯组卷策略和优先权策略等，这些方法各有自身优缺点。

随机选取策略是依据用户提交的组卷要求，随机地从试题库中抽取符合选题约束条件的试题，加入试卷草稿中，一直到生成可以用于实际测试的试卷为止。这种算法运行速度比较快，但随意性较大，组卷成功率比较低。如果试题库中试题量较少，在试题库中极易产生死区，而且不可回溯，只得重新抽取试题。

回溯组卷策略通过验证所选试题是否满足系统给定的目标条件，来决定对该试题是否进行抽取，当发现目前没有任何试题满足要求而组卷过程又没有完成时，取消上一选择，重新选题组卷[2]。这种组卷策略程序结构相对复杂，对内存的占用大，一旦题库中试题量较大，状态类型的变换数值也大大增多。因此，这种策略在实际使用的过程中更加适合小型的试题库系统。

优先权策略在试题抽取的初期，不存在约束的牵制问题，因为试题属性的取值范围较大，随着被选中的题目增多，试题属性的取值范围变小，矛盾就会产生，会出现一道待选题的某项属性在范围内，而其他值却超出范围。它的缺点在于在组卷过程中需要不断调整优先权的排序和计算方法，有时会导致算法非常复杂，降低组卷效率。

3 组卷策略的设计

通过上述的分析，我们可以看到每种组卷策略各有优缺点。因此在实际组卷的时候要综合考虑并设计出更科学的组卷策略。本系统设计一套基于人工设置参数的组卷策略，教师设定组卷方案表，系统根据组卷方案自动生成试卷。它既能仿真人工组卷方法又能确保试卷的多样性。

3.1 任课教师设定试卷的总分和考试题型。

3.2 确定题型的分值。针对某一具体的题型，根据该题型的分值，确定该类型题的小题数、每小题的分数。系统将自动校验所有题型的分值与试卷总分是否相同，如若不等，系统提示，要求修改。

3.3 为每一类题型抽题，具体方法如下：①先按题型分值大小来抽取。大分值的试题一般在试题库中的选择就比较少，对试卷的整体指标影响大，因此首先要抽取分值大、难度大的试题。②按教学要求，试题涵盖要广，每个章节都应该包括在内，为避免抽题过分集中，需要给定章节参数，设置每章最多能被抽中的次数，避免知识点分布不均衡。③为了学生的成绩呈状态分布，以显示出差异，这就需要在题目上的难度拉开档次，我们将难度系数在0.35-0.45题目定为易，难度系数在0.46-0.55题目定位中，难度系数在0.56-0.65题目定为难，三者的比例是3：5：2。这样系统组卷的最终试卷难度系数在我们设定的难度范围之内，我们就可以基本认定组卷成功。④当试题库中试题数量有限，很难同时满足所有的命题要求的时候，组卷工作不能完成，这时可以用近似匹配的策略，允许试题在某些指标上与试卷的要求可以存在一定的误差，使组卷工作可以完成并在后期进行适当的人工干预。

3.4 当对所有的题型都抽题完毕后，则本次的组卷工作也宣告完成。随着计算机技术的发展和网络技术的广泛应用，新型的教学模式，新型的考试模式为我们提供了新的思路。因此，利用计算机技术、网络技术转变传统纸质的考试方式，能提高教师和教务人员的工作效率和质量。网络考试这种更灵活，更方便，更节省人力物力的新型考试方式正被逐步推广使用并渐渐替换传统的考试形式。

参考文献：

[1]CELTS一41.1，教育资源建设技术规范[S].

[2]胡钰.基于网络教学平台的试题库组卷算法研究[D].2008.

[3]雷国雨.组卷策略的分析与设计[J].科技信息（学术版），2006.

[4]方大良.在线考试系统组卷策略分析[J].电脑知识与技术，2008，4卷，9.

作者简介：张徐（1982-），男，安徽宿州人，教务处考试中心主任，助理研究员，研究方向：高等教育管理。