基于命题细目表的二阶段组卷策略研究
2012-04-29邢博特
邢博特
【摘要】组卷策略是题库系统的重要环节,而使用命题细目表进行组卷则可以有效克服组卷的主观随意性,优化试卷结构。通过计算机系统自动生成命题细目表,再根据细目表进行组卷是基于命题细目表的二阶段组卷策略的核心思想。
【关键词】命题细目表;组卷策略;二阶段
【中图分类号】G40-057【文献标识码】A【论文编号】1009-8097(2012)09-0097-04
题库通常是指大量试题的集合,这些试题分类有序地存放,便于构造某种考试所用的试题或试卷。在教育测量学理论中,题库被定义为是在某种测量理论指导下,试题经过试测计算出相关的统计参数,试题参数经过等值并建立在同一量表上,按照一定原则组织起来的能够满足某种考试需要的大量优良试题的组合。建设优良题库是一种命题方式的变革,是提高命题效率和试卷组配质量的基础,有利于实现命题工作的日常化。
以题库方式进行命题,可以组织更多的专家和命题教师参与命题,便于广泛征集试题,使编制试题工作成为一种经常性的活动,命题人员有较充裕的时间研磨和审查试题,从而有利于提高试题质量。建立题库后,命题人员可以集中精力设计好试卷蓝图,使试卷结构更科学、更合理,并且选择题库中的优良试题组配试卷,有利于提高组配效率和试卷质量。通过题库方式命题,有利于组配平行试卷,坚持考试标准的一致性。以题库方式组织命题,还有利于提高考试的信度和效度,有利于做好保密工作。
一常见组卷策略分析
题库系统的核心是智能组卷系统,它可以在题库中选择合适的试题,自动完成组卷任务。它是数据库理论、教育测量理论和人工智能理论相结合的产物,是从传统教育向现代教育发展的一种新型教育考评体系,是我国教育考试体系的重要组成部分。目前的研究及应用中,各类组卷策略大致可以分为基于经典考试理论的组卷策略和基于项目反应理论的组卷策略两种类型。其中,基于经典考试理论的组卷策略又包括基于随机算法的组卷策略、基于深度与广度搜索算法的组卷策略和基于遗传算法的组卷策略等几大类。
1、基于随机算法的组卷策略
基于随机算法的组卷策略是最直观的一种组卷策略。在题库中随机抽取试题,然后判断其是否符合试卷要求,如果符合,则将其加入到试卷中,如果不符合,则将其放入题库重新抽取试题。不断重复这一过程,直至组卷完毕或无法从题库中抽选合适的试题为止。
该算法优势在于结构简单,单次选题过程运行速度较快,但如果组卷的约束条件较复杂,完成组卷方案的时间复杂度较大,而且试卷往往不能满足某些约束条件。因此,该算法只适用于组卷约束条件较少的小型试题库系统的组卷。
2、基于深度与广度优先搜索算法的组卷策略
深度优先搜索算法和广度优先搜索算法都是图论的遍历图算法。在题库组卷策略中,回溯组卷算法就是一种最常见的基于深度与广度优先的搜索算法,它对随机算法有很大的改进,可遍历所有状态组合。其主要思想是从题库中随机抽取试题,但在抽取过程中通过验证所选择的试题是否满足系统给定的目标条件确定是否抽取该试题,当发现目前没有任何试题满足约束时,废弃前一步或几步操作后重新组卷,通过回溯试探的方法遍历所有可能的组卷方式,完成组卷任务。
回溯算法组卷成功率高,理论上可以遍历所有可能状态组合,但当题库题量或试卷总题量较大时,搜索空间变大,实现过程的时间开销也会随之变大,组卷效率较低。加之所选试题缺乏随机性,因此在实际应用中单纯的基于回溯试探算法应用受到制约。
3、基于遗传算法的组卷策略
遗传算法(GeneticAlgorithms,GA)通过模拟自然生态进化过程,采用迭代式搜索算法,根据一定的标准,在保持种群稳定的基础上,激励好的结果,淘汰劣质结果,最终搜索到理想的最优解或次优解。遗传算法与其他算法不同的是,除去“染色体”的编码规则,求解问题的本身对算法的影响并不大。当按照适当的编码将待解问题的解表示成“染色体”形式后,每个个体就成为问题的一个解。建立一定规模的这种个体后,就可构成一个种群,根据计算种群中个体的适应度函数值,可以评价个体的优劣,在保持一定种群规模的前提下,按适者生存的原则执行选择、交叉和变异等操作,得到更适应环境的下一代种群。反复迭代这一过程,直到得到符合要求的最优解,或者次优解为止。将遗传算法应用于组卷策略,是近年来组卷策略研究的热点之一。
遗传算法的计算复杂度只与编码规则、种群规模及迭代次数等条件有关,与问题本身的复杂度无关,而且可同时并行计算,因此更适合大规模复杂问题的优化求解;同时,遗传算法是在所有解空间中使用多点随机搜索最优解,因此能够一定程度上避免局部最优的缺点;而遗传算法的交叉、变异等操作有利于保持种群多样性。但是,使用遗传算法处理多目标优化问题时,需要将多目标优化问题转化为单目标优化问题,因此求得的最优解(或次优解)有可能并非一份理想的试卷,而且,如果题库规模较大,容易导致染色体过长,时间开销呈非线性增长趋势,从而降低算法的运算效率。
4、基于项目反应理论的组卷策略
基于项目反应理论的组卷算法最早是由自适应考试发展而来的。其具体操作为:开始时选取中等难度试题作为初始试题,当考生回答完成一道试题后,系统立即对其评分并重新估计学生能力,然后从题库中选取下一道试题,直至对考生能力的测量精度达到指定的水平。
使用基于项目反应理论的策略对考生进行心理测量,优势在于测量结果与考试试题样本无关,突破了经典测量理论的局限性,具有题目参数估计更为准确、全面解决考试等值问题、适用于大规模自适应考试系统等优势。但由于入库试题需要进行试测以确定试题参数,而我国的各类大规模考试中无法进行试测,因此使用这一策略仍有一定困难。此外,该算法需要在考试过程中实施组卷策略,对考试系统的压力也较大。
二基于命题细目表的两阶段组卷策略的构想与实现
一份合格的试卷需要多方面的衡量,难度分布、评价目标分布、知识内容分布等各项指标都需要控制在合理范围之内。尽管上述几种智能组卷策略都有其自身的优势,而且近年在计算机等级考试、广播电视大学等教育考试系统中有所应用,但这些策略都属于单目标约束问题,实际操作过程中很难达到预期的组卷效果,因此需要命题细目表协助进行组卷。
命题细目表相当于试卷蓝图,它是试卷试题的考核内容、评价目标、难度、题型、分值等属性的数量化表格,是命题、审题和组卷的直接操作依据。编制命题细目表是克服命题、组卷的主观随意性、保证试卷结构合理规范、有效提高试卷内容效度的关键步骤,也是联结考试大纲与实际命题工作的纽带,代表考试机构对命题工作的具体要求。同时,命题细目表是试卷平行性控制的重要依据。
本文提出了一种基于命题细目表的组卷方法,其主体思想是计算机自动生成满足用户需求的命题细目表,然后题库系统根据该细目表从题库中抽取满足要求的试题,经过筛选,最终将这些试题组合成卷。因此本策略将组卷过程分为两阶段进行,分别为制作细目表阶段和组卷阶段。
1、组卷策略控制参数的约定
为实现上述组卷策略,需要建立一系列试题参数及试卷参数,作为题库与组卷策略之间的桥梁。
(1)总体参数
总体参数是试卷的整体属性,包括考试科目、试卷名称、考试时间、考核知识点、满分、及格分等。
(2)题型分布
题型分布是试卷的组成结构,即试卷使用的题型、题量及各题分数等。
(3)考核内容分布
考核内容分布是指试卷包含的各部分考核内容的比例,好的分布可以保证考核知识的覆盖面,突出考核知识的重点。
(4)难度分布
难度分布是试卷中各类型难度题目分值的比例。一般可将难度分为易、较易、较难、难等四个等级,可分别使用A、B、c和D标记。较好的难度分布可以提高试卷的区分度和信度,是组卷过程中重要的指标。
(5)评价目标分布
根据布鲁姆认知领域教育目标分类学,试题的评价目标可以分为记忆、理解、运用、分析、评价和创造,可以使用Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ表示(本文仅列出Ⅰ、Ⅱ、Ⅲ、Ⅳ)。评价目标分布是试卷中各题考查各类认知层次的比例分布,好的分布可以提高考试的效度。
2、生成细目表阶段
当用户给定试卷各项参数及目标分布后,进入到生成细目表阶段。由于本文细目表涉及四个维度的分布,因此编制合格细目表的工作量很大,即使使用计算机进行协助,其计算量也相当庞大,因此本文将采用降维调整算法构建命题细目表。
(1)相关术语及解释
降维调整算法的核心思想就是首先将四维的命题细目表降低成二维的“考核内容一题型”细目表,再根据难度分布与评价目标分布构建完整细目表。为完成上述操作,首先需要介绍相关术语及解释。
块:在仅以考核内容与题型构建的二维表格中,每个单元称为一个块,见表1。每个块中的数字表示每个题型中各考核内容的题目数量。
块分配:是指根据一定算法将试题分配到各个块中的过程,其结果是形成满足题型分布和考核内容分布的“考核内容一题型”二维表格。选择1题分布在相应块内,同时TNum[]数组相应位置数值-1,PAC[]数组相应位置减去相应题目的TSco[]数值。
第三步:重复上述操作,直至某题型相应位置的TNum[]数值变为零。
第四步:对前一道大题执行第二步及第三步的操作。
第五步:当TNum[]数组中的所有数值均为零时,算法完成。
格点:在以题型、考核内容、难度和评价目标而构建的细目表中,每个单元格称为一个格点,见表2。
格点分配:是指根据块分配结果,将相应数量的题目按照一定算法分配到细目表的各个格点中,其结果是形成基本满足难度分布和评价目标分布的命题细目表。
(2)块分配算法
块分配算法只考虑在“考核内容一题型”表格中的分配。这一过程中不考虑试题的难度和评价目标,从而把四维的命题细目表问题降为二维情况处理,大大简化了操作复杂度。分配的原则是大题尽量分布在考核内容的重点部分,小题则尽量平均分布,这样既可以保证试卷对知识点的覆盖面,又可以突出对重点内容的考核。操作步骤如下:
第一步:设定相关参数:
数组TNum[]为各题型中未分配的小题数量,初始值为试卷中各大题中包含的小题数量;
数组TSco[]为各题型中每小题的分值,此为常数数组;
数组PAC[]为考核内容分布概率,其初始值为考核内容的目标分布。
第二步:从最后一道大题开始,按照PAC[]的概率分布,
(3)格点分配算法
格点分配算法则是根据块分配构建的“考核内容,题型”分布表,在块内的格点中分配试题。分配过程不会改变块分布,同时需要同时满足难度分布和评价目标分布的要求。具体操作如下:
第一步:设定相关参数:
数组TBlock[]为各块中未分配的小题数量,初始值为块分配中构建的“考核内容,题型”分布表。
数组TSco[]仍为各题型中每小题的分值,此为常数数组;
数组PDif[]为难度分布概率,其初始值为难度的目标分布:
数组PAO[]为评价目标分布概率,其初始值为评价目标的目标分布。
第二步:从最后一个块开始,分别按照PDif[]和PAO[]的概率分布,随机分配块内题目,同时TBlock[]数组相应位置数值-1,PDif[]数组和PAO[]数组相应位置减去相应题目的TSeo[]数值。
第三步:重复上述操作,直至某块对应的TBlock[]单元的数值为零。
第四步:对前一个块执行第二步和第三步的操作。
第五步:当TBlock[]数组中的所有数值均为零时,算法完成。
执行上述步骤后,可以得到一份符合题型分布、考核内容分布、难度分布和评价目标分布的四维命题细目表,此时可以进入组卷阶段。
3按照细目表组卷阶段
制作命题细目表是本组卷策略十分重要的一环,组卷阶段的任务就是按照编制好的细目表抽取试题组卷。抽取方法可采用查询后抽取的方式进行操作,即组卷系统从题库中查询符合细目表要求的试题作为备选,以不重复考核知识点为原则随机抽取试题组卷。当题库按照细目表完成试题抽取任务后,输出并打印试卷,组卷完成。如果在抽取试题过程中发现没有满足某些属性要求的试题,可以局部调整细目表后重新组卷。
三总结
基于命题细目表的二阶段组卷策略有效地降低了随机搜索组卷策略和回溯算法组卷策略在搜索试题时的盲目性,大幅度提高了组卷的成功率;同时,该算法还可以根据命题细目表快速搜索试题并组卷,有利于大规模计算机化考试和网络考试,这是遗传算法组卷策略所不能做到的,因为其需要进行大规模的并行计算工作。
本组卷策略的优势在于,它是基于多维命题细目表构建而成的,可以很好地保证试卷的难度控制和考核目标分布,有利于提高试卷的效度,只要保证了题库试题的容量和多样性,完全可以命制出具有较高专家水平的试卷。而且,第一阶段制作的细目表可以重复利用,使用同一双向细目表可以命制不同的试卷,因此可以提高题库的使用效率。同时,对不同的课程,可定制不同的细目表要求,满足用户多样化需求。总之,该组卷策略符合现代考试的特点,是一种非常实用的组卷技术。
本组卷策略在计算机技术方面的优势在于,抽取题目过程与制作细目表过程可同时进行,提高计算机的并行效率。同时,在计算机的空闲时间也可执行制作细目表的操作,提高了计算机的使用效率。最后,本组卷策略仅需使用重复查询的算法即可实现满意的组卷结果,有效缩短了组卷时间,有利于实现大规模计算机化考试和网络考试。
但是,执行本组卷策略时还应注意,其对题库中题目多样性的要求较高,理论上,命题细目表中的任意位置都需有符合属性要求的试题才可较好地完成组卷过程。此外,由于目前国家大型考试中无法施行试测,因此对试题的难度只能使用专家估计的方式进行,避免入库试题属性的主观性是比较困难的,如果某些试题的预估属性不够客观,组卷的合理性就会受到影响,因此在实际操作中,采用多位专家独立预估并取平均值的方式可以尽量减少这种主观性。最后,本组卷策略仍有改进的余地,例如,由于分值较高的题目具有难度相对较大、考核目标相对较高等特点,对难度、考核目标的分布概率可以进行相应调整,可使组卷更加科学、合理等。