分段随机抽选算法在工程图学智能试题库系统设计中的应用
2015-05-15潘志国
潘志国
(青岛农业大学,山东青岛 ,266109)
0 引言
在教学过程中,考试是检查教学效果和学生对所学知识掌握情况的一个重要环节,一份好的试卷直接影响教学质量的效果评价。对于制图教师来说,由于工程图学课程的考卷主要为图形,所以人工出卷费时费力,是一项繁重的工作,并带有很大的主观性和差异性[1]。为了提高出卷效率,方便试题、试卷的管理,采用计算机技术开发智能试题库管理系统是解决这一问题的有效方法。
为了提高智能试题库系统的效率,并按照设定好的试卷难度进行组卷,组卷算法至关重要。不同的试题库系统对组卷算法要求不同,采用适当的算法能大大提高组卷效率和成功率;目前对自动组卷的算法较多,主要有随机抽取法、回朔探视法、遗传算法、分段随机抽选法等[2-7]。我们根据工程图学课程的特点,重点讨论了组卷策略和针对工程图学的分段随机组卷算法,在此算法的基础上开发了基于VB的工程图学智能试题库系统。
1 自动组卷策略涉及的命题主要内容
自动组卷策略中涉及的命题主要以下内容[6]:
(1)卷面总分:默认情况为百分制,这也符合学校对试卷的要求。
(2)试卷的期望平均值:该值主要通过试卷的总体难度系数来控制。总体难度系数通过每道题的难度系数来得到,而每道题的难度系数通过往年该试题的平均分值给出或者通过教师经验给出近似值,难度系数根据专业不同难度有所区别。
(3)考试范围:根据考生专业来设置,机类、近机类和非机类专业根据大纲要求,教学章节和课程难度有较大差别,可将考试范围按照专业固化到自动组卷策略中。
(4)各章节在试卷中所占的比例,可以手动设置或者按照专业设定大体范围到组卷策略中。
(5)题型和比例:题型可以固化到自动组卷策略里面,也可以进行设置;并确定各题型在试卷中所占的总体比例。根据以往组卷的经验,可以将题型固化,题型的比例可以在一定范围内调整。
用户的自动组卷过程采用人机交互的方式进行设置,主要反映了用户对试卷的整体难度、各章节试题分布情况及各类试题的比例要求;为了降低组卷的复杂性,命题组经过讨论根据专业设置常用的整体难度、考试范围、题型和题型分配比例,通常情况下用户可以不修改这些设置,直接进行组卷。
2 工程图学试卷的特点和自动组卷策略
2.1 工程图学试卷的特点
由于工程图学试卷的特殊性,题型不多,试题以绘图题为主,每学期所包含的授课章节固定且不多,所以作图题(包括看图改错、读图、标注尺寸等)占80%左右;通常情况下按照章节进行题目的分配,而且授课内容也是循序渐进,后面的章节要比前面章节复杂或者是前面几章内容的综合,这也在某种程度上降低了自动组卷算法的难度。剩余20%为选择题,内容从各主要章节选取,通常将选择题作为试卷第一个题型。
2.2 自动组卷策略
根据工程图学试卷的特点,自动组卷采取先按照题型的先后顺序组卷,通常选择题在前,作图题在后;每类题型通常又按照章节顺序或者试题难度系数来排序。试题的抽取采用随机抽取和近似匹配的策略来完成。每个知识点的题目分到一个组,对于同时满足要求的多个组和该组的多个试题采取随机抽取的方式,保证每个组和该组内的每道试题有同等的机会;对于已经抽取的试题组,通过设置标志位来避免同一张试卷中出现类似的试题。由于题库中试题数量的限制,很难同时满足试卷整体难度、章节比例分配、题型等指标与所设定的要求完全一致,存在一定的误差;因此为了增加组卷的成功率,允许相应指标在一定范围内浮动。
为了保证试卷的整体难度分配符合试卷先易后难的规律和制图试卷通常按章节组卷的特点,通常先按题型后按题目先易后难选取试题。为了简化并提高程序的运行速度,将选题按难度系数分段的方式进行处理。例如将作图题分成三段,前面的分段难度系数较低,后面的分段试题难度系数较高。通过这样的组卷策略,能保证同一知识点题目不会被重复选取,试卷整体按先易后难排列,并且试卷整体难度在与所要求难度非常接近。
3 分段随机抽选组卷算法
过去开发具有自动组卷功能的试卷生成系统大多采用随机选取法结合回溯试探的方法。该算法执行效率较低,主要的问题是出现在反复地回溯匹配这一部分。因为回溯匹配的每一次执行都是从数据库的第一条记录开始直至找到符合条件的记录。如果试题库的题量很大、数据结构复杂,这种算法就暴露出了它的弱点[7]。分段随机抽选法的核心思想是把众多的数据按照某种特定的规则分割为许多小的集合,然后在每个集合内产生一系列的随机数,构成候选码以确保选取目标的惟一。该算法较适合工程图学试题库的组卷策略,首先按难易和章节分段随机抽取分组,然后随机抽取各分组内题目。
为了提高自动组卷的效率,可以根据组卷的类型、经验将组卷的题目数量、章节范围和参考分值固定。在自动组卷方式下,用户设置好试卷属性,包括学期、班级、期望平均值、组卷类型(按专业划分)等内容后,系统将按照组卷策略自动选择试题进行组卷。选择题数量通常较少,因此不进行难度分段处理,采用在给定难度系数上下浮动0.2来设定难度系数的选取范围,根据组卷类型先选组后选题,选择好的题目根据难度按先易后难进行排列;作图题划分3段,按照章节和难度系数从前往后进行试题的抽取。例如,期望的难度系数为0.7,则该试卷的期望平均分为70分,前面的试题较易,难度系数的选择范围可以设置在[0.6-1.0]范围内选取,这样所抽试题的平均参考分在60-100分之间,题目较容易。抽取完第一段重新计算剩余题目的难度系数,在剩余题目的难度系数的基础上上下浮动0.2来设定新的难度系数范围,继续选题;最后一段采用和第二段同样的方法设定难度系数的选取范围;当只剩下最后一题的时候通过计算得到其难度系数值,并尽量在接近该值的基础上选取最后一道题目,这样能保证所出试卷的整体难度非常接近所期望的难度。
本系统的组卷算法流程如图1所示:
把已选题目在试题表中该试题的唯一标识存放到一个临时表中,待所有试题选取结束,就将该试卷的相关信息自动添加到试卷信息表中,完成组卷。
4 结论
工程图学智能试题库系统采用了按照设定难度系数的分段随机抽选法进行自动组卷,该方法组卷成功率高,方便快捷,大大降低了人工出卷的劳动强度,且具有很强的可扩展性,为工程图学类试题库系统研究提供重要参考。
参考文献
[1] 尹常治,杨皓,赵立族.最大权法试卷组卷算法[J].工程图学学报,2004,(3):106-111.
[2] 孟朝霞.基于自适应免疫遗传算法的智能组卷.计算机工程,2008,34(14):203-205
[3] 关丽杰,党进,郭凤.机械制图试题库组卷技术研究[J].工程图学学报,2006,(4):175-178.