医学智能无纸化考试系统的设计与开发
2014-01-02范雪雪王志荣黄一虹
范雪雪 徐 晤 王志荣 黄一虹
徐州医学院
无纸化考试作为一种现代化的考试方式得到了越来越广泛的应用。本文结合医学考试的特点,设计开发了一个医学无纸化考试系统,系统除具有传统无纸化考试的随机出题、自动批改、成绩查询的功能外,还能够快速生成高质量试卷。在主观题批改方面,本文提出了基于一种关键词集划分的文本相似度算法,实现了系统对主观题的批改,提高了系统的智能性。
1 引言
随着计算机和互联网技术的迅速发展,信息技术对教育模式产生了巨大的影响,传统的考试模式已经无法满足教学需求。一方面,随着学生人数的不断增加,教师出卷批改任务日益繁重,学校组织大规模考试需要花费更多的人力物力;另一方面,基于互联网的教学模式的迅速发展要求基于网络的考试模式与之相匹配。基于网络的无纸化考试具有实时性、互动性和准确性等传统考试模式无法比拟的优点,目前已经成为一种重要的考试模式。
经过多年的发展,GRE 考试、全国计算机等级考试等大型考试都实现了无纸化并收到了良好的效果。但是,这些系统并不适合直接应用到医学考试中。首先,医学是一门专业性很强的学科,其他学科的考试系统从功能到题库都不适合直接使用。第二,目前大多数考试系统仍然采取简单的随机出题方式,试卷内容比例分配、难度系数难以控制,自动出卷质量不高。第三,大多数考试系统仅限于客观题的自动批改,无法进行主观题的自动批改。本文根据医学教学特点,设计开发了一套能够生成高质量试卷并具有主观题批改能力的智能无纸化考试系统。
2 系统构架和功能
系统构架和开发环境
系统采用了B/S(浏览器/服务器)三层构架模式。B/S 构架是基于Web 的一种的软件构架模式,它将系统功能的核心部分集中到服务器上,客户端只需要有浏览器就可以进行操作。该系统在Windows Server 2003 操作系统和IIS6.0 环境下开发。采用VS2008 集成开发平台,应用C#语言和ASP.NET3.5 技术,使用微软 SQL Server 2005 作为数据库管理系统。
系统功能
该系统模拟了普通考试流程,设计了学生考试和管理员管理两个子模块,实现功能如图1 所示。
图1 医学无纸化考试系统功能模块图
考生考试模块:考生通过浏览器输入自己学号和姓名进行登录。登录后进入试卷选择界面,如果只是普通练习,则系统允许学生随时选择套题进行自我测试。如果是正规考试则需要在考试允许的时间内时才能够选择到试卷。选择好试卷后,系统将试题打乱顺序呈现到每个考生的电脑上,防止学生作弊,同时系统开始倒计时。学生可以在考试结束之前提前交卷,否则待考试时间结束后系统自动提交。提交后的试卷无法进行修改。试卷批改后学生可以随时登录系统查询考试结果。
管理员管理模块:管理员分为系统管理员和教师管理员两种角色。系统管理员可以对教师管理员和学生的权限进行管理,也可以对考试科目进行管理,教师管理员可以对参加考试的考生信息进行管理,也可以对题库试题进行管理。还可以进行人工出卷、设置系统自动出卷选项生成试卷、修改生成试卷题目、设置试卷有效时间及考试时间、核对系统自动批改过的试卷等等操作。最后系统自动将成绩进行统计生成报表。
3 关键技术
自动组卷
电子题库是无纸化考试系统的重要组成部分,一个带有标注的题库是生成高质量试卷的必要条件。本文对题库中所有题目都标注了考察知识点和难度系数两个参数。
自动组卷算法的优劣直接影响所出试卷的质量。目前使用最为广泛的方法是随机法:即由计算机从题库中随机抽取试题,该方法实现简单,对电子题库要求较低,但缺点是试卷的考察内容分布、难度等参数都很难控制,组卷质量不高。近年来,有很多学者将人工智能的算法应用到了自动组卷领域,如:遗传算法、蚁群算法、模拟退火算法、人工神经网络等等。这些算法虽然能够提高试卷质量,但是算法比较复杂,计算量大,不太适宜网络环境的出题方式。本文设计了一种能够快速生成高质量试卷的自动组卷方法,描述如下:
Step1:设置考试总分;
Step2:设置题型、每个题型的分数;
Step3:设置每种题型的考察知识点范围、对应题量和难度系数区间;
Step4:自动从题库中筛选所有符合设定题型、知识点范围和难度系数的题目并存入临时表;
Step5:从临时表中随机抽取设定题量的题目;
Step6:形成新的试卷,呈现给教师等待确认。
主观题自动批改算法
对于客观题的自动批改计算机实现比较容易,目前大多数考试系统均具有这项功能。但是对于主观题的批改,由于语言表达的模糊性和随意性,一直是人工智能和自然语言理解领域的热点问题,至今仍然很不完善。主观题是医学考试的重要题型,本文提出一种能够对主观题自动批改的方法。
教师批改主观题的方法都是按点给分,即从学生的答案中找到给分点,并按照和标准答案的吻合程度给分,整个批改的过程就是一个文本相似度计算的过程。因此主观题的自动批改就转化为自动计算文本相似度的问题。
基于向量空间模型(Vector Space Model,VSM)的TF-IDF 方法是一种基于统计的相似度计算方法,广泛应用于信息检索、数据挖掘等领域。它的基本思想是,假设文本包含的所有词为W1,W2,…,Wn,那么一个文本就可以表示为一个n 维向量T=
依照教师批改的过程,将标准答案分解成若干独立的给分点,每个给分点由若干句子组成,进而可以分解为若干个关键词。首先,对标准答案文本进行分词操作、去除停用词、虚词后,计算给分点中每个的词TF-IDF 值并进行排序,从中选取TF-IDF 值较大的前n 项作为关键词,以此关键词向量作为文本的特征表示。用同样的方法对学生答案进行处理(系统要求学生用数字序号分割不同的给分点)。在进行相似度计算之前,先将标准答案给分点关键词与学生答案给分点关键词进行比对,若相同关键词个数大于设置阈值,则表示该句群与得分点相关,对两个文本向量进行TF-IDF 相似度计算,并于得分后将此模块从答案中删除,再继续寻找下一得分点,直到答案为空停止。其中,相关性阈值既可以是预设好的一个固定值,也可以由教师根据情况自行设置,增加系统的灵活性。为了使得分更为准确客观,系统会将标准答案和学生答案按得分点同时显示在屏幕上,方便教师根据情况更改得分。
4 结语
随着教育信息化改革的不断进行,无纸化考试作为一种信息化的考试模式得到了越来越广泛的认可,发展速度十分迅速。但是目前大多数无纸化考试系统功能还比较机械,缺乏智能性。本文就在提升系统智能性方面做了尝试,提出并实现了一种高质量试卷自动出题算法和一种主观题批改方法,取得了良好的效果。但是汉语是世界上最复杂的语言之一,表达方式千变万化,要开发具有高精确度的主观题自动批改系统,还需要进一步研究。