智能文档解析技术在计算机在线考试系统中的应用分析
2018-01-08向煜晖
向煜晖
摘 要 随着计算机网络技术的应用普及,计算机在线考试系统已经得到了大量的使用,如驾照考试、GRE考试等,文章针对当前一些计算机在线考试系统需人工上传试题,造成工作效率低下、成本代价高等问题,在充分调研相关技术基础之上,结合当前主流的智能文档解析技术(Intelligent Document Parsing, IDP)特点,提出IDP技术应用于计算机在线考试系统中的思路与方案,并分别从题目的类型识别与语段分析两个角度进行了设计方案阐述,接着又深入分析了IDP应用于计算机在线考试系统的技术优势和仍旧存在的技术问题,为IDP技术推广提供有力支持。
关键词 智能文档解析技术;IDP;计算机考试系统;在线考试
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2018)225-0140-03
“互联网+教育”的理念是传统教学的有力补充,在线学习系统、网络课堂到如今大量存在的在线考试系统,不仅给学校一种更加方便、简单的检测学生学习成果的方式,也给自主学习的学生提供了一条自我检测的途径[ 1 ]。同时,这样的方式,既节省了大量人力成本,还节省了大量的纸张,对环境保护也有积极影响。而在线考试系统的灵魂,则在于其试题库的建立。虽然计算机在线考试系统已经越发完善,但是在用户的数据上传前,仍需要大量的人工干预,使用户体验不是很好。因此,迫切需要一种高效、准确的上传方式,这种方式能够智能地选择用户上传的题目题型,并与试题库中的内容匹配。
而智能文档解析技术是一种能对文档具有智能化处理的计算机信息处理技术,从文献调研来看,该技术对传统计算机在线考试系统题库上传问题具有一定的潜在解决优势[1-2],本文正是基于智能文档解析技术与计算机在线考试系统的结合,提出相应的技术思路与方案并进行相关技术分析,为今后进一步学习计算机技术奠定基础。
1 基本概念
1.1 计算机考试系统
计算机在线考试系统是现代信息技术在教育领域应用的典型,对于一些固定题库的考试类型提供了极大便利,可以避免繁琐的出题、阅卷和成绩分析,且能给考试带来客观公正的评判标准[3-4]。其一般功能构成如图1所示。
当前主流的计算机考试系统是考生从浏览器登入在线考试系统,服务器验证考生身份信息,通过在浏览器发布考试试题,待作答完毕后提交,服务器进行会根据规则进行自动批改阅卷并给出成绩[ 4 ],基本流程如图2所示。
1.2 智能文档解析IDP技术
类似计算机在线考试系统,需要事先建立试题资料信息库,且需要对信息库进行持续的维护与更新。对于计算机在线考试系统而言,题目信息库的建立当前无非两种,分别为逐题上传和批量上传,且都是事先按照一定的格式对题目进行编辑(通常有特定的Excel和Word格式),上传后,系统进行特定的完整性检验,如有问题必须退回手工修改,可见其工作量大、效率低、时间成本高、操作性不好,已经难以适应计算机信息系统的发展要求。
而智能文档解析技术是针对Word编辑的电子文档的一种智能解析技术,可以大大减少人工预处理,提高文档上传效率,其主要思想是对特定题型的特征进行预定义与预提取,并进行程序规则化便可自动对文档进行处理,常见题型规则定义如表1所示。
通过建立规则后利用计算机信息处理技术进行规则匹配,即可得到相应的题库,智能文档解析IDP技术原理示意如图3所示。
2 IDP在计算机考试系统中的应用
2.1 IDP在计算机考试系统中的应用方案
从1.1和1.2的描述来看,本文正是基于智能文档解析IDP的技術优势与计算机在线考试系统的题库建立、更新与维护工作存在的难点,提出将这种先进的计算机信息处理技术应用于题目信息库的建设与维护,有利于解决实际存在的问题。基于1.2对智能文档解析IDP技术的原理理解,在应用于计算机在线考试系统时需要进行题目类型识别与语段分析两个方面的应用设计。
2.1.1 智能文档解析IDP中的类型识别设计
类型识别就是将上传的Word版本文档按照之前预定义的规则进行分类与处理,而规则的制定通常都是基于语义进行的,即事先建立规则库和段落数据的解析规则,用于与实际文档中试题的匹配。由于一般计算机在线考试题型相对单一,无非为选择、判断、填空和简答题,所以规则库的建立也只有这几种,当Word试题文档上传后便可按照规则进行类型匹配处理,为后续的语段分析提供先决条件。
2.1.2 智能文档解析IDP中的语段分析设计
语段分析是基于2.1.1所述的类型识别基础之上进行的,因此需要结合类型识别的结果进行特定类型的语段分析设计,为便于叙述,本文主要以计算机在线考试系统中常用的选择题类型进行阐述。
当在类型识别中得到的是选择题类型,则进一步进行判断选项部分,选项往往可能由多个选项组合而成,因此便可以通过事先定义的语段分析规则,如选项之间是否有若干空格连接,基于类似这种的语段分析规则,便可进行分析处理,得到选项内容,进而完成整个题目的识别,最后通过与题目信息库进行匹配,如无该题则按照题目信息库规则进行入库编排程序,否则给予舍弃,实现题目的处理与归档。其他题型也是按照类似的方法进行语段分析。
2.2 IDP在计算机考试系统中应用的技术优势
从本文所述的类型识别与语段分析来看,智能文档解析IDP技术属于一种计算机智能信息处理技术,一旦将其应用于計算机在线考试系统题目信息库的建设与维护,其技术优势是十分明显的,主要体现在以下两点。
2.2.1 可以有效提升计算机在线考试系统文档智能化处理水平
计算机在线考试系统文档的智能化、自动化处理是其发展的潜在要求,传统的手工操作人力投入过大,且在很大程度上仍旧无法满足实际要求,与计算机智能化信息处理系统的发展趋势相违背,而智能文档解析IDP技术的应用则可以实现计算机在线考试系统更智能、更人性化的互操作性。
2.2.2 可以明显提高计算机在线考试系统题目信息库维护效率
传统的计算机在线考试系统的题目信息库建立往往依赖事先预定义的格式,需要人工按照规则进行预排版,且一旦出现手工错误,便会在后续的处理中报错,给实际题库的建设与维护带来巨大的潜在麻烦。而智能文档解析IDP技术则可以将任意的文档进行上传自动匹配,大大提高了题目信息库的建设维护效率。
3 结论
随着科技的发展,互联网已经逐渐融入了人们的生活,也对现代教育产生了许多积极的影响[ 5 ],本文所叙述的计算机在线考试系统是顺应计算机网络技术的发展潮流下孕育产生的计算机信息管理系统,不仅给很多行业、机构的考试提供了便利,也为人们进行测试与评测提供了有效途径,系统的建立节约了大量的社会人力物力,也给偏远地区学生自主学习先进的知识奠定了基础。
本文的核心是提出了将智能文档解析IDP技术应用于计算机在线考试系统中题目信息库的建设与维护,从题目的类型识别与语段解析两方面进行了方案设计阐述,相信一旦智能文档解析IDP技术真正得到应用,将进一步推动计算机在线考试系统的智能化、自动化和人性化发展,当然从目前一些文献调研来看,还存在一些技术障碍需要得到进一步的解决,如图片的自动处理、公式的编排等需要后续相关技术的跟进。
参考文献
[1]刘思婷.在线考试系统中若干技术研究与优化[D].合肥:中国科技大学,2016.
[2]于洋.文本信息智能处理技术综述[C]//全国计算机信息管理学术研讨会,2009.
[3]叶宇风.计算机基础在线考试系统分析与设计[J].微型电脑应用,2006,22(6):39-40.
[4]丁革媛,宋扬,袁忠臣,等.基于C/S模式多层结构的通用计算机在线考试系统的实现[J].微型机与应用,2011,30(14):1-3.
[5]苏艺.高校计算机公共课在线考试系统的设计与实现[J].黑龙江教育(高教研究与评估),2013(6):89-90.