网络阅卷中的一种涂点识别算法
2017-01-12张一飞
张一飞
摘 要:网络阅卷模式随着教育信息化的发展和相关技术水平的进步,已经成为一种非常流行的考试信息化解决方案。在网络阅卷中,图像识别的最终目的是识别试卷图像上的涂点信息,正确判别考生的填涂结果。文中介绍了一种基于动态阈值的涂点识别算法,并对该方法进行了理论分析和推导,证明其具有很高的实际应用价值。
关键词:动态阈值;涂点识别;网络阅卷;信息化
中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2016)11-00-02
0 引 言
随着在线教育和教育信息化的发展和推广,网络阅卷模式被越来越多的学校和教育机构所接受,已经逐渐成为一种业界通行的考试阅卷方案。具体来说,网络阅卷主要指学生参加纸质考试后,通过获取图像、图像识别、客观题判分、主观题阅卷、成绩汇总几个步骤,实现公平、公正判分,并生成成绩统计分析结果的过程。
网络阅卷流程的最终目的是实现涂点的识别,而涂点识别的目的是为了准确判定考生的填涂情况。一般来说,网络阅卷中使用识别模板对图像进行识别,在识别区域中,通过采集识别区域像素点的灰度值,利用阈值对图像进行二值化处理,从而判定涂点的填涂密度,确定填涂与否。这种判断方式的最大问题在于阈值的选取,若选取阈值过低,或填涂较轻的涂点则无法识别,阈值过高又可能误识别一些没有填涂的图像。因此可以考虑一种基于动态阈值的涂点识别算法,根据图像像素灰度的分布确定实际阈值,根据计算后的阈值进行二值化处理和涂点密度的计算。此外,由于试卷图像在印刷、学生填涂以及扫描过程中,无可避免的会产生一定的噪声信息,因此需要对图像上的噪声进行去噪处理。
1 涂点区域的特征
1.1 涂点信息类型
网络阅卷系统获取的试卷图像上可能存在多种涂点信息。具体来说可分为以下几类:
(1)考生信息数据。考生信息包含了考生的考号、姓名、班级等个人信息,其中考号信息是最关键的信息,因为其唯一标识了一张试卷的归属情况。
(2)客观题填涂数据。无论任何形式的网络阅卷,其客观题填涂信息一定是被系统识别并供后续判分使用的,因为这是保证网络阅卷高速、公平、准确判分的基础。
(3)其他试卷信息。在试卷上还会存在一些其他类型的试卷信息,例如缺考标记、学科标记、选做题选做标记等,这些标记均以涂点的形式存在。
对于客观题填涂信息而言,涂点识别的结果直接反映了学生填涂的结果,即学生作答的答案。对于其他试卷涂点信息,涂点识别的结果主要是学生在答题时的一些关键判别信息,如对试卷科目、缺考情况的认定以及学生答题的辅助信息,如选做题的选做标记信息等。
1.2 涂点的噪声
一个典型客观题区域经扫描后图像放大如图1所示。由图1可见,涂点区域的噪声主要有随机噪声和边缘噪声两种。
(1)随机噪声。随机噪声是指图像上的一些干扰像素点的灰度深度随机分布。随机噪声对于图像信息的提取有很大的干扰作用,由图1可见,填涂区域的周围及内部均存在一定程度的高斯噪声。而在无噪声条件下,这些噪声点的位置像素应该和背景色相同。
(2)边缘噪声。边缘噪声是指图像中存在的尖锐边缘,其定义主要取决于这些边缘对有效信息的提取是正作用还是负作用。在客观题填涂区域的识别当中,填涂区域的边框和填涂区域内部的字母A\B\C\D等标记均为边缘噪声,其对客观题填涂密度的识别有抑制作用,降低了像素灰度的分布空间。
(2)前景和背景的类间方差是0,1,0,1 的函数,而它们又是t的函数,因此可对每一个t级别做遍历,统计对应的前景像素比例0,背景像素比例1以及对应的灰度均值0,1,从而计算出对应每一个t值的类间方差g (t)。
(3)选择类间方差最大的点 g=max {g (t)},即得到该区
域的阈值t。
(4)由于该算法计算出的阈值可以随图像的颜色深浅和黑白对比程度动态变化,但涂点识别需要将尽可能多的点判定为黑点,因此需要对阈值t做加权处理,取权重为1.3,即最终阈值t0=t×1.3。若加权后的阈值大于255,则取t0=255。
2.4 涂点密度计算
确定动态阈值后,即可计算涂点的填涂密度。设计算得到的阈值为t0,则灰度值小于t0的像素点个数统计为n0,总像素点数为涂点宽度与高度的乘积m×n,即可得涂点密度=n0/(m×n)。若>0.75,则认为该点已被填涂。
3 结 语
本文介绍了网络阅卷中涂点识别的意义和主要内容,分析了涂点信息的类型和涂点噪声的形式,提出了一种基于动态阈值的涂点识别算法,并对算法流程、去噪处理、动态阈值的计算进行了理论分析和推导。该方法可以有效避免填涂深浅带来的阈值选取问题,根据实际图像灰度分布计算阈值,具有较高的实用价值。
参考文献
[1]宋锦秀.基于图像识别的答题卡自动阅卷研究[J].中小学电教月刊,2015(8):69.
[2]吴翔,夏英杰,李金屏.一种答题卡的自动阅读方法[J].济南大学学报(自然科学版),2014,28(4):246-250.
[3]杨青燕,彭延军.基于灰度图像的答题卡识别技术[J].山东科技大学学报(自然科学版),2009,28(3):99-102.
[4]李清.基于图像识别的网上阅卷系统的设计实现与优化[D].长春:东北师范大学,2013.