APP下载

答题卡识别技术的算法系统研究与实现

2022-03-18白雪松李娜黄凌霄

网络安全技术与应用 2022年3期
关键词:答题卡高斯校正

◆白雪松 李娜 黄凌霄

答题卡识别技术的算法系统研究与实现

◆白雪松 李娜 黄凌霄通讯作者

(宁夏大学信息工程学院 宁夏 750021)

随着国民经济水平的飞速发展,家长对于孩子的教育越来越重视。由于现在的教育信息化的发展,云计算、大数据、物联网等技术的完善成熟,各个学校的教育硬件资源越来越丰富,可在考试方面,普通的学校和老师无法完全使用答题卡进行考试,大量的阅卷无法避免,教师费神劳力却不能得到解决。本文对拍照实现答题卡图像的采集,对图像的识别流程、图像预处理中的对比度处理、图像滤波、灰度化以及二值化进行研究和实现。其次,对答题卡图像的校正进行重点研究,使用Hough变化、Radon变化、最长直线方程三种方法对倾斜的答题卡图像进行校正。

答题卡识别;倾斜矫正;Hough变化;Radon变化

1 前言

“十三五”期间,国家对加快教育信息化普及,全面提高教育质量,促进高等教育公平提出了更高的要求。为了紧跟中国教育的步伐,所有初中和高中都需要合理利用各种相关的信息技术来组织学生的考试。使用答题卡在日常教育工作中有很多便利。在一定程度上,学校和教师可以更好地开展教育工作,可以有更多的方案让教师根据学生的发展改变教学计划。随着中国信息技术的进步,所有学校都开始使用答题卡进行考试。在客观题的批改中,能保证准确无误,减少教师批改的工作量,节省批改时间。教师可以利用这些时间做更多有利于教育的工作。因此,答题卡识别技术的算法系统能够更好地满足人们对教育的普遍需求。

2 相关技术介绍

2.1 图像预处理

在使用普通相机或手机相机拍摄答题卡时,需将答题卡放在平坦的地方,底部桌面最好为白色,拍照时相机与答题卡尽可能平行,使答题卡位于中心。拍照时,光线应尽量为白色且充足。最好不要使用曝光。根据拍摄过程中可能出现的许多情况需要增强图像的对比度[1]。为了防止由于图像对比度不足而突出显示关键信息,图像归一化也可用于图像预处理。归一化[2]是一种简化计算的方法,也就是说,将维度表达式表示为无量纲表达式,这将成为标量。在变化过程中,根据图像不变矩的规定,可以使用一组参数来保证其他函数的变化不会改变原始图像。

噪声是图像中一些非常突出的像素点或像素块,会使图像模糊,不利于观察图像的细节。该系统主要处理高斯噪声的影响。高斯噪声中的噪声是随机产生的,噪声的深度也是随机的。其概率密度函数服从高斯分布,即噪声服从正分布。高斯分布的公式为:

公式中σ是标准差,在高斯分布中又称为高斯半径,是均值,即期望。高斯半径越小,曲线越高、越尖锐,概率分布越集中。图像中的高斯半径越小,图像的变化越大,曲线越陡。如果图像中产生高斯噪声,最直观的表示是会影响图像的层次结构,并且边缘边界模糊。

对于受到了高斯噪声影响的图像处理过程中,二维高斯函数通常用作平滑滤波器,对于二维高斯分布的函数为:

根据高斯函数的性质可以得出σ决定着平滑程度,σ越大,高斯滤波器的频带就越宽,平滑程度就越好。高斯滤波后图像的平滑程度取决于标准差σ,标准差决定了高斯函数的宽度。其处理过程是像素与其他相邻区域中的像素之间的像素的加权平均。像素离中心越近,权重越高。

由于彩色的答题卡的彩色图像包含的信息比灰度图像[3]更复杂、更无序,导致彩色图像所需的存储空间更大,计算机的处理工作更多。在RGB[4]的颜色范围内,每种颜色的值范围为0-255,表示从暗到亮的颜色。对图像进行灰度化处理不仅不会影响答卷的识别,还可以降低图像复杂度,优化识别效果。目前,使用加权平均法对图像进行灰度化,公式为:

图像的二值化[5]处理是将已经处理为灰度的图像再次处理,使其只显示为黑白两种颜色。经过测试设置一个阈值,将图像中阈值以下的灰度像素设置为0,将阈值以上的像素值设置为最大值255,即整张图像呈现为黑白两种颜色。二值化处理的公式为:

其中(,)表示的是图像经过二值化处理之后显示出来的像素值,(,)表示的是已经经过图像对比度增强、图像滤波和图像灰度化之后图像的像素值,代表设定的阈值,阈值可以将图像需要重点体现的信息和图像的背景区分出来,在阈值规定的数值下对图像进行二值化的操作,既可以显示准确信息,也能有效降低噪声的干扰。

2.2 图像校正

(1)Hough变换

Hough变换最初用于检测图像中的直线,而斜截距用于确定直线的参数。Hough变换可以定义直线和其他图形,适用于各种几何图形。使用Hough变换检测图像中的直线的过程主要是将直线定义为一组具有参数分布的点来定位直线,即分析直线中的多个点,最后定位直线的位置。通常的Hough变换在二值化后检测图像中的直线,Hough变换可以忽略图像中的噪声,对图像进行检测和分析。

Hough变换中的直线表达式为:

最后将原图像按照下述公式进行校正,完成使用Hough变换对倾斜图像的校正。

(2)Radon变换

(3)计算最长直线方程

在图像处理过程中,对答题卡进行了二值化处理。在这种倾斜校正方法中,需要连接所有边界。根据答题纸的布局,可以发现在答案的边界处有特殊的定位标记。连接这些标记,记录所有连接的线,然后比较它们以找到最长的线。将直线方程拟合到已找到的最长直线上,计算直线的倾斜角度,根据倾斜角度确定答题卡是否需要倾斜校正,然后将直线控制在垂直于或平行于水平方向的位置。将图像和最长直线作为一个整体进行处理,并根据直线倾角的变换一起改变图像,从而完成图像的倾斜校正。

2.3 形态学滤波

形态学滤波字面上是指利用形态学方法消除噪声,从而降低识别过程中的压力。在形态滤波过程中,要注意对图像的操作。我们需要先对图像进行扩展,然后对扩展后的图像进行腐蚀,这样可以有效地消除图像中的噪声。如果颠倒上述操作,图像中的噪声将被完全消除,即先腐蚀图像,然后扩展图像。展开操作的目的是放大图像中每个形状,有效弥合形状之间差距,消除无用信息并突出图像的焦点。蚀刻操作的目的是去除图像中的凸起或小污垢。形态学滤波不仅可以消除图像中的噪声,而且可以提高图像的信噪比。对于需要定位的答题纸识别操作,形态滤波还可以提高图像定位的精度,更容易、更快速地获取信息,这与形态滤波灵活、弹性的数学变换有很大关系。

2.4 图像分割

答题卡不仅包含多项选择题的填写部分,还包含考生的信息填写部分,比如姓名,准考证号,以及考试科目这种必不可少的选择部分。对于这种排版就需要对答题卡进行分割。本系统中图像分割是将整个答题卡分为两大部分,分别为基本信息填涂区和答案填涂区,为了方便对基本信息的处理,所以将基本信息填涂区又分为两大部分,分别为考试科目代号区域和准考证填涂区域。接下来定位网格线,生成网格线,将所有的填涂区域都进行分割,在对答题卡做了网格线的分割之后,就可以对网格线中的标记进行分析,最后生成结果。

3 系统设计与实现

答题卡识别技术的算法系统的界面将Hough变换、Radon变换、计算最长直线方程三种图像倾斜校正方法集合在同一界面,使用者可根据需求自行选择校正方式进行图像校正处理。

界面设有状态显示模块与系统功能模块。状态显示模块有四个相等的面板,分别对应显示读取答题卡的图像,图像预处理的不同过程,图像校正过后显示的正确的图像,以及最后区域分析显示框。系统功能模块对应读取答题卡、图像预处理、倾斜校正等操作。在系统功能模块中将图像预处理过程的各个步骤分开来进行按钮的设置,这样在进行操作的时候图像的每一步变化都可以清楚地显示出来。在倾斜校正方面可以选择三种不同的倾斜校正的算法。

使用者在使用时首先点击读取答题卡,将拍好的照片传入答题卡识别系统,然后进行对比度增强、图像滤波、灰度化、二值化一系列操作,然后选择适当方法进行倾斜校正、形态学滤波、区域分析等一系列操作,即可显示扫描结果。

4 结论

对于大多数学校来说,不可能每次考试都使用光标阅读器。因此,为了避免使用价格昂贵、操作困难、维护困难的光标阅读器,本系统中每个普通教师都可以使用普通的摄影技术来实现对客观题的分析和识别,最大限度地减少教师的工作量。在本系统中,老师只需要给每个学生的答题卡拍照。对摄像设备、拍摄地点、拍摄环境没有太高的要求。在该系统中,还可以准确地实现图像预处理、倾斜校正、试卷分割等方面的功能。只需要老师对最终的答案进行统计就可以完成一次试卷的批阅。

在本系统中,基本功能都可以实现。但是,由于笔者自己的技术所限,没有办法使本系统更加完善,更加符合当前教师的需求以得到广泛的应用。例如,虽然可以通过拍照将图片导入系统实现答案的识别,但无法输入正确的答案表选项,无法直接生成分数,这是当前识别系统中最大的问题。在这些方面,我们还需要进一步的研究和更改,使答题卡识别系统能够充分应用到教师的日常阅卷中,这不仅可以减轻教师的压力,而且可以使当前的教育信息化水平更加完善。

[1]刘嘉鑫.基于matlab的图像对比度增强处理的算法的研究与实现[J].中国新通信,2019,21(24):160.

[2]孙俞超,李德.基于图像归一化和NSST的鲁棒零水印算法[J].延边大学学报(自然科学版),2017,43(01):43-50.

[3]张菲菲. 基于计算机视觉的答题卡识别系统的设计与实现[D].西北大学,2019.

[4]袁鹏. 基于图像处理的答题卡自动阅卷系统的设计与实现[D].东北大学,2015.

[5]杜聪. 基于图像处理技术的答题卡智能识别研究[D].石家庄铁道大学,2018.

2021年大学生创新创业训练计划校级项目(答题卡识别技术的算法系统研究与实现)

猜你喜欢

答题卡高斯校正
劉光第《南旋記》校正
数学王子高斯
天才数学家——高斯
建立在校正系统上的强大实力Sonance所能士i12
在Lightroom中校正镜头与透视畸变
机内校正
安全知识竞赛答题卡
从自卑到自信 瑞恩·高斯林
知识竞赛答题卡
知识竞赛答题卡