APP下载

手持终端自动阅卷的表格数据定位算法的研究

2014-07-25冯军焕

网络安全与数据管理 2014年6期
关键词:交点表格答题

夏 禾,冯军焕

(西南交通大学 信息科学技术学院,四川 成都 610031)

传统的人工阅卷方式往往花费大量的人力物力和时间,效率低下,却不能得到一个很好的效果。因此,采用一种高效准确的阅卷方式显得尤为重要。参考文献[1]提出了一种基于图像识别的阅卷系统,这种阅卷系统需要对现有的常用答题卷格式进行改造,并且需要用扫描仪对学生的答题卷进行扫描,这势必会增加考试阅卷的复杂度。近年来,带有照相机功能的智能手机等移动终端快速增长且广泛使用,为高效地自动智能阅卷提供了很好的解决方案。

本文利用带有照相机功能的智能手机设计实现自动阅卷,教师只需将标准答案输入Android智能手机中,然后对学生答题卷进行拍照,如图1所示,通过手机阅卷软件便可以轻松得到学生客观题的考试成绩。这种阅卷方式可以降低人工评卷误差,减少教师阅卷工作量。

1 智能手机自动阅卷系统设计

各类考试的试卷中一般都会包括客观题部分,大多数考试答题卷的客观题部分都是由表格设计构成的。本文重点介绍系统在Android平台下识别表格图像,实现智能手机自动阅卷功能,具体流程如图2所示。

图1 学生答题卷

图2 手机自动阅卷流程

1.1 图像采集

与扫描仪获取图像资源相比,采用智能手机中的照相机获取图片的方式具有方便、快捷、应用一体化等特点。通过Android操作系统自带的照相机进行图像采集,并将采集到的图像存储到SD卡中等待后台应用程序进行处理。

1.2 图像预处理

照相机获取的图片携带了颜色特征,所以首先需要对图像进行二值化操作。除此之外,为了取得更好的字符定位效果和字符识别精度,还需要对图像进行倾斜校正等操作。

1.2.1 图像二值化

由于文档图片的颜色特征比较单一,因此本文采用参考文献[2]提出的基于简单阈值的Ridler和Calvard的聚类算法,取得了较好的二值化效果。

1.2.2 图像的倾斜校正

答题卷在被照相机拍照的过程中,或多或少都会存在一定的倾斜。倾斜会给字符的分割和识别带来很大的影响,所以处理表格图像很关键的一步是图像的倾斜校正。

[3]可知,传统的校正方法可通过Hough变化求出水平线的角度后,采用仿射变换调节图像的角度。该方法因为采用了Hough变化,需要耗费大量的时间。参考文献[4]提出了一种基于纵坐标投影峰值的表格图像倾斜调整算法,通过计算峰值之间的距离来度量表格的倾斜度。本文采用这种方法来进行倾斜矫正,该方法适用于带有表格信息的二值图像,其算法计算量较小,在实际中有一定的使用价值。

1.3 表格数据定位与拆分

往往一张答题卷分为多个部分,而客观题部分只是其中一个模块,所以表格数据定位拆分模块主要负责表格边框的定位,并且有效地对表格中的数据进行拆分。

1.4 表格数据识别

答题卷的客观题部分一般主要由答题序号 (也就是印刷体数字)和答案(手写体 A、B、C、D)构成。在进行数字和字符识别之前,通过参考文献[4]提供的方法可以使每个字符边缘没有空白区域,如图3所示。

图3 字符预处理后

1.4.1 手写字符特征提取算法

字符特征提取的好坏直接影响着最终的识别效果。参考文献[5]提供了一些字符的特征提取应遵循的规则。参考文献[6]提出了一种针对手写数字适应性较强的模板法——13点特征提取法,该方法具有实时、快速和准确等特点,但是该方法遇到大小不一的图片时就会难以识别。在此基础上,本文采用此方法归一化的结果来提取特征以适用于手写英文字符的识别。

1.4.2 手写体字符的识别

本文采用模板匹配进行字符识别,将标准的书写方式作为模板录入模板库中,利用图像之间的最短距离作为判别函数。对于一个待测试的样本X=(a1,a2,…,an)T,计算X和训练集中的某个样本Xj(0<j<N,N为训练集中样本的个数)之间的距离循环求出待测样本和。训练集中各个已知样本之间的距离为dj,比较所有的dj值,找出最小的d作为X所属的训练集类别。

2 表格数据定位算法优化

目前,表格框线检测算法有很多种,如Hough变换算法、投影法和交叉点特征法等。这些算法在传统的表格识别中都能运用于单一表格的拆分和框线的识别,但是对于表格外噪声数据的抗干扰能力较差。本文结合了Hough变换算法与交叉点特征法,实现了一种基于区域生长的表格定位算法。

2.1 算法假设

(1)图像中存在的表格是封闭的矩阵单元。

(2)图像中的待识别区域只存在单一表格,不存在多个表格混合识别的情况。

(3)图像中识别区域以外的数据应该与表格有一定的距离。

(4)图像中表格数据的直线检测允许出现断线,但不允许出现整个表格完全断裂。

2.2 算法设计

要对表格边框进行定位,首先需要对表格线进行检测。在答题卷中,经过倾斜校正后,常见的表格线分为水平横线和垂直竖线两种。

目前,Hough变换是在图像中寻找直线的最佳方法。OpenCV提供了基本Hough变换和累计Hough变换[7]两种Hough变换算法。设定一定阈值T,采用比较直线起点与终点的横坐标与纵坐标来对线条进行分类。设一条直线l(x1,x2)起点为x1(i1,j1),终点为x2(i2,j2),则分类规则为:

提取表格边线后,可以得到大量的横线与竖线的线条集合,如图4所示。可以看出这些集合不仅包含图像中待识别的表格部分的线条,同时也包含表格外的线条。

图4 通过Hough算法得到的直线集

2.3 算法描述

本文针对横线集和竖线集中包含非目标区域的表格线的问题以及横线集与竖线集断线的问题,改进了表格框线检测提取算法中的Hough变换算法和交叉点特征法[8],提出了一种基于区域生长的表格定位算法。算法具体流程如下。

(1)对倾斜校正过后的图像表格线进行检测,将检测到的线条进行归类,得到横线集与竖线集。设横线集为U1,竖线集为U2,通过与操作可以粗略得到交点集C,而最终需要得到的表格线外区域由4点集B构成。同时假设C中包含孤立交点为e。

(2)从C中选取4个相邻交点作为R的起始节点或叫种子节点,如图5(a)所示,区域应尽量小,且不包含其他交点,并且a与d和b与c形成横线关系,a与b和c与d形成竖线关系。

(3)生长区域选定,扩充区域R进行生长,这样可以填充掉断线区域。选定阈值T,将R区域向4个方向扩充T个像素,如图5(b)所示(T的选择应该适中,选择过大,会导致区域错误生长;选择过小,区域不能正常生长)。

(4)迭代横线集U1与竖线集U2中的线段,若线段L与生长区域相交,则R区域向线段L扩充直至L末端为止,形成新的R区域,返回步骤(3)进行新生长区域的选定;若不存在L与生长区域相交,则跳转至步骤(5)。图5(c)、图5(d)、图5(e)所示为表格生长区域的生长过程。

(5)对最终得到的R区域运用局部Hough算法,得到线段集合,线段集合将R区域分割开来形成最终的识别区域。将新生成的线段集合中的线段延长可以得到所有的交点,如图 5(f)所示。

图5 表格识别过程举例

由区域算法的特性可知,如果选择适当的阈值T,可以在生长过程中找到区域的边界{m,n,o,p},同时不会包含表格外的直线和交点e。

2.4 算法原理

(1)算法中,生长区域R由4个满足一定条件的相邻交叉点包围的区域B向外扩充阈值T所构成。由于B为4个相邻交叉点构成的区域,则R∩(U1∪U2)!=Ф,则必定可以选择一条相交直线进行延伸。

(2)假如在延伸过程中,一条直线l与表格的其他直线之间存在断线,但是断裂距离小于T,则在生长过程中,必定有l∩Rn!=Ф(Rn为R的第N次生长结果),生长区域R则可以沿该直线扩充。

(3)由于算法假设中整个表格不可能出现完全断裂(这里完全断裂是指小模块与表格其他线段的最小距离大于T),因此通过线段连通性可以证明区域多次扩展后,最后的生长区域R在包含所有的表格区域后停止生长。

(4)由于假设中表格数据与表格外的数据之间存在一定的距离(假设距离大于T),则最终的生长区域不包含表格外数据。

3 测试结果及分析

本文采用三星i9300作为测试平台,Android 4.0.4的系统版本。本文采用OpenCV2(版本号为2.4.5)作为图像处理的库。

3.1 几种常见定位算法的对比

对带有表格外噪声数据的考试试卷(如图6所示)运用不同表格框线检测算法进行表格数据定位。分别通过Hough变换表格框线检测算法[8]、交点特征提取算法[9]、由郑秀清等人提出的一种改进的自动表格框线检测算法[10]和本文提出的基于区域生长的表格定位算法得到的结果如图7所示。

图6 带有表格外噪声数据的考试试卷

图7 各种不同的表格框线检测算法的测试结果

Hough变换检查直线算法输入原始图片后,可以检测到图像中的所有直线。将这些直线中的横线与竖线选择出来,可以构成检测结果,如图7(a)所示。由结果可以看出,Hough算法得到的线段除表格框线外,还存在表格外的直线,利用算法得到的直线集很难区分出哪些是表格线,哪些是非表格线,因此很难对表格区域进行有效的定位。

交点特征提取算法将横线与竖线的交点作为特征,通过交点可以大体描绘出表格区域。然而由于图像采集中光线不均匀与图像预处理的误差,容易出现漏检短框线的问题,从而会直接影响到交点的检测,如图7(b)中出现部分交点漏检的情况。

郑秀清等人提出的改进的自动表格框线检测算法主要应用数学形态学来对表格框线进行处理,对表格线进行了断点补偿,很好地去除噪声带来的困扰,但是同样不能过滤掉表格外的孤立交点,如图7(c)所示。

通过区域定位算法则可以很好地进行断线补偿并且过滤掉表格区域以外的孤立交点,如图7(d)所示,采用该方法可以得到表格数据的交点集,对表格数据进行有效的定位。

随机选取20种常见的不同类型的表格型试卷,通过图像采集得到80张图片作为图像库,分别用不同方法进行答题区域的分割,结果如表1所示。对比结果表明,基于区域生长的表格定位算法在图片较清晰、满足算法假设条件的情况下有较高的定位准确率。

表1 几种常见的表格定位算法的对比

3.2 常见答题卷的定位结果

由于考试科目的不同,答题卷的类型有所不同,客观题的数量也有所不同。本文对不同格式的几种试卷进行了测试。用Android手机采集其中两种类型的试卷照片,经过图像的二值化、图像去噪、倾斜校正、Hough直线检测和区域定位等算法后,可以得到有效的识别区域,如图8所示。

图8 学生答题卷区域定位结果

传统的考试答题卷客观题部分主要存在于表格中,针对这种答题卷,本文针对Android移动终端设计了一种高效易用的自动阅卷方案,包括图像的采集、预处理、表格图像的识别和字符识别等。针对表格图像定位与手写字符识别算法进行了优化,实验结果表明,该自动阅卷方案具有高效、简单易用、便于推广的优点。

参考文献

[1]张站,刘政怡.基于图像识别的阅卷系统的设计与实现[J].微型机与应用,2011,30(4):44-47.

[2]RIDLER T W,CALVARD S.Picture thresholding using an iterative threshold selection method[J].IEEE Transactions on Systems,Man and Cybernetics,1978,8(8):630-632.

[3]谢亮.表格识别预处理技术与表格字符提取算法的研究[D].广州:中山大学,2005.

[4]巨志勇,郑应平.二值表格图像倾斜校正算法[C].第一届中国高校通信类院系学术研讨会论文集,2007.

[5]许雁飞,陈春玲,陈夏梅.基于 OpenCV的脱机手写字符识别技术[J].信息与电脑(理论版),2011(8):39.

[6]钟乐海,胡伟.手写体数字识别系统中一种新的特征提取方法[J].四川大学学报 (自然 科 学 版),2007(5):15.

[7]KIRYATI N,ELDAR Y,BRUCKSTEIN A M.A probabilistic Hough transform[J].Pattern Recognition,1991,24(4):303-316.

[8]ILLINGWORTH J,KITTLER J.A survey of the Hough transform[J].Computer Vision,Graphics,and Image Processing,1988,44(1):87-116.

[9]WENYIN L,DORI D.From raster to vectors:extracting visual information from line drawings[J].Pattern Analysis&Applications,1999,2(1):10-21.

[10]郑秀清,付茂名.一种改进的自动表格框线检测方法[J].中国民航飞行学院学报,2004,15(4):30-32.

猜你喜欢

交点表格答题
《现代临床医学》来稿表格要求
邀你来答题
邀你来答题
邀你来答题
《现代临床医学》来稿表格要求
邀你来答题
统计表格的要求
阅读理解
借助函数图像讨论含参数方程解的情况
试析高中数学中椭圆与双曲线交点的问题