银行票据自动裁剪方案设计与控件开发*
2016-08-10肖红玉
贺 辉 刘 琨 肖红玉
(北京师范大学珠海分校信息技术学院 珠海 519085)
银行票据自动裁剪方案设计与控件开发*
贺辉刘琨肖红玉
(北京师范大学珠海分校信息技术学院珠海519085)
摘要银行票据图片采集过程易受到复杂背景干扰和光照不足或不均等不利影响,使得自动、准确、实时裁剪票据的任务很具挑战性。在票据自动纠偏基础上,提出了基于图像自适应二值化的银行票据自动、快速裁剪策略。将该策略应用到银行印控仪进行集成测试,不同成像背景和光照环境下的多组数据结果表明本策略在自然光照环境中,能够很好地抑制背景干扰,准确裁剪票据,而在背景颜色接近票据底色时或存在明显光斑干扰情况下,依旧能够获得正确结果,总体裁剪正确率达到95%,其自适应性和鲁棒性明显优于基于边缘提取的方法。且改进了快速中值滤波算法,大大降低了滤波处理时间复杂度,可满足银行在线处理的实时性需求。
关键词银行票据; 自动裁剪; 图像二值化; 灰度直方图
Class NumberTP391.41
1引言
银行每天要处理堆积如山的各类票据,在柜台及时完成票据图片的采集和远程存储可以极大提高工作效率和确保票据的安全性。而为了操作简便同时提高采集图片的质量,高清镜头成为首选,这使得采集到的图像文件大,不利于在线上传和存储,这就要求在上传前给图像文件瘦身,除了高保真度的压缩处理,另一个关键是裁剪掉票据之外的多余图像部分,此举也利于对票据的后续处理,如OCR识别等。而操作人员在镜头下摆放票据的位置具有一定的随意性,使得图像中票据是倾斜的,需要在进行裁剪处理前进行倾斜纠正处理。因此银行票据裁剪工作完成主要需要进行两个处理:票据纠偏和票据目标分割。
在图像纠偏中,直线的检测算法是准确纠正倾斜票据的前提,目前较成熟的框线检测算法有基于Hough变换的方法,连通域分析法及其改进方法,交叉点特征法等。这些方法在特定的约束条件下都能取得一定的效果。其中基于Hough变换的方法因为易于实现而被广泛使用。
图像分割算法主要可分为阈值分割法[2~3]和基于边缘检测的方法[1~2,7,11]以及基于过渡区技术的分割[12]和基于熵、距离等统计量的方法[4,8]和基于图谱理论、云等理论的方法[9~10]等。从20世纪60年代开始,国内外学者针对图像阈值分割进行了广泛深入的研究和大量的实验,已提出了数十种阈值选取方法[7~8,14],其中基于直方图信息的阈值分割方法因其算法简单、稳定、易于实现自动阈值分割而被广泛的应用在图像处理中[15],典型的为各种图像二值化方法。但至今还未能找到一种对所有图像都能有效分割的阈值选取法[15~16],也尚未见在票据自动裁剪领域的相关应用研究文献。
本文研究源于企业生产实际需求,所以算法的稳健、快速和普适性是重点考虑的内容。因此,我们在文献算法研究和改良基础上,提出了一种基于自适应图像二值化的高效、可靠的银行票据自动裁剪策略,并基于Visual Studio平台完成了相应的控件开发。
2关键技术
2.1基于自适应Canny算子和Hough变换的票据纠偏
因为票据放置的随意性,在进行票据裁剪前首先要对彩色票据图像进行倾斜校正。我们采用的方法是先将彩色票据图像灰度化,以减少计算量。然后在灰度图像上找出票据的最长边缘线,并求出该边缘线的倾斜角,再对彩色图像进行倾斜校正,具体处理:采用自适应Canny算子[16]的高低双阈值方法进行边缘检测,该算子对细节信息与整理轮廓保留较好,能实现效果较好的边缘检测,给Hough变换查找偏转角度,逆旋转变换纠偏,提供了较高准确度保障;接下来基于Hough变换找到最长边缘线,确定倾斜角度,进而完成票据纠偏。
2.2基于自适应二值化的票据目标分割
要实现票据的自动裁剪,必须要自动获取票据的边界。因为票据目标与背景在灰度上总体存在着差异,可选用灰度值特征来分割这两个区域类,票据信息的提取可以通过基于灰度统计特征的图像二值化实现。很明显,二值化质量的好坏将直接影响后续的裁剪处理,是系统投入实用的最关键一环。因此针对本应用,提出基于自适应直方图阈值二值化的票据目标分割算法。
首先根据票据图像直方图特征确定二值分割阈值。如图1所示,该归一化直方图存在明显多峰的特点,不过票据目标对应的直方图在右侧比较集中,且与其它部分(桌面等背景)分界较明显,可以通过搜寻图1中所示分界点t1和t2来确定阈值。
图1 灰度化票据图像的直方图特征
其中t2通常可设为250以避免强光照射的干扰。而t1的值可通过搜索直方图极小值对应的灰度值来确定。为避免陷入背景直方图极值,且减少搜索时间,定义灰度搜索窗如下:
w=[wl,wr]
wl=min+(max-min)/2
wr=max-(max-min)/4
(1)
其中,min和max为p(sk)值小于给定常量θ的sk的最左和最右端点灰度值。本文设θ=0.001,因为票据是图像中的主体目标,剔除小于θ的部分直方图可以确保搜索窗的有效性。该搜索窗口将随着灰度图直方图的整体分布而自适应滑动,因此在该窗口中检测到的二值分割阈值(搜索窗极小值对应的灰度值,记为min_pox)有很好的自适应能力。接下来根据min_pox完成纠偏后票据灰度图二值化,其中票据区域赋值为0。
由于设备本身性能和光照等环境干扰,图像经常会受到各种噪声的干扰,导致二值化结果存在噪声(一般是椒盐噪声),会极大的影响到图像的后续处理。本文在林清华[17]提出的基于直方图的中值滤波加速算法基础上,根据滤波对象为二值图,即像素值只有0和1的特点,将中值滤波简化为如算法1所示操作,进一步降低了中值滤波处理的时间复杂度。
算法1
void MedianFilter(LPBYTE data,SIZE sz, int size)
{
int width = sz.cx; int height = sz.cy;//宽度、高度
int left_pox = ((int)sqrt(size * 1.0)) / 2;//计算得到滤波窗口半径,其中size为窗口面积
for(int i = left_pox;i < height - left_pox;i++)//滤波
{ for(int j = left_pox;j < width - left_pox;j++)
{int val_0 = val_255 = 0;
//逐行统计滤波窗口内值为0和255的像素点个数,分别记为val_0和val_255
for(int m = i - left_pox;m < i + left_pox + 1;m++)
{ for(int n = j - left_pox; n < j + left_pox + 1;n++)
{if(val_0 > size /2 || val_255 > size /2 ) break;
}}
if (val_0 > val_255) data[i * width + j] = 0; //data数组保存滤波结果
elsedata[i * width + j] = 255;}}
}
2.3自动确定裁剪框
此处采取了一个简单有效的处理,即对上小节得到的结果data,分别从左上方开始,逐行扫描值为255的目标点,并统计每行目标点数,最后只保留目标点数不小于最大值一半的行,以进一步排除由于明显光斑影响产生的一些干扰。接下来求出剩下候选目标区的列坐标最小值y_min和横坐标最小值x_min,及列坐标最大值y_max和行坐标最大值x_max,从而得到裁剪框的左上角和右下角坐标(x_min,y_min)、(x_max,y_max),标记坐标点,裁剪框确定。以y_min为例描述其搜寻过程如算法2所示。
算法2
for (int i = 0; i < _h; i++) // _h图像(data)高度
{
go_on = 1;
for (int j = 0; j < _w; j++) //_w图像(data)宽度
{if (data[i*(owh+nAdjust24)+j] == 0)
{ y_min = i;go_on = 0;break; }
}
if (!go_on) break;
}
3银行票据自动裁剪控件实现及测试
为验证本文自动票据裁剪方案的有效性,自主开发了相关控件(开发平台为Visual Studio 2010,开发语言为C++),具体技术路线如图2所示。并对50组印控仪采集票据图像进行了批量裁剪测试,测试程序主界面如图3所示。
图2 总体技术路线
图3 测试程序主界面
首先利用式(2)将彩色图像转换成灰度图,接着完成基于自适应Canny算子和Hough变换的票据纠偏;针对纠偏结果进行基于自适应灰度阈值的图像二值分割,并对二值化结果进行快速中值滤波处理以剔除孤立干扰噪点,最终通过设定阈值保留特定目标行,进而求解候选目标区左上角和右下角坐标,确定裁剪框。为避免针对在极端成像条件下获取得图像的过裁剪导致系统异常,我们设置了裁剪框尺寸的下限值ε,本应用中设为500个像素(考虑到我们拟裁剪的最小目标为身份证图片)。当裁剪框小于该限值则直接输出原票据图像。
gray=r*0.299+g*0.587+b*0.114
(2)
其中gray为转换后的灰度值,r,g,b分为别原RGB图像3个通道的像素值。
为了验证我们方法的优势,本文同时进行了基于边缘检测方法的票据裁剪对比实验。
3.1数据描述
本研究工作测试数据为印控仪(附带6个灯泡点阵补光光源)高清照相机采集图片,2种分辨率,分别为1600×1200和2592×1944。限于篇幅,本文只给出其中典型的6组数据,如图4所示,其中图4(a)背景比较均匀而图4(b)~图4(f)背景较复杂,且干扰显著。
图4 待裁剪票据图像
3.2结果和分析
实验结果表明,在背景较均匀的情况下,两种种裁剪方法都得到了准确的结果,其中基于边缘检测的结果有肉眼可辨识的黑边,见图5(a),而本文基于图像自适应二值分割的结果更为精确,无黑边,见图5(b);若背景比较复杂,如图4(b)~图4(f)所示,镜头采集到了除底座和票据之外的干扰,如棕色的地板(见图4(b)),缘检测结果会有伪票据边界,如图7(a)椭圆所标示,从而裁剪结果不理想,如图7(b)所示;而接近票据底色的亮灰色的桌子边缘(见图4(c))导致基于边缘检测方法的裁剪结果将桌面当作了票据保留,结果如图7(e)所示;而本文自适应阈值二值分割结果有效抑制了干扰的影响,对图4(b)二值化结果为完整的票据区域,如图7(c)所示,最终得到了达到应用要求的裁剪结果,如图7(d)所示图,对图4(c)也得到了理想裁剪结果(见图7(f)。对于图4(d)~(f)所示票据图像,要么票据体光照不均,如图4(d)~(f),将导致票据目标与背景区分度不够,从而易导致过裁剪,结果如图7(g)~(k)所示;要么存在明显光斑干扰,从而易导致欠裁剪,结果如图7(i)所示。而本文方案依旧得到了理想的裁剪结果,如图7(h),图7(j)和图7(l)所示,证明了本文票据裁剪方案的高鲁棒性和实用价值。
图5 本文方法处理中间结果示例
图6 不同方法对背景较均匀的票据(图4(a))裁剪结果
图5给出了本文裁剪处理的几个关键中间结果示例,从图中不难看出,中值滤波对于消除孤立早点的有效性;而最终的消除伪目标行的简单处理则进一步抑制了较强光斑对裁剪结果的不利影响,从而确保了裁剪结果的正确性。
对于必要的中值滤波处理,统计了改进前后中值滤波时间及完成票据裁剪所需的总体时间,如表1所示,表中Data1对应的时间是对分辨率为1600×1200的20张图片处理时间的平均值,而Data2对应的时间是对分辨率为2592×1944的30张图片处理时间的平均值。总耗时1和总耗时2分别为滤波改进前后裁剪所需总时间。结果表明改进后的处理时间大大缩短,尤其是对较高分辨率的图像,处理时间减幅更大,使得实现实时票据裁剪和远程存储成为可能。
图7 不同方法对背景干扰显著的票据(图4(b)~(f))裁剪结果
中值滤波改进的中值滤波总耗时1总耗时2Data13.2030000.2190003.4450001.937000Data2315.4450003.438000318.2380005.948000
4结语
本文针对银行票据自动裁剪应用需求,在票据倾斜纠正研究基础上,重点提出了一种高效实用的基于直方图自适应阈值二值分割算法,同时加入对目标点的简单实用约束,以最大可能降低光照不均对分割结果的不利影响。并进一步改进了中值滤波方法,以确保票据自动裁剪处理的实时性。多组不同成像环境采集的票据图像裁剪实验验证了本文方法的有效性和实用性。特别是对曝光过度或存在明显光照不均的图像,依旧可以取得理想的裁剪结果。如何结合基于边缘检测的方法,充分发挥基于图像二值化和边缘检测的图像分割方法的优势,进一步增强本自动裁剪策略的普适性是我们下一步工作的重点。
参 考 文 献
[1] Sauvola J, Pietikäinen M. Adaptive document image binarization[J]. Pattern recognition,2000,33(2):225-236.
[2] 韩思奇,王蕾.图像分割的阈值法综述[J].系统工程与电子技术,2002,24(6):91-94.
HAN Siqi, WANG Lei. A Survey of Thresholding Methods for Image Segmentation[J]. Systems Engineering and Electronics,2002,24(6):91-94.
[3] 陈果,左洪福.图像阈值分割的两种新技术[J].模式识别与人工智能,2002,15(4):468-473.
CHENG Guo, ZUO Hongfu. Two New Techniques Of Image Thersholding, PR&AI,2002,15(4):468-473.
[4] 向日华,王润生.一种基于高斯混合模型的距离图像分割算法[J].软件学报,2003,14(7):1250-1257.
XIANG Rihua, WANG Runsheng. A range image segmentation algorithm based on Gaussian mixture model[J]. Journal of Software,2003,14(7):1250-1257.
[5] 王晓年,冯远静,冯祖仁.一种基于主动轮廓模型的蚁群图像分割算法[J].控制理论与应用,2006,23(4):515-522.
WANG Xiaonian, FENG Yuanjing, FENG Zuren. Ant colony oPtimization with active contour models for image segmentation[J]. Control Theory & Applications,2006,23(4):515-522.
[6] 刘勍,许录平,马义德,等.一种超模糊熵ULPCNN图像自动分割新方法[J].西安电子科技大学学报:自然科学版,2010,37(5):817-824.
LIU Qing, XU Luping, MA Yide, et al. Automated image segmentation using the ULPCNN model with ultra-fuzzy entropy[J]. Joural of Xidian University,2010,37(5):817-824.
[7] 郑晓曦,严俊龙.图像分割新方法综述[J].计算机与数字工程,2007,35(8):103-106.
ZHENG Xiaoxi, YAN Junlong. A Survey Of New Image Segmentation Methods[J]. Computer and Digital Engineering,2007,35(8):103-106.
[8] 许新征,丁世飞,史忠植,等.图像分割的新理论和新方法[J].电子学报,2010,38(S1):76-82.
XU Xinzheng, DING Shifei, SHI Zhongzhi, et al. New Theories and Methods of Image Segmentation[J]. 2010,38(S1):76-82.
[9] 陶文兵,金海.一种新的基于图谱理论的图像阈值分割方法[J].计算机学报,2007,30(1):110-119.
TAO Wenbing, JIN Hai. A New Image Thresholding Method Based on Graph Spectral Theory[J]. Chinese Journal of Computers,2007,30(1):110-119.
[10] 李万臣,葛秘蕾,井志强.基于云理论的图像分割新方法[J].应用科技,2010,37(3):45-48.
LI Wanchen, GE Milei, JING Zhiqiang. A new method of image segmentation based on cloud theory[J]. Applied Science and Technology,2010,37(3):45-48.
[11] 林强,董平,林嘉宇.图割方法综述[J].微处理机,2015(1):35-39.
LIN Qiang, DONG Ping, LIN Jiangyu. A Survey on Graph Cut Techniques,2015(1):35-39.
[12] 章毓晋.图像分割中基于过渡区技术的统计调查[J].计算机辅助设计与图形学学报,2015(3):379-387.
ZHANG Yujin. A Survey on Transition Region-Based Techniques for Image Segmentation[J]. Journal of Computer-Aided Design & Computer Graphics,2015(3):379-387.
[13] 陈强,朱立新,夏德深.结合Canny算子的图像二值化[J].计算机辅助设计与图形学学报,2005,17(6):1302-1306.
CHEN Qiang, ZHU Lixin, XIA Deshen. Image Binarization Based on Canny’s Operator[J]. Journal of Computer-Aided Design & Computer Graphics,2005,17(6):1302-1306.
[14] 左奇,史忠科.一种抗干扰的图像分割新方法[J].计算机工程与应用,2002,(21):52-53.
ZUO Qi, SHI Zhongke. A New Method for Denoising Image Segmentation[J]. Computer Engineering and Applications,2002,(21):52-53.
[15] 刘欣欣,李雪,王琼.基于灰度直方图的多阈值分割法[J].计算机应用与软件,2013,30(12):28-30.
LIU Xinxin, LI Xue, WANG Qiong. A Multi-threshold Segmentation Method Based on Gray-scale Histogram[J]. Computer Applications and Software,2013,30(12):28-30.
[16] 李牧,闫继红,李戈,等.自适应Canny算子边缘检测技术[J].哈尔滨工程大学学报,2007,28(9):1002-1007.
LI Mu, YAN Jihong, LI Ge, et al. Self-adaptive Canny operator edge detection technique[J]. Journal of Harbin Engineering University,2007,28(9):1002-1007.
[17] 林清华,杜民.新型快速中值滤波算法及在医学图像中的应用[J].计算机应用研究,2012,29(9):3584-3587.
LIN Qinghua, DU Min. Novel fast median filtering algorithm and its application in medical image[J]. Application Research of Computers,2012,29(9):3584-3587.
收稿日期:2016年1月7日,修回日期:2016年2月19日
基金项目:国家自然科学基金项目(编号:61272364);广东省自然科学基金-博士启动项目(编号:2014A030310415);广东省教育厅科研项目(编号:2013LYM_0102)资助。
作者简介:贺辉,女,博士,副教授,研究方向:空间信息智能分析与处理。刘琨,女,硕士,副教授,研究方向:物联网技术。肖红玉,女,硕士,副教授,研究方向:软件工程、分布式水文。
中图分类号TP391.41
DOI:10.3969/j.issn.1672-9722.2016.07.030
Bills Auto-cropping Based on Adaptive Image Binary Representation
HE HuiLIU KunXIAO Hongyu
(College of Information Technology, Beijing Normal University Zhuhai Branch, Zhuhai519085)
AbstractImaging process for bank bills is vulnerable to the adverse effects for complex background interference or lack of illumination or uneven illumination, which makes the task of accurate auto-cropping for bank bills be very challenging in real-time. After automatic correcting of the deflection angle of the bills, a fast auto-cropping strategy based on adaptive image binarization is presented. The policy is applied to the integration testing with the auto-processing device for bank bills, results show that the policy has a good ability for the suppression to background interference and can obatin accurate cropping results in the environment with natural illumination, expecially when the background color is near to the base color of the bill. The overall correct rate is 95%, indicates that the self-adaptability and robustness of the methodology proposed is superior to that of the method based on edge detection. In addition, the median filtering algorithm was improved, which greatly reduced the time complexity, so as to meet the need of the real-time online processing for bank bills.
Key Wordsbank bill, auto-cropping, image binarization, gray histogram