基于多向投影新方法的捆钞印章个数统计
2015-08-10宋昀岑陈镇龙叶玉堂刘少荘
宋昀岑, 陈镇龙, 罗 颖, 刘 霖,叶玉堂, 陈 伟,2, 刘少荘,2
(1.电子科技大学现代光电测控及仪器实验室(摩米实验室),四川成都610054;2.成都术有科技有限公司,四川成都610054)
基于多向投影新方法的捆钞印章个数统计
宋昀岑1, 陈镇龙1, 罗 颖1, 刘 霖1,叶玉堂1, 陈 伟1,2, 刘少荘1,2
(1.电子科技大学现代光电测控及仪器实验室(摩米实验室),四川成都610054;2.成都术有科技有限公司,四川成都610054)
提出了一种快速自动统计印章个数的多向投影新方法。该方法基于图像处理理论,将采集到的捆钞图像从RGB空间转为LUV空间,然后通过聚类分析算法,得到捆钞的二值化图像,再利用多向投影的思路,依次在垂直和水平方向投影变换,完成印章个数的统计。理论分析及实验结果表明,该方法可以有效去除背景噪声的影响,不依赖于印章印迹的好坏,提高了印章个数自动统计的效率和准确率。
计量学;图像处理;印章个数;聚类分析;多向投影;机器视觉
1 引 言
在金融等行业为了便于财务的管理和统计,经常会在成捆的钞票侧面盖上印章,根据印章的个数判断捆钞的数量和金额。而在捆钞印章统计中,人工统计具有效率低、容易出错等问题,因此印章个数的自动统计研究就显得越发重要。传统的目标识别统计,需要先对图像分割[1~5],提取出模板的特征值[6],根据模板匹配算法[7~9],利用已建立的模板在图像上寻找目标并统计目标个数,国内外很多学者都从事过该领域算法方面的研究与改进,Sibiryakov Alexander[10]等提出了采用二进制码和直方图进行模板的匹配,姜志高[11]等提出了相互比较法,通过模板向量跟目标向量的关联度,完成模板的匹配与统计。何新鹏[12]等提出的基于模板的图像匹配算法,利用对图像色度的投影,将图像数据降低到一维进行匹配,大大降低了计算量。但是,这些方法均要求待检目标与模板具有很好的一致性,对于捆钞印章中常见的印迹模糊和印迹变形等问题无法解决。
本文在分析了捆钞印章固有特征的基础上,提出了多向投影新方法。该方法从投影统计的角度出发,先通过垂直方向的投影去除背景噪声,找到印章所在区域,再通过水平方向的投影优化算法识别出具体的印章个数。对于实际采集到的1 000张捆钞图像进行印章个数统计的实验结果表明,各种印章印迹不均的情况均可以准确地进行统计,而且处理速度非常快。
2 基本理论
2.1 单向投影变换
投影特征值算法常应用于目标位置的提取[13~15]。对于一幅8位bmp格式的图片,根据图像上面各处灰度值不同的特点,可以将图像沿垂直或水平方向投影变换,提取出目标图像。所谓投影变换指的是,以像素为单位,将每一列(行)的灰度值相加。可以根据每一列(行)的灰度值变化规律得到目标的位置。
2.2 多向投影初步分割
需要统计印章个数的捆钞图像如图1所示,利用单向投影无法得到具体的印章个数。考虑到捆钞印章的排列相对比较整齐,分布在图像的两侧,而且印章相互之间是独立的,没有交叉区域,采用依次在垂直和水平方向进行投影的方法。
图1 捆钞原图
捆钞原图是工业相机采集到的RGB三通道彩色图像。RGB色彩模式是一种颜色标准,通过对红(R)、绿(G)、蓝(B)3个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。RGB彩色图像颜色信息分布于3个通道,不便于颜色信息的提取。观察图1,印章采用红色印泥,而红色数值的大小与LUV空间的U通道的数据大小正相关。LUV色彩空间全称CIE 1976(L*,u*,v*)色彩空间,L*表示物体亮度,u*和v*表示色度。因此,先将图像从RGB空间转换到LUV空间,然后通过对U通道的数据进行聚类分析,得到原图的二值化图像,将印章从背景中区分出来,如图2所示。
图2 捆钞U通道二值化图
由图2可以看出,由于钞票本身的图案具有红色信息,导致在印章以外的区域会有很多点状或块状的噪声存在。
首先将捆钞二值化图的每一列像素灰度值进行相加,得到垂直投影结果。因为印章主要集中在两个固定的区间范围内,投影图上必然会出现两个尖峰,但同时因为背景噪声的干扰,印章所在区域以外的范围也同样会出现干扰峰,如图3所示。为了将2列印章准确分割出来,需要找出2列印章的4个
垂直分割点,由投影原理可知,分割点在投影坐标系中属于极小值点。由噪声产生的尖峰,造成了大量的无效的极小值点,通过提出特征值来抑制不必要的噪声造成的干扰。特征值计算公式如下:
图3 加上特征值线的垂直投影
式中:W为图像的宽度,Scol(i)为第i列像素灰度值之和,λ为常量参数,这里λ=0.5,round表示取整。
根据式(1)计算出垂直投影特征值Tcol大小,首先,从Scol[1,2,…,W]找到所有小于特征值Tcol的极小值,并在一维数组Pmin中存储所有极小值在Scol中的位置。然后,计算相邻2个极小值之间Scol的平均值,用极小值灰度均值表示。存储大于特征值Tcol的极小值灰度均值,不符合要求的舍去。这样就减少了需要排序的极小值灰度均值的个数,大大减小了计算量。最后,采用最小堆排序法找到极小值灰度均值的2个最大值,这2个最大值所对应的2组极小值点就是需要识别的4个垂直分割点,其相邻极小值区间就是印章所在区域,见图3所示。
图像经过垂直投影,2列印章区域被找到,提取出2列印章,然后依次对2列印章进行水平投影,分割出每一个印章。由于垂直方向的有效信息是多个印章的合集,而水平方向的有效信息只和单个印章有关,远远少于垂直方向,所以,噪声对于水平投影时候的分割点提取影响更大。本文在垂直分割点提取的基础上,引入印章最小宽度判断法则,通过印章宽度与图像高度的比值来有效去除噪声干扰。
采用与垂直投影类似的方式获得水平投影图,每一行像素灰度值之和存储在数组Srow(i)中,并且采用与公式(1)类似的方法计算出特征值Trow的大小,找到所有的极小值。同理,计算极小值灰度均值,找到极小值灰度均值中大于Trow的值,并取得在Srow中对应的位置,作为初步分割点数据;最后,判断检验得到的分割点之间的距离是否满足Ws≥r×H(条件Ⅰ)的条件,去掉不满足条件的分割点,得到印章的水平分割点,并统计出印章个数。条件Ⅰ中,Ws为单个印章的宽度即单个印章在图像高度方向上的像素宽度,r为单个印章的宽度至少相当于整幅图像高度的比例,H为整幅图像的高度。
工业相机视场大小设定好之后,单个印章的宽度稳定在一个范围内,与整幅图像的高度呈一较稳定的比例关系。根据统计学原理,当宽度小于一定值,判断为噪声干扰。本实验中采用的图片,当r的值取为0.015时,去除噪声干扰的效果最佳。
2.3 多向投影的改进
采用上述多向投影方法,可准确统计出印章较为清晰的图片中的印章个数。在某些情况下,由于印迹不均匀,对应的水平投影结果会出现同一个印章的投影区域内有低于投影特征值TzRow的凹谷,而这样的凹谷会被分割算法错误地判为1个分割点,最终导致印章只能被部分地分割出来或者分割成2个或2个以上的印章。针对以上问题,本文对多向投影方法作了进一步的改进,根据捆钞印章的特点,提出印章平均宽度和垂直方向占空比2个概念,通过对初步水平分割点做一系列循环的比较、判断与合并来达到准确分割的效果。
改进后的多向投影算法流程图如图4所示,虚线框内为增加的校正算法步骤。首先,计算出该列印章平均宽度Wa,即垂直方向上得到的所有印章宽度的平均值;然后,判断相邻2对分割点宽度之和是否小于A×Wa(条件Ⅱ);最后,判断相邻2对分割点间的垂直方向占空比是否小于系数B(条件Ⅲ),其中,垂直方向占空比表示单个印章的2个水平分割点之间印章的水平投影中,值小于特征值TZ的数目与该印章宽度之比。若相邻两对分割点符合条件Ⅱ,条件Ⅲ,则合并2对分割点。
图4 改进的多向投影算法流程图
条件Ⅱ避免了由于印记不清而造成的一个印章被统计成2个或多个的情况,但是有可能会造成一个印章的某一部分与另一个印章合并,这就导致得出的印章位置错误,由于相邻印章的印泥之间有空隙,条件Ⅲ能有效避免上述情况的发生。结合大量实际印章印迹不均匀图片的特征进行考虑,通过实验验证,系数A不能简单地取1或2,而应该取1.7更能满足正确分割的要求,系数B则应该取0.125更为合适。
图5 3种典型捆钞图像的印章统计结果
3 实验结果与分析
为了验证理论分析以及本文所提新算法的可行性,对实际采集到的1000幅捆钞图像逐一进行了印章个数的统计,对于印迹模糊不清、印迹大小不一致、印迹倾斜以及印迹变形等常见问题,均能准确地将所有印章识别出来。本文选取了3种比较典型的捆钞图像进行比较,每种图像的印迹均有不同的问题,其每一步的处理结果如图5所示,其中,初步印章识别图是初步水平分割后的处理结果,最终印章识别图是采用改进后的算法处理结果。
由图5可以看出,对于印章较为清晰的图像,图5(a)红色印章容易分辨出来,经过初步水平分割即可获得正确的结果,如图5(m)所示。对于存在少量问题的图像,图5(b)中部分印记被遮挡,经过初步水平分割,也能得到正确的统计结果,如图5(n)所示。对于存在较多问题的图像,图5(c)中有些印章的部分区域印泥太少,导致初步水平分割时,将一块印章分割为多块,经过校正算法处理,错误得到纠正。
实验结果表明,对于印章较清晰的图像和存在某些问题的图像在初步水平分割中均能够完成分割统计,即使是对于存在较多问题的图像也能够在经过校正算法后得到正确的结果。对于采集到的1000张图片,能够正确统计出印章个数的图片为953张,准确率达到95%,而且处理速度非常快,平均耗时210 ms。
4 结束语
本文提出了一种适用于银行捆钞印章位置识别和个数统计的多向投影新方法。该方法是基于捆钞印章的分布特点,针对捆钞印章容易出现的印迹模糊、深浅不一、倾斜和变形等传统模板匹配法无法解决的问题提出的。该方法对于一般的捆钞图像和某些存在质量问题的图像均能够很好地完成印章的识别和统计,而且处理速度非常快,极大地提高了捆钞印章的统计效率和准确率。
]
[1] Wang S,Siskind JM.Image segmentation with ratio cut[J].IEEE Trans on Pattern Analysis and Machine Intelligence.2008,25(6):675-690.
[2] TaoW B,Jin H,Zhang Y M.Color image segmentation based onmean shiftand normalized cuts[J].IEEE Trans on Systems.2007,37(5):1382-1389.
[3] Vadiveloo M,Abdullah R,Rajeswari M,et al.Image segmentation with cyclic load balanced parallel Fuzzy CMeans cluster analysis[C]//2011 IEEE International Conference on Imaging Systems and Techniques(IST).Guilin,China,2011:124-129.
[4] Hong H Y,Guo X Y,Zhang X H.An Improved Segmentation Algorithm of Color Image in Complex Background Based on Graph Cuts[C]//2011 IEEE International Conference on Computer Science and Automation Engineering(CSAE).Guilin,China,2011:642-645.
[5] 曹卫.基于二分法的字符垂直投影分割算法[J].软件导刊.2010,30(10):71-72.
[6] 曾锐.印章特征提取算法研究[D].杭州:浙江大学,2007.
[7] LeeW C,Chen C H.A Fast Template Matching Method for Rotation Invariance Using Two-Stage Process[C]//IH-MSOP'09.Fifth International Conference on Intelligent Information Hiding and Multimedia Signal Processing,Kyoto,Japan,2009:9-12.
[8] Zeng Y C,Chen JF.Adaptive template-matchingmethod for recognition of low-resolution license number[C]//2010 International Computer Symposium(ICS).Tainan,China,2010:228-233.
[9] Li Z H,Liu C Y,Cui J G,et al.Improved rotation invariant template matching method using relative orientation codes[C]//The 30th Chinese Control Conference(CCC 2011),Yantai,China,2011:3119-3123.
[10] Sibiryakov A.Fast and high-performance template matching method[C]//2011 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),Colorado Springs,USA,2011:1417-1424.
[11] 姜志高.基于二值化处理与模板匹配的图像识别[J].才智.2011,(26):72-73.
[12] 何新鹏,黄英,刘奇,等.基于投影的快速模板匹配算法[J].自动化技术与应用.2011,25(7):72-75.
[13] 迟晓君,孟庆春.基于投影特征值的车牌字符分割算法[J].计算机应用研究,2006,1(7):256-257.
[14] Yu S,Yu K,Tresp V,et al.Multi-Output Regularized Feature Projection[J].IEEE Transactionson Knowledge and Data Engineering,2011,18(12):1600-1613.
[15] Qong M.An unsupervised classification method for polarimetric SAR imageswith a projection approach[J].IEEE International Geoscience and Remote Sensing Symposium,2003,7:4471-4473.
Statistics of the Number of Seals Based on Multi-directional Projection
SONG Yun-cen1, CHEN Zhen-long1, LUO Ying1, LIU Lin1,YE Yu-tang1, CHENWei1,2, LIU Shao-zhuang1,2
(1.Lab of MOEMIL,University of Electronic Science and Technology of China,Chengdu,Sichuan 610054,China;2.Chengdu HOLDTECSCo.Ltd.,Chengdu,Sichuan 610054,China)
A multidirectional projection method which can count the number of seals on bundled banknotes automatically and quickly is introduced.The fundamental principle of thismethod is that,based on the theory of image processing,converting bundled banknotes image from RGB space to LUV space in the first,processing it by using cluster analysis algorithm,then a binary image of the tied note can be gained.Using thought of multidirectional projection,projection transformation in the vertical direction and the horizontal direction then be applied to in turn.Finally the number of the seals can be counted.Theoretical analysis and the experimental results show that,thismethod can remove the impact of background noise effectively,do not depend on the quality of seals sigil,and improve the efficiency and accuracy of the automatical number statistics of the seals.
Metrology;Image processing;Number of seals;Cluster analysis;Multidirectional projection;Machine vision
TB96
:A
:1000-1158(2015)03-0242-05
10.3969/j.issn.1000-1158.2015.03.05
2013-05-15;
:2013-08-06
国家自然科学基金(61205004);粤港关键领域重点突破项目(东科2012205106,20091683);总装预研基金(9140A01020507DZ0215)
作者简介:宋昀岑(1983-),男,四川成都人,电子科技大学博士研究生,主要从事机器视觉、光电测控及仪器研究。cczzll008@163.com