APP下载

印鉴图像预处理方法研究

2017-09-03阳,潘

网络安全与数据管理 2017年15期
关键词:印鉴票据字体

项 阳,潘 新

(内蒙古农业大学 计算机与信息工程学院,内蒙古 呼和浩特 010010)

印鉴图像预处理方法研究

项 阳,潘 新

(内蒙古农业大学 计算机与信息工程学院,内蒙古 呼和浩特 010010)

为了提高印鉴识别的准确性,在识别前需要对印鉴图像进行预处理。针对印鉴常与银行票据要素混杂的实际情况,基于RGB彩色模型,将影响印鉴提取的两个干扰源——字体和书写线分别进行处理。首先通过选取合适的阈值二值化图像,利用Canny算子和Hough变换提取字体和书写线边缘,然后与原二值图像做“与”运算,求出需要填充的印鉴缺失信息轮廓,并对该轮廓进行闭运算、中值滤波,最后填充缺失部分,得出完整的印鉴图像。实验结果显示,用此方法处理后的印鉴图像质量较高,能够满足后期识别的需要。

图像预处理;RGB彩色模型;Canny算子;Hough变换;图像边缘

0 引言

印鉴是指印章印面在纸张等文件载体上盖印出来的印迹,是印章印面结构特点的形象反映[1]。我国《票据法》明确规定将签章(签名或盖章)作为票据的绝对必要记载事项之一[2],因此印鉴成为银行重点审核的对象。但近年来随着票据业务逐年增多,传统的手工折角核对的方式速度慢、主要靠个人经验的弊端越发明显。随着信息技术的发展,使用计算机图像处理相关技术替代人工,对印鉴进行识别成为了新的检验印鉴真伪的途径。

图1 银行票据图像

相比于其他图像,银行票据的印鉴图像有其特殊性:一是票据本身的特殊性。一张填写好的完整票据(图1),除了印鉴以外,还有印刷字体、手写字体、行标、人民币大写书写线等一系列要素,复杂的背景情况会对图像处理产生不利影响;二是印鉴的特殊性。票据上的签章应为该单位公章或财务专用章并加盖法定代表人或授权代理人的签章[2],而我国仅对机关团体、企事业单位、社会团体的公章的规格等做出了规定[3],对其他专用章、名章等规格样式未做说明,因此从印鉴规格来看,圆形、椭圆形、方形等均是符合要求的,内部字体大小、排列方式也是较为随意的。另外,印鉴在票据上的位置并非固定,法律中没有明确要求,人们惯例会盖在中间红色书写线下,如图1所示,实际情况中,印鉴一部分位于书写线上也是合规的。

许多学者都对不同领域的图像预处理进行过研究,比如气象云图[4]、车牌[5]等,解决了各自的一些问题,但对于在银行票据上的印鉴预处理研究相对较少,也存在很多局限性。首先对于印鉴的载体,如文件纸张[6]、发票[7]等,其表面要素的复杂程度远不及银行票据。其次有些研究只针对某一种形状的印鉴,如圆形[8]、方形[9]等,通用性较差。针对以上不足,结合实际,本文以银行票据为背景,提出了一套印鉴图像预处理方法。

1 印鉴图像的采集和提取

首先通过扫描仪提取票据图像,分辨率为600 dpi,如图1,采集到的图像为RGB图像,票面要素可以分为三类:绿色的票据背景;红色的印鉴、行标、书写线,黑色书写字体和印刷部分。印鉴图像为红色,对红色(R)、绿色(G)、蓝色(B)分量可以分别设立阈值(T)提取印鉴。考虑到印鉴图像的红色分量远大于其他分量,可以先采用分量之间的相对差值[10]来进行灰度化(如图2)。

图2 gray1

gray1=(R-G)+(R-B)(0≤R≤255,0≤G≤255,0≤B≤255)

(1)

再对式(1)确定阈值T,使灰度图像二值化,gray1的直方图呈现单峰特征,在确定阈值T时所遵循的标准为:在保证印鉴图像清晰完整的前提下,尽可能减少噪声并消除票据其他要素的影响。经多次实验,取T=70,并采用3×3方形窗口的中值滤波消除孤立噪声,结果如图3所示。

图3 二值化结果(干扰区域)

由图3可知,印鉴的干扰源来自两个方面:一是票据上红色书写线,因为与印鉴颜色相近,故在前面处理中并未清除;二是原来黑色的书写字体造成印鉴上方边框及印鉴字体的缺失,因此需要修复印鉴图像。考虑到书写线未破坏印鉴完整性,首先处理书写字体造成的印鉴缺失。

2 书写字体处理

从票据上看,书写字体呈黑色,可知其灰度值较低,通过对整个票据灰度化,选取相应阈值二值化,再取反,就可以得到字体图像。彩色图像灰度化方法有很多种,常用的有最大值法、平均值法和加权平均法。相比来说,加权平均法得到的图像最理想。经验公式为:

gray2=0.299×R+0.587×G+0.114×B

(2)

同样的,需要对gray2取阈值再进行二值化,这里阈值T取180,为了与图2印鉴图像像素值保持一致,还应该按位取反,最后得出字体(如图4)。

图4 字体图像

接下来,需要将字体图像的相应部分也就是造成印鉴图像缺失的部分进行提取。Canny算子[11]是基于信噪比、定位精度、单边缘响应三个准则设计的边缘检测算子,其原理是先用高斯滤波器平滑图像,再计算图像每个点中梯度的幅值和边缘方向,比较每一点与沿梯度方向上相邻两点的梯度幅值大小,如果前者小于后者,则舍弃该点,保留其余点。对其余点像素的幅值设立两个阈值T1、T2,低于T1判定不是边缘点,高于T2判定一定是边缘点,在T1和T2之间判断该点邻接点中是否有梯度幅值高于T2的点,如果有,则算作边缘点;否则舍弃。经多次实验,确定高斯滤波器标准差为1.5,阈值T1=0.04,T2=0.10。

用检测出的边缘和字体图像做“与”运算,得出所要填充缺失的范围(图5),基于该范围再进行结构元素为20×20方形结构的闭运算,处理后的结果如图6所示。将图6与图3做“或”运算,即可填充字体缺失(图7)。

图5 造成印鉴缺失的字体边缘

图6 字体填充

图7 字体处理结果

3 书写线处理

观察图1,红色书写线一共10条,平行排列,经进一步分析,得知在分辨率600 dpi下,书写线线宽为10像素,线与线之间的空隙宽也为10像素,考虑用Hough变换[12]找出平行线,再判断若干平行线是否为同一书写线上,根据不同情况分别进行下一步处理。

一般的直线方程可以表示为:

y=kx+b

(3)

k、b分别为直线的斜率和y轴截距,x、y分别为直线上某一点的横、竖坐标。由于式(3)不能表示k无穷大时的直线,故用下面极坐标形式表示直线:

ρ=xcosθ+ysinθ

(4)

ρ表示图像坐标原点到该直线的距离,θ表示ρ与x轴夹角。

Hough变换将图像空间X-Y变换到参数空间θ-ρ,对于直线来说,图像空间上每一点都对应参数空间一条曲线。具体来说,参数空间先按θ、ρ精度划分若干原始值为0的累加器单元,然后图像空间直角坐标系上的点通过式(4)计算生成横竖坐标分别为θ、ρ的参数空间曲线,曲线经过的累加器单元值加1,因为经过同一累加器单元的曲线所对应的点近乎共线,所以所有的点计算完成后,图像空间直线上共线的点会形成在参数空间曲线的交点,而使某些累加器单元的值呈现局部极大值,通过确定阈值参数,检测出高于阈值的局部极大值,求出对应θ、ρ的值,即可提取相应直线。

但在实践中,在图像中直接使用Hough变换求直线的结果并不理想,除了需要计算整个图像的像素点而导致的计算量偏大的因素,还有票据上受其他因素干扰,比如与书写线交织在一起的印鉴图像、字体图像等,这些影响会造成提取书写线直线不准确。综合这两点,考虑在Hough变换前用边缘检测算子对图像进行边缘检测。首先将图7用前面提到的Canny算子求出边缘,再利用Hough变换,以所有累加器单元的最大值的一半作为阈值提取极大值, 将该值1×1邻域内单元置0以清理极大值,然后在Hough变换参数空间(图8)中确定这些极大值累加器的对应坐标θ、ρ(图8中用方格标出),从坐标θ可以看出,检出的直线集中在原票据图像中与x轴垂直的方向。对应地,在图7中通过上述θ、ρ选定直线(图9中用横线标出),共提取出43条直线。

图8 Hough变换累加器单元分布

图9 选定的直线

根据线宽以及线与线之间的距离均为10像素的特点,按ρ从小到大,判断这43条线两两之间的间距,如果间距大于10像素,则可判断两线属于不同的两条书写线像素内;如果小于等于10,则两线必属同一条书写线像素。重建一张与图9相同大小的空白图像,将同线间的像素置为1。生成与原票据图像对应的10条书写线,而在原图9选定的两线间置0。

与字体处理方法类似,用参数相同的Canny算子将置0处理后的图9与置1的10条书写线图像两者分别提取边缘,随后对两边缘进行“与”运算,得出应填充的书写线缺失的轮廓,再利用以半径为10像素的圆盘形为结构元素的闭运算,可求出缺失部分像素(图10),与图9做“或”运算,用中值滤波消除噪声,得到完整清晰的印鉴图像(图11)。

图10 书写线填充

图11 处理后图像

4 确定印鉴方位

需要提取的是图11中带有“计算机应用技术”字样的试验专用章和带有名字的名章,从票据上的要素来看,整个试验专用章是票据上最大的单连通区域,而名章则是第二大的单连通区域,那么利用这一特征,重设一张与图11相同的图像,填充其中所有单连通区域,通过MATLAB中regionprops函数计算各个单连通区域的面积,取面积最大的两个区域[13],根据该函数中‘BoundingBox’字符串所显示的值确定这两个区域边框,考虑到印鉴的多样性,在各个边框外留出10个像素的额外空间,最后得出试验专用章(图12)、名章(图13)两个印鉴图像。

图12 试验专用章图像

图13 名章图像

5 结论

本文介绍了一种印鉴图像预处理的方法,针对造成印鉴缺失的两个干扰源——字体和书写线分别进行处理,首先在处理字体时,用Canny算子提取二值化的原图像和字体图像的边缘做“与”运算,得出需要填充的边框,再用闭运算得出填充结果。然后在处理书写线时,用Hough变换提取书写线,与字体处理相似,也采取缺失图像和书写线图像提取边缘做“与”运算和闭运算的方法,填充后用MATLAB中regionprops函数确定印鉴方位,得出印鉴图像。

此方法应用于背景为银行票据的印鉴,对其需要处理的部位进行定位处理,可以最大限度地保证印鉴图像的完整。又因该方法不是依据判断可能出现印鉴的具体形状特征分别处理图像,所以也具有一定通用性,最终结果能够满足后期印鉴识别的需要。对于更为复杂的情况,比如印鉴与票据其他更多要素掺杂时处理的效果,有待进一步验证。

[1] 许爱东.印章印文鉴定理论与实务研究[M].北京:法律出版社,2015.

[2] 国务院法制办公室.中华人民共和国票据法注释与配套[M].北京:中国法制出版社,2008.

[3] 中华人民共和国国务院.关于国家行政机关和企事业单位社会团体印章管理的规定[EB/OL].(1999-10-31)[2010-11-15].http://www.gov.cn/xxgk/pub/govpublic/mrlm/201011/t20101115_62739.html.

[4] 孙彦子,范红,陈静,等.静止气象卫星多光谱图像的预处理方法研究[J].微型机与应用,2016,35(17):45-48.

[5] 李文锋,张红英.基于纹理特征的车牌定位方法[J].微型机与应用,2014,33(3):41-43.

[6] 张学东,潘晓红,李端端,等.基于最小二乘法的印鉴缺损轮廓修补法[J].计算机工程与设计,2009,30(20):4693-4696.

[7] 郑晓曦,宁科桐.一种提取印鉴方法的研究[J].数字技术与应用,2012(11):121-124.

[8] 刘铁根,邓集杰,张忠传,等.基于平滑卷积定位的圆形印鉴提取方法研究[J].光电工程,2009,36(4):1-6.

[9] 何瑾,刘铁根,张昊,等.应用形态学top-hat变换的支票方形印鉴自适应分割[J].光学精密工程,2009,17(10):2576-2585.

[10] 孙明.数字图像处理与分析基础——MATLAB和VC++实现[M].北京:电子工业出版社,2013.

[11] JOHN C.A computational approach to edge detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-698.

[12] HOUGH P V C. Method and means for recognizing comPlex patterns[P].U.S.Patent:3069654,1962.

[13] 彭烨.银行票据印鉴自动识别[D].江门:五邑大学,2013.

Study on image preprocessing method of seal imprint

Xiang Yang, Pan Xin

(College of Computer and Information Engineering,Inner Mongolia Agricultural University, Hohhot 010010, China)

In order to improve the accuracy of seal identification,the image preprocessing of seal imprint is needed before identification process. According to realities that the seal imprint often mixes with bank note elements ,based on the RGB color mode, two sources of interference which are characters and writing lines are processed separately.First of all, selecting a appropriate threshold to get binary image and take edges of characters and writing lines by using Canny operator and Hough transform, and then among the edges and original binary image do “and operation” to seek outlines of missing information.Secondly,using closed operation and median filtering for the outlines. Finally, filling the missing information of the image, so a complete image of seal imprint is presented.The experimental results show the image which is processed by this method has a character of high quality and can satisfy the requirements for the succeeding verification work.

image preprocessing; RGB color model; Canny operator; Hough transform; image edges

TP391.41

A

10.19358/j.issn.1674- 7720.2017.15.012

项阳,潘新.印鉴图像预处理方法研究[J].微型机与应用,2017,36(15):41-44.

2017-02-14)

项阳(1986-),男,硕士研究生,主要研究方向:图像处理与模式识别。

潘新(1974-),通信作者,女,博士,副教授,硕士生导师,主要研究方向:图像处理与模式识别。E-mail:pxffyfx@126.com。

猜你喜欢

印鉴票据字体
字体的产生
从几枚农民协会印鉴看民主革命时期的农民协会
江西苏区消费合作社印鉴
一种基于ORB特征的印鉴快速配准算法∗
2016年11月底中短期票据与央票收益率点差图
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图
2015年8月底中短期票据与央票收益率点差图
组合字体
基于RGB颜色特征的印鉴图像预处理