基于PCNN网络的印章图像处理
2017-03-29林毅傅夏生
林毅,傅夏生
(四川大学计算机学院,成都 610065)
基于PCNN网络的印章图像处理
林毅1,傅夏生2
(四川大学计算机学院,成都 610065)
当今社会,出现大量的假印章,假章的泛滥导致了严重的问题,因此对印文图像进行精确而高效的识别就显得非常重要。对PCNN模型进行深入的研究,并着重学习实践应用PCNN对印文图像进行处理研究。脉冲耦合神经网络是和生物智能领域的结合,具有生物神经网络独特的高容错性和高适应性,能够保证印文图像在印文残缺,线条不均匀的情况下不会影响印章的识别,同时也能够满足对印文图像识别的实时性和准确性的要求[1]。应用PCNN进行印文提取质量较高,提取速度快。应用PCNN模型对印文图像进行提取,探究应用人工神经网络和传统上提取印文图像红色分量匹配的结果,更好地理解人工神经网络在图像处理上应用的相关技术。
脉冲耦合神经网络;印章图像;印文提取
0 引言
印章,是用作于印在文件上表示鉴定或者签署的凭证。从古至今,印章无论在日常的经济生活中还是在其独特的艺术性上都有着无可取代的作用。然而在现实的生活中,正是因为事事不可离开印章的这样的特性,使得很多不法分子铤而走险,使用假印章获取不正当的利益,这种行为已经威胁到了社会的稳定和公平,给国家、社会、个人带来了巨大的损失。由于各类印章的防伪性较差以及监督使用方法的相对不成熟,长久以来,我们一直受到假印章的困扰。
人工神经网络的研究已经应用在经济、军事、工程等诸多领域,人工神经网络是和生物智能领域的相应结合,因此人工神经网络具有生物神经网络所有的高容错性、适应性强等明显的优点。人工神经网络应用在印章图像处理上,能够以更快的效率,更准确的识别率,更高的抗噪能力超越其他图像处理技术。
1 基于PCNN网络的印章图像处理
神经网络是一种运算模型,由大量的节点(或称“神经元”)和之间相互联接构成。每个节点即每一个神经元代表的是一种特定的输出函数,被称之为激励函数。每两个神经元间的连接都代表了一个对于通过该连接信号的加权值,称之为权重,这就相当于人工神经网络的记忆[2]。
人类神经系统的结构如图1中所示,系统中是人类的神经网络,神经网络不断的接受来自外界的刺激,通过感受器,感受这些刺激并做出相应的反应,信号会顺着箭头所指的方向往前传输,同时往回的箭头表示的是系统的反馈。感受器把人本身或者来自外部环境的刺激转换成为了电流,向神经网络传送信息,神经网络的效用器会把电流刺激转换成为可识别的响应输出。
图1 神经系统框架图
人工神经元的模型就是对生物神经元的数学上的抽象化,如图2所示。
图2 神经元模型
2 实验设计
PCNN属于第三代神经网络,Eckhorn[3]在对猫的大脑皮层视觉区域神经元研究时根据同步脉冲发放现象提出PCNN。Eckhorn提出的PCNN模型的参数较为复杂,不容易设定,所以在实际的应用中,研究者们就Eckhorn提出的PCNN模型进行了改进和简化,这样一来就能够更加适合于图像处理。不同的应用采用的是不同的网络模型和参数设定方法,网络模型的选择和参数的设定会直接影响着最终的效果。
有一种经过简化的网络模型“顾晓东模型”[4]如图2所示,是该模型的基本结构。
图3 顾晓东模型
本文采用的模型就是如图3所示的神经元网络模型,从生物的角度上来说,单个的神经元不仅要接受来自外部的环境输入,还会受到其他周围邻接神经元的影响,上图中的Ii,j表示的是来自外部的输入,Yk(1≤K≤4)表示的是来自神经元Ni,j邻接神经元的输入。Fi,j和Li,j分别表示的是馈送单元输入和连接单元输入,在本模型中馈送单元输入Fi,j在数值上等于外部环境输入Ii,j,连接单元输入Li,j是邻接神经元输出的和。在调制区域的部分,内部活动矩阵Ui,j是由公式(1)计算的:
在公式(1)中βi,j表示连接的强度。在脉冲产生区域,Ui,j和神经元的阈值θi,j进行比较。如果Ui,j比θi,j大,那么神经元Ni,j此时就会发送一个脉冲信号,这也就是所谓的神经元点火;否则,那就没有脉冲输出。神经元发出脉冲的同时,该神经元的阈值θi,j也会立刻提高到一个足够大的值,使得该神经元不会再次发送脉冲。因此,神经元的输出Yi,j由公式(2)得到:
将脉冲耦合神经网络应用于二值化图像细化操作时,除了以上所述的特点外,同时还应该满足以下的特点:
神经元Ni,j的馈送单元的输入值Fij就是像素点Pi,j的灰度值;
神经元Ni,j只会被其周围的和它连接的神经元Ni-1,j、Ni,j-1、Ni,j+1和Ni,j+1的影响,因此这时该神经元的连接单元输入Li,j的计算公式是:
阈值θi,j的计算公式如(4)所示,(和是两个给定的常数):
这里设定的矩阵T是一个二值的矩阵,保存着细化的结果,Ffired同样表示的是一个二值的矩阵,保存的是当前点火时刻所有点火的神经元。
细化的流程图如图4所示。
印文的提取的主要步骤如下:先对原始的RGB颜色空间的印文图像进行二值化的处理,使得图像变得简单,图像的数据信息会因此减少,但是却能够突显出我们需要的目标轮廓,接着提取出印文的轮廓骨架,让提取出来的骨架和原始的图像转化成的二值化印文图像进行融合,这样最终就把印文的主要特征结构给提取出来。对于印文的模版图像和待比对的图像都需要进行这样的相关处理,这样把图像转换成为计算机能够理解的特征,按照特征进行比对,最终得出鉴别的结果。
图4 细化流程图
原始图像是一个基于RGB颜色空间的图像,那么通过OpenCV这一跨平台的计算机视觉库里面的API函数,能够很方便地实现将原始图像转换为灰度图像,接着继续将灰度图像转换成更好处理的二值化的图像,二值化的图像能够大大减少处理信息,简化问题。由于印文本身结构的特殊性,可以料想到,进行二值化处理后的图像会存在一定数量的结构上的空洞,不利于对图像的处理,这时候应该采取形态学上的连续腐蚀操作,形态学上的腐蚀是将图像中的某些结构元给去除掉,腐蚀会缩小并细化二值化图像中的部分,在印文中就会将细小的边界和结构给过滤干净,进行完连续的腐蚀操作,还要对图像进行连续的膨胀操作,与腐蚀有所不同的,膨胀会在一定程度上粗化或者说增加二值化图像中的部分,重塑图像,然后对最终的图像进行边界的提取,这样就能够得到的符合要求的结果图像。
大小为m×n的二值图像F(假设图像中背景的灰度值是1,对象的灰度值是0),设定F(i,j)表示第(i,j)个像素的灰度值。在把图像F输入到神经网络前,对像素的灰度值F(i,j)进行预处理:
接着把F输入到网络中一直到没有新的神经元点火,那么最终得到的结果就是空洞填充的结果。这一步的操作为接下来对图像骨架细化,然后进行印文提取有重要的作用[4]。
所谓图像细化,指的是对二值化图像骨架化的一种操作运算。细化就是对图像进行一层层的剥离,把图像中一些不重要的部分给滤去,但是最重要的是仍然保持图像原来的大致形状。这对于印文图像的提取起到了很大的作用。
本文采用的细化算法能够把印文骨架快速的从复杂的印文背景中提取出来。算法的流程图如图5所示。
在图5中,Image1和Image2是两幅二值图像,在第n次点火的时候,分别用O1(n),O2(n)来表示输出。细化的结果公式为:
实际上Image1是原始图像通过空洞填充算法得到的,Image2则是由Image1和二值化后的图像相减得到的。通过PCNN神经网络模型得到最终的结果。由于待操作的图像在先决条件上要求是封闭的,那么形态学上的腐蚀和膨胀的操作就很有必要[4]。
在得到了印章的骨架之后,将印章图像的骨架提取的图像和印文的二值化图像在形态学上进行完腐蚀和膨胀操作之后的图像进行融合,可以得到一个新的融合图像。
图5 骨架提取算法流程图
3 实验结果及结论
本文实验的探究是建立在Windows操作系统平台上的。因此基于PCNN模型的印文处理研究可以利用微软的可视化集成开发平台Visual C++6.0。MFC基础框架可以在此IDE中搭建,使用MFC框架来构建实验程序,并辅之以OpenCV1.0这个开源的计算机视觉库,将相关的算法应用到对图像的处理上。
为了方便对印文图像进行比对,因此需要对印文留底图像和待识别图像都进行预处理操作,如图7中所示,对印文的原始图像进行了二值化的处理,同时还对提取印文图像红色分量的图像进行二值化的处理,可以明显观察到,被处理后的印文图像在图像信息结构上显得更加简单,这样也更容易被计算机理解,进而做出更好的判断。
通过对于两者不同实验步骤进行比较,明显的发现仅仅只是提取印文图像的红色分量的值,显然在印文图像信息的显示以及后续需要进一步对印文图像进行处理的时候,能够给印文正确识别带来的帮助十分有限,提取红色通道分量后的图像虽然直接简单,但是提取的效果并不好,在提取的过程中,会丢失其他有用的信息。
图6 印文原始图像和提取红色分量印文图像的二值化图像
得到二值化的图像之后,可以看到的是二值化后的图像还依然带着一些影响判断的特征,印文存在的瑕疵,因此在形态学上要对二值化的图像进行腐蚀和膨胀操作,得到更适合处理的印文图像。下图7中a、c、e、g、i、j是上文中二值化处理后的图像,b、d、f、h、k、l是经过了形态学上操作的图像。
图7 二值化图像形态学处理后的图像
经过比对可以发现,二值化原来存在的一些缝隙,大部分都已经被处理完毕。同时也可以明显的感受到图像的特征信息已经有了改进。
[1]Johnson J.L.and Padgett M.L.PCNN Models and Applications[R].IEEE Transactions on Neural Networks,1999,10(3):480-498.
[2]维基百科.[EB/OL]http://zh.wikipedia.org/zh-cn/人工神经网络
[3]Eckhorn R.,Frien A.and Bauer R.High Frequency(60-90 Hz)Oscillations in Primary Visual Cortex of Wake Monkey[R].Neuroreport,1993,4(3):243-246.
[4]顾晓东,余道衡.PCNN的原理及其应用.电路与系统学报[J],2001,9-6(3).
[5]Rafael C.Gonzalez,Richard E.Woods.Diaital Image Processing[M].Third Edition.北京:电子工业出版社,2011:14-16.
Process of the Seal Image Based on PCNN
LIN Yi,FU Xia-sheng
(College of Computer Science,Sichuan University,Chengdu610065)
With the development of the society,the seal plays a significant role in today’s social life as a symbol of the credit.In today’s society, there are many kinds of fake seals.Because the flooding of fake seals will cause serious problems,it is very important to identify the seal image accurately and efficiently.Studies this model and focuses on the application of the PCNN for the process of the seal image.The PCNN is a combination with biological intelligence.This model has unique high fault tolerance and high adaptability.By applying this model the seal image,it can be recognized under complicated conditions,and at the same time,it can satisfy the seal image recognition of realtime and accuracy requirements.Using the PCNN to extract seal images has higher quality and faster speed for extracting.Applies the PCNN model to extract the seal image and compare to the traditional method which extracts the red channel of the seal image.Through the study and research on PCNN model to get a better understanding of artificial neural network technologies of its application in image processing.
PCNNs;Seal Image;Seal Extraction
1007-1423(2017)05-0071-06
10.3969/j.issn.1007-1423.2017.05.017
林毅(1992-),男,福建福州人,硕士研究生,研究方向为机器学习
2016-12-16
2017-02-12
傅夏生(1991-),男,广西玉林人,硕士研究生,研究方向为机器学习