基于脉冲耦合神经网络的汉字纹理特征提取
2013-11-12姚娜吕海芳陈杰
姚娜 吕海芳 陈杰
(塔里木大学信息工程学院,新疆 阿拉尔 843300)
对于图像纹理特征的提取研究主要是基于模型类、统计类、信号处理类三大类的方法,各种方法的有效性相差无几,查准率和查全率的乘积的最大值在0.1~0.3 之间波动,但是在计算复杂度、反映图像信息的全面性、像素之间的依赖性和多分辨特性等角度各有各的优势与不足,其中多种方法都有计算量大,计算复杂度高的缺点[1]。1999年,Johnson在Eckhorn 猫视觉神经元模型的基础上提出了脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)[2-4]。PCNN 在图像处理[5]方面得到了广泛的应用,包括图像融合、去噪、分割、边缘提取等,近期也用在了图像特征提取方面[6-7],论文提出将脉冲耦合神经网络的方法用于汉字图像的纹理特征的提取中。中华文化中的汉字复原对于文化遗产的保护和传承有着极其重要的作用,对于汉字的特征提取重要的是形状提取和纹理提取,形状特征的提取相对简单,纹理特征的提取相对复杂,但纹理特征的提取是汉字图像的特征中一个很重要的特征,所以纹理特征提取是建立图像数据特征库并且进行复原的一个重要前提。论文提出将脉冲耦合神经网络的方法结合梯度向量对汉字图像进行纹理特征提取,计算复杂度低,且具有旋转不变性和尺度不变性的优点。
2 PCNN 模型和梯度向量
2.1 PCNN 模型
脉冲耦合神经网络(PCNN)是由多个神经元相互连接形成的反馈型网络,是对Eckhorn 提出的猫视觉皮层模型的一种扩展,其结构组成如图1所示[8]。
图1 单个神经元简化模型的内部结构
其中,构成PCNN的每一个神经元主要由接收部分、调制部分和脉冲产生三部分组成。接收部分由两部分来组成,其中一部分用于接收外部信号的馈入输入(Feeding Inputs),其运算关系为:
另一部分则用来接收来自其它神经元的连接输入(Linking Inputs),其运算关系为:
在公式(1)(2)中,和是连接权系数矩阵,表示卷积运算,为神经元是否点火的信息,和为时间衰减常量,和为连接和馈入常量,为神经元接受的外部激励。在调制部分,馈入输入和连接输入经过调制后产生神经元的内部活动,其运算关系为:
公式(3)中为连接调制常量。神经元的脉冲产生是根据内部活动的一个阶跃函数而产生二值输出,并根据神经元是否点火的状态自动调整阈值的大小。在时间,如果内部活动比阈值函数大,脉冲输出的值为1,称神经元点火;否则取值为0,称神经元未点火。如果神经元点火,则阈值根据下面两式进行自动调整:
其中,为时间衰减常量,为阈值常量,式(5)为阶跃函数。
2.2 梯度向量
Lee 和Cok 对图像梯度向量的研究从二维空间扩展到了多维的空间[9]。如果用函数来表示一幅二维空间的图像,那么该图像的梯度向量为一阶导数。在三维空间的彩色图像中,假设彩色图像的函数为,则该彩色图像的梯度向量为:
该方法在文献[9]中有更详细的阐述,论文中待处理的源图像为RGB 模式的彩色图像,先将其转换成L*a*b 空间模式的图像,再用此方法进行求解梯度图像如图3 所示,图2 为待处理的源图像,图4 为RGB 图像直接运用文献[9]求出的梯度图像,由仿真结果可以看出将RGB 模式的图像转换成L*a*b 空间模式后对于噪声的敏感度降低,更适合人类的视觉,更有利于纹理特征的提取。
图2 待处理的源图像
图3 L*a*b 空间模式下的梯度图像
图4 RGB 模式下梯度图像
3 简化PCNN 模型的改进及汉字纹理特征的提取
3.1 简化PCNN 模型的改进
PCNN的基本模型在实际应用中过于复杂,Gu Xiao dong 等提出了改进的简化PCNN 模型[8],公式表达如下:
通过公式可以看出改进模型的特点:
3.1.1 L 通道的各个脉冲输入线路上的突触联结权变成1。
3.1.2 把外部神经元的空间累积效果归一化。
3.1.3 将阈值调节器的非线性指数变化方式变为线性方式。
该模型舍去了通用模型的空间累加特性,保留了其它特性,为图像处理带来了好处。
3.2 汉字纹理特征的提取
论文在此改进简化模型的基础上结合梯度向量对图像进行特征提取:先将RGB 模式的汉字彩色图像转换成L*a*b 空间模式的图像,然后对图像求梯度得出梯度图像,对该梯度图像进行PCNN 迭代点火,每次迭代后的图像进行概率统计,最后得出一个向量作为提取的纹理特征。具体的改进后的纹理特征提取算法如下:
3.2.1 将RGB 模式转换为L*a*b 空间模式,汉字图像灰度化,求梯度图像;
3.2.2 将梯度图像归一化到0 和1 之间;L=U=0,θ=1,F=0;同时,令每个神经元Y=0;令N=20 β=0.2 Δ=0.05;
3.2.3 L=Step(Y ⊗K);
3.2.4 Y=Step(U- θ),D=Y,U=F*(1+βL);
3.2.5 如果Y=D,到(6);否则,L=Step(Y ⊗K),返回(4);
3.2.6 如果Y(i,j)=1,B=(i,j)=1,(i=1,…,H;j=1,…W)其中Y(i,j),B(i,j),分别为矩阵Y,B的元素;
3.2.7 θ=θ- Δ,随着调整次数N的增加降低阈值;
3.2.8 如果Y(i,j)=1,θ(i,j)=100.(i=1,…,H;j=1,…W),其中θ(i,j)为矩阵θ的元素。当某神经元点火后,迅速增加其阈值到一个足够大的固定值,使之不再点火;
3.2.9 B=Y,计算矩阵中值为1的概率P;
3.2.10 N=N-1。如果N ≠0,返回(2);否则,结束[P1P2……P20]。为20 次迭代后的概率统计向量。
其中,B 为点火结果矩阵,N 为循环次数,L 是连接矩阵,K 为运算核矩阵。论文采用8 邻域联接,核矩阵为:
图5 源图像的处理结果
图6 源图像大小的0.7 倍处理结果
图7 源图像旋转180°处理结果
Δ 为阈值调节矩阵,与循环次数相对应,Δ=1/N=0.05。D 为保存中间结果的临时矩阵;为图像的高度;为图像的宽度;各个矩阵的维数都一致,均为H ×W。概率统计向量[P1P2……P20]即为提取的纹理特征。
4 仿真结果及分析
论文所做仿真实验都是在CPU 为酷睿i5,CPU频率为2.5GHz的硬件条件下测得的仿真结果及数据。论文所做的部分纹理特征提取仿真结果如图5(d)图6(d)和图7(d),源图像为RGB 模式的图像如图2,来自于微软Office Word 中宋体文字的截图,图5(c)图6(c)和图7(c)的分割结果为20 次迭代中任意一次的分割结果。图5(d)为迭代次数为20,全部迭代次数的点火像素的概率统计直方图,图6(d)为迭代次数为20,图像大小变为源图像大小的0.7 倍后,全部迭代次数的点火像素的概率统计直方图,图7(d)为迭代次数为20,源图像旋转180°后,全部迭代次数的点火像素的概率统计直方图。通过理论分析及仿真结果得出总的分析如下:
4.1 不同的汉字图像有不同的灰度分布信息,该方法统计像素为1的概率,实际上是统计了汉字图像的灰度分布信息,即不同的汉字图像有不同的概率统计直方图,所以概率统计向量可以表示纹理特征的特点;
4.2 图5(d)、图6(d)和图7(d)中概率为0的次数都为15,概率在[0-0.015]之间的次数都为5次。虽然经过变换大小和旋转角度,有5 次在进行PCNN 点火时,每次点火的概率不完全相同,但是在某个范围内有共同的特点,所以在一定的范围内表示出该方法具有旋转不变性和尺度不变性的优点,只要设置适当的匹配数据范围就可以将提取的纹理特征数据与数据库中的数据进行匹配,然后进一步完成汉字的复原;
4.3 PCNN 具有并行高速传播的特点,所以该方法运行的速度高于普通的数学统计算速度,并且该方法的数学计算量较少,具有计算复杂度低的优点。
本论文将20 幅汉字图像进行纹理提取的仿真实验和匹配仿真实验,与常用的gabor 变换算法、灰度共生矩阵和局部二值模式(LBP)方法进行运行时间和匹配正确率的比较,如表1 所示。通过表中数据可以看出本文方法在综合考虑运行时间和匹配正确率的角度与其他三种方法相比具有优越性。
表1 运行时间及匹配正确率的比较
5 结论
论文提出了一种用改进的简化PCNN 模型结合梯度向量对汉字图像进行纹理特征提取的方法。首先将RGB 模式的汉字图像转换成L*a*b 空间模式的图像,然后再对其求梯度向量得到梯度图像,这样能够降低该方法对于噪声的敏感度,最后统计每次迭代点火后像素为1的概率统计直方图作为纹理特征。由理论分析及仿真结果分析可以表明该方法的有效性及优越性。如果旋转在180°以内,大小改变在2 倍以内,该方法的纹理特征具有旋转不变性和尺度不变性,该方法对汉字图像的纹理特征提取提供了新的理论依据,更具体的特征规律还有待于进一步的研究。
[1]刘丽,匡纲要.图像纹理提取方法综述[J].中国图象图形学报,2009,14(4):622-635.
[2]Johnson J L,Padgett M L.PCNN Models and Applications[J].IEEE Transactions on Neural Networks,1999,10(3):480-496.
[3]Kuntimad G,Rangnath H S.Perfect Image Segmentation Using Pulse Coupled Neural Networks[J].IEEE Trans on Neural Network s,1999,10(3):591-598.
[4]Eckhorn R,Reitboeck H J,Arndtetal M.Feature linking viasynch ronization among dist ributed assemblies:Simulation of results from acortex[J].Neural Computation,1990,2(3):293-307.
[5]Lindblad T,Kinser J M.Image Processing Using Pulse-Coupled Neural Networks [M].New York:Springer,2005.
[6]Yang Cheg,Gu Xiaodong.Combining PCNN with color distribution entropy and vector gradient in feature extraction[C].2012 8th International Conference on Natural Computation(ICNC 2012),2012:207-211.
[7]李双科,吴记群,孙传庆.一种基于PCNN的指纹特征提取算法[J].自动化与仪器仪表,2011,(5):134-137.
[8]Gu Xiaodong,Guo Shide,Yu Daoheng.A New Approach for Automated Image Segmentation Based on Unit-linking PCNN[C].International Conference on Machine Learning and Cybernetics,2002,1(1):175-178.
[9]Hsien-Che Lee,David R.Cok.Detecting Boundaries in a Vector Field[J].IEEE Transactions on Signal Processing,1991,39(5):1181-1194.