APP下载

褶皱中文手写体身份鉴别

2015-07-18尚赵伟

电子科技大学学报 2015年1期
关键词:手写体笔迹褶皱

尚赵伟,曹 海,陈 波



褶皱中文手写体身份鉴别

尚赵伟,曹 海,陈 波

(重庆大学计算机学院 重庆沙坪坝区 400044)

针对褶皱中文笔迹身份鉴别的问题,提出了一种基于散射变换系数统计特性的识别方法,主要利用散射变换的局部平移不变性和弹性形变稳定性等特性,先将文本图像进行散射变换,再采用伽玛模型,对其各子带的散射系数提取分布特征作为全局特征,然后在全局特征上建立Copula模型,最后使用Copula模型之间的KL距离计算相似性,用于身份鉴别。理论分析和对比实验结果表明,对于不同褶皱的文本图像,基于散射变换统计特性的识别方法优于现有的方法。

Copula模型; 伽玛分布; KL距离; 散射变换

手写体笔迹识别是根据笔迹对书写者进行身份认证的一种基于生物行为的识别技术,已在安防、金融等领域得到了广泛的应用,并逐渐成为计算机视觉和模式识别领域中的研究热点。通常根据笔迹是否与文本的内容相关,将其分为与文本相关的脱线笔迹识别和与文本无关的脱线笔迹识别两类。与文本无关的脱线笔迹识别克服了前者与书写内容相关的不足,在实际应用中具有制约少、数据易获取等特点,已得到广泛的应用。

1 研究现状

与文本无关的脱线笔迹识别方法主要有局部特征方法和全局特征方法,局部方法主要通过建立笔迹字典等作为身份鉴别的依据[1]。全局方法将文本图像的内容笔迹视作纹理,提取其纹理特征作为识别依据[2]。文献[2]认为书写者的笔迹特征变化主要表现在傅里叶谱的低频部分,提出了利用傅里叶变换(FFT)结合KL变换来进行笔迹识别。文献[3]提出了利用FFT结合谱分析的方法进行笔迹识别。文献[4]提出了应用2D-Gabor结合欧式权距离(WED)分类器来进行笔迹身份识别。文献[5]提出了轮廓波变换(CT)结合广义高斯分布(GGD)模型的中文笔迹身份识别方法。文献[6]提出了基于小波分解(DWT)结合GGD模型方法做身份识别。文献[7]提出了利用传统金字塔小波变换结合隐马尔科夫树模型(HMT)的方法对中文笔迹进行身份识别。文献[8]提出了利用对偶树复小波(DTCWT)变换和GGD相结合的方法。文献[9-10]提出了利用抗混叠轮廓波(NACT)结合GGD和金字塔复方向滤波器组(PDTDFB)结合GGD的方法。

以上方法处理的数据是正常情况下获取的文本图像(无褶皱),如图1a所示。但是在实际应用中,获取的笔迹文本图像可能是对褶皱纸张扫描后获取的文本图像,如图1b所示。因纸张褶皱所产生的笔迹会出现一定程度的平移和局部弹性形变,造成相同的文本图像存在一定的视觉差异,如图1a和图1b所示,即在褶皱笔迹文本图像中,笔迹产生了局部平移和局部形变等变化,直接影响了褶皱情况下的笔迹身份识别,所以对褶皱中文笔迹身份进行鉴别,其描述特征应具有局部平移不变性和局部形变不变性。

a. 正常文本图像 b. 褶皱文本图像

文献[2-10]采用不同时频分析工具对文本图像进行特征提取,但这些方法均不能同时满足时移不变性和局部弹性形变稳定性。如文献[2-3]采用FFT变换具有时移和频移性,且对形变不稳定;文献[4]采用的2D-Gabor是小波的一种,但不具有形变稳定性;文献[5]采用了CT方法,CT致力于构建最优逼近意义下的高维函数表示方法,能够稀疏地表示纹理图像的奇异结构特征,但不具有时移不变性和局部弹性形变稳定性;文献[6-7]采用的DWT不具有局部弹性形变稳定性和时移不变性;文献[8]采用DTCWT方法;DTCWT虽具有时移不变性,但不具有局部弹性稳定性;文献[9]使用NACT方法,是对CT的改进,但不满足局部弹性稳定性和时移不变性;文献[10]采用PDTDFB方法,具有近似时移不变性,但不具有局部弹性稳定性,所以均难以处理褶皱笔迹身份鉴别问题。

散射变换是在小波的基础上提出的新理论[11],已在纹理识别、语音分析得到了应用[12-13]。散射变换具有平移不变性和弹性形变稳定性,能够满足处理褶皱情况下的笔迹识别的要求,所以本文使用散射变换来提取笔迹文本图像的全局特征方法,提出了基于散射变换的Gamma模型来解决褶皱情况下的脱线笔迹鉴别问题,其流程框架如图2所示。

图2 使用散射变换识别手写体笔迹的框架流程图

2 散射变换理论

散射变换(Scatter)是文献[11]提出的基于小波变换的方法,采用多尺度小波变换提取图像底层结构特征,能有效地提取不同尺度和方向上图像共生信息,具有局部平移不变性、弹性形变稳定性和光照不敏感性等优点,其框架如图3所示。

图3 散射变换的框架图

在散射变换中第一阶散射变换的构造如下:

(2)

式(2)中丢失的高频信息又可通过下一轮的小波再分解得以恢复,则第阶散射变换为:

散射表达包括所有尺度和方向的散射系数,有:

(4)

若小波变换的方向数为,则第阶散射变换沿频率递减的路径数为,前阶的路径总数为。设图像的像素大小为,采样值为(=1或0.5),则每条散射路径有个散射系数。综上所述,前阶散射系数的总数,即散射变换的系数为,所以散射变换是冗余的,其算法实现过程如下:

end for

end for

end for

3 散射系数的统计特性

小波变换系数是服从GGD模型的,并成功地应用于手写体身份鉴别[15]。复小波是将单小波的构造空间扩展到复数域,构造出的小波不仅保持了传统小波变换良好的时域局部化特征,具有方向性、时域敏感性和相位信息,在散射变换中,本文选择复小波进行变换。由式(1)可知,在散射变换过程中,原图像经过复小波变换后的实部和虚部均是服从GGD模型,然后进行取模运算,所以各个子带的系数不服从GGD模型,而服从Rayleigh或Weibull或Gamma分布,但Gamma分布可更好地拟合其系数直方图[15]。因卷积操作为线性运算,且滤波器是线性算子,故使用滤波器与卷积后的值仍服从Gamma分布,所以散射变换系数服从Gamma分布。

为验证上述结论,本文设计了实验进行验证,对散射系数的直方图分布与DTCWT系数模的直方图进行对比研究和分析。随机选取一张图片,其在不同褶皱情况下的笔迹文本图像进行散射变换,如图4a~图4c所示,对应的2阶散射变换系数特定子图的直方图如图4d~图4f所示,通过观察可看出散射变换系数的直方图服从Gamma分布。

a. 无褶皱文本图像 b. 轻度褶皱文本图像

c. 重度褶皱文本图像 d. 无褶皱笔迹系数的分布拟合

e. 轻度褶皱笔迹系数的分布拟合 f. 重度褶皱笔迹系数的分布拟合

从Handwriting图像数据库中随机选择了40幅图像进行实验(分解级数为2级),使用DTCWT和Scatter对图像进行变换,按照式(5)定义变换系数的拟合度,分别计算DTCWT系数模的拟合度和Scatter系数的拟合度,其实验结果如表1所示,有:

表1 不同变换系数拟合度的比较表

通过表1可知,Scatter系数在不同褶皱情况下,Gamma模型的拟合度的均值和方差都小于Weibull模型,说明使用Gamma能够更好地拟合褶皱笔迹的Scatter系数;Scatter系数的拟合度的均值和方差与DTCWT系数模的拟合度相差较小,说明Scatter系数的直方图分布函数同DTCWT系数的模直方图分布函数一样近似逼近Gamma模型,与本文结论一致。

4 Gamma模型

Gamma分布的概率密度函数为:

式中,()为Gamma函数,当,且时,有。为了估计其分布参数,设为服从参数为的Gamma分布,采用矩估计法来估计,[15],有:

(7)

因计算的距离将随着的不同而变化,为平衡计算时间和效果,式(8)中选择[14]。

5 实验与分析

5.1 比较对象分析

针对无褶皱情况下的手写体笔迹鉴别问题,文献[9]中的NACT解决了CT中两个低通滤波器的基函数缺乏局部化能力而导致的频谱混叠现象[9],其实验结果优于文献[5-8]方法的实验结果,文献[10]中的PDTDFB方法结合了不可分离的方向滤波器组,具备小波所不能表达的多方向特性,能够有效地捕捉图像的边缘轮廓信息,且具有近似平移不变性,其实验结果也优于文献[5-8]方法的实验结果。另外,剪切波(Shearlet)是一种继承曲线波和轮廓波优点的新型多尺度几何分析工具,通过对基本函数缩放、剪切和平移等仿射变换生成具有不同特征的剪切波函数。对于二维信号,剪切波不仅可以检测到所有的奇异点,而且可以自适应跟踪奇异曲线的方向,且随着尺度参数变化,可精确描述函数的奇异性特征。DNST[16]利用了非独立紧支撑Shearlet算子,对图像的多尺度各向异性进行性稀疏编码,改善了Shearlet的方向选择性,在图像分割的效果上优于独立Shearlet结果[16]。综合以上已有的理论结果,本文的实验选取NACT、PDTDFB、DNST和CT方法作为比较对象。

5.2 相关参数和数据

5.2.1 实验参数

文献[11]的研究结果表明,散射系数中超过99%的能量集中在的路径中,在尺度的情况下,超过99%的能量更加集中在的路径里,综合效率和效果,本文的实验选择散射层数为2,尺度为5。根据文献[9-10],2级分解情况下,PDTDFB和NACT在方向数为(4,8)时效果最佳;3级分解情况下,方向数为(4,8,16)时效果最佳,因此本文的实验选择2级和3级作为NACT、PDTDFB、DNST和CT的分解级数,方向数分别为(4,8)、(4,8,16)。

5.2.2 实验数据

首先将所有的手写体文本以300 dpi的分辨率扫描进计算机,采用512×512像素作为本文处理文本图像的大小。实验选用了由50个人所书写的手写体文本进行预处理(使每个汉字的大小统一),每人有书写不同内容的两幅图像,这样共有100幅手写体文本图像。对这些图像进行不同程度的褶皱处理,分别得到无褶皱、轻度褶皱和重度褶皱手写体文本图像各100幅。

5.3 实验具体步骤

为了验证本文方法的有效性,本文设计了两个实验进行说明。

实验 1 从HandWriting图像数据库中选取某个书写者对应的40幅图像进行了实验,分别计算Scatter的二阶系数、NACT的三级分解系数、PDTDFB的三级分解系数、DNST的三级分解系数、CT的三级分解系数,然后使用Gamma模型对Scatter系数进行参数估计,使用GGD模型对NACT系数、PDTDFB系数、DNST系数和CT系数进行参数估计,最后对拟合出的参数进行统计分析,得出其均值、方差,结果如表2所示。

实验 2 实验中将不同褶皱情况下的300幅图像称为父图,在原图像(父图)基础上,以字符为单位随机排列形成20幅512×512像素的子图像,这样得到正常文本图像集、轻度褶皱文本图像集和重度褶皱图像集。按照图2的流程图进行实验,结果如表3所示。

表2 不同变换系数拟合参数的比较

表3 PDTDFB、NACT、Scatter在不同褶皱情况下的识别率

为评价本文方法的有效性,采用综合检索率作为评价标准,有:

式中,为属于同一个书写者的样本数目;R为每次相似计算结果中,前个距离最小的样本与被测试样本中属于同一个书写者的数目;为所有样本数。

5.4 实验结果与分析

5.4.1 实验结果分析

由表2可得,参数比较如下:无褶皱情况下,PDTDFB系数、NACT系数、DNST系数和CT系数的拟合参数的方差分别为Scatter的2.85´104倍、3.44´104倍、5.26´102倍、1.29´104倍,拟合参数为Scatter的6.39´102倍、5.96´102倍、1.76´104倍、5.54´102倍;轻度褶皱情况下,PDTDFB系数、NACT系数、DNST系数和CT系数的拟合参数的方差分别为Scatter的5.63´102倍、8.68´102倍、1.88´102倍、2.01´102倍,拟合参数为Scatter的7.88´104倍、9.02´104、1.18´106倍、9.55´105倍;在重度褶皱情况下,PDTDFB系数、NACT系数、DNST系数和CT系数的拟合参数的方差分别为Scatter的7.12´102倍、1.02´103倍、4.5´102倍、1.04´102倍,拟合参数为Scatter的1.10´104倍、1.16´104倍、1.60´105倍、6.59´104倍。

综合实验结果可得,在不同褶皱情况下,NACT系数、PDTDFB系数、DNST系数和CT系数的拟合参数的均值和方差均大于散射系数拟合参数的均值和方差。其中为尺度参数,模拟了系数直方图的峰值的宽度,为形状参数,反比例于直方图中定点的下降速率,因此方差越小,直方图所表示的特征之间的相似度越高。因为Scatter的变换系数的拟合参数的方差最小,所以Scatter系数所表示的同类特征相似程度高,能够较好地表示褶皱笔迹文本特征。

从表3可知,Scatter的效果要明显优于NACT、PDTDFB、DNST和CT的识别结果。取NACT、PDTDFB、DNST和CT的最好效果作为比较对象,无褶皱情况下,Scatter的识别率比NACT、PDTDFB、DNST和CT分别高15.4%、15.7%、22.2%、21.0%;轻度褶皱情况下,Scatter的识别率比NACT、PDTDFB、DNST和CT分别高18.3%、18.6%、19.3%、28.6%;重度褶皱情况下,Scatter的识别率比NACT、PDTDFB、DNST和CT分别高27.9.1%、29.1%、38.8%、32.2%。综合检索率结果可得,Scatter的平均检索率比NACT、PDTDFB、DNST和CT分别高22.5%、29.76%、29.8%、30.92%。

5.4.2 实验结果理论分析

1) 散射变换具有平移不变性和形变稳定性。

小波变换不具有平移不变性,为了取得平移不变性,与SIFT方法相似,需要对小波系数进行平均;但由于,高频系数的线性平均不会产生任何信息。散射变换通过引入模运算,得到各小波子带的平均信息,进而获得稳定的特征(见式(1))。虽然低通滤波器会导致高频信息的损失,但在计算第二阶散射系数时,对小波模进行新的小波再分解(见式(2)),恢复了高频信息,可获得新的不变特征,从而在尺度对和方向对上具有“共生”信息,是相关尺度对和方向对上的图像结构变化的相似程度较合理的描述。

因褶皱文本图像的笔画信号存在平移、旋转等刚性形变和局部弹性形变,所构建的相似度度量应具有相应的不变性。CT是二维图像的一种稀疏表示方法,沿着图像轮廓边缘用最少的系数表示曲线,能够很好地表示边缘和纹理信息,但不具有平移不变性和局部弹性形变稳定性,不能很好地抵抗刚性形变和局部弹性形变;NACT只是对CT的频域局部化能力的改进,不具有平移不变性和局部弹性形变稳定性;PDTDFB和DNST虽具有近似平移不变性,但与散射变换相比,其局部弹性形变稳定性差,难以有效地表示图像结构变化的相似性特征。所以与NACT、PDTDFB、CT和DNST相比,Scatter可更好地描述褶皱文本图像的特征。

2) Scatter比PDTDFB、NACT、CT冗余度高。

PDTDFB、NACT、CT和散射变换均是冗余变换。本文从笔迹文本图像集中随机选取一幅图像,分别使用Scatter、PDTDFB、NACT、CT对其进行变换,通过计算得出Scatter系数数目是原图像大小的3倍,PDTDFB系数数目是原图像大小的2.641倍,NACT系数数目为原图像大小的1.315倍,CT系数数目为原图像大小的1.313倍,所以散射变换比PDTDFB、NACT、CT的冗余度高,其携带的有效信息相应增多,能够更好地表示图像的全局统计特性,同时也增加了计算复杂度。

6 结 论

在提取褶皱笔迹文本图像特征方面,本文利用Scatter比NACT、PDTDFB、DNST、CT提取出的特征更有效的特点,从Scatter的变换系数出发,利用Gamma模型,蒙特卡罗方法和KL距离相结合的方法,进行脱线中文手写体识别。通过理论分析和实验证明,本文的方法在针对中文手写体识别的精确性方面优于基于NACT、PDTDFB、DNST、CT的GGD方法,尤其在褶皱情况下,该方法的识别准确率优于其他方法,但本文提出基于Scatter的方法不能够很好地抵抗图像的旋转与缩放[13],需要在未来的研究中不断改进,为以后的图像识别研究提供基础。

[1] 李昕, 丁晓青, 彭良瑞. 一种基于微结构特征的多文种文本无关笔迹鉴别方法[J].自动化学报, 2009, 35(9): 1199- 1208.

LI Xin, DING Xiao-qing, PENG Liang-rui. A microstructure feature based text-independent method of writer identification for multilingual handwritings[J]. Acta Automatica Sinica, 2009, 35(9):1199-1208.

[2] DUVERNOY J. Handwriting synthesis and classification by means of space-variant transform and density and Karhunen -Loeve analysis[J]. J Opt Soc Am, 1975, 65: 1331-1336.

[3] KUCKUCK W. Writer identification by spectra analysis[C]//Proc Int Conf Security Through Science Engineering. West Berlin, Germany: IEEE, 1980: 1-3.

[4] SAID S H E, TAN T N, BAKER K D. Personal identification base on handwriting[J]. Pattern Recognition and Artificial Intelligence, 2000, 33(1): 149-160.

[5] HE Z Y, TANG Y Y. Chinese handwriting-based writer identification based on contourlet[C]//IEEE International Conference on Systems, Man, and Cybernetics (IEEE SMC 2005). Hawaii, USA: IEEE, 2005: 1058-1063.

[6] HE Z, YOU X, TANG Y Y, et al. Handwriting-based personal identification[J]. Pattern Recognition and Artificial Intelligence, 2006, 20(2): 209-225.

[7] HE Zhen-yu, YOU Xin-ge, YUAN Yan-tang. Writer identification of Chinese handwriting documents using hidden Markov tree model[J]. Pattern Recognition, 2008, 41(4): 1295-1307.

[8] XU Da-yuan, SHANG Zhao-wei. Hand writing-based writer identification with complex wavelet[C]//International Conference on Wavelet Analysis and Pattern Recognition (ICWAPR). HongKong, China: IEEE, 2008: 597-601.

[9] 朱贝贝, 尚赵伟. 抗混叠轮廓波变换的脱线中文手写体笔迹识别[J]. 计算机工程与应用, 2011, 47(24): 150-153.

ZHU Bei-bei, SHANG Zhao-wei. Offline Chinese handwriting-based writer identification with non-aliasing contourlet transform[J]. Computer Engineering and Applications, 2011, 47(24): 150-153.

[10] 朱贝贝. 脱线中文手写体笔迹识别[D]. 重庆大学, 2011: 28-36.

ZHU Bei-bei. Offline Chinese handwriting-based writer identification[D]. Chongqing: Chongqing University, 2011: 28-36.

[11] MALLAT S, BRUNA J. Classification with scattering operators[C]//IEEE Conference Computer Vision and Pattern Recognition(CVPR). Colora Springs, USA: IEEE, 2011: 1561-1566.

[12] MALLAT S. Multiscale scattering for audio classification [C]//Proceedings of ISMIR 2011 Conference.Miami, Florida, USA: IEEE, 2011: 657-662.

[13] MALLAT S. Invariant scattering convolution networks[J]. IEEE Transactions PAMI, 2013, 35(8): 1872-1886.

[14] KWITT R, UHL A. A joint model of complex wavelet coefficients for texture retrieval[C]//IEEE International Conference on Image Processing(ICIP). Cairo, Egypt: IEEE, 2009: 1857-1860.

[15] KWITT R, ANDREAS U A. Lightweight probabilistic texture retrieval[J]. IEEE Transactions on Image Processing. 2010, 19(1): 241-253.

[16] LIM W Q. Nonseparable shearlet transform[J]. IEEE Transactions on Image Processing, 2013, 22(5): 2056- 2065.

编 辑 黄 莘

Wrinkled Chinese Handwriting-Based Writer Identification

SHANG Zhao-wei, CAO Hai, and CHEN Bo

(College of Computer Science, Chongqing University Shapingba Chongqing 400044)

Targeting at the problem of wrinkled Chinese handwriting recognition, this paper presents a method based on statistical characteristics of scattering transform coefficients. This method mainly uses the local translational invariance and the stability of elastic deformation of scattering transform. Firstly, the text image is transformed by scattering. The distribution characteristics used as global characteristics are extracted by applying gamma model to scattering coefficients of sub-bands. Then the copula model is constructed based on these global characteristics. Finally, the similarities are calculated for recognizing writers by using the Kullback-Leibler divergence between copula models. Theoretical analysis and comparative experiment show that our method based on statistical characteristics of scattering transform is more advantageous than the others for when regarding text images with various degrees of wrinkles.

Copula model; gamma distribution; kullback-leibler divergence; scattering transform

TP391

A

10.3969/j.issn.1001-0548.2015.01.012

2013-12-27;

2014-12-07

国家自然科学基金(61173130);重庆市自然科学基金(CSTC-2010BB2217)

尚赵伟(1968-),男,博士,教授,主要从事模式识别及图像分析方面的研究.

猜你喜欢

手写体笔迹褶皱
巧克力能否去除桌上的油性笔笔迹
基于大数据下的手写体识别的设计与研发
披着书法外衣的手写体
动漫人物衣服褶皱的画法(1)
一点褶皱
对维吾尔语手写体在线计算机识别技术的几点探讨
褶皱的优雅
模糊聚类算法下的手写体数字识别
论书写速度变化笔迹鉴定
梦幻褶皱