笔迹纹理图像预处理综述
2017-12-29王泽励于彤屈音璇赵建森
王泽励 于彤 屈音璇 赵建森
【摘 要】研究了笔迹图像预处理的常规步骤和方法,简述了灰度参数值的选择,二值化的处理方法以及归一化的基本原理,以期为纹理笔迹图像处理提供借鉴参考。
【关键词】图像处理;去噪;归一化方法
中图分类号: TP391.1 文献标识码: A 文章编号: 2095-2457(2017)26-0085-002
Summary of handwriting texture image preprocessing
WANG Ze-li1 YU Tong2 QU Yin-xuan2 ZHAO Jian-sen1
(1.Shanghai Maritime University,Shanghai 201306,China;2.China Criminal Police College,Shenyang 110000,China)
【Abstract】The routine steps and methods of handwriting image preprocessing are studied. The selection of grayscale parameter value, the binarization method and the normalization principle are briefly described in order to provide reference for the texture handwriting image processing.
【Key words】Image processing;Denoising;Normalization method
1 灰度化和二值化处理
常见的色彩模式有有很多种,如HSB,RGB,CMYK等,此处采用RGB色彩模式,一方面适应人体视锥系统,另外一方面也是便于扫描仪位图图像生成中,有效信息特征的存留和保证计算机对于一定精度条件下的数据处理能力和速度。
1.1 灰度化处理
灰度化是指把彩色图像表示为只有亮度表示的灰度图像的方式,指以线性相关度表示认知色彩的颜色空间理论的三基色(RGB)色觉认知原理C=rR+gG+bB出发的降维度处理方式。其中C为人眼感知系统可认知的色彩,R红,G绿,B蓝为三原色,r,g,b为对应色彩相关度。常见的灰度化处理方式如下:
1.1.1 最大值法
将三基分量中的最大亮度值作为灰度参数值,产生的图像多高亮。
R=G=B=MAX(R,G,B)
1.1.2 加权平均法
结合人眼的敏感度,对三基色分量进行权重处理。一般情况下,人眼对绿色敏感度最为高,蓝色最低,产生图像多柔和。即:Vgray=0.299R+0.587G+0.114B
1.1.3 平均值法
将RGB三个分量的平均亮度值作为灰度参数值。
R=G=B=Average(R,G,B)
1.2 二值化处理
二值化的处理问题主要就是阈值的选择问题,在笔迹鉴定的过程中一般采用认值S.Watanabe的灰度直方图法决定阈值。
P=M(i,j)-N(i+k1,j+k1)>0
if_P>0
D(i,j)=PS(i,j,M)= (D(i+k1,j+k1))
else灰度差S
D(i,j)=0
输出阈值N定义为图像中灰度级叠加的最大值N=MAX(C(m)=∑S(i,j,M))
2 去噪处理
图像的去噪处理方法有很多,比如中值滤波,邻域平均,边缘保持滤波器等方法。考虑到笔迹鉴定的细节特征保留和椒盐噪声的去除,一般采用阈值邻域平均法。给定像素点灰度值f(x,y)和窗口大小M*N,既定阈值T,关系如下:
f(x,y)= f(u,v)像素点灰度值
if_|f(x,y)-f(x,y)|>T
g(x,y)=f(x,y)该方法在平滑的同时减少了边缘模糊
else
g(x,y)=f(x,y)
3 单字符归一化
受限于书写载体,书写工具,书写时间,书写人习惯等因素,书写特征字的大小一般是不尽相同的,为了减少特征字符大小和位置变化对于鉴定的相关影响,同时还要保留书写者固有的笔迹风格,常采用归一化的方法。归一化就是将原始的点阵信息转化为固定维数的点阵信息的维度处理方法。
3.1 线性归一化方法
线性归一化分重心—中心线线性归一化和直接线性归一化方法,二中主要区别在于映射方式的不同,前者采用重心映射,后者采用像素映射。
3.1.1 重心—中心线性归一化
if_i m= i n= j 1<=m<=W; else else 1<=n<=H; m=W- (i-M)n=H- (j-M) 其中W,H为特征字图像高度和宽度,G为重心G=G(Gi,Gj),M为归一化后的高度和宽度,设归一化后像素点(i,j)处对应原始(m,n)處,则有上述关系。 3.1.2 直接线性归一化 m= i,1 n= j,1<=n<=W;1<=j<=M 其中W,H为特征字图像高度和宽度,M为归一化后的高度和宽度,归一化后像素点(i,j)处对应原始(m,n)处,则有上述关系。 此方法重心位置不固定,几何位置不重合。
3.2 非线性归一化方法
该归一化原理就是给定像素点密度值,归一化后笔画密度均匀分布特征字图像空间。这样分布紧密的笔画会分开,分布稀疏的会靠近。
定义d(m,n)为原始特征字图像中点(m,n)密度函数,H(m)和H(v)为水平和数值方向密度投影,为已知密度函数。归一化映射前后(m,n)和(i,j)关系如下:
i= Hk
H(m)= [d(m,n)+aH(m,n)],1<=m<=W
V(n)= [d(m,n)+aV(m,n)],1<=n<=H
j= V(l)
1<=m<=W;1<=n<=H;1<=i,j<=M
本方法可以改变笔画相对位置,减少倾斜,扭曲。重心重心保持不变,书写风格有所改变。
4 总结
以上简单阐述了笔迹图像的预处理方式方法,其基本原则还是最大限度保留有效的图像特征信息,减少特征损耗,同时满足类似压缩编码的过程中,实现信息数据量的减少,以适应计算机的处理过程。在灰度化,二值化,降噪,归一化的过程中,难免会出现特征损失的现象,导致有效特征信息失真,边缘特征模糊等常见的现象,因此,在具体的图像处理过程中,明确映射的卷积关系,也就是我们常说的模糊核,可以适当的反卷积,进行图像复原,还原有效的识别特征,对有争议的笔迹图像进行进一步的处理。
【参考文献】
[1]曹华军.图像二值化处理在笔迹样本中应用分析[J].信息技术与信息化,2016(06):67-68.
[2]朱若曦.基于模糊支持向量机的笔迹验证研究[D].河北工程大學,2014.
[3]于明,张彦云,薛翠红,孙林娟.笔迹图像中的单个汉字字符分割[J].计算机工程与应用,2010(09):180-182+245.
[4]范绪成.基于纹理特征提取的离线文字笔迹鉴别技术的研究[D].浙江工业大学,2009.
[5]师宝山,张贵州.笔迹鉴别预处理算法的设计与实现[J].电子器件,2008(04):1357-1360.
[6]张韵.基于纹理的文本独立离线笔迹鉴别[D].河北工业大学,2007.
[7]李莹.汉字笔迹鉴别的算法研究[D].山东大学,2007.
[8]梁亮.图像处理技术在笔迹鉴定系统开发过程中的应用与研究[D].沈阳工业大学,2007.
[9]王凤岭,刘连芳,蒋宗礼,韦智勇.基于纹理分析的笔迹图像预处理子系统的设计和实现[J].南宁职业技术学院学报,2005(04):84-89.
[10]杨亚莉.基于纹理分析的笔迹鉴别方法研究[D].武汉理工大学,2004.
[11]郑建彬,杨亚莉.基于整数小波系数的笔迹图像鉴别方法研究[J].武汉理工大学学报(交通科学与工程版),2004,(01):110-113.endprint