APP下载

面向汉字书写质量评价的Gabor特征提取方法

2020-10-28闫文耀郭铭涛王志晓张九龙

计算机技术与发展 2020年10期
关键词:滤波器样本书写

闫文耀,郭铭涛,王志晓,3,张九龙

(1.延安大学西安创新学院 数据科学与计算机学院,陕西 西安 710100;2.西安理工大学 计算机科学与工程学院,陕西 西安 710048;3.陕西省网络计算与安全技术重点实验室,陕西 西安 710048)

0 引 言

2017年初,国家在关于实施中华优秀传统文化传承发展工程的意见中对书法提出发扬、普及和创新应用的要求。当前,基于图像分析的书法研究在传统文化保护和普及方面发挥着重要的作用。国内已有相当多的书法研究成果,主要集中在碑帖图像去噪及增强[1-2]、书法字库检索[3-6]、书法体鉴别与评价[7]、特定风格生成[8]、书写质量评价等方面[9-10]。就本质而言,书法字检索、相似风格检索、体识别、风格生成等诸多应用的核心都是对字体的图像特征提取问题,包括手工设计的特征算子[11]和机器学习方法生成的统一特征[12],如何设计符合书法特点直观感受以及手写字特点专家评价的图像特征算子,使得机器与人的评价结果具有较为一致的可解释性,对高质量的书写质量评价产生重要的理论研究价值。针对传统书写质量评价方法所建立特征描述子往往仅适合某一种字体、风格的缺陷,肖建国等人领导的团队对汉字按偏旁部首进行切分,进而应用美学度评价准则,取得了较好的效果[13],但该方法需要较多的部首切分和美学评价规则制定。近期,该团队又针对艺术象形文字图像的自动生成问题探索性提出了一种新的模型AGIS-Net,该模型是一种一阶段模型,在只需少量样本的情况下就可以同时传递形状和纹理样式,并且取得了良好的效果[14-15]。虽然基于图像统计特征的方法结果的解释性不强,但其适应性广、评价有效,故仍不失为一种重要的研究途径。吴江琴等在书法字识别[16]及体识别[17]中应用了该类方法,取得较好的成果。该文提出将Gabor特征应用于书写质量评价中,研究书写汉字的纹理特征,进一步应用SVM进行评级,分为优良和一般两个级别,与专家打分的质量评价表进行对照分析,形成手写汉字质量评价的新途径。

1 基于Gabor的汉字纹理特征提取

Gabor滤波器是图像特征表示的主要方法之一,具有良好的多尺度及多方向性。生物学家通过实验证明了Gabor函数能够很好地模拟人类视觉细胞在受到外界刺激时做出的反应。Gabor滤波器的应用关键在于频率、高斯核大小、方向等参数的选择上。Gabor函数定义如下:

W(t,t0,ω)=e-σ(t-t0)2eiω(t-t0)

(1)

那么Gabor变换可以表示为:

(2)

把式(1)代入式(2),整理可得:

(3)

对式(3)展开后可得:

(4)

其中,C(x(t))(t0,ω)表示原始信号x(t)在时间为t0、频率为ω上的频率信息,它是一个复数形式,可按式(5)分为实部和虚部来表示。

C(x(t))(t0,ω)=αreal+iαimag

(5)

因此,C(x(t))(t0,ω)便能通过极坐标系下的幅值α和相位角φ来表示:

(6)

(7)

汉字的纹理特征提取本质上是使Gabor函数φμ,v(z)对汉字样本做卷积运算。设汉字图像的灰度分布为I(z),则与φμ,v(z)卷积的过程表示为:

Gμ,v(z)=I(z)*φμ,v(z)

(8)

其中,Gμ,v(z)是复数,其幅值与相位用以下两个公式来表示:

(9)

Pμ,v(z)=tan-1[Im(Gμ,v(z))/Re(Gμ,v(z))]

(10)

鉴于常见的汉字部首主要为横、竖、撇、捺四个方向,恰好对应Gabor滤波空间的0,π/4,π/2,3π/4,因此只需选定这4个方向对汉字图像进行Gabor纹理特征提取即可,字库中样本“乐”字的滤波后图像如图1所示。再提取汉字的5个尺度,4个方向,将Gabor滤波器的频率选为fmax=0.22,取图像大小的一半尺寸作为滤波器窗口的大小,图2和图3分别为实验所得的幅度图像和实部特征。

图1 “乐”字的滤波后的实验效果

图2 “阿”字滤波后幅度特征

图3 “阿”字滤波后实部特征

2 基于SVM的书写质量评价方法

在获取图像特征后,需要使用分类器进行书写质量的等级评价,即分为优良和一般两种等级。虽然更精细的评价在于为每篇作品在各个指标上打分评价,但在目前的探索研究中,仅考虑使用图像特征及分类器进行粗分类作为尝试。SVM是基于统计学的机器学习分类方法,准确率较高,推广性也较好。它具有核函数、最优超平面等解决方案,可解决过拟合等问题。该文选取常见的SVM方法进行二值分类。在计算完每个汉字滤波图像的均值和方差后,得到40维特征向量,以此作为特征输入支持向量机。

汉字特征提取具体过程如下:

Begin

gamma←0.5;

theta←pi/4;

a←sqrt(2);

fmax←0.22;

r←m/2;c←n/2;

i←1;

j←21;

foru←0:4

do

f←fmax*a^(-u);

lambda←1/f;

forv←0:3

do

sigma←0.56*lambda ;

GK←getGaborKernel(r,c,v*theta,sigma,lambda,gamma)

x←conv2(pic,GK);

mea←mean2(x);

colvector(i,1)←mea;

i←i+1;

var←std2(x)^2;

colvector(j,1)←var;

j←j+1;

End

End

End

设pic为所有训练样本的集合,训练样本为灰度图像,n为所有训练样本的总量。对Gabor核函数进行参数设置:m,n分别为当前图像的高和宽,把Gabor核窗口设置成图像窗口的一半[18],gamma的取值为(0,1)之间,由于Gabor滤波器的仿生特性,0.5是比较符合人类视觉的。设定五个尺度,四个方向(0,pi/4,pi/2,3pi/4)。f决定了Gabor滤波器的尺度特性,Gabor滤波器频率变化公式为f[k]=a^(-k)*fmax,sigma为高斯函数标准差。函数getGaborKernel返回一个方向一个尺度的Gabor核,函数conv2(pic,GK)取pic样本集合中一个样本与四个方向五个尺度二十个Gabor核函数进行卷积。函数mean2和std2分别为卷积过后的均值和标准差,向量colvector内存储的是二十个卷积图像分别取的均值和方差,组成40维向量。每个样本都有一个colvector,最终组成列向量集合,然后利用SVM进行分类。

下面主要介绍SVM参数优化的过程:

基于统计方法的SVM算法,其中的参数在于核函数的选取以及惩罚因子的系数,这两个参数的选择直接决定了分类效果的优劣。经过寻优的参数其效果可以远远超过未寻优的参数。常见的方法有基于网格的穷举筛选法和基于遗传算法的寻优方法。穷举法的思路较简单,易实现。给定参数的最大最小值范围,确定搜索步长即平面上网格大小,逐网格进行搜索。在每个网格参数点上,将数据集5等份,进行5重交叉验证,获取识别率。最终搜索完网格后确定最佳参数。

虽然该文只是进行了二值分类,但在SVM的输出中,是存在回归函数的具体数值的,施加了阈值判断,从而形成二值决策,所以文中方法对其稍加改进,即可用于书写质量的打分上来。

3 实验与分析

3.1 数据准备

实验数据来源于北京大学计算机科学技术研究所字形计算技术实验室孙榕鞠等人整理的CHAED字库,它包含30个人书写的100个汉字,每字收集10种写法构成1 000个字的字库,并有33个人工打分数据。图4为字库中不同书写质量以及不同结构的汉字样本示例。

图4 字库部分汉字样本示例

3.2 笔划清晰匀称性的特征衡量

本部分研究以Gabor特征衡量书写线条的匀称性及笔画的清晰度。好的书写,笔划之间清晰,结构匀称;差的作品,由于笔划扭曲,比例失调等形变造成笔划不清晰,结构不匀称的效果。清晰和匀称是两个较相近的特征,所以选用同一组样本进行实验。实验中选取书写匀称、符合规范的100个汉字,另外选取不具备这些特征的100个汉字,提取Gabor特征,用于决策分类。实验数据集如图5所示。

图5 笔划清晰匀称性实验数据集

通过实验测得最终的分类识别率为91%,反映出Gabor特征可以表示书写的匀称性。

3.3 书写风格一致性判断

同一个人书写的汉字风格是统一的,不同人的风格是不同的,本部分实验使用Gabor特征进行书写风格一致性判断。实验数据的准备是这样的,针对同一篇楷书作品,不同的人通过透明纸覆盖在其上进行摹写,鉴别不同的书写风格。实验数据集如图6所示,选取两个人的摹写样本各100个汉字,训练集和测试集分别包括两个人的100个汉字,风格一致性的测试结果为65%。

图6 书写风格一致性判断实验数据集

这部分实验风格鉴别率不高的原因是两个人的样本都来自同一书法字帖的摹写,原有的风格是一致的。这里只是每人在摹写时附加了个人的特点,这种算法在公安部门图侦室的书写同一验证中有重要作用。

3.4 汉字书写质量评价实验

本部分进行汉字书写质量评价的综合实验,需要机器给出优秀和一般两种判断。实验数据集如图7所示,通过和人工打分进行对比,得出文中算法的识别率为95%。

图7 汉字书写质量评价实验数据集

综上,文章从三方面对Gabor滤波器在书法特征鉴别方面的性能进行了测试,实验表明其效果较为理想。

4 结束语

针对汉字书写质量的评价问题,提出了基于Gabor滤波器特征表示的二值评价方法,根据5个尺度4个方向的Gabor特征,以均值和方差作为统计特征,输入SVM进行分类判别,分别检验了Gabor特征在笔划清晰结构匀称性及风格一致性方面的性能,并进行了综合的质量评价实验,取得了良好的效果。书法质量评价的研究是一个具有广泛应用价值的研究领域,其涉及到特征提取、图像形态学和图像语义理解等问题,提出的方法不依赖于字体分割精度,这为探索基于统计学习的书法质量评价研究提供了新的研究思路和方法。

猜你喜欢

滤波器样本书写
浅谈有源滤波器分析及仿真
基于多模谐振器的超宽带滤波器设计
书写要点(十)
养成书写好习惯
规划·样本
人大专题询问之“方城样本”
随机微分方程的样本Lyapunov二次型估计
书写春天的“草”
FIR滤波器线性相位特性的研究
My Story以笔相伴静书写