印刷星标的Gabor纹理特征分析与自动识别研究
2014-07-08徐卓飞张海燕徐倩倩向晨
徐卓飞,张海燕,徐倩倩,向晨
1.西安理工大学机械与精密仪器工程学院,西安710048
2.西安理工大学印刷包装工程学院,西安710048
印刷星标的Gabor纹理特征分析与自动识别研究
徐卓飞1,张海燕2,徐倩倩2,向晨2
1.西安理工大学机械与精密仪器工程学院,西安710048
2.西安理工大学印刷包装工程学院,西安710048
印刷星标是判断水墨平衡的重要方式,由于其同时受到水墨关系与光照等因素影响,难以通过一般灰度分析方法准确判断,故提出通过图像纹理识别星标,以实现水墨状态的自动判断。内容包括印刷星标的采集与预处理,基于2D-Gabor的印刷星标纹理特征提取与融合PCA分析的纹理特征集降维,最后利用SVM实现决策网络的构建,实现了印刷机工作中对星标的自动识别,相关研究结果在减少调试维修设备工时和成本、提高印刷调节效率、快速实现水墨平衡等方面具有实际应用价值。
印刷星标;二维Gabor滤波;水墨平衡;支持向量机;主成分分析
胶印作为最主要的印刷方式,其工作状态在很大程度上依赖于水墨平衡,即利用油水不相溶原理,使得印版具有选择性吸附特性,使油墨和水在印版上分别处于亲油位置和亲水位置,从而实现油墨向承印物的转移,这里的“水”指胶印中的润版液。在这一过程中需要保持墨量和水量的相互平衡以保证网点转移的最佳效果,达到印刷品图像清晰、色彩饱满的效果[1-3]。为了匀墨均匀,胶印机墨路设计往往较为复杂,较长的墨路系统导致墨量易受设备状态变化的影响;水量会受到较多外界因素如温度、湿度、气流等影响,基于上述原因,致使印刷机在每次停机、启动、调试以及维修期间,往往会浪费大量的纸张和油墨,而相应的水墨状态判断与调节多以人工经验为主,若实现自动监测技术,则可提高生产效率和可靠性[4-5]。
若要脱离人工经验判断模式,需要建立准确高效的水墨量测量方案,因此印刷设备生产商与专家学者对于印刷机水墨检测展开了深入的研究:国外印刷设备先进制造商如德国海德堡、高宝等企业都开发了相应的油墨在线预置系统,通过在印刷前对印刷画面的分析,计算出各个色组的墨量值,并以此为依据通过遥控墨斗进行各墨区的墨量控制,以便于在印刷中快速达到墨量要求;张海燕等[6]设计了一种以超声波传感器为主的印刷机墨量在线监测系统,可以有效避免工作环境中噪声对监测的干扰,当印刷机墨斗中油墨到达最低线时,系统会发出报警声提示加墨,改进后系统可以在线显示墨斗中的墨量值,实现了印刷机供墨装置的自动化控制;考虑到润版液厚度在印刷过程中变化规律较为复杂,管力明等[7]针对润版液供给量进行了监控,利用光纤传感器及相关检测技术构建了监控系统,相对于人工经验判断,具有更高的准确性;上述研究可测量水墨关系,但是都需要在印刷机上开发安装相应的测试设备,增加了成本,因此Ren Linghui[8]等提出利用BP神经网络自动识别印刷标识,成功对印刷墨量的大小进行了判断,脱离了机械测试硬件的需求,但由于BP神经网络存在对样本需求量大的问题,致使其应用难度较大。
随着数字化工作流程在行业全面的推广,图像处理技术越来越多地应用于印刷画面分析之中,相关的模式识别技术为印刷设备的状态检测与故障诊断提供了新的有效方法[9]。考虑到印刷画面分析可脱离测试系统硬件与人工经验的束缚,降低成本并提高效率,提出自动识别印刷星标以实现水墨平衡的判断方法。
1 星标检测方法概述
图1代表了常见的印刷检测星标,其设计来源于美国印艺技术基金会(GATF),其多用于人眼直接观测。印刷机在水墨不平衡时,如图2星标上会出现细微的异常纹理,这里提到的纹理是一种反映像素的空间分布属性的图像特征,通常表现为局部的不规则性和宏观的规律性,是一类有效的图像特征[10]。考虑到印刷图案随水墨量变换时,其纹理会出现规律性变化,故提出从纹理角度进行模式识别研究,实现水墨平衡及相关异常的识别,克服灰度能量识别的不足。
图1 研究所选取的星标
图2 印刷状态出现异常时的印刷星标(以品红色为例)
实际生产中,工作人员常通过目测星标的方式,依据人工经验对水墨平衡进行相关的判断并进行相应设备调节。研究以星标为主要检测对象,实现自动水墨状态判断,选用CMYK四色(即青、品、黄、黑印刷基本四色)星标,印刷星标是尺寸为5 mm×6.5 mm的小矩形,提出技术路线如图3所示,主要包括采集印刷图像、基于二维Gabor滤波的特征提取分析与状态决策三个部分。
图3 技术路线
2 星标纹理特征提取与分析
2.1 基于2D-Gabor滤波的图像变换
星标检测具体有如下困难:首先,印刷作业环境光照的变化会影响到星标图像采集的效果,造成图像识别的误判;此外,星标纹理变化会受到色彩、水墨、湿度及温度等多重因素影响,变化形式复杂,单一的特征评估极易产生误判。
图4按照图像灰度能量值进行了分类,选取三种状态(水量过大墨量不足,水量不足墨量过大,水墨平衡)星标各20个,可发现A区域是明显墨量过大水量不足的标识,C区域是明显墨量不足水量过大的标识,而B区域包含了三种状态,难以区分。
图4 基于能量特征的区分结果
针对上述问题,提出了融合Gabor小波能量与方向特征向量的星标特征提取方法,利用二维Gabor纹理特征具有分辨率强且对光照的不敏感等特性,可对星标纹理细节起到良好的增强效果[11-12]。
Gabor变换是一种加窗傅里叶变换,它很好地兼顾信号在空间域和时间域中的分辨能力,且与人眼的生物作用相仿,故常用于纹理识别[13-14]。二维Gabor滤波是一个调制过的二维高斯函数,其单位冲击响应函数为:
其中,σx与σy分别控制高斯函数在x轴和y轴方向上的变换尺度,f0为中心频率,为了得到一组Gabor小波基,需对其进行尺度变换和方向旋转,如式(2)~(4)所示,经过方向旋转之后坐标为x′和y′:
其中θ为旋转角度,x和y为原坐标,θ=nπ/k,k是Gabor总的方向数,a-m为尺度因子。Gabor特征可通过将输入图像与Gabor小波滤波器组卷积得到。若输入图像为I(x,y),则图像I和Gabor函数在尺度m方向n下的卷积定义为:
本文拟采用8个方向(0°,45°,90°,135°,180°,225°,270°,315°)和5个尺度(m=1~5)Gabor滤波组,共有8× 5=40个特征组,图5是正常星标经过Gabor滤波之后得到结果。
图5 星标的Gabor小波变换
2.2 基于幅度谱与相位谱的纹理特征提取
在不同尺度和方向下,经Gabor滤波组滤波后得到幅度谱和相位谱,之后需要提取有效地纹理特征以用于模式识别。对于幅度谱而言,其均值与方差广泛应用于纹理分割和图像检索,具有良好的模式分类效果,本次研究选取不同尺度方向下滤波组的这两个特征值,构成特征向量组M,则每一幅图片的Gabor滤波幅度谱特征是一个5×8×2=80维的特征向量;对于相位谱而言,其灰度分布具有很强的不确定性,不能像幅度谱那样可以用一个分布来近似,基于这样的考虑并针对相位谱的信息不确定程度,可以从信息论的角度出发,用熵作为其特征值以描述其信息确定性程度[15],构建相位谱特征向量组N,它由5×8×1=40维特征向量组成,表示每一幅图片的相位谱特征,相位谱熵的计算如式(6)所示:
其中,P(i,j)代表图像中的一个像素,图像尺寸为(L-1)× (L-1)。由M与N构成二维Gabor滤波后图像的特征集,每一幅原始图像对应一个120维特征组,记为X= [M,N]。
2.3 基于PCA的特征融合
X中包含多尺度多方向的纹理特征,其中存在相当的冗余特征不利于模式分类,同时特征组过大也会大大降低识别效率,因此研究对于特征集X进行主成分分析,以便消除特征组之间的冗余信息。主成分分析(Principal Component Analysis,PCA)把多个变量化为少数几个主成分,这些主成分能够反映原始变量的大部分信息并表示原始变量的线性组合,为使得这些主成分所包含的信息互不重叠,要求各主成分之间互不相关[16-17]。
主元分析法的目标是在保证星标的纹理信息丢失最少的前提下,其寻找一组新变量来替代原变量,且新变量是原变量的线性组合,对于特征集为X,对其进行主成分分析时,需要它的协方差矩阵Σ或相关系数矩阵R,本文选择对Σ进行估计,记特征组样本的观测矩阵为:
X的每一行对应一幅图像的全部Gabor滤波组特征值,p=120,记式(7)S为Σ的估计,可从S出发求样本的主成分:
设λ1,λ2,…,λp为S的p个特征值,T=t1,t2,…,tp为相应的正交单位特征向量,则有Σti=λiti,t′iti=1,t′itj=0,其中,i≠j;i,j=1,2,…,p。记Λ为对角线为λ1,λ2,…,λp的对角阵,则
进行如下线性变换:
A为单位向量矩阵,Y=[y1,y2,…,yn]为主元特征集。考虑y1的方差:
当a′1=t1时,y1=t′1x的方差值达到最大,最大值为λ1。称y1=t′1x为第一主成分,以此类推,在约束cov(yk,yi)=0(k=1,2,…,i-1)下可得,当ai=ti时,yi= t′ix(i=1,2,…,p)的方差达到最大,最大值为λi,称yi为第i主成分。分解得到主元模型后,根据式(11)~(12)计算各个主元的贡献率与累积贡献率,并根据累积贡献率选取降维后的主元特征集。
提取后的得到主元特征集Y:Y=[y1y2…yn],n为选取的主成分个数,使n的个数大幅小于p,即实现特征集的冗余信息消除和维数降低。
将降维之后的主元特征集进行后续模式识别分类计算,作为后续SVM分类的输入特征,这样原先p维特征向量被压缩成n维主元特征向量。
3 基于SVM的印刷状态识别
经过PCA分析,可去除掉特征集中的冗余信息以提高计算效率。在研究中,要求准确地识别水量墨量状态,需引入相关的模式识别算法,考虑到SVM(Support Vector Machine)对解决小样本模式分类问题有独特的优势,具有很好的泛化能力,由于印刷生产中不易获取大量样本,SVM恰好适应小样本模式分类,故选其进行分类研究。研究需根据主元特征实现水墨平衡、水量过大或墨量不足、水量过小或墨量过大三种状态的分类,在本文中三类决策状态是SVM的输出向量,将经过降维的n维主元特征向量作为输入集。
SVM的核心思想是通过非线性核映射关系将输入向量映射到一个高维空间中,构造最优分类平面以实现分类。支持向量机对于k类问题分类时,只需要k-1个两类分类器即可解决,在识别过程中选取径向基函数作为SVM核函数,如式(13)所示:
SVM模型中,σ为控制核函数高宽的参数,惩罚参数C主要用于控制错误分类,其选取由具体的问题而定,并取决于数据中噪声的数量。在确定的特征子空间中:C取值小表示对经验误差的惩罚小,学习机器的复杂度小而经验风险值较大;C取无穷大,则表示所有约束条件都必须满足,这意味着训练样本必须准确地分类。每个特征子空间至少存在一个合适的C以使得SVM泛化能力最好[18-19]。核函数参数会直接影响映射关系,其反映样本数据在高维空间分布的复杂程度;惩罚参数可调节置信区间和经验风险比例,提高SVM的泛化能力。本文采用交叉验证(Cross validation)的方法找到适合工况的最优参数,研究将训练集分为K组,将每一组样本依次作为验证集,同时将其余K-1个样本作为训练集,采用KCV交叉验证思想,从而寻找到最优的C和σ的参数值,之后利用完成训练的网络实现对未知样本的判断。
4 实验
4.1 实验条件
实际进行印刷实验,以验证所提出方法的可行性和理论的正确性。实验在纸胶印机上进行(图6(a),胶印机光华650,陕西省印刷包装工程重点实验室);采用普通感光CCD(有效像素1 010万,最高分辨率3 648×2 736)进行图像采集;计算机(处理器Inter®CoreTM2 Duo CPU T6500,2.1 GHz)进行图像的存储和处理,图像的前处理、Gabor滤波、能量方向特征提取、SVM网络的训练等所调用的程序均在Matlab环境下编写。研究通过人为操作印刷机,分别调节进墨量和上水量,造成水量过大墨量不足、水量不足墨量过大以及水墨平衡三种印刷状态,根据印张的实际水墨供给印刷状态,通过密度计反复测量印刷色彩控制条,获取训练样本与验证样本并保证样本的正确性。
根据图1星标进行CTP印版制作,制版完成后上机印刷,分别按照KCMY(黑青品黄)色序印刷并进行套印,部分印刷品如图6(b)所示,得到印刷品之后进行后续图像处理与分析。图6以品红色为例,记录了部分印刷标识,7(a)~(c)分别是水量不足与墨量过大、水量过大与墨量不足、墨量适中三种状态的星标,分别从印品中选取训练样本集和验证样本集每种状态各30个,共计2×3×30=180个样本。
4.2 纹理特征提取分析
图6 实验设备及印刷品样张
图7 部分印刷检测星标样本
从原始特征集中每一个样本中提取一个120维特征向量,通过对特征集进行主成分分析,可得到其主成分分量,根据累计贡献率来选取合适的维数。对训练样本的120维特征向量矩阵进行主成分分析,其累计贡献率如图8所示:经过PCA处理之后,按照式(11)~(12)计算相应累积贡献率,发现仅第一主元贡献率已达到96.23%,到第二主元其累积贡献率已达到97.60%,在第五个主元处超过99%,为了有效降低维数并不丢失信息,选取前5个主元来替代原始120为特征向量,这样极大地减少了特征信息量从而提高了计算效率。前5个主元的累积贡献率已经达到了99%以上,说明其中已包含了特征集中主要的信息,虽然信息略有丢失,但相对于120维原始特征而言,简化了SVM输入集,由于累积贡献率较高,故未造成识别率明显下降。
图8 Gabor纹理特征的累积贡献率
4.3 实验结果分析
在完成了图像的采集、特征的提取和PCA分析之后,可从每一幅原始图像中获取一个5维主元向量,以此作为状态最终识别的特征向量,在识别前对特征集进行标准化,以训练集训练网络并用验证集验证识别效果。研究在Matlab环境下进行,参数设定K=5,经过参数交叉对比验证后,寻找到最优惩罚参数C=32,核函数参数σ=0.125,结果记录在表1中,而表2则详细记录了每种状态的识别情况。
表1 识别结果
表2 识别率分析
从识别结果可以发现,当n=5时,即120维原始特征集降维为5维特征之后,星标平均准确率可达90%以上,符合一般实际生产要求,远高于一般灰度能量分析分类的结果。
表3为按照第2章内容描述采用灰度能量特征进行星标识别的结果,其整体识别率与本文方法相比明显偏低,认为这主要是由于光照因素、纹理的复杂程度导致。表2中反映出了识别产生错误的情况,可以发现主要的错误出现在墨量偏大与墨量适中两种情况之间,这是由于实际生产中两种纹理过于接近所致,这种错误发生时说明印刷品状态介于二者之间,对实际生产影响较小,可通过增加滤波尺度适度提高,但会降低计算效率。
表3 基于灰度特征的识别结果
5 结论
研究以实现印刷机水墨状态的自动判断为目的,针对星标进行了图像处理、纹理特征分析与状态模式识别,进行了现场印刷实验,验证了可行性,主要结论有:(1)通过对星标图案的二维Gabor滤波分析,得到了其幅度谱特征和相位谱特征,结合主成分分析,大大降低了原始纹理特征集的维数,证明了PCA对于基于二维Gabor相关的纹理特征集有着很好的维数降低和冗余信息排除作用,可在实际工况中提高识别效率。(2)通过基于纹理特征的GATF星标模式分类,实现了印刷机墨量大小的自动识别,可替代人眼观察且拥有较高的准确度,弥补了灰度特征分析在星标识别时易受光源影响、识别率低的不足。(3)在利用支持向量机分类的过程中,通过交叉验证的方法,在印刷标识的决策网络的建立中实现了参数的最优选取,保证了小样本条件下识别网络的分类与泛化能力,最终实现了水墨状态的模式分类。
本研究设计了一套印刷星标识别方法,可通过一般图像采集设备快速判断水墨状态,从而为印刷机调试提供参考。研究对于提高印刷生产的自动化程度、降低印刷中的人工经验依赖程度有着重要意义。
相关方法存在以下不足:(1)由于水墨量耦合关系较强,目前实际生产中缺乏相关测量理论与技术,研究对水墨量大小进行了自动判断,但尚未实现对其精确的定量测量。(2)本方法目前可在印刷车间替代人工目测判断,但依然处于离线监测阶段,开发出与印刷机结合的在线监测系统可进一步提高工作效率,也将是后续研究的重点。
[1]Koivula H,Kamal A lm H,Toivakka M.Temperature and moisture effects on wetting of calcite surfaces by offset ink constituents[J].Colloids and Surfaces A:Physicochem ical and Engineering Aspects,2011,390(1/3):105-111.
[2]王仪明,蔡吉飞,赵吉斌.高速胶印机关键技术研究现状及进展[J].中国机械工程,2007,18(10):1255-1263.
[3]Maind S D,Chattopadhyay N,Gandhi C,et al.Quantitative evaluation of europium in blue ballpoint pen inks/ offset printing inks tagged with europium thenoyltrifluoroacetonate by spectrofluorometry and ICP-AES[J].Science and Justice,2008,48(2):61-66.
[4]Zhang Haiyan,Ren Linghui,He Yanling.dynamic simulation of offset printing inking system based on undirected graph[C]//2009 ETP/IITA World Congress in Applied Computing,Computer Science,and Computer Engineering,Sanya,China,2009:193-196.
[5]Shen Wei,Hutton B,Liu Fuping.A new understanding on the mechanism of fountain solution in the prevention of ink transfer to the non-image area in conventional offset lithography[J].Journal of Adhesion Science and Technology,2005,15:1861-1887.
[6]张海燕,闫海滨,赵庆海.印刷机着墨量在线监测的新方法研究[J].传感技术学报,2006,19(1):258-260.
[7]管力明,陈梅.胶印润版液膜厚动态检测技术研究[J].包装工程,2007,28(1):58-64.
[8]Ren Linghui,Liu Kai,Zhang Haiyan.Printing machine condition monitoring based on printing image texture[C]// 2011 International Conference on Mechanical Engineering and Technology,London,UK,2011:267-269.
[9]刘东昌,王欣刚,李锐.基于纹理分析的张数检测算法[J].中国图象图形学报,2011,16(3):413-419.
[10]Bovik A C,Clark M,Geisler W S.Multichannel texture analysis using localized spatial filters[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,55(12):798-805.
[11]Arivazhagan S,Ganesan L,Prival S P.Texture classification using Gabor wavelets based rotation invariant features[J]. Pattern Recognition Letters,2006,27(16):1976-1982.
[12]刘金平,桂卫华,牟学民,等.基于Gabor小波的浮选泡沫图像纹理特征提取[J].仪器仪表学报,2010,31(8):1769-1775.
[13]王宪,陆友桃,宋书林,等.基于Gabor小波变换与分块PCA的人脸识别[J].计算机工程与应用,2012,48(3):176-180.
[14]Granlund G H.In search of a general picture processing operation[J].Computer Graphics and Image Processing,1978,8(2):155-173.
[15]练秋生,陈书贞,刘春亮.融合Gabor小波能量与方向特征的掌纹识别算法[J].仪器仪表学报,2008,29(3):556-561.
[16]张勇,陈莉.聚类与PCA融合的特征提取方法研究[J].计算机工程与应用,2010,46(11):148-153.
[17]Perlibakas V.Distance measures for PCA-based recognition[J].Pattern Recognition Letters,2004,25:711-724.
[18]奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3):123-125.
[19]Burges C J C.A tutorial on support vector machines for pattern recognition[J].Data mining and Know ledge Discovery,1998(2):121-167.
XU Zhuofei1,ZHANG Haiyan2,XU Qianqian2,XIANG Chen2
1.School of Mechanical and Precision Instrument Engineering, Xi’an University of Technology, Xi’an 710048, China
2.School of Printing and Packaging Engineering, Xi’an University of Technology, Xi’an 710048, China
Printing label is the main way to monitor the state of ink balance. As the control for printing ink balance mainly depends on human experience, there are some problems such as strong subjectivity and low efficiency. In this study, the digital image processing and pattern recognition algorithm are used to solve the problem mentioned above and realize the automatic monitoring and identification of the balance of ink and water. The feature of printing label is abstracted with a 2D-Gabor filter and analyzed with a principal component analysis. SVM nets are trained to identify the statement of water and ink with the result of PCA and it has a qualified accuracy in application. This study has a significant in reducing the debugging time and cost of equipment. Both the quality and automation degree of printing will be improved.
printing label; 2D-Gabor filtering; ink-water balance; Support Vector Machine(SVM); Principal Component Analysis(PCA)
XU Zhuofei, ZHANG Haiyan, XU Qianqian, et al. Study on automatic identification and texture analysis with Gabor filtering for printing label. Computer Engineering and Applications, 2014, 50(17):230-235.
A
TS825;TH17
10.3778/j.issn.1002-8331.1310-0122
国家自然科学基金(No.51275406);陕西省自然科学基础研究计划项目(No.2013JM 7009);陕西省教育厅科学研究计划项目(No.2013JK 1030)。
徐卓飞(1985—),博士研究生,主要研究方向为印刷图像处理技术、机械故障测试与诊断。E-mail:xzf_34216606@163.com
2013-10-14
2013-12-20
1002-8331(2014)17-0230-06
CNKI网络优先出版:2014-03-12,http://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1310-0122.htm l