基于多特征融合的彩色印刷图像识别算法
2018-12-22熊丽珍何慧琴罗文琪舒忠
熊丽珍,何慧琴,罗文琪,舒忠
(荆楚理工学院,荆门 448000)
0 引言
为获得高质量的彩色印刷品,检测控制印刷图像的颜色和纹理是非常关键的。
2007年以来,Labate D团队研究人员陆续发表了关于Shearlet数学理论及Shearlet变换在图像处理中应用的系列论文[1],取得一系列重要的基础性研究成果。在多尺度几何分析中,只有他们提出的Curvelet能满足与Shearlet相似的稀疏性[2],通过Shearlet的方向数目在每一个尺度加倍,使得Shearlet实现了像小波一样的迭代算法,且推广到了经典的级联算法。近几年来,在Shearlet变换应用方面成颇丰,例如:文献[3-4]提出通过Shearlet变换,利用稀疏最优化模型加入迭代阈值进行编码,实现图像去噪处理。文献[5]提出了Shearlet变换耦合频率特征的多聚焦图像融合算法,完成高频子带的融合。文献[6]提出了结合颜色和深度数据的边缘检测算法,实现了针对两幅图像中相同颜色的边缘提取。文献[7]提出了基于BP神经网络的图像边缘检测算法,提高了检测精度及抗噪声能力,等等。
图像识别技术的研究主要是应用于图像检索领域,图像检索技术起源于上世纪60年代。自2010年以来,图像识别技术经过大规模集成化[8]向智能化[9]方向发展。文献[10]以卷积神经网络在图像识别中的应用为基础,提出了采用深度学习模型进行图像检索;文献[11]依据提取图像中层特征并应用训练分类器,提出了局部空间和多特征上下文信息的场景分类技术进行图像检索;有文献依据编码解码思想提出的“单词-句子-错误分析”模型[12]和依据计算机翻译思想提出的“特征提取-句子-单词”模型[13]的图像描述检索技术;文献[14]提出依据对收集到的图像内容数据集,并采用卷积神经网络进行分类,以问题文本方式产生答案的视觉问答技术实现图像识别;文献[15]提出依据机器人环境认知和图像匹配(输入图像与数据库已有图像匹配)数据集,采用空间一致性认证和投票机制的机器人视觉识别技术实现图像检索。
当前,能够与印刷和包装行业现有技术条件接轨的图像检索方式的选择,应以基于内容、颜色和形状等不同特征进行分类的方式为研究基础,毕竟全智能化机器人技术在印刷设备上的应用并不普及。此类技术应用的突出成果是使用颜色直方图来描述图像颜色特征,文献[16]中对早期和近几年来多特征融合图像识别技术应用的主要思想和核心算法进行了论述,同时,提出了一些较为先进的改进算法。选择颜色直方图来描述图像颜色特征的好处还能够较好地满足对一些不易进行分割的印刷图像进行识别。
本文尝试将图像边缘检测和颜色特征提取运用到图像识别中,通过形状与颜色特征结合的方式实现图像检索。在研究中所应用到的一些其他支撑技术,如:图像边缘提取中需要应用到的图像增强、图像分割、图像规范化、边缘轮廓描述、图像对比等算法和颜色特征提取中的印刷图像去加网、颜色空间转换、颜色矩、颜色熵、颜色聚合向量、颜色相关图等算法,将引用一些现有的成熟研究成果。本文研究的关键点是Shearlet变换、颜色直方图和向量机(SVM)技术的综合应用方面,研究目标是在众多的印刷图像中准确找出所需要的某幅图像,研究的意义在于为后续图像色彩控制中识别某个像素点的亮度和颜色信息奠定基础。
1 基于Shearlet变换系数模极大值的图像检测方法实现
Shearlet变化的核心是剪切波的引入,剪切波的本质是傅里叶变换与连续小波变换的有机结合。在剪切波变换中,通过控制剪切参数和平移参数可以实现对剪切波的离散,使之具有频域支撑、空域衰减、方向数目倍增等特性。本文的研究主要是建立Shearlet模极大值数学模型和Ostu最佳阈值选取数学模型。
1.1 Shearlet模极大值数学模型的建立
在文献[17-18]中的相关数学理论研究,形成了小波分析边缘检测数学模型,依据小波模极大值的变化规律(也就是通过模的相位角来确定图像边缘曲线梯度方向),可以得到图像边缘的灰度变化特征。实际上,由于小波模极大值中可能包含有图像噪声信息,在图像检测中,图像边缘的灰度变化结果必定会受到噪声的影响。
由于图像空域衰减,为图像准确地检测图像边缘的几何信息和方向特征提供了便利,且具有很强的自适应性。通过对Shearlet变换中空域衰减造成的方向敏感特性加以应用,利用小波模极大值算法原理,本文提出一种改进的Shearlet模极大值边缘纹理检测算法。其算法数学模型如下:
本文提出的Shearlet模极大值边缘纹理检测算法数学模型,设定图像边缘分解方向数为8(正方形像素中以中心点为原点,分别向四个角和四个边的中心点扩散),求解确定在其中一个方向上的某个点Cn m,j(x,y)是否为模极大值所在的点,可以通过求余函数加以确定,其中,(x1,y1)为起始点坐标,r1(x1)和r1(y1)分别为的横向和纵向开始。
在公式(1)中,x1-r1(x1)、y1-r1(y1),x1-r2(x1),y1-r2(y1)分别表示模极大值所在点的水平和竖直方向的两组坐标偏移量。
以上改进算法,在理论上准确提取了图像边缘方向信息,剔除了噪声,其检测结果准确性在实验部分将进行验证。
1.2 Ostu阈值选取数学模型的建立
Shearlet变换的算法实现需要应用图像分割技术,较早的图像分割方法通常采用直方图双峰法,随后被Ostu方法所替代,Ostu方法是一种基于类间方差最大的自动阈值选择方法。本文通过对Ostu方法进行改进,实现Shearlet变换中的图像分割。
设定:N为图像的总像素数,ni为灰度级i的像素数量,pi为灰度级为i值时的像素概率,则再设定:t为区分图像边缘与非边缘的阈值,则整个图像的灰度级可分为0~t和t+1~L-1两段,图像的平均灰度级可定义为,则图像边缘与非边缘段的平均灰度级分别为,其中,
则可定义原图像灰度级方差为:
1.3 算法的实现过程
(1)输入图像后进行锐化处理。
由于Shearlet变换检测的是图像的边缘区域,因此,首先对输入图像进行锐化处理增强图像的边缘信息是必不可少的。锐化处理的最佳实现方法就是应用Kirsch算子。本文使用的Kirsch算子数学模型建立过程如下:
设定一个以值为I(m,n)的像素点为中心像素点,建立一个3×3邻域的像素方向分布模版(表1所示),形成一个二维矢量,将其定义为F。
表1 像素I(m,n)的3×3邻域示意图
设定p1,p2,…,p8分别表示Kirsch算子的8个方向上的卷积矩阵,定义每个方向之间的夹角为45∘,则有:
根据Kirsch算子的计算原理,设定x=-5,y=3,z=3。
(2)对锐化处理后的图像进行Shearlet变换。
Shearlet变换的核心是使用高斯概率密度函数建立转换模型,使用ME最大期望算法获取Shearlet变换系数集。本文使用的Shearlet变换采用放弃低频信号、迭代强化高频信号的方式突出边缘信息,以确保检测效果。
(3)使用计算获取的最佳阈值检测有效的Shearlet模极大值。
(4)使用Shearlet逆变换对图像进行分割处理并还原分割后的图像。
(5)强化图像边缘,输出边缘检测结果。
2 基于颜色特征图像识别技术实现
印刷图像复制,其色彩控制是必不可少的环节。依据最新的G7工艺质控标准,将灰平衡、Lab值和CMYK网点面积率设定为主要的控制参量,其依据主要是为了便于企业实施。由于每一种颜色所具备的独有特征,本文将依据颜色直方图理论,应用支持向量机(SVM)的多特征融合识别方法,获取印刷图像的颜色特征进行精确检索,为后序实现与印刷原稿进行G7工艺参量比较分析提供技术支撑。
颜色的数学表示可以通过建立颜色空间来实现,因此,颜色模型是实现图像检索的重要基础,在电子显色设备中其主要的颜色参量为色相、饱和度和明度,而印刷图像的颜色空间为CMYK,通常由CMYK四色油墨还原视觉色彩,且具有半色调特性,一定会影响电子显色设备对颜色的表述。为了在计算机显示器中准确地实现印刷图像的颜色显示,必然将面对去加网和颜色模型转换等问题。另外,图像特征提取离不开图像分割,而颜色量化则是图像分割的重要组成部分。当前使用的颜色量化技术主要包括均匀量化和非均匀量化两种。
2.1 颜色特征提取
为了实现在计算机显示器上的印刷图像颜色特征提取,首先必须对印刷图像进行去网化处理和图像模式向HSV模式的颜色空间转换,其转换过程包括CMYK→Lab→HSV模式,中间加入Lab模式的目的是减少图像亮度和颜色信息的损失,从而确保通过颜色直方图获取的颜色特征数据有效。在颜色直方图中,纵坐标表示某种颜色的像素点数量,横坐标表示该种颜色的颜色值。设定一幅图像f(x,y)的大小为M×N,其颜色集为C,则该图像的颜色直方图可以表示为:
HSV颜色直方图提取的关键首先是获取H、S和V三个分量的直方图,然后进行图像主体信息筛选(降低计算量)并实现三分量量化,通过三分量一维化处理后得到图像的整体直方图。在分量量化时,应考到虑印刷图像仅为8位这一因素。在一维化处理的加运算中,H分量需要考虑S和V分量的量化级数,S分量需要考虑V分量的量化级数,V分量取自身量化结果。
2.2 支持向量机(SVM)的原理
SVM分类器的本质是使用一种工具在两种或两种以上的颜色(或纹理)中将其中的一种最大限度地选出来加以标识,当然工具的选择非常重要。在图像识别中,所选用的工具通常就是一条直线(分割线),当然,这条直线是从多条直线中选出的最完美的一条(其选择依据是分割线尽可能离所有分割点越远越好),在对工具进行数学描述时,可以将其定义为判别表达式。由于印刷图像通常为静止状态的平面图像,就必须将图像定义为一个线性分类面。然而,静止状态的平面图像具有非线性的特征,因此,SVM分类器的应用还需要首先将非线性平面映射为线性平面,其实质是核函数转换空间的应用。SVM分类器应用的目的是实现最低误差率的图像颜色(或纹理)识别。其主要数学模型如下:
在原告的资格问题上,存在以下三种立法:(1)一元主义的立法。在法国,只有非婚生子女才能提起强制认领之诉。在日本,只有非婚生子女及其直系晚辈血亲以及他们的法定代理人(代理人并无固有的权利)可以提起诉讼。㊽(2)二元主义的立法。又可分为以下两类:其一,生父和生母主义的立法。在美国,生父和生母均可提起诉讼。㊾其二,生母和非婚生子女主义的立法。在我国台湾地区,非婚生子女本人或其生母或其他法定代理人可以提起认领诉讼(就生母、其他法定代理人的权利,存在固有权和代理权两种解释)。㊿(3)三元主义的立法。在英国,生父、生母、非婚生子女本人均可提起诉讼。
设定原稿图像空间是由 (x1,y1),(x2,y2),(x3,y3),…,(xn,yn)组成,xi∈Rn,yi∈{ }+1,-1,其中,+1表示图像的颜色,-1表示图像的纹理。
分割线的判别表达式可定义为:
线性分类面可定义为:
图1 具有二维特性的向量分类示意图
2.3 SVM分类器的多特征融合识别实现
本文提出的图像边缘提取和颜色特征认别机制,首先是对彩色印刷图像进行灰度处理后,然后进行Shearlet变换提取边缘特征,再对源图像利用颜色直方图提取颜色特征,获取特征数据经过SVM分类处理得到彩色印刷图像的结果信息。SVM分类认别的实现过程如下:
(1)选取好进过灰度处理的彩色印刷图像,利用Shearlet的相关函数对样本图片进行Shearlet,进而进行边缘纹理特征提取;
(2)在对印刷图像进行去网化和颜色空间转换(CMYK→Lab→HSV)的基础上,通过 H、S、V 分量一维化处理,对其进行直方图颜色特征提取;
(4)将第3步中得到的特征和第1步中得到的特征结合起来,在SVM分类器中进行训练;
(5)输入待测试的图像进行比较分析,进而得到彩色印刷图像的识别结果。
其实现流程如下:
图2 用SVM分类器多特征融合识别彩色印刷图像的流程
3 实验结果及分析
3.1 Shearlet变换的图像边缘检测实验
为了验证基于Shearlet变换的图像边缘检测的有效性,选取了六幅目标印刷图像进行仿真实验。实验结果如图3所示,其中,(a1-a6)为印刷图像原稿,(b1-b6)是用Canny算子进行边缘检测的图像,(c1-c6)为文献[7]中提供的边缘检测图像,(d1-d6)是本文法实现的边缘检测的图像。
图3 不同边缘检测算法的实验对比图
本文通过主观和客观两种方式对实验所采用的三种图像边缘提取方法进行比较。主观评判方式是在对提取的图像边缘进行放大后,直接通过视觉感受观察图像局部边缘像素点的分布。观察结果显示:Canny算子提供的6幅图像中边缘像素点较多,表明噪点没有被很好地抑制;通过文献[7]算法提供的6幅图像中边缘像素点有所减少,但也较为明显,表明噪点得到了一定的抑制;通过本文算法提供的6幅图像中边缘像素点最少,表明噪点得到了有效抑制。由于本文实验选择了花卉类图像,此类图像边缘具有分界清晰的特点,边缘像素点数量分布少,因此,采用以视觉感受方式的主观图像边缘强化结果评判是有效的。
客观评判方式采用FOM品质因数指标对边缘检测结果进行评估,三种算法边缘检测通过计算得到的FOM品质因数指标见表2所示,FOM品质因数指标的取值范围是0~1,FOM值越趋于1表示质量越好。
以上实验结果表明:由于Canny算子采用的是一阶偏导的有限差分来计算梯度的幅值和方向,受幅值和方向精度控制等因素影响,因此,细节信息捕捉与边缘线连接效果并没有达到最佳状态;文献[7]算法是以标准图像和传统边缘检测算法检测得到的边缘信息为依据构建的边缘检测BP神经网络,由于受数据来源依据可靠性等因素的存在,从而导致图像边缘强化不够;本文法提出的边缘检测方法,结合了Shearlet模极大值和Ostu阈值优化选取数学建模,提高了灰度级区分度并进一步强化了图像边缘。
表2 FOM品质因数评估
3.2 多特征融合识别实验
为了验证多特征融合识别的有效性,本实验选取100幅花卉类图像进行识别,其中包括图3所示的6幅目标图像。首先对图像进行了像素值标准化处理,并利用HSV非均匀量化成128bin;然后制定三种本文介绍的图像边缘检测方法与SVM分类器融合的图像识别算法比较方案,分别对目标图像按照设计流程进行实验;每次检索输入一幅目标图像,在检索结果中统计正确的图像数目计算6幅目标图像的平均查全率和平均查准率。
表3中统计了使用三种图像识别算法从100幅图像中检索6幅目标图像的平均查全率和查准率,三种算法的主要区别在于采用了不同的边缘检测算法,进一步证实了3.1小节实验中结果的准确性,且查全率和查准率是比较高的,说明了本文提出的颜色直方图SVM分类器识别算法是可靠的。另外,实验中还专门针对BP神经网络边缘检测技术进行了相关实验,在对常规数字图像边缘信息收集精确度较高的情况下,使用该技术进行图像检索查全率和查准率都非常高。
本文提出的算法没有完全实现将查全率和查准率误差控制在10%以内的目标,排除图像边缘特征提取因素之外,与SVM分类器的设计有关,SVM分类器中的颜色分割采用直线工具并没有最大限度地将目标图像区分出来。
4 结语
通过本文的研究发现,Shearlet变换相比于小波变换,具有多方向性和基函数各向异性的优点,所以Shearlet变换不仅可以描述纹理图像更多的方向信息而且还对图像具有更强稀疏表示的能力。为了尽量降低算法的复杂度,从整体算法方面考虑,可以对其中的辅助部分环节采用低计算量运算,而对核心环节的实现采用高计算量运算。当前一些智能化程度较高的图像识别算法优势的体现,必须以准确的图像边缘数据精确提取为前提。实验结果证明了结论的正确性,重要的是验证了本文提出算法的有效性和可靠性。
表3 三种算法的平均查全率和查准率对比
本文主要围绕多尺度几何分析中的Shearlet变换进行研究、分析,并成功地应用于印刷图像识别中,有机融合彩色印刷图像中的颜色特征信息,取得了非常不错的识别效果,但仍然有一些问题需要继续探讨和完善。如算法针对以亮度(或光学密度)为核心的灰度印刷图像识别实现没有准确性依据、特征融合识别增加算法复杂度的缺点、高智能化图像识别算法应用不够等方面。