基于PCA的彩色印刷图像色彩分割算法
2016-11-17李向阳
郭 健,李向阳,哀 薇
(华南理工大学 自动化科学与工程学院,广州 510641)
基于PCA的彩色印刷图像色彩分割算法
郭 健,李向阳,哀 薇
(华南理工大学 自动化科学与工程学院,广州 510641)
针对彩色图像的印刷过程中,原图像的色彩分割问题,提出了基于PCA(主成分分析)并结合其它典型彩色图像分割方法的新分割算法;该算法首先利用PCA算法把图像分解为主特征分量和残特征分量两分量图;然后采用二次分水岭算法对残特征分量图进行分割;利用K-Means算法对主特征分量图进行聚类初分割,接着对聚类初分割后的图像进行相似色彩区域融合;最后把分割后的两分量图的进行融合,得到最终的分割结果图;该算法可以应用于彩色印刷图像的色彩自动分割和彩色印刷过程的自动色彩控制中。
色彩分割;主成分分析;分水岭算法;K均值聚类
0 引言
在彩色图像印刷系统中,被印刷图像(原图像)的色彩提取和区域分割是实现自动彩色油墨配置和色彩浓度控制的前提。印刷图像中包含有丰富的色彩和轮廓及纹理特征,各种色彩的区域面积不均衡,需要避免因区域面积不均衡而造成纹理区域被更大区域“吞并”现象;同时,通过成像设备获取图像不可避免含有噪声,分割算法必须对噪声有很好的滤除能力。典型的图像分割算法各有优缺点,单独使用并不能适合印刷图像分割。例如,K-Means算法存在易受噪声和孤立点影响的问题;分水岭算法对图像的梯度变化很敏感,可以用于色彩渐进过渡的印刷图像分割,但是容易造成过分割;基于图论的分割算法,由于需要人工参与确定前景和背景,不满足自动分割的要求;基于区域生长和区域分裂合并的分割算法也存在需要人工确定种子点的缺陷。
为了综合利用现有典型算法的优点,本文应用主成分分析(principal component analysis,PCA)算法对原图像进行主成份分解,然后针对分解后的图像应用典型的图像分割算法,最后把分割后的不同成份图像分量进行融合,从而实现对原图像的分割。
1 基于PCA的图像特征分解
假设数据集在维空间中有个样本,PCA的核心思想是利用K-L变换对数据集的阶协方差矩阵进行正交特征分解,求出协方差矩阵的n个特征值;接着求出矩阵的n个特征向量,这n个特征向量构成了n维空间的标准正交基;然后将数据集投影到这n个标准正交基上。特征值的模代表数据集在每个基上的的投影长度;特征值越大,说明数据集在对应特征向量上的方差越大,信息量越多。前个最大特征值对应的投影分量包含了主要特征,而最小特征值上对应的投影信息量很小,主要包含了细节特征。对一幅有M个像素点的彩色图像而言,每个像素点都可以看作是一个3维向量,X=[x1,x2,x3]如果在RGB色彩空间中,则x1,x2,x3分别代表图像的3个颜色分量R、G、B。对图像做K-L变换的基本思想是通过求分量x1,x2,x3间的协方差矩阵Cx=[cov(xi,xj)]的特征值及特征向量ui。用特征向量ui组成正交矩阵Φ=[u1,u2,u3]T作为变换矩阵,将[x1,x2,x3]变换到正交系[y1,y2,y3]。
对印刷图像做K-L变换的步骤如下:
Step 1:对M个像素点的X=[x1,x2,x3]计算各分量的均值
(1)
然后对每个像素点求xi-uxi(i=1,2,3),这等价于将[x1,x2,x3]的原点移至像素点中心。
Step 2:计算协方差矩阵
E[(xi-Exi)(xj-Exj)T]=
(2)
Step 3:根据|λI-Cx|计算协方差阵Cx的特征值并降序排列为λ1>λ2>λ3和对应的特征向量u1,u2,u3。将特征向量ui作为行向量构成正交变换矩阵Φ=[u1,u2,u3]T。
Step 4:通过y=Φ·x将像素点投影到特征向量上[u1,u2,u3],求出y=[y1,y2,y3]。
经过上述变换后,图像的协方差矩阵Cx变为对角阵,y1,y2,y3之间相互独立,K-L变换去除了分量间的相关性。对图1(a)的原图像做K-L变换,得到正交系[y1,y2,y3]的分布如图2所示。
图1 PCA分解后的成分图
图2 K-L变换
从图2可以看出,在y1和y2上的投影包含了图像主要特征,而在y3上的投影包含图像的纹理特征,图1的(b)、(c)和(d)为根据PCA算法在y1,y2和y3上的投影后的第1成分图、第2成分图和第3成分图。为了后续叙述方便,把较大特征值的投影图称为主特征分量图,在图2中是第1成分图和第2成分图;最小特征值的投影图称为残特征分量图,在图2中是第3成分图。分别对主特征分量图和残特征分量图采用不同的分割算法,首先对残特征分量图进行分割,然后对剔除残特征分量图后的主特征分量图进行分割,最后融合两部分分割结果。
由图1(d)可以看到,在残特征分量图中,纹理特征具有较大的投影值,而其他点则相对较暗。因此只需对残特征分量图进行合适的阈值分割就可以获得图像绝大部分的纹理特征,采用最大类间方差算法(OTSU),并自适应地确定阈值可以实现第3分量图的二值化,从而提取出图像的重要纹理特征。
OTSU算法把图像阈值化为只包含前景和背景的一幅二值图像。其核心思想是选取最佳阈值使得前景和背景的类间方差最大,类内方差最小。对第3成分图二值化后的结果如图3所示。
图3 阈值化图
最终所得到的二值图包含了图像主要的纹理特征。由以上结果可以看出,图中纹理特征丰富的区域(如脸部)最后被分割出来。
2 残特征分量图分割
经PCA分解后的残特征分量图包含丰富的纹理特征,图像中的梯度变化较大,分割算法必须对图像中的梯度变化有良好的响应,分水岭算法能较好地适应具有该图像特征的图像分割。分水岭算法是一种基于拓扑理论的数学形态学的分割算法,模拟了集水盆中漫水筑坝的过程,较经典的实现是Luc Vincent和 Pierre Soille提出的基于梯度图的分割,其基本思想是对彩色图像先求其梯度图,然后对梯度图进行漫水筑坝。针对分水岭算法对图像存在过分割情况,本文提出了二次分水岭分割算法。在初次分水岭分割图的基础上,对分割后的梯度图做形态学闭开平滑,然后再进行第二次分水岭分割,最后对二次分水岭的结果进行适当的小区域合并,该方法较好地解决了过分割的问题,结果如图4所示。
图4 残特征分量分割图
3 主特征分量图分割
图1中的第1成分图和第2成分图是经过PCA分解后的原图像的主特征分量,对于原图像的主特征分量图,首先利用K-Means聚类分割算法对主特征分量图的进行初分割。由于实际印刷过程中图像可印刷的色彩种类有限,K-Means算中的值取为实际印刷色彩上限。若原图像的实际色彩种类大于上限,则表明该彩色印刷机不能完成原图像的印刷任务,需要更换可印色彩更多的印刷机或者采用在同一印刷机上进行多次印刷。若图像实际色彩种类小于上限,则经过初分割之后,图像中可能还存在色彩相近的区域,因此还需要进行相似颜色区域的融合。
K-Means的基本原理是随机选取图像中的个点作为初始聚类中心点,而后迭代求取图像中最优聚类中心和最优分类,使得(3)式定义的误差平方和准则函数值最小。
(3)
其中,Mj是属于类Cj的所有点的均值,xi是属于类Cj的点。K-Means算法的计算过程如下:
Step 1:给定包含n个点的图像,随机选取K个初始聚类中心Z(I)=(z1,z2,…,zk),j=1,2,3,…,k,其中I是迭代次数标志,初始化为1;
Step 2:计算每个点到聚类中心距离d(xi,Z(I)),如果d(xi,zj)≤min{d(xi,Z(I))},则xizj;
Step 3:计算误差平方和准则函数Jc:
(4)
上述过程结束后,图像的初分割已经完成,然后检查如色彩相似性,对于极相似的色彩要进一步色彩合并和融合。对于初分割形成的区域,本文采用色彩的欧式距离度量作为区域融合的度量标准,实现区域融合的具体步骤如下。
Step 1:取初分割图像的一个区域xi做为第一个类簇Cm|m=1;
Step 2:计算下一个区域xi+1到所有类簇Cj(1≤j≤m)间的欧式距离d(xi+1,Cj),并取得最小值d(xi+1,Ck)=min1≤j≤md(xi+1,Cj),若d<θ,则Ck={xi,xi+1},并且更新Ck为所有成员的均值;否则新建类簇Cm+1={xi+1};
Step 3:重复2直到所有区域迭代完毕。
区域融合过程中的相似性度量阈值根据经验取为θ=50,上述过程的分割效果图如图5所示。
图5 主特征分量分割图
4 特征图像分割后的颜色融合
经过主特征分量图和残特征分量图的分割后,把主特征分量的分割图和残特征分量的分割图再融合得到图像的最终分割图,如图6所示,共分割成7种不同颜色,用于配置印刷机的油墨色彩和生成印刷图案。
5 对比实验
对于图1(a)的原图像,实验对比了本文算法与SLIC算法、传统K-Means算法、分水岭分割算法,图7分别给出了它们的色彩分割结果图。
图7 分割对比图
从图7可以看出,SLIC算法分割效果不理想,不符合人眼的视觉分割效果;K-Means算法和分水岭分割算法丢失了图像的部分特征,分割结果也不理想,不能应用于彩色图像的印刷控制中。本文提出的算法很好的满足了印刷图像色彩分割的需求,明显优于其他分割算法,适合彩色图像的印刷控制。
6 结论
针对彩色印刷图像的色彩分割问题,本文提出了基于PCA的彩色图像分割算法,该算法能够结合了现有典型算法的优点,实验结果表明本算法的图像分割效果较好地符合人眼的视觉分割效果,能够很好的适用于印刷图像的色彩控制。
[1]Chen B, Harrison R, Pan Y. Novel Hybrid Hierarchical-K-means Clustering Method (H-K-means) for Microarray Analysis [A]. Proceedings of the 2005 IEEE Computational Systems Bioinformatics Conference Workshops (CSBW’05).[C]. 2005: 105-108.
[2]Tapas Kanungo, Nathan S. Netanyahu. An Efficient k-Means Clustering Algorithm: Analysis and Implementation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 881-891.
[3]Fan J P. Automatic Image Segmentation by Integrating Color-Edge Extraction and Seeded Region Growing [J]. IEEE Transactions on Image Processing, 2001, 10(10): 1454-1466.
[4]吴夙慧.K-Means算法研究综述[J].知识组织与知识管理,2011,205(5):25-35.
[5]孙吉贵.聚类算法研究[J].软件学报,2008,19(1):48-61.
[6]林开颜.彩色图像分割方法综述[J].中国图像图形学报,2005,10(1):1-10.
[7]何 俊.图像分割算法研究综述[J].计算机工程与科学,2009,31(12):58-61.
[8]张武强,穆瑞辉.基于模糊K均值和节点位置的负载均衡传感网路由策略[J].科学技术与工程,2013(1):912-916.
[9]柯尊海,刘 勇,徐义春,等.基于改进K均值的运动目标检测算法研究[J].三峡大学学报:自然科学版,2012,24(6):98-102.
[10]张 靖,段 富.优化初始聚类中心的改进K-Means算法[J].计算机工程与设计,2013,34(5):1691-1694.
[11]任 磊,赖惠成,陈钦政,等.基于改进K均值聚类与HSV模型的棉花分割算法[J].计算机工程与设计,2013,34(5):1772-1776.
[12]王雪光,陈淑红.基于K均值聚类的成熟草莓图像分割算法[J].农机化研究,2013,35(6):51-54.
[13]王联国,韩晓慧,宋 磊.基于改进混合蛙-K均值聚类算法的无功电压控制分区[J].传感器与微系统,2013,32(6):18-21.
Color Segmentation of Color Printing Image Algorithm based on PCA
Guo Jian, Li Xiangyang, Ai Wei
(School of Automation Science and Engineering, South China University of Technology, Guangzhou 510641, China)
To solve the color image segmentation problem in the color image printing process, a new segmentation algorithm is proposed based on PCA and combined with other typical image segmentation algorithms. According to the proposed algorithm, firstly PCA is used to decompose the original image into two parts; secondly, the K-Means algorithm is used to divide the primal part of image and then twice-watershed algorithm is used to divide the remnant part of image; finally, the segmented images are got by merging the two kinds of segmentation images. This proposed algorithm can be applied to color printing image segmentation and automatic color printing control during the process of color image printing.
color segmentation; PCA; watershed; algorithim; k-means clustering
2015-09-15;
2015-11-11。
郭 健(1990-),男,硕士研究生,主要从事图像处理和印刷控制系统方向的研究。
李向阳(1969-),男,副教授,主要从事学习控制和嵌入式系统方向的研究。
1671-4598(2016)03-0211-03
10.16526/j.cnki.11-4762/tp.2016.03.057
TP391
A
哀 薇(1979-),女,副教授,主要从事数据驱动控制方向的研究。