基于优化初始中心的加权K?均值彩色图像聚类算法分析
2020-09-23何芳州
何芳州
摘 要: 超像素作为一种图像预处理技术,在计算机视觉领域中得到了广泛的应用。该文研究的重点就是基于优化初始中心的加权K?均值彩色图像聚类算法的具体应用,针对单板彩色图像,提出一种基于彩色RGB空间通道的K?均值优化初始中心聚类分割方法,并与SLIC进行了分析,得到一种新的SLIC算法(WKK?SLIC算法)。该算法是基于优化加权K?means聚类初始中心点为基础,对彩色图像进行分割处理。在该算法中,通过运用密度敏感相似度对空间像素点密度生成聚类初始中心完成计量,所得聚类结构较稳定且经试验结果表明,在进行图像分割时该算法各方面的性能都要优于其他算法,具有更高的稳定性与准确性。
关键词: 彩色图像; 聚类算法; 加权K?均值; 优化初始中心; 图像分割; 试验分析
中图分类号: TN911.73?34 文献标识码: A 文章编号: 1004?373X(2020)18?0026?04
Abstract: As an image preprocessing technology, the super?pixel has been widely used in the field of computer vision. The specific application of the weighted K?means color image clustering algorithm based on optimized initial center is the emphases for the research. In allusion to single?board color images, a K?means optimized initial center clustering segmentation method based on color RGB spatial channel is proposed and analyzed with SLIC, and a new SLIC algorithm (WKK?SLIC algorithm) is obtained. The algorithm is based on the optimized initial center points of weighted K?means clustering as the basis, so as to conduct the segmentation process for color image. In this algorithm, the clustering initial centers of spatial pixel density are generated to complete the measurement by using density?sensitive similarity. The obtained clustering structure is stable, and the experimental results show that the performance of this algorithm is better than that of other algorithms in the image segmentation, and it has higher stability and accuracy.
Keywords: color image; clustering algorithm; weighted K?means; optimized initial center; image segmentation; test analysis
0 引 言
图像分割是图像处理到图像分析中一个非常重要的技术,在图像技术中一直是被人们所关注的重点和难点,在计算机视觉领域是首要解决的问题。在图像分割中,目标识别、特征提取和测量都是非常重要的步骤,处理的结果决定了图像分割的质量。随着计算机网络的迅速普及,人们接触的信息越来越多,彩色图像比灰度图像能够表现出更加丰富的内容。彩色图像处理技术中,最重要的一个关键内容就是彩色图像分割。
1 基于特征加权的改进K?均值聚类算法
1.1 初始聚类中心选择算法
在运用传统K?均值计算方法中,通过选择初始聚类中心计算所得的随机性,会对所得结果产生必然影响,该算法初始中心搜索时会将一些特殊孤立点作为聚类中心,影响聚类结果的准确性。为了提高聚类结果的准确性,通过一种初始聚类中心算法,得到与数据相同的初始聚类中心,从而得到最佳的结果。初始聚类中心的算法可以分阶段进行[1]。
1.1.1 数据预处理
标准预处理公式如下:
1.1.2 去除孤立点
计算数据集X中,数据对象之间的距离,去除与其他数据对象的孤立点,得到数据集X*。
1.1.3 找到k个初始聚类中心
针对数据集[X*]中的不同数据对象距离进行计算,需要找出相邻的数据对象,构成集合[X*1],通过将[X*]中取出数据对象,寻找最小距离的数据对象[xi],之后重复步骤直至所得的集合数据[X*1]对象数目超出设定阈值计算结束,集合所得的数据对象[X*1]。重复上述步骤,直到得到k个初始聚类中心[2]。
1.2 改进的K?均值聚类算法
1.2.1 权值计算
在一个数据集合内包含多个数据对象,且每一个数据对象所起到的作用有所不同,为了区别这些不同之处,需要给每一个对象进行赋值。采用特征权重设置方法,对此类特征赋予一致的特征权重,需要根据差异特征设置各自权重,公式如下:
式中:X表示数据集;Xi表示第i类数据集;x表示数据对象;Eir表示方差;wir表示权重;ck表示中心向量;cir表示第r个特征;xj表示第j个特征;[Card(Xi)]表示元素个数。
特征权重wir可以表示为:
式中:h为常数,取值为12。为了防止因Eir过大而影响[exp(-h·Eir)]快速收敛的值,因此需要对数据进行标准化处理。
1.2.2 改进的K?均值聚类算法描述
确定初始聚类中心算法及权值计算方法,提出有关初始中心加权K?均值聚类优化算法,主要计算思想即针对每类对象完成权值计算,并向数据集的每个对象赋予相似性,重复以上操作,最终可得收敛函数的过程[3]。具体方法为输入待处理的数据集、聚类个数、阈值,输出聚类。
为了验证改进后的聚类算法,对传统K?均值算法以及改进后的特征加权K?均值算法进行对比,测试结果如表1所示[4]。
从表1可以得到,随机选择的初始聚类中心K?均值算法,聚类结果的准确率较低,且不够稳定;改进后的聚类算法得到的聚类结果准确率最高达到95.15%,准确率相对较为准确,更加适用于对实际数据的聚类。
相较传统的K?均值算法所得聚类结果存在的误差大、不稳定特点,通过运用本文提出的经改进特征加权K?均值聚类算法结果能够得出更高的准确率,经过与处理数据结合的主要分布特征,对初始聚类中心加以确定并运用改进算法,所得聚类结果稳定,减少了噪声和孤立点对实验所带来的影响[5]。
2 基于优化初始中心的加权K?均值彩色图像聚类算法分析
2.1 彩色图像分析
随着计算机处理技术的不断提高,人们对彩色图像的分割关注度越来越高,充分利用彩色图像的彩色信息进行图像分割,可以使用模糊类方法、聚类以及边缘检测等方式实现彩色图形的分割。本节所重点介绍的就是使用K?均值聚类图像的自动分割,完成对彩色图形的聚类。
为了降低计算的复杂性,可以使用RGB彩色空间的方式对彩色图像进行处理。在RGB彩色空间中,通过红绿蓝三种颜色得到多单板图像分析。
RGB图像由三种分量图形组成,原色对应一个分量图像,共同組成彩色单板图像。
利用图像的彩色信息,完成对图像的分割,对图像中的颜色进行研究。观察绿色传送带和白色单板之间的颜色变化,在R通道中,绿色和白色的像素差值明显,为(0,255)。在此基础上,对单板图像中的单板颜色做进一步分析,通过采样点的方式分析颜色值,观察图像中采样点的分布情况。采样点的颜色值如表2所示。
通过采样点的颜色值和传送带颜色采样表的结果,采用RGB彩色空间与采样点相结合的方式对图像进行分析,发现在图像中,目标颜色值与背景颜色值在R通道中的差异较大,在G通道和B通道中差异不明显。因此,针对差异较大的R通道进行图像分割分析[6]。
2.2 基于R通道聚类方法的彩色图像分割
2.2.1 基于OTSU阈值化
从RGB图像中得到R通道分量图像,利用灰度图像的OTSU算法进行图像分割。
假设图像的像素总数表示为M,范围为[0,L-1],则概率公式可以表示为:
将图像中的像素按照灰度值将其分为两类,R1对应[0,T-1]的像素,R2对应[T,L-1]的像素,则R1与R2之间的概率可以表示为:
T在[0,L-1]的范围中递增,当[σ2]最大时,对应的T阈值最佳。利用OTSU算法进行图像分割可以得到如图1所示的结果。
根据单板的颜色变化,一些目标区域可能会被误分割,无法得到较为理想的分割结果。针对此种情况,使用OTSU分割结果显然无法达到图像分割的要求。因此,可以尝试使用加权K?均值聚类的方式进行彩色图像分割,以提高图像分割的效果。
2.2.2 加权K?均值聚类算法
超像素是一种图像预处理技术,在计算机视觉领域中应用较为广泛,简单线性迭代聚类(SLIC)算法是一种图像预处理技术框架,该算法主要是根据像素的颜色和距离完成聚类,对其进行分割并得到较好的结果。但是该算法在实际的应用中依然存在一些问题,基于此,提出了一种基于优化初始中心的K?均值聚类算法(WKK?SLIC算法),通过运用该算法能够对像素点间密度结果运用密度敏感相似方式完成计算,所得结果形成K?means聚类的初始中心,保证所得聚类结果的稳定误差效果[7]。
WKK?SLIC算法以加权K?means聚类算法的目标函数和归一化割为基础来表示目标函数之间的关系,用p,q表示聚类像素点;K表示聚类数量,则加权K?均值的目标函数可以表示为[8]:
式中:w(p)表示权重;[πk]表示像素点到高维空间的函数。
加权K?means的目标函数可以通过迭代的方式进行最小化,在归一化割中,每一个像素点都可以表示节点。
SLIC算法实际上就是K?means算法的一种快速优化方案,在实际的应用中存在以下缺陷:要事先定K值,但是通常来讲无法轻易确定K值。再加上初始聚类中心敏感性,初始中心不同造成的聚类结果均有不同。对于存在的这些问题,容易出现图像像素点不稳定情况,最终发生无法分割及欠缺分割问题,对此应当对图像像素点密度计算中,运用密度敏感相似性度量方式,可以更好地得到初始聚类中心图形的分割效果。
基于密度初始化中心算法,其计算思想为:通过图像像素点集合所得像素点为初始中心,集中像素点中取出像素点领域的所有像素点,并按照相同的方式得到第二、第三,甚至更多的初始中心点。可以将其描述为:计算所有的像素点密度,得到初始化中心点集;视结果中最大密度的像素点为首个初始中心点,并在初始中心点集M中添加多个像素点,由像素点集中取出,对邻域像素点确定后去除像素点。重复以上步骤直至所得中心点集内含有K个中心点,输出所得的初始中心点集M即完成整个计算过程[9]。在SLIC算法的框架基础上,结合介绍过的内容,对优化加权K?means聚类初始中心点的分割算法进行描述。
3 试验结果与分析
优化加权K?means聚类算法得到的图像分割结果如图2所示。图2a)为原图,图2b)~图2d)为不同像素时的分割结果。与SLIC算法相比,该算法可以生成规则的超像素,并且在有限的像素点中没有出现欠分割的情况发生。
为了对该算法进行具体比较和分析,需要对其进行进一步的实验,采用边缘贴合度的方式,对边缘召回率和欠分割错误率进行评估,得到的对比结果如图3所示。图3a)的目标超像素明显比WKK?SLIC算法的欠分割错误率高,WKK?SLIC算法具有更高的边缘召回率。
4 结 语
在原始SLIC算法框架的基础上,将图像的像素点进行映射,并引入核函数得到相似性度量,使用基于初始化中心的算法对初始化聚类中心进行计算,并提出了一种基于优化加权K?means聚类初始中心的彩色图像分割算法,通过该分割算法所生成的超像素规则以及分割的结果都可以更好地保证图像的属性。根据实验结果可以得到,本文所介绍的基于优化加权的K?means聚类算法在进行图像分割方面能够得到更好的分割效果。
参考文献
[1] 杨艳,许道云.优化加权核K?means聚类初始中心点的SLIC算法[J].计算机科学与探索,2018,12(3):494?501.
[2] 阮威.基于动态粒子群优化与K均值聚类的图像分割算法[J].信息技术,2018,42(10):126?130.
[3] 李玉倩,胡步发.K?均值优化初始中心聚类单板图像的分割[J].机械制造与自动化,2018,47(1):208?212.
[4] 王日宏,崔兴梅.融合集群度与距离均衡优化的K?均值聚类算法[J].计算机应用,2018,38(1):104?109.
[5] 薛印玺,许鸿文,李羚.基于样本密度的全局优化K均值聚类算法[J].计算机工程与应用,2018,54(14):143?147.
[6] 李立军,张晓光.基于动态粒子群优化与K?means聚类的图像分割算法[J].现代电子技术,2018,41(10):164?168.
[7] 茆汉國.基于K?均值与AGNES聚类算法的校园网行为分析系统研究[J].现代电子技术,2016,39(23):116?120.
[8] 吴焕丽,崔可旺,张馨,等.基于改进K?means图像分割算法的细叶作物覆盖度提取[J].农业机械学报,2019,50(1):42?50.
[9] 丁明月,庄晓东.基于数据融合的K均值聚类彩色图像分割方法[J].青岛大学学报(工程技术版),2018,33(2):42?46.
[10] 汪方正.基于狼群算法优化的FCM图像自动分割[J].控制工程,2018,25(9):1727?1732.