基于多尺度核模糊聚类的图像分割算法
2023-12-12龙建武
龙建武,陈 都
(重庆理工大学 计算机科学与工程学院, 重庆 400054)
0 引言
图像分割作为图像处理的主要分支,广泛应用于医学图像、遥感图像、目标检测和视频影像处理等领域[1]。目前主要分割算法有阈值[2]、聚类[3]、边缘检测[4]、区域提取[5]等。在聚类方法中模糊聚类,由于其原理简单、收敛速度快,并且具有比硬聚类算法[6]保留更多的原始图像信息的优点而备受青睐,成为了当下运用在图像分割上最广泛的聚类算法之一。
Bezdek等[7]基于模糊理论集提出了模糊C-均值(fuzzyC-means,FCM)聚类算法。经过实验验证,传统的FCM算法对噪声非常敏感,Ahmed等[8]引入邻域项来修改目标函数,提出基于空间信息的FCM算法,改善了FCM算法的抗噪能力,但过程中需要反复迭代计算邻域信息,导致计算效率低。为了解决这个问题,Chen等[9]提出了FCM_S1和FCM_S2算法,将像素用中心像素的邻域均值或中值来替换,降低了算法的时间复杂度。考虑到待处理的数据不完全处于线性空间,所以Chen等[9]在FCM_S1与FCM_S2的基础上通过高斯核函数把输入模式空间映射到一个高维特征空间,将聚类转化到高维特征空间中进行,提出基于新核诱导距离测度的空间约束FCM算法,延伸了算法的可扩展性。Szilagyi等[10]提出增强型FCM算法,由原始图像和每个像素的局部邻域平均灰度级形成线性加权和图像,将其转化为基于灰度直方图信息的图像分割,加快了灰度图像的聚类过程。
在这些算法中都涉及经验参数的设定,而其取值往往是复杂和不确定的。于是Krinidis等[11]基于局部空间信息提出了FLICM算法,避免了人为设定正则化参数,提高了算法的自适应能力。Gong等[12]在FLICM算法上利用高斯核度量来替代欧式距离,同时利用像素的空间信息和局部方差来修改局部模糊因子,提出了基于核函数的局部FCM算法,对图像数据的优化处理和抑制噪声的能力都有所增强。Zhao等[13]利用局部上下文信息和结构信息提出了一种邻域加权FCM算法,在没有噪声先验知识的情况下也能给出更准确的距离度量。Guo等[14]提出了基于噪声检测的FCM算法,通过测量灰度级的局部方差来自动调整参数,采用2种图像滤波方法,既能去除噪声又能保留细节信息。虽然像素的邻域信息已经被不断考虑,但忽略了相应隶属度的邻域信息,有助于提高分类效果,而HMRF[15]考虑了当前隶属度的先前状态,是解决该问题的常用算法。Chatzis等[16]利用邻域像素的标签来估算中心像素的先验概率,提出HMRF-FCM算法。上述算法因引入局部空间信息增加了计算复杂度,因此Lei等[17]通过形态学重建[18]和隶属度滤波来解决该问题,提出一种快速稳健的FCM算法。该算法存在难以计算彩色图像的直方图的问题。所以Lei等[19]继续利用超像素作为预处理,提出一种基于超像素的快速FCM算法,以极低的计算成本来分割彩色图像。Wu等[20]为了克服KWFLICM对高噪声图像敏感的缺点,提出基于局部信息的核化Bregman散度的FCM算法,将具有多项式核度量的TBD引入其中,降低了被不均匀噪声污染的图像分类错误率。像素级和区域级信息也被广泛地进行结合使用,Guo等[21]提出一种像素级和区域级信息融合的隶属度规范化模糊聚类图像分割算法。构建一个新的矩阵来存储和呈现图像空间信息作为先验,并且在算法的迭代中使用固定的聚类中心,结果显示出比最先进的聚类方法更好的分割结果。Zhao等[22]提出一种用于多目标的鲁棒模糊聚类算法。开发了像素和区域级适应度函数来综合考虑图像中的空间约束和区域一致性,在彩色图像和磁共振图像上都证实了该算法的性能。
通过分析及实践发现,虽然上述算法各具优势,但运用模糊聚类进行图像分割依然存在以下问题:① 噪声依然是影响分割精度的主要因素;② 大多数算法的分割效果始终依赖经验参数的选择;③ 适用于非线性处理的方法不多。针对以上问题,本文中提出一种基于多尺度核模糊聚类的图像分割算法。打破传统单一尺度滤波,对图像构建多尺度空间。将滤波后的图像从上至下依次进行模糊聚类,平衡了高斯滤波对图像噪声的抑制效果。其次,将局部空间信息和权重信息引入到模糊平衡因子中,避免了空间距离无法反映当像素点被噪声污染后对其中心像素的影响。接着,引入高斯核度量来增大聚类的线性可分概率。最后,对隶属度进行全局和局部加权,不断修正隶属度。
1 基于核的模糊聚类算法(KFCM)
为解决非线性问题并提高算法抗噪能力,文献[9]提出了一种基于核函数的FCM算法,用内核诱导距离替换FCM中的欧式距离,其目标函数如式(1)所示。
(1)
(2)
式中:σ为函数的带宽。对式(1)进行拉格朗日求导,隶属度和聚类中心计算如式(3)所示。
(3)
(4)
2 多尺度核模糊聚类算法
为提高算法对重度噪声污染和异常值的鲁棒性,提出一种基于多尺度核模糊聚类的图像分割算法,算法流程如图1所示。
图1 基于多尺度核模糊聚类图像分割算法流程框图
2.1 目标函数
在聚类算法中使用欧式距离进行像素度量,对被噪声污染和对比度低的图像非常敏感,容易陷入局部极小值,无法得到全局最优解[23]。为解决上述问题,受文献[9]的启示,用高斯核空间距离替换传统欧式距离,从而解决非线性问题的同时增强算法的抗噪性能。部分算法分割性能受一些参数的影响,而参数的选取通常需要大量的实验计算。为了克服该问题,本文算法利用局部信息和亮度信息来自动调整权衡参数,以提高算法的可扩展性。由于FLICM算法所提出来的空间距离约束1/(1+dij),存在各邻域点对中心点的影响都是相同的局限性。
(5)
(6)
(7)
图2 邻域窗口示意图
(8)
(9)
带宽σ设置为di的方差,则有:
(10)
聚类准则是求目标函数的最小值,式(11)利用拉格朗日乘子法进行求解,其隶属度计算如下:
(11)
2.2 隶属度的修正
在模糊聚类算法中隶属度函数的计算有着至关重要的意义。图像的一个重要特征是相邻像素之间的紧密联系,即相邻像素属于同一集群的可能性很大,此空间关系在模糊聚类算法中不容小觑,若图像中存在大量异常值时,可能会误分。为进一步提高分割精度,基于式(12)所计算出的隶属度,利用邻域隶属度对当前隶属度进行二次修正,以便再次调整聚类中心,其定义如式(13)所示。
(13)
式中:Ωi表示像素点i的邻域,|Ωi|表示其大小。于是,由改进的隶属度更新出聚类中心vk的值为:
(14)
2.3 多尺度鲁棒聚类
由于噪声污染一直是图像分割的主要障碍,因此学者们不仅在约束项上做了改进,在图像预处理上也进行了尝试。高斯滤波作为一种线性平滑滤波,被广泛用于去除图像噪声。部分算法将滤波融入模糊聚类的算法中,在单一尺度上进行,容易造成小尺度上平滑不够,大尺度上平滑过度的问题。不同尺度的高斯滤波会得到不同模糊度的图像,其作用是抑制图像非重要的特征,凸显图像的重要特征。为平衡高斯滤波对图像噪声的抑制作用,提出一种基于多尺度的鲁棒聚类算法,将给定图像与设置的高斯滤波器进行循环卷积操作,得到相应尺度下的滤波图像。
I(k)=I(k-1)*GFσ
(15)
式中:I(k)表示经第k尺度高斯滤波后输出的图像;I(k-1)表示前一次滤波结果;GFσ表示高斯滤波器,其函数定义为:
(16)
基于所提出的多尺度鲁棒聚类算法过程为:首先对初始图像依次进行给定尺度的高斯滤波,对滤波后的图像从上至下进行改进后的模糊聚类算法,更新隶属度和聚类中心直到收敛。利用已更新好的隶属度和聚类中心来指导第二层的图像聚类,不断进行迭代直到输出最终聚类结果,整个过程如算法1所示。
算法1基于多尺度核模糊聚类的图像分割算法
输入:图像I
输出:图像聚类结果
初始化:设定尺度计数k=0,窗口大小w,I(k)←I,给定聚类类别数c,n是像素个数,随机初始化隶属度矩阵U(k)。
1.给定尺度因子σ和尺度数N,利用式(15)对图像构建高斯尺度空间;
2.对图像I(k)计算聚类中心V(k);
3.对图像I(k)根据式(6)计算加权模糊因子wij;
4.根据式(12)更新隶属度矩阵U(k);
6.根据式(14)更新聚类中心V(k);
8.k←k-1,如果k≥1,转向执行步骤3,否则输出聚类结果。
3 实验结果及分析
将KFCM[9]、HMRF-FCM[16]、FLICM[11]、NWFCM[13]、KWFLICM[12]、NDFCM[14]、FRFCM[17]和TKWFLICM[20]8种模糊聚类算法与本文算法在相同环境下进行实验。整个实验需要设置3个参数,分别是模糊指数m=2,收敛条件ε=0.000 1,最大迭代次数100。算法的局部窗口大小为3×3,在FRFCM中,用于多元形态重构的SE窗口和隶属度滤波的窗口大小均为3×3。NDFCM的空间权重因子为λs=3,灰度权重因子为λg=5,标度因子为λa=3,NWFCM的灰度权重因子为λg=5。TKWFLICM的多项式核函数取值为a=1,b=105,d=2。本文算法在人工合成图像上的尺度个数为3,BSDS500和MRSC环境下的尺度个数为2。
3.1 实验环境及数据集
实验的测试环境如下:Windows 10,四核3.10 GHz的CPU和8 GB内存,Matlab 2018b进行算法编程设计。为验证算法的有效性,选取非均匀合成图像以及BSDS500和MSRC这2个自然图像数据集进行多组实验。BSDS500数据集是伯克利大学提供用于图像分割和物体边缘检测的数据集,包含500张大小为481×321或者321×481的自然图像。MSRC是微软公司提供的覆盖23个类,包含591张大小为320×213或213×320的自然图像。
3.2 评价指标
采用以下8种评价指标客观评价各算法的性能,分别是划分系数Vpc[24]、划分熵Vpe[25]、分割精度(SA)[26]、概率边缘指数(PRI)[27]、重叠比率(CV)[28]、边界位移误差(VI)[29]、全局一致性误差(GCE)[30]、变化信息(BDE)[31]。当Vpc越接近1,Vpe越接近0。VI、GCE和BDE的值越小,SA、PRI和CV的值越大,则图像分割效果越理想。
3.3 合成图像实验
为验证本文算法在图像被重度噪声污染的情况下的分割效果,首先对比了2幅大小分别为256×256和244×244的人工合成图像。图3—图6分别展示了合成图像1和2在不同强度的椒盐噪声和均值为0的高斯白噪声下的分割结果。通过分割结果可以看出,各算法在低噪声环境下都能表现出良好的分割效果,但随着噪声强度的增加,各算法表现出了明显差异。KFCM、HMRF-FCM、FLICM和NWFCM算法对两类噪声都非常敏感。KWFLICM、NDFCM和FRFCM对两类噪声表现出一定的抗噪能力,但是对于高强度的高斯白噪声在图像复杂的情况下较为敏感。TKWFLICM的分割结果仅次于本文算法,具有良好的抗噪能力。可以观测出本文算法在低噪声和高噪声下都保留更多的图像细节,有明显的分割优势。
图3 合成图像1在椒盐噪声下各算法的分割结果
图4 合成图像1在高斯白噪声下各算法的分割结果
图5 合成图像2在椒盐噪声下各算法的分割结果
图6 合成图像2在高斯白噪声下各算法的分割结果
利用评价指标绘制出数据结果,图7—图10分别是合成图像1和2在4种椒盐噪声和高斯白噪声下的Vpc和Vpe曲线。可以看出,在高斯白噪声下各算法的Vpc和Vpe曲线下降趋势更明显。KFCM、HMRF-FCM、FLICM以及NWFCM对噪声都很敏感,KWFLICM、NDFCM和FRFCM的走向趋势相近。TKWFLICM变化趋势与本文相似,本文算法在噪声强度不断增加的情况下保持稳定分割。
图7 合成图像1椒盐噪声下的Vpc和Vpe曲线
图8 合成图像1高斯白噪声下的Vpc和Vpe曲线
图9 合成图像2椒盐噪声下的Vpc和Vpe曲线
图10 合成图像2高斯白噪声下的Vpc和Vpe曲线
表1和表2分别展示了各算法在2幅合成图像上的分割精度。KFCM对重度噪声依然敏感,HMRF-FCM、FLICM和NWFCM仅使用邻域窗口将局部空间信息合并到目标函数中,对被低密度噪声破坏的图像有效,但对于高密度噪声损坏的图像分割结果并不理想。NDFCM对于已知的噪声分割有一定的抗噪能力,KWFLICM利用更多的局部空间信息来改善分割结果,获得了较高的分割精度。TKWFLICM利用多项式核函数对TBD进行核化,分割精度高于前7种算法。可以看出,在对比的模糊聚类图像分割算法中,本文的算法可以获得最满意的结果。
表1 合成图像1上的分割精度(SA)
表2 合成图像2上的分割精度(SA)
3.4 自然图像实验
在MSRC和BSDS500这2个自然图像数据集上进行实验,如图11所示,可以看出各算法在前景和背景有明显差异的图像上都是有效的。对于背景复杂的图像如第4行所示,各算法都出现了大量小区域。尽管NDFCM和FRFCM使用改进的图像滤波方法获得了比KFCM、HMRF-FCM、FLICM、NWFCM以及KWFLICM更好的分割结果,但依然存在被误分割的情况。TKWFLICM在自然图像上对于背景复杂的图像有良好的分割能力,可以看出本文算法在4幅自然图像上的分割准确度最高,因此本文算法在复杂背景情况下依旧能够对图像进行较为准确的分割。
本文在使用BSDS500和MSRC这2个自然图像数据集上与各算法进行对比分析。在实验中,对于BSDS500中的图像,聚类数c为2~6,而对于MSRC中的图像,聚类数c为2~4。表3和表4分别展示的是本文算法与其余模糊聚类算法在2个数据集上的平均性能。
可以看出,在自然图像数据集上,KFCM、FLICM、NWFCM以及KWFLICM的PRI、CV、VI和GCE值相似。NDFCM与HMRF-FCM的平均性能相似。由于FRFCM算法考虑形态学重建和隶属度滤波,于是在PRI和BDE这两方面优于前面的算法。TKWFLICM算法开辟了新的度量方式,比KWFLICM算法的精确更高。本文算法在2个数据集上PRI、CV、VI和GCE的值都优于其他对比算法,对于背景条件复杂的图像分割存在很大的分割优势。
表3 BSDS500数据集上的平均性能
表4 MSRC数据集上的平均性能
3.5 尺度选择讨论
为验证本文算法中滤波尺度数的大小对分割结果的影响,在BSDS500和MRSC这2个自然图像数据集上进行不同尺度的聚类实验。平均性能如表5和表6所示,从各项指标的统计结果可以看出,2个数据集对于尺度数从2到4,其结果变化并不是很敏感。尺度数越大,下降趋势越大,尺度过小达不到平滑效果,过大会非常耗时并且过度平滑,不利于分割。
表5 BSDS500图像上不同尺度(N)的分割平均性能
表6 MRSC图像上不同尺度(N)的分割平均性能
4 算法复杂度分析
执行时间是衡量算法性能的一个重要指标,因此对不同算法的计算复杂度进行分析。如表7所示,各算法的复杂度主要由两部分组成,一部分来自于每个像素的局部空间信息的计算,另一部分来自于算法的迭代。n为像素总数,c为聚类数,t为迭代次数,w为局部窗口的大小,q为图像的灰度级数,N为尺度个数。
表7 9种算法的计算复杂度
可以看出,KFCM不适用任何邻域窗口,计算复杂度最低。NDFCM的相邻信息是提前计算的,计算复杂度相对较低。FLICM、NWFCM、KWFLICM和TKWFLICM在每次迭代中需要重复计算相邻信息,导致计算复杂度较高。HMRF模型使用的先验概率需要在每次迭代中计算,所以HMRF-FCM计算复杂度较高。NDFCM和FRFCM在图像分割过程中都只计算一次局部空间信息,因此计算复杂度较低。本文算法的时间复杂度主要由高斯滤波O(n×w)和模糊聚类算法O(n×c×t×w2)迭代组成,再乘以尺度数,在现有算法中计算复杂度处于中等,能够满足一定的实时性要求。
为了直观地展示本文算法的运行效率,对分别受椒盐噪声和高斯白噪声污染的合成图像1与2在BSDS500和MSRC这2个自然图像数据集进行测试,不同算法的平均运行时间如图12所示,可以看出本文算法对自然图像的分割时间略高于合成图像,但是远低于KWFLICM和TKWFLICM算法。因此,本文算法在分割精度和抗噪声鲁棒性方面均优于其他比较算法,该算法具有潜在的应用价值。
图12 各算法的平均运行时间
5 结论
为解决被重度噪声污染的图像分割问题,采取多尺度方式构建模糊空间。利用上层图像对噪声不敏感和下层图像保留更多图像细节信息的特性,反向进行模糊聚类,为下层提供了一个有效的初始值。通过重构模糊因子,有效地抑制了噪声像素的干扰,同时避免了参数设置。结合邻域信息对隶属度进行二次修正。通过与其他算法的实验对比,本文算法能够有效抑制高强度噪声的干扰,有一定的实际应用价值。算法的最优尺度个数为2~4时,分割结果变化并不明显,所以可以容易确定其最优尺度。不足之处在于聚类的个数是人为给定的,需要进一步优化,使其自动确认。算法的执行效率有待提升,后续将运用超像素结合等预处理工具来提升算法的运行效率。