图像信息驱动的抑制式粗糙模糊聚类分割算法
2021-09-29程艳阳刘汉强
赵 凤 程艳阳 刘汉强 刘 琳
(1. 西安邮电大学通信与信息工程学院 (人工智能学院), 陕西西安 710121; 2. 西安邮电大学电子信息现场勘验 应用技术公安部重点实验室, 陕西西安 710121; 3. 陕西师范大学计算机科学学院, 陕西西安 710119)
1 引言
图像是人类视觉的基础,是自然景物的客观反映,是人类认识世界和人类本身的重要源泉,是客观对象的一种相似性的、生动性的描述或写真,是人类社会活动中最常用的信息载体。随着多媒体技术的发展,图像大数据时代已经来临。图像数据在工业生产、医疗健康、遥感识别、军事竞争以及日常生活中无处不在,对图像进行智能化处理和分析逐渐成为科学和技术前沿。图像分割作为图像处理中的关键步骤,是图像识别和计算机视觉至关重要的预处理,没有正确的分割就不可能有正确的识别。图像分割质量对于后续的图像分析和理解至关重要,对其进行研究仍是一项任重而道远的工作。从数学角度来看,图像分割是将数字图像按照某种规律划分为多个区域的过程,从而使得被划分在同一块区域内的像素可以表现出相似性或者一致性,而那些不在同一块区域间则会表现出明显的差异性。图像的分割方法主要包括以聚类为基础的分割方法[1-2]、以阈值为基础的分割方法[3-5]、以区域为基础的分割方法[6-7]、以边缘为基础的分割方法[8-9]和以图论为基础的分割方法[10-12]等。基于聚类的图像分割是将图像中的像素依据某种聚类准则从而划分成多个类的过程,尽可能的将相似的样本点划分为一类,而具有明显的差异性的样本尽可能划分到不同的类中来实现图像的分割。众所周知,图像是一类典型的含有不确定性的数据。为了有效处理图像中的模糊性和不确定性,许多学者研究基于模糊聚类的图像分割方法。CaiOck-Kyung Yoon[13]提出了一种基于模糊聚类的脑磁共振图像分割方法,实现对白质、灰质和脑脊髓液的自动分割。Zhao[14]等人提出了一种提升的空间模糊C-均值聚类算法,通过引入空间约束项提升方法的抗噪能力。Zhao[15]等人利用像素的邻域统计信息和竞争性学习思想构建图像的直觉模糊集,从多目标优化的角度,提出了一种新颖的噪声鲁棒的多目标进化直觉模糊聚类算法。
粗糙集理论是继概率论、模糊集、证据理论之后的又一个处理不确定性问题的数学工具。1982年,波兰数学家Z.Pawlak提出了粗糙集理论[16],用来研究不完整数据,不精确知识表达、学习、归纳等的一套理论。2002年,Lingras等人[17]把粗糙集理论中的上、下近似引进到C-均值算法中,提出了粗糙C-均值算法。Seiki Ubukata[18]等人将粗糙集理论引入到硬C-medoids聚类中并参考广义粗糙C-均值提出了粗糙C-medoids聚类,处理样本归属的确定性、可能性和不确定性。由于图像数据的不确定性,粗糙聚类应用于实际的图像分割时,容易出现类间像素重叠的问题。为此,将模糊聚类与粗糙聚类相结合的方法被更多地应用于图像分割问题,试图从多种信息处理角度挖掘图像数据的模糊性和不确定性。粗糙模糊聚类[19]整合了模糊集和粗糙集理论[20]的优点,已经显示出它们在图像分割中的有效性[21],有效处理了图像中的各种不确定性。例如,Shaswati Roy等人[22]提出了一种基于模糊粗糙聚类和空间约束的算法,避免了图像伪影造成的敏感性问题,使用粗糙集的核心区域和边界区域的概念处理了簇定义中的不完整性,可以有效地处理重叠分区,在医学图像分割上获得了良好的性能。
传统的粗糙模糊聚类方法应用于图像分割时,需要手动设置合适的阈值确定粗糙聚类的上、下近似,阈值的选取不同会对实验结果造成一定的影响。此外,该算法对于图像中的噪声较为敏感。为了克服这些问题,本文提出一种图像信息驱动的抑制式粗糙模糊聚类分割算法,实现粗糙模糊聚类在图像分割中的深度应用。该算法设计了基于超像素区域信息的自适应阈值确定策略,用于判定聚类的上、下近似。该策略首先对输入图像进行超像素区域划分,并对超像素区域的代表特征进行初步聚类获取超像素区域对初步聚类中心的模糊隶属度,进而获取判定粗糙聚类的上、下近似的阈值。将自适应阈值策略应用到粗糙模糊聚类中,极大的降低了由于人为选取阈值不当造成的误差。为了克服方法对于图像噪声的敏感性,将图像空间信息引入到粗糙模糊聚类,构造了融合空间信息的粗糙模糊聚类目标函数。此外,在聚类迭代过程中将模糊聚类中的抑制式学习思想引入到粗糙下近似集中像素的模糊隶属度的修正中,进一步提升聚类性能,使得粗糙聚类与模糊聚类深度融合,可以从多个不同角度更加精细处理图像数据的模糊性和不确定性。综上,本文算法是更具混合智能机理的粗糙模糊聚类图像分割算法,自适应阈值有效性验证实验以及Berkeley[23]图像对比实验证明了本文算法的有效性。
2 图像信息驱动的抑制式粗糙模糊聚类分割算法
2.1 基于超像素的自适应阈值确定
(1)
假设μip和μiq分别为代表点i对应的最大隶属度和次大隶属度,利用下式构造上下近似判断的自适应阈值T,
(2)
2.2 融合图像空间信息的粗糙模糊聚类目标函数
传统的粗糙模糊聚类算法在应用于图像分割时,没有考虑图像中的任何空间信息,这样使得算法对于图像中的噪声敏感,无法在含噪图像分割中获得满意的分割效果,为了解决这个问题,本文构造了融合图像空间信息的粗糙模糊聚类目标函数,具体如下:
(3)
(4)
其中p表示像素i的ω×ω邻域内像素的集合。为了最小化目标函数,采用Lagrange乘子法,获得中心和隶属度的更新公式:
(5)
(6)
2.3 基于自适应阈值的粗糙上下近似的确定
依据公式(6)获得的像素点与聚类中心之间的模糊隶属度,计算像素i对应的最大隶属度uip和次大隶属度uiq,基于2.1部分获得的自适应阈值,按照下式确定融合空间信息的粗糙下近似和边界,
(7)
即当某个像素点最大隶属度和次大隶属度的差值大于自适应阈值时,这个像素点会被划分到下近似中;否则,该像素点被划分到边界中。
2.4 抑制式粗糙下近似策略
为了加速算法收敛并提升算法性能,将模糊聚类中的抑制式学习思想引入到粗糙下近似集中像素的模糊隶属度的修正中,通过借助竞争学习的思想,在每一次的迭代过程中,对下近似集中像素的最大隶属度uip进行适当的放大,其他隶属度给以适当的抑制达到加速粗糙模糊聚类收敛的效果。下式为隶属度修正计算公式:
(8)
其中α指的是抑制参数。所以在每一次的聚类迭代更新过程中,需要将修正后的隶属度代入中心更新公式中。
2.5 算法流程
本文提出的图像信息驱动的抑制式粗糙模糊聚类分割算法的主要步骤介绍如下:
算法1 图像信息驱动的抑制式粗糙模糊聚类分割算法输入:图像数据X,模糊指数m,聚类数目K,下近似权重系数Wl,边界权重系数Wb,迭代停止阈值ε,空间限制参数β,抑制参数α,最大迭代次数Iter。步骤1 采用基于超像素区域信息的自适应阈值确定策略获得图像X的自适应阈值T;步骤2 随机初始化聚类中心vj;步骤3 设置初始迭代次数t=0;步骤4 按照公式(5)计算融合空间信息的模糊隶属度;步骤5 按照公式(8)对隶属度进行抑制式变换;步骤6 按照公式(7)将修正后的最大隶属度与次大隶属度的差与自适应阈值进行比较,从而进行粗糙模糊聚类的上下近似划分;步骤7 按照公式(6)更新聚类中心;步骤8 如果vt+1-vt2≤ε,迭代终止;否则令t=t+1,返回步骤4;输出:图像分割结果。
3 实验结果与分析
3.1 实验设置
为了验证本文所提出的算法的有效性,本文选取了Berkeley图库中的图像进行分割实验并采用粗糙聚类、粗糙模糊聚类、基于空间信息的模糊聚类(Fuzzy C-Means with neighborhood-based spatial constraints, FCM-S)以及抑制式模糊聚类(Suppressed Fuzzy C-Means, SFCM)算法作为本文实验的对比算法。实验中,采用分割准确率指标[25](Segmentation Accuracy, SA)、标准化互信息指数[26](Normalized Mutual Information, NMI)以及兰德指数[26](Rand Index, RI)来验证所有算法的有效性。SA指标越高表明图像的分割效果越好。NMI和RI两个指标则进一步验证了聚类的效果好坏,当数值越大,代表聚类效果越好。
在本文算法中,空间限制参数β可以控制空间信息在算法中重要性,对图像分割性能有一定的影响,我们通过对比在不同大小的β下分割图像的准确率,将分割准确率随参数的变化曲线展示在图1中,从结果中可以看出,当没有空间限制参数时(β=0),提出的方法在含噪图像上没有获得理想的分割性能,由此验证了空间信息的有效性。在给定均值为0、标准方差为0.01的高斯噪声时,综合评价三幅图像的性能曲线,β取10是最合适的。
图1 不同分割图像在不同空间项系数下的准确率Fig.1 Accuracy of different segmented images under different spatial coefficients
由文献[27]可知,模糊指数m一般取2是合适的,并且依据大量实验经验,权重系数Wl和Wb在粗糙聚类、粗糙模糊聚类和本文算法中均分别设置为0.7和0.3。所有比较算法的部分参数设置如表1所示。
表1 三种算法的参数设置
3.2 自适应阈值策略有效性验证实验
为了验证本文算法所提出的自适应阈值策略的有效性,将自适应阈值策略应用于粗糙模糊聚类算法,并与该算法分别在0.1、0.3、0.5、0.7、0.9等不同阈值下得到的分割结果图像进行了对比。实验结果如图2~图6所示。
从图2~图6中可以看出,本文所提出的自适应阈值策略可以得到较为理想的分割效果,减少了人为干预,降低了手动设置阈值所造成的误差。
图2 不同阈值下的图像3096分割结果Fig.2 Image 3096 segmentation results under different thresholds
图3 不同阈值下的图像3063分割结果Fig.3 Image 3063 segmentation results under different thresholds
图4 不同阈值下的图像238011分割结果Fig.4 Image 238011 segmentation results under different thresholds
图5 不同阈值下的图像101027分割结果Fig.5 Image 101027 segmentation results under different thresholds
图6 不同阈值下的图像24063分割结果Fig.6 Image 24063 segmentation results under different thresholds
3.3 Berkeley图像对比实验
为了验证所提出的算法在含噪图像上的分割效果,在八幅Berkeley图像上人为添加了均值为0、标准方差分别为0.005和0.01的高斯噪声,并在表2和表3中展示了不同噪声下所有比较方法的分割准确率,在表4和表5中展示了不同噪声下所有比较方法的标准化互信息指数,在表6和表7中展示了不同噪声下所有比较方法的兰德指数。需要指出,粗糙聚类算法和粗糙模糊聚类算法需要给定合适的阈值来粗糙聚类的划分上、下近似。根据不同阈值下的实验数据表明,粗糙聚类算法对于图3096、图3063、图167062,阈值选取为6.4是比较合适的;对于图238011、图15088、图101027,阈值选取为8.1是比较合适的,对于24063、图86016,阈值选取为10.4是比较合适的。在粗糙模糊聚类算法中,对于图3096、图86016、图15088,阈值选取为0.3是比较合适的;对于图238011、图3063、图167062,阈值选取为0.1是比较合适的;对于图101027、图24063,阈值选取为0.5是比较合适的。从表2~表7中可以看出,本文提出的方法在大多数被噪声污染的图像上都获得了理想的分割性能。
表2 均值为0、标准方差为0.005高斯噪声 污染下的图像分割准确率
表3 均值为0、标准方差为0.01高斯噪声 污染下的图像分割准确率
表4 均值为0、标准方差为0.005高斯噪声 污染下的图像标准化互信息指数
表5 均值为0、标准方差为0.01高斯噪声 污染下的标准化互信息指数
表7 均值为0、标准方差为0.01高斯噪声 污染下的兰德指数
为了更直观的展示含噪图像的视觉分割结果,在图7~图22中,展示了被不同噪声污染的八幅图像的分割结果。结合空间信息的FCM-S算法和本文提出的算法获得视觉分割结果明显优于其他分割方法,由于采用了粗糙和模糊理论相结合的思想,分割结果中的目标更加准确,且背景噪声更少且错分更少,因此本文提出的方法获得了更加理想的分割结果。
图7 均值为0、标准方差为0.005高斯噪声污染下的图像3096分割结果Fig.7 Segmentation results of 3096 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图8 均值为0、标准方差为0.005高斯噪声污染下的图像3063分割结果Fig.8 Segmentation results of 3063 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图9 均值为0、标准方差为0.005高斯噪声污染下的图像238011分割结果Fig.9 Segmentation results of 238011 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图10 均值为0、标准方差为0.005高斯噪声污染下的图像167062分割结果Fig.10 Segmentation results of 167062 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图12 均值为0、标准方差为0.005高斯噪声污染下的图像86016分割结果Fig.12 Segmentation results of 86016 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图13 均值为0、标准方差为0.005高斯噪声污染下的图像24063分割结果Fig.13 Segmentation results of 24063 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图14 均值为0、标准方差为0.005高斯噪声污染下的图像15088分割结果Fig.14 Segmentation results of 15088 image corrupted by Gaussian noise with zero mean and standard variance 0.005
图15 均值为0、标准方差为0.01高斯噪声污染下的图像3096分割结果Fig.15 Segmentation results of 3096 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图16 均值为0、标准方差为0.01高斯噪声污染下的图像3063分割结果Fig.16 Segmentation results of 3063 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图17 均值为0、标准方差为0.01高斯噪声污染下的图像238011分割结果Fig.17 Segmentation results of 238011 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图18 均值为0、标准方差为0.01高斯噪声污染下的图像167062分割结果Fig.18 Segmentation results of 167062 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图19 均值为0、标准方差为0.01高斯噪声污染下的图像101027分割结果Fig.19 Segmentation results of 101027 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图20 均值为0、标准方差为0.01高斯噪声污染下的图像86016分割结果Fig.20 Segmentation results of 86016 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图21 均值为0、标准方差为0.01高斯噪声污染下的图像24063分割结果Fig.21 Segmentation results of 24063 image corrupted by Gaussian noise with zero mean and standard variance 0.01
图22 均值为0、标准方差为0.01高斯噪声污染下的图像15088分割结果Fig.22 Segmentation results of 15088 image corrupted by Gaussian noise with zero mean and standard variance 0.01
4 结论
为了从多个不同角度更加精细处理图像数据的模糊性和不确定性,实现粗糙模糊聚类在图像分割中的深度应用,并减少人为干预和对图像中噪声的敏感性,本文提出一种图像信息驱动的抑制式粗糙模糊聚类分割算法。算法设计的基于超像素的自适应阈值策略大大降低了手动设置阈值对分割效果造成的影响,空间信息的引入成功抑制了图像中的噪声,抑制式学习思想的引入实现了粗糙和模糊思想的深度融合,进一步提升了聚类性能。实验证明本文所提出的算法在对含噪图像进行图像分割时,分割效果明显优于其他算法。在接下来的研究工作中,如何将粗糙聚类算法与更多现代智能优化算法相互结合从而构造具有混合智能机理的粗糙聚类算法是一个值得继续探究的问题。