APP下载

隶属度修正的空间核直觉模糊聚类苗族服饰图案分割

2023-10-18彭家磊黄成泉覃小素周丽华

毛纺科技 2023年9期
关键词:模糊集直觉苗族

彭家磊,黄成泉,覃小素,雷 欢,陈 阳,周丽华

(1.贵州民族大学 数据科学与信息工程学院,贵州 贵阳 550025;2.贵州民族大学 工程技术人才实践训练中心,贵州 贵阳 550025)

苗族服饰图像具有浓厚的文化底蕴,代表了一个民族的文化传承。随着流行文化的冲击,苗族服饰图像文化逐渐流失,一些研究者采用有效的分割方法对其进行保护和传承,如基于主动轮廓[1]和深度学习[2]的苗族服饰图案分割方法。然而,基于模糊C均值[3](Fuzzy C-Means,FCM)聚类算法的苗族服饰图案分割方法几乎没有。

图像分割是数字图像领域中的一项关键技术,其分割的质量对后续的特征提取、图像识别具有重要的作用,并广泛应用于交通[4]、医学[5-6]和遥感图像[7-8]等领域。聚类算法是实现无监督模式识别的一种方法,目的是将一个数据集根据特定的规则划分为多个子数据。近年来,FCM算法被广泛运用于图像分割领域,但传统的FCM算法对图像进行聚类时,没有考虑图像像素的空间位置关系,仅对像素点的灰度值进行聚类,致使该算法对噪声点敏感,难以取得较好的分割效果,同时具有收敛速度慢等问题。为此,Zhu等[9]根据竞争学习的思想,在FCM的目标函数中引入隶属度竞争惩罚项,提出广义FCM(Generalized FCM,GFCM)聚类算法,有效提升了运行效率和聚类性能。随着模糊聚类算法的逐渐成熟,隶属度单一的局限性也渐渐浮现。

Zadeh[10]提出的模糊集理论是描述像素点归属哪一类的肯定程度,而事物发展不仅是支持或者反对,还有介于二者之间的不确定性。直觉模糊集是模糊集的拓展,其增加的犹豫度给不确定性的信息提供了新的思路。Chaira[11]将直觉模糊集与FCM结合提出直觉模糊(IFCM)聚类算法,该算法解决了传统模糊集隶属度单一的局限性问题,但IFCM算法同FCM算法一样,过分依赖于样本的数据结构,缺乏空间信息,对噪声和图像的伪斑点较为敏感。为了解决这个问题,Lei等[12]通过核函数的思想,提出核距离的直觉模糊(Kernel Intuitionistic FCM,KIFCM)聚类算法,核方法将输入空间中的非线性问题转化为高维特征空间中的线性问题,用核距离替代欧氏距离,提高了聚类性能,但由于未考虑空间信息,导致对噪声图像的分割质量较差。Arora等[13]将空间信息纳入直觉模糊集,提出增强空间直觉模糊(Spatial Intuitionistic FCM,SIFCM)聚类算法,该算法使用新的模糊补计算非隶属度,克服了噪声或异常值的影响。

综上所述,与主流医学和遥感图像相比,苗族服饰图案具有色彩鲜艳、纹理复杂、样式多元化等特征,容易导致图案的伪斑点增多。在噪声的干扰下,现有的模糊聚类算法分割图像会存在边缘模糊和破损等问题。因此,本文结合直觉模糊集与空间信息,引入隶属度约束惩罚项,同时采用核距离度量替代欧氏距离,提出一种隶属度修正的空间核直觉模糊(Spatial Kernel Intuitionistic FCM,SKIFCM)聚类苗族服饰图案分割算法。与经典FCM、IFCM、SIFCM和KIFCM算法相对比,用于验证本文算法的分割效果和聚类性能。

1 相关基础理论

1.1 FCM聚类算法

FCM算法是一种迭代算法,用模糊隶属度为其类别分配像素。设X={x1,x2,…,xn},FCM最小化约束目标函数如下:

(1)

FCM算法应满足式(2)的约束条件:

(2)

式中:c表示聚类数目;n表示总像素数目;m是加权指数,控制结果分区的模糊性,一般将m设置为2;μki表示第i个像素xi到第k个聚类中心的隶属度值;‖xi-vk‖2表示像素xi到聚类中心vk的欧氏距离。

通过拉格朗日乘子法对目标函数式(1)求解,得到隶属度和聚类中心的更新公式如下:

(3)

(4)

1.2 直觉模糊的理论基础

在模糊集的假设中,FCM算法只生成隶属度。然而,单一的隶属度并不能准确的描述事物所存在的不确定性。因此,Atanassov将模糊集推广至直觉模糊集,在隶属度的基础上引入了非隶属度和犹豫度。设X={x1,x2,…,xn}表示一个有限论域,则D在X中的直觉模糊集被定义为:

D={(x,μD(x),vD(x))|x∈X}

(5)

式中:μD(x)→[0,1]、vD(x)→[0,1]分别表示x到D的隶属度函数和非隶属度函数,并且每一个x∈D都满足0≤μD(x)+vD(x)≤1。对于集合D中的每一个x,当μD(x)=1-vD(x)成立时,直觉模糊集就退化成传统模糊集。

为了更好地描述数据之间的不确定性,Atanassov也指出了一个犹豫度:

FD(x)=1-μD(x)-vD(x),0≤FD(x)≤1

(6)

在现有的直觉模糊集中,Maheshan等[14]通过Yager生成函数,得到非隶属度如下:

vD(x)=[1-μD(x)β]1/β,β∈(0,+∞)

(7)

因此,将式(7)代入式(6),犹豫度变为:

FD(x)=1-μD(x)-[1-μD(x)β]1/β

(8)

1.3 IFCM聚类算法

直觉模糊熵是模糊集中模糊性的度量,许多学者以不同的方式来定义。其中,Pal等[15]分析了经典的香农信息论,引出了指数熵。对于一个概率分布:p=pi(i=1,2,…,n),指数形式的香农熵可定义如下:

(9)

将指数香农熵与直觉模糊集相结合,得到直觉模糊熵如下:

(10)

IFCM聚类算法在传统FCM算法的基础上引入了犹豫度函数,其目标函数可表示为:

(11)

对目标函数式(11)进行最优化求解,得到隶属度函数和聚类中心的更新公式如下:

(12)

(13)

2 SKIFCM算法

2.1 高斯核距离

近年来,核方法被广泛应用于聚类算法中,其基本思想是将低维空间中的非线性问题转变为高维空间中的线性问题,使原来的非凸数据变得线性可分,从而让数据点的分类更加合理。根据文献[12],高维特征空间中的核距离被定义如下:

‖Φ(xi)-Φ(vk)‖2=

K(xi,xi)+K(vk,vk)-2K(xi,vk)=

2[1-K(xi,vk)]

(14)

式中:Φ表示数据空间到特征空间的非线性映射。

本文使用高斯核函数来计算核距离,其定义如下:

K(xi,vk)=exp(-‖xi-vk‖2/h2)

(15)

式中:h表示核宽度。而参数h的选择往往能影响图像分割质量的好坏[16],并且需要大量的实验。

本文为了解决h的取值问题,采用均方误差来估计h2,具体形式如下:

(16)

2.2 SKIFCM算法的目标函数

为充分利用图像的空间邻域信息,本文从竞争学习的角度出发,将直觉模糊集和空间邻域信息相结合,并采用核距离替代欧式距离构造出新的目标函数如下:

(17)

利用拉格朗日乘子法对目标函数式(17)求最优解,得到隶属度函数和聚类中心的更新公式如下:

(18)

(19)

由于图像的相邻像素具有高度相关的性质,且属于同一类的概率较大,所以考虑周围像素点的隶属度有利于提高算法的聚类性能。本文利用局部像素特征来修改式(18)所得的隶属度函数。定义空间函数如下:

(20)

式中:NB(xi)表示空间域中以xi为中心的l×l正方形窗口,本文实验取5×5的窗口;hki与隶属度一样,表示像素xi到第k个类的概率。

在不改变目标函数式(17)的情况下,将式(20)与式(18)相结合,得到更新隶属度函数和聚类中心如下:

(21)

(22)

式中:p和q是2个参数,控制2个函数的贡献程度。

在同质区域内,空间函数对图像的作用不大,仅仅简单的加强初始隶属度函数。然而,对于噪声点,利用像素邻域信息降低噪声点的权重,从而达到消除噪声的影响。因此,图像的噪声或伪斑点能够被纠正。

2.3 SKIFCM算法的步骤

SKIFCM算法的步骤如下:

①设置聚类数目c,加权指数m,最大迭代次数T和终止条件ε,邻域大小w。

②随机初始化聚类中心V,随机初始化模糊隶属度矩阵U。

③设置迭代计数i=0。

④根据式(21)更新模糊隶属度。

⑤根据式(22)更新模糊聚类中心。

⑥当‖Ji+1-Ji‖<ε或者i>T时,终止迭代过程,否则转向④,直至迭代结束。

3 实验结果与分析

为了验证本文算法对苗族服饰图案分割的有效性,本文设计2组实验进行验证,即含噪声的苗族服饰图案分割和彩色苗族服饰图案分割。为了进一步验证本文算法的有效性,还设计了织物疵点图像分割的实验。苗族服饰图案的数据集来源于北京服装学院民族服饰博物馆(http://www.biftmuseum.com/),选取博物馆内的苗族服饰局部图像(蜡染、刺绣、混合与简单绣线)作为本次实验的数据集。

3.1 实验环境与参数选取

参数的选取往往能决定图像分割质量的好坏。为了获得良好的分割效果,本文实验选取的参数如下。固定参数:加权指数m=2,终止条件ε=1e-5,最大迭代次数T=200,聚类数目c=2,邻域窗口大小w=5,犹豫度指数β=0.85;可变参数:模糊指数α,贡献程度指数p和q都需要根据图像的性质进行相应的调整,对比算法参考原文的参数设置。实验环境为MatLab R2018a,Windows 10操作系统,处理器为Intel(R) Core(TM) i5-7200U CPU @ 2.50 GHz 2.71,运行内存为8 GB。

3.2 评价指标

为了客观评估本文算法的聚类性能,采用划分系数(Partition Coefficient,VPC)、划分熵(Partition Entropy,VPE)对5种分割算法进行定量评价[17],VPC和VPE反映划分矩阵的模糊程度,VPC的值越接近1,VPE的值越接近0,聚类性能就越好,分割效果就越明显。定义VPC和VPE如下:

(23)

(24)

为了进一步验证本文算法相对于其他算法的有效性,采用有效性指数(Xie and Beni Index,VXB)作为评价指标[18],VXB测量特征域内的紧致度,VXB越接近0,同类像素点之间的紧密性越强,聚类效果越好,表达式如下:

(25)

3.3 不同类型噪声的苗族服饰图案分割

为了测试本文算法对噪声的鲁棒性,本节挑选样式单一和样式多元化的2类苗族服饰图像作为实验对象,分别对2类图像添加10%的椒盐噪声、高斯噪声和混合噪声,其测试的噪声图像如图1所示。分割结果如图2、3所示,分割性能指标如表1、2所示。图2、3中所有图像的实验参数α、p和q均分别设置为0.9、5和0。

表1 不同算法在图像1~6中的VXBTab.1 VXB of different algorithms of image 1~image 6 %

图1 测试图像Fig.1 Test image. (a)10% Pepper Salt Noise image 1;(b)10% Gaussian Noise image 2;(c)10% Mixed Noise image 3;(d)10% Pepper Salt Noise image 4;(e)10% Gaussian Noise image 5;(f)10% Mixed Noise image 6

图3 样式多元化的苗族服饰图案分割结果Fig.3 Segmentation results of Miao costume patterns with diversified styles

从图2、3可以看出,FCM、IFCM和KIFCM算法分割的图像中存在大量的噪声点,图像分割的质量较差,达不到理想的分割效果,而SIFCM和SKIFCM算法利用空间邻域信息对原隶属度函数进行修正,消除了噪声对图像的影响,且SKIFCM算法的图像细节信息更清晰。

从表1可以看出,当对苗族服饰图案添加不同类型的噪声时,FCM、IFCM和KIFCM算法的VXB相对较低,而IFCM和KIFCM算法的VXB相对较高。原因是他们通过最小化特征域中的度量差来实现划分,而SIFCM和SKIFCM算法在空间分布的基础上修改了空间特征,从而致使特征域内的紧致性恶化,造成VXB增大。与SIFCM算法相比,SKIFCM算法的VXB降低约4.18%。然而,从表2可以看出,SKIFCM算法的VPC最高、VPE最优,分别对应为95.49%和7.44%,明显优于其他改进算法。实验结果表明,本文算法不仅能平衡噪声和边缘细节信息之间的关系,而且还具有较好的聚类性能。

表2 不同算法在图像1~6中的VPC和VPETab.2 VPC and VPE of different algorithms of image 1~image 6 %

3.4 彩色苗族服饰图案分割

苗族服饰图案种类繁多,每种图案所代表的意义都不相同,对于色彩鲜艳、纹理复杂、样式多元化的图案,通常难以取得较好的分割效果。为了验证本文算法的优越性,选取4幅不同类型的彩色苗族服饰图案进行实验。分割结果如图4所示,其红色方框表示图像细节的差异,性能指标如表3所示。图像7与图像8的实验参数α、p和q均分别设置为0.9、1和1。图像9的实验参数α、p和q分别设置为0.9、4和1,图像10的实验参数α、p和q分别设置为0.45、3和1。

表3 不同算法在图像7~10中的VPC与VPETab.3 VPC and VPE of image 7~image 10 for the different algorithms %

图4 彩色苗族服饰图案分割结果Fig.4 Segmentation results of color Miao costume patterns

从图4可以看出,对于图像7,各算法都取得了不错的分割结果。对于图像8,FCM、IFCM、SIFCM算法的分割效果较差,且SIFCM出现了过分割的现象,而KIFCM和SKIFCM算法的分割效果较好。这是因为采用欧氏距离对图像进行聚类时,要求每一类中的成员必须要靠近聚类中心,但事实上远离聚类中心的点容易被错误分类。KIFCM和SKIFCM算法采用核距离替代欧式距离,重新计算像素点到聚类中心的距离,所以提高了聚类的准确性。对于图像9和图像10,FCM、IFCM和KIFCM算法的分割效果较差,这是由于未考虑空间信息所致,而SIFCM和SKIFCM算法考虑了空间信息,对原隶属度进行修正,提高了聚类性能,视觉效果较好。

由表3可知,SKIFCM算法的VPC和VPE最优,约为97.91%和3.42%;SIFCM算法次之,约为96.56%和5.75%;FCM算法最差,约为89.96%和17.20%。实验结果表明,本文算法整体上提高了其他改进算法的聚类性能,其分割所产生的区域具有更强的连续性,能得到清晰的图像边缘。

3.5 织物疵点图像分割

为了进一步说明本文算法的有效性,选择带有油污、竹节、浆斑和褶子等常见的织物疵点的4幅图像,对其添加2%的椒盐噪声进行实验,分割结果如图5所示,分割指标如表4所示。其红色方框表示该织物图像的疵点,本节实验中的参数α、p和q均分别设置为0.9、5和1。

表4 不同算法在图5中的VPC与VPETab.4 VPC and VPE in Fig.5 for the different algorithms %

图5 织物疵点图像分割结果Fig.5 Segmentation results of fabric defect images

从图5可知,对于4种类型的织物疵点图像,SIFCM和本文算法的视觉效果较清晰,基本上不存在噪声点,但SIFCM在分割褶子图像时,产生了较为严重的误分割,仅SKIFCM算法大致分割出了褶子图像的疵点。从表4可看出,SIFCM在分割竹节图像时的性能指标最好;其余3幅织物疵点图像中,SKIFCM算法的性能指标最好,且VPC和VPE的平均值分别为99.76%和0.40%,这是由于SIFCM和SKIFCM算法引入了空间信息,从而增强了对噪声的鲁棒性。

3.6 运行效率分析

核函数的引入有利于将低维空间中的非线性问题转变为高维空间中的线性问题,从而提高算法的聚类性能。然而,核函数的引入增加了计算复杂度,导致运行效率降低。由于FCM、IFCM和SIFCM算法均使用欧氏距离,故在此不做比较。

为了验证本文算法的运行效率,选取图像7~10对KIFCM和SKIFCM算法的运行效率做比较,结果如表5所示。可见,SKIFCM算法的迭代次数与运行时间都有所降低。这是由于本文在目标函数中引入隶属度约束惩罚项,通过竞争学习的思想,即加强最大隶属度,同时抑制其他隶属度,从而达到快速收敛的结果。

表5 不同算法在图4中分割时间与迭代次数Tab.5 Segmentation time and number of iterations in Fig.4 using different algorithms

4 结束语

本文提出一种隶属度修正的空间核直觉模糊聚类苗族服饰图案分割算法。该算法利用邻域空间信息,对局部像素分配权值,以提高像素聚类的准确性;同时引入隶属度约束惩罚项,加强最大隶属度,抑制其他隶属度,并使用核距离度量代替欧氏距离完成图像分割。含噪声的苗族服饰图案、彩色苗族服饰图案和织物疵点图像的分割结果表明,对比SIFCM、KIFCM、IFCM和FCM算法,所提算法具有良好的聚类性能,能正确分类像素点,去除图像的噪声和伪斑点,还能保留图像的边缘,得到清晰的图像;在色彩鲜艳、纹理复杂、样式多元化的苗族服饰图案分割中具有广阔的应用前景。与使用核距离的KIFCM算法相比,运行效率有一定提升,但所提算法分割彩色苗族服饰图案的时间仍然较长,如何提高算法的运行效率仍需连续研究改进。

猜你喜欢

模糊集直觉苗族
苗族蜡染
“好一个装不下”直觉引起的创新解法
基于上下截集的粗糙模糊集的运算性质
林文月 “人生是一场直觉”
一个“数学直觉”结论的思考
盛大节庆——苗族牯藏节
数学直觉诌议
苗族民歌
基于粗糙模糊集的输电杆塔塔材实际强度精确计算
苗族老照片