基于ELM的局部空间信息的模糊C均值聚类图像分割算法
2019-02-27陈秀宏
陈 凯 陈秀宏
(江南大学数字媒体学院,无锡,214122)
引 言
图像分割是图像处理中的关键所在,被广泛应用在人脸识别、医学影像及指纹识别等各种图像处理应用中。当前,图像分割方法有多种,比如区域增长法等。其中基于聚类方法被广为认同,硬C均值聚类算法和模糊C均值聚类算法(Fuzzy C-means algorithm,FCM)[1]是最常用的两种聚类算法。与硬C均值算法(Hard C-means algorithm,HCM)算法相比,FCM算法为每个像素的归属引入了模糊概念,保留了更多的纹理细节信息。
由于传统的FCM算法存在不足,只关注到图像像素灰度相似性,忽视了图像其他影响信息,从而导致FCM的分割结果不理想。为此,国内外学者研究了许多基于局部空间信息的改进FCM算法。Ahmed等[2]在FCM的目标函数中加入邻域项,提出了基于空间约束的模糊C均值算法(FCM algorithm based on space constraint,FCM-S),增强了抗噪声能力,但也增加了算法的时间复杂度。针对该问题,Chen和Zhang[3]用邻域像素的均值或中值来代替对应的像素点提出了FCM_S1和FCM_S2模型。该模型减少了算法计算时间,但模糊了图像的许多细节。于是,Cai等[4]提出了同时考虑邻域位置和像素关系的快速FCM聚类算法(Fast generated fuzzy C-means algorithm,FGFCM)。该算法虽在一定程度上抑制了噪声,却引入了太多人工参数,且分割精度不高。
对于参数比较多同时要人工进行设定的问题,文献[5]在经过研究之后,阐述了局部空间信息模糊C均值算法(Fuzzy local information C-means algorithm,FLICM),该算法引入了模糊影响因子,考虑邻域像素的空间信息和灰度信息,且参数不用人为设定,大大增强了算法适用范围。其全部参数能够自适应确定,在鲁棒性方面表现非常出色,能够让图像细节得到有效的保存。基于此,Gong等[6]在FLICM算法的基础上引入了像素点的邻域像素变异系数c_k,提出了修正的局部空间模糊C均值算法(Modi⁃fied fuzzy local information C-means algorithm,MFLICM)。若噪声高度污染图像时,在一个像素的邻域像素中可能会包含很多异常特征,容易出现分割错误。此外,局部空间信息的模糊C均值算法(Weight⁃ed fuzzy local information c-means,WFLICM)算法用欧氏距离作相似性度量,容易造成低维空间线性不可分现象。
为解决此问题,本文用非局部信息将邻域像素唯一标识化,并用核距离代替原来算法中的欧氏距离,提出了改进的新核局部空间信息的模糊C均值聚类图像分割算法(New kernel weighted fuzzy local information C-means,NKWFLICM)算法。为了解决数据在低维空间线性不可分现象并提高算法效率,本文基于ELM特征映射技术,先将原始数据通过ELM特征映射技术映射到高维ELM隐空间中,再利用NKWFLICM算法进行聚类,提出了基于ELM的局部空间信息的模糊C均值聚类图像分割算法(New kernel weighted fuzzy local information C-means based on ELM,ELM-NKWFLICM)算法。
1 局部空间信息的模糊C均值聚类算法
为了克服传统模糊C均值聚类算法在图像分割时仅利用像素点灰度值信息的问题,WFLICM算法继承了FCM算法的优势,同时还融入了邻域空间信息,综合像素点邻域框内像素点对中心点的影响,构造目标函数
式中:xi为在WFLICM算法中表示第i个像素点的灰度值,vj为在WFLICM算法中第j类的类中心灰度值,Gij为加入的模糊影响因子。相关定义具体为
式中:Ni表示像素点xi所在的邻域窗口;dik表示邻域窗口中的点xk与中心像素点xi的坐标位置距离;wik表示邻域内像素点影响因子权重,定义为
式中:ck为邻域像素点的变异系数。以中心像素点xk为中心,则
式中:var(x)代表邻域中全部像素点灰度值的方差;x为邻域内像素点灰度值的均值。
于是,由利用拉格朗日乘子法得到的隶属度更新公式为
2 新局部空间信息的模糊C均值聚类图像分割算法
WFLICM算法充分考虑了局部空间信息和局部灰度值关系对像素点的影响,在很大程度上降低了对噪声的敏感度。但当图像噪声污染严重时,一个像素点的邻域像素会存在异常特征,造成局部信息对中心像素点聚类的影响,因此发生错误。
如图1,以x像素点为中心的3×3邻域框内,a和b相对邻域中心点的位置相同,而以a和b点为中心的邻域像素点灰度值分布情况也相同,因此,在WFLICM算法中变异系数ca=cb。此时算法认为a点和b点会同等影响像素点x,这是错误的。若图像被更多噪声污染时,会有更多的异常情况出现,从而导致分割错误。基于此,本文引入非局部空间信息系数sik对每个邻域像素点的影响因子进行正确的标识。
图1 以x为中心的3×3邻域噪声情况Fig.1 Pixel x of 3×3 window with noise
式中:λ1和λ2分别为wik和sik的相对权重。实验经验表明,当λ1wik和λ2sik的值在相同数量级上时,该算法的性能表现最佳。
本文用高斯核距离[9-11]代替WFLICM算法中传统的欧式距离。本文提出改进的新核局部空间信息的模糊C均值聚类图像分割算法(Fuzzy C-means clustering image segmentation algorithm of the im⁃proved new kernel local spatial information,NKWFLICM)算法,NKWFLICM的目标函数为
式中:‖Φ ( xi)-Φ(vj)‖2在本文算法中表示在高维特征空间中定义的距离,Φ(∙)则表示从低维到高维空间的一种映射,具体定义表示为[12]
本文的核函数使用的是高斯核函数[13]
σ为函数的宽度参数,根据数据集波动程度决定,定义为[12]
于是,由拉格朗日乘子法得到隶属度更新公式为
3 ELM-NKWFLICM算法
极限学习机从本质上来讲是一种单隐层神经网络,能够随机产生输入层到隐含层权值,基于广义逆法精准地获得隐含层到输出层的权值,让实际与期望的输出偏差最低。极限学习机权值没有通过迭代训练取得,而通过计算获得,在训练速度、精度方面表现极为出色,其最初为解决单隐层前馈神经网络而提出。对于一个单隐层神经网络,假设有N个任意样本(Xi,ti),其中Xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tim]T∈Rm。一个有L个隐层节点的单隐层神经网络可以表示为
式中:g(x)表示激活函数,Wi=[wi,1,wi,2,…,wi,n]T表示输入权重,βi为输出权重,bi是第i个隐层单元的偏置。其目标是使得输出的误差最小,可以近似表示为
即存在βi,Wi和bi,使得
可用矩阵表示为
式中:H为隐层节点的输出;β为输出权重;T为期望输出。
基于ELM的局部空间信息的模糊C均值聚类图像分割算法(Fuzzy C-Means clustering image seg⁃mentation algorithm with local spatial information based on ELM,ELM-NKWFLICM)首先基于ELM特征映射技术,将原始数据通过ELM特征映射技术映射到高维ELM隐空间中,隐藏层将数据从输入空间Rd映射到执行数据聚类的高维特征空间RL(L≤d),再利用NKWFLICM算法进行聚类,可以使得NKWFLICM算法能够在新的空间探索固有的数据结构并提高算法分割精度和效率。
ELM-NKWFLICM算法:
(1)给定一个数据集D,激励函数g(x)和隐含层节点数L。
(2)随机生成输入权重Wi和偏置bi,i=1,…,L。
(3)计算隐含层输出矩阵H。
(4)在隐含层输出矩阵H上用NKWFLICM算法进行聚类。
4 实验研究与分析
为了对ELM-NKWFLICM算法图像分割性能进行测试,本文进行了对比实验,涵盖了人工合成、医学以及自然3种类型图像。相关运行环境是Matlab 2014b。以下实验中设定模糊指数m=2,迭代阈值ε=0.001,最大迭代次数T=500,Ni为3×3邻域窗口,λ1=1,λ2=30。本次实验把快速模糊C均值算法(Fast and generalized FCM,FGFCM)[14]、WFLICM和核空间模糊局部信息C⁃均值聚类算法(Kernel weighted fuzzy local information C-means,KWFLICM)当作实验对比算法。
4.1 人工合成图像分割实验
实验围绕人工合成图像进行,总数为3张,添加的高斯以及椒盐噪声强度有差异。对比分析图像分割算法的抗噪声能力,常采用分割准确(Segmentation accuracy,SA)指标来衡量其好坏。SA是指正确分类的像素点占总分割像素点的百分比,代表图像分割精度为
式中:c为分割类数;Ai为算法分割到第i类的像素点;Ci为图像中属于第i类的像素点集。
第1张合成图像分4类共256像素×256个像素点,灰度值分别为0,100,145,199。图2是4种算法在图像中添加均值为0方差为0.02高斯噪声后的分割结果。从分割结果可以看出,FGFCM算法的分割图去噪效果最差;WFLICM算法,KWFLICM算法和ELM-NKWFLICM算法去噪效果最好,不过,在细节保留上和噪声去除上本文算法要明显优于改进前的算法和传统算法。
图2 第1张人工合成图像分割实验Fig.2 Segmentation result of the first Synthetic image
4种算法在第1张合成图像上的分割精度如表1所示。从表1可以看到,随着高斯噪声强度越来越大,对比算法会有着越来越低的SA值,而本文算法SA值却有着很小的变化,表现出更好的鲁棒性。在实际运用中有一定的实际意义。
第2张合成图像分4类共244像素×244个像素点,灰度值分别为0,85,170,255,分割结果如图3所示。从分割结果可以看出,FGFCM算法和WFLICM算法的分割图去噪效果最差;KWFLICM算法和ELM-NKWFLICM算法在去噪声和保持边缘细节上表现最好,几乎不受噪声影响,分割图几乎和原图一致。4种算法在第2张合成图像上的分割精度如表2所示。由表2可以看到,高斯噪声有着越来越大的强度,此时其他算法的SA值出现明显下降,本文算法变化最小,表现出更好的鲁棒性。在实际运用中有一定的实际意义。
第3张合成图像分为4类共256像素×256个像素点,灰度值分别为32,150,201,255。图4给出了4种算法在第3张图像受均值为0,方差为0.03的高斯噪声污染后的分割结果。FGFCM算法只能去除少
部分高斯噪声;其次是WFLICM算法,分割图上还能明显看到噪声点;KWFLICM虽然有较强的去高斯噪声能力,但明显ELM-NKWFLICM算法的分割图像上噪声点更少,说明该算法有着很强的去高斯噪声能力。表3主要为4种算法在第3张合成图像受不同类型噪声污染后的分割精度。SA数据明显说明不论是对椒盐噪声还是高斯噪声,ELM-NKWFLICM算法较其他3种算法有更好的去噪声能力且鲁棒性最好。
表1 4种算法在第1张合成图像上的分割精度Tab.1 Segmentation performances comparison of four algorithms on the first synthetic image%
图3 第2张人工合成图像分割实验Fig.3 Segmentation result of the second synthetic image
表2 4种算法在第2张合成图像上的分割精度Tab.2 Segmentation performances comparison of four algorithms on the second synthetic image%
图4 第3张人工合成图像分割实验Fig.4 Segmentation result of the third synthetic image
表3 4种算法在第3张合成图像上的分割精度Tab.3 Segmentation per for mances compar ison of four algorithms on the thir d synthetic image%
4.2 医学图像分割实验
医学图像容易受到莱斯噪声[14-15]的污染。图5显示了一张的大脑切片影像图像大小为256像素×256像素,受20%的莱斯噪声污染。从分割结果可以看出,FGFCM算法、WFLICM算法和KWFLICM算法的分割图依然存在着一些噪声点,ELM-NKWFLICM算法表现更好,图像细节也保留最好。
图5 医学图像分割实验Fig.5 Segmentation results on medical image
表4给出了3种分割精度较高的算法(WFLICM算法、KWFLICM算法和ELM-NK⁃WFLICM算法)分割医学图像的时间花费,数据说明ELM-NKWFLICM算法的分割时间效率比另两种算法要更高。
4.3 自然图像分割实验
实验用3张自然图像来比较4种算法在处理自然噪声图像时的分割性能。图6—8分别显示了摄影者、花朵和琳娜3张图像,并且分别被椒盐(0.02)噪声、高斯(0,0.03)噪声和椒盐(0.02)噪声污染。从实验结果可以看出,ELM-NKWFLICM算法分割图要比其他算法分割图去噪效果更好,纹理也更为细腻,表现出本文算法对含噪声的自然图像分割能力要优于其他3种算法。表5给出了3种分割精度较高的算法(WFLICM算法、KWFLICM算法和ELM-NKWFLICM算法)分割图像的时间花费,数据说明ELM-NKWFLICM算法的分割效率比另两种算法要更高。
表4 3种算法在医学图像上的时间对比Tab.4 Time comparison of three algorithms on medi⁃cal image s
图6 第1张自然图像分割实验Fig.6 Segmentation results on the first natural image
图7 第2张自然图像分割实验Fig.7 Segmentation results on the second natural image
图8 第3张自然图像分割实验Fig.8 Segmentation results on the third natural image
表6给出了3种分割精度较高的算法(WFLICM算法、KWFLICM算法和ELM-NKWFLICM算法)分割第2张自然图像的时间花费,数据说明ELM-NKWFLICM算法的分割时间效率比另两种算法要更高。
表5 3种算法在第1张自然图像上的时间花费Tab.5 Time cost of three algorithms on the first natu⁃ral image s
表7给出了3种分割精度较高的算法(WFLICM算法、KWFLICM算法和ELM-NKWFLICM算法)分割第3张自然图像的时间花费,数据说明ELM-NKWFLICM算法的分割时间效率比另两种算法要更高。
表6 3种算法在第2张自然图像上的时间花费Tab.6 Time cost of three algorithms on the second natural image s
表7 3种算法在第3张自然图像上的时间花费Tab.7 Time cost of thr ee algorithms on the thir d natural image s
分析结果,ELM-NKWFLICM算法表现出更优秀的去噪声能力和更好的鲁棒性,并且在保证高精度分割的情况下花费时间最短。
5 结束语
本文提出了ELM-NKWFLICM算法,实验结果表明该方法具有强大而高效的图像分割能力。同时,算法对模糊指数和隐节点数目等重要参数不敏感,解决了参数选择困难的问题,极限学习机技术的应用提高了算法效率,减少了图像分割时间。此外,本文在WFLICM算法的基础上,充分融合了非局部空间信息系数,从而实现邻域像素点对中心点影响因子的正确标识。通过不同类型的分割实验证明了本文算法的优秀去噪声能力和良好的鲁棒性,图像细节同时也得到了一定的保留,具有一定的实际应用价值。由于ELM隐空间随着隐节点数目的增加,会造成效率逐步降低且引入噪声,以后可以根据这点进一步优化模型。