基于加权像素距离和相对熵的模糊C均值聚类改进算法研究
2020-06-09
南京医科大学附属南京医院(南京市第一医院) 放射科,江苏 南京 210006
引言
图像分割是把图像分成若干个特定的、具有独特性质的区域,并提出感兴趣目标的技术和过程,每个像素将被归入一个特定的类别[1-3]。图像分割是图像分析重要组成部分,在视觉分析、医学诊断与外科手术等方面应用广泛。目前图像分割算法主要包含阈值法、边缘检测、区域增长、基于统计分析、聚类分析和人工神经网络等算法[4]。其中阈值法简单高效,当背景和目标的直方图分界明显时具有可行性,但对灰度分布复杂且噪声显著图像很难达到预期效果;基于边缘检测算法受噪声和阈值选取影响较大,图像边界分割准确性差,容易丧失重要细节;区域增长算法是阈值法在图像均匀性和联通性方面的延伸,人工神经网络算法参数多,运算复杂,分割结果受训练数据和输入参数影响较大。
聚类分析算法属于无监督算法,无需训练数据,数据分类主要取决于像素位置和像素到聚类中心距离[5]。其中模糊C均值算法是应用最广泛的分类方法,分割结果较为准确,但FCM算法不能利用图像空间信息,且同样对噪声敏感。本研究提出一种基于加权像素距离和相对熵的FCM改进算法,并验证其有效性。
2 方法
2.1 标准FCM算法
模糊C均值算法主要思想是将N个L维向量分为C个模糊组,通过不断更新图像像素隶属度和聚类中心,使得目标函数达到最小,从而完成像素分类和图像分割[6-7]。像素隶属度函数是用来描述像素z属于一个图像B的程度,一般假定为B(z),其中z为图像矩阵B中任意像素,B(z)的取值范围为[0,1]。在隶属度函数的基础上,可称空间Z={z}的隶属度函数为一个模糊集合。FCM算法的目标函数和约束条件由公式 (1)给出[8],其中μ={μ1,…,μc}表示μin=μi(xn)的像素隶属度的一个模糊子集,m是一个大于1的模糊加权系数,常取2,νi={v1,…,vC}表示第i个聚类中心,(xn,vi)=||xn-vi||2表示第n个像素到第i个聚类中心的欧式距离。
目标函数最小值可采用拉格朗日乘数法计算,如公式(2),分别对参数λ和隶属度μin求导可得隶属度和聚类中心,如公式(3)和(4),直到|μ(k+1)-μk|<β(设定的阈值)停止迭代,完成聚类优化过程。
虽然FCM算法能通过像素隶属度进行图像模糊分类,但是从公式(1)可知,FCM算法仅将图像像素独立看待,并未关注图像像素空间的联结性与局部特征,且公式(4)隶属度函数中像素相似性测度由像素灰度与聚类中心的刚性距离决定,易受噪声影响造成误分类。
2.2 改进的FCM算法
为了克服标准FCM算法局限性,多种改进算法被提出[8-10],Yushkevich等[8]采用邻域区域加权距离改善欧氏距离对噪声的敏感性,Tak等[9]采用邻域隶属度调整目标函数,对于邻域内多数像素属于同一类别时赋予更大的隶属度,可在一定程度提升分割性能。本研究结合上述两种方法优势,采用加权像素距离和相对熵构造目标函数,如公式(5),其中加权像素距离能充分利用像素的空间信息,相对熵可根据邻域内像素隶属度调节当前像素隶属度,使得像素隶属于最接近于真实分布,其中γ为模糊加权系数,πin是局部区域Nn中k个像素隶属度的均值,改变πin大小可调整像素到聚类中心距离din,起到平滑噪声的作用,见公式(6)。对公式(5)求极小值可得第i个像素隶属度μin和聚类中心νi,由公式(7)和(8)可得。
2.3 图像分割评价指标
本研究图像分割效果定性分析主要基于视觉效果,定量评价指标采用分割错误率(Misclassified Pixels Ratio,MCP)[11-12]、划分系数(Partition Coefficient,VPC)[13-14]、划分熵(Partition Entropy,VPE)[15]、和 Xie-Ben 系数(Xie-Ben Coefficient,VXB)[16],如公式(9)~(12)所示。MCP和VPE越小,VPC和VXB越大,表明图像分割效果越佳。
其中Nfp代表不属于目标却被分割为目标的像素数,Nfn代表属于目标却未被分割成目标的像素数,N为图像总像素数量,μin表示第n个像素xn隶属于第i类的隶属度。
3 结果与分析
将本文提出的FCM聚类改进算法与标准FCM算法、基于局部数据距离的FCM算法(Local Data Distance Based FCM,LDFCM)、基于局部隶属度信息的FCM算法(Local Membership Based FCM,LMFCM)等算法进行比较。选用三组图像进行仿真实验:① 人工合成的灰度图像;② 选自测试数据库的Lena图像;③ 真实的脑部MR-T1加权图像。所有算法测试均在Matlab 2013a编程环境下仿真实现。
3.1 人工合成的灰度图像分割结果
首先选用一幅人工合成的4灰度类别图像进行模拟实验,该图像(图1a)包含4个方格,方格矩阵大小为64×64。在原图像中加入信噪比为3.5 dB的高斯噪声得噪声图像(图1b)。各算法参数设置如下:FCM算法C=4,LDFCM算法a=0.4,LMFCM算法p=1,q=2,本研究算法γ(t)=6000*exp(-t/100),迭代次数t取20,领域矩阵大小为3×3。由图1视觉评判可知,四种算法均能分离4个类别图像,但标准FCM算法、LDFCM算法和LMFCM算法所得图像中均存在像素误分类现象,基于本研究算法的图像各类别边界清晰,图像噪点最少。定量评估结果见图2和表1,基于本研究算法的不同噪声水平图像分割MCP均最低,且在噪声水平为 0.02时,MCP(0.02%)、VPC(0.9986)、VPE(0.0024)和VXB(0.2114)均优于其他FCM算法,
图1 不同算法合成图像分割结果
图2 基于不同分割算法所得不同高斯噪声水平图像分割错误率
3.2 Lena测试图像分割结果
第二幅Lena测试图像来自Brainweb网站,矩阵大小256×256,加入均值为0、标准差为0.02得到信噪比为4.1 dB的噪声图像(图3b)。算法参数设置如下:γ(t)=2000·exp(-t/100),图像分为2类,其余参数同前。图3视觉分析可知,基于本研究算法的分割图像(图3f)噪声被显著压制,其余算法所得图像噪点明显;由表2定量评估结果显示,本研究算法所得VPC达到0.9905,VPE降至0.0143,VXB提升到0.1882,且本研究算法的分割性能指标均显著优于其他FCM算法(均P<0.05),表明本研究提出的算法能改善对噪声敏感性,显著提升分割精度。
图3 不同算法的Lena图像分割结果
表2 Lena图像的分割结果评价(±s)
表2 Lena图像的分割结果评价(±s)
算法 VPC VPE VXB FCM算法 0.8294±0.00050.2817±0.00070.0872±0.0004 LDFCM算法 0.7999±0.00050.3296±0.00080.1147±0.0006 LMFCM算法 0.9383±0.00040.1019±0.00060.1388±0.0005本研究算法 0.9905±0.00060.0143±0.00090.1882±0.0014
3.3 临床实例图像分割
选用临床实例脑部MR-T1加权图像,矩阵大小256×256,加入椒盐噪声水平0.02得信噪比为18.9 dB噪声图像(图4b),算法参数设置同前,除了γ(t)=700·exp(-t/70)。
图4 不同算法的脑部MR图像分割结果
表1 噪声水平0.02的人工合成图像分割结果评价(±s)
表1 噪声水平0.02的人工合成图像分割结果评价(±s)
算法 MCP (%) VPC VPE VXB FCM算法 21.70±0.20 0.7934±0.0007 0.3998±0.0012 0.0481±0.0003 LDFCM算法 11.40±0.10 0.7564±0.0008 0.4735±0.0014 0.1028±0.0010 LMFCM算法 16.90±0.10 0.9318±0.0005 0.1139±0.0007 0.0596±0.0004本研究算法 0.09±0.03 0.9986±0.0003 0.0024±0.0009 0.2114±0.0019
由图4分割图像可知,基于本研究提出算法所得图像中脑白质、灰质和脑脊液被完整提取,且图像噪点显著少于其他三种算法。表3定量评估结果显示,本研究算法的分割性能指标最优,其中VPC达到0.9748,VPE降至0.0177,VXB提升到0.1784;其次是LMFCM算法,LDFCM算法与标准FCM算法性能最差,表明本研究提出的分割算法在临床实例应用中仍然表现优越。
表3 临床实例MR图像的分割结果评价(±s)
表3 临床实例MR图像的分割结果评价(±s)
算法 VPC VPE VXB FCM算法 0.8361±0.0004 0.3159±0.0007 0.1072±0.0018 LDFCM算法 0.8407±0.0010 0.3656±0.0012 0.1546±0.0020 LMFCM算法 0.9475±0.0004 0.0877±0.0006 0.1711±0.0031本研究算法 0.9748±0.0007 0.0177±0.0014 0.1784±0.0024
4 结论
本研究提出一种基于加权像素距离和相对熵的FCM改进算法,并用于人工合成图像和临床实例图像分割。邻域像素隶属度均值化可对像素到聚类中心距离进行加权,既充分利用图像空间信息,又起到平滑噪声作用;相对熵进一步调节像素隶属度,使得像素分类更接近真实状态,减少错误分类。仿真实验结果表明,基于本研究提出的FCM改进算法,能有效抑制噪声,精确分割图像,获得高质量的分割图像,是一种可行的图像分割算法。