基于SLIC和马氏距离混合核函数聚类的脑肿瘤图像分割算法

2021-07-21王志刚冯云超

城市学刊 2021年4期

王志刚，冯云超，黄灌

(湖南师范大学信息科学与工程学院，长沙 410081)

近年来，脑肿瘤的发病率和死亡率正在逐年攀升，且患者多为恶性肿瘤，它对人类的生命健康造成了严重的危害[1]﹒利用计算机技术准确获得脑肿瘤的尺寸和位置等信息，能够帮助医生作出准确的诊断[2]，同时，在手术定位、创建病情档案、建立肿瘤模型等方面也有重要作用[3]﹒因此，将脑肿瘤图像从MRI影像中准确地分割出来对脑部疾病的诊断具有重要的意义﹒

在临床中，通常由医生手动绘制脑肿瘤边界，这不仅需要医生掌握较多的专业知识，还会耗费大量的时间和精力，且分割结果易受主观因素的影响，可能会因医生水平的不同而出现明显的差异﹒因此，实现脑肿瘤图像的自动分割，一直是学者们研究的热点问题﹒

模糊C均值聚类(fuzzy c-means, FCM)算法是一种经典的图像分割算法，也是一种无监督的聚类分析方法，已被广泛应用于医学图像分割领域[4]﹒但是，该算法对噪声较为敏感，且初始聚类中心随机确定，容易陷入局部极值，当不同类别样本特征差异较小时，聚类精度较差﹒为此，学者们进行了大量的研究和改进，祖志文等[5]使用粒子群算法初始化聚类中心，提高了算法的稳定性；Yang等[6]提出一种基于核函数及空间邻域信息的模糊聚类算法，扩大了不同样本间的特征差异，提高了算法的抗噪性；王燕等[7]将核函数与马氏距离相结合，提出了KM-FCM算法，增强了算法的噪声鲁棒性﹒

针对传统模糊 C均值聚类算法对噪声敏感，初始聚类中心不确定，聚类精度不高以及无法对脑肿瘤MRI图像准确分割的问题，本文将马氏距离混合高斯核函数引入到模糊C均值聚类算法中，结合 SLIC算法和粒子群算法，提出一种新的脑肿瘤图像分割方法，研究其分割精度和有效性﹒

1 各向异性滤波

传统消噪方法虽然能较好地去除噪声，但却损害了原信号的强度，模糊了图像的边缘，不能很好地满足医学图像分割的需要﹒因此，本文采用各向异性滤波进行图像的预处理，在去除噪声的同时还可以把图像的边缘较好地保留下来﹒

各向异性滤波是把图像看成物理学的力场或热流场，图像像素总是朝着跟其值差异不大的地方流动，那些差异大的地方(边缘)得以保留﹒因此，各向异性滤波本质上是图像边缘保留滤波器(EPF)[8]，其在各方向上的扩散可表示为

其中Dq是扩散因子﹒不同时刻的扩散过程可以表示为

其中，I表示输入的图像；t表示当前的迭代次数；cNx,y，cSx,y，cEx,y和cWx,y分别表示4个方向的导热系数，见公式(3)﹒

2 算法描述

2.1 线性迭代聚类预分割

为避免残留噪声和散点对图像分割造成干扰，

本文首先采用 SLIC算法对图像进行预分割﹒简单线性迭代聚类(simple linear iterative clustering,SLIC)算法是Achanta等[9]提出的一种新的聚类算法，它能够生成大量形状规则、相对均匀的超像素块，可以有效避免过分割和欠分割现象﹒SLIC算法的具体步骤[10]如下：

1)初始化种子点﹒假设图像有N个像素点，首先，将其分为K个超像素块，则超像素块尺寸约为N/K，超像素块间的距离可用来表示；其次，计算出所有像素点的梯度值，为避免影响后续的聚类结果，让种子点在邻域3×3的窗口内移动，并且保证其移动到梯度值最小的位置上，以防止种子点被分配到影像的边缘位置或噪声点的位置；最后，分配对应标签到每个种子点上﹒

2)相似性度量﹒对每个像素点进行搜索，计算出像素点与种子点之间的相似程度(包括颜色距离和空间距离)，不断迭代直到算法收敛﹒其距离关系为

其中，lk,ak,bk,xk,yk表示种子点的 5维特征值，li,ai,bi,xi,yi为等待判断的像素点的 5维特征值，且l表示亮度，a,b表示颜色分量，x,y表示像素坐标；dlab表示像素点间的颜色相似程度；dxy表示邻域内像素点的空间距离；s为间距大小；m用来衡量颜色信息与空间信息的相似比重；D代表2个像素点的相似度大小﹒

2.2 粒子群算法确定聚类中心

粒子群优化(particle swarm optimization, PSO)算法是由Kennedy和Eber-hart提出的群智能优化算法[11]﹒其具体流程如下：

在D维搜索空间中，由N个粒子汇聚成1个群落，群落中的每个粒子都在寻找自己的最佳位置，可用Xi= (xi1,xi2,…,xiD)表示第i个粒子的位置，Vi= (vi1,vi2,…,viD)表示其速度；在搜寻过程中，个体的最优位置定义为pi= (pi1,pi2,…,piD)，记为pibest；群体中的所有粒子在先前搜寻过程中的最佳位置表示为gibest；粒子的速度和位置更新公式为

其中，c1和c2为学习因子；r1和r2是2个随机值，取值范围为[0, 1]；w是惯性权重﹒

当惯性权重w值偏大时，算法拥有较强的全局搜索能力；其值偏小时，则拥有较强的局部搜索能力﹒因此，本文采用线性变化的权重，即

其中，wmax表示w的最大值，通常取0.9；wmin表示w的最小值，通常取0.4；t表示当前的迭代次数；tmax表示最大迭代次数﹒

2.3 基于马氏距离混合核函数的聚类算法

2.3.1 混合核函数聚类

设X=｛x1,x2,x3,…,xn｝是原始空间Rs经非线性变换映射至特征空间Rp的1个样本集，则混合核函数聚类算法在高维特征空间下的目标函数可表示为

其中，m为模糊控制指数；c代表聚类数目；φ(vi)为聚类中心在相应核空间中的像；uij为第j个数据对第i类的隶属度；表示特征空间中φ(xj)至φ(vi)的欧氏距离﹒

在进行数据映射时，传统的核模糊聚类算法(KFCM)一般采用单一的高斯核函数进行映射，其定义为

其中，σ表示数据的标准差；表示原始空间中x至y的欧氏距离﹒

由于单一高斯核函数只有唯一的可调参数σ，所以其具有很强的局部性，导致聚类算法的学习和泛化能力不强[12]﹒本文采用混合高斯核函数替代单一高斯核函数，这样就可以通过调整多个σ参数来优化样本数据在核空间中的分布，从而提高核模糊聚类算法的性能﹒混合高斯核函数的定义为

其中，σl为高斯核参数；αl为各核函数的权重因子，满足

2.3.2 马氏距离混合核函数聚类

传统高斯核函数虽具有很强的适应性，但其对数据差异性的度量方式是欧氏距离，而欧氏距离并没有考虑特征之间可能存在的耦合关系，因此它不能有效地描述2个样本点之间的全局性关系，往往不能取得令人满意的效果﹒

马氏距离是由印度统计学家 Mahalanobis提出的[13]，因其引入了协方差矩阵，所以可以更好地描述2个样本点之间的全局性关系，其定义为

其中Σ为样本的协方差矩阵﹒

基于马氏距离的混合高斯核函数则可表示为

将数据通过马氏距离混合核函数映射至特征空间后，φ(xj)至φ(vi)的欧氏距离可利用核函数表示为

因此，该算法的目标函数可进一步表示为

再根据拉格朗日乘数法，可以分别求得隶属度和聚类中心的迭代公式为

2.4 算法步骤

本文所提算法的具体实现步骤如下：

1)使用各向异性滤波对图像进行预处理，设定迭代次数t=20，导热系数k=15，平滑系数λ= 0 .15﹒

2)用简单线性迭代聚类算法对预处理后的图像进行分割，超像素块大小设为15个像素﹒

3)设定粒子群算法的相关参数，即粒子群规模N=30，最大迭代次数tmax=30和学习因子c1=c2=2 ，并求得初始聚类中心v0﹒

4)设定聚类数目c=3，迭代终止条件ε=10-5，最大迭代次数Tmax=100，高斯核数目g=2，高斯核参数σ1=150，σ2=20，约束系数λ=0.6﹒

5)输入由步骤3)获得的初始聚类中心v0，再根据式(17)～式(18)，不断更新聚类中心vi和隶属度矩阵U﹒如果或者达到最大迭代次数，则停止迭代；若不满足上述条件，则继续执行本步骤﹒

6)迭代停止后，根据最终得到的隶属度矩阵把目标像素指定为相应的最佳聚类中心的值，并输出图像﹒

7)结合形态学对图像进行后处理，即平滑脑肿瘤图像的边缘﹒

3 实验结果及分析

3.1 实验环境

本次实验的脑肿瘤MRI图像来自BraTS2018数据库，该数据库的MRI图像提供了4种图像序列，分别是T1，T1c，T2和FLAIR﹒由于FLAIR图像序列在成像过程中水分子信号被抑制，故常被用于肿瘤诊断[14]，本文亦选择该图像序列﹒实验环境为Windows10、AMD Ryzen 5 3500U处理器、16 GB内存，以及Matlab 2018a﹒

3.2 抗噪实验

由于 MRI图像在成像过程中经常受到高斯噪声的干扰，所以在图像中分别添加方差为0.005，0.01，0.02和0.03的高斯噪声，并用本文所提算法对MRI图像进行分割，结果如表1所示﹒

表1 不同强度噪声下的分割结果

由表1可知，当噪声方差为0.005～0.02时，分割结果相对稳定，能较好地将脑肿瘤图像分割出来，这说明算法具有良好的抗噪性；当噪声方差为0.03时，消噪后的图像开始变得模糊，脑肿瘤图像的边缘部分开始出现误分割的现象﹒

3.3 脑肿瘤分割实验

为了验证所提算法分割脑肿瘤图像的有效性，从BraTS2018数据库中随机挑选某位患者的脑肿瘤MRI图像，抽取3个层面进行图像分割，并且分别与FCM算法[15]和KFCM算法[16]的分割效果进行对比，结果如图1～图3所示﹒

图1 切片1分割效果对比

图2 切片2分割效果对比

图3 切片3分割效果对比

从图1～图3可看出，在FCM和KFCM算法的分割结果中，脑肿瘤图像的边缘部分出现了一定程度的误分割现象，且有一定的散点存在；本文算法则能较好地处理脑肿瘤图像细节，且分割后无明显散点，其分割效果最接近于真值图像﹒

为了避免主观评价因素的影响，本文选择Dice，Jaccard，Sensitivity和Accuracy共 4个评价指标对算法分割精度进行评估，其定义分别为

其中，TP为正确分割的目标区域；FP为误分割的目标区域；FN为没有检测到的目标区域；TN为一定的非目标区域﹒

仍以上述3幅脑肿瘤MRI图像为例，将本文算法与FCM算法和KFCM算法的4项评价指标进行比较，结果如表2所示﹒

表2 本文算法与其他算法的分割性能对比

由表2可以看出，本文算法相较传统聚类算法在各指标上均有一定提升：Dice平均值相较传统算法高出2.21%～2.69%；Jaccard平均值相较传统算法高出3.97%～4.78%；Sensitivity平均值相较传统算法高出5.31%～6.39%；Accuracy平均值相较传统算法高出0.22%～0.26%﹒在脑肿瘤图像分割中，通常以Dice和Jaccard作为主要指标，其值越接近 1，代表分割效果越好﹒本文所提算法从实验中得出的Dice平均值和Jaccard平均值均较高﹒

4 结束语

本文所提脑肿瘤图像分割方法，利用各向异性滤波进行图像预处理，具有良好的抗噪性；通过粒子群算法确定初始聚类中心，提高了算法的稳定性；利用多个马氏距离高斯核函数进行数据映射，可以优化算法的分割性能﹒实验结果表明，与FCM算法和KFCM算法相比，所提算法具有较好的噪声鲁棒性，其分割精度更高，能将脑肿瘤图像从脑MRI影像中准确地分割出来，是一种有效的脑肿瘤图像分割算法﹒但本算法也存在一定缺陷，如高斯核的各参数和权重不能自动调节，需要人为干预，这将是下一步研究的重点﹒