一种改进分水岭乳腺肿块图像分割方法
2016-01-19李东红宋立新牛滨
李东红++宋立新++牛滨
摘要:针对分水岭算法对噪声敏感、易产生过分割现象的问题,在图像的滤波和区域合并方法上做了改进.该算法首先对肿块图像做初步预处理,设计高斯差分滤波器,实现平滑滤波,增强图像的信噪比,并计算图像的梯度幅值;然后,依据传统分水岭变换算法进行粗分割,计算各个子区域的灰度均值并排序,依次合并灰度均值相似的区域,直到将整个肿块区域完整分割出来;最后,保留合并后灰度均值最大的肿块区域,去除灰度值较小的区域,得到最后的分割结果.实验结果表明:该算法相较于三层地形分割方法、自适应区域生长算法和二次分水岭算法,能够得到更准确的肿块边缘轮廓,误分率减少到23.07%,运行速度高.
关键词:高斯差分滤波;分水岭变换:灰度均值;区域合并
DOI:10.15938/j.jhust.2015.05.005
中图分类号:TN911.73
文献标志码:A
文章编号:1007-2683(2015)04-0025-05
0 引言
乳腺钼靶X射线成为乳腺癌早期诊断的重要依据,乳腺肿块的分割是医生进行高层次图像处理及图像分析的重要基础,肿块图像分割是将图像中互相不交叉的感兴趣区域(ROI,Region of Interest)和背景区分开,每个区域都满足特定区域的一致性特点.因为分水岭算法可以得到比较窄的、封闭的分割线及对细微的灰度变化非常敏感等特点心,应用在乳腺肿块分割中可以实现比较好的效果.
然而,分水岭算法在分割图像时会受到肿块周围的腺体、血管、脂肪组织等干扰,使算法对图像中的伪边缘进行误判,分割出过多小区域,造成过分割现象.国内外许多学者已对分水岭分割算法的缺点进行了改进.文提出一种基于分水岭和核聚类算法的图像分割算法,对分割成的多个小区域进行聚类分析,但由于数据量的有限性,聚类分析不能得到准确的肿块轮廓.文利用区域邻接图的邻接数据结构描述过分割区域之间的关系,采用分级阈值合并的方式完成区域快速合并,而肿块与周围腺体组织的灰度相似性会导致误分割,从而影响分割精度.文提出一种结合形状特征和改进标记分水岭的图像肿块方法,自适应的选择形态学参数,但肿块的形状特征参数复杂多变,尤其是恶性肿块,很难确切构建适应性强的形状模板,不能得到准确的肿块轮廓.
本文在分水岭分割算法对背景噪声非常敏感的情况下,对肿块图像感兴趣区域做初步预处理后,设计高斯差分滤波器,将二维滤波器分解成两个一维的高斯滤波核函数,与原图像卷积滤波,得到对比度增强的图像.应用基于传统标记分水岭算法进行粗分割得到多个小区域,标记子区域,计算各个区域的灰度均值并排序,合并灰度值相似的区域,直到得到完整的肿块轮廓.最后保留灰度均值最大的区域,去除灰度均值较小的区域,得到肿块边缘的准确分割图像.
1 图像预处理
首先利用最小二乘平面拟合的方法拟合出背景平面,将原来的ROI图像与背景平面差运算后的图像进行线性拉伸得到去除背景的图像.然后利用形态学方法增强图像的对比度,得到肿块所在的高亮度感兴趣区域,最后,进行高斯差分滤波,增强图像对比度,尽可能保留图像的边界信息,得到梯度图像.
2.1 背景去除
首先利用多点最小二乘方法拟合背景平面,设背景平面方成为:
那么对于一系列的n个点(n≥3),记为(Xi,yi,Zi),i=0,1,2,…n-1要拟合出背景平面则需要求出拟合值与原ROI图像的背景平面值之间的平方和,如:
解上述线性方程,的到系数a0、a1与a2,代人式(1),即得到感兴趣区域的背景平面,再将原图像与背景平面做差运算后得到去除背景趋势结果.
1.2 形态学增强
高帽变化(Top-hat)是原始图像与图像开运算结果之差,低帽变化(Bot-hat)是图像的闭运算结果与原始图像之差,假设原始图像为f,结构元素为b,高、低帽变化的定义为:
高帽变换:
低帽变化:
高帽变化具有高通滤波的特性,常用于暗背景上的亮物体,突出图像的高亮度区域;低帽变化能检测出图像的像素谷值,常用于亮背景上的暗物体,突出肿块图像的背景区域.
形态学增强的步骤是将高帽变化的图像与原图像做和,再与低帽变化的图像做差,最后对图像数据进行取反运算,达到图像灰度增强效果.
1.3 高斯差分滤波算子
高斯滤波器是一种根据高斯函数的形状来选择权值的线性平滑滤波器.本文设计的高斯差分滤波器的基本思想是:由高斯函数的可分离性得到,将二维高斯滤波器用两个一维滤波器逐次卷积来实现,一个沿水平方向,一个沿垂直方向,可以提高滤波效果和计算速度.两个一维高斯核函数的公式为:一维高斯低通滤波核函数为: 一维高斯高通滤波核函数为:
在进行边缘检测处理时,用高斯函数的一阶导数作为阶跃边缘的检测算子,计算梯度幅值.先对图像进行横向平滑,后纵向求导;然后纵向平滑,再横向求导,对图像进行滤波.最后将高斯函数在垂直和水平方向上的方向导数与图像的卷积得到图像在水平和垂直方向的梯度Ex,Ey,计算公式为:
其中, (x,γ,σ)是高斯滤波算子;I(x,y)是原始图像;*是卷积符号,
下图是对图3中的原图像进行水平方向和垂直方向高斯平滑滤波的结果.
2 传统分水岭分割算法
分水岭算法是基于拓扑理论的形态学分割方法,本文分水岭过程通过模拟浸水的过程来说明,在每个局部极小值刺穿一个小孔,然后在整个模型慢慢浸水的过程中,随着浸水加深,每一个局部极小值的影响域慢慢向外扩展,在两个集水盆汇合处构筑大坝,即形成分水岭.传统分水岭分割算法的步骤是:
Stepl:读取乳腺图像,进行梯度扫描,按每个像素的灰度级进行从低到高排序;
Step2:分别标记肿块图像的前景和背景,记录存储标记区域的像素的极小值;
Step3:通过扩展极小值,集水盆地汇合,得到区域分水岭,并分割出图像不同的区域并作不同标记.
本文选取了美国南佛罗里达大学构建的数字乳腺X线图像数据库(DDSM,Digital ciata})ase forscreenlng mammography)中100幅图像进行算法测试,下面选取边界清晰(circumscribed)和边界欠模糊(ill-defined)的两幅图像进行实验的处理结果为:
结果显示:图2存在的过分割现象,需要将多个小区域进行合并才能得到完整的肿块边缘轮廓.图3是部分区域已经包含了肿块区域所在的位置,但是需要去除周围腺体组织的干扰区域,得到最终的分割结果.
3 基于灰度均值的区域合并本文采用基于灰度均值的合并方法,达到抑制过分割现象的目的.各个区域的平均灰度值的计算方法为:扫描区域标记值,提取所在像素的横纵坐标,再查找原图像中相应坐标的灰度值并存储求和,最后再除以所标记区域的面积Area,最后将平均灰度值排序.平均灰度的计算公式为:
式中:k是分割得到的每个区域的标记;I(ik.jk)是与标记为k的坐标相同的原图像的灰度值;Areak是标记为k的所在区域的面积.
将计算得到的灰度均值按从大到小排序存储在矩阵P中,则得到一些列的灰度均值为:
其中,
定位到平均灰度值最大的区域,依次合并灰度均值相似的区域,直到将完整肿块区域都包含进来,停止合并,就得到最后的肿块的轮廓.该算法的流程图如下所示.
对二进制乳腺肿块图像打开,去除与上述合并得到肿块区域相离的灰度值较小的区域,得到乳腺肿块的分割图像,区域分裂合并结果如图5所示.
4 实验结果对比分析
客观评价图像分割结果的方法主要有:算法速度的评价、算法精度的评价、和封闭区域数量的评价等.本文采用误分率(ME,misclassifica-tion error)和程序的花销时间作为衡量分割准确性的指标.将算法分割的结果与专家手动分割结果进行面积的比较,得到误分率的定义为:误分率=误分像素总数/目标像素总数;
其中,SA为算法分割轮廓,SB为目标轮廓.当算法分割的结果与专家手动分割结果逐渐接近直到相同时,ME=0,ME的值越小,分割准确度越高.
最后将本文算法的分割结果、三层地形分割结果、自适应区域生长算法分割、二次分水岭分割算法与专家分割得到的结果进行对比,分割结果对比如图6、图7所示.三层地形分割是将图像分三层进行分割提取,且生长因子相同.白适应区域牛长算法要先选择种子点,然后将种子点周同领域中与种子像素具有相同或相似性质的像素按照一定的生长准则合并,依次类推,直到满足生长的终止条件,停止生长,得到最后分割区域.二次分水岭算法是针对一次分水岭算法的粗分割结果,再次进行分水岭分割算法,从而降低过分割现象发生率,在进行的100组实验中,平均误分率和时间开销的对比结果如下.
5 结论
本文在应用传统的标记的分水岭算法之前,做了充足的图像预处理,提高图像分割准确度,并进行了区域合并,抑制过分割现象,针对乳腺肿块图像因周围腺体组织影响存在的过分割现象,采取预处理时加入高斯差分滤波器,抑制周围噪声和腺体组织的干扰.然后依据灰度均值相似进行区域合并,保留灰度均值最大的肿块区域,去除与肿块相离的灰度值较小子区域,得到最终的分割结果,在算法的计算速度提高的同时,准确的提取乳腺肿块的所在区域的轮廓,提高了分割算法的精度.