APP下载

基于改进的SLIC区域合并的宫颈细胞图像分割

2016-02-14夏海英金凯跃邓帅飞李建辉

关键词:细胞质直方图宫颈

夏海英,金凯跃,邓帅飞,李建辉

(1.广西师范大学电子工程学院,广西桂林541004; 2.广西师范大学省部共建药用资源化学与药物分子工程国家重点实验室,广西桂林541004; 3.桂林电子科技大学广西自动检测技术与仪器重点实验室,广西桂林541004)

基于改进的SLIC区域合并的宫颈细胞图像分割

夏海英1,2,3,金凯跃1,邓帅飞1,李建辉1

(1.广西师范大学电子工程学院,广西桂林541004; 2.广西师范大学省部共建药用资源化学与药物分子工程国家重点实验室,广西桂林541004; 3.桂林电子科技大学广西自动检测技术与仪器重点实验室,广西桂林541004)

针对现有细胞图像分割算法对噪声敏感,传统SLIC(simple linear iterative clustering)算法对边界分割不精确的问题,提出一种基于改进的SLIC融合区域合并的方法:首先对宫颈细胞图像进行均值漂移处理,消除细微噪声点;然后进行二维Otsu自适应阈值处理得到初始轮廓,应用SLIC算法得到超像素区域,并融合到原图中完成初始分割;最后,在初始分割图中进行初略标记获得交互信息,利用最大相似准则进行合并,不需要预先设定分割阈值,没有被标记的背景区域将成功合并到标记的背景区域,同时,没有被标记的目标区域会被识别出,有效地阻止与背景区域合并。对宫颈细胞图像进行大量的细胞质分割实验,结果表明本文算法能够在较短时间内准确识别出宫颈细胞的细胞质边缘。

超像素;图像分割;初始轮廓;区域合并;最大相似度

0 引言

细胞图像能有效地反映人体组织各个器官形态功能和病变等重要信息,具有直观、形象和信息丰富以及便于观测和理解等特点,因此对细胞图像的分割已逐步成为图像研究学科中一个极具意义和应用性的方向。目前应用于细胞图像中的分割算法有基于阈值的分割方法[1]、基于二阶导数的分割、基于活动轮廓(snake)模型的分割[2]等。基于阈值的分割方法对噪声非常敏感,适用范围很小。基于二阶导数的分割方法,主要是通过图像边缘位置的梯度值的跃阶变化对图像进行分割。该方法抗噪性欠佳,当边缘像素灰度变化较为稳定时,对边缘的提取难度偏大。基于活动轮廓模型的分割有气球力模型、GVF Snake模型[3]和RGVF[4]等。此类算法在一定程度上解决了医学图像中深凹区域轮廓提取的问题,但在模糊边缘地带,分割效果仍然不太理想。

超像素最早由Ren和Malik[4]提出。超像素分割就是将像素聚合成超像素的处理过程,其在很大程度上降低了后续图像处理任务的复杂度[5-8]。除了在图像分割领域的广泛应用,超像素在人体姿态估计、目标跟踪、显著性分析等其他计算机视觉领域的研究也越来越热门[9]。在基于梯度下降的方法中[10],Achanta等2010年提出的SLIC 算法是基于颜色和距离相似性进行超像素分割[11-12]。该方法思路简单,可以产生大小均匀、形状规则的超像素,在边界保持度和超像素形状等方面都有较高的综合评价,可以有效实现目标分割[13-14]。

传统的SLIC超像素算法有一定的局限性[15],在K均值聚类中,如果背景区域和目标边缘区域对比度不足或具有相同的特质,在迭代时会出现像素错误分类,最终形成错误的超像素。本文提出的算法将meanshift去噪处理后的图像经自适应阈值处理后得到SLIC超像素初始分割,通过标记获得交互信息,以计算区域颜色直方图之间标准欧氏距离的方法来衡量相似度,最后利用最大相似准则进行区域合并,实现宫颈涂片细胞质的分割。

1 SLIC算法及改进

1.1 本文算法流程图

本文算法流程如图1所示。首先对原始细胞图像进行meanshift平滑处理,去除细微的环境噪声点,然后通过二维Otsu阈值处理自适应地得到初始轮廓图,用SLIC算法得到超像素区域,最后通过循环的区域合并运算得到最终分割效果。

图1 本文算法流程图Fig.1 Algorithm flow diagrams

1.2 SLIC算法

基于颜色相似度和空间距离关系的简单迭代聚类算法SLIC是在K-means聚类算法的基础上扩展而来的。对于每个超像素,其中心采用CIELAB颜色空间的三维颜色特征向量C及二维位置信息S。

该算法首先在图像上均匀初始化k个初始聚类中心,将所有像素点赋予与其距离最近的聚类中心标签,基于颜色和空间位置特征的归一化距离为:

(1)

式(1)中:向量C表示CIELAB色彩空间的三维颜色特征向量;向量S表示二维空间的位置坐标;下标j=1,2,…,k为聚类中心标签;下标i为对应聚类中心j的2S×2S大小邻域内的像素标签。NC和NS分别为颜色与空间距离的归一化常数。

初始聚类后,聚类中心φj依据对应聚类图像块Gj中所有像素颜色和空间特征的均值进行迭代更新,即:

(2)

式(2)中,Nj为图像块中Gj像素数量。算法不断迭代聚类和更新直至满足终止条件,最后采用邻近合并策略消除孤立的小尺寸超像素,保证最终结果具有较好的紧密度。

1.3 改进的SLIC方法

当利用SLIC分割算法时,由于医学图像中存在很多细小的杂点,它们是由发炎、感染或血渍等引起的噪声点,而这些细小噪声点会很大程度地影响区域合并过程的速度和精确度,因此在对图像进行分割前,需要对医学图像进行平滑处理,本文采用meanshift算法对医学图像进行平滑去噪。mh(x)表示均值漂移迭代,其公式:

(3)

式(3)中:x表示图像中待平滑像素点的像素值;xi(i=1,2,…,n)表示以被平滑点为中心,边长为2hs(hs称为空域带宽)的正方形区域内的像素点的值,其中正方形区域内的所有像素点称为采样点;h为带宽;w(xi)≥0是一个对采样点xi的考量的权重;G(x)为核函数。当对医学图像进行平滑和分割时,为了充分利用空间结构信息和色彩信息,采用多元核函数Khs,hr来估计x的分布,该函数为:

(4)

式(4)中,hs与hr控制着平滑解析度,C为归一化常数。

由于医学图像的特殊复杂性,通常要求其分割结果具有较高的准确性,而传统的SLIC算法比较容易受到噪声的干扰,造成过分割或欠分割。在对宫颈细胞涂片图像进行meanshift平滑去噪处理后,能够消除一定的噪声,但在边缘模糊地带,目标边缘与背景区域对比度仍然不足。本文提出的算法是对宫颈细胞图像进行meanshift平滑和初始分割消除一定的环境噪声后,仅考虑细胞质内的区域为目标区域,细胞质外的区域被视为噪声,采用二维Otsu自适应阈值算法来进行二值化处理,得到初始轮廓,进一步划清了边缘与背景区域。图2为宫颈细胞涂片图像的meanshift处理和细胞质初始轮廓的提取效果。

图2 宫颈细胞图像的预处理Fig.2 Preprocessing of cervical cells images

(a1)和 (b1)为原图的SLIC;(a2)和(b2)为本文方法处理后的SLIC;(a3)、(a4)、(b3)、(b4)为对应的局部放大图。图3 不同方法处理后SLIC分割效果Fig.3 Segmentation results of SLIC using three methods respectively

图3(a1)(b1)为原图上直接应用SLIC算法得到的分割效果,可以看出,在很多边缘,尤其是与背景区域颜色相近或有相同特质的边缘,SLIC算法难以准确识别,因此分割效果不佳。图3(a2)(b2)是本文提出的经meanshift算法处理后,再进一步提取出初始轮廓后,用SLIC得到的超像素分割效果,可以看出,在边缘保持上和平滑度上都体现了较高的优越性,能准确识别到细胞质边缘。

2 基于改进的SLIC算法的区域合并

2.1 区域的表征和相似度的度量

经SLIC改进方法处理后,我们得到了很多可以用来合并的小型区域,目前需要一些描述符来表征这些区域,需要相应的合并准则来实现合并。而颜色直方图可以较好地表示出目标颜色特征,也被广泛应用于图案识别和目标追踪。颜色直方图比其他的特征描述符具有更好的鲁棒性,因此我们选用颜色直方图作为描述符。

在本文中,采用RGB色彩空间来计算颜色直方图,考虑到色彩需求和算法运行时间,统一量化每个色彩通道到8水平,计算出8×8×8=512特征空间每个区域的直方图。区域A的归一化直方图记为HistA。通过标记一些目标区域和背景区域,关键就是如何衡量没有被标记区域和标记过区域之间的相似度,以此来决定是否进行合并,因此我们需要定义区域A和B之间的相似度度量。标准欧氏距离是针对传统欧氏距离的缺点而作的一种改进的距离算法。它用来计算向量之间的差异程度,因此本文采用标准欧氏距离的相反数d(A,B)来表示区域A和B之间的相似度:

(5)

式(5)中,HistA和HistB分别代表区域A和B的归一化直方图,上标u代表它们的第u个元素,S为归一化直方图之间的标准差。d(A,B)越大,则区域A和区域B之间的相似度就越大。如果2个区域有相似的特征,那么它们的直方图就很相似,因此标准欧氏系数就会很大。

2.2 合并算法的流程

B是区域A的一个邻域,B的邻域记为:

(6)

MO和MB分别表示标记的目标区域和背景区域,N表示未被标记的区域,以下是合并算法的具体步骤。

步骤1:

③更新区域MB和N,如果MB还能找到与其合并的区域,则返回①,否则进行下一步。

步骤2:

③更新区域N,如果区域N还能找到与其合并的区域则返回①,否则进行下一步。

若全图仍有可以合并的区域,则返回步骤1①,否则结束合并算法,完成分割。对医学图像进行分割,需要大致标记出目标区域和背景区域。我们只需要标记出很小的一部分目标区域和背景区域,在完成标记后,所有区域都可以归为3类区域的其中一类,即标记的目标区域、标记的背景区域和未被标记的区域。在完成标记后,没有被标记的区域应该被正确地归为目标区域或是背景区域才能实现分割。

3 实验结果及分析

3.1 实验数据及步骤

本文的实验数据来源于含有102张单细胞涂片图像的Herlev数据集,实验平台为:Matlab 2010b,CPU为 Intel Core i3,内存为3.0 GB。超像素个数为150。图4是改进SLIC超像素分割融合区域合并算法的分割步骤。图4(b)是经过meanshift平滑后进行阈值处理得到的SLIC超像素边缘图。图4(c)是标记过程,细胞内部的线条代表目标区域,细胞外部的线条代表背景区域。图4(d)是第一轮运算中步骤1的合并结果,可以看到标记的背景区域与未标记的背景区域的部分合并。图4(e)是第一轮运算中步骤2的合并结果,一些未标记的区域,包括背景区域和目标区域自适应地合并。因为还有未合并的区域,所以进行第二轮运算。图4(f)是标记的背景区域与未标记的背景区域合并结果。可以看到,此时细胞图像中的区域明显地分为2种,即背景区域和目标区域(细胞质内的区域),因此只需要自适应地合并未标记区域。从图4(f)中的最终分割结果中可以看出,本文算法能准确有效地分割出细胞质边界。

图4 宫颈细胞图像的分割Fig.4 Cervical cell images segmentation using the proposed method

3.2 实验对比

传统的SLIC算法能通过增加超像素的个数,获得更多的细胞图像边界信息,提高分割的准确性,改善细胞质的分割效果,如图5所示。但在一些模糊的边缘地带,增大超像素粒度,仍然无法准确识别到边缘,而且大幅增加超像素个数会增加区域合并算法的运行时间。图5可见,本文算法能在超像素粒度较小的情况下准确识别出细胞质边缘。

(a1)和a(2)为超像素个数为50的传统SLIC算法分割结果;(b1)和b(2)为超像素个数为500的传统SLIC算法分割结果;(c1)和(c2)为超像素个数为2 000的传统SLIC算法分割结果;(d1)和(d2)为超像素个数为50的本文算法分割结果。图5 不同超像素粒度的分割结果Fig.5 Segmentation results using various number of super-pixels

实验主要评估了本文算法在宫颈细胞涂片图像中定位细胞质边界的性能,并与GVF Snake分割算法和RGVF细胞分割算法作对比。实验中,控制活动轮廓曲线弹性的系数α和控制曲线刚性的系数β以及加权系数μ均设置为1。RGVF中提取细胞初始轮廓的阈值δ为0.5,抑制函数的系数γ为0.1,基于堆栈的细化中的阈值θ为2。如图6所示(图6A~F来自标准库Herlev数据集的宫颈细胞图像),我们可以看到,在正确定位细胞质边界上,本文算法的性能优于GVF和RGVF。GVF算法对噪声和干扰最敏感,RGVF虽然在其基础上做出改进,但在识别模糊边界方面仍表现出不足,会造成欠分割或过分割。本文提出的算法可以稳定并能够准确地识别出真实的细胞质边界,在定位相对模糊边界方面也有较好的表现。

图6 3种算法对宫颈细胞的分割效果对比Fig.6 Segmentation results of cervical cell images using various algorithms

3种分割算法的时间对比结果如表1 所示。

表1 运行时间对比

为了在客观评价指标下分析本文算法的分割准确率,这里我们需要实验细胞图像的Ground Truth。分割准确度SI(similarity index,SI)定义为:

(7)

其中A为Ground Trouth的像素集合,B为算法分割的像素集合。

对Herlev数据集中的宫颈细胞图片进行实验,得出3种算法各自SI的均值和方差,如表2所示。我们可以看到,本文算法的SI均值大于GVF和RGVF,且标准差最小,表明在正确定位细胞质边界上,本文算法更加准确,且具有较好的鲁棒性。

表2 3种分割算法结果对比

4 结束语

本文提出一种改进的基于SLIC区域合并的医学图像分割算法,利用改进的SLIC超像素准确识别出细胞质边缘,结合区域合并算法,可有效地完成细胞图像分割。在减少炎症细胞、血渍等造成的污染方面都有良好的抗干扰能力和鲁棒性,即使在模糊边缘也能实现较准确的分割。在运行时间方面,本文算法的运行速度比GVF算法略低,但仍能达到实际应用要求。

[1] MOO E K, ABUSARA Z, OSMAN N A A, et al. Dual photon excitation microscopy and image threshold segmentation in live cell imaging during compression testing[J]. Journal of Biomechanics, 2013, 46(12):2024-2031.

[2] XU C Y, PRINCE J L. Snakes, shapes and gradient vector flow[J]. IEEE Trans on Image Pocessing, 1998, 7(3):359-369.

[3] LI K,LU Z,LIU W Y,et al.Cytoplasm and nucleus segmentation in cervical smear images using Radiating GVF Snake[J]. Pattern Recognition, 2012, 45(4):1255-1246.

[4] REN X F,MALIK J.Learning a classification model for segmentation[C]//Proceeding of the 9th IEEE International Conference on Computer Vision. Piscataway NJ:IEEE Press, 2003:10-17.

[5] FELZENSZWALB P F, HUTTENLOCHER D P. Efficient graph-based image segmentation[J]. International Journal of Computer Vision, 2004,59(2):167-181.

[6] 张微,汪西莉.基于超像素的条件随机均图像分类[J].计算机应用,2012, 32(5):1272-1275.

[7] SHI Jianbo, MALIK J. Normalized cuts and image segmentation[J]. IEEE Trans on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.

[8] 谭乐怡, 王守觉. 基于双重超像素集的快速路径相似度图像分割算法[J].自动化学报, 2013, 39(10):1653-1664.

[9] 王春瑶, 陈俊周, 李炜. 超像素分割算法研究综述[J]. 计算机应用研究, 2014,31(1) :6-12.

[10] 饶倩,文红,喻文,等.超像素及其应用综述[J]. 电脑与信息技术,2013,21(5):1-3.

[11] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to state-of-the-art superpixel methods[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2012, 34(11):2274-2282.

[12] LUCCHI A, SMITH K, ACHANTA R, et al. A fully automated approach to segmentation of irregularly shaped cellular structures in EM images[C]//Medical Image Computing and Computer-Assisted Intervention. Berlin:Springer-Verlag, 2010:463-471.

[13] COMANICIU D,RAMESH V,MEER P. Kernel-based object tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(5):564-577.

[14] LUCHHI A, SMITH K, ACHANTA R, et al. Supervoxel-based segmentation of mitochondria in EM image stacks with learned shape features[J]. IEEE Trans on Medical Imaging, 2012, 31 (2):474-486.

[15] 张亚亚,刘小伟,刘福太,等.基于改进SLIC方法的彩色图像分割[J].计算机工程,2015,41(4):205-209.

(实习编辑 李 朝)

(责任编辑 马殷华)

Cervical Cell Images Segmentation Based onImproved SLIC Region Merging

XIA Haiying1,2,3,JIN Kaiyue1,DENG Shuaifei1,LI Jianhui1

(1.College of Electronic Engineering Guangxi Normal University, Guilin Guangxi 541004, China; 2. Key Laboratory forthe Chemistry & Molecular Engineering of Medicinal Resources, Guangxi Normal University, Guilin Guangxi 541004, China; 3. Guangxi Key Laboratory of Automatic Detecting Technology & Instruments, Guilin University of ElectronicTechnology, Guilin Guangxi 541004,China)

As the existing cell images segmentation algorithms are sensitive to noise and traditional SLIC(simple linear iterative clustering) algorithm can not divide boundary precisely, an improved SLIC method based on region merging is proposed to resolve the problems. First, the mean shift treatment is used to eliminate noise on the cervical cell images, then the two-dimensional otsu adaptive threshold processing is conducted to abtain the initial contour, then based on SLIC algorithm the superpixel region is obtained, and the superpixel regions are fused to the original image to complete the initial segmentation. Finally, in the initial segmentation map, the initial mark is used to obtain the mutual information, and the maximum similarity criterion is used to merge. In this way, no present threshold is needned. The non-marker background regions are merged with labeled automatically, while the non-marker object regions are identified and avoided from being merged with background. Several experiments of dividing the cytoplasm are conducted for cervical cells images. The proposed algorithm can extract cytoplasm from a single-cell cervical smear image more accurately in a relatively short time.

superpixel; image segmentation; initial contour; region merging; maximal similarity

10.16088/j.issn.1001-6600.2016.04.014

2016-04-15

国家自然科学基金资助项目(21327007);广西自然科学基金资助项目(2013GXNSFBA019278)

夏海英(1983—),女,山东聊城人,广西师范大学副教授,博士。E-mail:xhy22@gxnu.edu.cn

TP391.4

A

1001-6600(2016)04-0093-08

猜你喜欢

细胞质直方图宫颈
符合差分隐私的流数据统计直方图发布
动物细胞里的成员
怀孕后宫颈管短怎么办
这几种“宫颈糜烂”需要治疗
用直方图控制画面影调
HPV感染——“宫颈的感冒”
中考频数分布直方图题型展示
高中生物细胞质作用研究
基于空间变换和直方图均衡的彩色图像增强方法
洋葱细胞质雄性不育基因分子标记研究进展