改进分水岭与主动轮廓模型相结合的肝癌细胞核分割算法研究
2018-01-09张学典蔡雨杏汪泓
张学典+蔡雨杏+汪泓
摘要:肝癌已经成为常见的恶性肿瘤,组织切片显微图像的病理分析是诊断的主要手段,细胞的准确分割是病理分析的重要环节。提出了一种新的基于H&E染色组织病理学图像的肝癌细胞分割算法,首先用彩色卷积方法进行主成分提取得到灰度图像,在此灰度图像的基础上,进行形态学处理;然后运用快速径向对称变换提取种子点作为前景标记,进行分水岭分割;最后将分水岭分割得到的轮廓线作为初始轮廓进行GVF主动轮廓分割,得到更为精确的轮廓线。分割结果的阳性预测平均值达到0.89,召回率平均值达到0.9,证明了该算法细胞定位的准确性。Dice系数平均值为0.84,证明了本算法细胞分割区域的准确性。
关键词:H&E;細胞分割;径向对称变换;分水岭分割;主动轮廓模型
DOIDOI:10.11907/rjdk.172017
中图分类号:TP312
文献标识码:A 文章编号:1672-7800(2017)012-0081-05
Abstract:Liver cancer has become a common malignant tumor in the world. Analysis of histopathology images is one of the main methods for diagnosis and precise segmentation of cell and nuclei is the first step towards automatic analysis of histopathology images. A new nuclei segmentation method that works with H&E stained liver cancer histopathology images was proposed. The procedure can be concluded as the following steps: getting the grayscale image by color convolution, selecting seed points utilizing fast radial symmetry transform, marker-controlled watershed segmentation, getting final contour via active contour model. The evaluation was done in terms of positive predictive value, recall and Dice coefficient. The mean predictive value was 0.89 and the mean recall was 0.9 which indicates the accuracy of cell detection. The mean Dice coefficient was 0.84 which indicates the accuracy of segmentation.
Key Words:H&E; cell segmentation; fast radial symmetry transform; watershed; ACM
0 引言
近年来,图像处理与计算机视觉技术在生物医学工程领域的广泛应用加快了生物医学的发展。利用计算机技术对光学显微镜细胞图像进行细胞参数的定量分析,可以辅助医师判别细胞病变状态,从而在一定程度上减轻医务人员的工作负担,具有很大的应用潜力。因此,细胞图像处理逐渐成为医学图像处理领域的一个研究热点[1]。实现细胞图像的病理学识别,重点在于细胞图像分割,即从显微镜细胞图像中提取出所需的细胞区域,从而为后续定量分析作必要的准备。
截至目前,国内外学者已经对细胞图像的分割技术进行了大量研究。其中主要有两类研究,一类是针对显微镜低倍物镜采集的低分辨率大图像分割,这类分割主要是实现细胞核、实质细胞区域的定位;另一类是针对显微镜高倍物镜采集的高分辨率细胞图像,这类分割主要是实现单细胞、重叠细胞图像的分割。医生能够通过快速数码扫描获得整张图片,从而进行病理学分析。H&E染色是组织学、胚胎学、病理学教学与科研中最基本、使用最广泛的技术,但由于组织的多样性和复杂性,H&E染色图像的自动化分析仍然是个挑战。自动化分析数字显微图像的第一步是细胞和细胞核的分割。Cosatt等[2]采用霍夫变换确定种子点,并对每个种子点运用主动轮廓模型进行演化得到细胞轮廓;Kong等[3]采用基于GVF的主动轮廓模型提取细胞核;Vink等[4]将聚类算法与主动轮廓模型相结合,提取乳腺细胞的细胞核;Wahlby等[5]采用H最小值变换提取种子点,并在此基础上进行分水岭分割;Hafiane等[6]采用模糊聚类方法和多相水平集相结合提取细胞核;Al-Kofahi等[7]提出一种多尺度LoG滤波方法提取细胞核的中心作为种子点进行分水岭分割;Yang等[8]运用基于梯度的彩色Snake算法分割血细胞。
本算法研究的是针对高分辨率H&E染色细胞图像与重叠细胞图像的分割。无论是哪类细胞图像的分割,目前的分割算法大多是围绕主动轮廓模型、分水岭算法、像素聚类或者上述方法的结合,再加上一些预处理和后处理以及探测和定位过程。上述算法大多需要通过后处理剔除错误细胞,且大部分针对的不是H&E染色图像,故本文提出一种将前景标记分水岭和主动轮廓模型相结合的算法,对H&E染色的组织病理学图像中的细胞核进行分割。本算法结合了多种处理算法,在预处理方面采用形态学重建方法,前景标记方法采用快速径向对称变换,相比于传统算法能产生更好的分割效果,在分水岭分割结果的基础上进行主动轮廓模型分割能够提高准确性。本算法的评价性能指标主要有3项:阳性预测值、召回率、Dice系数。其中阳性预测值和召回率评价的是细胞定位的准确性,Dice系数评价的是细胞分割区域的准确性。
1 前景标记分水岭与主动轮廓模型结合算法
本文采用的算法流程如图1所示。首先对彩色图像进行主成分分析,得到含有苏木精颜色信息的灰度图像,然后用形态学操作进行预处理,去除干扰成分,得到较好的细胞核轮廓,再运用快速径向对称变换提取种子点,将种子点标记在原图中,在进行后景标记后运用分水岭变换完成预分割,将预分割得到的轮廓线作为主动轮廓模型的初始轮廓,进行曲线演化得到最终轮廓。下文将详细介绍本文算法中用到的关键算法。
1.1 前景标记分水岭
1.1.1 主成分分析
H&E染色图像细胞分割的第一步是主成分提取,本文采用了Ruifrok[9]提出的彩色分离技术,该技术主要利用亮场条件下的显微图像信息能运用朗伯定律进行模拟分析这一事实,相机获取图像时探测到R、G、B三个信道的光强,而从单色染色的图像中获取特定染料的吸收系数。由于细胞核被苏木精染成了紫色,提取苏木精染色部分并转化成灰度图,本算法的后续步骤都是基于该灰度图。
利用该矩阵进行彩色卷积即可将图像中三种染料的染色图像分离出来,达到主成分提取的效果。
1.1.2 形态学处理
经过分离得到的苏木精染色图像仍有比较杂乱的结构,这会阻碍种子点的选取和最后的分割。本算法通过一系列形态学灰度重建操作将这些结构滤除[10]。使用形态学开重建可以将小于结构元素的亮目标去除,类似地,使用形态学闭重建可以将小于结构元素的暗目标去除,交替进行这两个操作可以产生较为平滑的图像。另外,可以通过调节结构元素的大小获得想要的图像细节。在苏木精图像中,先进行形态学开重建,再进行形态学闭重建。结构元素大小要根据所需细胞核大小、图像分辨率和滤除结构的大小进行选择。
在完成了以上两个操作之后,细胞核的主轮廓往往不规则且带有毛刺,为解决该问题,本算法提出用一个比较小的结构元素进行闭操作,可以在不影响主轮廓位置的情况下,简化目标形状,消除毛刺,去除不必要的粘连。结构元素尺寸为之前开操作和闭操作结构元素大小的一半。
当然,选取能适用于所有图像的结构元素是不可能的,结构元素大小应根据想要移除的结构大小进行选择。若结构元素过大,会失去图像细节,若结构元素过小,会导致某些子结构无法去除,都会影响分割效果。故对于不同尺度的图像,选用的结构元素也不同。
1.1.3 快速径向对称变换
快速径向对称变换是一种提取径向对称中心的变换,在某种程度上类似于霍夫圆变换,二者的主要区别在于:前者主要考察一幅图像中每个像素点对它周围邻域内像素点的作用(贡献),而后者则主要考察一个像素点的邻域对当前像素点的作用(贡献)[11]。该算法的算法复杂度为O(KN),其中K为原图像总像素点数,N为考察的N*N的邻域范围。该算法原本用于人脸识别,后来被用于淋巴瘤细胞的自动分析,Chekkoury[12]将该变换用于乳腺癌切片细胞的分割。
大部分细胞核的轮廓具有高度径向对称性,故本算法运用该变换进行细胞核定位。为定位细胞核,可以忽略梯度最大值信息,仅需要利用该算法计算图像的方向投影图。该算法尤其适用于细胞核和背景区域对比度较低的情况。
1.1.4 前景后景标记与分水岭分割
普通的分水岭算法容易导致过分割,故在经过形态学处理之后,本算法运用标记控制的分水岭算法进行图像分割[13]。針对本实验选择图像的放大倍数,设定半径的集合为N,得到的快速径向变换结果S,再利用h最小值变换,得到S的局部最小值,得到的局部最小值点即为用作前景标记的种子点。h最小值变换公式如下:
其中,ρ为形态学灰度重建的腐蚀算子,h为深度参数,该变换会压缩所有深度小于h的点。
运用分水岭算法还需标记出背景,本算法采用背景图的形态学骨架作为背景标记,得到图像的前景后景标记之后,通过在标记处添加局部最小值改变Sobel梯度最大值图像,该图像是分水岭分割的关键分割函数。
1.2 GVF Snake
分水岭算法得出的细胞轮廓不一定准确,故本文将改进的分水岭算法得出的细胞轮廓作为初始轮廓,通过基于梯度矢量流的主动轮廓模型得到更为精确、平滑的细胞轮廓。
1.2.1 GVF Snake基本思想
Snake模型是图像中一条表示突出形状的曲线,可以用v(s)=(x(s),y(s) ),s∈(0,1)表示,该曲线在内力和外力的共同作用下,朝着物体的边界或感兴趣的图像特征移动。内力体现的是曲线本身具有的特性,如光滑性、连续性等,并根据所需特征计算外力,如边缘等。
Snake的数学模型是个能量公式,此能量公式是根据Snake曲线上的点在物体边界时该公式取得最小值而建立的。因此, 定位物体的边界问题则转化为对能量公式求最小值的问题,即一个内力和外力平衡方程:
其中,f为边缘图f的梯度场;μ是控制GVF场光滑性的参数,可以根据图片的噪声确定,噪声越大,μ越大。
利用欧拉方程解出GVF场,同样通过最小化能量函数实现曲线的演化。
本文运用梯度矢量流迭代计算每个细胞的终止轮廓,步骤如下:①由图像梯度求出边缘图;②迭代计算得到GVF全局变量u、v;③由每个细胞核初始轮廓上的点(x,y)迭代计算出终止轮廓上点的坐标值(xsnake,ysnake );④在原图上标记最终轮廓。
2 实验与结果分析
本文选择显微镜放大40倍的H&E染色的肝癌组织病理学细胞图像进行分割,图片大小为572×567像素。
在进行形态学处理时,为达到消除毛刺且同时保留细胞核结构的目的,通过反复试验,最终形态学处理灰度重建的结构元素大小选择为8,则闭操作的结构元素大小设为一半,即为4。由于图像中每个细胞核的半径都在10个像素左右,故快速径向对称变换的半径参数R设为10。在GVF主动轮廓模型中,为了得到精确的轮廓,迭代次数设为150;GVF光滑性参数μ越小,最终的图案圆形度越好,但是光滑性会变差。鉴于细胞具有良好的圆形度,同时也需要得到较为光滑的轮廓,故设定μ为0.2;弹性参数α控制Snake曲线的张力,由于细胞的轮廓比较精细,故α取一个较小的值0.05;刚性参数β影响曲线硬度,一般设置为0;黏性参数设置为0.1,外部力权重k影响外部力的大小,设置为0.5。其中一幅肝癌细胞分割过程及结果如图4所示。本文还对另10幅相同放大倍数的肝癌细胞组织病理学图像进行了分割,从分割结果可以看出,除个别细胞分割不准确,以及个别粘连细胞没有分割出来外,其它细胞的分割较为准确,达到了较好效果。分析分割不准确的区域,可以发现该细胞分割错误是细胞核周围组织染色较深导致的。
其中,TP为分割正确的细胞个数,FP为分割出的错误细胞个数,FN为未被分割出的细胞个数,X为人工分割的基准图像,Y为算法分割出的图像。
统计结果如表1所示,可以发现本算法的阳性预测值和召回率都很高,在0.9左右,证明本算法的定位精确性较高;Dice系数也在0.8左右,分割出的轮廓接近真实的细胞核轮廓。
3 结语
本文主要处理的是H&E染色的肝癌组织细胞图像,提出了一种将分水岭算法与主动轮廓模型相结合的算法,并采用快速径向变换这种新方法进行种子点提取。实验结果表明,本算法在细胞的定位和分割方面具有较好的准确性,克服了传统分水岭算法过分割的问题,可以用于细胞核的轮廓提取与定位。但是本算法采集的图像属于轻度肝癌图像,细胞分布密度较为稀疏,还需要采集细胞密度较高的图像验证其准确性。
参考文献:
[1] 范金坪.宫颈细胞图像分割和识别方法研究[D].广州:暨南大学,2010.
[2] E COSATTO, M MILLER, HP GRAF, et al. Grading nuclear plemorphism on histological micrographs[C].19th International Conference on Pattern Recognition,USA:IEEE,2009:1-4.
[3] J KONG, L COOPER, T KURC, et al. Towards building computerized image analysis framework for nucleus discrimination in microscopy images of diffuse glioma[C]. International Conference of the IEEE Engineering in Medicine and Biology Society,USA:IEEE,2011:6605-6608.
[4] J VINK, M V LEEUWEN, C V DEURZEN, et al. Efficient nucleus detector in histopathology images[J]. Journal of Microscopy,2013,249(2):124-135.
[5] C WAHLBY, I M SINTORN, F ERLANDSSON, et al.Combining intensity, edge and shape information for 2D and 3D segmentationof cell nuclei in tissue sections[J]. Journal of Microscopy,2004,215(1):67-76.
[6] A HAFIANE, F BUNYAK, K PALANIAPPAN. Clustering initiated multiphase active contours and robust separation of nuclei groups for tissue segmentation[C]. 19th International Conference on Pattern Recognition,USA:IEEE,2008:1-4.
[7] Y AL-KOFAHI, W LASSOUED, W LEE, et al. Improved automatic detection and segmentation of cell nuclei in histopathology images[J]. IEEE Transactions on Biomedical Engineering,2010,57(4):841-852.
[8] L YANG, O TUZEL, P MEER, et al. Automatic image analysis of histopathology specimens using concave vertex graph[C]. International Conference on Medical Image Computing &Computer-assisted Intervention, USA:Medical Image Computing and Computer-Assisted Intervention,2008:833-841.
[9] AC RUIFROK,DA JOHNSTON. Quantification of histochemical staining by color deconvolution[J]. Analytical & Quantitative Cytology & Histology, 2001,23(4):291-299.
[10] VINCENT L. Morphological grayscale reconstruction in image analysis: applications and efficient algorithms[J]. IEEE Transactions on Image Processing,1993,2(2):176-201.
[11] G LOY, A ZELINSKY. Fast radial symmetry for detecting points of interest[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2003,25(8):959-973.
[12] A CHEKKOURY, P KHURD, JIE NI, et al. Automated malignancy detection in breast histopathological images[J]. Proceedings of SPIE,2012,8315(2):831515-831515-13.
[13] 刁智華,赵春江,郭新宇.分水岭算法的改进[J].计算机工程,2010,36(17):4-6.
[14] 祝世平,高瑞东.基于自适应扩散梯度矢量流的图像分割算法[J].光电子·激光,2015,26(12):2409-2416.
[15] C XU,J L PRINCE.Gradient vector flow: a new external force for snakes[C].IEEE Computer Society Conference on Computer Vision & Pattern Recognition, 2002:66-71.
(责任编辑:黄 健)