肿瘤癌变细胞FISH图像分析系统的研究
2017-01-19陈若寒
陈 舒,陈若寒
(福建警察学院 计算机与信息安全管理系,福建 福州 350007)
肿瘤癌变细胞FISH图像分析系统的研究
陈 舒,陈若寒
(福建警察学院 计算机与信息安全管理系,福建 福州 350007)
肿瘤癌变细胞FISH图像分析系统中,需要解决粘连细胞核的分割问题。FISH属于新兴技术,产生的是特殊的荧光彩色细胞图,现有细胞图像分析方法并不适用。文章创新设计了基于深度凹陷检测和构造自然凹陷力的方法,分离粘连细胞核。首先,针对参差不齐的实验成像,在RGB模型下结合统计思想,将图像分为三类,分别进行预处理。继而,利用融合了K-means聚类算法的改进马尔科夫随机场(MRF)方法,将细胞核与癌变信号点进行有效提取。在此基础上,利用几何原理,创新设计了一套粘连细胞核分离算法。最后,给出细胞核快速计数和信号点提取方法。该系统设计基本完整,并达到预期效果。
FISH图像;细胞核提取;MRF模型;细胞核粘连;自然凹陷力
0 引言
较多研究表明,癌变细胞中都存在HER2蛋白的过表达或基因扩增现象。当前的检测技术有很多种,其中的FISH技术虽是一项新兴技术但已经被公认为业界的“黄金标准”[1-2]。
经过FISH技术处理后产生的肿瘤癌变细胞图像中,包含三个主要成分:背景(黑色)、细胞核(蓝色)、信号点(红色和绿色)。通过统计、分析细胞核与信号点的个数,就可以实现对HER2蛋白扩增现象的检测。
1 预处理
FISH图像中,具有研究价值的区域恰好与RGB颜色模型的三个通道相吻合,不需要进行复杂的映射或者换算,所以选用RGB模型来进行设计。通过批量观察以及相应资料的查阅,FISH技术呈现的细胞核大致具有3个特点:边缘模糊(荧光强度不同)、核外轮廓各异(探针手工着色)、核内结构复杂(孔洞),需要进行预处理使得图像呈现最佳效果,从而简化算法。
1.1 FISH图像分类
首先,根据成像的荧光效果,将图像分为三类:(1)弱荧光信号图;(2)晕染严重信号图;(3)理想信号图。分别如图1(a)、(b)、(c)所示。在专家指导下进行手工分类作为训练样本,得出图像在蓝色通道上的分布规律,借助统计学原理,进行自动分类。
图1 三类肿瘤癌变细胞FISH图像示例
1.2 非理想图片的改善
需要对弱荧光图进行增强,对晕染现象进行去除。
1.2.1 弱荧光图自适应增强
(1)原图像进行叠加,I=1.5×I(这步操作的实质是对亮度进行叠加);
(2)重新判断是否为弱荧光,如果是,则重新转入步骤(1),否则停止。实验效果如图2所示。
图2 弱荧光信号图自适应增强的前后对比
1.2.2 晕染现象的自动去除
(1)将判别为“晕染严重”的原始图像转化为蓝色亮度图;
(2)运用Otsu法进行阈值分割,目标标记为1(白),背景标注为0(黑);
(3)填补小于阈值Pc个像素点的连通区域(孔洞);
(4)去除小于阈值Pc个像素点的连通区域(非细胞核区域);
(5)将标记为目标的区域恢复成RGB图,其他部分保持黑色背景;
(6)重新判断是否晕染严重,如果是,则重新转入步骤(2),否则停止。实验效果如图3。
图3 严重晕染现象去除前后对比图
其中Pc默认为原图总像素点的4%,这个百分比是根据多次实验效果得出的经验值,表示该图片中的细小孔洞,可以自适应各种尺寸的原始图像。
2 FISH图像细胞核的提取
2.1 传统方法
对细胞核提取的常用方法主要依据四类原理,分别是:阈值分割、边缘检测、传统区域思想以及基于特殊算法的理论[3-4]。
阈值分割虽然快速简便、不需要先验知识,却没有考虑与邻域像素点之间的关联性,分割较为粗糙,容易发生误判;边缘检测虽然是基于各个像素点与其邻域的差异,但是细胞核内荧光信号产生了大量的梯度变化,给真实边缘的检测增加了困难;传统区域思想需要先验知识并对图像有一定要求,且不考虑空间信息,容易造成过分割;而基于特殊算法的理论,则因为其特定的应用条件、复杂的参数或对图像计算量的要求等,在FISH图像的细胞核提取中并不适用。
2.2 本文方法
综合以上算法的优缺点,本文考虑到像素点间的关联,选取马尔科夫随机场(MRF)[5-7]与无监督的聚类算法相结合来进行图像分割,提取FISH图像的细胞核。
从算法计算量和精度的角度考虑,在MRF建模中,选用二阶8-邻域系统的Potts模型作为标记场模型,有限高斯混合模型(FGMM)建立观测场,迭代条件模式(ICM)作为最优化分割算法,其中Potts模型中的势函数β改进为可变势函数βb。
2.2.1 可变势函数
势函数β的大小对分割结果影响很大。以图4a为例进行分割,选取其中β=0.5和β=5的情况,分割结果如图4(b)和图4(c)。
图4 图像在不同势函数作用下的分割结果
显然,当势函数β增大时,标记场就越占主导,区域性就越好,分割结果细节也就越差;当势函数β变小时,标记场的影响就弱了,观测场占的比重变大,分割结果细节信息丰富,区域性差。由此引入可变势函数βb,符合“前期着重在区域性的控制,后期集中在细节信息的判断”的规律,势函数应该是逐渐变小的。
综上所述,设计可变势函数如下:
令初始势函数β=1,总迭代次数限制为maxIter,当前迭代次数为Iter,则当Iter (1) 上式保证在迭代次数Iter增加时,势函数βb是缓慢变小的,并且不会偏离最初由经验确定的β值太多。 2.2.2FISH图像细胞核的提取具体步骤 (1)将原始图像转化为蓝色亮度图; (2)设定实验图像分类数K=2,初始势函数β=1,最大迭代次数maxIter=10; (3)应用K-means聚类算法得到初始分割; (4)估计观测场参数μ和σ2; (5)计算FGMM模型建立的观测场能量; (6)计算Potts模型建立的标记场能量; (7)根据能量最小原则,估计新的分割; (8)判断是否满足迭代终止条件(MAP准则和最大迭代次数),满足则算法停止,得到最佳分割,否则更新势函数βb的值,并重新转入步骤(3)。 2.2.3 实验效果 分别用Otsu自动阈值法、传统的K-means聚类算法以及本文算法对FISH细胞图像进行分割,效果如图5所示。可以看出,本文算法比前两种产生的分割结果更加连续,且错判产生的孔洞现象更少。这说明:融合了MRF模型的K-means聚类分割方法,在兼顾了区域完整性的同时较好地保有了细节信息。而引入可变的势函数βb的优势,在前文已有分析。在判定为细胞核的一些区域内,仍然存在一些细小的孔洞,用前文处理晕染图片时使用的方法修复,效果如图6所示。 图5 三种算法对细胞核提取效果比较 图6 本文算法对细胞核提取并修复 对粘连细胞核分离的常用方法主要依据三类原理,分别是:基于数学形态学、基于形状特征以及特定理论的方法。 3.1 传统方法 当目标粘连紧密时,应用基于数学形态学的方法通常得不到理想的种子点个数。 基于形状特征原理,主要是采用寻找凹点进而分离的方法。将细胞核的粘连方式分为串联和并联两类,根据每个区域凹点奇偶性或者其他准则,来判断属于哪一类粘连。然后运用不同的凹点匹配策略,进行凹点连线划分。但大部分的方法并没有考虑更加复杂的串并联混合情况,FISH细胞核恰属于复杂粘连情况,同时,FISH细胞核边缘不规则,容易出现“假凹点”。 基于特定理论的方法中,比较适合FISH图像复杂结构的是文献[8]中提出的基于水平集和随机霍夫圆检验方法来分离原生质细胞核。但该算法融入了水平集算法,需要设定的参数非常多,随着粘连细胞核个数的增加和粘连情况的复杂,相应的参数也更加难以全面设置,并且需要用到统计学的霍夫投票法决定区域的分割归属问题,计算量较大,影响了总体分析效率,故不采用。此外,其他文献中基于主动轮廓模型[9-10]和图论[11-12]等方法的改进,都因计算量比较大,不予采用。 3.2 本文方法 在Harris和Susan算法的基础上,改进设计出“深度凹陷点”的检测方法,寻找因粘连造成的真正凹陷,同时判断出粘连现象的存在与否。接着,创新引入“自然凹陷力”的概念,令深度凹陷点的凹陷有规律有方向地加深,并逐渐产生区域断裂,最终实现粘连的分离。 3.2.1 深度凹陷点检测 本文将角点分为以下4种点情况:钝角凸点、锐角凸点、轻微凹陷点、深度凹陷点。本文定义的深度凹陷点必须满足以下条件:以该角点作为圆形模板的中心,角点的两条线段在目标区域内构成的夹角必须大于225°。 本文设计的深度凹陷检测方法: (1)设FISH细胞核二值图I中,目标(细胞核区域)标记为1,背景标记为0,同时构造半径R=5的圆形模板M,模板内标记为1的像素点总个数为MMAX; (2)利用Harris角点检测算法对I进行扫描,得到一个角点集合J(j1,j2,...,jn); (3)将圆形模板M的中心与J(j1,j2,...,jn)逐点重合; (4)借鉴Susan算法的思想,得到每一个角点位置上的USAN值MUSAN; (5)当MUSAN>5/8×MMAX时,该角点判定为深度凹陷点,存入集合H中,用于下一阶段运算。 3.2.2 粘连判断 当某个目标连通区域内存在深度凹陷点时,该区域存在粘连现象,需要实现细胞分离,否则是独立细胞核。 3.2.3 自然凹陷力 设想:在现实世界中,要让这些粘连的细胞核产生分离,可以对每一个深度凹陷处施加作用力,要求该作用力的大小一致,方向顺应每个凹陷处的凹陷方向,这样在凹陷处就会不断地加深凹陷程度,粘连的细胞核们也会逐渐被挤压得分离开。当某几处作用力汇集到一点时,该局部的粘连区域就被分离;当图像中所有深度凹陷处施加的作用力都汇集到某一处时,则粘连部分被完全分离。 为了满足实时性的需求,本文采用纯几何的线性思想来模拟自然凹陷力的作用,如图7所示。 图7 本文设计的自然凹陷力作用示意图 本文设计的自然凹陷力具体作用过程为: (1)取深度凹陷点集合H(H1,H2,...,Hn); (2)定位至其中一点Hi(i=1,2...,n),以该点为圆心、R=8(多次实验的经验值)为半径构造一个圆,设该圆交Hi两条边的交点分别为J1和J2; (4)逐个定位至H中的其他点,重复步骤(2)和(3),遍历一轮后,将产生的集合H′作为新的凹陷点集合H,完成一轮自然凹陷力作用; (5)定位至更新过的Hi点,重复步骤(2)~(4),直至新产生的Hi′不再在目标内时,停止Hi点的继续凹陷,跳至H中的其他点继续操作,直至所有的H′都在背景中时(表示粘连产生的凹陷区域都完成分离),停止所有操作。 3.2.4 本文粘连分离方法 (1)读取一张原始FISH细胞核图Iy; (2)利用前文设计的方法,将Iy分类并预处理为理想图I,使用前文设计的细胞核提取方法,将I中的细胞核提取出来,并将图像转化为二值图I0; (3)对I0做边界提取,记录目标初始边缘ED0; (4)利用半径R=3的近圆形结构元素SE,对I0图像做腐蚀运算,分离轻微粘连的细胞核; (5)利用前文设计的“深度凹陷检测方法”,检测出当前图中深度凹陷点,存入集合H; (6)利用前文“自然凹陷力”,逐点加深H点处的凹陷,最终使得细胞核粘连区域全部得以分离; (7)对分离后的各个区域进行连续粗化运算(保持不连通性),使各个区域复原成原始大小,直至区域边缘达到ED0的极限,且结果不再变化为止; (8)对当前二值图I0做边界提取,记录当前目标的边缘ED,则ED为细胞核的分离界线; (9)将分离界线转化为红色,叠加于图像I上,作为输出结果。 3.2.5 实验效果 分别选取“简单粘连”和“复杂粘连”的FISH细胞核图像进行分离实验,结果如图8、图9所示,实验效果理想。 图8 简单粘连的分离效果 图9 复杂粘连的分离效果 4.1 细胞核计数 读取一张经过粘连分离后的细胞核二值图I0,继而计算标记为目标(标记为1)的连通区域数,即为细胞核个数。 4.2 信号点提取 红色信号点的提取方法:先将G和B的值减为0,得到R-红色荧光图,再通过阈值分割和极限腐蚀法得到几何中心,用于后续分析。同理,可用于绿色信号点的提取。 系统主要实现4个功能:(1)FISH图像预处理;(2)FISH细胞核的提取;(3)粘连细胞核的分离;(4)细胞核技术和信号点提取。上述设计,都在满足精确度和视觉效果要求的范围内,尽可能构造计算量小、直观性强的方法。但仍存在着不足:无法实现某些特殊情况下的粘连分离,比如在细胞核严重团簇、细胞核发生多层粘连时,内层细胞核相互挤压,没有形成凹陷,使之无法分离。这有待进一步改善。 [1] 柳威, 谢凤, 陈临溪. C-Abl在肿瘤发生及治疗中的重要作用[J]. 临床与病理杂志, 2012, 32(6):516-523. [2] 唐磊. 基于肿瘤分类与生长建模的癌症药物疗效预测平台设计与应用[D]. 合肥:中国科学技术大学, 2012. [3] 杨泽新.基于颜色和形状的图像检索技术研究与实现[D].武汉:华中科技大学,2006. [4] 许新征,丁世飞,史忠植,等 .图像分割的新理论和新方法[J].电子学报,2010,38(Z1):76-82. [5] 刘国英. 基于Markov随机场的小波域图像建模及分割[M]. 北京:科学出版社, 2010. [6] 白雪. 基于三马尔可夫场的SAR图像分割[D]. 西安:西安电子科技大学, 2012. [7] 段汕, 陈晓惠, 郑晨. 基于区域特征的模糊多尺度Markov模型在纹理图像分割中的应用[J]. 中南民族大学学报(自然科学版), 2010, 29(3):93-99. [8] 王晓飞, 庞全. 基于圆形约束快速水平集的原生质体细胞分割[J]. 中国图象图形学报, 2013, 18(1):55-61. [9] 涂云霞. 基于Snakes模型的图像轮廓提取算法的研究[D]. 哈尔滨:哈尔滨工业大学, 2009. [10] 王科俊, 郭庆昌. 基于粒子群优化算法和改进的Snake模型的图像分割算法[J]. 智能系统学报, 2007, 2(1):53-58. [11] 侯叶. 基于图论的图像分割技术研究[D]. 西安:西安电子科技大学, 2011. [12] 李军侠. 基于显著性的图像分割研究[D]. 南京:南京航空航天大学, 2012. Research on the FISH image analysis system of tumor cell Chen Shu,Chen Ruohan (Department of Computer and Information Security Management,Fujian Police College,Fuzhou 350007, China) In FISH image analysis system, the segmentation of the cell nucleus is needed. FISH is a new technology, it is a special fluorescent color cell image, the existing cell image analysis method is not applicable. In this paper, we design a method based on deep depression detection and constructing the natural sag force to separate the adhesion nucleus. Firstly, according to the different experimental imaging, the images are divided into three kinds according to the RGB model, and the images are preprocessed. Then, using the improved Markov Random Field (MRF) method with the integration of K-means clustering algorithm, to extract nuclei and carcinogenesis signal points. On this basis, using geometric principles, a set of adhesion cell nuclear separation algorithm is designed. In the end, the method of nuclear fast counting and signal point extraction is presented. The design of the system is basically complete, and achieve the desired results. FISH image;nucleus extraction;MRF model;nucleus adhesion;natural depression force R857.3;TP391 A 10.19358/j.issn.1674- 7720.2017.01.015 陈舒,陈若寒. 肿瘤癌变细胞FISH图像分析系统的研究[J].微型机与应用,2017,36(1):48-51,55. 2016-10-20) 陈舒(1988-),女,硕士研究生,助教,主要研究方向:图像处理,模式识别。 陈若寒(1987-),男,硕士研究生,助教,主要研究方向:图像处理,模式识别。3 粘连细胞核的分离
4 细胞核计数和信号点提取
5 结论