APP下载

基于概率图模型的病理图像分割研究

2021-03-24张翼庞宝川

数字技术与应用 2021年1期
关键词:有向图细胞核边缘

张翼 庞宝川

(1.文华学院,湖北武汉 430074;2.武汉兰丁医学高科技有限公司,湖北武汉 430074)

0 概述

病理图像的分割,是指利用图像处理与计算机视觉的方法,将显微图像中的不同细胞、细胞核或组织结构分割开,并标示其位置、勾勒其轮廓,为后续的特征提取与识别诊断提供依据。复杂纹理背景上的粘连和部分重叠目标的识别与分离一直是模式识别与图像处理领域最为困难的问题之一。本文通过构造适合于病理图像分割的混合概率图模型,分别利用无向图与有向图对于因果和相互作用统计关系的描述与刻画能力,对细胞核位置、轮廓对于区域及边缘信息的概率依赖关系进行统计建模,设计与实现基于上述构造的概率图模型的病理图像分割算法,实现病理图像中细胞核的准确识别与轮廓勾勒[1]。

图1 混合概率图模型框架Fig.1 Framework of mixed probability graph model

1 混合概率图模型

“概率图模型”分割算法将图像中的像素、目标标记、边缘、灰度、颜色等视为随机变量,通过对这些随机变量间的统计关系建模,从而将图像分割问题转化为概率优化与推理问题。概率图模型主要分为无向图模型与有向图模型两大类。无向概率图模型能够表示随机变量之间的相互作用关系。有向概率图模型提供了描述随机变量间因果关系的系统性框架,它通过有向图结构描述随机变量间的条件依赖与独立关系[2]。

在混合概率图模型设计中,通过构造合适的概率图模型来研究病理图像中细胞核位置与轮廓对于不同区域与边缘信息依赖关系的表示理论、方法与分析模型。混合图模型中,将图像中的各种观测(如像素的局部特征、边缘等),以及图像中的分割目标的标记及信息(如细胞核的位置与大小、像素的前/背景标记等)看作随机变量。并通过有向图与无向图的结构来表示它们之间的条件依赖与独立关系,其基本框架如图1所示。

混合图模型主要包括两个部分:基于无向图的像素级分割和基于有向图的目标级细胞核检测与分割。其中,阴影节点表示观测节点: Mx表示图像观测或者由图像提取的局部特征向量; Me表示边缘观测,即由图像通过边缘检测算法得到的响应值。模型中无向图部分的作用主要是在给定像素 x 的局部观测 Mx的情况下,对像素的前景或背景标记 y 进行估计,同时利用相邻像素间标记的关系,对标记进行约束,从而实现像素级的分割。有向图部分的作用是在给定边缘 e 的观测值 Me的情况下,对细胞核(即目标) c 的位置进行检测,从而将不同细胞核分离,实现目标级的分割[3]。

1.1 基于无向图的像素级病理图像分割概率图模型

本文采用无向图条件随机场(CRF)模型来实现病理图像的像素级分割。C R F 模型的基本思想是在给定图像观测 x 的情况下,直接对标记随机变量 y 的后验概率分布建模,如式(1)所示:

其中, V 表示图像中所有需要标记的像素集合,称为图像域; i 表示像素坐标; y 为这些像素的联合标记,iy 表示像素 i 的前/背景标记,对于细胞核像素 yi= 1,否则yi= 0; x 表示图像观测或者局部特征向量, xi表示像素i 的图像观测或特征向量。 gi,j(·) 表示像素对 (i, j )的特征向量, λ 表示它的权向量。 Z 为归一化项,也称为配分函数(Partition Function):

式(2)中包含两项。其中 φ( yi, xi)表示图像观测或局部特征向量对于图像标记的影响,它以参数函数的形式给出给定像素 i 的局部特征ix 条件下,标记取值iy 的似然率。通过提取不同的颜色、纹理、染色体分布等局部特征值作为图像观测 x ,可以描述像素标记与上述局部特征的依赖关系,从而实现细胞核像素先验知识的数学化表示。这里, φ(yi, xi)表示图像观测 xi对于像素级标记 yi的影响,利用训练数据训练多层感知器,并得到相应的输出f ( xi),再利用logistic函数给出它与 yi之间的关系:

1.2 基于有向图的目标级分割概率图模型

利用弧形边缘检测器,不仅能够检测到边缘的强度,还可以检测到边缘对应的方向与曲率半径。这些强度、方向与曲率半径共同构成的边缘场景信息,对于推理细胞核的位置、将不同的细胞核区分开、实现目标级的病理图像分割具有重要的作用。该模型可以表示与估计有向图部分的局部条件分布和,从而将边缘场景信息表示与嵌入到分割模型中弧形边缘检测器如图2所示。

图2 弧形边缘检测器Fig.2 Arc edge detector

其中,边缘基元与该细胞核中心距离为 r ,边缘基元方向和基元与细胞核中心连线的夹角为 θ ,边缘基元的曲率半径为 R 。即假定对于某种特定曲率半径 R 的边缘基元,该边缘与细胞核中心的位置关系成 (θ , r) 的联合高斯分布。

利用上述多元联合高斯分布及加法模型,由不完整的多曲率边缘信息,推理得到细胞核中心位置。

6.管理上的不平衡。随着社会市场领域不断伸展,干部职工舍家撇业,常年野外施工付出较多,特别是在远离亲人的艰苦环境情况下,个别党员干部出现了心里失衡,感觉劳动付出与得到的实际报酬不匹配,为了找回心里的平衡,个别人在经济上就出现了问题。

其中, p( e) 表示检测到的边缘 e 的概率, 为指示函数, ρe为对应的阈值。 H( c) 为细胞核中心的强置信度。通过Logistic函数,可以转换为其相应的后验概率值

通过上述概率建模思路,将基于无向概率图的像素级分割模型和基于有向图的目标级分模型结合起来,构造混合概率图模型,刻画图像中区域与边缘等场景信息,并以统一的框架加以表示与描述,以解决病理图像分割中的场景信息表示与利用等核心问题。

2 混合概率图模型的参数估计

接下来解决如何由训练数据,估计得到最优的权向量λ的值。本文采用最大似然率准则(MLE)估计参数 λ 的值。

假定所有训练数据是独立同分布的,则 λ 的对数似然率可以表示为:

其中, z(k)为训练数据 k 的对数配分函数,K 表示训练数据数量。利用上述对数似然率,可以采用直接法或梯度下降法等常见最大似然率准则求取最优的λ。由M LE 准则知:

则利用随机梯度下降法,以及如下梯度,可以实现参数 λ 的估计:

根据观察可以看出,边缘基元与细胞核中心的相对空间位置关系应具有旋转不变性,也即最可能的细胞核应处于边缘基元的轴向上。

根据以上推导,结合混合概率图模型中的不同场景信息的参数表示方式,进一步给出由训练数据优化与估计上述参数的算法,以解决病理图像分割中的先验信息提取与嵌入、区域场景信息的利用等核心问题。

3 分割算法与实现

利用像素级标记 y 与目标级标记 c 的关系,将CRF部分与B N 部分相关联,建立统一的混合模型,才能实现多目标的细胞核检测与分割。像素级标记 y 与目标级标记 c可以表示为一种自然的因果关系:像素级标记iy 完全依赖于目标级标记ic ,也即像素标记为前景是因为它属于某个细胞核。若将iy 和 cj看作随机变量,则它们的关系可以用条件分布描述。一种方法是将该条件分布看作Bernoulli分布,用如下的形式表示:

图3 病理图像分割结果Fig.3 Pathological image segmentation results

该条件分布定义的基本思想是当某像素属于某细胞核时,其属于前景的概率也较大。模型参数可根据实际情况进行调整。有研究表明,只要参数不处于极端情况,实际推理结果对于该参数的具体值不是非常敏感,可以看作是一种定性的定义[5]。

利用上述混合图模型,推理得到像素级标记和目标级标记的最可能值,实现目标级的分割。由于本文所构造的混合图模型由有向图与无向图两部分构成,难于用传统的概率图推理方法进行直接推理。一种方法是将两部分统一转换为因子图,并利用和积算法等推理方法进行参数的最大后验估计,实现最优标记。根据因子图,可以将本文提出的混合图作如下分解:

从而实现像素级标记 y 与目标级标记 c 的同步推理,实现细胞核的分离与位置的准确检测;同时,还能够实现细胞核的真实边缘 e 的最大后验估计,从而实现细胞核轮廓的准确勾勒。

4 实验与结论

采用本文提出的概率图模型针对H&E 染色的病理样本显微图像进行分割实验,以验证该方法的有效性。实验样本采用H&E 染色的乳腺肿瘤病理图像,原始显微病理图像如图3(a)所示。可以看出图3(a)第二幅图的细胞核存在大量的粘连,甚至部分重叠的情况,这也为实现不同细胞核的准确分割与轮廓勾勒带来难度。利用传统方法对图3(a)中的原始显微病理图像进行分割,其结果如图3(b)所示,利用本文方法对图3(a)中的原始显微病理图像进行分割,其结果如图3(c)所示。由对比可知,传统方法在应对细胞核粘连和重叠情况下,分割的准确率较低,而通过本文中的概率图模型方法分割的准确性较高。综上所述,基于概率图模型的病理图像分割方法能够在复杂的纹理背景下,估计细胞核对于不同区域与边缘依赖关系,从而提高了分割的准确性。

猜你喜欢

有向图细胞核边缘
有向图的Roman k-控制
野生鹿科动物染色体研究进展报告
植物增殖细胞核抗原的结构与功能
超欧拉和双有向迹的强积有向图
关于超欧拉的幂有向图
一张图看懂边缘计算
中药提取物对钙调磷酸酶-活化T细胞核因子通路的抑制作用
细胞生物学
有向图的同构判定算法:出入度序列法
在边缘寻找自我