基于HSV 分量联合Hessian 矩阵的卵巢癌细胞检测算法*
2022-04-07邹礼萍李永彬
邹礼萍 罗 红 李永彬
(1.遵义医科大学医学信息工程学院 遵义 563000)(2.贵州大学机械工程学院 贵阳 550025)
1 引言
卵巢癌是严重威胁妇女健康的恶性肿瘤之一,发病率仅次于宫颈癌,死亡率居各类妇科癌症之首。由于早期无明显特征和症状,难以发现,出现症状时已是晚期,治愈率极低,因此早发现是治愈该病的关键。目前主要通过病理学检查来早期识别和判断,工作量大,可靠性低。近年来,随着数字图像处理技术在临床诊断中的应用,大大提高了工作效率和可靠性,但由于癌细胞形态特征多变,细胞图像背景复杂,使得细胞特征的提取成为了一个难题,多年来很多学者对该问题展开了深入的研究。利用先进的计算机图像处理技术对卵巢癌细胞图片进行图像增强,细胞分割等预处理,再结合病理专家的临床经验可做到早发现早治疗,从而降低卵巢癌对女性生命健康的威胁,这是目前最有效的途径。
多年来,专家学者对细胞显微图像做了大量研究,细胞分割算法不断在优化[1~10],但在医学方面还达不到精准分割,还需要继续研究。对李天钢等[11]针对具有复杂纹理的胃癌细胞显微图像进行检测,提出了基于多尺度小波变换的边缘检测方法,解决了传统算法存在伪边缘和方向性误差的问题,提高了边缘检测的可信度。赵国超等[12]根据提取的38个细胞核特征组成的细胞样本特征矢量,利用主成分分析方法对原始特征向量进行降维处理,提出了一种强分类器集成算法,实现了癌细胞的分类识别。王云霞等[13]在通过对胃腺癌免疫组化细胞图像进行色度学分析并进行粗分割,提出了基于改进距离标记的分水岭分割算法,得到了较为准确的细胞轮廓。历谨等[14]利用细胞分类方法并结合细胞形态学特征,完成了癌细胞的提取,但提取的精度有待提高。马瑾等[15]应用宫颈癌细胞图像,建立了BP 神经网络模型,通过对模型的训练,使用人工神经网络模型的BP反向传播误差算法对细胞进行分类,但是由于BP 算法在训练过程中不易得到最优解,从而使得分类效果不佳。夏为为[16]等利用卷积神经网络的不同池化模型对宫颈癌细胞图像进行特征提取,分析了不同池化模型的特征提取方式以及对识别错误率的影响,提出了一种基于卷积神经网络的算法,该算法降低了宫颈癌细胞图像的识别错误率,但最终效果有待提高。
以上方法虽然实现了对胃癌细胞、宫颈癌细胞等的分类和提取,但针对卵巢癌细胞来说其实用性较差,为了更加有效地识别卵巢癌细胞,更加准确地提取卵巢癌细胞的轮廓特征,进而能够更加准确地识别卵巢癌,本文提出了基于HSV分量联合hessian 矩阵的卵巢癌细胞检测算法,首先提取卵巢癌细胞图像HSV 模型中的S 分量可以得到癌细胞的主要信息,同时去除部分噪声的干扰;然后通过Hessian 矩阵对卵巢癌细胞进行图像增强,使得细胞的局部特征更加凸显,并结合自适应迭代阈值算法完成图像的分割;再根据形态学方法去除图像中的干扰,最后运用canny 算子实现细胞轮廓特征的提取。
2 基于HSV 颜色空间的卵巢癌细胞图像分析
HSV 颜色模型是根据颜色的直观特性即色调(Hue)、饱和度(Saturation)、亮度(Value)而创建的一种颜色空间,也称为六角椎体模型。色调H表示颜色所处的光谱颜色的位置,用来区分不同的颜色;饱和度S反应颜色的纯度,取值范围为0-1,取值越大,饱和度越高,颜色越鲜艳,反之颜色越暗淡;亮度V 是指颜色表面的明亮程度,与光照强度之间没有直接联系。三个通道各有特点,对于图像的不同情况采用不同的通道来处理。如图像是由于光照不同而造成视觉感知不同,采用V通道计算梯度可较好的提取对象边缘;如图像前景饱和度较高,背景饱和度较低则使用S 通道可获得更好的效果;对风格单一,颜色单一的图像利用H通道效果更好。
HSV 模型是通过RGB 模型演变过来的,对应的HSV模型中的分量可由RGB表示为
相对于RGB 模型而言,HSV 模型更符合人眼对光的感知特性,色调H、饱和度S、亮度V 三个分量独立解耦[17],能够更加准确的量化图像的颜色信息。卵巢癌细胞在HSV 模型中的三个分量图如图1 所示,对比三个分量图可以发现:图(b)即H 分量图较好地保留了细胞信息,但同时也把原始图像的噪声保留下来,没有去除噪声的干扰,不利于后期对图像的进一步处理;图(d)即V 分量图虽然清除了大部分噪声,但细胞信息保留不够完整,也不利于后期特征的提取;图(c)即S 分量图很好地保留了细胞信息,同时去除了大部分噪声,效果最好,因此使用S分量图进行后期分析和识别。
图1 卵巢癌细胞的HSV颜色模型
3 细胞图像增强
图像增强是通过各种算法强化图像中感兴趣的区域,抑制部分噪声,增大图像前景和背景特征差别的过程,使图像信息量更加丰富,更容易判读和识别。常用的方法有中值滤波、高斯滤波等,但传统的滤波算法在平滑噪声的同时会使细胞边缘轮廓变得模糊,不利于进一步提取,针对这一问题,提出了利用Hessian 矩阵求特征值,根据特征值之间的关系提取边缘,凸显细胞形态特征算法轮。
Hessian 矩阵是由多元函数的二阶偏导数所组成的实对称矩阵[18],常被用于医学图像中的细胞增强处理。如果需要判断图像中的像素点m 是否属于卵巢癌细胞的轮廓区域,可通过泰勒展开式来表示图像I 中像素点m 邻域内的图像结构,数学表达式为
式中:∇I(m)表示像 素 点m 的 梯 度 向 量,H(m)表示Hessian 矩阵。对于二维图像I(x,y),像素点m 的Hessian 矩阵的数学表达式为
式中:Ixx,Ixy,Iyx,Iyy分别表示二维图像I 在四个不同方向上的二阶偏微分。
X方向上的二阶偏微分:
Y方向上的二阶偏微分:
X,Y方向上的二阶偏微分:
计算矩阵的特征值λ1、λ2,并根据两者之间的关系检测图中的细胞结构,并确定参数Rb和S,建立增强滤波函数区分背景与目标,其表达式为
β和c 可以调整Rb和S 的灵敏度。通过大量试验分析,取β和c分别为0.3、12。
Hessian 中通过构建高斯函数线性模型,用于完成细胞轮廓特征提取,通过设计增强滤波函数,将卵巢癌细胞图像噪声去除,从而达到图像增强的目的,图2(a)为卵巢癌细胞图像利用Hessian 矩阵增强后的效果图。
图2 Hessian矩阵增强与阈值分割效果图
4 自适应迭代阈值分割算法
由于增强后的卵巢癌细胞图像中灰度等级较多,细胞与背景的界限不够明显,因此需要进行图像分割处理,常用的图像分割算法有全局阈值法、最大类间方差法(OTSU)等,全局阈值法由于使用固定不变的阈值,因此实用性较差;最大类间方差法通过求取背景与目标之间的最大类间方差值作为阈值对图像进行分割,针对灰度波动较大,目标轮廓清晰的图像,分割效果较好,但运用于边缘较为模糊,背景较为复杂,细胞形态多变的卵巢癌细胞图像的分割,会使得细胞信息丢失严重。针对卵巢癌细胞图像中灰度分布不均,细胞形态多变的现象,提出了一种自适应的阈值分割算法,具体计算流程如下:
1)为全局阈值T 确定一个初始估计值,计算出图像中所有像素灰度的平均值,将该平均值作为图像的初始阈值T。
2)以初始值T 为阈值分割图像,将产生两组像素I1和I2∶I1由灰度值小于平均值T 的所有像素组成,I2由灰度值大于T的所有像素组成。
3)分别计算像素I1、I2的平均灰度值average1和average2。
4)利用I1、I2的平均灰度值average1和average2,重新计算新的阈值,计算方法为
5)重复步骤2)到步骤4),直到迭代得到相邻两T 之间的差值小于设定的参数t为止。对卵巢癌细胞图像自适应迭代阈值分割算法的分割
效果如图2(b)所示,从实验结果看出,分割效果较好,去除了背景的干扰,突出了细胞的结构特征,保留了细胞的主要轮廓,但细胞内部信息有所丢失,同时也带入了很多细小的噪声。针对该问题,通过形态学方法选取适当的结构元素进行腐蚀膨胀运算可以有效地去除噪声,完善细胞的结构。
5 边缘检测
图像边缘是图像的基本特征之一,包含了图像的大部分信息,边缘检测是获取细胞形态特征的重要环节,后续处理中会发挥重要作用,在对图像边缘检测时先进行图像去噪和边缘增强,在采用某种算子进行边缘检测。常用的边缘检测算法有roberts 算子、prewitt算子、sobel算子、log算子、canny算子等,这些算子都利用了图像梯度的极大值,微分算子模板进行卷积来提取图像边缘[10]。
roberts算子是由Lawrence Roberts 在1963年提出来的第一个边缘检测算子,是一阶微分算子,它利用图像垂直方向和水平方向的差分来逼近梯度,可以提取背景单一的图像边缘,roberts算子定位较精确,但是对噪声比较敏感,不能控制噪声对边缘的影响。
prewitt算子是一阶微分算子,采用了更加复杂的模板,利用像素点上下左右的灰度差在边缘处达到极值来进行边缘检测,对于检测水平或垂直方向的边缘效果更好。
Sobel 算子是一阶差分算子,利用快速卷积函数检测图像边缘,由于Sobel 算子没有严格遵循人的视觉生理特征,没有基于图像灰度进行处理,通常提取的边缘不够完整,效果不尽如人意。
log 算子首先对图像做高斯滤波,再求图像拉普拉斯二阶导数,通过检测滤波结果的零交叉提取图像边缘,是不依赖于边缘方向的二阶微分算子,定位精度高,但抗干扰能力不强,
canny 算子是经典的边缘检测算子,通过对原始数据与高斯平滑模板作卷积,再运用4 个模板检测水平、垂直、对角线方向的边缘,最后使用滞后阈值避免了将没有组成曲线的噪声像素当成边缘,因此canny 算子具有低误率、高定位精度和抑制虚假边缘等优点,是所有算子中检测效果最好的算法,而且能够检测出弱边缘。
基于以上特点,本文采用canny 算子对卵巢癌细胞图像边缘进行检测,得到如图3 所示的实验结果,从图3 可以看出,所得细胞边缘轮廓清晰,弱边缘检测效果明显。
图3 卵巢癌细胞图像边缘检测效果图
6 实验分析
为了验证本文算法的效果,本文选取3 张不同时期的卵巢癌细胞图像作为实验图像,其尺寸统一为125×125 像素。算法的硬件运行环境为华硕XY670ZD;处 理 器:AMD 锐 龙5 2500U;CPU@3.60GHz 3.30GHz;安装内存(RAM):8.0GB;采用软件编程语言Matlab2015 工具进行图像处理实现算法,具体实验方法及步骤如下:
1)首先将卵巢癌细胞的RGB 图像转化为HSV颜色空间图像,并提取饱和度S 分量,得到原图的HSV颜色空间S分量图;
2)利用Hessian 矩阵对图像的S 分量进行图像增强,去除了部分噪声,使得细胞的形态特征变得更加凸显;
3)利用自适应迭代阈值对增强后的图像进行分割,得到二值图像,但同时也给图像带入了大量干扰,通过形态学腐蚀膨胀运算结合区域填充滤掉干扰;
4)最后运用canny算子实现细胞轮廓特征的提取。
实验结果如图4 所示,从实验结果可以看出,细胞轮廓清晰,细胞边缘连续,实验效果较好。
图4 卵巢癌细胞边缘提取效果图
7 结语
本文算法针对形状多变、背景复杂的卵巢癌细胞图像进行了细胞轮廓特征提取算法的研究,实现利用HSV 颜色模型S分量分析细胞的形态特征,结合Hessian矩阵和自适应迭代阈值分割算法滤除了图中存在的部分噪声,通过形态学方法结合canny边缘检测算子实现卵巢癌细胞轮廓特征提取,对细胞进行分类识别。实验证明,本文算法取得了较好的效果,解决了边界不连续的问题,极大地保留了细胞的边缘特征,提高了检测精度,进而提高了对细胞进行分类识别的准确度。但该算法目前只能处理颜色较深,细胞间重叠较少的图像,针对大面积扩散的细胞切片图像检测效果不佳,在接下来的工作中,如何提高检测算法的适用范围和保留更多图像细节信息,实现细胞重叠图像的轮廓提取及分割是研究的重点。