APP下载

不同分类器对苏木精-伊红染色在早期胃癌组织病理图像分级研究*

2020-12-30胡嘉影陈雨萍罗志飞蔡仁桑马梦晨黄幼生陈梦柚

中国医学装备 2020年12期
关键词:组织学像素点纹理

胡嘉影 陈雨萍 罗志飞 蔡仁桑 马梦晨 黄幼生* 陈梦柚

苏木精-伊红染色法(hematoxylin-eosin staining,HE)是石蜡切片技术里常用的染色法之一,在组织学、病理学等研究方面使用非常广泛[1]。早期胃癌是指癌组织限于胃黏膜层及黏膜下层,不论其范围大小和是否有淋巴结转移,多见于中老年人,早期胃癌患者经过有效治疗后5年生存率达90%以上[2]。HE染色活检组织病理学检查是诊断早期胃癌的主要手段,近年来随着计算机技术的迅速发展,利用计算机辅助数字病理的过程中,将显微镜下观察到的图像通过电脑扫描制作成数字病理图像,能够极大提高诊断效率和准确性[3]。

医学图像分割是医学图像处理与分析领域的复杂而关键的步骤,其目的是分割和提取医学图像中具有特殊含义的相关特征,为临床诊疗和病理学研究提供可靠的依据。本研究利用训练逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)和朴素贝叶斯(naive Bayes,NB)3个机器学习算法分类器对像素点进行癌巢区域和间质区域进行区分,对比癌巢分割效果,选择效果最佳的分类算法观察其图像组织学分级效果。

1 资料与方法

1.1 临床资料

选用2018年1月至2019年12月海南医学院第一附属医院病理科的420幅原始HE染色胃癌组织病理图,其中黏膜内癌[cT1a(M)]185幅,黏膜下癌[cT1b(SM)]235幅。使用Matlab7.0软件对病理图像进行灰度化、去噪、增强对比度、特征提取及图像分割等处理。

1.2 仪器设备

采用数字切片扫描与应用系统(厦门麦克奥迪实业集团有限公司,闽械注准20162220080)。

1.3 采集图像

将收集的420幅病理切片均运用数字切片扫描与应用系统进行数字化扫描(20倍物镜)形成数字化病理切片,并制作成TIFF格式图像集,其分辨率为1024×1360。

1.4 图像处理方法

1.4.1 癌巢分割

对原始的HE染色胃癌组织病理图像进行预处理,包括灰度化、去噪和对比度增强。

(1)灰度化。根据重要性及其他指标,将红、绿、蓝(Red,Green,Blue,RGB)3个分量以不同的权值进行加权平均。由于人眼对绿色敏感最高,对蓝色敏感最低,因此,对RGB的3个分量进行加权平均得到较合理的灰度图像,其转换算法为公式1:

式中L为灰度值;R为红色分量;G为绿色分量;B为蓝色分量。

(2)去噪。为消除图像中的噪声并对图像平滑化,选择3×3模板扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均值替代模板中心像素点的值。

(3)对比度调整。将给定图像的直方图分布改变成“均匀”分布直方图分布。根据图像灰度计算概率密度函数(probability density function,PDF);计算累积概率分布函数的累积分布函数(cumulative distribution function,CDF);将CDF归一化到原图灰度取值范围,如[0,255](灰度图像像素值的取值范围为[0,255])之后CDF四舍五入取整,得到灰度转换函数,其算法为公式2:

式中sk为目标图像灰度值;T为输入灰度级和输出灰度级之前的映射关系;rk为原始图像灰度值;将CDF作为转换函数,将灰度为rkrk的点转换为sksk灰度。

1.4.2 特征提取

(1)颜色特征提取。将颜色空间RGB模型转化成六角锥体(Hue,Saturation,Value,HSV)模型,RGB转换到HSV的算法:

(2)纹理特征提取。应用局部二进制模式(local binary pattern,LBP)算子的过程类似于滤波过程中的模板操作,逐行扫描图像,对于图像中的每一个像素点,以该点的灰度作为阈值,对周围3×3的8邻域进行二值化,按照一定的顺序将二值化的结果组成一个8位二进制数,以此二进制数的值(0~255)作为该点的响应。3×3区域的中心点,以其灰度值68作为阈值,对其8邻域进行二值化,并且从左上点开始按照顺时针方向(具体的顺序可以任意,只要统一即可)将二值化的结果组成一个二进制数10 001 011,即十进制的139,作为中心点的响应。局部二进制模式算子见图1。

图1 局部二进制模式算子示意图

1.4.3 细胞核分割

先对HE染色的早期胃癌组织病理图像进行主成分分析,得到含有苏木精颜色信息的灰度图像后进行形态学预处理,得到较好的细胞核轮廓,运用快速径向对称变换提取种子点,将种子点标记在原图中,进行后景标记后完成预分割,得到初始轮廓;进行曲线演化得到最终轮廓。分割算法步骤为:原始图像→提取苏木精染色通道的灰度图→形态学操作→图像预处理→快速径向对称变换→前景、后景标记→分水岭变换→分水岭分割线→主动轮廓模型→细胞核区域。

1.4.4 图像组织学分级

应用SVM进行图像分类时,整个过程划分为训练阶段分类阶段。在试验步骤中,对所采集的图像特征提取,然后分别对图像分配类标签1和2以组成样本。将每个类别图像总数的4/5作为训练集,1/5作为测试集。即cT1a(M)级患者148幅图像用于训练,37幅图像用于测试;cT1b(SM)级患者188幅图像用于训练,47幅图像用于测试。每次划分均采用随机方法将图像划分为5份,共进行10次试验,记录每一次试验被正确分类的各个类别的数量,取其平均数。分别在像素级别特征(pixel level features,PLF)、对象级别特征(object level features,OLF)及两者组合(PLF+OLF)上进行试验。试验结果分别统计被正确分类和错误分类的正例与负例的平均数,SVM分类器的核函数为径向基核函数,参数sigma=5。

1.5 观察与评价指标

选取一幅典型的图像并请病理科医生对此图像中的癌巢与间质作分割,在病理医生的指导下随机地划分癌巢区域,选取100个典型的像素点,提取其颜色特征和纹理特征,一起组成正例样本,同样地在图像中被划分为间质区域里选取100个典型的像素点,也提取其颜色特征与纹理特征,一起组成负例样本,将正例样本和负例样本组合在一起组成训练样本,并训练LR、NB和SVM 3种分类器。

评估分类效果,以像素点数作为定量评估标准。将图像分割成癌巢和间质两个部分,因此定义真正例(TP)为被正确分割为癌巢区域的像素点数,假正例(FP)为被错误分割为癌巢区域的像素点数,真负例(TN)为正确分割为间质区域的像素点数,假负例(FN)为被错误分割为间质域的像素点数,查准率P=TP÷(TP+FP),查全率R=TP÷(TP+FN)。对比不同算法下癌巢分割效果。

2 结果

2.1 癌巢分割效果对比

SVM分类器的查准率和查全率分别为85.4%和81.6%,高于LR分离器(83.0%和80.0%)及NB分离器(82.2%和79.4%),3种分类器间比较均无统计学差异,见表1。

表1 三种分类器的分类效果

2.2 图像组织学分级效果对比

在图像组织学分级准确率中,cT1 a(M)级患者图像与cT1 b(S M)级患者图像二分类时,分类器在PLF 上的图像组织学分级准确率为(23.6+36.8)÷(37+47)=71.9%,在OLF上的图像组织学分级准确率为(23.0+36.5)÷(37+47)=70.8%,在两者组合(PLF+OLF)上的图像组织学分级准确率为(25.8+38.6)÷(37+47)=76.7%,相比于单独PLF或OLF,两者组合的图像组织学分级准确率较高,与其他两组比较差异均无统计学意义。cT1a(M)被正确分级的准确率为25.8÷37=69.7%,cT1b(SM)被正确分级的准确率为38.6÷47=82.1%,见表2;患者早期胃癌组织学分级图像见图2。

3 讨论

HE病理图像分析中,图像质量的好坏直接影响识别算法的设计与效果的精度,原始的HE染色胃癌组织病理图像中存在噪声,因此在图像分析(特征提取、分割、匹配和识别)前需要进行预处理[4]。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性,最大限度地简化数据,从而改进特征提取、图像分割、匹配和识别的可靠性[5]。图像预处理主要包括灰度化、去噪及对比度增强。

表2 cT1a(M)与cT1b(SM)患者图像的分级情况(%)

图2 早期胃癌组织病理图

对HE染色图像进行处理时,往往需要对3个通道依次进行处理,将会消耗很多时间。因此,为了达到提高整个应用系统的处理速度的目的,需要对彩色图像进行灰度化以减少所需处理的数据量。在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0~255[5]。根据重要性及其他指标,将3个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,对RGB3个分量进行加权平均能得到较合理的灰度图像。

对图像去噪时,滤波器有抑制噪声和光滑化的作用,常用的滤波器有均值滤波、中值滤波和高斯滤波等[6]。高斯滤波器是一种线性滤波器,能够有效的抑制噪声,平滑图像,其作用原理和均值滤波器类似,都是取滤波器窗口内的像素的均值作为输出,其窗口模板的系数和均值滤波器不同,均值滤波器的模板系数都是相同的为1;而高斯滤波器的模板系数,则随着距离模板中心的增大而系数减小[7]。因此,高斯滤波器相比于均值滤波器对图像模糊程度较小。在比较各种滤波器效果之后选择3×3模板大小的高斯滤波。

在对比度调整时,基于直方图的对比度调整方法:直方图均衡化通过使用累积函数对灰度值进行“调整”以实现对比度的增强。直方图均衡化处理的“中心思想”是将原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同,也是把给定图像的直方图分布改变成“均匀”分布直方图分布。

在颜色特征提取中由于组织或细胞的不同成分,对苏木精的亲和力不同及染色性质不一样。经苏木精染色后,细胞核及钙盐粘液等呈蓝色;再利用胞浆染料伊红染胞浆,使胞浆的各种不同成分又呈现出深浅不同的粉红色,这是区分不同组织对象的一个重要信息[8-10]。在图像处理中,可以将一个具体的像素点所呈现的颜色分多种方法分析,并提取出其颜色特征分量。颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献[9]。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。此外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响。

纹理特征也是一种全局特征,其描述了图像或图像区域所对应景物的表面性质[11]。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,需要在包含多个像素点的区域中进行统计计算。图像的纹理特征有很多种,如灰度共生矩阵、Tamura纹理特征、自回归纹理模型、小波变换、Gabor以及LBP等。

LBP方法是一种用来描述图像局部纹理特征的算子,其作用是进行特征提取,提取图像的局部纹理特征[12-13]。LBP是计算机视觉中用于图像特征分类的一个方法,用于纹理特征提取。LBP纹理特征向量,一般以图像分块LBP直方图表示。得到了整幅图像的LBP纹理特征后,便可利用SVM或者其他机器学习算法进行分类。

分水岭分割方法是一种基于拓扑理论的数学形态学的分割方法,其基本思想是将图像看作测绘学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭[14]。分水岭算法是一种图像区域分割法,在分割的过程中会把跟临近像素间的相似性作为重要的参考依据,对图像每个像素的灰度级进行从低到高排序,再从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(first in first out,FIFO)结构进行判断及标注[15]。

本研究中,通过将显微镜下观察的患者组织切片扫描到计算机上并制作成TIFF格式,该图像集的分辨率为1024×1360。选取一幅典型的图像并请病理科医生对此图像中的癌巢与间质作分割,在病理医生的指导下随机划分癌巢区域,选取100个典型的像素点,提取其颜色特征和纹理特征,一起组成正例样本,同样的在图像中被划分为间质区域里选取100个典型的像素点,也提取其颜色特征与纹理特征,一起组成负例样本,将正例样本和负例样本组合在一起组成训练样本,并训练LR、NB和SVM的3个分类器。为评估分类效果,本研究以像素点数作为定量评估标准,将图像分割成癌巢和间质两个部分,因此定义真正例(TP)为被正确分割为癌巢区域的像素点数,假正例(FP)为被错误分割为癌巢区域的像素点数,真负例(TN)为正确分割为间质区域的像素点数,假负例(FN)为被错误分割为间质域的像素点数。结果显示SVM分类器的查准率和查全率高于LR和NB分类器。

细胞核分割中,对HE染色的早期胃癌组织病理图像进行主成分分析,得到含有苏木精颜色信息的灰度图像,然后用形态学操作进行预处理,去除干扰成分,得到较好的细胞核轮廓,再运用快速径向对称变换提取种子点,将种子点标记在原图中,在进行后景标记后运用分水岭变换完成预分割,将预分割得到的轮廓线作为主动轮廓模型的初始轮廓,进行曲线演化得到最终轮廓。

组织病理学上根据浸润深度将早期胃癌分为cT1a(M)、cT1b(SM),在图像组织学分级的试验中,先提取图像相关特征,如PLF及OLF等,OLF提取包括前面提到的分割的癌巢特征与细胞核特征,然后使用分类模型将图像分类为1和2,分别为cT1a(M)和cT1b(SM)。本研究中,在cT1a(M)患者图像与cT1b(SM)患者图像二分类时,分类器在PLF上准确率为71.9%,在OLF上准确率为70.8%,在两者组合(PLF+OLF)上的准确率为76.7%,相比于单独PLF或OLF,两者组合的准确率较高。cT1a(M)被正确分类的准确率为69.7%,cT1b(SM)被正确分类的准确率为82.1%。结果表明,从图像分析的角度对图像的组织学分级可行,而HE染色的早期胃癌组织病理图像可以直接反映患者的胃癌状态。

4 结论

HE染色的早期胃癌组织病理图像的组织学分级可以在一定程度上代表患者的组织学分级。在HE染色早期胃癌组织病理图像中癌巢分割中,SVM分类器的查准率和查全率较高,同时其对图像组织学分级效果较好。

猜你喜欢

组织学像素点纹理
图像二值化处理硬件加速引擎的设计
不同灸法对免疫抑制兔脾脏、胸腺影响的组织学研究
花刺参幼参摄食和消化器官形态学和组织学研究
基于局部相似性的特征匹配筛选算法
基于BM3D的复杂纹理区域图像去噪
《呼吸道感染牛分枝杆菌对肝脏和肠道影响的病理组织学观察》图版
使用纹理叠加添加艺术画特效
基于像素点筛选的舰船湍流尾迹检测算法
基于canvas的前端数据加密
TEXTURE ON TEXTURE质地上的纹理