用于乳腺癌诊断的图像局部信息增强技术
2020-04-10付其林邓安生曲衍鹏
付其林,邓安生,曲衍鹏
(大连海事大学 信息科学技术学院,辽宁 大连 116026)
1 引 言
乳腺癌是影响女性健康的常见疾病之一.根据世界卫生组织国际癌症研究所的统计,世界上每年有100多万妇女死于乳腺癌,2016年乳腺癌的发病率增加了13.6%[1].其早期的诊断主要靠专家通过乳腺X光图像[2]进行筛查.然而,即使是专业的放射科医生有时也无法发现乳腺X光图像异常.而且在医学调查后发现,有时医生诊断出的异常通常是良性的.因此,通过CAD系统辅助医生进行乳腺癌判别受到了很大关注.
在CAD处理过程中,图像处理对于提取高质量特征以获得准确的诊断结果起着至关重要的作用.一般来说,乳腺癌诊断的图像处理过程包括以下三个步骤:感兴趣区域(ROI)提取、图像增强和特征提取.乳腺X光图像通常包含标签和伪影.噪声、血管组织和腺体组织也可能影响异常区域的搜索,导致分类精度差.因此,特征提取通常不适合用于整个乳腺X光图像,而是适合于特定的区域,如ROI[3].为了提取ROI,通常先对图像进行去噪处理.在文献[4]中,为了避免某些区域微观结构所造成的影响,使用中值滤波器对乳腺区域进行平滑处理.然后利用灰度信息结合模糊C均值聚类方法将像素分为脂肪组织和致密组织两类.在文献[5]中作者使用了质心法和最大内接圆提取ROI区域.
图像增强的目的是提高目标特征的可识别性和图像质量,以满足特定应用场景的分析需求[6].常用的图像增强方法主要有以下几种:1)直方图均衡化[7];2)中值滤波[8];3)小波变换[9].在增强ROI之后,会提取特征进行进一步分析.一般将特征提取方法分为以下四类:1)统计方法:如灰度共生矩阵(GLCM)[10];2)几何方法:如棋盘格特征法[11]和结构方法[12];3)模型方法:典型的方法有马尔可夫随机场模型方法[13]和吉布斯随机场模型方法[14];4)信号处理方法:利用线性变换或滤波将纹理转换到变换域,然后应用某种准则提取特征[15].
传统的医学图像增强方法通常是完整地处理从原始图像中提取的ROI.然而在ROI中,并不是所有的信息都与决策相关.在整个ROI中由于不相关或无用信息的增强与突出,可能会产生很多不相关的特征数据.这会影响后续的特征选择和诊断决策等数据分析工作.
为了解决这些问题,本文基于信息熵对ROI图像局部增强(IR)策略进行研究,分层次地提高乳腺图像特征的质量.具体来说,本文首先采用文献[16]中的方法获得乳腺癌图像的ROI.然后使用滑动窗口算法[17]对得到的ROI进行分割.通过图像信息熵的值来评估每个窗口块的重要性[18].因为图像信息熵表明对象和给定特征集的标签之间存在正依赖关系,所以最高熵值的窗口更能决定图像标签,更适合表示整个ROI.此外,还采用脉冲耦合神经网络(PCNN)方法[19]对信息熵最高的窗口块进行增强.为了进一步保证特征的质量,不同阈值的PCNN将反复增强优胜窗口块,创建一个图像增强结果池.对于乳腺X光图像,将候选增强块嵌入原始ROI后,使用熵权法对各自提取的特征进行对比,计算的最大值的一组特征将表示这幅图像.最后将基于该策略(IR)提取的特征与原始图像特征、全局增强图像特征和随机选择窗口的局部增强图像特征的乳腺癌诊断结果进行比较.本文使用的分类器包括JRip[20],PART[21],AdaBoostM1[22],RandomForest(RF)[23].实验结果表明,在分类精度和AUC指标[25]方面,基于本文所提方法所获得特征的诊断结果明显优于其他特征来源的评估结果.为了验证所提方法的适用性,本文还根据不同滑动窗口结构的IR所获得的特征,给出了计算结果.
2 理论背景
本节介绍了图像信息熵的概念,并将其作为本文的指标.同时回顾了本文中使用的特征提取、图像增强方法.
2.1 图像信息熵
图像信息熵是一种特征的统计形式,它反映了图像中平均信息量的多少[18].图像的一维熵表示图像中灰度分布的聚集特征所包含信息量,令Pi表示图像中灰度值为i的像素所占的比例,则定义灰度图像的一元灰度熵为:
(1)
图像的一维熵可以表示图像灰度分布的聚集特征,却不能反映图像灰度分布的空间特征,为了表征这种空间特征,可以在一维熵的基础上引入能够反映灰度分布空间特征的特征量来组成图像的二维熵.选择图像的邻域灰度均值作为灰度分布的空间特征量,与图像的像素灰度组成特征二元组,记为(i,j),其中i表示像素灰度值,j表示邻域灰度均值:
Pij=f(i,j)/N2
(2)
上式反应了某像素位置上灰度值与其周围像素灰度分布的综合特征,其中f(i,j)为特征二元组(i,j)出现频数,N为图像尺度.则定义离散图像二维熵为:
(3)
构造的图像二维熵可以在图像所包含信息量的前提下,突出反映图像中像素位置的灰度信息和像素邻域内灰度分布的综合特征.
熵权法就是根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其熵值越小,指标的离散程度越大,该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用.最后通过计算每个样本特征的熵权值来选择最佳特征.
对于给定的特征集,具有较高图像信息熵的对象与决策更为相关.因此在这种情况下,利用图像信息熵作为度量工具,在所提出的策略中选择最佳的ROI局部信息,并利用熵权法计算得到每个乳腺图像的最佳特征进行融合.
2.2 灰度共生矩阵(GLCM)
本文使用的特征提取方法是灰度共生矩阵(GLCM).GLCM是通过研究灰度空间相关性特征来描述纹理的一种常用方法[10].在文献[10]中,提出了如何使用GLCM描述纹理特征.GLCM方法是通过计算灰度图像来获得共生矩阵.然后通过计算GLCM得到矩阵的一些特征值,分别表示图像的一些纹理特征.GLCM 可以反映图像灰度在方向、相邻区间、变化幅度等方面的综合信息,它是分析图像局部模式及其排列规律的基础.本文突出显示了基于GLCM提取的如对比度、纹理熵、相关性、方差等纹理特征.
2.3 脉冲耦合神经网络(PCNN)
脉冲耦合神经网络(PCNN)是一种迭代图像增强模型,它模拟了哺乳动物视觉皮层神经元对视觉信号的响应.PCNN方法可以提高图像的亮度,增强图像的边缘,使纹理细节更加突出[19].因此,采用PCNN对乳腺图像进行处理,使其纹理更清晰且更容易识别.PCNN的框架可以看作是一个单层的二维神经网络,其中每个神经元对应于输入图像的每个像素.图1显示了一个PCNN神经元模型,其中包括一个接受域、一个非线性调制域和一个脉冲发生器.各部分的功能介绍如下.
图1 PCNN神经元模型Fig.1 PCNN neuron model
对于图像中坐标为(i,j)的像素,接受域的输入由反馈输入Fij和线性连接输入Lij组成,定义如下:
Fij[n]=Sij[n]
(4)
Lij[n]=e-αLLij[n-1]+VL∑WijklYkl[n-1]
(5)
其中Fij作为外部输入信号,等于该像素灰度Sij.Lij是邻域神经元的连接输入,它通过Ykl和Wijkl加权和得到.Ykl初始化为0,是相邻神经元的输出.对于PCNN,将每个神经元的输出作为相邻神经元的输入.Wijkl是内部连接矩阵,存储相邻神经元连接的加权系数.n是脉冲点火迭代次数.αL是Lij的衰减常数.VL是连接输入的内在电势.
Uij作为调制域的输出,是由Fij和Lij两个输入通道通过调制信号形成的内部活动项.它的定义如下.
Uij[n]=Fij[n](1+βLij[n])
(6)
其中β为连接强度系数.
在脉冲发生器中,将Uij与动态阈值Eij进行比较,生成输出脉冲Yij.当神经元动态阈值Eij超过内部活动项Uij时, 脉冲发生器关闭,脉冲停止.然后,阈值开始呈指数递减.当动态阈值低于Uij时,脉冲发生器再次打开,神经元被触发或激活,脉冲序列按如下方式输出.
Eij[n]=e-aEEij[n-1]+VEYij[n-1]
(7)
(8)
其中VE是振幅常数.αE是动态阈值Eij的时间衰减常数.它可以确定处理所有像素的循环中的迭代次数.Yij是PCNN脉冲输出函数.
利用脉冲发生器的输出,公式(9)提高了每个像素的灰度值.
(9)
3 基于信息熵的图像局部增强策略
基于上述方法,本文提出了一种基于信息熵的图像局部增强策略(IR)用于乳腺X光图像风险评估.图2说明了提议方案的流程图.该策略包括三个步骤:
1)图像预处理和ROI提取.
2)ROI分割和局部评估.
3)ROI局部增强和特征融合.
图2 提出方法的体系结构Fig.2 Architecture of the proposed approach
3.1 图像预处理和ROI处理
本节对乳腺图像进行预处理,提取乳腺组织区域以供进一步分析.首先去除胸肌和其他伪影,如定位标签和胶带.由于大多数致密组织和实质形态位于乳腺纤维腺盘区,因此将从这些区域提取特征.根据组织密度的乳腺癌诊断标准,无论组织的密度级别如何,纤维腺区以外的区域都含有脂肪组织,因此在纤维腺体区域之外提取的特征并不能为组织密度分类提供有力证据.本节从每张乳腺X光图像中提取大小为256×256像素的纤维腺盘区域.如图3所示,在提取纤维腺盘区域时,将乳腺边界的最长垂直距离(通常是和乳头区域的垂直距离)和乳腺边界的平行距离线的交点作为ROI区域的中心点.基于这个中心点,提取大小为256×256像素的样本纤维腺盘区域作为ROI[16].
图3 从乳腺X光摄影图像中提取ROIFig.3 Extracting ROI from mammography images
3.2 ROI分割和局部评估
在该策略中,采用滑动窗口算法分割ROI区域来获取初始提取的ROI的局部信息.为了使实验更加全面和可信,将滑动窗口的大小分别指定为160×160,176×176,192×192,208×208,224×224像素.同时为了评估每个窗口块在ROI中的重要性,我们将选择具有最高图像信息熵的窗口块,以获得进一步的增强.
具体来说,该策略在对每幅乳腺图像的ROI进行局部分割后,选择熵值最大的块区域进行增强.为了保证图像增强过程的质量,本文通过PCNN多轮策略进一步改进优胜块,创建一个图像增强结果池.对于乳腺X光图像,本文将候选增强块嵌入原始ROI后,使用熵权法对各自提取的特征进行对比,将计算结果值最大的一组特征表示这幅图像.
3.3 ROI局部增强和特征融合
如前所述,αE应尽可能取合适的值,以确保Eij能够衰减的足够慢,以便通过不同的点火时间来区分相邻的灰度值.因此,PCNN将所选窗口块上的图像增强进程实现为一个多轮策略,根据每个策略阈值αE的不同,从而创建一个图像增强结果池.在此过程中,表示每张乳腺X光照片的候选特征集数量与PCNN算法中αE不同值个数相同.如图4所示,所有候选增强窗口都将嵌入到原始ROI中,由GLCM生成特征,以供进一步评估.
图4 ROI局部增强Fig.4 ROI Local enhancement
本文所提策略利用熵权法对局部改进ROI提取的候选特征进行评估.另外在评估窗口块的过程中,其余图像是用从整个原始ROI中提取的特征来表示.最后通过不同轮的图像增强处理,可以得到每幅乳腺图像的优胜特征集.这些特征集的融合将作为最终的乳腺图像数据集.
在接下来的实验中,对比研究将使用IR策略的两种变体:全局增强ROI(GR)方法和随机局部增强ROI(RR)方法.具体来说,GR方法是指在所提出的策略的图像增强过程中增强整体ROI的方法.当IR策略随机选择窗口块进行进一步增强时,称为RR方法.这两种方法的应用将证明IR方法的有效性和优越性.
4 实验结果
本文使用的实验数据来源于乳腺图像分析学会(MIAS)数据库中提取的图像,包括161名女性(322例)的左右侧位斜位(MLO)乳腺X光照片.并基于BI-RADS[24]设置乳腺X光图像风险评估指标.
本文通过使用混淆矩阵,分类精度和AUC的统计检验,将基于该策略(IR)提取特征的风险评估结果与基于原始ROI方法、GR方法和RR方法的评估结果进行比较.此外,本文还讨论了该策略在不同滑动窗口尺寸下的性能.表1介绍了本文实现方法的配置参数.
表1 基于信息熵的局部增强策略配置
Table 1 Configuration of local enhancement
strategy based on information entropy
方 法 参 数 脉冲耦合神经网络1.衰减常数 αL= 0.069312.固有电势 VL= 1.003.连接强度系数 β = 0.24.振幅常数 VE = 2005.时间衰减常数 αE = 0.0016.更新的轮数 n=100灰度共生矩阵1.距离 d= 12.方向角度 0°,45°,90°,135°特征融合1.Pij=f(i,j)/N22.二维熵 H=-∑255i=0∑255j=0PijlogPij
4.1 性能评估
本节采用混淆矩阵,分类精度t检验和AUC指标进行乳腺X光图像风险评估.
4.1.1 混淆矩阵
基于原始、RR、GR和IR数据集特征的BI-RADS度量混淆矩阵结果在表2中进行描述.并采用100棵树的RF方法实现分类任务.滑动窗口的大小设置为160×160像素.
本文所提的IR策略目的是为了减少类混淆,例如减少表2中II类和III类之间的混淆.因为II类和III类构成了BI-RADS主体,所以减少类混淆是具有现实意义的.如表2所示,原始数据集在区分II类和III类方面表现得很差.例如,通过RF方法,19个II类成员错误地分为III类,11个III类成员错误地分为II类.虽然通过RR和GR改进了RF的分类结果,但是IR的性能仍然优于其他所有方法.第II类和第III类中很少有样本错误地分为另一类.可以看出IR策略显著提高了分类能力.实验表明,与原始数据集和传统的图像增强策略GR相比,IR策略能够取得更好的风险评估结果.此外,使用信息熵来评估窗口块比随机选择窗口块效果更好.
表2 BI-RADS的混淆矩阵和分类精度
Table 2 BI-RADS confusion matrix and classification accuracy
Original(69.25%)ⅠⅡⅢⅣⅠ371840Ⅱ1354190Ⅲ01112012Ⅳ022012RR(82.91%)ⅠⅡⅢⅣⅠ481001Ⅱ07727Ⅲ471275Ⅳ111715GR(90.06%)ⅠⅡⅢⅣⅠ53240Ⅱ27590Ⅲ041363Ⅳ01726IR(90.99%)ⅠⅡⅢⅣⅠ52115Ⅱ08123Ⅲ341342Ⅳ43126
4.1.2 分类精确度的统计检验
本文采用显著性水平为0.05的t检验,通过前面介绍的4种分类方法,对得到的分类准确率进行统计分析.这样做是为了确保结果不具有偶然性.t检验的结果用三个标签进行注释:更好(v)、等效()或更差(*).这些通过统计得到的显著性结果在每个表的右栏进行汇总.
从表3所示的结果可以得出结论,提出的IR策略在统计上优于其他方法.这表明,IR策略确实以一种有效和卓越的方式提高了乳腺X光图像风险评估的特征质量.
表3 分类精度的t检验
Table 3 T test for classification accuracy
数据集AdaboostM1JRipPARTRFSummaryIR90.4488.2789.6791.84(v/ /∗)RR80.39∗79.68∗77.48∗82.16∗(0/0/4)GR88.40∗86.28∗86.72∗89.60∗(0/0/4)Original61.12∗65.90∗64.87∗67.19∗(0/0/4)
4.1.3 AUC的统计检验
在数据不平衡的情况下,分类准确率通常不能提供一个全面的效果评估,而受试者工作特征曲线(ROC)提供了一种附加的评价方法[25].ROC曲线有助于评价分类器的性能.利用曲线下面积(AUC)度量可以分析和评价学习算法的预测能力.AUC是统计上一致的度量.与使用分类精度相比,它更具鉴别性.因此,可以把AUC作为整体分类准确率的标准.在本节中,比较了分类器上不同数据集在AUC值上的分类精度.AUC的结果如表4所示.AUC值越高,性能越好.可以看出表中出现的“*”的数量远远大于出现“v”的数量.这也反映了IR方法的良好性能.
4.2 不同滑动窗口大小
在本节中,我们使用不同的滑动窗口大小来验证所提方法的优越性.本文将步长设置为16像素,使用大小分别为160×160,176×176,192×192,208×208,224×224像素的滑动窗口得到5个局部增强数据集.同时本文使用100棵树的RF分类器对所有数据集进行评估.
表4 AUC的t检验
Table 4 T test for AUC
数据集AdaboostM1JRipPARTRFSummaryIR0.980.930.930.98(v/ /∗)RR0.94∗0.89∗0.90∗0.96∗(0/0/4)GR0.980.92∗0.95v0.97∗(1/1/2)Original0.85∗0.85∗0.81∗0.90∗(0/0/4)
从图5中可以看出,与原始乳腺癌数据集相比,增强图像得到的特征数据集分类准确率更高.而且在大多数情况下,采用不同滑动窗口大小的IR方法得到的数据集优于GR和RR策略得到的数据集.此外在某些情况下,我们还可以看出滑动窗口的大小会对最终特征集的质量产生显著影响.
图5 对BI-RADS使用不同滑动窗口大小的分类精度Fig.5 Classification accuracy for different slidingwindow sizes for BI-RADS
总的来说,我们通过实验可以看出,与原始方法、RR方法和GR方法相比,IR策略的分类精度得到较大提高.通过采用不同的分类器对统计中的分类精度和AUC指标进行比较,进一步证明了IR策略的优越性.而且随着滑动窗口大小的不同,IR数据集也取得了一致较好的效果.从实验结果中我们可以得到利用图像信息熵选择医学图像处理任务的重要部分是可行的,局部评估得到的信息比全局评估得到的信息更具代表性.
5 结 论
本文提出了一种基于信息熵的图像局部增强策略(IR),用于分层次地提高乳腺图像特征的质量.因为具有较高熵的样本更能决定决策标签,所以该方法根据窗口块的图像信息熵最大值对ROI进行局部分割和增强.最终的特征数据集是融合多轮图像增强池中具有最佳熵权法值的特征而生成的.今后的工作将采用其他特征提取和图像增强方法,来得到质量更高、更具代表性的特征数据.