基于Adaboost-决策树算法的乳腺微钙化区域真假阳性检测
2021-08-31申楠邢素霞何湘萍潘子妍王瑜
申楠,邢素霞,何湘萍,潘子妍,王瑜
1.北京工商大学人工智能学院,北京100048;2.北京海淀妇幼保健院乳腺病防治中心,北京100080
前言
乳腺癌作为一种具有高发病率和死亡率的恶性肿瘤,已成为威胁全球女性健康甚至生命的主要杀手。乳腺癌的早期病症在乳腺钼靶图像中主要表现为微钙化点。乳腺钼靶图像中存在较多的乳腺纤维组织,其在图像中表现为高亮区域,而微钙化区域在图像中表现为细小的高亮区域,因此乳腺纤维组织和微钙化区域在亮度即灰度值上易混淆,增大了乳腺钼靶图像微钙化区域的检测难度。为此,很多研究在微钙化区域检测上做出了很多有意义的探索,如彭庆涛等[1]提出基于小波分析和灰度纹理特征相结合的微钙化区域提取方法,微钙化点检出率为85%;商小宝[2]提出一种基于旋转不变局部二值模式的早期乳腺钙化点检测方法,真阳性率为95.6%,假阳性率为5.6%;王科举[3]利用周围区域矩阵反映射乳腺微钙化区域特征,并结合随机森林分类器,特异性达到88%,曲线下面积达到0.922 4;Karale 等[4]提取乳腺微钙化区域的密度特征、形状特征、不变矩、Haralick 特征、基于方向梯度直方图的特征,每幅图像的平均误报率为2.59%,并能达到100%的灵敏度;Suhail等[5]利用改进的Fisher 线性判别方法对微钙化区域进行线性变换,平均准确率达96%。这些研究均为微钙化点的计算机辅助诊断的临床应用做出了贡献。
为进一步提高微钙化区域的检测准确率,降低检测假阳性率,本研究提出一种基于Adaboost-决策树(Adaboost-Decision Tree,AB-DT)的乳腺微钙化区域真假阳性检测方法,并采用10 折交叉验证确定AB-DT模型的性能。
1 特征提取
乳腺钼靶图像为灰度图像,钙化点的形态各异,有管状、圆形、爆米花状、轮圈状、杆状、球状、点状和发育不良型[6](图1)。而乳腺组织区域中微钙化点区域相对正常区域在纹理、灰度方面差异明显[7],因此可提取感兴趣区域(Region of Interest,ROI)的纹理和灰度特征作为分类器的输入特征。本研究提取ROI的Haralick 纹理特征和灰度游程矩阵特征建立特征集。
图1 钙化点类型Fig.1 Types of calcifications
1.1 Haralick纹理特征
Haralick 等[8]于1973年提出基于灰度共生矩阵的纹理特征统计方法。灰度共生矩阵反映了图像灰度分布关于方向、局部邻域和变化幅度的综合信息,由于灰度共生矩阵的数据量较大,一般不直接作为区分纹理的特征,而是把基于它构建的一些统计量作为纹理分类特征。为简化特征提取的计算过程,仅对ROI内每个像素与其8 邻域所组成的像素对进行统计,对应距离d= 1,且不考虑方向角度。
利用灰度共生矩阵提取19 个特征参数,分别是[9]:能量、熵、对比度、相异性、相关性、自相关系数、突出聚类、阴暗聚类、差熵、差方差、同质性、相关信息度1、相关信息度2、逆差距、最大概率、和平均、和熵、和方差以及平方和,定义如表1所示,表2为所用到的变量定义。
表2 Haralick纹理特征的变量描述Tab.2 Variable description of Haralick texture features
1.2 灰度游程矩阵
灰度游程矩阵统计图像中某个方向上同灰度值g连续的像素长度l的出现频率,是一个二维统计矩阵[10]。设一个M×N大小图像的统计矩阵为p(i,j|θ),即在θ方向构建的游程矩阵在(i,j)坐标下的位置,Ng为最大像素值,Nr为不同的像素沿方向θ的行走距离[11]。基于灰度游程矩阵可以计算7 个纹理特征参数[12]:短游程优势、长游程优势、长游程不均匀性、游程百分比、灰度不均匀性、低灰度级游程优势和高灰度级游程优势,详见表3。
表3 基于灰度游程矩阵的特征定义Tab.3 Feature definition based on grey-level run length matrix
2 AB-DT算法
2.1 Adaboost算法
Schapire 等[13]对Boosting 算法进行改进得到Adaboost算法。Adaboost算法运用迭代的思想,在使用样本训练集的过程中,挑选其中的关键分类特征,增加前一轮被错误分类的样本的权重,减小被正确分类的样本的权重,重复多次,逐步训练各弱分类器,并采用加权多数表决的方法调整各弱分类器的权重,最终筛选出权重系数最小的弱分类器构造成一个强分类器。
Adaboost 算法具有很强的适应性和灵活性。弱分类器可以与大多数的分类器兼容,如决策树、支持向量机、朴素贝叶斯以及K 最近邻等算法,可根据实际应用组合分类器,以获得最佳的分类识别效果[14]。
2.2 决策树
决策树是一种重要的机器学习和数据挖掘算法[15]。由于决策树算法易于理解和实现,对噪声数据具有良好的鲁棒性,与此同时具有很好的预测性能,因此被广泛用于各种实际领域。决策树是一种分类树结构的预测模型,描述了对象属性与对象值之间映射属性关系。学习时,根据最小化损失函数的原则,利用训练集数据建立决策树模型;预测时,利用决策树模型对新的数据进行分类。其中,单层决策树(也称决策树桩)是一种较为典型的简单决策树,只基于单个特征来做决策,仅有一次分裂的过程[16],因此处理数据非常迅速、简单易行、实时性好,十分适合作为弱分类器。
3 实验过程及结果
3.1 数据来源
DDSM (Digital Database for Screening Mammography)是由南佛罗里达大学于1999年提供数字化乳腺图像库,该数据库是一个高分辨率的乳腺钼靶图像标准数据库,含2 620 个病例[17]。每个病例包含右侧头尾位、左侧头尾位、右侧侧斜位、左侧侧斜位这4个视图的图像(图2)。每个视图的标注文件包含医师手动标注的病灶区域、病灶类型、病灶等级等相关信息。
图2 DDSM图像Fig.2 Images from digital database for screening mammography
将来自DDSM 的图像转换格式后,从中手动截取400 幅128×128 像素的ROI,其中200 幅为医生标注的钙化区域图像,另外200 幅为疑似钙化区域图像。如图3所示,图3a 为乳腺钼靶的原始图像,图3b为用OVERLAY 文件生成的金标准图像,图3c 和图3d 分别为从乳腺钼靶图像中截取的疑似钙化区域和微钙化区域图像。
图3 乳腺钼靶图像、对应的金标准图像及其所含的疑似钙化区域和微钙化区域放大图Fig.3 Mammography,the corresponding gold standard image and the enlarged images of suspected calcification region and microcalcification region
3.2 AB-DT参数的确定
乳腺微钙化区域检测方法流程如图4所示。提取图像的Haralick 纹理特征及灰度游程矩阵特征,26维特征组成特征集来量化乳腺的微钙化区域。决策树作为弱分类器,通过Adaboost 集成算法生成强分类器AB-DT。
图4 乳腺微钙化区域检测方法流程图Fig.4 Flowchart of breast microcalcifications detection
在AB-DT 算法中,决策树的数量k影响着分类器的性能,当k值较小时,AB-DT 算法的分类误差较大,算法分类性能差;而AB-DT 算法的复杂性与k值成正比,k值越大,算法的复杂度越高,运行时间也越长。在400幅ROI图像中,随机选取80%的ROI图像作为训练集,剩余的20% 作为测试集。通过MATLAB 中的集成学习工具箱,搭建AB-DT 模型。设置决策树的数量为500,绘制决策树的数量与分类错误率的关系曲线,如图5所示。横坐标表示决策树的数量,纵坐标表示分类错误率。
由图5可知,当k≥484 时,分类错误率趋于稳定,图像存在多个分类错误率最低点,综合分类准确率和运算复杂度,决策树的数量k应设置为462(即第一个分类错误率最低点的横坐标)。
图5 决策树数量与分类错误率的关系曲线Fig.5 Relationship between the number of decision trees and classification error rate
3.3 评价标准
为验证和量化此分类算法的效果,采用准确率(Accuracy)、敏感性(Sensitivity)、特异性(Specificity)、阳性预测值(Positive Predictive Value,PPV)、阴性预测值(Negative Predictive Value, NPV)及F1分数(F1-score)对训练的模型进行评价,其定义如下所示。
设阳性代表微钙化区域,阴性表示非钙化区域。式中,TP(True Positive,真阳性)表示测试集中被正确分类的微钙化区域样本个数;FP(False Positive,假阳性)表示测试集中被错误分类的微钙化区域样本个数;TN(True Negative,真阴性)表示测试集中被正确分类的正常组织样本个数;FN(False Negative,假阴性)表示测试集中被错误预测的正常组织样本个数。
3.4 实验结果及分析
采用10折交叉验证来验证所使用的AB-DT模型的性能,将样本集中所有的样本数据随机分成10组,选择其中9组数据作为训练样本,训练出分类模型,最后1组样本数据作为测试数据,验证训练的模型的准确率。
将决策树的数量设置为462,测试结果显示模型分类准确率为91.75%,敏感性为91.75%,特异性为91.79%,阳性预测值为92.35%,阴性预测值为91.56%,F1分数为0.918 7。实验结果表明此模型具有较强的学习能力和泛化能力,并且具有较高的预测精度。
为进一步验证AB-DT算法的鲁棒性与有效性,将本文算法与其他文献中所提方法进行性能比较。Cai等[18]提出基于卷积神经网络的乳腺钙化区域分类算法,该算法在中山大学附属肿瘤医院和南方医科大学附属南海医院的数据库上取得88.59%的准确率,89.32%的精准率,86.89%的特异性和88.43%的敏感性;王科举[3]提出基于周围区域矩阵的微钙化区域检测算法,在MIAS数据集上得到88.84%的准确率,90.00%的敏感性和88.80%的特异性;蔡雅丽等[19]利用局部二值模式和灰度共生矩阵特征进行乳腺钙化检测,支持向量机、随机森林和Adaboost算法均可较好地区分正常样本和钙化样本,检测的准确率分别为90.0%、81.5%、87.5%,敏感性分别为83.60%、78.40%、79.30%,特异性分别为91.10%、86.00%、87.00%;Chakravarthy等[20]提出萤火虫算法进行微钙化区域的检测,在MIAS数据库中的实验准确率为86.75%,敏感性为90.08%,特异性为83.42%,阳性预测值为86.78%,阴性预测值为90.21%,F1分数为0.874 2。比较每种算法的准确率、敏感性和特异性,本文提出的AB-DT算法在微钙化区域检测上具有更好的准确率、敏感性、特异性。
4 结语
本研究针对微钙化点检查精度不高的问题,提出一种乳腺钼靶图像微钙化真假阳性检测的方法。首先提取ROI的Haralick纹理特征和灰度游程矩阵特征,然后结合Adaboost算法和决策树算法,构建强分类器ABDT对区域进行分类,将微钙化区域和正常组织分离开来,并通过10折交叉验证,验证了该分类方法的有效性,分类正确率高达91.75%。本研究提出的方法在辅助乳腺微钙化点检测中具有一定的临床应用价值。