基于影像组学对数字化乳腺断层摄影中肿块病变的鉴别诊断研究
2022-01-11郑惠中姜婷婷简嘉豪厉力华顾雅佳彭卫军
尤 超,郑惠中,姜婷婷,简嘉豪,范 明,厉力华,吴 炅,顾雅佳,彭卫军
1.复旦大学附属肿瘤医院放射诊断科,复旦大学上海医学院肿瘤学系,上海 200032;
2.杭州电子科技大学生物医学工程与仪器研究所,浙江 杭州 310018;
3.复旦大学附属肿瘤医院乳腺外科,复旦大学上海医学院肿瘤学系,上海 200032
乳腺癌是女性最常见的恶性肿瘤,发病率逐年上升[1]。数字乳腺体层合成(digital breast tomosynthesis,DBT)技术可减少病变和正常腺体组织的重叠,提高病灶检出率和诊断准确度,目前已逐步推广应用于乳腺癌的筛查及诊断体系[2-3]。
近年来,越来越多学者对DBT的诊断价值展开研究并取得一定进展,但研究大多数基于传统形态学特征[4]。随着影像组学和人工智能在医学影像领域的广泛应用,基于全数字化乳腺X线摄影(full-field digital mammography,FFDM)建立的乳腺癌诊断模型,相比于传统模型表现出更高的预测准确度[2,5-6]。DBT多角度摄片成像,能为乳腺癌诊断模型提供更多的影像学特征,因而进一步探索DBT的临床应用价值亦成为研究的关注点[7-8]。本研究以乳腺肿块病变为研究主体,旨在探索DBT的影像组学在肿块病变鉴别诊断中的价值,为其提供更多的特征,使其在乳腺癌鉴别诊断中发挥更大作用。
1 资料和方法
1.1 临床资料
回顾并分析2019年4月—2020年8月复旦大学附属肿瘤医院符合以下标准的患者。纳入标准:①经临床检查乳腺发现可疑病灶;② 行DBT检查证实为肿块病变;③经手术后病理学检查证实。排除标准:①有单侧或双侧乳房植入物;② 有单侧或双侧乳房切除术病史或有乳腺切开手术史;③DBT检查前行穿刺活检后确诊为乳腺癌。
143例患者符合上述标准纳入本研究,其中1例患者为双侧乳房各1个良性病灶,选用双侧乳房图像分析,其余均为单侧单发病变,选用单侧乳房图像分析。最终本研究数据集共计144个病灶,其中良性65个,恶性79个。
1.2 数字化乳腺X线断层摄影
1.2.1 图像采集
采用美国Dimensions公司的乳腺断层X线摄影系统。所有受检者均行头尾(cranio-caudal,CC)位和内外斜(medio-lateral oblique,MLO)位双体位投照。患者在每个体位的同一压迫条件下由设备自动同时完成FFDM和DBT扫描。DBT成像中,X线管在乳腺周围以15°扫描角度进行一系列低剂量曝光,以生成乳腺组织3D容积重组图像。重组DBT图像数据集包括厚层(1 cm)、薄层(1 mm间距切面)的图像。
1.2.2 病灶标注
使用开源软件VGG Image Annotator(VIA)图像标注工具(Visual Geometry Group),由1名从事乳腺影像诊断的放射科医师(工作年限为10年)独立阅片对肿块的轮廓进行勾画,标记如图1所示,包括起始层面,表示肿块的顶部(图1A);中间层面,即肿块最大径所在层面图像(图1B),终止层面,表示肿块的底部(图1C)。肿块的具体位置坐标将由程序通过计算轮廓的外接矩取得,从而获得肿块的标注信息。
图1 肿块轮廓勾画Fig.1 Mass delineation
1.2.3 构建病灶三维掩膜(mask)矩阵
首先创建与原影像相同宽度、高度的全零矩阵,将原影像数据按顺序叠加,构建三维原始影像数据矩阵。其次,从标注文件中提取病灶轮廓的坐标点数据,根据坐标数据,在三维原始影像矩阵中将轮廓内坐标数据置一,得到原影像的掩膜文件。最后,将掩膜信息同样按顺序叠加,根据标注文件病灶数据,构建病灶的三维掩膜数据矩阵,用于后续特征提取。
1.3 基于DBT影像组学模型的建立
影像组学分析主要包括3个部分,提取影像组学特征、构建算法模型及模型检验。
将预处理后的原始影像按顺序排列组合成三维矩阵,使用pyradiomics包在CC位、MLO位提取病灶影像特征,单个体位获得特征109个,包括病灶的形态学特征、统计特征以及纹理特征。其中形态学特征18个,统计特征16个,纹理特征75个。本研究融合不同体位提取的特征作为特征集合,进行良恶性鉴别的研究。按照8∶2的比例划分数据集为训练集与测试集。训练集通过特征递归消除(recursive feature elimination,RFE)的特征选择方法,筛选获得特征数目从20~40的不同的特征集合。采用五折交叉验证的方式进行参数调整,采用逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)以及梯度提升决策树(gradient boosting decision tree,GBDT)3种算法建立良恶性诊断模型,比较并分析几种算法模型在测试集上的效果。
1.4 病理学检查
由1名病理科从事乳腺疾病诊断的主任医师对所有病理切片进行诊断,病理学诊断参照第5版世界卫生组织(World Health Organization,WHO)乳腺肿瘤病理分类诊断标准[9]。
1.5 统计学处理
采用SPSS 22.0及R 3.6.1进行统计学分析。采用χ2检验比较训练集与测试集临床及病理学特征的差异。采用预测模型的受试者工作特征(receiver operating characteristic,ROC)曲线的曲线下面积(area under curve,AUC)及准确度作为主要的预测模型效能评价方法。P<0.05为差异有统计学意义。
2 结果
2.1 临床病理学结果
经病理学检查证实的144例病灶中,良性病灶65个(纤维腺瘤26个、分叶状肿瘤5个、乳腺病16个、硬化性腺病3个、导管内乳头状瘤12个、炎性病变3个);恶性病灶79个(浸润性导管癌54个、浸润性导管癌伴导管原位癌成分11个、纯导管原位癌8个、浸润性小叶癌2个、乳头状癌4个)。按8∶2比例划分为训练集112例与测试集32例(表1)。
表1 研究人群临床病理学基本资料Tab.1 clinical data of study population
其中所选取肿块数据集中,病例年龄分布在36~71岁之间。最大直径为113 mm,平均最大直径为30.77 mm,经年龄段分层、腺体密度、肿瘤最大径χ2检验,计算得到P>0.05,表明随机划分的训练集与测试集数据分布差异无统计学意义。
2.2 影像组学特征的筛选
在肿块良恶性分类上,使用特征递归消除得到不同特征数目的特征子集,在训练集上得到对应的平均AUC值见表2。基于不同数目特征的分类器算法,LR、SVM和GBDT的最佳特征数目分别为20、24和32(图2),相应的最佳特征子集分布见表3。
表3 不同分类器最佳子集特征数目分布Tab.3 Distribution of optimal subset numbers in different classifiers
图2 特征筛选依据图Fig.2 Feature selection basis diagram
表2 不同特征数量在训练集上准确率及AUC值Tab.2 Accuracy and AUC values of different feature numbers
2.3 构建模型
结合网格搜索与交叉验证方法,得到LR、SVM与GBDT这3种分类器模型最佳参数。在相同的训练集上利用对应的超参数重新训练机器学习模型,并在测试集上对各个分类器进行测试,计算评价指标见表4。绘制其对应的ROC曲线。在3种分类器模型中,GBDT模型表现最佳,其准确度为0.81,AUC为0.91(图3)。图4、5为2例影像科医师诊断错误,影像组学模型诊断正确的病例。
表4 不同分类器测试集评价指标Tab.4 Test and evaluation indexes of different classifiers
图3 三种分类器在测试集的ROC曲线Fig.3 ROC curves of the three classifiers in the test set
图4 女性57岁,左乳浸润性导管癌Fig.4 A 57-year-old female patient with left breast IDC
图5 女性37岁,左乳腺病Fig.5 A 37-year old female patient with left breast adenosis
3 讨 论
DBT通过X线球管从不同角度对压迫乳腺组织进行多次低剂量快速曝光,重建获取与探测器平面平行的乳腺三维影像。这一技术突破了传统乳腺X线摄影的二维图像重叠的局限,提高了致密性乳腺中病灶的检出,尤其是表现为肿块或结构扭曲征象的病灶。影像组学通过高通量地提取病灶的定量信息,实现病灶分割、特征提取与模型建立,凭借对海量影像数据信息的挖掘、预测和分析,是对肿瘤内部特征进行深层次的剖析。目前,影像组学在乳腺磁共振成像(magnetic resonance imaging,MRI)、超声的研究中已有较多报道,针对乳腺X线的影像组学报道相对较少[3-4,10-12]。
本研究基于影像组学针对DBT的三维图像对乳腺肿块病变的辅助诊断展开。在乳腺X线摄影的影像组学对乳腺癌的辅助诊断方面,早期学者[13]大多使用机器学习方法,针对二维影像进行诊断。由于DBT影像数量较大,且在各个断层上所呈现的病灶形状、大小存在一定差异。针对同一病灶,使用二维影像可能会在不同层面上得到不同的诊断信息。再者,DBT影像的特点是其从不同角度对乳房进行拍摄,所获影像除了包含断层内的信息,还具备断层间信息,对于肿块诊断具有一定价值。因此,理想的肿块分析方法应包括每一层存在的肿块区域,对肿块整体进行组学特征的提取及分析。Fan等[14]基于DBT影像病灶三维纹理特征,研究良恶性诊断,相比二维诊断AUC更高,因此研究DBT影像的三维特征有一定意义。Samala等[15]使用深度卷积神经网络(deep convolutional neural network,DCNN)结合迁移学习策略,DBT肿块诊断结果的AUC值达到0.81。然而,其研究仍然是针对DBT中的二维影像进行,未探究DBT三维影像信息在诊断方面的价值。Li等[16]比较三维DBT影像与二维FFDM影像在DCNN对乳腺肿块的良恶性分类效能,发现具有迁移学习DCNN在鉴别恶性、良性和正常组织上更优,且DBT上训练的DCNN精度优于FFDM。本研究在方法上,利用图像标准化构建三维原始影像数据矩阵,再通过标准轮廓坐标得到原图像的掩膜文件,最终利用掩膜信息叠加获取病灶的三维掩膜数据矩阵。这种针对三维医学影像数据获取层间和层内信息,构建三维掩膜矩阵的方式,整合更多特征信息可能会对更加准确的检测提供帮助[17]。
本研究采用LR、SVM与GBDT 3种分类器研究基于影像组学对DBT三维肿块良恶性鉴别的诊断价值,发现在3种分类器模型中,GBDT模型表现最佳,在测试集中准确度为0.81,AUC值达到0.91。由于DBT三维肿块提取影像组学特征较多,属于线性模型的逻辑回归方法不容易处理。GBDT算法与SVM与LR算法相比较,具有以下三点优势[18]。第一,GBDT算法使用串行化的策略,继续学习上一个学习器拟合的残差,对数据的拟合能力大大增强,偏差减小,准确性提高。第二,GBDT能够较灵活地处理连续数据与离散数据,能从中筛选出为合适的特征子集。第三,在相对少的调参时间情况下,使用一些健壮的损失函数,对异常值的鲁棒性也很好。因此,与SVM及LR相比,GBDT能达到更好的准确度与AUC,模型更加稳定。
本研究存在若干方面的局限性,亟待后续研究的深入和改进。首先,本研究中共纳入乳腺肿块数据144个,数据量偏少,模型泛化能力较弱。今后将通过样本量扩充、纳入不同机型样本,以提高模型的泛化能力。同时在算法选择中纳入一些其他临床及病理学特性,以便判断结合ROC曲线能否更全面地反映模型效能。其次,本研究针对DBT影像肿块的良恶性诊断开展,可提供给医师的诊断信息仍显不足。后续在此基础上,拟基于DBT对分子亚型预测等临床问题进行探索。第三,在后续研究中,将考虑补充DBT数据中影像医师的诊断评估结果,并且进一步纳入人工智能的深度学习方法,将影像医师诊断、影像组学诊断、人工智能诊断三者进行比较。此外,本研究采用了提取DBT影像组学特征的研究方法,而基于DBT深度学习算法可以更好地消除诸如感兴趣区勾画等人为因素干扰,未来应通过深度学习路径进一步开展DBT的诊断价值研究。
综上所述,基于影像组学的DBT图像特征对乳腺肿块病变的鉴别诊断具有较好的临床价值。其中GBDT模型由于其集成学习的优势,表现效果最佳。