基于MR图像的深度学习预测乳腺癌脉管浸润状态*
2024-03-23张慈慈程相宜熊玉超欧志强钟敏之
张慈慈 程相宜 熊玉超 欧志强 钟敏之 步 军,*
1.暨南大学附属广州市红十会医院放射科 (广东 广州 510220)
2.暨南大学附属第一医院影像中心 (广东 广州 510632)
脉管浸润(lymphovascular invasion,LVI)是指在显微镜视野下发现肿瘤组织区域的小淋巴管、血管的管壁被肿瘤细胞侵袭、破坏或淋巴管、血管管腔内有癌栓形成,是肿瘤进展和远处转移的重要步骤之一[1]。术前预测乳腺癌LVI状态,有利于帮助临床制定治疗决策如保乳手术、淋巴结活检术,避免手术扩大乳房切除、过度清扫淋巴结带来的创伤及并发症,且对放化疗方案的选择及患者预后有重要的指导作用[2-4],有助于推动乳腺癌患者个体化精准医疗的发展。临床上,手术病理学检查是诊断LVI的“金标准”,它能提供最完整,最准确的信息,但无法做到术前预测,进而导致临床过度治疗或治疗不足。传统医学影像不能直接诊断LVI。因此,寻找新方法预测乳腺癌LVI刻不容缓。近年来,深度学习在医学影像中广泛应用,通过高通量分析、提取医学图像的许多定量特征的信息,对疾病诊断、预测及预后的判断方面具有明显优势,已有应用于乳腺癌的相关报道[5]。
1 资料与方法
1.1 研究对象本研究回顾性收集2010年1月至2021年12在广州市红十字会医院治疗的乳腺癌患者。这项研究得到了本院伦理审查委员会的批准。
纳入标准如下:手术病理诊断的乳腺癌和LVI;女性患者,单侧;MR检查检查前未进行放疗、内分泌治疗、化疗或穿刺活检,MRI检查和手术之间的时间间隔<两个周,没有隆胸手术。排除标准为:活检病理诊断的乳腺癌和LVI;男性患者双侧乳腺癌、复发或转移性乳腺癌,腋窝处副乳腺癌;具有运动伪影、化学位移伪影和脂肪抑制不良的图像。
1.2 资料收集收集病理相关信息:肿瘤的病理类型、脉管浸润状态。MRI资料收集:从我院PACS系统中回顾性收集的符合纳入条件的乳腺癌MRI图像,将轴位FS-T2WI图像和动态增强图像(dynamic contrast-enhanced,DCE)第2期导出为Dicom格式用于分析处理。在本研宄中,选择第2期图像序列进行分割和分析的原因一般乳腺癌表现为早期快速强化,且此时背景腺体组织尚未强化,对肿块影响小。本研究中的图像均来源于同一1.5T MRI(Siemens Healthcare,Germany)设备。
1.3 图像的勾画和处理所有图像的感兴趣容积(volume of interest,VOI)勾画均使用ITK-SANP软件(http://www.itksnap.org)。我们在原始图像上对病灶进行人工勾画逐层分隔,勾画方式如图1所示,VOI包含整个病变,由另一名放射科医师对每个VOI进行复核,确保每个VOI准确勾勒病灶边界,最后保存nii格式。两位医师均对患者的临床信息不知情。
图1 动态增强图像上感兴趣区的勾画。
图2 VanillaCNN网络结构;图3 ResNet10-2D网络结构;图4 3D-ResNet10网络结构
1.4 深度学习方法实验系统及参数:本文使用硬件环境为NVIDIA Tesla V100 32G,操作系统为Centos 7.9,软件环境为Python 3.8、Pytorch 1.8。本文采用2D和3D网络的分类模型去建模和验证。457份,数据按照9:1的比例切分为训练和测试数据集,模型总共训练100个迭代,使用Adam优化器,学习率为1e-3,学习率使用等间隔衰减策略,衰减率系数为0.9,衰减间隔为总批处理数为0.1,2D网络的批量大小为64,3D网络的批量大小为8。
(1)基于2D网络的模型,训练两种模型:①是简单的使用卷积和池化层堆叠而成的卷积神经网络,简称为VanillaCNN。②是ResNet10。
①VanillaCNN:使用5次卷积-池化的组合提取输入特征,每次卷积-池化后特征图的数量翻倍、尺寸减半。每个卷积核大小为3,步长为1,填充大小为1,池化方式选择最大池化。5次卷积-池化后对特征图进行扁平化,从二维转化为一维,后续通过一个全连接层把维度转换为512。第一个全连接层后添加随机失活层,减少过拟合现象,最后使用第二个全连接层,得到最终输出。
②ResNet10:ResNet由多个残差块构建而成,通过恒等映射和残差映射(缓解梯度消失/爆炸的现象)解决了由于网络深度加深导致的退化问题,使得网络性能不会随着深度增加而降低。
(2)基于3D网络的分类模型 本文以2D ResNet10网络为基础,把最后的全局平局池化层替换成2个卷积-池化层,提取更加丰富的信息。3D ResNet10网络架构与2D ResNet10类似,只是把其中的所有二维卷积替换为三维卷积,卷积核参数设置与2D ResNet10一致。
2 结 果
2.1 患者的一般资料共纳入457例乳腺癌患者,年龄范围26-91岁,平均年龄57.94±12.63。其中LVI阴性患者共304例,占比约66.52%,平均年龄57.2±12.62;LVI阳性患者153例,占比约33.48%;平均年龄59.41±12.56。
2.2 不同深度学习模型预测乳腺癌脉管浸润的效能深度学习预测能有效乳腺癌LVI状态,不同序列、算法模型进行训练数据集预测效能不同。相同算法模型下,DCE序列预测效能均高于FS-T2W序列(表1)。
表1 深度学习预测乳腺癌脉管浸润的效能
3 讨 论
本研究通过对MR图像进行深度学习训练以建构多种算法模型来预测乳腺癌LVI状态,有助于推动乳腺癌ΒC患者个体化精准医疗的发展。
在本研究中,我们利用FS-T2WI和DCE两个序列数据集去预测LVI状态,结果显示DCE的预测性能优于FS-T2WI。这表明,与FS-T2WI相比,DCE序列能提供更多的肿瘤微观信息,表明肿瘤内的异质性。FS-T2WI可以清晰显示病变的大小和形状,对病变内的囊性变化和坏死敏感,但图像分辨率相对有限,提供的信息有限。而DCE序列可以提供形态及血流动力学信息,在乳腺MRI中至关重要。基于DCE的深度学习技术已用于鉴别良恶性肿瘤,分子亚型分类,评估Ki-67状态,评估复发风险,预测治疗反应和预测乳腺癌前哨淋巴结转移,具有较好的效能[5-6]。本研究结果同样也表明,不同的MRI序列可能包含肿瘤内不同特征的鉴别信息,选择合适的MRI序列有助于更好实现特定评估任务。
在本研究中,我们旨在开发和验证基于2D VanillaCNN和ResNet10、3D ResNet10算法技术来训练模型能够自动地辅助诊断出乳腺癌LVI状态,结果显示,不同算法的预测(AUC为0.69–0.80)。可能原因有以下两个:(1)本研究仅建立了基于单个MR序列的预测模型,单个序列仅反应肿瘤一部分特征。目前多模态图像是新的应用趋势,即结合多MRI建立模型,不同的序列可以反映肿瘤的不同特征,如肿瘤信号强度、组织细胞和微血管密度,因此,多序列结合可以充分结合利用每个序列的优势,更全面的反映肿瘤信息,提供更准确的图像评估。Nijiati等人结合了多个序列T2WI、DCE、DWI、ADC的MRI特征预测浸润性乳腺癌LVI状态,结果表明,融合DCE+T2WI+ADC图像特征的AUC值最高,达到0.93,优于单独使用及其他组合[7]。另一个类似的研究中,对DCE、ADC及组合DCE+ADC图像获得的数据进行了多参数评估,结果发现,T2WI+DCE+ADC融合放射组学模型对LVI状态的预测效果优于单独使用。(2)没有纳入其他相关的评价因素,在浸润性中LVI状态受多种因素如临床特征、病理特征及肿瘤生物行为学相关的影响[9]。Shen SD[10]等人采用相关临床病理因素建立LVI的预测模型,Her-2、Ki-67肿瘤大小和3个因素组合的预测LVI的AUC值分别为0.614、0.596、0.575和0.670,表明单个因素预测效能一般。因此,一些学者将临床病理特征、形态学特征和组学标签结合起来的影像组学模型来预测乳腺癌LVI状态。朱浩雨等人研究了140例乳腺癌,综合纳入了多参数变量如患者的临床资料、病理结果、形态学征象和影像组学标签去构建影像组学模型及联合序列影像组学标签两种模型预测浸润性乳腺癌LVI状态,结果显示,影像组学模型的预测诊断效能高于联合多序列的影像组学标签的诊断效能(0.91 vs 0.83)[11],同样的Ouyang等[12]的研究结果也表明,通过加入病例临床特征后,放射组学模型预测血管浸润的诊断效能明显提高。Wang D等人基于数字化X线摄影图像提取的放射学特征预测乳腺癌LVI的AUC、敏感性和特异性分别为0.716、72.0%和82.4%,而结合重要的临床危险因素、放射特征和Rad评分建立联合放射组学nomogram图取得了更好的预测性能,其AUC、敏感性和特异性达到0.835、80.0%和76.5%[13]。Liu等人使用基于DCE-MRI的放射组学特征与MR报告的ALN状态相结合以预测浸润性乳腺癌的LVI状态、在训练和测试数据集中分别实现了0.851和0.763的AUC,比单独使用MRI中腋窝淋巴结状态、放射组学特征的准确性明显提高[14]。这几项研究临床病理特征与影像组学结合预测乳腺癌患者的LVI效能明显提升,因此,我们后续的研究将加入临床病理特征并联合多个序列基于MRI图像的进行预测研究,提高模型的预测效能。
总之,深度学习能有效预测乳腺癌LVI状态,不同网络算法模型的预测性能。且DCE序列在预测乳腺癌LVI的效能优于FS-T2WI序列,表明DCE序列能提供更多的肿瘤微观信息。