乳腺癌MRI影像组学的研究进展
2021-03-25王中一毛宁谢海柱
王中一,毛宁,谢海柱*
作者单位:1.山东省滨州医学院医学影像学院,烟台264000;2.青岛大学附属烟台毓璜顶医院影像科,烟台264000
乳腺癌是全世界最常见的恶性肿瘤之一,也是导致女性死亡的第二大癌症[1]。在精准医疗时代,乳腺癌早期诊断、早期治疗是临床中的关键问题。这一过程中,医学成像技术是必不可少的。其中,MRI 因其较高的软组织分辨率,作为目前诊断乳腺癌常用的成像方式。利用动态对比增强MRI(dynamic contrast enhanced MRI,DCE-MRI)、扩散加权成像(diffusion-weighted imaging,DWI)等序列,获得更多、更准确的肿瘤信息。然而这些医学图像中含有我们肉眼观察不到的信息。在过去几年,学者指出这种信息可以通过纹理和形状等分析从影像中提取,伴随计算机技术的快速发展,影像组学应运而生。本文就乳腺癌MRI 影像组学方面的研究进展进行综述。
1 影像组学概述
“组学”是一种起源于分子生物学的术语,用来表征DNA、RNA、蛋白质和代谢物[2]。影像组学概念最初由一位美国学者于2010年提出[3],它的提出是基于一种假设,即所提取的影像特征是发生在组织基因型和表型特征相关的遗传和分子水平上的产物[4-5]。它从影像中高通量提取定量特征,创建高维数据集,然后进行数据挖掘,从而辅助临床决策,实现个体化精准治疗[6-7]。影像组学是一种分析框架,适用于各种目标部位和成像方式,一般包括以下几个步骤:图像采集与重建、病灶分割、特征提取和特征分析(特征筛选和模型建立)。传统影像组学特征包含形态学、直方图、纹理以及变换特征[2]。
2 影像组学在乳腺良恶性鉴别中的应用
DCE-MRI可以提供有关血管生成的功能性信息,可以将其作为肿瘤的特定特征[8]。Lo Gullo 等[9]针对96 例BRCA 突变患者的116 例BI-RADS 3 或者BI-RADS 4 类1 cm 以下 乳腺病变进行研究,从DCE-MRI 和T1 加权成像中提取了102 个影像组学特征,并结合临床因素来鉴别良恶性,建立的预测模型鉴别能力优于放射科医师,从而减少了良性小病灶不必要的活检。但研究为单中心,存在样本量小,数据偏移等局限性,并且由于病灶较小导致勾画ROI 过程中存在一定困难和误差。DWI 通过描述组织的扩散率,可以反映组织微环境和膜完整性[10],被认为是提高乳腺良恶性鉴别最有价值的序列[11],近期研究指出定量DCE 药代动力学参数和扩散峰度成像(diffusion kurtosis imaging,DKI)具有更好的诊断准确性[12-13]。Zhang 等[14]则利用多种MRI 序列包括T2 加权成像、DCE 参数(Ktrans,Kep,and Vp)、DKI、ADC 和T1 加权成像进行影像组学分析,采用支持向量机方法分别建立单序列和多序列联合模型来预测乳腺病灶良恶性,最终联合模型表现最好(AUC=0.921),其中T1 加权成像和ADC 影像特征的融合并未提高模型的效能。Truhn 等[15]通过对乳腺DCE-MRI 图像进行影像组学分析和深度学习来预测强化病灶的良恶性,结果显示深度学习模型表现要优于影像组学模型,但是均明显低于放射科医师的诊断能力,可能与样本量较小、纳入患者的高患癌风险和诊断医师的水平有关。作者还研究了模型在小病灶组和不同样本量组的表现,发现深度学习模型小病灶良恶性鉴别能力仍好于影像组学模型,但容易受到样本量的影响。本研究团队[16]则从DWI 中提取纹理特征,并研究这些特征在乳腺癌与纤维腺瘤之间的差异性,发现两者间方差、标准差、强度及分位数(5、10、25、50、75、90、95)等存在统计学差异,但本研究数据量较小,缺乏非肿块型、不同病理类型、分子分型的乳腺癌,研究结果缺乏验证集验证。目前乳腺良恶性方面文章开始聚焦于小病灶,DCE 药代动力学参数、MRI 多序列联合及深度学习的应用有助于提高模型效能。但研究多为单中心,受到了样本量的限制。
3 影像组学在乳腺癌受体类型、分子分型中的应用
不同分子分型在治疗方案、治疗效果及预后方面具有差异性[17],乳腺癌受体类型及分子亚型的确定对制定患者治疗策略至关重要。Xie 等[18]等从134 例乳腺癌患者的DCE、DWI图像中提取特征,建立不同的影像组学模型来鉴别分子亚型、三阴与非三阴型乳腺癌。在四分类任务中,线性判别分析模型准确率最高(72.4%)。支持向量机模型鉴别三阴、非三阴型乳腺癌的准确率最高(91.0%)。考虑到磁共振参数可能影响纹理特征,进而影响影像组学模型的稳定性,作者从不同时间点DCE 和不同b 值DWI 图像中提取影像组学特征。但本研究由于其回顾性本质,导致了样本量有限及样本类型分布不均衡的问题,模型可能没有得到充分训练。Zhang 等[19]将DCE-MRI 图像分别输入到两种深度学习网络进行分子分型和受体类型预测,并取得了较好的预测结果。然后,作者将深度学习模型作为一种预训练模型重新在不同的患者组之间进行训练和验证,来探究迁徙学习能否提高模型效能。结果表明迁徙学习后模型的准确率得到明显提高。大多文章可以实现受体类型、分子分型的多任务预测,利用不同时间点DCE 及不同b 值DWI 影像特征、深度学习或迁徙学习可以提高模型效能,但研究多为单中心研究,不均衡、小规模的样本量可能会影响到模型效能。
4 影像组学在评估淋巴结转移的应用
腋窝淋巴结转移是影响乳腺癌患者预后的重要因素,确定腋窝淋巴结状态是临床指导制定乳腺癌个性化治疗决策的关键。Liu 等[20]利用影像组学方法从肿瘤及肿瘤周围区域提取特征,结合临床因素建立模型来预测腋窝淋巴结转移,联合模型验证集AUC 达到了0.869。Shan 等[21]定义了三种动力学曲线模式来反映DCE-MRI 不同期之间像素信号变化,然后结合从淋巴结提取的影像组学特征建立淋巴结转移预测模型,验证组AUC达到了0.86,但是手动勾画目标淋巴结存在难度,虽然提取的特征组内相关系数大于0.75,但勾画误差仍对模型效能产生影响。本研究团队[22]则直接将DCE 动力学参数作为特征,融合DCE-MRI 影像组学特征建立联合模型,较好地预测了乳腺癌前哨淋巴结转移。瘤周特征、DCE动力学参数及其变化特征的利用有助于提高模型效能。并且由于最近临床试验的结论[23],非前哨淋巴结状态评估成为新的方向,超声领域目前已有相关文章[24]。
5 影像组学在乳腺癌治疗效果评价中的应用
新辅助化疗(neoadjuvant chemotherapy,NAC)是乳腺癌的主要治疗方式[25],大约10%~35%的患者对NAC 不敏感,5%的患者NAC 治疗后病情恶化[26]。利用影像组学方法评估NAC疗效有重要的临床意义。Liu 等[27]进行了一项多中心回顾性研究,以评估多参数MRI 在预测病理完全缓解方面的表现。研究共纳入了586 例患者,利用从T2 加权、T1 加权、DWI 和增强序列提取的13 950 个影像组学特征,计算了影像组学得分,并且在不同的分子亚型组对模型进行训练和内外部验证,同时建立临床模型和联合模型进行效能比较。结果表明在不同的分子分型亚组,包含多参数MRI 影像组学特征和临床特征的联合模型相较于临床模型表现更好,但该研究同样存在样本量有限、患者分布不均衡的问题。Sutton 等[28]纳入了NAC 前后均做过MRI 的乳腺癌患者,同时提取了NAC 前后的影像组学特征,并且将NAC 前后特征相减得到新的特征集,来反映治疗前后的特征变化,利用这些特征建立了影像组学模型预测病理完全缓解,最终展现了较好的预测能力。乳腺癌NAC后特征在疗效评估方面同样具有重要的意义,多中心研究保证了模型的泛化能力,是未来影像组学的发展方向,但由于NAC 作为乳腺癌重要治疗手段,效果较好,样本不均衡的问题较突出,可能影响模型训练效果。
6 影像组学在乳腺癌预后分析的应用
Nam 等[29]研究了乳腺癌MRI 影像组学特征和预测复发风险的多基因检测之间的潜在关联。这项研究回顾性纳入了127例ER阳性浸润性乳腺癌的患者,从DCE-MRI序列中自动提取了158 种影像组学特征。研究发现LASSO 建立的影像组学得分、Ki-67表达、p53与Oncotype DX计算的复发危险得分相关联,并且影像组学得分能够较好的区分高低风险组,然而乳腺癌复发情况需要经过长时间随访获得,文章中的复发风险分数并不能完全真实反映复发情况。乳腺基因序列同样包含了预后信息,结合乳腺癌基因数据的多尺度研究是影像组学新的发展方向。
7 影像组学的发展方向
7.1 多中心研究
目前乳腺影像组学研究中,单中心的回顾性研究占主体。然而,尽管单中心内部验证已经成为研究中重要的环节,但由于回顾性研究的本质、人群种族、地区等方面的差异,使单中心研究结果的稳定性值得怀疑,因此,多中心研究成为影像组学的未来趋势。
7.2 多尺度、多模态研究
医学图像并不是显示肿瘤信息的唯一方式,一些研究结果表明血液指标和生物标志物、病理及基因信息等同样包含肿瘤信息,对揭示肿瘤异质性有着重要的作用。Shao 等[30]从四家医院981 例患者多参数MRI 和病理全视野数字切片(whole slide image,WSI)中提取定量影像特征,建立了影像病理模型来预测直肠癌放化疗疗效,这项研究为影像组学的发展提供了新的方向,即“影像病理组学”,证明影像组学已经向多尺度的研究方向发展。另外,不同的成像方式可能包含不同的肿瘤信息,例如,本团队近期分别进行了各种模态的影像组学研究[31-33],证明不同模态影像组学特征均具有重要意义。融合来自多种成像方式的特征,将有助于提高影像组学模型的效能。
7.3 深度学习
影像组学研究在很大程度上依赖于机器学习,传统机器学习与深度学习最显著的区别是使用了手动特性,这意味着我们需要为不同的任务设计不同的特征,并且多为人工勾画ROI,总体过程费时费力,且容易受到人为因素干扰。深度学习网络可以从数据本身学习到具体的特征,不需要指定预定义的特征,这意味着人们可以用同样的深度学习方法来解决许多不同的任务,作为一种端到端的网络结构,深度学习网络整个学习过程无需人的参与,效率更高、结果更可靠。因此深度学习促进了目前影像组学的发展[34-35]。
8 总结
目前乳腺癌MRI 影像组学领域迅速发展,主要应用于良恶性鉴别、受体和分子分型分类、淋巴结转移、疗效评估及预后方面的研究。然而,目前影像组学多为单中心、单模态研究,数据量通常较小,且传统机器学习方法,干扰因素较多,效率较低,未来影像组学正向多中心、多尺度、多模态及深度学习方向发展。
作者利益冲突声明:全体作者均声明无利益冲突。