影像组学在乳腺癌分子分型中的应用现状及研究进展
2020-03-03马梦伟秦耿耿陈卫国
马梦伟 秦耿耿 陈卫国
近年来乳腺癌发病率呈快速上升趋势,已成为全球女性疾病死亡的第二大原因[1]。目前对乳腺癌的研究已深入到分子水平,准确判定乳腺癌分子分型对选择治疗方案及预测预后具有重要意义。因此,如何在术前无创地判断乳腺癌分子分型成为目前研究的热点。数字乳腺X线摄影、乳腺超声、MRI等影像方法不仅在乳腺癌的检测、治疗及预后预测中发挥着重要作用,还能够提供丰富的不可视信息。影像组学通过无创性采集图像,整合疾病特征与不可视信息,并进一步探究两者之间联系[2],现已应用在乳腺癌诊断与鉴别诊断、生物学行为评价、恶性度评价及预后预测等方面。本文就影像组学在乳腺癌分子分型中的研究进展进行综述。
1 乳腺癌分子分型的概述
乳腺癌分子分型的概念最早由Perou等[3]提出,雌激素受体 (estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、人表皮生长因子受体 2(human epidermal growth factor receptor 2,HER2)和增殖细胞核抗原(Ki-67)是乳腺癌分子生物学的主要决定因素[4]。根据2013年St.Gallen国际乳腺癌会议指南[5-6],将乳腺癌分子分型分为以下5类:Luminal A 型、Luminal B 型(HER2 阳性)、Luminal B型(HER2阴性)、HER2型及三阴型。不同分子分型的乳腺癌治疗方式及预后截然不同。目前乳腺癌分子分型主要依靠活检样本的免疫组织化学检测来确定,但该方法存在诸多缺陷,不仅有创而且由于乳腺肿瘤存在异质性,单个区域的样本检测结果并不能代表整个乳腺病灶,因此最终的分子分型结果存在不确定性。
2 影像组学概述
影像组学的概念最早由美国研究者Gillies[7]提出,并由荷兰研究者Lambin[8]进一步总结,即从医学影像中提取高通量成像特征并创建高维数据集。影像组学主要包括6部分:高质量图像的采集和重建、病灶区域的勾画、病灶的分割及重组、病灶影像特征的提取和量化以及预测模型的建立,其不仅克服了传统影像诊断因医师阅片经验所造成的主观限制,更可直观地观察病变的总体特征及其邻近周围组织的情况,提供丰富的不可视信息。随着精准医学概念[9]的提出,影像组学在临床医学中的应用也愈加受到重视,乳腺癌作为影像组学研究的热点,目前已进行了较多的科学试验及临床研究[10-12],其中在乳腺癌分子分型中的研究已取得突破性进展。不同分子分型的乳腺癌影像学及临床表现复杂多样,极易与良性病变混淆,相较于传统的免疫组织化学检测,影像组学可无创地通过所提取的特征间接反映其在细胞和分子水平上的变化,对鉴别乳腺癌分子分型具有独特的优势,亦可为术前乳腺癌分子分型的预测提供新的解决思路和方案。
3 影像组学在乳腺癌分子分型中的应用
3.1 数字X线摄影 数字乳腺X线摄影是乳腺癌最常用的检查方法,具有分辨力高、操作简便等优点。Zhang等[13]回顾性分析120例浸润性乳腺癌病人术前X线摄影图像发现所提取的12个影像组学特征中的4个特征(圆度、凹度、灰度值及偏度)在区分三阴型与非三阴型乳腺癌中差异有统计学意义。Zhou等[14]同样通过乳腺X线摄影提取出186个影像组学特征,并利用所提取的特征分别建立以支持向量机(support vector machine,SVM)和logistic回归为分类器的乳腺癌HER2状态的预测模型,结果表明联合头尾位和内外侧斜位影像组学特征所建立的logistic回归模型预测性能最佳,其敏感度、特异度、准确度和受试者操作特征曲线下面积(AUC)分别为73.91%、68.75%、77.00%和0.787,表明影像组学特征可作为乳腺癌病人术前评估HER2状态的有效工具;研究还发现联合2个摄影体位的影像组学特征所建立的模型比单一体位影像组学特征所建立的模型预测乳腺癌分子分型的性能要高。Ma等[15]就331例浸润性乳腺癌病人的X线摄影图像进一步探讨其他乳腺癌分子分型与影像组学特征之间的相关性,并以朴素贝叶斯为分类器建立乳腺癌分子分型的预测模型,其三阴型与非三阴型、Luminal型与非 Luminal型的 AUC分别为 0.796、0.752,且该研究还发现其中的4个影像组学特征(凹度、灰度值、相关性及圆度)在乳腺癌分子分型的鉴别中有统计学意义。总之,上述研究均是通过提取乳腺X线摄影图像的纹理特征来鉴别乳腺癌分子分型,但不足之处在于传统的乳腺X线摄影获取的是二维图像,腺体组织重叠过多,病变细微结构易被掩盖,其预测性能仍有待进一步研究。
数字乳腺断层摄影(digital breast tomosynthesis,DBT)是在传统的二维数字乳腺X线摄影基础上发展形成,通过不同的投照角度成像,减少腺体组织的重叠,从而更清楚地显示病灶[16]。Tagliafico等[17]从20例乳腺癌病人和20例正常女性乳腺 (年龄及乳腺密度都与乳腺癌病人的相似)的DBT中共提取104个影像组学特征,结果显示其特征熵与ER状态密切相关。Ki-67作为一种与细胞增殖密切相关的核蛋白,目前已成为乳腺癌病人临床常规检查的分子生物学指标。2011年St.Gallen会议指南认为Ki-67可用于区分Luminal A和Luminal B型乳腺癌[18-20]。Tagliafico等[21]在70例浸润性乳腺癌病人的DBT影像中提取出106个影像组学特征,探讨所选取的特征与Ki-67之间的关系,结果发现有34个特征与 Ki-67 明显相关(P<0.001),其中球度、自相关、四分位间距等5个特征的相关系数>0.5,且预测Ki-67 的 AUC 分 别 为 0.613、0.625、0.633、0.641、0.676,因此该研究也进一步表明DBT影像组学特征在一定程度上与Ki-67有关。DBT虽在一定程度上克服了传统数字乳腺X线摄影的局限性,但却无法提供肿瘤血供情况,只能反映病灶形态学的改变,故存在诸多限制。
对比增强乳腺X线摄影 (contrast-enhanced mammograpy,CEM)利用碘剂的K缘效应,通过静脉注射对比剂后对乳腺组织同时进行高、低能量曝光,使在低能图像上未能显示的病变得到充分显示。该技术不仅消除了腺体组织重叠所造成的干扰,还可间接地显示病灶血供状态,从而更准确地评估病变性质。已有部分研究[22-23]表明CEM对于乳腺癌诊断的敏感度明显优于全数字化乳腺X线摄影,尤其对于致密型乳腺病变,减影图像有独特的诊断优势。Marino等[24]采用MaZda软件在CEM中提取出300个影像组学特征,结果发现所提取的部分影像组学特征鉴别激素受体 (hormone receptor,HR)状态、HER2阳性/HR阴性与HER2阴性/HR阳性的准确度分别为78.4%、97.2%,研究还发现部分CEM影像组学特征与乳腺癌分子分型密切相关。但由于CEM辐射剂量大且病人易出现碘对比剂过敏的风险,未能在临床上广泛应用[25]。目前基于CEM的影像组学在鉴别乳腺癌分子分型的研究报道较少,尚处于初步研究阶段,还需要更多、更大规模的研究进行验证。
3.2 乳腺超声 乳腺超声与数字乳腺X线摄影是乳腺癌筛查和诊断的首选组合方法,具有无创、可短期内多次重复检查等优点,对软组织的分辨能力较好,尤其对囊性病变有明显的诊断优势。Moon等[26]采用SVM和交叉验证分析提取了85例三阴型乳腺癌和84例良性纤维腺瘤病人的超声影像组学特征,结果显示所提取的形态特征和纹理特征鉴别三阴型乳腺癌和良性纤维腺瘤的AUC分别0.847 0、0.854 2。鉴于不同的超声设备可能会对所提取的超声影像组学特征产生影响,Lee等[27]收集3种不同超声设备(IU、E9、HDI5000)采集的 715 例纤维腺瘤和186例三阴型乳腺癌影像,并从中提取730个影像组学特征,利用logistic回归和最小绝对收敛和选择算子(least absolute shrinkage and selection operator,LASSO)建立三阴型乳腺癌与良性纤维腺瘤的影像组预测模型,结果显示在训练组中3种不同超声设备的 AUC 分别为 0.893、0.912、0.922,测试组中AUC分别为0834、0.868、0.864。为了避免因超声设备不同所造成的影响,该研究者又随机地在同一超声设备中对所提取的组学特征进行重复性分析,其训练组的AUC为0.910,测试组的AUC为0.838,研究表明无论采用何种超声设备,所提取的超声影像组学特征对三阴型乳腺癌与良性纤维腺瘤的鉴别诊断均有较高的准确性。Guo等[28]研究共提取乳腺癌463个超声影像组学特征,并根据超声乳腺影像报告和数据系统 (breast imaging reporting and data system,BI-RADS)将其转换为形状、边缘、边界、回声模式、病灶后方回声和钙化6个影像征象,其中回声模式对乳腺癌分子分型的预测效果最好,其AUC可达0.738,该研究也间接指出低级别HR+、HER-的浸润性乳腺癌比高级别的 HR+、HER-浸润性乳腺癌形状更不规则,边界更不清晰,内部回声更高或更复杂。研究表明超声影像组学特征可以预测乳腺癌分子分型。
超声弹性成像通过测量病灶组织的硬度,可提供比传统二维超声更为丰富的信息,对一些硬度较大但二维超声难以显示的病灶具有更优越的诊断性能。Youk等[29]从296例病人的乳腺灰阶超声和弹性超声图像中共提取730个影像组学特征,特征降维后则保留了22个灰度特征和6个弹性超声影像组学特征,应用logistic回归分析2种方法预测乳腺良恶性病变的性能,结果表明灰阶超声的AUC为0.929,剪切波弹性成像的AUC为0.992。但由于超声弹性成像需要操作者施加适当的压力,对于操作者的熟练度及经验有较高的要求,因此目前关于超声弹性成像的组学研究较少,尤其对乳腺癌分子分型的预测研究甚少。
3.3 MRI 近年MRI在临床应用中发展迅速,特别是功能MRI以高软组织分辨力、多方位成像、无电离辐射等优点更是备受青睐。Leithner等[30]利用MaZda方法从143例乳腺癌病人动态增强MRI(DCE-MRI)中提取352个影像组学特征,采用线性判别分析及K折交叉验证预测乳腺癌分子分型,结果显示其训练集的预测准确度均高于80%,如预测Luminal B与 Luminal A型、Luminal B与三阴型、Luminal B与其他类型、HER2型与其他类型的准确度分别为84.2%、83.9%、89%、81.3%。在独立测试集中预测Luminal A与Luminal B型、Luminal B与三阴型乳腺癌的准确度也较高,分别为79.4%和77.1%。该研究表明所提取的DCE-MRI影像组学特征对乳腺癌激素受体状态和分子分型的评估具有较高的诊断准确性,可提供肿瘤整体的预后指标。Mazurowski等[31]从48例浸润性乳腺癌病人的DCEMRI中共提取出23个影像组学特征,通过构建logistic回归模型评估所提取的影像组学特征与乳腺癌分子分型之间的关系,结果显示仅Luminal B型乳腺癌与部分影像组学特征(纹理特征、形态特征及动态特征)之间存在关联,且该分型的乳腺癌病灶强化率与背景实质强化率比值高于其他乳腺癌分子分型。Wang等[32]从84例乳腺癌病人的DCE-MRI中提取出85个特征,特征降维后建立SVM模型诊断三阴型乳腺癌,结果显示,基于肿瘤自身的影像组学特征鉴别三阴型乳腺癌的AUC为0.782;当纳入背景实质强化特征时,其AUC可增加至0.878,因此该研究也进一步指出增加背景实质强化的异质性可提高鉴别诊断三阴型乳腺癌的效能,且该特征与三阴型乳腺癌有很强的相关性。Fan等[33]回顾性研究联合DCE-MRI影像组学及临床信息特征预测乳腺癌分子分型的可行性,在60例浸润性乳腺癌病人的DCE-MRI数据集中提取88个影像组学特征,并加入年龄及绝经状况2个临床特征,构建logistic回归模型,研究结果显示该模型在独立组中预测准确度为0.872,还发现与肿瘤异质性相关的特征在预后较好的分型 (如Luminal A型)中强化值较低,在HER2型乳腺癌中的强化值较高,这可能是由于该分型乳腺癌提高了血管生成增长率。也有研究者[34]发现特征熵值与乳腺癌分子分型密切相关。DWI作为诊断乳腺病变的辅助序列,可无创性检测活体组织中水分子扩散运动,其参数ADC值可在细胞水平评价组织的病理和功能变化。Zhang等[35]基于DWI从128例乳腺癌病人的兴趣区(ROI)中提取了1 029个影像组学特征,利用LASSO算法筛选出11个特征建立logistic回归模型,预测病灶的Ki-67水平,模型中训练集的AUC为0.75,测试集的AUC为0.72,结果表明基于ADC的影像组学特征可以预测病人的Ki-67。尽管目前关于乳腺癌分子分型的MRI影像组学研究还存在诸多缺陷,但是基于乳腺癌分子分型的MRI影像组学特征能够为早期检测乳腺癌分子分型提供更多参考。
3.4 不同影像组学处理方式对预测乳腺癌分子分型的影响 影像组学为乳腺癌分子分型提供了一种低成本、高通量的数据分析方法,从而有利于分子分型的准确检测和个性化治疗。但是,不同的影像组学处理方式可能会对所提取的特征以及最终所建立的模型产生不同的影响。影像组学的关键步骤是病灶的分割,分割范围的正确与否直接影响特征的提取及预测模型的建立。目前图像分割的方法有手动、半自动及全自动3种。Agner等[36]采用二维手动法对DCE-MRI进行分割,然后提取特征,以此建立SVM模型鉴别三阴型乳腺癌与其他非三阴型病变、三阴型与ER阳性乳腺癌、三阴型与HER2阳性乳腺癌,其 AUC 分别为 0.73、0.77、0.74。Juan等[37]采用全自动方法对53例乳腺癌病人的DCE-MRI进行分割预测Ki-67,减少了观察者之间的差异性,该研究从每个ROI中提取15个特征,结果显示1个形态学特征、3个灰度直方图特征(标准差、偏斜度和峰度)和3个纹理特征(对比度、均匀性和逆差分矩)对其鉴别有显著差异。
影像基因组学在提取定量特征后,通过分类算法将其与疾病诊断、治疗、预后等进行相关。不同的分类算法有可能对预测结果产生不同的影响。Ma等[38]从377例乳腺癌病人的术前DCE-MRI中共提取出56个定量影像组学特征,利用LASSO算法筛选出最优特征集,并分别建立以朴素贝叶斯、SVM及K折邻近为分类器的机器学习模型预测病人Ki-67,结果显示以朴素贝叶斯为分类器所建立的模型预测性能最好,其AUC为0.773,准确度为0.757,敏感度为0.777,特异度为0.769,且LASSO算法最终筛选出3个最具统计学意义的特征,分别为对比度、熵和线条相似度。目前影像组学处理方法多种多样,因此根据临床需求选用科学合理的方法是研究的重点。
4 小结
目前关于影像组学与乳腺癌分子分型的研究仍处于起步阶段,部分研究还存在一些不足,尚不能完全代替有创的免疫组织化学检测。一方面可能由于影像科医生对影像组学的基本概念尚缺乏深入了解,未能建立有效和标准化的特征提取和数据共享系统,阻碍了影像组学在临床实践中的应用;另一方面大多数涉及乳腺癌分子分型的影像组学研究均为回顾性分析,样本数量不足,并且均为单一模态的影像组学,预测准确性有待进一步提高。总之,随着大数据时代的到来、影像组学的发展以及对精准医疗的需求,影像组学联合基因组学、蛋白质组学将成为未来研究的新方向。