机器学习基于MRI预测乳腺癌对新辅助化疗反应的研究进展
2021-12-04陈志庚李响沙琳
陈志庚,李响,沙琳
作者单位:大连医科大学附属第二医院放射科,大连116027
新辅助化疗(neoadjuvant chemotherapy,NAC)是绝大多数乳腺癌,尤其是局部晚期乳腺癌的标准治疗方法[1-2],其旨在降低肿瘤分期,减少手术干预程度。虽然多数患者可以从中受益,但是全世界范围内仅12%~28%达到病理完全缓解(pathologic complete response,pCR)[3],另有10%~35%对NAC不敏感以及5%左右出现病灶进展[4]。乳腺癌的反应可分为六种,即pCR、单病灶缩小、单病灶伴卫星灶残留、多病灶残留、病灶稳定以及病灶进展[5-6]。在手术方案的制订中,对pCR和单病灶缩小倾向于采取保乳手术,余者更倾向于乳房切除术。
目前NAC 疗效评估的金标准是病理活检。Miller-Payne(MP)分级是基于病理活检的临床评估方法,其根据镜下肿瘤细胞的密度和形态划分G1~G5。实体瘤的疗效评估(RECIST 1.1)是基于影像学检查的评价方法。MRI 能够将肿瘤内部信息可视化后用于分析,在乳腺癌的良恶性鉴别、分级和NAC 反应评估等方面得到普遍应用[7-8]。有别于传统影像诊断,机器学习(machine learning,ML)能够提取医学图像中肉眼无法识别的信息并转换为定量特征,筛选其中与肿瘤异质性高度相关者用于预测或分类。本文就ML基于不同MR序列预测NAC后乳腺癌的反应进行综述。
1 机器学习介绍
ML 是统计学和计算机科学的交叉学科,专注于对数据进行学习归纳并不断自我完善,常用于处理预测和分类的问题。按学习方式分为监督学习、无监督学习、半监督学习和强化学习。监督学习是一类基于已标记的训练样本进行学习进而推测未知样本的算法,而无监督学习所采用的训练样本无需标记[9]。半监督学习介于二者之间,是一种兼具低成本和准确性的方法[10]。强化学习与无监督学习相似,但是引入了奖惩函数,以奖励信号函数值达到最大为目标[11]。影像组学(radiomics)主要流程为:(1)获取医学图像;(2)勾画感兴趣区(region of interest,ROI);(3)提取影像特征;(4)特征降维;(5)建立模型。ML 已涉及其中(2)~(5)。相关研究常以监督学习方法建立预测模型,常用算法有支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、逻辑回归(Logistic regression)等。
2 机器学习预测模型
2.1 动态对比增强磁共振成像
动态对比增强磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)是乳腺MRI 最灵敏的成像序列,该技术的原理是通过连续、快速地扫描获取对比剂注射前后多个时间点的图像。在以往研究中,NAC评估常用的MRI特征有肿瘤直径、体积和病灶增强等,但从现有证据来看,该特征并不足以作为pCR的早期预测因素[12]。直方图和纹理分析是基于统计建模对肿瘤异质性的定量分析,Bitencourt等[13]对DCE-MRI进行分析发现直方图特征的熵、第90百分位数、方差,纹理特征的区域长度方差与pCR 密切相关,其预测效能优于包括肿瘤直径、增强类型在内的临床和MRI 特征。DCE-MRI的血流动力学参数同样可以用于定量分析,容积转移参数(Ktrans)、速率参数(Kep)以及血管外细胞外容积分数(Ve)是早期预测肿瘤反应的良好特征[14]。但是Braman等[15]研究认为与影像特征相比,血流动力学参数并非高度相关特征。这表示影像特征可能更具备成为生物标志物的潜力。浸润性乳腺癌对周围组织具有侵犯性,其浸润范围与手术范围密切相关,因此肿瘤周围区域同样需要深入分析。Braman等[15]提取肿瘤周围区域特征用于分析,其结果证明肿瘤周围区域的直方图特征和纹理特征可用于预测模型,但是不同乳腺癌亚型的最佳预测特征存在差异。NAC 方案通常需要6 到8 个周期,期间肿瘤异质性的变化是值得深入探讨的。治疗前的图像通常称之为基线图像,Fan等[16]选取基线与两个治疗周期后图像通过配准形成雅可比图以反映图像体素变化,该模型基于此三类图像进行特征提取,其分析结果显示反映肿瘤异质性的直方图特征(例如平均值)和纹理特征(例如太依赖高灰度强调)的变化可用于早期预测,NAC应答组的降低程度高于无应答组。Sutton等[17]表明基线和NAC 后不同增强时间点的图像纹理特征的变化同样具有预测价值。该特征变化由生长分割混合高斯模型计算图像间体素差异而得。研究中所用的Gabor 滤波器对图像边缘敏感,可以细致地获取纹理的变化,此类特征属于高阶特征。但是Gabor 变换对突变信号和非平稳信号处理能力不足,而小波变换可以弥补该缺点。小波变换是对空间频率的局部化分析,可有效地提取图像中的高频和低频信号,更加细致、全面地分析纹理变化[18]。从Zhou 等[19]的研究可知小波变换纹理特征对预测pCR 有良好的表现,并且优于体积纹理特征和周边纹理特征。另有学者将关注点对准了高斯拉普拉斯(Laplacian of Gaussion,LoG),这是图像二阶空间导数的二维各向同性测度,用于突出图像中强度发生快速变化的区域[20]。Choudhery 等[21]提取三阴性乳腺癌的3D 形状特征和纹理特征用于分析,发现基于LoG 滤波器的信号强度平均值、信号强度中位数、最大信号强化、最小信号强度和信号强度标准差可用于预测pCR。上述特征类别不尽相同,所用滤波器和特征计算方法也存在差异,能够更可信地解释肿瘤间差异化缓解的关键特征可能尚待发掘。因此,特征的优劣对比及对更多高阶特征的尝试值得深入探索。
2.2 弥散加权成像
弥散加权成像(diffusion-weighted imaging,DWI)是基于组织内水分子弥散运动的成像手段,表观弥散系数(apparent diffusion coefficient,ADC)是其量化指标。DWI 和ADC 可以反映水分子的弥散率、肿瘤细胞密度和细胞膜完整性,用于预测NAC 反应[22]。Chen 等[23]对比了DCE-MRI和ADC 图,结果表明基于ADC 图的模型能够预测pCR,并且基于DCE-MRI 和ADC 图的联合模型表现更好,其所用四个影像特征中两个取自ADC 图。由此可知,多模态序列中纳入DWI和ADC 是一个值得考虑的选择。另外,研究认为基于逻辑回归的诺谟图具备定量预测pCR 的潜能。Bian 等[24]和Chen 等[25]基于DWI、DCE-MRI、和T2WI 高效地预测了pCR 并肯定了诺谟图的作用,并且后者通过决策曲线分析(decision curve analysis,DCA)证实了诺谟图的有效性。上述研究大多致力于对pCR 的预测,然而非pCR 肿瘤的退缩模式是影响手术方式的重要因素,如能准确识别将有助于治疗方案制定和调整。Zhuang 等[5]将pCR 和单病灶缩小作为一组,其余非pCR退缩模式为另一组,基于多模态基线图进行预测,AUC 可达0.826。目前早期预测研究一种聚焦于基线图像,另一种聚焦于治疗期间图像的变化。Eun 等[26]选取基线和治疗中期(第3 或4 治疗周期)的多模态图像(DWI、ADC 图、DCE-MRI 和T2)进行纹理分析,经对比表明治疗中期的预测效能优于基线及治疗中期-基线。目前,多序列的结合较之单一序列效能更佳,但是最佳的序列组合尚无定论,后续可以对此做进一步的比对研究。
3 深度学习介绍与应用
目前,ML 正在向深度学习(deep learning,DL)方向发展。DL基本结构是输入层、隐含层和输出层,其中隐含层包括卷积层、池化层以及全连接层。卷积层负责提取图像特征,池化层则对特征进行筛选和信息过滤,得到的特征最后进入全连接层进行非线性组合得以输出。这是一种端到端的结构类型,即前端输入原始图像后末端直接输出结果,无需对特征进行预设定,可自行创建特征并进行学习,建立起从输入端到输出端的函数关系[27]。卷积神经网络(convolutional neural network,CNN)是DL的代表算法之一,该网络结构是对生物神经网络的模拟,在图像识别方面拥有其他算法不可比拟的作用[28]。
VGGNet (visual geometry group network)是CNN 中常用的网络结构,常使用L2 正则化(regularization)、增强(augmentation)、舍弃(dropout)防止数据过拟合。在一些研究中已经展现出比传统ML 更高的效能。在Ha 等[29]研究中将NAC 后肿瘤的反应分为pCR、部分缓解和无缓解或进展三组,使用基线DCE-MRI 实现了良好的预测效能。El Adoui 等[30]进一步讨论了NAC前后DCE-MRI在CNN预测pCR中的差异。他们发现虽然使用基线与NAC后图像的组合模型的AUC最高,但是基线图像的AUC 也达到0.7969,并且高于NAC 后图像。此外,该研究显示选用未经分割的图像较人工分割肿瘤边界的图像效能更佳。这说明CNN足以应付复杂信息,人为裁剪图像可能反而减少与肿瘤异质性相关的数据,限制了CNN的能力。随着DL 深度的增加可能会出现梯度消失和梯度爆炸,导致浅层参数未能得到充分训练。多通道CNN可以有效减少此类问题,使DL的浅层学习到更具区分性的特征。前文El Adoui等[30]以包含两个并行子通道的多通道CNN 同时分析治疗前后的图像,Qu等[31]则扩展至12个并行子通道将治疗前后DCE-MRI的六个增强阶段图像纳入分析。后者表示NAC 后图像的预测效能优于基线图像,不过采用治疗前后图像数据的组合模型表现仍是最优的,并且该研究通过DCA 证实多通道CNN 具有临床价值。目前乳腺癌CNN 研究仍以DCE-MRI 为主,而在结直肠癌中,除主要序列T2WI外,还对多种序列及其组合(DCE-MRI、ADC等)进行了探索并取得良好成效[32]。有鉴于此,多模态序列及新兴序列的CNN应用可作为后续研究的思路之一。
4 挑战与展望
综上所述,直方图特征、纹理特征和高阶特征对NAC 反应的预测作用已经得到证实,但是受限于开发人员的专业知识,传统ML 设定的特征可能无法获取正常与异常间的复杂变化。DL 则很好地弥补了这点,但是具有很高的敏感度的同时也存在较高的假阳性率。传统ML 研究大部分采取人工勾画ROI,虽然这是金标准,但是需要大量的时间和人力成本,也存在主观因素的干扰。值得期待的是自动分割和半自动分割有望取代人工分割[33-35],不过仍需要更多的研究来进行论证。无论是传统ML还是DL,都需要大数据作为支撑才能发挥出应有的效果。虽然近年的研究中纳入的样本量正在逐渐增多,但是仍然需要进一步地扩大。机器型号或参数等都可能对预测模型产生影响,因此图像的预处理是极为重要的环节[36]。对预处理的具体步骤目前尚无统一的标准,在许多研究中往往也欠缺细致的说明。最后,现阶段的预测模型还停留在研究阶段,绝大多数是单一中心的回顾性研究,而且关于DL 应用于预测乳腺癌NAC反应的研究的数量较之传统ML尚显不足。总而言之,ML 强大的分析能力为乳腺癌诊疗技术的进步带来了希望,相信随着人工智能技术的进步,未来将开发出更精准、适用范围更广且更具临床价值的ML模型。
作者利益冲突声明:全体作者均声明无利益冲突。