人工智能和影像组学在免疫检查点抑制剂治疗非小细胞肺癌中的应用进展
2024-04-09刘佳林张皓
刘佳林 张皓
据国家癌症中心统计,肺癌居中国恶性肿瘤发病率及死亡率的首位[1],非小细胞肺癌(non-small cell lung cancer,NSCLC)为其最常见的病理类型。近年来,随着免疫治疗的发展,以细胞毒T淋巴细胞相关抗原4(cytotoxic T lymphocyte-associated antigen-4, CTLA-4)、程序性死亡受体-1(programmed cell death 1,PD-1)及其配体(programmed cell death 1 ligand 1,PD-L1)为代表的免疫检查点及相关抑制剂的研究,使非小细胞肺癌的临床诊疗和疾病管理发生了巨大的变化。但仍然缺乏高特异度和高灵敏度的生物标志物来筛选免疫检查点抑制剂治疗可能获益的患者人群,肿瘤患者在诊疗全阶段有多次的影像学检查,获得了大量有关实体肿瘤的影像数据,而影像组学基于医学影像以非侵入性的方式提取大量肉眼无法分辨的特征,获得包括纹理特征和高阶特征等反应实体肿瘤内部异质性的定量参数,弥补了侵入性检查无法获取全面的、整体的信息这一缺点[2]。人工智能算法同样擅长从复杂的医学图像中识别定量特征[3],其在影像研究中常用的算法有:卷积神经网络、支持向量机、随机森林等。人工智能、影像组学与医学的学科交叉,为肿瘤病变特征量化方法提供了新的方案,有助于临床实践中的纵向管理。
目前,影像组学和人工智能在免疫检查点抑制剂应用于NSCLC的研究主要集中在两个方面:(1)预测疗效及患者临床获益,如:直接预测免疫治疗的疗效,或者通过预测PD-L1的表达及TMB等间接预测疗效。(2)免疫治疗相关不良反应的预测及鉴别。
一、免疫治疗的反应性预测
1. 间接预测
研究表明,更高的PD-L1表达通常与更好的临床获益相关[4]。免疫治疗前通常行穿刺活检通过免疫组化计算肿瘤细胞阳性比例分数(tumor proportion scoring,TPS)作为应用免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)能否临床获益的判断标准[5],但穿刺作为一种侵入性检查,患者的接受度不高,可能发生出血、气胸等并发症,并且由于肿瘤内部的异质性,穿刺的部分组织难以获得肿瘤整体信息。
部分临床特征和影像征象与PD-L1表达水平相关,如肿瘤分化程度、肿瘤形状、血管集束征等,有学者将这些临床特征、影像征象和影像组学特征结合构建列线图等,显示出较好的预测效能[6, 7]。Wang等[8]使用3D ResNet神经网络基于CT图像开发了一种无创的预测PD-L1表达的深度学习系统,该模型具有稳健的预测性能,在验证队列预测PD-L1表达1%、1%~49% 和 ≥50%的曲线下面积(area under curve,AUC) 分别为 0.950、0.934和 0.946,并且基于以上PD-L1表达差异所实现的患者生存风险分层具有统计学意义,总体生存期一致性指数为0.89。该深度学习系统的开发和验证为选择适合免疫治疗的患者并评估其预后提供了一种新的思路,当肿瘤组织无法获取时,基于影像信息可以为临床决策提供重要支持。
美国食品药品监督管理局批准的另一项泛实体瘤免疫治疗反应的生物标志物为肿瘤突变负荷(tumor mutational burden,TMB)[9],TMB是ICIs治疗NSCLC疗效的重要预测指标[10-12]。Wang[8]等发现肿瘤的分期、分化程度和病灶空泡征与TMB状态相关,将这些临床特征、影像征象和影像组学特征结合,构建TMB状态预测模型,AUC为0.818。He等[13]使用4个带有密集连接层模块的密集卷积神经网络(3D-densenet)识别肿瘤影像组学特征,使用全连接网络作为分类器,对患者TMB水平进行二分类判断,研究了放射组学标签与TMB之间的相关性,该模型区分患者TMB水平高低的AUC在训练集和测试集分别为0.85和0.81,优于单纯影像组学特征和临床病理特征模型。
2. 直接预测
一些临床试验表明,接受ICIs联合化疗的患者均有生存获益[14-16],PD-L1表达水平的测定对临床决策可提供的帮助信息有限[17],TMB对于NSCLC患者接受ICIs治疗效果和预测模型是一种有效的生物标志[18],但TMB检测耗时较长并且价格不菲,上述两者并不是疗效预测的理想生物标志物。基于以上问题,有学者[19]直接将CT图像作为疗效预测的生物标志物使用神经网络对无进展生存期进行预测,Yang等[20]结合NCSLC患者基线CT影像组学数据及临床病理信息,通过多因素逻辑回归分析和Cox比例风险回归分析,分别构建影像组学模型1和影像组学列线预测患者接受ICIs治疗的持续临床获益,同时构建影像组学模型2和影像组学列线预测患者的2年无进展生存期。影像组学模型1及影像组学列线图在验证集预测患者接受ICIs治疗的持续临床获益的AUC分别为0.795、0.877,影像组学模型2和影像组学列线在验证集预测患者的2年无进展生存期的一致性指数分别为0.760、0.791。影像组学列线图具有更高的总体净收益,结果表明较高的影像组学评分、年龄较小并且无远处转移的患者可以从免疫治疗中获益。结合平扫及增强多模态影像学信息可进一步提高模型预测效能[21]。Ravanelli等[22]提取CT图像上肺部病灶的直方图特征,作为ICIs治疗NSCLC患者预后和治疗反应分层的预测因素。这说明基于CT的影像组学特征和临床病理信息可用于识别最有可能从免疫治疗中受益的NSCLC患者,可以指导NSCLC的个体化治疗策略。Liu等[23]基于NSCLC患者基线CT图像,使用L1特征选择进行特征降维,分别训练支持向量机、逻辑回归、高斯朴素贝叶斯分类器,依据三个分类器所得到的分数进行风险分组并进行生存分析,三个分类器预测PFS和OS的平均AUC分别为0.73、0.61,一致性指数分别为0.92、0.79,预测PFS和OS的模型的平均风险比(HR)分别为6.22和3.54,算法模型分类所得两个风险亚组的PFS和OS存在显著差异。有研究对比深度学习神经网络与机器学习预测NSCLC患者免疫治疗后1年、3年、5年、7年的生存终点,结果显示深度学习模型并没有显著提高预测效能[24]。人工智能和影像组学模型用于风险分层及预后预测有广泛的前景,但是开发对结局的预测效能更加稳健的模型有待于更进一步的研究。
由于人工智能自身特性、算法与临床应用关系的研究较少,深度学习的不可解释性长期限制着预测模型的应用,Tian等[25]使用深度卷积神经网络提取CT图像的深度学习组学特征及传统影像组学特征,分别建立PD-L1表达深度学习模型、影像组学模型、临床信息模型,并研究各个模型及其融合模型与PD-L1表达状态的相关性并预测患者对免疫治疗的反应。其中PD-L1表达深度学习模型在验证集鉴别患者PD-L1 TPS≥50%或<50%的ROC曲线下面积为0.76,并且PD-L1表达深度学习模型的预后分层效果优于临床模型,结合两者可进一步提高风险分层效能。此外通过生成类激活图他们还发现,深度学习关注病灶的边缘区域,这一区域的纹理特征有明显的差异。这表明深度学习的方法有较好的能力通过CT图像预测PD-L1的表达,并且对NSCLC患者的预后进行分层,从而指导临床对肿瘤治疗方式的选择。此项研究以可视化的方法一定程度上阐明了神经网络在医学图像上如何学习的,提高了神经网络学习过程的可解释性。同样Zhu等[26]使用弱监督框架的基于注意力机制多示例学习(Attention-based multiple instance learning,a-MIL)方法对免疫治疗生存获益大于6个月的NSCLC患者进行预测,AUC可达0.8。Hozumi等[27]利用临床信息,根据频率和循证医学的方法基于树增强贝叶斯算法(tree-augmented naïve Bayes ,TAN)开发人工智能模型,预测NSCLC患者接受免疫治疗后的持续临床获益在验证集的AUC均大于0.7,贝叶斯网络模型采用的图形模型形式的因果关系在可解释性上有天然的优势,可以利用专业知识选择控制连接的节点,使用有较好解释性的算法或模型对于临床推广使用有很大的帮助,并且可以转移应用于NSCLC以外其他类型的癌症。
3. 多组学模型
基因组学的发展加速精准医学的实现,临床医生可使用的辅助诊疗信息更加多样、可靠,使用多组学、多模态特征的方法对改进机器学习来预测 NSCLC 患者的免疫治疗反应提供了定量依据。Vanguri等[28]融合影像组学、基因组学、病例特征基于动态注意力机制构建带有掩蔽多示例学习模型来预测免疫治疗反应,多模态模型的风险预测AUC为0.80。还有学者仅利用基因突变特征预测NSCLC患者免疫治疗的反应性[29],其预测效能不及多模态模型[28]。Chen等[30]结合影像组学和PD-L1的编码基因CD274作为预测工具,该工具预测PD-L1表达>1%、>50%、>90%的AUC分别为0.70、0.72、0.66;预测治疗反应和肺炎发生的AUC分别为0.68、0.64;在生存分析高、低风险分组中同样表现出较好的性能,HR为2.26、P为0.011。基因集合富集性分析结果显示,该预测工具与组织缺氧和炎症通路相关。Chen等人开发的影像基因多组学预测工具在PD-L1表达、治疗反应预测、肺炎预测及生存分析分组等多个临床应用中均表现出较好的性能,有较好的组学临床泛用性。Saad等[31]采用集成学习策略将一个监督学习网络、两个以不同方式合并监督学习和无监督学习的混合网络以及一个无监督学习网络的4个三维卷积神经网络组成集成框架,可以捕获不同网络中存在的共同或互补的信号,通过聚合多个模型减少单个模型的偏差和方差,该深度学习框架分析影像、临床和病理对患者进行风险分层有良好的性能。
在PD-L1免疫组化染色和TMB检测无法实施时,影像检查结合多组学一定程度上作为预后相关生物标志物,Tunali等[32]根据CT影像组学特征构建模型以总生存期和无进展生存期差异对NCSLC患者进行风险分层,分层结果具有统计学意义,并且碳酸酐酶Ⅸ(carbonic anhydrase Ⅸ,CAⅨ)基因表达与影像组学特征的积分呈正相关。该研究不仅验证了影像信息与NSCLC患者经免疫治疗临床获益的关系,进一步结合基因分析阐明了分子水平的改变。
二、免疫相关不良事件
免疫检查点抑制剂增强免疫系统活性的同时,可能诱发与呼吸系统、消化道、内分泌系统等有关的副作用[33-35],被称为免疫相关不良事件(immune-related adverse events,irAEs),然而缺乏有效的生物标志物预测这类事件的发生。
1. 鉴别免疫检查点抑制剂相关性肺炎和放射性肺炎
同步放化疗之后进行免疫治疗在治疗Ⅲ期不可切除NSCLC患者的治疗策略中获得广泛认可[36]。放射性肺炎(radiation pneumonitis, RP)是胸部放疗中常见的不良反应,免疫检查点抑制剂相关性肺炎(checkpoint inhibitor-related pneumonitis, CIP)也有较高的发生率,同时RP和CIP的治疗及预后有较大不同,因此,二者的鉴别在临床工作中十分重要,但仅依靠临床症状和胸部CT表现区分二者是困难的。Chen等[37]全自动分割治疗后并发肺炎患者双肺的病灶,提取影像组学特征,使用随机森林算法建立机器学习模型,该模型诊断CIP的AUC为0.76。虽然该模型的诊断效能没有足够优秀,但是为CIP的诊断和鉴别诊断提供了新的思路。Qiu等[38]纳入126名晚期NSCLC并发肺炎患者,在CT肺窗图像提取影像组学特征,构建影像组学评分,使用逻辑回归构建列线图。根据影像组学评分可以有效鉴别RP和CIP,列线图鉴别二者的AUC为0.947,列线图可进一步提高鉴别效能,此外单变量分析表明双肺病变和病灶边缘锐利是鉴别诊断的独立预测因子。此模型的诊断效能十分理想,但是由于验证队列的数量限制以及缺乏外部验证,该影像组学模型的临床预测价值有待更广泛的研究。
有学者从病灶CT图像提取强度直方图特征、灰度共生矩阵(gray level co-occurrence matrix, GLCM)特征及词袋(bag-of-words, BoW)特征,从3个尺度分别训练和验证模型,使用三种算法:逻辑回归、随机森林和支持向量机,ROI包括:原始ROI、原始ROI外扩5个像素和外扩10个像素。原始ROI提取以上三种特征在验证集AUC最高分别为0.677、0.848、0.834,诊断效能表现最好的组合为:BoW特征、逻辑回归、ROI外扩5个像素,AUC可达0.937[39]。说明比较多种机器学习算法,选择不同的特征,外扩一定程度的ROI可以获得更加优秀的诊断效能。
2. 预测快速进展和超进展
ICIs治疗NSCLC的总体反应率为20%~50%,另外有相当一部分患者会经历超进展[40, 41],临床上缺少有效预测超进展的生物标志物。Tunali等[42]提取瘤周CT图像影像组学特征预测肿瘤快速进展和超进展的AUC为0.812和0.823,在预测超进展的发生上有更好的效能。他们仅使用影像特征及临床特征构建模型,并没有从基因分子层面对快速进展及超进展的发生进行研究,未来需要更多机制的探索。
三、现存问题与展望
应用影像组学和人工智能的方法在免疫治疗非小细胞肺癌的研究中,目前获得了一些乐观的结果,但是还存在着部分问题需要克服。第一,人工智能和影像组学以数据为基础,但是目前医学影像数据的获取、标注、数据量以及质量缺乏统一的标准;第二,可解释性阻碍模型的广泛应用和临床医生对深度学习模型的接受,因此基于人工智能的算法模型需要不断优化并进行可解释性上的探索,以最终应用于临床实践。因此,人工智能和影像组学在免疫治疗非小细胞肺癌方面的研究,需要多学科交叉的研究团队形成新的体系,解释医学影像所包含的信息与肿瘤生物学行为的联系,以此提高其在临床工作中的价值。
免疫治疗的研究和应用使非小细胞肺癌的治疗进入了全新的阶段,但是免疫治疗高昂的费用和免疫治疗后疾病进展的发生,开发一种有效的疗效预测以及不良反应预测生物标志物来筛选用药人群迫在眉睫,基于人工智能和影像组学在免疫治疗相关的研究中得到的结果显示出了很大的作用,随着人工智能算法的发展及多组学数据的融合,影像学评价作为非小细胞肺癌免疫治疗临床诊疗的生物标志物会有新的突破。