非小细胞肺癌的影像组学研究进展
2023-05-11杨朝凤
郭 黎,杨朝凤,李 杨,2
1.医学影像四川省重点实验室/川北医学院附属医院放射科,四川 南充 637000;2.四川省岳池县人民医院放射科,四川 岳池638300
肺癌是最常见的癌症之一,也是癌症死亡的主要原因,大多数肺癌患者就诊时已处于晚期,5 年生存率仅16.3%[1]。肺癌可分为非小细胞肺癌(non-small cell lung cancer,NSCLC)和小细胞肺癌两大类。NSCLC是一组异质性疾病,约占肺癌的85%[2],主要为腺癌、鳞状细胞癌和大细胞癌。早期诊断、准确评估和个体化治疗是提高肺癌患者生存率的重要途径,而靶向治疗和免疫治疗等的应用极大改善了NSCLC 患者的预后,使其2 年相对生存率从34%提高至42%[3-4]。
NSCLC 缺乏特异性临床特征,大多数患者确诊时已处于晚期,治疗效果较差,生存率低。研究表明,影像组学能无创性地评估肿瘤组织的特征,可用于肿瘤诊断、分期和指导治疗,且具有很高的准确性[5],有望为临床诊疗提供更多帮助。笔者对影像组学及其在NSCLC 中的研究进展进行综述。
1 影像组学的概念及研究方法
影像组学是指利用数学算法从医学图像(即CT、MRI、PET、超声)中高通量地提取定量影像特征,深度挖掘图像所包含的信息,协助临床疾病诊疗的影像分析方法[6-8]。这些特征包括病变的形状、体积、纹理、衰减及其他人眼难以识别或量化的特征[9]。影像组学的研究过程可分为5 个步骤:数据选择、图像分割、特征提取、探索性分析和模型建立[10]。
1.1 数据选择
影像组学研究从选择成像数据(即回顾性研究)或建立成像方案(即前瞻性研究)、选择感兴趣的组织和预测目标(即希望预测的事件或特征)开始[11]。如对整个原发肿瘤进行分析,将其与现有的治疗结果(如预后、生存率等)数据联系,然后从医学图像中提取出定量的影像学数据,并以无创性方式探索其与疗效的相关性[12]。与MRI 相比,CT 数据的可变性更小,在影像组学分析中应用更广泛[13]。
1.2 图像分割
在二维/三维图像中描绘ROI/VOI 是影像组学分析方法关键的一步[14],通常选择ROI 作为两者的统称。ROI 定义了计算影像组学特征的区域,并采用手动、半自动或全自动方式进行分割。大多数影像组学研究采用手动分割,可准确勾画肿瘤边界,但存在耗时久、受主观性影响较大、可重复性差的缺点。而自动分割(包括半自动和全自动)具有高效性和可重复性,将影像组学特征的提取与机器学习相结合,可自动勾画肿瘤病变的轮廓[15],避免人工勾画的繁琐与失误。但许多肿瘤边界模糊,难以正确划分ROI,而后续特征数据需从ROI 中获得,因此,自动分割可能会导致特征数据缺乏准确性[16]。
1.3 特征提取
影像组学特征是一种定量特征,可分为形状特征、一阶统计特征、二阶统计特征和高阶统计特征[17]。形状特征描述了所追踪ROI 的形状及其几何属性;一阶统计特征描述了单个体素值的分布,而不考虑空间关系;二阶统计特征即纹理特征,是通过计算相邻体素之间的统计关系而获得;高阶统计特征是在对图像应用滤波器或数学变换后,通过统计方法获得[18-19]。有些商业软件包可执行特征提取工作,如PyRadiomics、ONCOradiomics、LIFEx、3Dslicer、MIM、TexRAD、MaZda、CGITA、IBEX 等[20]。
1.4 探索性分析
在建模之前,可对提取的特征和预测目标之间的关系进行评估,以帮助选择特征。如可使用相关或单变量逻辑回归分析进行评估[11],或将特征与1 个或多个特定结果行关联分析[21],以探索特征的可行性与准确性;可将收集的数据集划分为用于创建模型的训练数据集和验证数据集,以及测试数据集。通常将80%的数据作为训练数据集,20%作为测试数据集,而训练数据集的20%作为验证数据集,用于模型超参数调整时检查是否过度拟合[22]。只有对预测目标的评估显示出显著诊断性能的特征才能用于进一步建立模型。
1.5 模型建立
在获得足够多的定量成像特征后,需进行特征选择以保留关键特征,避免大量信息导致过度拟合,再根据临床终点与关键特征构建预测模型[23]。建立模型的关键在于模型的可重复性,因此可采用多重建模方法。当数据量大时,深度学习是建模的首选方法[22],常用的有逻辑回归、支持向量机(support vector machine,SVM)和随机森林等。研究表明,随机森林通常具有较高的性能[24]。相较于单纯的影像组学模型,将患者的临床特征与影像组学特征相结合,可提高模型的有效性[25]。建立模型后,常采用ROC曲线或AUC 对模型性能进行评估和验证,目前多采用AUC,其值为0~1[26],值越大,模型性能越好。
2 影像组学在NSCLC 患者中的应用
随着医疗条件的进步,NSCLC 患者的治疗方法也趋于多元化:早期患者手术切除能获得较好的预后效果;而晚期无法手术的患者,放射治疗(包括立体定向消融放射治疗)和全身治疗(包括细胞毒性化疗、酪氨酸激酶抑制剂和免疫检查点抑制剂)的应用也极大提高了患者的生存期[27]。影像组学能够以无创的方式,对肿瘤的整体特征进行分析,间接反映肿瘤细胞及分子层面的理化性质,并及时评估治疗反应,建立起影像学与生物学之间的联系,为临床诊疗提供重要帮助。对于NSCLC 患者,影像组学的应用包括以下几个方面。
2.1 预测NSCLC 患者组织学亚型、基因突变类型
正确区分NSCLC 组织学亚型及基因突变对治疗至关重要,但这些结果主要依赖病理活检。重复活检会增加肿瘤局部转移的风险和患者的经济负担[28],因此,影像组学因无创、可重复和成本低可替代病理活检而用于组织分型和基因突变检测中。Ferreira-Junior等[29]基于CT 影像组学特征预测肺癌组织学亚型的研究发现,共生矩阵的最大概率特征变化能够区分NSCLC 组织学亚型,其值越大,肿瘤为鳞状细胞癌的可能性越大。Tang 等[30]收集了148 例NSCLC 患者的多模态MRI 数据,分别构建了影像组学评分(Rad-score)模型和影像组学-临床列线图用于区分鳞状细胞癌和腺癌,结果显示Rad-score 模型在2 个队列中(训练组和验证组)均具有良好的区分性能,AUC 分别为0.819 和0.824,而结合了Rad-score 和临床独立预测因子的影像组学-临床列线图在2 个队列中的AUC分别为0.901 和0.872,表明基于多模态MRI 的影像组学特征可对NSCLC 进行组织学亚型分类,且影像组学特征与临床特征相结合可进一步提高对NSCLC组织学亚型分类的准确性。另有研究显示,影像组学特征(熵)联合临床特征(吸烟和性别)和影像学特征可正确识别85%的腺癌和鳞状细胞癌,且这种预测的准确率在表皮生长因子受体(epidermal growth factor receptor,EGFR)突变型腺癌和鳞状细胞癌中可达95%[31]。
NSCLC 致癌的核心机制为体细胞基因的突变,包括EGFR、kirsten 鼠类肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)、Erb-B2 受体酪氨酸激酶2(erb-B2 receptor tyrosine kinase 2,ERBB2)和肿瘤蛋白53(tumor protein 53,TP53)等。多项研究指出,影像组学在识别NSCLC 患者基因突变方面具有巨大潜力[32-33]。Zhang 等[32]纳入了134 例NSCLC 患者,提取出20 个与突变相关的影像组学特征,结果显示,用于区分EGFR、KRAS、ERBB2 和TP53突变的组合模型(影像组学特征和相关临床因素)的AUC 分别为0.78、0.81、0.87 和0.84;其中非EGFR突变的特异度为0.96,KRAS、ERBB2 和TP53 突变的敏感度为0.82~0.92,表明影像组学可区分NSCLC 患者中不同类型的基因突变。还有研究提取出12 个与EGFR 突变显著相关的影像组学特征,建立了临床-放射-影像组学模型,该模型具有更高的AUC(0.849),优于SVM 分类器(AUC=0.81)、逻辑回归分类器(AUC=0.783)、决策树分类器(AUC=0.768),这一结果表明临床-放射-影像组学模型对EGFR 突变有更高的预测价值,可指导患者的靶向治疗[33]。
NSCLC 患者中ALK 是另一种突变率较高的驱动基因,占肺腺癌的5%~7%[34],但影像组学在ALK 突变方面的研究较少。Chang 等[35]研究发现,PET/CT 影像组学-临床模型在预测ALK 突变状态方面具有显著优势(训练组AUC=0.87,测试组AUC=0.88),高于单独的临床模型(训练组AUC=0.76,测试组AUC=0.74)(P=0.023),表明基于PET/CT 影像组学的机器学习模型可作为一种无创性诊断方法确定NSCLC 的ALK 突变状态。
2.2 评估NSCLC 患者靶向治疗效果
近年来,靶向治疗在多种晚期肿瘤的治疗中展现出巨大前景。在NSCLC 患者中,尤其是东亚人群,EGFR 的突变率高达40%~55%[36]。因此,研究人员开发了以EGFR 酪氨酸激酶抑制剂(tyrosine kinases in-hibitors,TKIs)为代表的靶向药物,用于治疗晚期NSCLC。当患者出现EGFR 基因突变时,采用TKIs治疗的客观缓解率高达80%,而野生型EGFR 患者的客观缓解率仅10%[37]。Shao 等[36]收集了250 例接受第1、2 代EGFR-TKIs 药物治疗的ⅢC~Ⅳ期EGFR 突变型NSCLC 患者数据,构建Rad-score 模型,结果显示Rad-score 与无进展生存期呈负相关,Rad-score 越高,无进展生存期越短,说明基于PET/CT的Rad-score 可筛选出NSCLC 第1、2 代EGFR-TKIs药物治疗后有进展风险的人群,并识别出对靶向治疗敏感的EGFR 突变型NSCLC 人群,有助于为NSCLC患者提供精准的治疗方案。Yang 等[38]研究了治疗前影像组学特征在预测接受一线化疗、靶向治疗或两者联合治疗的NSCLC 患者的有效性,从322 例NSCLC患者数据中筛选出6 个最佳影像组学特征(包括4 个纹理特征,2 个统计特征)建立的影像组学标签,其AUC 达0.746,结果表明基于治疗前CT 图像的影像组学标签可准确预测NSCLC 患者接受一线化疗或靶向治疗后的肿瘤情况。还有学者研究了预测EGFR-TKIs 治疗晚期EGFR 突变NSCLC 无进展生存期的最佳影像组学模型,结果显示使用基尼指数特征选择方法的逻辑回归模型具有最佳表现(AUC=0.797),且风险评分中位值为0.518,其值越大,肿瘤快速进展的可能性越大,而根据该临界值可将患者分为高风险组和低风险组[39],有助于临床医师筛选出高风险患者并及时干预治疗。
ALK 是治疗NSCLC 另一种较为成熟的靶点,但并非所有NSCLC 患者都能受益于靶向治疗。脑转移是接受TKIs 治疗ALK 阳性肺癌患者治疗失败最常见的原因[40]。提前筛选并及时进行干预有脑转移风险的患者,可大大提高其生存率。Xu 等[41]研究发现了一个小波变换的纹理特征(即W_GLCM_LH_Correlation),结果显示其能够预测Ⅲ/Ⅳ期ALK 阳性NSCLC 患者的脑转移情况(AUC 分别为0.682、0.653)。Jiang 等[42]研究基于CT 的影像组学模型,用于预测接受克唑替尼治疗NSCLC 患者的脑转移情况发现,结合吸烟史和影像组学特征的列线图对NSCLC 患者的无脑转移生存期预测性能良好(C 指数训练组0.762,验证组0.724)。
2.3 评估NSCLC 患者免疫治疗效果
免疫疗法能够刺激针对恶性肿瘤的细胞免疫反应,以程序性细胞死亡蛋白1(programmed cell death protein 1,PD-1)或程序性死亡配体1(programmed death-ligand 1,PD-L1)信号通路为靶点的免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)是驱动基因阴性晚期NSCLC 患者的标准治疗方案[43]。影像组学在评估免疫治疗效果方面也具有一定的价值。Zerunian 等[44]研究发现,在纹理参数中,细过滤器和中等过滤器的正像素平均值(mean value of positive pixels,MPP)AUC分别为0.72 和0.70;Kaplan-Meier分析显示MPP<56.2 与较短的总生存期及无进展生存期显著相关,提示MPP 可作为ICIs 派姆单抗治疗的NSCLC 患者总生存期和无进展生存期的预测性影像学因素。Trebeschi 等[45]开发了一种评估免疫治疗反应的影像组学生物标志物,该标志物在NSCLC中具有良好性能(AUC=0.83),可反映免疫治疗效果,且在改善新辅助治疗和姑息治疗患者分层方面具有潜在的效用。Li 等[46]研究显示,在结合影像组学特征和临床病理特征的基础上,PD-L1 表达水平超过1%和50%的预测模型,其AUC 分别为0.762 和0.814,表明基于PET/CT 图像和临床病理特征的预测模型可筛选出抗PD-L1 免疫治疗有效的NSCLC患者。
免疫治疗后2 个月内获得的图像与治疗前图像比,若肿瘤负荷增加50%以上,且进展速度增加2 倍以上[47],则为超进展。一旦患者出现超进展,多预后不良,及早识别有超进展风险的患者是目前亟待解决的问题。Vaidya 等[48]使用随机森林分类器区分超进展和非超进展患者,在训练集和验证集中,其AUC 分别为0.85±0.06 和0.96,结果表明从接受ICIs 治疗的晚期NSCLC 患者CT 图像中提取的影像组学生物标志物,有助于识别有超进展风险患者。鉴于目前超进展尚无统一的诊断标准,其发生机制、危险因素也不明确,应用影像组学或可成为一种具有极大潜力的研究方式,但还需进一步验证。
2.4 评估NSCLC 患者预后
NSCLC 患者的预后通常取决于TNM 分期,但在临床中,即使肿瘤病理类型和分期相同,采用同样的方法治疗后,也可能出现不同的治疗结果。因此,预测患者的预后对选择治疗方案和提高生存率至关重要。寻找一种新的预测指标成了影像工作者亟需解决的问题。有研究表明,非同义突变的肿瘤突变负荷(tumor mutation burden,TMB)与可切除NSCLC 患者的预后相关,TMB 越高,预后越好[49]。He 等[50]收集327 例患者具有TMB 数据的CT 图像,建立了TMB 影像组学生物标志物(TMB radiomic biomarker,TMBRB),结果显示TMBRB 能够区分高TMB 和低TMB 的NSCLC 患者,并推测TMBRB 的ROI 可能与CD8 细胞丰度及肿瘤浸润淋巴细胞密度有关。Yang等[51]研究表明,CT、PET 或PET/CT 的影像组学评分对生存率有较好的预测能力,其中又以PET/CT 影像组学评分表现最好,其与临床病理因素结合,可提高PET/CT 模型的预测性能。
有研究者改进了影像组学方法,提出采用基于同源性的影像组学方法预测NSCLC 患者预后,但目前相关研究较少。Kadoya 等[52]根据Rad-score 将训练组和测试组中的患者分为高风险组和低风险组,2 组的总生存期具有明显差异。在训练组中,基于同源性的特征(Rad-score)、标准特征(Rad-score)和肿瘤大小的C 指数值分别为0.625、0.603 和0.607,而在测试组中分别为0.689、0.668 和0.667。这一结果表明,基于同源性的影像组学特征的预测能力略高于标准影像组学特征,提示其在提高影像组学的预后预测准确性方面存在潜力。
3 不足与展望
近年来,影像组学在肺癌诊断、治疗和预后评估等方面显示出巨大前景,但其仍存在一些局限性:①大多数研究是回顾性队列研究,样本量较小,缺乏足够的数据来验证影像组学的有效性。②在临床中,患者的情况复杂,存在多种病变和共病,基于单个病变的预测模型可能无法满足临床需要[53]。③目前大多数为单中心研究,研究结果的可重复性较差,无法进行验证,因此需大量的多中心前瞻性研究评估影像组学的准确性。④缺乏标准化的影像组学方法、质量评估,以及统一的图像采集参数,存在较大的主观性,降低了研究结果的科学性。未来影像组学的发展需多学科、多机构合作,通过建立影像组学数据库,实现数据共享,以克服不同数据之间的差异。同时,将传统影像组学与人工智能相结合有望从2 种技术的优势中获益。
总之,影像组学在肺癌的应用中存在巨大潜力,随着影像组学的发展与进步,必将为临床诊疗带来帮助,实现对NSCLC 患者的精准治疗。