影像组学和人工智能在预测非小细胞肺癌免疫及靶向治疗生物标志物表达状态上的研究进展

2024-04-08王晓妍郭莉莉

中国中西医结合影像学杂志 2024年1期

王晓妍，郭莉莉

南京医科大学附属淮安第一医院影像科，江苏淮安223300

肺癌是最常见的癌症之一，也是全球范围癌症相关死亡的主要原因。据统计，每年约有200万新发病例和176 万死亡病例［1］。依据病理分型，肺癌可分为小细胞肺癌和非小细胞肺癌（non-small cell lung cancer，NSCLC），其中后者最常见，但多在晚期才被确诊。在21 世纪初，晚期肺癌患者的中位总生存期为1 年［2］。随着个体化医疗的发展，免疫检查点抑制剂（immune checkpoint inhibitors，ICIs）和新一代靶向药物的出现大大提高了NSCLC 患者的长期生存率，成为改善患者预后的关键［3］。然而患者能否从中获益，取决于生物标志物。治疗前检测生物标志物，从而针对性地进行靶向或免疫治疗，有助于医疗决策，大大改善患者预后。目前，生物标志物识别主要依赖于活检或手术获得的肿瘤样本分析，具有一定局限性：①获得样本的途径为侵入性方法，在一些患者中并不可行；②肿瘤具有异质性，而样本仅代表部分肿瘤组织，无法获得肿瘤全部信息；③治疗后复发患者的二次活检并非常规操作，若存在基因二次突变，则可能因无法获知而延误治疗。因此，临床迫切需要一种无创且全面的方法来预测生物标志物的表达。

随着影像组学和人工智能在医学影像领域的发展，影像学方法在肺癌分期、病理分型及反应评估等领域发展迅速。因其能非侵入性地从医学影像中提取高通量数据信息，越来越多的研究利用影像组学和人工智能手段预测生物性标志物的表达。本研究总结了影像组学和人工智能在预测NSCLC 免疫及靶向治疗生物标志物表达状态上的研究进展。

1 影像组学和人工智能概述

1.1 影像组学

影像组学是一种高通量的图像表型分析方法，利用计算机算法从CT、PET 或MRI 获得的医学图像中提取定量特征并进行分析，该技术可获取人眼难以或不可能捕获的成像特征，客观描述肿瘤的边界、形态、纹理、空间结构等，从而反映肿瘤内部的异质性和基因表达模式。其流程主要包括：图像采集和重建、ROI划定和图像分割、特征提取和量化、影像组学模型建立和验证及分类、预测［4］。

1.2 人工智能

作为计算机科学的一个分支，人工智能因涉及医学癌症领域的研究而成为前沿热点。人工智能由大数据驱动，通过训练数据集、预处理、生成模型算法、预训练及验证模型的一系列过程来达到分类及预测癌症相关信息的目的［5］。机器学习、深度学习和神经网络是人工智能的子领域，另外深度学习实际上是机器学习的子领域，神经网络则是深度学习的子领域。机器学习是人工智能在医学领域应用的重要部分，其使用统计方法对算法进行训练，对关键数据进行分类或预测。常用的机器学习算法包括支持向量机（support vector machines，SVM）、决策树（decision trees，DT）及贝叶斯网络（Bayesian networks，BN）等。深度学习是一种以人工神经网络为架构，对数据进行表征学习的算法，其处在人工智能的前沿，近年来发展势头迅猛，在医学图像分析中发挥着越来越重要的作用［6］。而卷积神经网络（convolutional neural networks，CNN）是医学图像分析中使用最广泛的深度学习架构，CNN 直接将图像输入，并通过卷积层、池化层和全连接层对其进行转换，最后输出分类［7］。

2 影像组学和人工智能在免疫治疗中的应用

2.1 免疫治疗的发展概述

免疫治疗是通过诱导、加强或抑制免疫反应来治疗疾病，对癌症患者应用免疫疗法，旨在激活免疫系统攻击癌细胞从而改善预后。肺癌的一线或二线免疫治疗方案仅两大类ICIs，分别抑制不同位置的免疫检查点：程序性细胞死亡受体1/程序性细胞死亡配体1（programmed cell death receptor 1/programmed cell death Ligand 1，PD-1/PD-L1）路径和细胞毒性T淋巴细胞相关蛋白4（cytotoxic T lymphocyte antigen 4，CTLA-4）路径。自2011年伊匹木单抗（针对CTLA-4）获得美国食品和药物管理局（Food and Drug Admin‐istration，FDA）的批准用于治疗晚期黑色素瘤以来，利用患者免疫系统对抗癌症的药物ICIs 成为癌症治疗的新选择［8］。随后，靶向PD-1 和PD-L1 的单克隆抗体相继问世，抗PD-1/PD-L1 抗体已成为使用最广泛的抗癌抗体之一。ICIs 对NSCLC 患者的治疗效果明确，目前在转移性患者的一线治疗、不可切除的局部晚期患者放化疗后巩固治疗及可切除患者手术切除和化疗后的辅助治疗中广泛应用［2］。

2.2 免疫治疗的生物标志物

近年来，免疫治疗虽应用广泛，但患者对ICIs 的治疗反应各异，仅20%～30%有效［9］。目前，FDA批准了3种预测性生物标志物用于临床决策：PD-L1、微卫星不稳定性（microsatellite instability，MSI）及肿瘤突变负荷（tumor mutation burden，TMB），其中PD-L1是FDA于2015年批准的首个NSCLC预测生物标志物［10］，在临床研究和实践中使用最广泛，而PD-L1的表达状态测定主要依赖于FDA 批准的4 种免疫组化测试。这些免疫组化方法使用的抗体、评分系统、PD-L1 表达阈值及表达PD-L1的细胞均不相同，正是这些差异给临床实践带来了挑战。此外，PD-L1的表达具有空间和时间上的异质性，且会在治疗过程中发生变化，这进一步加大了PD-L1表达状态的检测难度。

2.3 免疫治疗生物标志物的预测

随着影像组学及人工智能在肿瘤鉴别、分型及预后等方面的广泛应用，有关其代替传统侵入性方式无创预测生物标志物表达的研究也越来越多。目前的研究主要集中在预测PD-L1 的表达状态。Yoon等［11］研究证实，CT 影像组学定量特征有助于预测PD-L1表达，且由临床变量和影像组学特征构成的组合模型性能更好。Bracci 等［12］针对72 例晚期NSCLC的纹理特征以PD-L1 2 种临界值（50%和1%）分别构建了2 种不同的模型，最终得到了AUC=0.763/0.806的良好结果。一项纳入839 例表现为磨玻璃结节的早期肺腺癌患者的研究表明，影像组学在预测早期肺腺癌PD-L1表达方面很有前景，而结合临床特征具有更好的预测效果［13］。然而一项涉及125 例NSCLC患者的双中心研究认为PD-L1 表达水平与临床特征无显著差异［14］，单纯影像组学模型的预测性能优于影像组学及临床特征结合的组合模型，这表明不相关的特征可能会降低整个模型的预测性能。Shiinoki等［15］研究了同时使用肿瘤内及肿瘤周围的CT 影像组学特征预测PD-L 表达水平的可能性，结果表明该模型比仅具有肿瘤内部特征的模型具有更高的准确性。此外，尚有一批研究试图使用18FDG PET-CT 影像组学特征预测PD-L1 的表达水平，除Hannequin等［16］研究认为两者之间无关联外，大部分研究表明基于18FDG PET-CT影像组学特征的预测模型可帮助临床医师识别PD-L1 表达阳性的肿瘤［17-18］。Wen等［19］比较基于CT 的影像组学特征及临床病理和CT形态学特征对PD-L1 表达水平和TMB 状态的预测性能，认为其对PD-L1 表达水平和TMB 状态的分类具有潜在价值，且组合模型进一步提高了预测性能。Zhou等［20］根据肿瘤标本中PD-L1、PD-1、CD8+和肿瘤浸润淋巴细胞的表达，将103例NSCLC 患者分为4个肿瘤微环境免疫型（tumor microenvironment immune types，TMITs），在使用FDG-PET/CT 的影像组学特征预测TMIT时，该方法表现出良好的预测性能。

人工智能的应用发展大大提高了预测模型的性能。一项包含127 例晚期肺腺癌患者的研究首次证明，晚期肺腺癌PD-L1表达状态与CT特征存在关联，另外深度学习（DL-3D DenseNet）模型的预测值（AUC＞0.750）高于形态特征［21］。Tian 等［22］首先报道了使用基于CT 的深度CNN 构建模型（PD-L1ES）在939 例晚期NSCLC 患者中预测PD-L1 表达，研究表明将PDL1ES与性别、年龄、吸烟史和恶性肿瘤家族史等临床特征相结合可更好地预测免疫治疗反应。如今越来越多的研究开始着眼于搭建多种特征融合模型预测单个或多个生物标志物的表达。Wang 等［23］利用CT图像开发了一个包含深度学习模块、影像组学模块及结合了深度学习、影像组学和临床特征联合模块的多任务人工智能系统同时预测EGFR突变和PD-L1状态，该系统在识别基因状态和进一步评估基因型方面表现良好。

3 影像组学和人工智能在靶向治疗中的应用

3.1 靶向治疗的发展概述

靶向治疗是可以特异性地定位靶点和抑制肿瘤突变基因的癌症治疗方法。近20 年来，对含有致癌基因突变的患者实行靶向治疗这一临床实践极大地改变了晚期NSCLC 的预后。吉非替尼在2000 年代初获得批准，是第一个在具有EGFR突变的NSCLC患者中显示出疗效的靶向药物，现在EGFR已被证明是NSCLC 中最常见致癌突变基因［24］。最近的美国国立综合癌症网络（National Comprehensive Cancer Network，NCCN）指南推荐将EGFR-TKI（包括第1～3代酪氨酸激酶抑制剂）作为存在EGFR突变的晚期NSCLC 患者的一线治疗方案，故早期识别驱动基因突变可协助临床医师改善患者预后，极大地提高了患者的中位生存期［25］。目前，被FDA 批准在NSCLC患者中使用的药物靶点除了最常见的靶基因EGFR外，还包括间变性淋巴瘤激酶（ALK）重排、大鼠肉瘤病毒癌基因同源物（KRAS）突变、BRAFV600E点突变、ROS1重排、METex14跳跃突变、RET重排和NTRK1/2/3基因融合，靶向这些目标的酪氨酸激酶抑制剂也显示出很好疗效［26］。但超过75%的NSCLC 患者靶向治疗的预后并不理想，迫切需要一种非侵入性的方法来准确识别驱动基因突变并预测患者对靶向治疗的反应［27］。

3.2 靶向治疗的生物标志物——EGFR的预测

已有研究证明，磨玻璃成分的存在、支气管充气征、胸膜回缩、血管集束征、毛刺征是NSCLC 患者EGFR突变的重要危险因素［28］，因此CT 可作为EGFR突变的非侵入性预测方式［29］。然而，依靠放射科医师肉眼评估特征是主观的，缺乏一定的标准。影像组学的发展使医学影像进入了自动提取和分析影像特征的时代，能够最大限度地完善预测模型。一项研究从201 例晚期肺腺癌患者的增强扫描及平扫CT图像中共提取396个特征，分析对比数据发现在预测EGFR突变时两者均展示出良好的结果，且CT 增强扫描影像组学特征优于非增强CT，这是由于对比剂的使用更好地显示了肿瘤与周围组织的关系及血管［30］。多项研究表明，临床和影像特征联合模型比仅影像组学特征的模型具有更好的性能［31-32］，而Cheng等［33］在用636 例磨玻璃样早期肺癌影像组学特征构建模型预测EGFR突变状态时，发现单纯影像组学模型与加入临床特征的模型性能相当，这可能与试验设计差异有关。一项包含478 例原发性肺癌的研究从CT 图像中提取了212 个肿瘤内特征及186 个瘤周特征构建预测模型，结果证实其性能远高于单纯瘤内特征构建的模型［34］，给非侵入性预测EGFR突变状态提供了新思路。此外，不同的EGFR突变亚型对酪氨酸激酶抑制剂的反应不同，与外显子21 的L858R突变相比，外显子19 缺失突变的NSCLC 患者的无进展生存期和总生存期更长，而其他突变患者的预后相对较差，因而在疾病早期准确识别EGFR突变亚型非常必要［35］。在应用第1、2代酪氨酸激酶治疗EGFR突变的晚期NSCLC 时，大多数患者会出现耐药性，而其耐药机制主要源于EGFR外显子20中T790M突变阻碍药物结合EGFR的ATP 结合位点［36］。有学者应用CT、MRI 影像组学特征预测T790M后续发展［37-38］，这对NSCLC患者的临床决策和预后有影响。

人工智能技术的发展给影像组学注入了新的生机，Feng 等［39］从168 例NSCLC 患者CT 图像中提取1 409 个影像组学特征使用单个和集成分类器构建模型预测EGFR突变状态，结果发现其可提高模型的准确率和鲁棒性。通过深度学习方法提取肿瘤特征建立预测模型，并与影像组学模型、临床模型对比融合，证实基于深度学习或影像组学特征的模型均可很好地预测EGFR表达状态［40］，而结合了这2 个特征的模型性能更好。另外，结合了深度学习、影像组学和临床特征的多任务人工智能系统在预测EGFR状态和特定基因型方面显示出令人满意的结果［41］，融合模型的出现对优化EGFR突变预测模型具有深远的影响。与常规基于肿瘤的深度学习方法相比，全自动人工智能系统通过获得全肺信息来预测EGFR基因型并识别具有耐药高风险患者，其性能更优越，这表明基因型和预后信息可从整个肺部获得而不仅是肿瘤组织［42］。

基于MRI 的影像组学能很好地预测EGFR突变状态，Wang 等［43］首次使用MRI 影像组学预测肺腺癌患者EGFR突变状态，结果发现ADC 和DWI 模型略优于T2WI模型，且与单序列模型相比，多序列模型的预测性能进一步提高。在肺腺癌脑转移患者中，MRI影像组学也发挥了强大的预测能力。一项研究发现基于MRI 的脑转移影像组学特征有助于预测肺腺癌的EGFR突变状态，特别是使用T2-FLAIR 影像组学特征模型的AUC 达到0.987［44］。骨骼是肺癌转移的另一个常见部位，用MRI 影像组学来预测肺癌骨转移患者EGFR状态的模型也已经被研究［45］。此外，许多研究已证明PET/CT 在预测肺癌生物标志物方面的价值［46］。Huang 等［47］比较了影像组学和深度学习在基于PET/CT 图像预测肺癌患者EGFR突变状态方面的表现，结果发现深度学习优于影像组学模型，且结合了有统计学意义的临床特征（吸烟）和深度学习特征的混合模型性能更好。还有研究者基于PET、CT 及PET-CT 融合图像的建立深度学习模型来预测EGFR突变，结果发现基于融合图像模型的AUC更高［48］。

3.3 靶向治疗的生物标志物——其他基因的预测

与EGFR类似，准确识别ALK重排有助于临床决策。有研究开发了一种影像基因组学分类器评估实体肺腺癌中ALK重排状态，结果表明CT 增强扫描效果更好［49］。而基于CT 图像和临床特征的影像组学模型比仅基于临床信息或CT 图像的模型AUC 更高［50］，另一项添加了临床特征和常规CT 特征的影像组学模型在预测肺腺癌患者ALK突变时也显示了更好的性能［51］。也有研究设计了结合CT 图像和临床信息的深度学习模型来预测NSCLC 患者的ALK融合状态，以及其对ALK酪氨酸激酶抑制剂的治疗反应，这些模型均具有良好的性能［52］。此外，利用MRI 和PET/CT 影像组学模型预测ALK重排的研究也显示出很大的价值［53-54］。

除EGFR、ALK之外，尚有研究基于影像组学特征开发了用于预测KRAS基因突变的影像组学评分模型，结果表明PET/CT 影像组学模型的AUC 高于CT 模型，且整合了EGFR突变信息的影像组学评分模型性能更好［55］。人工智能不断发展促使研究者基于CT、PET/CT 图像开发了许多可进行多种基因预测的影像组学和深度学习模型［56-57］。另外，近期一项研究开发了基于CT 图像的多标签多任务深度学习系统，是第1个同时分析10种分子（EGFR，ALK，ERBB2，BRAF，MET，ROS1，RET，KRAS，TP53和PD-L1）表达的深度学习系统，对多基因同时进行评估反映了更真实的临床场景，为精准医疗的发展提供了新思路［58］。

总之，影像组学和人工智能技术在预测免疫及靶向治疗生物标志物上应用广泛，多种利用CT、MRI、PET 图像建立的影像组学和深度学习模型均展示了不错的预测性能，可非侵入性识别免疫或靶向治疗获益的患者，这将有助于肺癌患者的临床决策。研究存在的局限性：①多为单中心、回顾性研究且研究数量有限，模型存在一定的偏倚且缺乏广泛而有效的外部验证，因而其准确性及普遍适用性得不到确切保证；②NSCLC 患者多有多种基因突变，而当前联合预测生物标志物的研究仍较少，模型的准确性面临挑战；③影像组学模型的建立有很多步骤，从图像采集、分割到重建过程中缺乏一定的标准化程序，且每次扫描的切片厚度、给药剂量和管电压等参数各异，均导致影像组学生物标志物缺乏可重复性，使得模型的预测功能不稳定；④一些机器学习和深度学习算法因缺乏对预测过程的解释而被视为“黑匣子”，无法取得临床医师和患者的信任。因此，未来的研究应扩大样本量，纳入多中心数据及联合预测多种生物标志物来提高模型的准确性，且构建的模型需在前瞻性研究中得到进一步验证；由于影像组学生物标志物缺乏可重复性及人工智能算法的难解释性，短时间内人工智能的应用仍需监督，在临床实践中真正应用其预测生物标志物还需进行更多的研究，未来可建立生物标志物的预测数据库使更多患者获利。