人工智能在胃癌影像学中的应用进展

2022-11-21刘波刘菲周冠知张登云王鹤翔王赫张群张坚

磁共振成像 2022年6期

刘波，刘菲，周冠知，张登云，王鹤翔，王赫，张群，张坚*

作为最常见的癌症之一，胃癌的死亡率位列我国癌症相关死因的第四名[1]。大约20%的进展期患者在接受根治手术后1 年内复发[2]。中国临床肿瘤学会(Chinese Society of Clinical Oncology，CSCO)胃癌指南[3]推荐使用的超声内镜(endoscopic ultrasound，EUS)、MRI、计算机断层扫描(computed tomography，CT)、正电子发射计算机断层显像(positron emission tomography computer tomography，PET-CT)等影像学检查在胃癌的临床诊断、疗效评估及预后预测等领域发挥着重要作用。但是，传统影像学检查反映肿瘤异质性的生物学信息明显不足，其主要关注病变的形态、大小及强化特征，且诊断准确率为40.8%～98.1%不等[4-6]。随着胃癌个体化诊疗的发展，迫切需要更准确、经济、无创的评估方法。近十年来，人工智能(artificial intelligence，AI)技术发展迅速。基于AI技术的影像组学和深度学习技术，正是医工学科交叉的产物，该技术能够突破常规影像学依靠视觉进行主观判断的局限，将影像图像转换为海量可挖掘的数据特征，客观量化地表现肿瘤内的异质性和微环境。AI技术在胃癌的临床诊疗及预后预测研究中已展现出了巨大的优势，是目前学术研究的热点[7]。因此，本文着重介绍基于AI技术的胃癌影像学研究中的方法框架及研究进展。

1 研究方法

1.1 获取数据

由于不同成像方式、机器协议等原因，原始图像均带有不可避免的异质性，为了减少这种干扰，就需要对图像进行预处理。预处理图像最常用的两种技术为图像归一化和重采样。具体而言，图像归一化技术是将原始图像转换为统一的标准格式，减少各组图像之间的差异[8-9]。重采样技术则是通过提升或降低像素采样将原始图像转换为目标尺寸[10-13]，现今，图像预处理技术已成为基于AI技术的胃癌影像学研究的常规步骤。临床病理特征在基于AI技术的模型构建中也发挥着重要作用，这些因素包括患者年龄、性别、体质量指数、癌胚抗原(carcinoembryonic antigen，CEA)、糖类抗原199 (carbohydrate antigen 199，CA199)、糖类抗原724 (carbohydrate antigen 724，CA724)、肿瘤位置、肿瘤大小和TNM分期等，可通过结合上述临床特征改善模型性能[10,11,14]。

1.2 分割病灶

对于感兴趣区(rregion of interests，ROI)的分割可使用人工、半自动或全自动三种方法。其中，人工分割通常由影像科医生手工勾画病灶的三维/二维(3D/2D)边界生成ROI。Wang 等[15]手动勾画完整肿瘤生成3D ROI，以此构建影像组学模型预测胃腺癌的组织分型，其在内部验证组中AUC 为0.904。Dong等[10]通过勾画肿瘤最大截面生成2D ROI，构建深度学习模型以预测进展期胃癌的淋巴结转移状态，其在4 组外部验证组的C 指数为0.777～0.817。此外，Zhang 等[13]通过在CT 图像勾画生成2D ROI，基于18 层残差卷积神经网络(convolutional neural network，CNN)算法构建深度学习模型，预测进展期胃癌患者的术后复发与总生存期，在内部和外部验证组中的AUC 分别为0.826 和0.806。由于不同影像科医师对肿瘤边界的主观判断可能存在差异，因此需要多位医师在不同时间点进行勾画，以评估同一医师和不同医师间的勾画差异性。通常计算组内和组间相关系数(intra- and interclass correlation coefficients，ICC)来评估特征的稳定性和复现性[12,14,16]。与人工分割相比，半自动分割技术可大大降低工作量，其通常包括两个步骤：先由影像科医生勾画几个标记点，然后自动分割程序根据标记点自动识别并生成ROI。多项研究通过使用这种方法取得了令人满意的实验结果，模型的AUC为0.630～0.940[15,17-18]，并采用计算机软件(Frontier、Syngo via、Siemens Healthcare 等软件中的一种)应用二分法半自动区分正常与病变区域。全自动分割需要构建自动识别的CNN算法，对于计算机技术要求较高，现应用于前列腺癌、神经疾病等领域[19-21]，胃癌相关研究仍处于探索阶段，Zhang 等[22]构建了可自动勾画病灶的3D深度学习网络，该算法具有良好的病灶分割和淋巴结分类能力，AUC为0.837～0.860。Li等[23]构建了新型可自动分割病灶的3D 金字塔网络(3D improved feature pyramidal network，3D IFPN)，其性能优于现有的其他自动分割算法。无论是全自动或半自动分割技术，都较人工手动勾画节省大量的人力与时间，并且应用标准化的计算机算法可以提高病灶分割的复现性。当未来AI 模型应用于临床实践时，将有利于提升模型应用的泛化性与工作效率。并且，随着计算机算法的发展，自动分割技术将更加成熟与稳定，相信该技术未来将在基于AI 技术将在胃癌影像学研究中发挥愈发重要的作用。

1.3 提取特征

分割病灶生成ROI后，可以通过特征提取软件计算出定量的影像组学特征。常规影像组学特征可以分类为一阶统计量特征、形状特征、纹理特征。一阶统计量特征用于表现ROI 中体素强度的分布，但不包含体素间的空间关系；形状特征用于表现ROI的几何特性，如：直径、体积、致密度和偏心度等；纹理特征用于表现空间中体素分布情况。不同于常规影像组学特征，深度学习特征来自深度学习神经网络算法，该技术将影像图片编码为特征图，从中提取肉眼无法发现的信息。Gao等[24]基于快速区域CNN算法建模预测胃周淋巴结转移状态，其AUC和准确度为0.954 和78.0%。Zhang 等[13]结合3 种常规影像组学特征、6 种深度学习特征和临床因素构建列线图，用于预测胃癌患者的术后早期复发，在内部和外部验证组中AUC 分别为0.826 和0.806。常规的影像组学特征表现了ROI 的形态、强度和纹理，而深度学习神经网络可以从图像中直接提取像素相关特征。因此，结合常规影像组学特征和深度学习特征，可以获得更高维度的数据以提高模型效能。

1.4 选择特征

最常用的特征选择方法分为包裹式、过滤式、嵌入式。在这些方法中，包裹式(如回归特征消除、顺序特征选择算法等)是在保证模型获得最佳性能的同时，通过多次训练模型以提取特征子集。不同于包裹式，过滤式(如相关性分析、方差分析等)是较简单的特征选择方法，其根据数据的相关性筛选特征[25-27]。包裹式和过滤式经常会被结合使用以提高特征选择的能力。通过结合Pearson 相关性分析和序列浮动前向选择(sequential floating forward selection，SFFS)算法，Yang 等[27]选取肿瘤和淋巴结的常规影像组学特征建模，该模型取得了满意的预测性能。嵌入式是将分类器算法的训练和特征选择过程结合，然而在患者数量较少、组学特征很多时，该方法易出现过拟合，此时可应用正则化来避免。LASSO(least absolute shrinkage and selection operator)回归是一种经典且应用广泛的嵌入式算法[11,16]，通过构造惩罚函数不断减少特征，因此应用该算法可以构建简单而有效的数个特征组成的模型。在研究过程中，各特征选择方法并非孤立，通过合理的结合可以获得效能最佳的特征集合。

1.5 构建模型

关于模型构建，Logistic 回归模型(如：多因素Logistic回归分析、LASSO 回归算法)已广泛应用在基于AI 技术的胃癌研究中[28-29]。支持向量机(support vector machine，SVM)和随机森林算法也是构建模型常用的机器学习分类器方法[10,12,30]。在一项多中心研究中，Dong等[10]构建了结合深度学习特征、常规影像组学特征和临床特征的AI 模型，应用多种建模方法包括SVM、CNN、随机森林、Spearman 相关性分析、Logistic 回归分析和线性回归分析等算法并进行性能比较，其中基于SVM 算法构建的模型产生了较佳的预测效能。现今，在基于AI 技术的胃癌影像学研究中，普遍通过结合多种算法和组学特征旨在构建性能最佳的预测模型，其相应算法亦是该研究最合适的建模方法，然而哪种是最佳的建模方法尚无定论。

2 临床应用

2.1 诊断

TNM 分期系统是胃癌诊疗中最权威且应用最广泛的分期系统，临床诊疗过程中可应用CT和MRI检查对胃癌诊断、分期与评估[31-32]。CT 检查扫描时间短，受胃肠道蠕动影响较小，目前在胃癌临床诊疗方面应用比较广泛，大多数研究都应用CT图像对病理TNM分期进行术前预测[10,12,6]。由于淋巴结常发生炎性反应而肿大，传统影像学检查存在淋巴结评估困难的问题。胃癌相关的淋巴结多位于腹膜后，穿刺活检较困难，因此无创地评估淋巴结转移情况成为预测TNM分期的难点[4]。既往多数研究旨在区分N (+)和N (-)[12,16,33]，也有部分研究旨在区分特定的N分期(N0～N3)[9-10]。上述研究基于常规影像组学特征、深度学习特征的模型，在验证组中的AUC 范围是0.760～0.890[10,12,16]。对于T 分期的预测，既往有多项研究旨在区分T1/T2 和T3/T4 分期[18,33-34]、T3 和T4a 分期[35-37]，较少研究对T1～T4各分期进行区分[17]，各研究构建的模型均产生良好的预测效果，在验证组中的AUC 范围是0.820～0.910。对于M 分期，Liu等[38]基于进展期胃癌的静脉期CT图像建模以预测隐匿性腹膜转移，该研究的影像组学模型(AUC=0.724)性能略逊于临床模型(AUC=0.762)，该研究对后续的组学研究有一定的参考价值，也从侧面说明临床特征和影像科医师的主观评估在临床实践中的重要性。由于MRI检查采集时间长，患者消化道蠕动、呼吸和患者运动引起的运动伪影会随之加重，因此其在胃癌患者中的应用较少[39]。既往也有多项研究应用MRI图像通过勾画胃癌完整病灶，利用表观扩散系数(apparent diffusion coefficient，ADC)分析，预测胃癌T、N 分期，AUC 约为0.80，但未验证模型性能[25,40-41]。Chen 等[42]提取了基于MRI 的ADC、常规影像组学特征构建预测N 分期的模型，其中由影像组学特征、ADC 值、影像医师评估的N 分期组成的列线图取得了最佳预测性能。该研究利用双中心数据，进行内、外部验证，列线图在验证组中AUC 为0.860～0.880。相信随着成像技术的不断进步，MRI在胃癌的影像组学研究中将发挥出愈发重要的应用价值。

关于术前预测胃癌的组织病理学状态，既往多项研究基于AI 技术建模预测胃癌的组织分化程度[26,43]、Lauren 分型[15,26,44]、淋巴血管和神经侵犯[14]等，均取得了良好的预测效能。其中Zhang等[43]基于MRI的ADC直方图分析建模预测胃癌的组织分化程度，各ADC 分组的AUC 范围为0.550～0.680，该研究首次将MRI的完整肿瘤的ADC分析应用于胃癌研究，具有一定的开拓意义。除预测常规病理特征以外，Gao等[11]基于CT构建影像组学模型评估一种新兴的生物标志物——肿瘤浸润调节性T (tumor-infiltrating regulatory T，TITreg)细胞的富集程度，并取得了良好的预测效果，各模型AUC为0.847～0.884。此外，还有多项研究构建模型预测胃癌患者的人类表皮受体-2 (human epidermal receptor-2，HER-2)表达状态，可无创地识别出适合于曲妥珠单抗靶向治疗的HER-2 阳性患者[45-46]。因此伴随着基础研究的发展，基于AI 技术的胃癌影像学研究也将延伸到更为复杂的肿瘤内部微环境状态相关方向，从而提升模型对临床结果预测的精确性及可解释性，有助于影像组学在临床上的应用和发展。

2.2 鉴别诊断

既往多项影像学研究方向为胃癌的鉴别诊断[28,47-48]。其中，通过纹理分析，Ba-Ssalamah 等[28]基于动脉期和静脉期增强CT 对腺癌、淋巴瘤和胃肠道间质瘤进行区分，误分类率为0%～10%。Feng等[47]通过结合常规影像组学特征、CT表现构建模型以区分Borrmann Ⅳ型胃癌与原发性胃淋巴瘤，验证组中AUC 为0.932。目前影像组学在胃癌与胃平滑肌肉瘤间的鉴别诊断研究鲜有报道，准确区分此类良恶性病变也具有重要的临床意义。

2.3 治疗反应和预后

新辅助化疗(neoadjuvant chemotherapy，NAC)可提高胃癌患者根治性切除率和生存获益[49]，广泛应用于进展期胃癌的Ⅲ期及以上的患者中。然而，NAC的实际效果存在个体差异性，约有至少20%接受NAC 的患者无法明显获益，徒增经济负担并延误手术时机[50]。因此，在新辅助治疗前识别NAC有效者对于患者的诊疗决策至关重要。既往多项研究基于CT 构建影像组学模型预测NAC 治疗无效者模型的AUC 为0.650～0.820[29-30,51]，其中Sun等[30]的研究结果证明影像组学模型的预测效能优于临床模型。术后化疗和放疗是进展期胃癌患者最主要的两种术后治疗方案。既往多项研究建模预测患者的化疗效果及预后[8,52-53]。其中，Jiang 等[8]基于CT 的影像组学模型提示具有较高影像组学评分的Ⅱ期和Ⅲ期胃癌患者对化疗反应较好并进行生存分析，结果显示影像组学模型预测性能优于TNM分期系统。除此以外，Jiang等[53]基于PET-CT构建了影像组学分数(radiomics score，Rad-score)，发现化疗敏感者分数较高。Klaassen等[52]通过勾画食管胃结合部癌患者的肝转移灶，构建CT 影像组学模型来预测对化疗反应良好的患者，在验证组中模型的AUC为0.650～0.790。Hou等[54]基于CT图像建模以区分发生腹腔转移后对放疗敏感的患者，其预测精准度为0.714～0.816。CSCO 指南[3]推荐对于可耐受同步放化疗的患者，尽可能同步治疗，目前胃癌的影像组学研究预测接受同步放化疗患者治疗效果的研究鲜有报道。随着影像组学与肿瘤学结合的发展，相信AI 技术与胃癌临床诊疗应用价值的结合将更加深入。

预后是胃癌研究的重点，更是基于AI 技术的胃癌影像学研究的重点，既往多项研究表明常规影像组学和深度学习特征与胃癌预后之间存在密切关联[8,13,18]。大部分研究均使用CT 图像作为数据来源[11,13,30]，也有研究应用PET-CT 图像提取影像组学特征，以预测患者辅助治疗效果及生存预后[53]。早期影像组学研究仅基于影像纹理特征构建预后预测模型[45,55]，随着影像组学及深度学习技术的发展，已有多项研究通过联合常规影像组学、深度学习特征及临床特征建模，预测胃癌患者的总生存期、无病生存期和早期复发，并取得了良好的预测效能[11,13,18]。除此以外，既往多项影像组学研究预测与预后相关的临床和病理学特征，例如TITreg 细胞、脉管癌栓、不良病理组织学分级、肿瘤免疫微环境和对NAC 反应程度，进而预测生存、预后相关指标[11,14,17,30,56]。基于AI 的影像组学研究在胃癌的预后预测中表现出广泛的应用价值，为了将影像组学生物标志物真正应用于临床诊疗，还需进行国际性大样本和多中心研究进一步验证相关模型及特征的稳定性及泛化性。

3 未来的挑战与展望

常规影像组学特征和深度学习特征在胃癌的诊断、鉴别诊断、治疗和预后方面具有较大的应用价值。与CT 相比，MRI在胃癌临床诊疗过程中应用较少，也造成了MRI在基于AI技术的胃癌影像组学研究中成果较为稀缺，相信未来随着成像技术的发展，MRI在临床实践中也将得到更为广泛的使用，进而推动基于MRI的影像组学研究的进展。MRI对软组织病变有着更佳的分辨效果，MRI图像可能包含更多的肿瘤内部异质性特征，可能会提高模型预测准确性。因此，未来的研究应进一步开展基于MRI 的胃癌影像组学研究，通过结合更先进的组学特征和建模算法，提升预测模型性能。在临床实践中，患者由于各种原因可能行多种影像学检查明确病情，未来可同时联合提取多种影像学检查的组学特征建模，也许会提升预测性能。淋巴结转移状况是治疗前和术后评估的重要组成部分。许多研究开发了基于AI 技术的影像组学预测模型，包括预测淋巴结是否转移和特定的N 分期。然而，目前还没有针对某个特定淋巴结的研究，这需要外科、病理科、影像科的通力协作，将术前影像中肿大的淋巴结和术后相同解剖位置的淋巴结病理结果相对应，严格统一研究对象的金标准。我们建议未来的研究可以将重点放在预测严格基于病理相关性的单个淋巴结转移状态。此外，鲜有研究分析影像组学特征与临床病理表现之间的原理性问题，这需要更深入的基础研究、计算机研究共同探索其中分子、通路层面的机制。

既往通过分析77项肿瘤影像组学研究，Park等[57]提出当前影像组学研究的整体科研方法学质控不足。AI技术应用在胃癌研究的图像采集、分割、特征提取、特征选择、模型构建到模型性能评估的每个过程都出现了不同程度的问题。在这种情况下，遵守严格的放射组学质量评分(the radiomics quality score，RQS)[58]和预后或诊断相关的临床预测模型的TRIPOD(the Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis，TRIPOD)指南[59]可以提高研究的可信度。此外，在未来的研究中，建议进行国际性多中心的前瞻性研究以建立更全面的数据库。未来还应继续积极开展提升AI 技术在临床研究中算法性能的研究，这将依托于开发更先进的算法框架。而且，考虑到AI 技术在分析高通量信息方面的强大能力，现研究的临床特征多局限于常规临床病理特征，未来研究可考虑结合基因组学[60-62]、蛋白质组学[63]等，通过多组学研究实现更深入的精准医疗目的。总之，我们希望所有科学研究成果能够将基于AI技术的胃癌影像学研究从探索阶段转变为常规临床应用阶段，并真正可以使患者获益。