应用人工智能方法构建直肠癌影像学相关预测模型的研究现状

2023-05-10张天帅彭智颖贾航温镕博周乐其沈浮于冠宇张卫

结直肠肛门外科 2023年5期

张天帅，彭智颖，贾航，温镕博，周乐其，沈浮，于冠宇△，张卫△

1 海军军医大学第一附属医院（上海长海医院）肛肠外科上海 200433

2 海军军医大学第一附属医院（上海长海医院）影像医学科上海 200433

结直肠癌（colorectal cancer，CRC）的发病率在恶性肿瘤谱中排名前列[1]。目前，直肠癌的临床治疗趋向“精准医疗”，而面对多样化的治疗方式，若是能够早期明确产生治疗应答的潜在患病个体将有助于实现临床获益最大化。此外，对患者治疗后生存状态的评估结果也影响着临床治疗决策的制定与实施。因此，建立稳健的、准确率高的预测模型将有助于优化直肠癌的临床诊疗。

影像学评估是直肠癌临床诊疗过程中必不可少的环节之一，临床医师可结合自身的诊疗经验与专业知识进行阅片判断，并将影像蕴含的特征信息用于辅助临床诊疗。然而，人工阅片耗时长、效率低，临床医师的诊疗经验、对影像学资料的个人理解及视觉对图像的分辨能力等多种因素可能会影响影像学资料的应用价值[2]。

随着科技的发展，具有图像信息处理优势的人工智能方法已成功应用于肿瘤的影像学分析，使得高通量影像数据可通过计算分析挖掘得出以往难以获得的肿瘤异质性信息，进而构建预测模型，对患者的生存预后、治疗效果等进行预测，使影像学资料得以采用一种新的方式加以应用[3]。

1 预测模型的构建

影像学相关预测模型的构建过程包括选取、收集数据及应用人工智能方法进行数据分析、完成模型构建。高质量、大样本的影像数据是构建预测模型的基础，也是模型的预测价值的决定性因素，通过影像组学、深度学习及二者结合等方法处理、分析影像数据是构建预测模型的主要内容[4]。此外，可添加患者其他的临床资料以使预测模型的数据类型更加完善，以提高预测模型的准确性。

1.1 模型数据来源

临床诊疗过程中用于评估患者病情的影像数据是构建预测模型所需的底层数据，而临床中影像学检查的普遍应用为预测模型的构建提供了丰富的数据来源，使其具有加以挖掘的现实意义。美国国立综合癌症网络（National Comprehensive Cancer Network，NCCN）指南认为，直肠癌患者需要在手术治疗之前、辅助治疗前后及随访期间进行胸部CT、腹部CT/MRI及盆腔MRI检查，以评估肿瘤分期、评估疗效及监测肿瘤状态[5]。此外，部分诊疗中心会对直肠癌患者进行更为精细的直肠高分辨率MRI 检查，也有应用PET/CT来评估肿瘤转移状态的临床实践。

在众多影像数据来源中，最常用于构建直肠癌相关预测模型的影像学检查项目是MRI。Liu 等[6]通过影像组学方法分析直肠癌患者直肠部位的MRI 影像数据，结合临床资料构建了直肠癌同时性远处转移的预测模型（列线图），建立用于预测的评分系统，并在验证集中体现出良好的预测效能（AUC为0.827，95%CI为0.696 3～0.958 0；敏感度为72.2%，特异度为94.4%）。

腹部CT也可作为影像数据来源用于构建转移性结直肠癌相关预测模型。Dercle 等[7]收集来自两项临床研究共1 584 例患者的腹部CT 图像进行影像组学分析，筛选出肿瘤体积、肿瘤体积改变量及肿瘤空间异质性改变这三种图像特征用于预测转移性结直肠癌患者的总生存期（overall survival，OS），为早期预测患者的OS提供了具有良好效能的工具。

此外，Lovinfosse等[8]在对86例局部进展期直肠癌患者的预后信息进行分析的过程中将PET/CT影像数据与临床资料相结合，构建Cox比例风险回归模型，结果表明粗糙度（coarseness）这一影像学纹理特征是疾病特异生存期（disease-specific survival，DSS）（HR＝7.06，95%CI为1.29～38.7，P＝0.024）、无病生存期（disease-free survival，DFS）（HR＝11.19，95%CI为3.13～40，P＝0.000 2）的独立影响因素，而且粗糙度更高的患者的DSS与DFS均更短（DSS与DFS的数据分析设置了不同的截断值），显示出PET/CT影像数据用于预测患者预后的良好效能。

1.2 模型构建方法

人工智能方法是构建预测模型过程中的常用方法，此类方法不仅具有处理高通量数据的优势，还可通过具体算法将既往临床医师视觉评估产生的定性判断转化为经数据处理后的定量判断，对不同图像之间的差异进行细化比较[9]。此类方法主要通过感兴趣区域（region of interest，ROI）提取、图像特征提取、图像特征建模这三个阶段完成模型构建。各阶段的实现方式不同，普遍应用的方法包括影像组学、深度学习和基于深度学习的影像组学（deep learning-based radiomics，DLR）这三种。

影像组学的处理过程通常先由影像学科专家划分ROI，从中提取包括病灶形态特征、病灶灰度特征及病灶纹理特征在内的图像特征，之后应用支持向量机（support vector machines，SVM）、决策树（decision tree、DT）及随机森林（random forest，RF）等机器学习方法筛选出最具显著性的特征，并与其他临床资料相结合，共同构建预测模型[10]。Liu 等[11]对222例接受新辅助放化疗的局部进展期直肠癌患者在新辅助放化疗前1周内及术后1周内的MRI图像进行影像组学分析，通过影像学科专家勾画ROI 及影像图像特征提取分析，构建了包含有30 个影像学特征的具有良好区分度的新辅助放化疗病理完全缓解率预测模型；此外，基于影像学特征及肿瘤大小所建立的个体化影像学模型在验证集（n＝70）中显示出良好的区分度和校准度。然而，影像组学分析过程中通常需要由影像学科专家人工勾画ROI，这给拟用于构建预测模型的样本量大小带来限制，并导致该方法耗时较长、效率较低。

深度学习作为另一种基于高通量影像数据构建预测模型的人工智能方法则具有自主识别分析的优势，此方法在图像处理方面得到了广泛应用[12]。深度学习的工作模式与临床医师颇为相似，即读取图像、深入分析并最终得出结论。与影像组学方法不同，深度学习通常应用卷积神经网络（convolutional neural network，CNN）等高阶方法进行图像分析，通过如末梢感受器般的滤波器接收大量的、多样化的影像数据，传递至计算模块后进行对比卷积，挖掘其重复特征或隐藏特征，并以类似传出神经的作用方式输出图像特征，以此构成如神经网络一般的数据处理体系。CNN 的特点在于既可接受无标记的影像数据应用无监督学习方法进行分析，又可应用监督学习方法分析标记后的影像数据，体现了CNN处理数据的优势。Filitto 等[13]通过直肠癌患者（n＝39）的盆腔MRI 影像数据构建了预测新辅助放化疗敏感性的模型并获得了良好的模型评估结果，对肿瘤退缩程度为0～1级和2～3级的患者的预测准确率分别为（0.70±0.05）与（0.84±0.05）；此外，研究者分析得出应用自动勾画ROI 的方法所构建模型的预测效能优于Li 等[14]应用不同的单一算法（Logistic 回归、DT、K 近邻）所构建模型的预测效能，表明自动勾画ROI 的方法具有提高直肠肿瘤图像勾画效率的应用潜能。但是，此类无监督学习方法需要大量数据作为模型训练集的底层数据，以构建准确度较高的ROI 自动勾画模型，之后才能进入图像特征分析及预测模型构建阶段。

相比之下，监督学习方法更适用于样本量有限的条件下的预测模型构建，通过人工勾画ROI 进行图像分析同样可以很大程度获得具有深度学习图像特征的预测模型。监督学习方法结合了影像组学方法及深度学习方法的不同环节，形成了DLR，该方法仅将深度学习作为一种图像分析方法，仍由富有经验的影像学科专家进行ROI 勾画，虽然人工勾画ROI的研究样本量相对有限且耗时费力，但是更精准的勾画联合深度学习的图像分析使模型的预测效能大大提高。Liu等[15]对235例在新辅助放化疗+手术治疗后具有3年随访信息的局部进展期直肠癌患者的资料进行分析，通过人工勾画MRI 图像ROI 后应用深度学习方法构建了直肠癌远处转移的预测模型，并在验证集中体现出其对3年远处转移的良好预测效能（C-index ＝0.747，AUC＝0.894），研究者进一步联合深度学习影像学特征与临床病理资料构建得到了具有更优的预测效能的列线图（C-index ＝0.775）。Zhang 等[16]的研究由两名影像学科专家对383 例直肠癌患者的MRI 图像勾画ROI 并应用深度学习方法提取图像特征，构建了关于新辅助放化疗敏感性的预测模型，该模型对患者新辅助放化疗病理完全缓解率的预测效能（AUC＝0.99）优于两名影像学科专家的评估结果（AUC分别为0.66、0.72），错误率（2.2%）低于两名影像学科专家的评估结果数值（错误率分别为26.9%、24.8%），体现了DLR方法应用于构建直肠癌相关预测模型的可靠性。

1.3 多组学联合构建

对于应用人工智能方法构建直肠癌相关预测模型，患者的影像数据仅是构建预测模型的底层数据来源之一，通过高通量方法处理其他类型数据形成的组学分析也可与之结合，使预测模型更加完善、准确，比如病理学图像数据。病理图像同样具有大量的图像特征，而机器学习可利用其图像处理能力挖掘病理图像的显著的图像特征，将其纳入预测模型的构建过程。Wang 等[17]构建的结直肠癌肺转移患者接受根治性肺切除术后OS及DFS的预测模型中纳入了机器学习病理组学、影像组学、免疫评分和患者的临床资料等信息，结果显示在模型的预测效能方面，联合信息的应用优于单一信息的应用。这表明在构建预测模型的过程中可以通过增加预测模型来源数据的类型、联合多组学构建等方式优化预测模型，以提升临床信息的利用效能。

2 预测模型的应用

2.1 预测生存预后

肿瘤患者的生存预后是临床关注的重要指标，不同病情的患者呈现出差异化的生存预后，故而有效预测生存预后将有助于为临床决策的制定提供参考依据。影像学检查是评估患者病情的重要手段，基于影像数据进行生存预后预测具有较高的临床应用价值。

Tibermacine 等[18]应用影像组学方法分析两组互相独立的接受新辅助治疗（FOLFIRINOX 联合放疗）的148例局部进展期直肠癌患者MRI影像资料，通过2D 图像手工勾画、3D 图像手工勾画及2D 图像辅助边界框这三种方法获得ROI，之后从中自动提取并筛选肿瘤图像体积、图像纹理及图像灰度等影像学特征，最终完成预测模型的构建，并在验证集中发现这三种模型对DFS 的预测效能良好，AUC分别为（0.73±0.06）、（0.67±0.09）、（0.73±0.18），其后进一步与肿瘤消退等级（MRI tumor regression grade，mrTRG）这一临床常用的新辅助放化疗疗效评估指标进行对比并验证了该预测模型的有效性。在影像组学预测生存预后的应用中，还可计算评估多种影像组学特征的综合评分进行预测模型构建，苏日新等[19]对109例直肠癌患者的盆腔MRI图像进行ROI勾画后提取出1 656个影像学特征，进而通过特征分析筛选和多变量线性加权法计算出综合评分（Radsscore），并应用该评分与肿瘤分化程度、T 分期、癌胚抗原水平和体素内不相干运动弥散加权成像（intravoxel incoherent motion diffusion weighted imaging，IVIM-DWI）灌注分数（f值）联合构建形成可评估1 年或2 年DFS 的列线图，获得了C-index 为0.816 的良好预测效能。孟闫凯等[20]对比了MRI 平扫图像与增强图像的影像组学标签对直肠癌患者生存期的预测价值差异，通过应用51 例直肠癌患者平扫轴面小视野（field of view，FOV）的T2 加权成像（T2-weighted imaging，T2WI）及动态增强序列静脉期图像分别构建DFS 预测模型，最终得出增强序列应用12 个影像组学特征构建的预测模型的C-index（训练集为0.904；验证集为0.700）优于平扫序列的相应结果（训练集为0.771；验证集为0.500，且与DFS 无联系，P＝0.767 0），提示增强序列图像在影像组学预测直肠癌患者生存预后的应用中更具优势。

2.2 预测疗效

临床中另一关注点是治疗方案的疗效预测，通过对不同疗效的患者的临床病理资料进行分类总结，有条件者亦可建立评估/预测体系，进而用于治疗前的患者筛选，有助于为患者提供个体化诊疗。人工智能方法同样可应用于患者的影像学资料分析，为疗效预测提供参考依据。

Giannini等[21]应用52例局部进展期直肠癌患者的18FFDG PET/CT及MRI图像资料构建新辅助放化疗疗效预测模型，通过软件勾画联合影像学科专家叠加PET/CT和MRI图像的半自动方法完成ROI勾画，并提取ROI中肿瘤图像体积、图像纹理及图像灰度等影像学特征进行分析与预测模型构建，通过多参数分析得出的由6项影像学图像特征（5项PET/CT图像特征，1项MRI图像特征）所构建的预测模型在预测病理完全缓解率方面的预测效能最佳（AUC为0.86，敏感度为86%，特异度为83%）。Feng等[22]应用影像组学与病理组学联合构建了局部进展期直肠癌患者新辅助放化疗病理完全缓解率的预测模型，收集了933例患者的MRI影像数据、细胞核病理学特征及肿瘤微环境病理学特征这三个方面的资料，通过SVM构建了以MRI特征图像、细胞核病理学特征图像及肿瘤微环境病理学特征图像为基础的预测模型，在验证集中显示出了良好的预测效能（AUC＝0.812，95%CI为0.717～0.907；敏感度为0.888，95%CI为0.728～0.999；特异度为0.740，95%CI为0.593～0.886），这是多组学联合构建预测模型的应用实践，研究者认为此模型可作为一种稳定、准确的工具用于患者的个体化诊治。朱洁等[23]应用99例局部进展期直肠癌患者的MRI T2WI图像提取的11个高价值影像组学特征同样展现出了良好的预测效能，其所建立的模型预测病理完全缓解率的AUC为0.798（95%CI为0.615～0.920），可用于指导临床决策。目前，国内已围绕影像组学方法分析多模态MRI图像进行直肠癌新辅助治疗效果评估的应用形成专家共识[24]。

2.3 预测远处转移

直肠癌有无发生远处转移是临床医师实施临床诊疗期间与随访过程中重点关注的问题之一，而发生远处转移意味着患者的预后较差，而且可能会影响患者后续的诊疗计划。应用人工智能方法构建基于影像学检查的直肠癌相关预测模型也可用于预测肿瘤发生远处转移的概率。

Liu 等[25]基于临床对局部进展期直肠癌患者术后施行辅助化疗以预防肿瘤发生远处转移的治疗方案，应用629例患者的MRI图像数据进行影像组学分析，以无远处转移生存（distant metastasis free survival，DMFS）情况作为主要观察指标，通过手工勾画ROI后分析图像特征，并应用Cox比例风险回归分析方法进行特征图像筛选，之后使用LASSO 回归算法确定用于构建预测模型的图像特征，并在不同随访时间点（1 年、2 年、3 年）的训练集与验证集资料中体现出了良好的预测效能。但是，如何提高预测模型的临床应用价值仍是该研究方向的关注点，亦有研究者进行了相应的探索。刘明璐等[26]应用127例直肠癌患者高分辨T2WI 图像提取出5 个与肝转移相关的影像组学特征，但其单独应用的预测效能（AUC＝0.836）弱于影像组学特征联合癌胚抗原、糖链抗原199构建的列线图（AUC＝0.918），因此研究者认为结合影像组学特征和临床危险因素的影像组学列线图预测直肠癌同时性肝转移的临床价值更高。胡斯娴等[27]应用140例直肠癌患者的MRI不同序列的图像构建了预测模型，并进一步评估其在直肠癌肝转移方面的临床应用价值，结果表明多序列联合（T2WI、弥散加权成像和表观弥散系数）数据集与独立T2WI数据集、独立表观弥散系数数据集都具有较理想的AUC，而多序列联合数据集校准曲线最接近参考线，模型效果最好。

3 预测模型的局限性

应用人工智能方法构建直肠癌影像学相关预测模型可为临床诊疗的实施提供参考依据，但是就目前来说，这些预测模型在临床中的应用存在一些局限性。

（1）应用研究范围受限。该方法构建得出的预测模型距真正意义上的临床应用仍有一定距离。在预测模型的构建阶段，出于对研究开展的可行性与临床研究伦理要求的考虑，训练集与预测集的大部分数据源于回顾性收集所得的患者既往诊疗过程中留存的影像数据，其研究方法多为回顾性分析。然而，在前瞻性研究中验证并优化预测模型才能使模型预测效能得以提高。其中，需要明确的是应用尚未完善的预测模型得出的预测结果不能干扰临床诊疗，这是开展前瞻性研究需遵守的科研伦理规范。

（2）结果同一性偏低。影像数据可因仪器设备不同而产生较大差异，人工勾画ROI 也会因个人经验差异而对预测模型的构建产生较大影响，而且不同的数据分析算法也会对模型的构建产生根本性的影响，即便同一预测模型也可能在不同研究中心的应用中产生较大的预测效能差异。

（3）生物学本质欠缺。影像数据为肿瘤表观层面异质性分析，其在预测模型中展现的更多是图像特征而非生物学特征，以此为数据来源产生的预测模型变量多为体积、灰度、粗糙度等图像特征，这使得图像差异而非病情差异成为影响预测结果的主要因素。

4 小结与展望

影像组学、深度学习等人工智能方法在构建直肠癌影像学相关预测模型的应用中发挥了重要作用，并成功应用于患者的生存预后预测、疗效预测和肿瘤转移风险预测等方面。这使得原本“一次性使用”的影像数据得以反复应用于预测模型的训练—优化过程，更重要的是为临床医师提供了以往难以获取的预测信息。但是，关于这些预测模型在临床中的应用还需要进一步优化，如：探索符合伦理要求的预测模型前瞻性临床应用途径，设置与诊疗无关的研究人员进行数据采集、结果判读等前瞻性模型验证与优化，同时要求诊疗过程中不得仅以预测模型生成结果作为诊疗依据，以使其更加贴合临床诊疗所需；建立预测模型的质量控制标准与建立多中心、高质量的影像数据库，以更好筛选数据并实现数据的深度挖掘；对于预测模型结果的分析与讨论则可以通过多组学分析结合的方式进行，避免仅进行单纯的数据拟合而忽略其生物学本质。相信随着人工智能方法在临床应用中的不断成熟、优化，其将不断助力临床诊疗的发展与革新，影像学资料将得以采用更多的方法加以利用并构建高效稳定的直肠癌相关预测模型，为临床诊疗提供更有价值的参考依据，助力诊疗模式精准化。

利益冲突声明全体作者均声明不存在与本文相关的利益冲突。