基于磁共振成像的人工智能技术在垂体腺瘤中的应用研究现状

2022-12-05杨邱园柯腾飞杨斌

磁共振成像 2022年7期

杨邱园，柯腾飞，杨斌

垂体腺瘤（pituitary adenoma, PA）是起源于腺垂体的神经性内分泌肿瘤，约占颅内肿瘤的10%～15%，其患病率约为0.08%～0.09%[1]。近年来发病率具有上升趋势。临床上功能性PA因高水平分泌激素，导致内分泌紊乱，从而引起全身性内分泌疾病；无功能性PA（non-functioning pituitary adenomas,NFPA）由于起病隐匿，临床发现时常伴随颅内占位效应。虽然PA 为良性肿瘤，但部分肿瘤却具有高侵袭性和高复发率。临床和实验室检查以及影像检查手段在PA 的检出、诊断与鉴别诊断、评估侵袭性等方面发挥着重要作用。然而，目前的检查方法对术前诊断PA 的异质性、治疗疗效及预后预测等方面不能满足临床的诊疗要求。

随着人工智能技术在各个领域的深入研究和应用，其中影像组学和深度学习在医学影像方面取得了显著进步，且广泛运用于疾病筛查、诊断和治疗的各个环节，其在早期预测、评估、诊断神经系统疾病方面显示出巨大的价值和潜力，PA作为中枢神经系统常见肿瘤，也成为了当下的研究重点与热点。本文就影像组学和深度学习在PA 中的应用研究现状和发展面临的挑战进行综述。

1 影像组学和深度学习的概述

影像组学是一种从标准CT、MRI、PET-CT 等影像图像中高通量地挖掘定量图像特征的人工智能技术，通过提取和应用特征（包括肉眼难以识别或量化的信息）来构建模型，以提高疾病诊断、疗效评估和预后预测的准确性，主要运用于肿瘤研究[2-3]。PA 影像组学模型构建包括图像采集、肿瘤分割、特征提取及筛选、模型的构建与验证四步。

深度学习是人工智能的重要分支领域，是一种由多层人工“神经元”组成的人工神经网络，当数据输入神经网络后运用机器学习算法学习样本数据的内在规律和层次，输出预期算法结果[4]。深度学习包括两种：监督学习和无监督学习，均依赖大量的临床数据来提高预测模型的准确性，其中卷积神经网络（convolutional neural networks, CNN）被广泛运用于医学影像领域，它能够高效地对图像进行分割和分类[5-6]。

2 影像组学和深度学习在垂体腺瘤的应用现状及研究进展

目前，影像组学和深度学习在PA 的应用和研究包括以下三部分：异质性诊断、治疗疗效评估、预后预测。

2.1 垂体腺瘤异质性诊断

2.1.1 垂体腺瘤术前鉴别诊断

颅咽管瘤（craniopharyngioma, CP）与囊实性PA 具有相似的临床和影像征象，常常难以区分。Zhao等[7]基于MRI的影像组学特征和血液指标构建列线图对两者进行鉴别，18 个组学特征在5 种分类器中表现出优异的鉴别效能，其中多层感知器（multilayers perceptron, MLP）模型分类效能最佳，训练集和测试集的曲线下面积（area under the curve, AUC）分别为0.93和0.86，优于逻辑回归（logistic regression, LR）模型、岭（ridge）模型、随机梯度下降（stochastic gradient descent, SGD）模型及线性支持向量分类（linear support vector classification, Linear SVC）模型。列线图显示出良好的辨别性能（训练集和测试集的AUC 分别为0.93、0.90）。表明影像组学能有效鉴别囊实性PA和CP，为临床制订精准治疗方案提供依据，减轻患者的治疗及经济负担，提高患者预后。该研究纳入的CP 患者相对较少（71/272），且数据来源单一，相信随着数据量的增加和数据均衡性的提升，能够进一步提高模型的预测效能。

2.1.2 预测垂体腺瘤的肿瘤亚型

术前区分PA亚型具有重要的临床意义，因为不同亚型肿瘤的最佳治疗方案不同，准确预测肿瘤亚型能够实现精准医疗，避免延误治疗时机。第五版WHO垂体腺瘤分类标准将垂体特异性POU-同源结构域转录因子（pituitary transcription factor 1, Pit-1)、T-box 家族成员TBX19 转录因子（T-box transcription factor TBX19, T-pit)、类固醇生成因子1（steroidogenic factor-1, SF-1)纳入到新的分类依据中[8]。Peng 等[9]回顾性研究235 例根据转录因子进行分类的PA 患者，从冠状位T1WI（T1-weighted）、T2WI（T2-weighted）和CE-T1（contrast-enhanced T1-weighted）图像中提取、筛选的特征，运用支持向量机（support vector machin, SVM）、k-最近邻（k-nearest neighbor, k-NN）和朴素贝叶斯（naive bayes, NB）分类器建立模型预测肿瘤亚型，基于T2WI 图像特征的SVM 训练的模型表现出较高的预测效能（准确度为0.89、AUC 为0.9549），模型分类的敏感度（P=0.031）和特异度（P=0.012）存在显著差异。Zhang 等[10]基于T1WI、CE-T1 的影像组学预测NFPA 亚型，使用SVM 构建的特征模型在训练集和测试集AUC 分别为0.8314、0.8042，能够将NFPA 的空细胞腺瘤（null cell adenomas, NCA）和其他类型进行准确区分，性别和T1WI 图像特征构建的列线图在训练集和测试集有良好的校准性（一致性指数分别为0.854、0.857）；另外该研究发现CE-T1图像特征对提高模型效能无额外贡献，存在过度拟合的风险，需要进一步研究来探索其原因。随着人工智能技术的不断发展,影像组学研究正延伸至更为复杂的细胞水平结构，旨在提高预测模型的准确性，为临床制订个体化诊疗策略提供依据。

2.1.3 预测垂体腺瘤的一致性

内镜下经鼻蝶腺瘤切除是PA的首选外科术式。大部分肿瘤质地柔软（软一致性），可通过该术式充分抽吸和刮除肿瘤；然而大约10%的肿瘤呈纤维状（硬一致性），难以抽吸和刮除[11]。因此肿瘤一致性信息将有助于神经外科医生提前规划手术入路，以避免或减少肿瘤残留和潜在并发症。Cuocolo等[12]研究表明基于MRI 纹理分析提取的定量特征能够准确预测肿瘤的一致性，从89 例患者MRI 图像提取的14 个纹理特征构建的预测模型AUC 为0.99、准确度为93%、敏感度为100%、特异度为87%。Zeynalova 等[13]研究直方图分析预测一致性的潜在价值，并与MRI 图像的信号强度比（signal intensity ratio,SIR）评估进行比较，直方图分析（准确度为72.5%、AUC 为0.710）较SIR评估（准确度为74.5%、AUC为0.551）具有更高的预测效能（P=0.021）。

上述研究仅从MRI 的单一序列中提取影像特征，未能突显MRI 检查多参数、多方位扫描的优势。Wan 等[14]研究从多个MRI图像序列提取特征，运用自动三维分割肿瘤生成感兴趣体积（volume of interest, VOI），并使用随机森林（random forest, RF）和SVM 构建预测模型，结果显示联合T1WI/CE-T1/T2WI序列的特征模型预测效能最佳，AUC为0.90、准确度为87%、敏感度为83%、特异度为87%。表明影像特征模型术前预测肿瘤一致性具有可行性，且基于多参数MRI的特征具有更高的预测效能。此外，Wang 等[15]建立了一个门控形U 网（Gated-Shaped U-Net, GSU-Net）深度卷积神经网络，用于从MRI图像自动分割PA 病灶，根据自动分割的感兴趣区（region of interest,ROI）提取特征预测肿瘤一致性，模型具有良好的预测效能。自动分割ROI 具有高效、便捷、可重复性强等优点。但相较于传统手动分割肿瘤，采用自动分割方法的准确性需更多研究进一步验证。当前，单序列图像特征提取、手动分割ROI 仍是主流研究方法，开展多序列图像特征提取、自动分割ROI、多维特征模型对比是未来的发展方向，不断提高预测模型效能，进一步实现临床适用性。

2.1.4 预测肿瘤侵袭性

PA侵犯海绵窦（cavernous sinus, CS）的程度决定了不同的治疗方案。Micko 等[16]证实Knosp Ⅳ级的PA 均发生CS 侵犯，Knosp 0 级、Knosp Ⅰ级的PA 未出现CS 侵犯，而Knosp Ⅱ级和Knosp Ⅲ级PA是否发生CS侵犯不能准确判断。Niu等[17]基于MRI 的影像组学预测Knosp Ⅱ级和Knosp Ⅲ级PA 对CS是否造成侵袭，从194 例患者的CE-T1 和T2WI 图像中提取2553 个定量成像特征，采用线性SVM 构建的预测模型在训练集和测试集的AUC 分别为0.852、0.826；结合影像特征和临床影像危险因素（Knosp 分级、动脉周围增强和下外侧静脉室闭塞）的列线图AUC分别为0.899、0.871，列线图显示出良好的校准性能（P=0.664 和0.771），决策曲线分析（decision curve analysis, DCA）显示阈值概率高于20%时，列线图的预测具有较高的净收益，表明影像组学能够在术前预测Knosp Ⅱ级和Knosp Ⅲ级PA对CS的侵袭状态。Liu等[18]的研究利用动态对比增强MRI 纹理分析评估垂体大腺瘤的侵袭性，logistic 回归分析构建的模型能够准确预测垂体大腺瘤的侵袭表现，但由于该研究数据量少（n=50），未设置训练集和测试集，对预测模型的效能不可避免产生影响。上述研究表明基于MRI 的影像组学预测肿瘤的侵袭性具有可行性，能够为临床制订手术方案提供依据，提高术后生存质量，在一定程度避免术后肿瘤进展或复发。

2.1.5 预测肿瘤高增殖指数（Ki-67）

Ki-67 是评估PA 增殖潜能、侵袭性的重要分子标记，需依靠组织病理学检测[19]。但影像组学可以在术前预测Ki-67 等重要的肿瘤分子标记，实现无侵入性检查。Ugga 等[20]研究基于MRI 纹理分析预测Ki-67 指数的阳性结果准确性（Ki-67≥3%为阳性），从89例患者的T2WI图像中提取了12个关键纹理特征，k-NN 分类器构建的模型在测试组中预测的总体准确度达91.67%（33/36）。此外，Fan 等[21]也基于MRI 影像组学预测肢端肥大症患者的Ki-67指数阳性结果（≥3%为阳性），预测模型在训练集和测试集的AUC 分别为0.96、0.89，其构建列线图的AUC分别为0.94、0.91；该研究还纳入25例外院患者进行多中心模型验证，其预测准确率为88.2%。上述两项研究均表明影像组学能够在术前实现无创和实时地预测Ki-67指数结果，从而提高治疗的成功率。值得注意的是，不同临床指南提出Ki-67 指数为阳性的临界值不同，≥3%是常用的研究临界值，不同的临界值可能导致不同的模型和预测结果，未来可将＞3%作为临界值进行探索。

2.1.6 预测肿瘤肉芽形成

生长激素型PA 根据肉芽形成分为密集颗粒型（densely granulated, DG）和稀疏颗粒型（sparsely granulated, SG）。研究证实术前生长抑素受体配体（somatostatin receptor ligand, SRL）治疗能够改善生长激素型患者的手术结果，且SRL 对DG 患者疗效更佳[22-24]，因此术前区分DG 和SG 可避免医疗资源浪费，并减轻患者治疗负担。Park 等[25]从69 例患者的CE-T1 图像中提取了4 个关键纹理特征（1 个形状特征，1 个一阶特征，2 个二阶特征）构建模型，预测模型的AUC、准确度、敏感度和特异度分别为0.834、73.7%、74.0%和73.9%，预测效能明显优于定性T2 信号强度评估模型（AUC 为0.597）和T2 相对信号强度比（relative signal intensity, rSI）模型（AUC 为0.647）。Liu 等[26]研究评估基于多参数MRI 的纹理特征预测DG 和SG，49 例患者MRI 图像使用两种分割方法进行肿瘤勾画（ROI Ⅰ不包括肿瘤囊变和/或坏死区域，ROI Ⅱ涵盖整个肿瘤区域)，基于ROI Ⅰ在T1WI 图像提取的特征构建的模型具有最高的预测效能（AUC 为0.918），区分DG 和SG 的准确度为85.7%、敏感度为72.0%、特异度为100.0%、阳性预测值为100.0%、阴性预测值为77.4%，整合T1WI 和CE-T1 特征的联合预测模型AUC 为0.908，DCA 表明阈值概率为0.254～0.798 时预测模型具有更高的净获益；ROIⅡ构建的模型的预测效能均低于前者。基于MRI 影像组学可作为区分生长激素腺瘤肉芽形态的有效手段，实现无创检查。需要关注的是，上述研究数据量相对较少，未能设置测试集和外部数据验证，预测模型缺乏精准度、敏感度及临床可解释性，未来研究还需重点关注数据的丰富性、多中心性，以期提高模型的预测效能和临床实用性。

2.2 治疗疗效评估

2.2.1 手术治疗疗效预测

手术治疗是PA的首选治疗方式，过去术前预测患者的术后疗效面临重重挑战，但目前人工智能技术已应用于该领域。Fan等[27]的研究根据激素水平将侵袭性功能性PA患者术后疗效分为缓解组和非缓解组，基于MRI使用SVM构建模型预测手术患者的治疗疗效，模型在训练集和测试集的AUC分别为0.834、0.808，列线图AUC 分别为0.832、0.811。Staartjes 等[28]首次运用深度学习技术研究肿瘤经鼻蝶途径全切术的治疗疗效，使用16 个术前影像特征和程序变量训练深度神经网络，深度学习模型（AUC 为0.96）较作为金标准的Knosp 分类法（AUC 为0.87）、logistic 回归法（AUC 为0.86）预测效能均有提高。影像组学和深度学习作为人工智能的重要分支领域，在预测手术治疗疗效方面同样显示出巨大潜力。

2.2.2 药物治疗疗效预测

药物治疗是PA的二线治疗方案，但却是泌乳瘤的首选治疗。准确预测药物治疗疗效同样具有重要的临床意义。Park等[29]研究基于MRI 的影像组学早期识别泌乳素瘤患者对多巴胺激动剂（dopamine agonists, DA）的疗效，从177 例患者冠状位T2WI 中提取的影像特征使用5 种分类器（RF、梯度提升机、额外树、二次判别分析和线性判别分析）分别构建单一特征模型，最终通过软投票构建的集成分类器模型预测效能较高，在训练集AUC为0.81，在测试集AUC、准确度、敏感度和特异度分别为0.81、77.8%、78.6%、77.3%。表明影像组学模型能够预测DA治疗反应，是一种无创、高效的预测手段。但目前人工智能在该领域的研究鲜有报道，未来可进一步探索和验证。

2.2.3 放射治疗疗效预测

放疗作为肢端肥大症的治疗方式之一，能够缓解激素高分泌和肿瘤复发，但其引发的放射性损伤不容忽视，因此准确预测肿瘤放射敏感性和放疗疗效对个体化治疗策略非常重要。Fan 等[30]的另一项研究评估基于MRI 影像组学模型预测肢端肥大症患者的放疗疗效，临床特征模型的AUC为0.86，影像特征模型的AUC 为0.92，最佳临床特征和影像特征联合建立的影像组学模型的AUC为0.96，DCA表明影像组学模型具有较高的临床获益，能够准确预测放疗疗效。虽然本研究首次建立了放疗疗效预测模型，但较少的研究数据（n=57）无法建立测试集，导致预测模型具有局限性。随着定向放疗技术的发展，PA放疗疗效预测模型具有巨大的潜在临床应用价值。

2.3 预后预测

预后预测是人工智能的重要应用领域，不仅能够协助制订治疗方案，还能为预后不良患者的及早干预治疗提供依据，提高预后生活质量。Machado 等[31]评估基于MRI 的影像组学特征对NFPA 患者首次术后复发的预测价值，手动对肿瘤进行二维和三维分割，6 个二维和13 个三维影像特征差异具有统计学意义，基于二维和三维特征建立的预测模型准确度分别为92.6%和96.3%，三维特征模型较二维特征模型使用了更少的影像特征（5 vs. 8）便获得更高的预测效能。表明三维分割可以提供更丰富的定量图像特征，能够提高预测模型效能。该研究同样面临数据量少、未进行模型验证的挑战。机器学习可以自动识别与预后相关的最具预测性的临床风险因素，并使用训练数据学习复杂的风险因素间的相互关系，建立预测模型。Hollon 等[32]基于MRI 利用监督机器学习建立模型预测预后，logistic 回归模型在测试集的敏感度为68.0%、特异度为93.3%、总体准确率为87.0%。机器学习为改善PA患者预后管理提供了有效手段。此外，还有研究[33]报道基于MRI纹理分析预测经鼻蝶途径手术的NFPA 患者肿瘤复发的预后因素。临床实践中，患者预后受多重因素相互作用，需要整合更多的临床资料、影像信息，同时进行多中心合作，提高预测模型效能。

3 总结及展望

影像组学和深度学习在PA 领域进行了深入研究，在异质性诊断、疗效评估及预后预测等方面取得了一定成果，尤其异质性诊断方面，不仅充分应用多参数MRI 检查的优势提取大量影像特征，还利用深度学习、自动分割等先进人工智能技术，预测模型表现出良好的预测效能。但影像组学和深度学习技术在临床诊疗的应用中仍面临着诸多挑战与困难，包括：（1）病例数量相对较少，且大部分为回顾性、单中心研究，存在一定偏倚，缺乏外部数据的验证，对模型的稳定性和可重复性提出更大挑战；（2）大部分研究手动分割病灶，受限于肿瘤形态和操作者主观因素的影响，可重复性差且分割效率低，亦制约了该领域技术的发展；（3）工作流程缺乏标准化的操作规范，不同研究的图像参数及预处理、肿瘤分割的标准不尽相同。

为应对上述挑战，未来可能需要在以下几方面进一步探索：（1）增加研究数据量，并进行多中心合作和数据验证，以期提高预测模型的稳定性和鲁棒性；此外，可开展前瞻性研究以提高模型的准确性，目前尚未见前瞻性研究的报道；（2）提高自动分割技术的准确性，联合深度学习可进一步实现对肿瘤的快速、客观、精准分割，提高研究效率和预测的准确性；（3）建立标准化的工作流程，规范各个操作环节，以期统一该研究领域的工作流程。此外，文献调研发现影像基因组学在肺癌[34-36]、头颈部肿瘤[37]、胶质母细胞瘤[38]、胰腺癌[39]等领域进行了深入研究，但未见PA 相关的影像基因组学报道，今后可侧重于对该方向进行探索。

综上所述，影像组学和深度学习技术在PA 中具有广泛的应用前景，尤其是深度学习技术，充分利用人工智能所带来的先进技术，能够为临床提供更具科学性的诊疗策略，从而最终实现患者的个体化治疗。

作者利益冲突声明：全体作者均声明无利益冲突。