影像组学在胰腺囊性肿瘤中的应用进展
2022-12-11刘泽群孙文阁
刘泽群 孙文阁
随着影像学检查技术的不断发展,其在胰腺囊性肿瘤(pancreatic cystic neoplasm,PCN)的诊断、治疗与预后预测等多个环节中发挥的作用愈加重要。传统的影像学检查只能显示肿瘤的宏观特征,如大小、形态、对比剂增强等,而影像组学将图像转化为数据,提取肉眼无法识别的影像特征,可以反映病变的微观特征。本文旨在综述影像组学在PCN 影像学评估中的研究进展。
胰腺囊性肿瘤
PCN 是一组以胰腺囊肿或囊性变为主要表现的良性或低度恶性肿瘤,发病率仅次于胰腺癌。PCN主要包括以下四类:浆液性囊性瘤(serous cystic neoplasm,SCN)、导管内乳头状黏液瘤(intraductal papillary mucinous neoplasm,IPMN)、黏液性囊性瘤(mucinous cystic neoplasm,MCN)以及实性假乳头状瘤(solid pseudopapillary neoplasm,SPN)。其中SCN在绝大多数情况下为良性肿瘤,而IPMN、MCN和SPN为潜在恶性肿瘤。
超过2%的正常人群存在胰腺囊性病变,但其中仅有很少一部分会发展为恶性肿瘤[1]。对于具有恶性潜能的PCN,治疗以手术切除为主,而低风险PCN仅需随访观察即可。虽然胰腺手术的死亡率已显著下降,但也要避免因不必要的手术而引起的胰瘘、感染等并发症。因此,对高风险和低风险PCN 准确鉴别十分重要。
常规影像学方法如CT、MRI 对于PCN 的诊断需要细致观察肿瘤的边界、肿瘤内部结构、是否有实性成分、是否有出血、钙化、实性成分是否有对比剂强化、囊与胰腺导管是否相通、周围血管是否受侵等,同时需要结合患者的年龄、性别及临床症状,综合分析做出影像学诊断[2]。但PCN 的病理特征、表型差异比较大,影像表现多样,影像异质性较大,极易与其他胰腺肿瘤混淆,其诊断和预后判断都相对复杂。目前,准确识别高风险PCN 需要借助侵入性的病理活组织检查[3],但活检具有侵入性和局灶性的特点,活检结果并不能代表整个肿瘤的异质性,而异质性在肿瘤预后和治疗中至关重要。
影像组学
影像图像在传统的临床诊断中一直被用作主观或定性的工具,计算机和图像处理技术的发展使量化医学图像信息成为可能。影像组学目前已成为影像图像分析的一种新兴方法,其核心是将影像图像的灰度信息转换成定量的特征信息,可全面研究肿瘤表型,并评估组织异质性。影像特征是图像内在的属性,不依赖于影像学医师的主观因素及临床经验,可提供大量肉眼无法识别的图像客观信息,尽管不同疾病因具有相同的影像表现而难以鉴别,但其图像的纹理特征可能存在差异。影像组学还致力于开发预测和预后模型,以达到个性化诊断的目的。现有影像组学方法主要包括机器学习和深度学习。
1. 机器学习
基于机器学习的影像组学方法基本工作流程包括步骤:图像采集与重建;图像分割;特征提取与选择;分类与预测。
1.1 图像采集与重建
图像采集与重建等预处理步骤是影像组学分析的基础。预处理方法包括配准、颅骨剥离、去噪、偏场校正、图像不均匀性校正和强度归一化等。
1.2 图像分割
影像组学研究中的图像分割方法主要有人工分割、半自动分割和自动分割。手动分割是勾画ROI的金标准,可以准确、精细的对病变边缘进行勾画,但缺点是费事费力,画图者主观性较强,造成可重复性较低。半自动分割法是目前应用较广泛的分割方法,如区域增长法等。全自动分割是完全由计算机进行的方法,重复性良好,但此技术目前尚不成熟。ROI分割的关键在于高精度、重复性好,全自动分割应为未来发展的主要趋势。
1.3 特征提取与选择
影像组学的核心是提取高维影像特征,可以通过特定的软件如Matlab、3D Slicer 等提取医学影像图像的特征。提取的特征通常可分为以下三类。①一阶特征:基于图像信号强度和形状的特征,如最大强度、最小强度、平均值、球形度、体积、表面积等;②二阶特征:基于图像纹理的特征,如熵值、不均一性、自相关、惯性矩、聚类等;③高阶特征:经滤波分解等方式获得的特征,如小波变换和傅里叶变换等。一阶特征大多具有语义性,即可解释性,与病灶的外在表型密切相关;而二阶和高阶特征具有不可视特性,部分特征如熵值、不均一性等可解释为病灶的异质性,但大部分二阶和高阶特征只对应具体的预测模型,尚缺乏与之对应的病理学解释和临床意义[4]。
为了减少模型训练时间避免模型过度拟合,提高模型泛化能力,需对所提取的大量影像学特征进行选择或降维,减少存储空间和计算时间,消除多重共线性,有利于机器学习算法获得更好的结果。
1.4 分类和预测
分类和预测是影像组学的最终目标。目前影像组学研究中常用的诊断及分类模型主要是基于机器学习算法的模型,包括logistic 回归模型、随机森林(random forest,RF)、支持向量机(support vector machine,SVM)、套索回归模型(least absolute shrinkage and selection operatom,LASSO)和线性判别器(linear discriminant analysis,LDA)等。
2. 深度学习
近年来基于深度学习的影像组学算法受到广泛关注,它是对神经网络的进一步改进,包含了更多的计算层。它采用端到端的学习方式,省略了图像分割,特征提取与选择的过程,直接将图像直接作为模型输入,最终得到分类结果。常用的深度学习方法包括深度神经网络(deep neural network,DNN)[卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)]、深度生成网络(deep generate networks,DGN)[生成对抗网络(generative adversarial network,GAN)、堆叠自动编码器(stacked auto-encoder,SAE)、深度玻尔兹曼计算机(deep Boltzmann machine,DBM)和深度信仰网络(deep belief network,DBN)]等[5]。
但应用于医学影像领域的深度学习并没有实现全智能,它必须依赖已有的大量数据样本进行训练和测试,才能对新数据进行分析和预测,然而大量标记良好的医学影像数据不易获得,成本较高,而且很难控制它的变异性。
影像组学在PCN诊疗中的应用现状及研究进展
1. IPMN的诊断及风险分级
手术切除的PCN 中最常见的为IPMN,约占38%[6]。IPMN 为潜在恶性的胰腺肿瘤,且IPMN 逐步进展演变为胰腺癌的占所有胰腺癌构成比例的20%~30%。虽然福冈指南[3]为IPMN 患者提供了手术管理框架,但在30-70%的病例中术前诊断和术后病理是不一致的[7],现存指南的预测效能不足、缺乏准确性。而影像组学的出现与发展,为IPMN 的诊断和风险分级开拓了新的领地。
Hanania 等[8]的研究纳入了53 例IPMN 患者,其中34 例为伴有胰腺导管内腺癌(pancreatic ductal adenocarcinoma,PDAC)或高级别不典型增生,19例为低级别不典型增生,通过影像组学方法在患者术前CT 图像的病灶中提取了360 个影像特征来预测IPMN 的良恶性。结果表明灰度共生矩阵(gray level co-occurrence matrix,GLCM)特征的表现最好,预测能力最强的特征曲线下面积(area under curve,AUC)为0.82(95%置信区间0.71~0.93),灵敏度为85%,特异度为68%。当联合10个效能最好的特征进行预测时,AUC 达到了0.96(95%置信区间0.92~0.99),灵敏度为97%,特异度为88%。证明基于影像组学的模型术前预测高低风险IPMN 具有可行性且准确率较高,可为临床手术治疗等决策供更多的参考。
影像特征还可以与临床信息、基因标志物联合,以更全面地评估患者病灶,进一步提高诊断效能。在一项纳入103 例患者的研究中[9],76 例IPMN 为低风险病变,27 例为高风险病变,仅依靠临床信息,鉴别二者的AUC 为0.67,而研究者进一步通过提取术前CT 图像的纹理特征,联合临床信息共同建立预测模型,模型的诊断效能明显提高,AUC 为0.79。Permuth等[10]收集了38例经手术病理证实的IPMN患者(20 例良性,18 例恶性)的术前CT 图像,从中提取了112 个影像特征,联合血浆miRNA 基因组数据,采用logistic 回归构建模型,模型鉴别良性和恶性IPMN的AUC为0.93(95%置信区间0.85~1.00)。
2. SCN与MCN的鉴别诊断
SCN 是胰腺的良性肿瘤,生长缓慢并且恶性进展风险较低,仅在有症状时才考虑进行手术切除[11],而MCN 具有潜在恶性,即使没有症状也应该进行手术切除。SCN 与MCN 的常规影像表现类似。然而,目前临床上SCN 诊断的准确率很低,超过50%的患者接受了不必要的手术切除[12]。
胡征宇等[13]的研究纳入了两个中心共48 例SCN和34 例MCN 的CT 图像,并进行了图像滤波,结果表明不同滤波值时的偏度、滤波值为2.5 时的方差、熵值、峰度在二者间具有显著差异,AUC 介于0.56与0.84 之间,其中熵值的灵敏度最佳,提示了MCN病灶内具有更大的异质性,且影像特征可以有效地量化这种异质性。Wei等[1]的研究分析了260 例行手术切除的PCN患者的影像图像,其中102例为SCN,但术前临床医师做出正确诊断的仅31 例(30.4%),这项研究表明三分之二的SCN 患者接受了不必要的手术。因此研究者进行了影像组学预测模型的构建,将其中200例患者作为训练组,60例患者作为独立验证组,提取了385 个影像特征,并使用支持向量机分类器来构建模型,结果表明模型的AUC 为0.767,灵敏度为68.6%,特异度为70.9%,且在独立验证组中的AUC为0.837,灵敏度为66.7%,特异度为81.8%。相较于临床医师,影像组学模型的预测效能显著提高,且模型稳定性较好,可以辅助临床医师做出准确的治疗决策。
除了CT 图像,也有学者选择了MRI 图像进行探究。王波涛等[14]对24 例SCN 和20 例MCN 患者的常规T1WI和T2WI图像进行纹理分析,并联合T1WI和T2WI 纹理特征构建了logistic 模型,模型的AUC 为0.879。
3. 预测生物标志物
疾病的精准诊断,仅靠影像学是不够的。一些潜在的生物标志物已经被确定为肿瘤生物学行为的预测因子,如果将影像组学与这些标记物联系起来,将提供更准确的评估信息。
Ki-67 是一种肿瘤细胞增殖标志物,其表达情况可以反映肿瘤增殖活性,为判断肿瘤的恶性程度、预测患者预后情况提供重要依据。有学者尝试了用抽象的影像组学特征预测Ki-67 表达情况,魏然[15]等的研究纳入了87 例经手术病理证实的PCN 患者,其中IPMN 患 者59 例,MCN 患者28 例,收集平扫、动脉期、静脉期三个期相的CT 图像,从中提取了409 个特征,通过特征筛选留下20 个特征构成最优特征子集,预测Ki-67 分子标志物的AUC 达到0.91,准确率85.29%,灵敏度81.88%,特异度86.75%,证明了通过影像组学方法预测Ki-67分子标志物的可行性。
挑 战
影像组学是典型的医工交叉学科,打破了医学影像学的传统观念,且影像组学为非侵入的手段,相较于手术病理诊断病变有很大的优势。虽然影像组学研究为PCN 的诊断和预后判断提供了新的工具,但也存在着一些问题:
(1)样本数量和质量:目前影像组学在PCN 上的研究普遍是小样本量研究,多数不超过100 例,所提出的预测模型可能存在过度拟合的问题,数据质量也存在较大的差异。未来多中心联合数据库的建立与大数据的共享可为PCN 的影像组学研究提供更多前景。
(2)模型的可解释性:影像组学中的多数特征为描述病变异质性的统计术语,尚缺乏与之一一对应的病理学或生物学解释,导致其在临床运用中受限。
(3)深度学习:目前在PCN 的影像组学研究中,以机器学习研究为主,还未见PCN 影像组学深度学习研究报道,仍有待进一步的研究探索。
综上所述,影像组学基于其定量成像、特征提取和预测模型构建等方面的优势,已逐渐应用于胰腺囊性肿瘤的诊断、生物学行为评价、预后预测中,并表现出了巨大的应用前景。随着大样本、多中心、规范化影像组学研究的深入开展,影像组学在胰腺囊性肿瘤诊断与治疗中的作用必将愈发重要。