影像组学在肾细胞癌中的应用现况和进展
2022-11-23蒋婷婷综述王旭审校
蒋婷婷 综述 王旭 审校
肾细胞癌(renal cell carcinoma,RCC)是一种常见的泌尿系统恶性肿瘤,且其检出率随着检查技术的进步逐年增加,国际癌症组织(International Agency for Research on Cancer,IARC)的最新数据显示,2020 年国内的肾癌发病人数为661345,发病率为4.8/10 万[1]。CT 和MRI 是RCC 早期诊断及评估中常用的影像检查方法,其中MRI 在评估不确定性囊性肿块、局部侵犯和血管扩张方面优于CT[2]。然而,RCC 的影像学诊断很大程度上依赖于放射科医生对影像数据的主观判定,在与部分良性肾肿瘤的鉴别及其预后预测等方面仍然是一个挑战。目前临床上急需探索出更加准确、高效的方法,用于肿瘤术前诊断及疗效预测。影像组学应用高通量的方法将医学图像转换为定量、可挖掘、高维的数据,包括颜色、纹理和形状分析[3,4]。与传统影像学检查相比,影像组学能够帮助医生通过人工智能(artificial intelligence,AI)方法来提取肉眼无法识别的定量特征,从而提高疾病诊断及预后预测的准确性。近年来,随着AI 在医学领域的快速发展,影像组学在RCC 中的应用也逐渐增多,本文旨在对影像组学在RCC 中的应用现况和进展作综述一篇。
影像组学流程
目前影像组学主要的工作流程包括:(1)数据采集;(2)图像分割;(3)提取及量化特征;(4)建模及分析等。数据采集时,需对获取的图像进行标准化处理。图像分割是是图像分析的第一步,将病灶作为兴趣区(region of interest,ROI)进行勾画,包括手动、半自动和全自动三种分割方法。然后对ROI 进行特征提取。提取的特征包括:一阶直方图特征、二阶特征及高阶特征等。最后进行建模和分析,通常将数据分为训练组和测试组,对训练组常用的建模方法有逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、K-最邻近(K-nearest neighbour,KNN)及决策树(decision tree,DT)等。在模型评价方面,目前大多研究应用受试者工作特征曲线(receiver operating characteristic,ROC)并计算曲线下面积(area under curve,AUC)作为定量评估模型效能的指标[5],AUC 越接近于1 说明模型效能越好。
近年来深度学习(deep learning,DL)模型在医学成像领域迅速发展,是机器学习(machine learning,ML)的一个分支,主要模型有人工神经网络(artificial neural network,ANN)和卷积神经网络(convolutional neural network,CNN)这两种,其特征提取并不依靠人工,而是机器自动提取的,可直接处理图像数据并建立分类模型。相较于传统的建模方式,可提高影像组学的工作效率[6,7]。
影像组学在肾细胞癌中的应用
1.良恶性鉴别
RCC 最常见的亚型依次为肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)、乳头状肾细胞癌(papillary renal cell carcinoma,pRCC)和嫌色细胞癌(chromophobe cell carcinoma,chrRCC)[8]。值得注意的是,部分或根治性肾切除术后,约30%肾肿瘤术后病理结果为良性[9]。乏脂型血管平滑肌脂肪瘤(fat-poor angiomyolipoma,fp-AML)及嗜酸细胞腺瘤(renal oncocytoma,RO)是常见的肾良性肿瘤,但在影像学上易被误诊为RCC[10]。不同类型肾肿瘤的治疗选择和预后存在差异,因此,术前鉴别肾肿瘤的病理类型具有重要的临床意义。
以往一些学者对fp-AML 和RCC 患者进行CT纹理分析(CT texture anaylsis,CTTA),发现CTTA在区分fp-AML 和RCC 方面也有较好的预测效果[11-13]。此外,Ma 等[14]不仅发现影像组学模型鉴别诊断能力优于常规CT 图像,且还发现基于平扫CT 图像的模型AUC 值高于皮髓质期及排泄期CT 图像模型。然而,这些研究仅仅局限于区分fp-AML 和RCC,在区分其他良性肿瘤(如RO)的价值仍不清楚。相较于之前研究,Deng 等[15]增加了RO组患者,通过CTTA 比较RCC 与良性肾肿瘤之间区别,发现RCC 的精细空间滤波熵明显高于良性肿瘤。Yu 等[16]评估了CTTA在区分RO和RCC亚型方面的作用,ML模型区分ccRCC 和RO、pRCC 与RO 的能力较好,AUC 分别为0.93 和0.99。Erdim等[17]使用8 种ML 算法,构建了基于CT 增强影像的良恶性肾肿块鉴别诊断预测模型,其中RF 模型准确度和AUC 最高,分别为91.7%和0.916。其他研究则使用了DL 模型,如CNN 可以准确分类chrRCC和RO,同时与最终病理结果相比,敏感度也达到100%[18]。综上所述,影像组学在肾肿瘤良恶性鉴别方面的研究已较为成熟,随着深度学习的不断创新发展及更大样本量的临床验证,未来影像组学技术将成为鉴别肾肿块良恶性的一种新型影像工具。
2.病理亚型分类
RCC 患者中ccRCC 占70%,pRCC 占10%~15%,chrRCC 占5%,且ccRCC 恶性程度最高、预后较差,出现转移风险更高[19]。大多数ccRCC 动脉期表现出显著强化,根据其强化方式可与非ccRCC 鉴别,但pRCC 与chrRCC 影像表现存在重叠,鉴别较为困难。Leng 等[20]基于CT 增强图像的影像组学特征对ccRCC、pRCC 及AML 进行异质性评分,结果显示ccRCC 异质性更高。另外,Wang等[21]探讨基于MRI 影像组学模型是否可区分ccRCC、pRCC 和chrRCC,结果表明根 据 多序列MRI 提取的特征可以对RCC 病理亚型进行鉴别。
近年来机器学习和深度学习快速发展,可从图像数据中自动提取和分析直方图、纹理和形状特征,避免手动勾画的局限性。Han 等[22]纳入169 例RCC 患者通过训练深度学习神经网络模型来预测RCC 亚型的性能,组合出3 种分类模型,其敏感度、特异度、准确度和AUC 分别为0.64~0.98、0.83~0.93、0.84~0.88、0.87~0.93。Sun 等[23]比较了ML 模型和放射科专家对254 例RCC、26 例fp-AML 和10 例RO 的诊断能力,结果显示机器学习模型在区分肾肿块病理类型方面优于放射科专家;ccRCC 具有较低的均匀性和最大值、较高的相关性信息量度,显示出其高异质性的生物学特性。同样,Xi 等[24]基于MRI 开发了一种深度学习模型以区分良性肾肿瘤和RCC 亚型,并将其与四位放射科专家进行比较,结果显示深度学习模型表现出更高的准确度、敏感度和特异度。因此,从CT、MRI 图像中提取的影像组学特征可有效帮助发现肉眼眼无法识别的差异,有助于区分组织学亚型,定制精准治疗方案。然而目前面临的问题是样本量较少且缺少相关罕见RCC 亚型的研究。
3.病理分级预测
病理分级是RCC 侵袭性和预后的独立预测因子,与RCC 转移的发生率密切相关。因此,在治疗前评估RCC 分级很大程度上有助于预后风险评估。过往RCC 病理核分级应用最广泛的是Fuhrman 分级系统。由于穿刺活检在实际应用中的局限性,通过无创的影像学方法评估RCC 的病理分级具有重要的临床价值。
Ding等[25]比较了基于增强CT图像的非纹理特征和纹理特征模型预测高级别(Fuhrman Ⅲ~Ⅳ)和低级别(Fuhrman Ⅰ~Ⅱ)ccRCC,采用LR 构建训练组预测模型,结果显示基于纹理特征模型(有或无非纹理特征)预测性能优于其他模型(P<0.05)。Goyal 等[26]研究发现MRI 纹理特征在区分ccRCC和非ccRCC 以及ccRCC 病理分级中的表现出较好的诊断性能。
由于Fuhrman 分级系统存在一定的局限性,2016 版WHO 肾脏肿瘤新分类提出新的病理分级标准,称为WHO/国际泌尿病理学会(International Society of Urological Pathology,ISUP)病理分级[27]。近年来多数学者采用新的分级标准,通过提取CT平扫或增强图像的纹理特征建立预测模型,发现其对预测ccRCC 病理分级有较高诊断效能[28-31],其中Zhou 等[31]发现联合影像组学特征和临床特征的模型具有更好的预测性能。Dwivedi 等[32]基于MRI 构建影像组学模型用来预测高级别ccRCC及肿瘤性坏死,提示影像组学模型在预测ccRCC的高级别组织学方面优于单纯肿瘤大小。Cui 等[33]研究表明基于MRI 和CT 图像的机器学习模型是区分高、低级别ccRCC 的可靠预测因子,其中基于全序列MR 序列和全期相CT 图像的机器学习模型在ccRCC 分级中可能优于基于单独序列或单独期相CT 图像的模型,并进行了外部验证。影像组学在术前鉴别RCC 病理分级方面有一定的价值,且基于多期相图像时,准确度较高。另外,基于MRI 图像的影像模型的诊断性能优势甚微(相较于CT),可能的原因是样本量偏小。
4.TNM 分期
TNM 分期与RCC 患者的预后存在密切关系,如果RCC 出现转移被认为是预后不良。但传统影像检查对肾窦及肾包膜是否侵犯的灵敏度较低,导致部分患者TNM 分期准确性欠佳。Demirjian等[34]除了进行核型分级预测,还增加了病理分期的评估,研究结果证实基于多期增强CT 图像的机器学习模型可区分ccRCC 的组织学分级和TNM分期,其AUC 值分别为0.70、0.80。Yaar 等[35]回顾分析了77 例RCC 患者,使用CTTA 研究其组织学亚型、Fuhrman 分级和TNM 分期的相关性,结果表明灰度不均匀性和游程长度不均匀性参数在低级别和低分期肿瘤中显著降低。Hussain 等[36]在深度神经网络框架中提出了一种可学习的图像直方图,这种新方法可在不同强度谱中分离RCC的CT 纹理特征,从而有效地对RCC 进行TNM 分期及病理分级,其分期和分级的准确率分别为83%和80%。
此外,肾包膜浸润是区分T2和T3分期的重要因 素[37]。Yang等[38]基于CT平扫及增强图像构建五种不同的机器学习分类器在126 例RCC 患者中应用,结果显示影像组学特征与RCC 的肾包膜浸润有一定的相关性,特别是皮髓质期肿瘤的特征可预测肾包膜浸润。上述研究部分证实基于对比增强图像模型预测效果更好,然而部分研究发现基于非增强图像模型亦有较好的结果,这个问题未来还需要扩大样本量研究。
5.治疗反应评估及疗效预测
在常规的临床实践中,影像学检查常被用于评估患者的治疗反应及疗效预测,但对于转移性RCC(mRCC)患者的治疗反应评估复杂,可能会出现影像学假性进展,导致许多患者过度治疗,然而基于可测量病灶大小的治疗反应评估标准目前已达到极限[39]。因此,基于影像组学探索新的生物标志物用于评估治疗反应及疗效预测具有一定的临床意义。
氟胸嘧啶(fluorothymidine)是常用于细胞增殖和相关治疗效果成像的PET 示踪剂,一项前瞻性研究显示,综合FLT-PET/MRI 影像组学分析晚期mRCC 的治疗反应,结果表明T2WI 和ADC 影像学特征可捕捉到解剖结构的亚视觉变化,从而量化了舒尼替尼治疗后肿瘤显微结构的变化[40]。Khene 等[41]使用KNN、RF、LR 和SVM 算法构建影像组学模型用来预测mRCC 纳武单抗的治疗反应,模型的准确度为71%~91%,AUC 为0.67~0.92;其中LR 模型的准确度和AUC 值最高。Haider等[42]基于CTTA 评估了舒尼替尼治疗后ccRCC 患者的无进展生存期(progression free survival,PFS)和总生存期(overall survival,OS),发现标准化标准差(normalized standard deviation,nSD)和熵是OS的预测因子,同时nSD 也是PFS 的预测因子;该研究还发现通过结合nSD 与国际mRCC 数据库模型(International Metastatic Renal-Cell Carcinoma Database Consortium Model,IMDC)对OS 的预测效能优于单独使用IMDC。Ming 等[43]基于影像组学、临床病理和术前CT 特征联合的列线图表模型预测ccRCC 患者的无病生存期和OS 方面价值,发现影像组学特征与无病生存期(disease-free survival,DFS)和OS 独立相关,该模型在预测OS 及DFS 的C 指数分别为0.943、0.825,可准确进行预后和生存分析。Huang 等[44]研究提示联合CT 增强图像特征和潜在的基因组学特征构建模型助于对ccRCC患者进行全面的预后评估。由此可见近年的研究已从单纯鉴别肿瘤类型转为预测肿瘤疗效的方向,但多数研究仅处于初始阶段,缺乏大量临床验证,未来影像组学研究是否可作为早期肿瘤治疗的反应性指标还需探索。
6.影像基因组学
近年来相关研究显示,可通过影像组学预测肿瘤的基因状态(包括基因序列、基因表达等),部分肿瘤细胞的基因表达异质性是导致疾病进展和预后差异的根本原因[45-47]。Kocak 等[48]纳入161例ccRCC患者(74例伴PBRM1突变,87例不伴PBRM1突变),通过比较机器学习和RF 两种算法预测ccRCC PBRMl 突变潜力,结果显示两种模型均有较好的预测性能,且RF 模型的性能优于机器学习。Kocak等[49]另一项研究基于机器学习模型对65 例ccRCC(13 例伴BAP1 突变,52 例不伴BAP1 突变)进行CTTA,其构建的RF 模型的诊断符合率为84.6%、AUC为0.897。Yin 等[50]基于PET/MRI 联合影像组学可作为ccRCC 患者ccA 和ccB 分子亚型疾病风险的替代生物标志物,其模型对ccA 与ccB 亚型的分类诊断符合率达86.96%~95.65%。Li 等[51]研究发现大多RCC 亚型的影像特征与VHL 基因突变相关,还强调了当影像特征能够反映RCC 的潜在分子基础时,影像组学模型可以更加准确性和可解释性。仅通过影像学特征能够反映RCC潜在分子基础。Gao 等[52]通过TCGA数据库构建了基因组学特征、通过TCIA-KIRC 数据库构建了缺氧基因相关影像基因组学生物标志物,发现在TCGA 数据库中,由5 个基因(IFT57、PABPN1、RNF10、RNF19B和UBE2T)组成的缺氧基因组学特征与ccRCC 患者的生存显著相关。由于生物标志物检查费用昂贵,目前文献较少,接下来可以发现更多未知的影像基因组学生物标志物,从而提升影像组学模型对临床结果预测的精确性及可解释性。
问题与展望
尽管影像组学在医学领域的研究很多,但其临床实际应用仍面临很多挑战:(1)标准化:临床对于研究设计、影像组学方法、特征提取和检查设备及参数等缺乏统一标准,导致研究结果可重复性差;(2)样本量:目前RCC 影像组学研究样本量偏小,且为回顾性分析,缺乏外部验证,尚需大样本量的多中心、前瞻性研究进行验证;(3)深度学习模型虽然诊断性能较高,但存在受黑盒数据(无法解释的数据)或整个肿瘤图像以及相邻图像信息丢失影响的问题,相关流程还需进一步完善改进。如果接下来的研究中不能解决数据集异质性问题,那么影像组学从实验性研究工具转变到临床应用诊断和预测工具的将是一个挑战,因此未来研究的重点可以建立统一的医学数据库,进一步提高影像组学的准确性。
综上所述,影像组学在肾癌的应用包括良恶性鉴别、组织学亚型分类、病理分级、TNM 分期预测、治疗反应评估及疗效预测、影像基因组学等。影像组学通过建立预测模型并结合临床数据,更好地辅助临床诊断、制定治疗决策和评估患者预后。然而,影像组学和基于深度学习的影像组学仍处于初步阶段,在常规临床试验中的适用性尚未得到充分验证。面对巨大的机遇和挑战,多模态、多维度、多模式的影像组学和多组学研究未来将成为最有价值的临床研究方法,解决临床需求核心问题,以满足精准医学发展的需求。