人工智能在肾癌诊疗中的运用及展望
2021-04-17陈思腾郑军华
陈思腾, 郑军华
精准医学时代的到来为临床医学的发展提供了更多先进的研究手段。精准医学之所以在癌症研究中举足轻重,主要的原因就在于它可以根据个体肿瘤的特征,为患者匹配相应的治疗并预测其治疗效果。人工智能(artificial intelligence)作为计算机科学的一个分支,通过模拟人类智能的算法,使用以深度学习(deep learning)为代表的智能算法对医学大数据资源进行挖掘、提取和拟合,以提高临床诊疗的精准度和有效性,正逐步渗透到精准医学的研究领域[1-3]。人工智能与医学研究相结合是生物医学领域研究的重点方向之一,尤其是肿瘤影像组学(radiomics)和病理组学(pathomics)的运用,恰好为临床医师的诊疗提供了更加精准的辅助手段[4-5]。近年来在肾癌的研究领域,人工智能得到了快速发展,并取得了丰硕的成果。作为异质性极高的恶性肿瘤,肾癌的病理类型多样,患者的治疗效果和临床预后也存在着明显的个体化差异。人工智能基于个体化医学大数据的方法和技术恰好能为肾癌的个体化诊疗提供重要的支持。本文就人工智能近年来在肾癌诊疗中的研究和初步运用进行综述,以期为广大同行提供参考和新的启发。
1 人工智能在肾癌基因组学、转录组学研究中的运用
高通量测序是近年来高速发展的一项重要技术。以美国癌症基因组图谱计划(the Cancer Genome Atlas,TCGA)为代表的多中心、大型癌症基因组项目为肾癌基因组学、转录组学的研究奠定了重要基础[6-7]。Wang等[8]利用TCGA数据库中1 020例肾细胞癌患者和复旦大学上海癌症中心129例肾癌患者的测序及定量聚合酶链式反应(polymerase chain reaction,PCR)数据,通过机器学习算法开发并验证了基于44个关键基因的肾癌分类模型,精准识别肾癌亚型。通过机器学习算法开发的糖酵解相关肾癌基因标签有望成为肾癌的有效生物标志物[9]。此外,基于多组学数据的人工智能分析也有助于鉴定出新的肾癌特异性表观遗传特征,为肾癌发生机制和治疗靶点的进一步探索提供新的思路[10]。临床上,1/3的肾癌患者发现时已经出现远处转移,1/4接受根治性肾切除术的肾癌患者也会出现复发转移[11-12]。基于高通量测序数据,人工智能逐步被用于开发肾癌预后相关的临床模型。氧化还原在肾脏肿瘤的发生、发展中起着至关重要的作用,有研究者利用机器学习的方法基于氧化还原相关长链非编码RNA构建了肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)生存预测模型,可有效预测ccRCC患者的临床预后情况[13]。N6-腺苷酸甲基化(N6-methyladenosine,m6A)修饰是真核细胞中最重要的基因转录后修饰之一,目前已被证实与多种恶性肿瘤的发生、发展密切相关[14-15]。国内学者利用转录组测序数据和机器学习算法,基于7个m6A甲基化调控关键基因构建了ccRCC预后预测模型,可以准确地识别术后存在生存高危风险的肾癌患者。结合病理特征,该智能预测模型对肾癌患者术后1年、3年、5年的生存预测准确率可以达到85.2%、82.4%和78.3%[16]。此外,基于机器学习的多组学智能分析可有效预测肾乳头状细胞癌的分期,并为早期癌症的筛查提供一种新的思路[17]。
2 人工智能在肾癌影像组学研究中的运用
临床上超过一半的肾脏肿瘤为恶性病变,仍有25%~40%的肿瘤性质为良性,包括血管平滑肌、肾纤维瘤、囊肿等[18]。如何准确、快速地鉴别肾脏良、恶性肿瘤目前仍是临床上面临的一个重要问题。病理检测一直是鉴别良、恶性肿瘤的金标准,但是病理活检存在有创性、种植转移风险等弊端。此外,对于微小肾脏肿瘤的病理活检亦不易进行。影像学检查作为临床上最常见的无创性检查,可辅助医师实现对肿瘤病变的初步评估。但是目前这些检查尚缺乏定量标准,且在肾癌的临床诊断、治疗和预后评估方面受限于影像学方法的局限性、肿瘤组织的影像表现及诊断医师的经验。影像组学的概念于2012年由荷兰学者首次提出,其利用特征提取和人工智能技术,构建对医学影像大数据进行定量分析和预测的有效方法。影像组学试图对肿瘤宏观影像特征与微观基因、蛋白质和分子改变建立一种分析模型,通过修改网络的结构可从数据中学习得到更具有针对性的特征,结合神经网络算法的特点,形成基于深度学习网络的影像组学算法[19]。相比于传统病理化验及荧光原位杂交等昂贵、费时的检查,影像组学可以通过非侵入性的三维方式捕获肿瘤内异质性,实现无创分子分型[20],并优化术前治疗策略[21],为肾癌的临床诊断、疗效评估和生存预测等提供便捷的指导。国外学者将计算机辅助检查与人工智能相结合,构建了肾癌自动深度特征分类模型,利用CT影像可以对肾细胞癌和血管平滑肌瘤进行自动鉴别,准确率达到76%[22]。Feng等[23]采用支持向量机(support vector machine,SVM)联合递归特征消除的方法评估CT图像的定量纹理特征,构建了识别分类器,实现了对无可见脂性成分小血管平滑肌脂肪瘤与肾细胞癌的鉴别诊断,准确率最高可达93.9%。Erdim等[24]基于随机森林算法对肾脏CT图像进行纹理分析并构建肾脏良、恶性肿瘤分类器,其受试者工作特征曲线(receiver operating characteristic curve,ROC)的曲线下面积(area under curve,AUC)可达90.5%。此外,对小肾脏肿瘤CT图像上的纹理特征进行机器学习对比分析后发现,平扫图像上的影像组学特征可能优于增强图像,有望在提高小肾癌诊断准确性的同时降低患者检查时所接受的CT辐射剂量[25]。肾细胞癌的病理类型多样,包括ccRCC、肾乳头状细胞癌、肾嫌色细胞癌、肾嗜酸性细胞瘤等,且不同类型的肾细胞癌预后差异较大,使得临床上对肾癌不同亚型病变的准确鉴别显得格外重要。多项研究表明,肾脏皮质期影像纹理特征更有助于肾癌不同病理类型的分型诊断[26-28]。由于ccRCC预后较其他亚型的肾癌更差,所以非侵入性地鉴别ccRCC在临床实践中显得更加重要[29]。Kocak等[27]利用卷积神经网络(convolutional neural networks,CNN)在一个94例肾癌患者组成的队列中构建了基于CT影像的ccRCC识别模型,对ccRCC的鉴别表现良好。Sun等[30]也构建了基于机器学习算法的诊断模型,并进行了10倍交叉验证,证实了该模型从肾乳头状细胞癌和肾嫌色细胞癌中区分ccRCC的准确率达89.8%。然而,基于随机森林算法的MRI影像组学模型对于ccRCC的诊断准确率仅为77.9%[31]。此外,Pedersen等[32]基于CNN构建了非侵入性CT成像模型,可高效地识别肾嗜酸性细胞瘤,准确率可达90.0%~93.3%。而基于SVM算法的监督学习也可以实现对肾脏皮质期、髓质期与排泄期纹理的差异特征分析,指导临床医师更好地鉴别肾嫌色细胞癌和肾嗜酸性细胞瘤[33]。Fuhrman核分级系统是目前肾癌最常用的肿瘤分级方法,但是目前只能通过术后病理或穿刺病理活检进行评估。此外,该方法需要观察者同时评估细胞核大小、形状和核仁特征,因此很大程度上受限于观察者的经验和观察视野的选择。人工智能结合CT影像的纹理分析可实现对不同Fuhrman分级的ccRCC的无创性鉴别,AUC可达82.6%~84.3%[34]。此外,Coy等[35]发现肾癌分级与CT影像的强化程度呈负相关,这可能是由于Fuhrman分级与肿瘤内微血管密度的相关性导致的,为影像组学的无创性分类诊断运用提供了一定的理论基础。Shu等[36]则基于机器学习算法构建了影像组学模型来评估肾癌世界卫生组织国际泌尿病理学会(International Society of Urological Pathology,ISUP)分级系统,AUC可达到90.1%~97.6%,有望成为肾癌可靠的无创预后预测指标。此外,基于MRI图像的机器学习模型识别肾癌ISUP级别的AUC仅为71%~74%[37],提示我们可能基于CT图像的影像组学分析更有利于预测肾癌核分级。
3 人工智能在肾癌病理组学研究中的运用
传统的病理学检查是由病理医师借助显微镜通过肉眼观察组织或细胞形态上的改变,再根据自身经验作出病理学的诊断,但往往都是定性或者半定量的诊断结果。更加精准、便捷的病理诊断有赖于“新型”病理学技术的开展。病理组学的概念是近几年逐渐兴起的新型深度学习模式。组织结构中的像差是癌症诊断和肿瘤分级的重要指标。因此,异常表型特征的提取和组织学分类可以为计算机辅助病理学提供重要参考数据。2018年发表的一项肾癌案例研究[38],利用CNN分析苏木精-伊红染色法(hematoxylin-eosin staining,HE)染色的组织学切片,研发对肿瘤深度网络分级模型和肿瘤结构的分类模型。训练集中的样本图像分为正常、脂肪、血液、基质、低度粒状肿瘤和高度透明细胞癌六类。该研究比较了深层网络和浅层网络的性能,实验表明深层网络优于浅层网络,肿瘤分级模型和肿瘤结构分类模型可应用于存活率的预测。目前已有多项研究报道了人工智能在肾癌核级分类中的运用,其中基于SVM算法的ccRCC核级分类系统结合了梯度变化和数学形态学,通过对肾脏显微图像进行整体的评估来预测肾癌的Fuhrman分级,准确率高于90%,为促进肾癌病理组学的研究提供了良好的思路[39]。Holdbrook等[40]开发的核级分类系统则聚焦于肾癌中核仁的病理形态表现,可准确区分高、低级别的肾细胞癌。病理图像中的细胞核形态对于癌症的诊断和预后预测起着非常重要的作用。国内学者基于HE染色病理图像,创新性地运用机器学习的方法,开发并验证了一种基于机器学习的ccRCC人工智能生存预测模型,识别术后高风险患者,为临床医师的术后辅助治疗决策提供了有效的指导意见[41]。Cheng等[42]从病理图像中提取肾癌细胞核的拓扑特征,构建了肾乳头状细胞癌预后预测模型,通过不同形态细胞的空间分布来探究潜在的预后生物标志物。基于病理图像的联合组学研究也在肾癌中陆续开展,进一步地探究肿瘤形态学和基因组学特征之间的关系。国内学者对肾癌全切片病理图像中提取的细胞形态学特征与基因组数据中提取的共表达特征基因进行关联分析,利用病理组学和基因组学联合的双组学数据构建智能模型来预测ccRCC患者的生存预后,显著地提高了现有模型的预后预测能力[43]。而基于交叉模态特征的整合框架则利用神经网络从病理图像中提取深度特征,并与功能基因组数据相结合,构建ccRCC预后模型,可以显著区分高、低风险的肾癌患者,一致性指数高达0.808[44]。基于机器学习的肾癌病理组学分析还有望进一步预测免疫反应、细胞外基质重建和细胞代谢等生物学功能,为组织病理学和蛋白质组学的整合分析提供了新的见解[45]。
4 不足及展望
尽管人工智能技术在肾癌的诊疗中已经得到大量的研究和初步的运用,但是现有的研究还存在以下几点不足:(1)当前研究主要聚焦于肾癌的诊断以及简单的临床预后预测,针对肾癌靶向治疗、肿瘤免疫治疗等疗效预测的影像组学和病理组学研究还未涉及;(2)目前所发表的肾癌影像组学研究更多涉及CT图像,关于肾癌MRI影像组学分析则少有报道;(3)当前的报道多为单中心研究的结果,可能存在病例数量过少、数据偏倚等缺陷。靶向治疗是治疗晚期肾癌的主要方式。其中舒尼替尼作为晚期或者进展性肾癌患者的一线治疗用药,能够显著缩减肿瘤体积并改善患者预后。但晚期肾癌患者对舒尼替尼的客观反应率只有40%左右,甚至后期还可能出现耐药和疾病进展,给患者家庭和社会带来沉重的负担[46-47]。所以,关于肾癌靶向药效评价的生物标志物以及患者的选择性一直是该领域的研究重点。随着研究的进一步深入,人工智能技术有望在肾癌靶向药效评价方面开创一条新的道路。未来仍需开展大规模、多中心研究进一步验证人工智能在肾癌诊疗领域中的应用价值。