深度学习在原发性肝癌相关诊断模型中的应用与前景

2022-11-25张清华李海涛方国旭郭鹏飞刘景丰

临床肝胆病杂志 2022年1期

张清华，李海涛，方国旭，郭鹏飞，刘景丰，3

1 福建医科大学研究生院，福州350108； 2 福建医科大学孟超肝胆医院 a. 肝胆胰外科，b. 东南肝胆健康大数据研究所，福州 350025； 3 福建省肿瘤医院肝胆胰肿瘤外科，福州 350014

原发性肝癌(简称肝癌)的发病率和病死率均居所有肿瘤的前5位[1]，是男性癌症相关死亡的第2大原因，女性癌症死亡的第6大原因[2]，2015年中国统计数字显示，肝癌是国内第4位恶性肿瘤，肿瘤致死病因则位于第3位[3]。大数据时代，随着人工智能的快速发展，各种数学算法也在肝癌的海量数据中得到广泛应用，数据挖掘和云计算等不断层出的分析技术，为肝癌的诊疗分析提供了更加便利的方法，涉及到肝癌病因、基因组学、代谢组学、影像组学、蛋白组学、病理学、复发预测及生存风险分析等各个方面的机器学习方法的研究[4-6]。

机器学习是一种实现人工智能的方法，机器学习最基本的做法，是使用算法来解析数据、从中学习，然后对真实世界中的事件做出决策和预测，具有机器模仿、识别和学习人类大脑认知功能的作用，随着人工智能的发展也日渐受到关注[7]。机器学习是用大量的数据来“训练”，通过各种算法从数据中学习如何完成任务，其主要内容就是各种学习算法。深度学习涵盖于机器学习算法，是目前最热的机器学习算法，能基于大量积累的医疗数据产生计算模型，通过训练，在面对新的患者时，会提供相应的判断(譬如肝癌可能发生的风险、再复发的风险以及生存风险等)。对于癌症，与传统的方法相比，初期的机器学习即具有图像识别和特征选择的优势[8-9]。而近年来，深度学习算法被开发用于检测乳腺癌女性前哨淋巴结的转移，并表现出比病理学家更好的诊断性能[10]。在肝癌的诊断与复发领域，利用大数据平台，相对于传统的逻辑回归或Cox回归，深度学习模型表现出更好的诊断与预测性能。传统机器学习的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等，而机器学习的算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习，其中主要包括监督学习、半监督学习和无监督学习3种[11]，如监督学习代表有：随机森林(RF)、梯度增强机(GBM)、支持向量机(SVM)、决策树、k近邻(k-nearest neighbors, KNN)、人工神经网络(ANN)等；半监督方法代表有：最大期望、生成模型和图算法、主成分分析等。无监督学习方法代表有：先验算法(Apriori)、分叉树、K-均值(K-means)以及目前比较火的深度学习[12]。目前，深度学习广泛应用于医学预测模型，而深度学习其本身也会用到有监督和无监督的学习方法来训练深度神经网络。本文将深度学习在肝癌诊断、复发中应用进展介绍如下。

1 构建模型预测肝癌发生风险应用

1.1 构建血清蛋白质组学模型协助早期诊断血清AFP是目前肝癌诊断随访复发的一种重要检查方法,仍然被认为是血清肿瘤标志物中的金标准[13]。早在2001年,Poon等[14]通过深度学习算法计算出了AFP cut-off值，从而首次构建了血清AFP肝癌诊断模型。Camaggi等[15]在2010年筛选了45例HCV相关肝硬化、早期肝癌及晚期肝癌病例，通过深度学习对522 份血清样本进行训练得到多种蛋白质组学特征，其所建模型对其中43个可能区分伴或不伴肝硬化、伴或不伴血管浸润的肝癌病例进行了正确分类。2011年Patterson等[16]也通过深度学习，对血清中甘氨酸脱氧胆酸盐、脱氧胆酸 3-硫酸盐、胆红素水平、溶血磷脂水平进行例模型训练，构建了的肝癌发生的血清学预测模型。2014年Wang等[17]应用同样的方法建立了HBV相关肝硬化进展的早期肝癌进行诊断的预测模型，主要通过血清肽和 AFP 联合检测数据训练完成。Estevez等[18]2017年应用随机森林训练模型建模，检测了411例HBV及HCV感染的肝细胞癌(HCC)病例的血清细胞谱，该模型从深度学习算法角度说明了有或无HCC的 HBV 或 HCV感染者，其体内细胞因子分泌明显不同，疾病发病机制和疾病特征存在潜在差异。这些文献的报道，使血清学指标的检测及学习训练对各种情况下肝癌的协助诊断提供了很大的帮助。

1.2 构建模型优化影像学诊断肝癌通常通过肝活检或增强计算机断层扫描(CT)和磁共振成像技术进行诊断[19]，近年来深度学习算法和模型也大量应用于基于癌症图像的诊断、预后和预测[20-21]。卷积神经网络 (convolutional neural network, CNN) 允许在识别肝脏肿块和识别病理病变的特定特征时解释HCC图像[22]，伴随着计算机计算能力的猛进发展，深度学习的模型算法也逐步深入，而肝癌影像诊断所涉及的深层神经网络的研究陆续增加，包括多层神经网络、深度信念网络、CNN等多种算法的应用。2017年，Pang等[23]报告了一种凹凸变优化稀疏贡献特征选择和分类器的深度学习用以提高肝癌图像识别，在凹凸变分(CCV) 方法来优化的3种分类器(随机森林分类器、支持向量机分类器和极限学习机分类器)中，CCV-随机森林分类器更能准确的识别肝癌图像。但是作为一种“不可解释的”深度学习模型，其存在着“黑盒子”效应。2019年，Wang等[24-25]在其报道的肝肿瘤诊断的深度学习系列研究中，初次提出一种概念验证的“可解释的”深度学习模型，即利用放射成像特征的CNN，识别测试病灶中正确的影像特征。这种“可解释的”深度学习模型可与标准化报告系统(如LI-RADS)对接，添加了定量数据又利用了影像的相关辅助特征，从而提高了临床实用性，其阳性预测值和灵敏度也分别达到了76.5%和82.9%。此外，在多相核磁图像上，基于概念验证CNN的深度学习系统(DLS)对常见肝脏病变进行分类的研究中，通过与高年资医师的测试比较，肝癌分类深度学习系统测试出更高的准确度、敏感度和特异度。2020年Shi等[26]报道了密集卷积神经网络的深度学习方法可优化增强CT对肝脏肿瘤的诊断，又进一步丰富了影像组织性的深度学习内容。

1.3 构建模型优化病理学检查 2010年，Cucchetti等[27]应用人工神经网络术前预测HCC肿瘤分级及微血管侵犯，通过收集250例有肝硬化的HCC患者的临床、影像学和组织学资料，随机选取175例患者建立人工神经网络和逻辑回归模型，对其余75例患者进行测试。其中术前血清AFP、肿瘤数量、大小和体积与肿瘤分级和MVI相关(P<0.05)，用于构建ANN。在训练组，用于肿瘤分级和MVI预测的受试者工作特征曲线下面积(AUC)分别为0.94和0.92，均高于逻辑回归模型(均为0.85)(P<0.001)。在测试组中，人工神经网络正确识别了93.3%的肿瘤分级(k=0.81)和91% 的MVI (k=0.73)。逻辑回归模型正确识别了81%的肿瘤分级(k=0.55)和85%的MVI (k=0.57)。因此，与传统线性模型相比，人工神经网络更准确地预测肝癌肿瘤分级和MVI，可应用于优化病理学检查。2017年Li等[28]通过病理学专家的指导对病理切片感兴趣区做相应标记来识别肝癌细胞的细胞核，所构建的多重连接的CNN模型在细胞核分级方面体现了一定优越性。Pang等[23]2017年同样在病理学专家的指导下获得每个肝癌患者的HE染色的病理图像，构建了一种CCV方法，其中CCV-随机森林算法与其他算法相比较准确率达到98.74%，对肝癌的病理图像分类最为准确。2020年，Liao等[29]建立了基于深度学习的深度卷积神经网络模型，可明确区分肝癌肿瘤和邻近正常组织，实现了HCC的自动诊断和体细胞突变预测，也逐渐深化了病理学的深度学习研究。

1.4 构建代谢组学模型协助诊断 2016年Liang等[30]使用由LC-QTOF-MS结合多变量数据分析方法对HCC患者的尿液进行代谢分析，在人尿代谢组中所发现的15 种不同代谢物中，5种标志代谢物可有效诊断HCC，所建立的预测模型预测敏感度为 96.5%，特异度为83%。Wang等[31]2018年基于随机森林建立了两种新的模型：固定序列模型和两步模型，结合肝癌和非肝癌患者尿液中提取多个尿DNA生物标志物评估模型的敏感度、特异度、AUC和变异性，认为多个尿生物标志物的评估模型有一定潜力进行自我训练并完成HCC患者的云筛选。

1.5 构建基因组学模型协助早期诊断 2014年Ibrahim等[32]基于深度学习和主动学习，进行特征性选择的思想在生物信息领域的模型构建，通过考虑miRNA和基因之间的生物关系，扩展使用了该技术的miRNA，集成了两种无监督机器学习方法，选择最少的最有鉴别力的基因，提高了肝癌样本分类的准确性，所提出的特征性选择方法优于经典的功能选择算法。2015年Gui等[33]构建了一个源自STRING数据库中蛋白质-蛋白质相互作用(PPI)数据的分子相互作用网络，并确定187个基因之间的最短路径与机器学习方法确定的基因，且找到了117个基因探针，可以最优的分离肿瘤和非肿瘤样本。为理解HCC的发展过程提供了新的视角。

随着基因测序技术的发展，大量的基因测序数据随着复杂的深度学习技术的提高处理能力也得到提升。2018年Augello等[34]报道，在预测HCC的生物标志物与HCV相关肝硬化患者风险的研究中，使用机器学习分类器发现MICA的基因位点rs2596542和rs2596538变异体值得进一步研究，其与HCV相关肝癌关系密切。在一项从肝移植受者的移植肝脏中获得的59个组织样本的研究中，Kim等[35]制作了cDNA微阵列，每个样本中有超过9000个基因。通过使用KNN和支持向量机方法，在肝硬化有发生肝癌风险的高危患者中识别出30个显著改变基因的分子标记。这些基因可以作为诊断高危人群早期肝癌的候选标记，并可能指导新的化学预防策略。2020年Shen等[36]利用数据库和机器学习方法，构建并验证了HCC患者复发的预测模型，获得了预测肝癌早期复发的基因信号，并验证了突变的基因，准确度为74.19%，而模型的验证成功率达到80%，为临床预测肝癌复发提供了有意义的指导。

2 构建模型预测肝癌术后复发与生存风险应用

肝癌术后复发风险、生存预测等关系着患者术后及后期的生命健康，通过机器深度学习的相关研究为临床患者的治疗提供了很多指导，所构建的预测模型在临床中也得到初步应用。2012年Ho等[37]报道基于HCC数据库，对接受肝切除患者术后1、3、5年的无病生存率建模预测，分别使用ANN、逻辑回归(LR)及决策树 3 种算法构建了模型，结果人工神经网络模型(ANNS)的精确度更高，表明在医疗决策系统中使用ANNS对肝切除术后患者预测较为理想。2012年Shi等[38]报告了目前最大样本量的模型评估研究，共纳入22 926例接受过肝切除术的HCC患者，通过传统的逻辑回归模型和人工神经网络模型比较分析，ANNS在预测住院病死率方面更准确(准确度97.28%)，更具有综合评价的意义。2014年Qiao等[39]使用ANN、LR建立早期HCC根治切除手术的患者术后生存预测模型，发现ANNS比其他模型AUC更高。机器学习在处理含有缺失值的数据集时具有较大的灵活性。2020年Huang等[40]对7919例肝癌患者临床病理资料进行分析报告，在使用Cox回归、深度学习、随机生存森林、极度梯度等算法构建肝癌根治性切除术后复发预测模型发现，XGBoost的精确度最高。以上研究结果证明ANN等机器深度学习在肝癌患者预后预测模型中具有良好的前景，在医疗决策支持系统中应用的可行性。

Tseng等[41]2015年为了提高利用多个测量值预测临床结局的准确性，提出了一种新的多时间序列数据处理算法，收集了83例肝癌患者的临床资料，采用径向基函数核的多测量支持向量机作为肝癌复发多元测量随机森林回归的模型。结果提示该算法能显著提高HCC复发预报性能，且多次测量比单次测量更有价值。2017年Qiu等[42]通过使用机器学习中Lasso 算法及SVM-RFE算法，针对早期576 例肝癌患者的基因CpG甲基化水平检测所得到的数据建模分析，从甲基化的角度建立了预测早期肝癌复发风险的模型。Xu等[43]2017年也对血清中循环肿瘤DNA甲基化水平进行检测，共检测1098例肝癌患者和835例正常人，数据使用Lasso 算法及随机森林算法筛选，共选出10个标志物建立了肝癌诊断模型；并使用机器学习中 Lasso-Cox 算法筛选出8个标志物构建预测肝癌预后风险模型。由此可见术后复发与生存风险模型的建立通过深度学习的方法也可达到一定临床指导效果。

3 构建模型预测射频消融(radiofrequency ablation，RFA)、经导管肝动脉化疗栓塞术(TACE)生存风险应用

RFA、TACE是肝癌患者不可或缺的重要辅助治疗手段，主要针对无法耐受手术切除和不能手术切除的肝癌人群。2014年Liang等[44]报告了83例接受RFA治疗的HCC患者，共采用了5种特征选择方法，包括遗传算法(GA)、模拟退火算法(SA)、随机森林算法(RF)及混合算法(GA+RF和SA+RF)，从总共16个临床特征中选择一个重要的特征子集，这些方法与SVM开发具有更好的性能预测模型相结合，最终结论提示SVM的预测模型可以提示高风险复发患者。2020年Brehar等[45]文献报告纳入RFA和放疗患者214例和205例，通过放射组学特征和重要临床变量建立RFA和放疗的列线图，评估愈后，结论提示深度学习建立的放射组学模型和列线图实现了对RFA与放疗的无进展生存期的准确预测，可以促进二者之间的优化治疗选择。预测肝癌接受肝动脉化疗栓塞治疗反应由Abajian等[46]2018年报告，研究包括36例HCC患者，使用磁共振成像和临床患者数据，创建一个人工智能(AI)框架，通过应用机器学习技术预测接受TACE治疗患者的愈后。用临床资料、基线影像和治疗特征训练LR和RF，结果显示，结合患者临床资料和磁共振图像数据，应用机器学习算法可以在术前预测肝癌患者TACE的结果。2020年Peng等[47]收集了国内多中心共789例中期肝癌患者，建立一个转换学习技术的残差CNN预测模型，预测TACE治疗的效果，可以更好的帮助临床医生筛选哪些患有HCC的患者更能够从介入治疗中获益。

4 其他

近年来，深度学习不仅在基于图像的癌症检测和治疗预测方面，而且在多组学数据的集成方面也取得了一些进展。Chaudhary等[48]报道使用RNA(RNA-Seq)测序、miRNA(miRNA-Seq)甲基化数据和TCGA的甲基化数据构建360例HCC患者的生存敏感模型，该模型可将患者分为两种因生存率而有显著差异的最佳亚型。Nam等[49]用基于传统回归方法的DL算法，构建了563例患者肝移植后HCC复发的预测模型。这项多中心研究表明，肿瘤直径、年龄、AFP水平和维生素K缺失或拮抗剂Ⅱ(PIVKA-Ⅱ)是基于AI的肝移植后复发模型(MoRAL-AI)的最大加权参数。

人体和肿瘤的生物多样性决定着任何深度学习的模型并不能适用所有的患者。AI在肝癌的诊疗领域也一直在研发，帮助临床医师的智能辅助决策系统。Singal等[50]开发机器学习模型，并与传统预测模型进行比较；其中基于决策树的随机森林模型(C-statistic 为0.71)比常规回归模型(C-statistic为 0.64)的效果更好。然后在另一队列(1050例HCV相关HCC患者)中验证，机器学习模型(敏感度为80.7%、特异度为46.8%)比传统模型(敏感度70.7%、特异度41.6%)的结果也更优。Divya等[51]2019年在对HCC射频术后复发与否的算法研究中，提出一种有效的抽样方法，使用逆随机抽样，以克服类不平衡问题。同时也提出了一种优化方法，使用人工植物优化算法(APO)来选择最有特征和参数分类，以提高分类的有效性和效率。利用SVM和RF分类器，基于最优特征和参数对肝癌患者和非肝癌患者进行分类。Giordano等[52]报道探针电喷雾电离质谱与AI相结合,用来评估SVM和RF两种算法的整体诊断准确度。该方法在肝癌诊断上具有较高的准确度、特异度和敏感度。这两种算法的总体诊断准确度均超过94%。该研究的主要限制是所有样本来自同一临床中心，可能会限制机器学习的能力，不过即便如此，他所提出的方法也可以被转化到外科肿瘤的临床实践中并得到广泛应用，最终可能体改肿瘤患者治愈的终极目标。

5 小结及展望

在医疗保健和信息技术不断更新的时代中，越来越多利用数据科学和技术使医疗保健个性化，并增强与患者的交互。AI伴随着计算机科学技术的飞速发展，深度学习技术同样会不断深入发展，深度学习所构建的各种模型在肝癌研究领域的应用也会更加深入。未来，深度学习这些研究领域应该涉及多个中心的合作，应该包括更大样本量的肝癌患者，这样才能使AI、机器学习、深度学习在肝癌的诊疗中发挥更大的作用。

利益冲突声明：所有作者均声明不存在利益冲突。

作者贡献声明：张清华起草并撰写文章主要内容；李海涛负责主要内容修改并完善文章内容；方国旭负责协助查阅文献并提出修改意见；郭鹏飞提供了文章思路；刘景丰参与修改及审校。