人工神经网络在肝癌诊疗与预后预测中的应用进展△
2020-12-24史斌王建立
史斌,王建立
解放军总医院第三医学中心器官移植科,北京 100039
肝癌是全球第五大恶性肿瘤,近20年来肝癌的病死率呈上升趋势,在中国恶性肿瘤致死原因中居第2位,严重影响人们的身体健康。常见的高危因素是病毒性肝炎(如乙型肝炎、丙型肝炎)肝硬化、酒精性肝硬化、胆汁性肝硬化(如Caroli病)、布加综合征、原发性铁过载、糖原代谢性疾病等。肝癌的诊断主要依据临床表现、甲胎蛋白和影像学特征,外科手术仍然是治疗肝癌的有效方法。然而,肝癌复发与转移是影响预后的主要因素,是肝癌外科治疗中的世纪性难题,也是最终攻克肝癌的关键所在。因此,如何预测肝癌术后复发和转移是亟待解决的重大健康问题。人工智能技术在医疗领域已应用了40多年,其可通过协助医务人员提高工作效率,进一步提升医疗保健水平。人工智能主要应用于传统医学诊断、疾病治疗、自动分类和患者康复等。随着医疗行业的飞速发展,人工智能也进入了最好的时代。与传统医疗相比,人工智能为开展疾病诊断、制订治疗方案、提高医学研究和临床试验的效率、规范医师操作提供了全新的思路和方法。人工智能的发展经历了早期的逻辑推理到中期的专家系统,直至机器学习出现后,人工智能研究终于找对了方向。从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。从实践意义上来说,机器学习是一种利用数据、训练模型、使用模型预测的方法。主要方法如下:①回归算法,包括线性回归和逻辑回归;②人工神经网络(artificial neural network,ANN);③支持向量机(support vector machine,SVM);④聚类算法;⑤降维算法;⑥推荐算法。ANN的概念可以追溯到20世纪初期,然而,它最早始于19世纪80年代,当时主要应用于识别、控制和优化模式等。神经系统应用肿瘤标志物作为输入神经元,并提供输入信号的理想方法以便输出神经元可以提供患者治疗过程的预测依据。本质上,决定神经网络可靠性的两个特征是对输入变量的判断分析和关于预测输出准确性的分类方法。本文就ANN在肝癌血清学、影像学、病理学、蛋白质组学、基因学诊断和预后预测中的应用进展作一综述。
1 ANN概述
在过去几十年中,ANN在生物学和医学研究中的应用大大增加。ANN的医学应用涉及麻醉学、放射学、心脏病学、精神病学和神经病学。肿瘤的治疗与管理具有一定的模式化,大多数肿瘤的诊断通常是通过穿刺活检完成的,但具有一定的创伤性。从患者和医师的角度来看,智能化、可靠且无创的诊断程序将会非常有利,同时对于评估肿瘤的进展至关重要。这就促使研究人员寻找一种简单有效的测量方法来评估患者预后,了解肿瘤的生物学特征及其相关信息。神经网络分析已被证明对解决这些问题具有重要作用。
ANN是平行的信息处理结构,试图模仿生物神经系统的某些性能特征。生物神经元具有3种类型的组件,即树突、体细胞和轴突。树突通过轴突从其他神经元接收起源于化学、电或温度变化的信号,并且通过化学过程穿越突触间隙,使传入的信息累积在体细胞中。然后体细胞通过简单的求和过程作用于各种输入信号,当接收到足够量的输入时,该单元将触发,即通过输出轴突将信号传输到其他单元。
典型的神经网络由一系列通过完全随机连接的层组成,通常有两层与外界连接:输入层,将数据提供给网络;输出层,网络对输入数据的响应。另外,隐藏层处于输入层和输出层之间。训练过程需要反复呈现数据的输入与输出对,然后网络研究数据中的模式或功能,这些模式或功能最终将有助于达成“正确的”决策。在每次迭代时,将网络输出与所需的输出进行比较,并生成误差函数。当误差值超过设计人员设置的某个阈值时,将重新修改各层神经元的权值,最终使得误差信号最小,并为后续的迭代进行更新。只有当误差等于或低于该阈值时,该网络才认为输出的误差可以接受。当出现一组新的输入数据时,网络能够基于其先前的学习积累获得正确的决策。从这个意义上说,网络可以进行概括,即合理地插入新的输入模式,这无疑是神经系统的独特优势之一。
2 ANN与肝癌诊断
2.1 血清学诊断
血清学标志物可用于肝癌的早期诊断,其方便快捷,成本相对较低,还可用于动态监测。研究表明,血清学指标联合ANN可以提高肝癌诊断的准确性[1-2]。王运九等[3]将甲胎蛋白、总胆汁酸、活化部分凝血活酶时间、碱性磷酸酶和血小板分别纳入ANN和逻辑回归模型,结果发现,ANN的诊断效率优于逻辑回归模型。Xie等[4]基于GeXP系统构建了一个9种基因(GPC3、HGF、ANXA1、FOS、SPAG9、HSPA1B、CXCR4、PFN1和CALR)表达检测系统,采用Logistic回归分析、判别分析、分类树分析和ANN等方法建立诊断模型,对肝癌患者与健康者进行分类。结果显示,ANN对9种基因的诊断价值最高,其灵敏度和特异度分别为98%和85%。另有研究发现,使用单盲试验验证的径向基函数神经网络的学习算法建立诊断模型,成功鉴定了 7种质荷比分别为 1780.7、1866.5、2131.6、2880.4、1532.4、2489.8和2234.3的肽序列。基于6个重要肽段(质荷比分别为1535.4、1780.7、1866.5、2131.6、2880.4和2901.9)建立的诊断模型的识别率和预测能力分别为89.47%和82.89%,基于单盲试验的该模型的灵敏度和特异度分别为85.29%和85.71%[5]。Wang等[6]利用蛋白质芯片技术检测ANN的血清蛋白质指纹图谱,该模型诊断肝癌的灵敏度和特异度分别为88.2%和94.6%。这些研究结果表明,为了提高血清学诊断早期肝癌的准确性,可以联合ANN方法,这为提高肝癌的诊断率提供了新的思路。
2.2 影像学诊断
2.2.1 磁共振成像(MRI) MRI在临床中可用于诊断肝癌及评估治疗效果。卷积神经网络是一种类似于深度学习的机器学习算法,能够识别和检测病变的特征。已有研究证实,多通道融合三维卷积神经网络(multichannel fusion three-dimensional convolutional neural network,MCF-3DCNN)对高分化肝细胞癌的鉴别诊断价值最高,曲线下面积(area under the curve,AUC)、准确度、灵敏度和特异度分别为0.96、91.00%、96.88%和89.62%[7]。此外,卷积神经网络能够对肝细胞癌多b值弥散加权成像(diffusion weighted imaging,DWI)的深层特征进行有效分级,准确度高达80%[8]。另有研究发现,三维卷积神经网络结构可以在磁共振-DWI中很好地鉴别肝脏肿瘤的来源[9]。Le等[10]采用三维快速推进算法和单层前馈神经网络对肝脏肿瘤进行分割,选取25个肿瘤病变进行评价,结果表明,与人工分割方法相比,该方法提升了准确度,缩短了分割时间,提高了工作效率。另有研究表明,应用肝癌切除术前核磁共振的纹理特征来推测术后复发情况,可为临床医师下一步治疗方案的制订提供思路[11]。
2.2.2 计算机断层扫描(CT) CT检查是肝癌诊断的重要方法。刘建华和王建伟[12]通过分析CT图像特征,采取反向传播(back propagation,BP)神经网络方法对肝癌进行识别,识别率为83.33%。郝涛和张智[13]寻找适合识别肝癌CT图像的特征向量,建立BP神经网络模型,其对原发性肝癌的识别率为(91.08±6.96)%,说明ANN对于肝癌的影像学诊断具有非常重要的价值。Ouhmich等[14]采用深度学习卷积神经网络方法在多期CT图像上实现正常肝组织和肝癌组织的自动分割,能够有效地评估肿瘤组织的坏死率。Yamada等[15]研究结果表明,三相动态增强CT对原发性肝癌组织学分型和分化程度的平均诊断性能分别为39.1%和47.9%。在像素偏移、旋转和倾斜失调的转移学习(transfer learning,TL)后,卷积神经网络的最高平均诊断性能分别为44.1%、44.2%和43.7%。这些研究均说明,应用ANN结合传统的CT检查,能够大大提高肝癌的诊断准确率。
2.2.3 超声 目前超声检查是肝癌诊断的最佳方法,容易操作且价格低廉。Hwang等[16]为了提高超声诊断肝脏恶性病变的准确度,选取29个关键特征作为前馈神经网络的输入数据,采用阳性预测值、阴性预测值、灵敏度、特异度和准确度评价诊断效能,结果提示诊断准确度高达96%以上。Streba等[17]论证了时间强度曲线(time-intensity curve,TIC)分析参数在肝脏肿瘤ANN诊断系统中的作用,结果提示ANN具有94.45%(95%CI:89.31%~97.21%)的训练准确度和87.12%(95%CI:86.83%~93.17%)的测试准确度,并对不同类型的病灶进行了分类,分类过程的灵敏度为93.2%,特异度为89.7%,阳性预测值为94.42%,阴性预测值为87.57%。
2.3 病理学诊断
肿瘤组织学反映了潜在的分子和疾病进展过程,包含丰富的表型信息,可以预测患者预后[18]。病理诊断在肝细胞癌的诊断和治疗中具有重要作用。大多数肿瘤的传统病理诊断方法需要冷冻、切片、苏木精染色,并进行人工分析,从而限制了诊断的速度。卷积神经网络是一种类似于深度学习的机器学习算法,它能够识别与检测病变的特定特征。已有研究证实,卷积神经网络极限学习法(connected convolutional neural network with extreme learning machine,CNN-ELM)模型能够对肝癌细胞核进行有效分级[19]。另有一些研究表明,卷积神经网络可准确地用于肝癌图像的分割和分类[20-22]。Gheonea等[23]将一种新的形态测量技术——分形维数(fractal dimension,FD)运用到肝细胞癌诊断的ANN中,收集了21例肝细胞癌患者和28例肝转移瘤患者的组织标本,进行苏木精和免疫组化染色。ANN正确分类了肝细胞癌图像(90.20%)和正常组织图像(97.23%)、肝转移瘤(86.78%)和正常组织(98.00%)。该研究成功地将FD用作决策系统中的形态计量标记,这是一组ANN的集合,旨在区分正常实质的组织学图像与恶性肿瘤,并对肝细胞癌和肝转移瘤进行分类。
2.4 蛋白质组学、基因学诊断
为了提高血清蛋白质组学诊断肝细胞癌的准确性,研究人员做了一些研究工作。Ward等[24]的研究探讨了丙型肝炎相关性肝硬化的肝细胞癌的血清蛋白质组学变化情况,建立基于表面增强激光解吸/电离飞行时间质谱的ANN,显著提高了血清蛋白质组学诊断肝细胞癌的灵敏度。Luk等[25]通过二维凝胶电泳(two-dimensional gel electrophoresis,2-DE)研究肝细胞癌患者的蛋白质组学表达情况,采用ANN和分类回归树(classification and regression tree,CART)数据挖掘方法分析数据,结果表明ANN检测的灵敏度和特异度分别为96.97%和87.88%,而CART检测的灵敏度和特异度分别为81.82%和78.79%。Wang等[26]运用血清蛋白指纹图谱结合ANN模型诊断肝癌,灵敏度为88.2%,特异度为100%。
鉴定肿瘤预后基因十分重要,有助于更好地预测预后。ANN通过对预测肝癌复发的基因表达谱的训练,能够对所有样本进行正确的分类,识别出最适合该组织的基因。与单因素分析相比,采用ANN进行多参数分析具有更好的诊断价值[4,27-28]。Chaudhary等[29]基于RNA测序、miRNA测序和癌症基因组的甲基化数据建立深度学习模型,可准确、有效地预测肝细胞癌患者的生存情况。Marsh等[30]研究了一组等位基因缺失的抑癌基因是否可以作为基因损伤的标志物以预测肝移植患者的预后,并评估了组织样品在10个基因组位点1p、3p、5q、7q、8q、9p、10q、17p、17q、18q上的信息状态。采用ANN模型结合基因分型结果进行预测,结果表明,组合模型可以完全准确地预测肝癌的复发情况,基因分型为无瘤生存时间提供了有力的判断依据。Choi等[31]运用基于网络的深度学习方法,通过G2Vec获得的基因分布鉴定预后情况,结果显示,由G2Vec鉴定的生物标志物可用于发现与肝细胞癌相关的重要预后基因。
3 ANN 对肝癌治疗后的预后预测
大量研究表明,ANN对于肝癌切除术后的预后预测越来越重要。Qiao等[32]研究发现,ANN在预测肝癌切除术后患者生存率方面明显优于其他模型。Shi等[33-34]验证了ANN模型和逻辑回归模型预测原发性肝癌手术后的住院死亡率和5年死亡率,结果均显示,与逻辑回归模型相比,ANN模型具有更高的准确率。Ho等[35]采用ANN方法评估肝癌患者肝切除术后的无病生存情况,结果提示,在预测精度方面,ANN模型优于逻辑回归和决策树(decision tree,DT)。Chiu等[36]前瞻性地运用ANN、SVM、高斯过程回归(gaussian process regression,GPR)模型研究肝切除术后患者的生活质量,结果显示,与SVM、GPR模型相比,ANN模型具有更好的性能,术前功能状态是影响第6个月生活质量的敏感指标。Chiu等[36-37]通过ANN预测肝癌患者肝切除术后的死亡风险和生活质量,其结果均表明,ANN不仅具有大量的死亡率变量预测因子,而且还能够提供准确的预测。
ANN还可用于肝癌射频消融、经肝动脉化疗栓塞及肝移植术后的预后评估。为预测接受射频消融治疗的肝细胞癌患者的1年和2年无病生存期(disease-free survival,DFS),Wu等[38]选取了15个临床指标,构建DFS预测的ANN模型,结果表明,通过15个临床指标构建的ANN模型可以很好地预测DFS,可为临床医师做出治疗决策提供依据。研究表明,对于经肝动脉化疗栓塞治疗后的疗效及生存情况的评估,ANN均具有良好的性能[39-41]。Zhang等[42]采用非线性方法建立一个肿瘤特异性预后模型,通过构建多层感知器(multilayer perceptron,MLP)神经网络预测肝移植术后的死亡风险,利用受试者工作特征曲线评估移植后1、2和5年的预测性能,结果发现,特异性MLP在预测肝细胞癌患者肝移植后的死亡率方面具有较高的准确性。MLP模式识别方法有望解决肝移植术后的预后预测问题。
4 小结
ANN在肝癌诊断及预后预测中具有重要意义,这主要得益于自身的性能优势。传统的肝癌诊疗和预后预测方法结合ANN技术,可以达到精准的诊断、精细的治疗和精确的预测,使患者获益最大化。