人工智能与影像组学在肝纤维化及肝硬化中的研究进展
2022-12-25张舒张蒙刘雨萌黄小平甘建和
张舒 张蒙 刘雨萌 黄小平 甘建和
肝细胞受到损伤后,损伤区域被细胞外基质或纤维瘢痕组织包裹。如这一损伤修复过程持续反复发生,则纤维瘢痕组织越来越多,逐渐形成肝纤维化和肝硬化[1]。肝组织活检是诊断肝纤维化和肝硬化的“金标准”,组织学分期划分为S0~S4(S0为无纤维化;S1为轻度纤维化;S2为中度纤维化;S3为进展期肝纤维化;S4为肝硬化)。根据各评分系统,以S0-1表示无显著纤维化, Scheuer和METAVIR≥S2或 Ishak≥S3定义为显著纤维化;Scheuer和 METAVIR≥S3或Ishak≥S4定义为进展期肝纤维化[2]。肝纤维化和早期肝硬化是可逆的,准确地评估和早期干预是延缓甚至逆转疾病进展的关键[3]。然而,肝组织活检因具有侵袭性、手术并发症、取样误差、观察者内部和观察者间的偏倚等原因,在临床应用中受到限制[4]。常规影像学检查对于肝纤维化的早期诊断意义不大,现有的无创血清诊断模型在各研究结果中精度不一,磁共振弹性成像和瞬时弹性成像等新技术尚未在各医院广泛开展,临床上亟需更精准、便捷的无创诊断工具。针对肝硬化而言,肝硬化分为代偿期肝硬化和失代偿期肝硬化,代偿期肝硬化患者往往无明显症状,而失代偿期肝硬化患者常因并发肝性脑病、食管胃底静脉曲张、腹水等并发症而死亡,中位生存期约为2年[5]。全球每年有近200万人死于肝硬化并发症,是全球第11大最常见的死亡原因[6],准确、及时评估患者病情有助于临床管理和降低病死率。近年,人工智能和影像组学技术正成为医学领域的一股研究热潮,为疾病的诊断、风险分层、预后预测提供辅助帮助。本文旨在对AI与影像组学在肝纤维化及肝硬化中的应用研究做一综述。
一、基于机器学习
AI是计算机学科的一个分支,是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的新学科[7]。机器学习(machine learning,ML)是AI的一个子集,通过它可以建立算法和预测模型,以有效地识别大数据集中的模式;通过运用统计学方法,使机器能够通过经验进行改进。ML可以进一步分为监督学习(基于输入和输出数据创建的预测模型)、无监督学习(仅基于输入数据的组合模式识别)和深度学习(基于神经网络的学习,可以应用于大数据集)[8]。
(一)机器学习在评估肝纤维化和早期肝硬化的研究进展 病毒性肝炎是当前导致肝纤维化/肝硬化的首要因素,Wei等人[9]利用490例慢性乙型肝炎患者血清学指标构建了多种机器学习模型,同时在两个独立的外部队列——慢性丙型肝炎患者(n=254和n=230)上使用这些模型来进行验证。研究得出GB模型明显优于其他ML模型和基于4因子的纤维化指数(FIB-4)。在诊断显著性肝纤维化,GB模型受试者操作特征曲线下面积(receiver operating characteristic area under the curve,AUROC)为0.918,FIB-4的AUROC为0.841;在区分有无肝硬化中,GB模型AUROC为0.871,而FIB-4为0.830;外部队列中GB模型预诊断性能亦优于FIB-4。
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)的全球患病率正在逐年增加,已成为一个严重的公共卫生问题。NAFLD发展过程中,在肝脏脂肪变性基础上出现肝细胞损伤,发生变性坏死,进而导致肝纤维化和肝硬化[10]。Okanoue等人[11]基于人工智能/神经网络算法,建立了Fibro-Scope模型,包含年龄、性别、身高、体重、腰围、天冬氨酸氨基转移酶(AST)、丙氨酸氨基转移酶(ALT)、γ-谷氨酰转移酶、胆固醇、甘油三酯、血小板计数和 IV型胶原蛋白7S(T4C7S)12个血清学指标。结果表明,在训练集中和验证集中Fibro-Scope模型在诊断有无肝纤维化的AUROC分别为0.960(95%CI:0.937~0.983)和0.888(95%CI:0.784~0.991)。Okanoue等[12]对模型再次优化,纳入424例NAFLD患者再次进行研究,在训练集中预测肝纤维化各阶段的模型AUROC值均极高(>0.97)。Fibro-Scope模型在训练集中诊断肝纤维化敏感性为99.5%,特异性为90.9%,阳性预测值为97.4%,阴性预测值为98.0%;在验证集中的敏感性为100%,特异性为88.2%,阳性预测值为96.9%,阴性预测值为100%。总之,模型诊断性能超越了病理学家的独立诊断和其他现有的血清学模型。病理学家独立诊断的敏感性为98.4%,特异性为87.5%,阳性预测值为96.9%,阴性预测值为93.3%。研究表明,基于人工智能/神经网络算法的Fibro-Scope模型具有极高的诊断精度,且成本低、易于使用,可以准确地区分出各个阶段的肝纤维化。此模型已被纳入日本医疗健康检查计划,根据临床实践将进一步微调,并可能最终替代肝组织活检。
二、基于影像组学
影像组学指的是结合AI技术,高通量地从影像中提取大量的特征,从而将影像数据转化为具有高分辨率、可挖掘的影像特征空间[13]。具体包括以下步骤[14]:①图像采集:对图像进行标准化处理,消除不必要的混杂变异因素; ②图像分割:对感兴趣区域进行二维或三维勾画,分割方法包括手动、半自动、自动三种分割方式; ③特征提取:包括形态学特征、一阶特征、二阶特征、纹理特征、基于滤波和变化的其他特征; ④特征选择:常用的特征选择方法包括方差选择法、相关系数法、卡方检验、LASSO回归、主成分分析法、线性判别分析法等;⑤模型建立;包含多种机器学习方法,如逻辑回归、决策树、随机森林、支持向量机、神经网络、深度学习等。
(一)在肝纤维化及早期肝硬化中的研究进展 Li等人[15]对100例患者的常规超声影像上肝脏回声纹理的异质性进行影像组学分析,根据肝纤维化面积来量化肝纤维化程度,能够准确地鉴别出轻度和显著性肝纤维化,模型AUROC高达98.5%,特异度为93.3%,敏感度为93.7%。Wang等人[16]纳入144例慢性乙型病毒性肝炎患者,采用LASSO回归进行特征选择、支持向量机建模以评估患者是否出现肝硬化,新模型包含了25个影像组学特征,以及ALT、AST、球蛋白、国际标准化比值(INR)4个临床指标。结果显示,在训练队列和验证队列中,此新模型的AUROC分别为0.915和0.872,显示出良好的诊断价值。此外,Park等人[17]纳入436例肝纤维化患者的肝脏增强MRI,在开发集中,通过使用逻辑回归和弹性网络正则化构建影像组学纤维化指数模型(RFI),确定诊断显著肝纤维化、进展期肝纤维化和肝硬化的最佳RFI阈值,RFI诊断中度肝纤维化的敏感性和特异性分别为81%和78%;诊断进展期肝纤维化的敏感度和特异度为79%和95%;诊断肝硬化的敏感度和特异度为95%和75%。在测试集中,该模型在区分肝纤维化3个阶段的AUROC值分别为0.91、0.87和0.88。我们发现基于影像组学的方法,可改善常规的影像学检查对于轻度肝纤维化的诊断性能以及提升在肝纤维化各分期的诊断性能。但上述研究均为单中心的研究,模型是否具有普适性仍需要更多的研究来验证。
(二)在失代偿期肝硬化及其并发症的研究进展 Nitsch等人[18]将肝硬化患者的影像组学特征应用于肝硬化患者的预后分析,为应对肝病患者的临床治疗和移植器官分配等方面的挑战开辟了新的研究途径。他们对肝脾影像分割后进行特征提取、采用随机森林建模评估疾病的严重程度,并将其与现有的MELD评分和临床失代偿的指标进行比较。结果表明,基于肝脾的MRI影像学特征的模型预测在预测失代偿的效能最高(AUROC为0.84)。但本研究为小样本单中心的研究,仅采集了90例患者的肝脏MRI资料,仍需进一步研究。
肝性脑病是肝硬化患者常见的并发症之一,发病率为30%~45%,III~IV级肝性脑病患者90天内病死率可高达66%[19]。为提高预测患者继发HE的准确性,曹金明等[20]通过肝脏增强CT影像组学共收集304例乙型肝炎肝硬化患者的临床资料及肝脏增强CT影像。从门静脉期影像中提取到356个肝脏影像组学特征,LASSO回归筛选出其中19个特征,结合3个独立危险因素(血清白蛋白、腹水和侧支循环开放情况),建立了单独的影像组学模型、单独的临床模型以及由影像组学和临床特征共同构成的综合模型3个模型,预测继发肝性脑病的风险。结果表明综合模型预测AUROC值高达0.94,准确性高达0.93。
约50%的肝硬化患者会发生食管胃底静脉曲张(gastroesophageal varices,GEV)[21]。GEV引起的首次出血的病死率为20%,无干预的首次出血存活的患者1年内再出血的风险高于60%,病死率约为33%[22]。鉴于与GEV相关的高发病率和病死率,指南建议所有肝硬化患者都应定期行胃镜筛查有无发生GEV[23],然而部分患者暴露于有创手术和麻醉并发症等风险,并没有出现需要治疗的静脉曲张(varices needing treatment,VNT)。2015年BavenoVI共识提出肝硬度<20kPa、血小板计数>150×109/L的患者可免行内镜筛查[24],但仍有不少争议。Lin等[25]收集245例肝硬化患者临床和门脉期CT影像资料,随机分为训练集(n=111)、内部验证集(n=71)和外部验证集(n=63)。在训练集中,利用LASSO回归和交叉验证法算法,共提取了14个食管胃底区的特征和5个脾门区的特征,构成影像组学标签(rad score),多因素逻辑回归显示血小板、rad score是发生VNT的独立危险因素,进而建立了预测发生VNT的预测模型和列线图。在训练集、内部验证集和外部验证集中,AUROC分别为0.987(95%CI0.969~1.00)、0.973(95%CI0.939~1.00)和0.947(95%CI0.876~1.00);在有效性和安全性评估中,列线图显示可免除40%以上的内镜检查,且VNT漏诊率低于5%。此无创和可重复的模型不仅能提高患者的依从性,还能显著减少不必要的内镜检查和医疗负担,具有极高的应用价值。
三、总结
基于人工智能与影像组学的研究方兴未艾,在肝纤维化和肝硬化的无创诊断方面,常规的检查可以达到甚至超越金标准的诊断性能;在失代偿期肝硬化的应用方面,各种预测模型的预测效能可得到进一步优化,提高评估患者预后的准确性。这些均有助于慢性肝病患者实现无创、纵向、精准的随访和治疗。当前的大多数研究多为单中心研究,尚未在临床投入使用,还需接受临床实践的检验。人工智能与影像组学的应用亦存在许多壁垒,例如高质量数据的采集、部分算法难以理解、模型准确度不足等,但随着大数据的发展、多学科的融合,未来或许我们可以建立大型、多中心、跨学科、高质量的肝病数据中心,为实现肝病的精准治疗和个体化治疗提供桥梁。
利益冲突声明:所有作者均声明不存在利益冲突。