无创评估NAFLD肝纤维化的研究及其与肝细胞癌的相关性
2020-12-29田宏扬鲁晓岚夏智红
田宏扬,鲁晓岚,夏智红
复旦大学附属浦东医院 1.消化内科;2.急诊科,上海 201399
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)已成为全球最常见的慢性肝病,疾病谱包括非酒精性肝脂肪变、非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH)、肝硬化和肝细胞癌(hepatocellular carcinoma,HCC)[1]。肝纤维化是NAFLD进展至肝硬化和HCC的中间阶段,是目前准确预测肝脏不良结局的最佳因子,在NAFLD患者中评估纤维化程度对预后判断十分重要[2]。肝活组织检查至今仍是诊断肝纤维化的金标准,但因其有创性及一系列潜在并发症,在临床诊疗和研究中,为了评估肝纤维化情况而重复行肝活组织检查是不易被接受的。因此,近年来研究出现多项无创方法,致力于替代肝活组织检查。本文就评估NAFLD肝纤维化的无创方法研究作一概述,并分析相关检测方法与HCC的关联性,以期为临床诊断评估及进一步的研究提供参考。
1 血清标志物模型
目前尚无单独血清学指标可高效而准确地诊断NAFLD肝纤维化,故为提高实验室指标的诊断价值,许多研究者开发出临床参数和血清生物标志物不同组合的多种预测模型[3]。
1.1 天冬氨酸转氨酶与血小板比值指数(AST-to-platelet ratio index,APRI)APRI最初是一种评估丙型肝炎纤维化的工具,计算公式:(AST/ULN)×100/血小板计数(×109L-1)(ULN:AST的正常值上限)。Kruger等[4]对111例NAFLD患者的研究发现,进展期肝纤维化(advanced fibrosis,AF)患者的APRI显著升高,取最佳临界值0.98时,ROC曲线下面积为0.85,灵敏度75%,特异度86%。一项关于NAFLD肝纤维化的Meta分析显示,APRI诊断显著肝纤维化(significant fibrosis,SF)、AF和肝硬化的ROC曲线下面积分别为0.70、0.75和0.75[5]。APRI的优势是其简便性,所需测量指标少,但灵敏度相对较低,对早期肝纤维化的诊断效能劣于对AF,在临床实践中可作为排除AF的一项简单工具。
1.2 NAFLD纤维化评分(NAFLD fibrosis score,NFS)NFS是最常见的评估NAFLD肝纤维化严重程度的生物标志物模型,计算公式:1.675+0.037×年龄(岁)+0.094×BMI+1.13×糖调节受损/糖尿病(是=1,否=0)+0.99×AST/ALT比值+0.013×血小板计数(×109L-1)+0.66×白蛋白(g/dl)[6]。多项研究证实NFS诊断AF具有良好的准确性。NFS取低临界值<-1.455可以准确地排除AF(阴性预测值为88%~93%),取高临界值>0.676时能准确检测出AF(阳性预测值为82%~90%)[7]。Xiao等[5]进行的Meta分析发现,NFS诊断NAFLD患者SF、AF和肝硬化的ROC曲线下面积分别为0.72、0.73和0.83,并未表现出理想的诊断效能。可能由于不同研究诊断界值的差异影响了诊断水平的一致性,需要进一步研究以确立统一、高效的最佳诊断界值。另外,低灵敏度是NFS的局限性,且应用于65岁以上患者时假阳性率较高,建议评估老年人肝纤维化时NFS取0.12的低临界值[8]。
1.3 FIB-4评分FIB-4是一种常见的评估肝纤维化程度的生物标志物模型,简单方便,计算公式:年龄(岁)×AST(U/L)/[血小板计数(×109L-1)×ALT(U/L)的平方根]。FIB-4首先在同时感染了HIV的丙型肝炎患者中建立,后来其作用在NAFLD患者中也得到证实[9]。研究表明,FIB-4评估NAFLD患者AF的临界值可取<1.3(阳性预测值36%,阴性预测值95%)和>3.25(阳性预测值75%,阴性预测值85%)[10]。McPherson等[8]对634例NAFLD患者进行的研究发现,在65岁以上的个体中FIB-4评估AF的特异度显著降低,假阳性率较高。日本的一项对1 050例NAFLD患者的研究表明,根据年龄分层采取不同的FIB-4临界值可提高诊断准确性,该研究建议60~69岁的患者FIB-4临界值为1.88和2.67,≥70岁患者FIB-4临界值为1.95和2.67[11]。故FIB-4应用于老年患者时临界值需要适当调整。
1.4 Bard评分Bard评分由BMI、糖尿病和AST/ALT比值组成,容易计算,其中BMI≥28 kg/m2记1分,AST/ALT≥0.8记2分,患糖尿病记1分。研究表明,Bard评分在2~4分时AF的风险增加了17倍,ROC曲线下面积为0.81,阴性预测值为96%,但阳性预测值较低,仅43%[12]。一项Meta分析显示,在NAFLD患者中Bard评分诊断SF、AF、肝硬化的ROC曲线下面积分别为0.64、0.73、0.70[5]。尽管如此,由于其简单易行及结果明确,Bard评分在临床应用中仍可作为评估肝纤维化的一种有价值的方法。
1.5 增强肝纤维化(enhanced liver fibrosis,ELF)评分ELF评分包括三项肝纤维化标志物:透明质酸(HA)、基质金属蛋白酶组织抑制因子-1(TIMP-1)和Ⅲ型前胶原氨基端肽(PⅢNP),计算公式:2.278+0.851ln(HA)+0.751ln(PⅢNP)+0.394ln(TIMP-1)。欧洲肝纤维化学组对ELF评分识别不同阶段肝纤维化的作用进行评估,其诊断AF、SF和无肝纤维化的ROC曲线下面积分别为0.9、0.82和0.76[9]。ELF评分在识别AF方面具有良好的准确性,但对早期纤维化的灵敏度较低。
1.6 FibroMeter NAFLD和NIKEIFibroMeter NAFLD对肝纤维化的诊断准确性高,计算公式:0.4184×血糖(mmol/L)+0.0701×AST(U/L)+0.0008×铁蛋白(μg/L)-0.0102×血小板计数(×109L-1)-0.0260×ALT(U/L)+0.0459×体质量(kg)+0.0842×年龄(岁)+11.6226。该模型最初是在一项对235例NAFLD患者的研究中被提出,对SF的诊断准确率高达91.4%,ROC曲线下面积(0.943)显著高于NFS(0.884,P=0.008)和APRI(0.866,P<0.001)[13]。NIKEI(non-invasive Keoln-Essen-index)也是一种无创肝纤维化评分系统,由年龄、AST、AST/ALT比值和总胆红素构建一个指数来计算AF的可能性P:LogitP=ln(P/1-P)=-24.214+0.225×年龄(岁)+0.056×AST(U/L)+5.044×AST/ALT+3.631×总胆红素(mg/dl)。研究发现,NIKEI诊断AF的ROC曲线下面积为0.968,排除诊断准确性极高,为99%~100%[14]。这两种模型诊断准确性高,但较复杂,相关变量较多,不利于临床推广。
上述模型是低风险、低成本评估NAFLD肝纤维化的有效方法,有助于减少肝活检。APRI、NFS、FIB-4、Bard评分、ELF评分、NIKEI对AF的诊断效能要优于对SF,在临床指南中,NFS和FIB-4常被推荐用于鉴别AF或肝硬化的低或高风险患者[7]。NFS是目前临床上最常用的无创评估纤维化严重程度的模型,局限性是它的低灵敏度,而FIB-4的诊断准确性可能受患者年龄影响,应根据年龄分层采取不同的临界值以提高诊断准确性。APRI更有助于预测而不是识别AF,且灵敏度相对较低,ELF评分在识别AF方面具有良好的准确性,但对早期纤维化的灵敏度较低,相较而言,NIKEI诊断AF的准确性更高,且排除诊断更加可靠。不同于前面几种模型,FibroMeter NAFLD对SF的诊断准确性高,有助于识别早期肝纤维化。
Yang等[15]在近期的一项研究中比较了9种现有的诊断NAFLD肝纤维化的无创评估模型,发现APRI、Bard、FibroMeter NAFLD和NIKEI的诊断准确率更高,可推荐作为诊断NAFLD肝纤维化的指标。并且这4种评分模型的逐步分层组合对AF的诊断效果明显优于单一的评分系统,这为临床实践提供了有价值的参考,这种组合模型可能成为肝活检的潜在替代方法。未来的研究应该着眼于进一步改进这些模型,并通过大型独立的前瞻性队列研究对其进行验证。
2 影像学检查
2.1 瞬时弹性成像(transient elastography,TE)TE是通过测量探头发射到肝脏的剪切波的速度,得到肝脏弹性值(liver stiffness measurement,LSM),从而准确定量地计算肝组织硬度。TE不仅可重复性较强,且可检测约1 cm×4 cm大小的肝脏组织,远大于肝活检所取得的肝脏组织量。目前用于临床的TE技术包括法国的FibroScan和我国的FibroTouch。肥胖会影响FibroScan检测成功率,且随着BMI的增加其失败率越高,为6.7%~27.0%[16]。M探头是最常见的测量剪切波速度的探头,其诊断SF、AF和肝硬化的ROC曲线下面积分别为0.83、0.87和0.92[5]。XL探头通常用于肥胖患者以降低失败率,但有研究显示,在BMI>30 kg/m2的患者中,失败率仍达35%[17]。Wong等[16]研究发现,TE对SF、AF和肝硬化的诊断临界值分别取5.8和9.0、7.9和9.6、10.3和11.5时,灵敏度和特异度均在90%以上。TE对NAFLD肝纤维化的诊断效能优于NFS、APRI、FIB-4等模型,有助于区分无/轻度肝纤维化(F0、F1)与AF[18]。利用LSM能准确检测NASH引起的各期肝纤维化,且与肝纤维化分期呈正相关,纤维化程度越高,诊断效能越好[19]。为了提高诊断肝纤维化的能力,一些研究联合使用TE和血清标志物模型。Loong等[20]将TE与FibroMeter结合,结果显示诊断SF、AF的阳性预测值达到84%和89%。需要注意的是,TE诊断各期纤维化的阈值需要与肝脏病变相结合,在肝脏淤血、胆汁淤积、重度肝脂肪变及明显的肝脏炎症等情况下均可能使LSM升高,从而高估了肝纤维化的程度。
2.2 声辐射力脉冲成像(acoustic radiation force pulse imaging,ARFI)ARFI也是一种评估肝组织的弹性以检测肝纤维化的超声技术,使用常规的超声扫描仪就可以进行该项检测。ARFI对肝纤维化诊断的准确性与TE相似,但检测成功率不受肥胖的限制。ARFI诊断NAFLD患者SF、AF和肝硬化的ROC曲线下面积分别为0.77、0.84、0.84,相应的灵敏度和特异度在90%以上的临界值分别为0.95和1.32、1.15和1.53、1.30和2.04[21]。一项Meta分析中ARFI检测NAFLD患者SF的汇总灵敏度、特异度分别为80.2%和85.2%[22]。然而,ARFI在临床实践中尚未得到广泛推广,相关研究报道较少,其准确性受到严重脂肪变性的影响[23],还需要进一步的研究,以探索在不同程度脂肪变性时的最佳诊断界值。
2.3 剪切波弹性成像(shear wave elastography,SWE)SWE是一种较新的弹性成像技术,它基于二维超声技术,评估聚焦的超声波束经过肝组织的剪切波速度,提供二维、实时、彩色的肝脏弹性图。该方法不需要额外的振动器或探测器,可以集成到常规的超声系统中。研究表明,在NAFLD患者中,SWE诊断SF、AF和肝硬化的ROC曲线下面积分别为0.86、0.89和0.88,临界值分别取6.3和8.7、8.3和10.7、10.5和14.4时灵敏度和特异度可在90%以上[21]。SWE评估肝纤维化程度的准确性要高于TE和ARFI,尤其是在早期肝纤维化患者中。与ARFI一样,SWE的准确性受观察者间变异和饮食的影响。因此,患者检查前应禁食至少2 h,并由操作经验丰富的医师对其进行检查。
2.4 磁共振弹性成像(magnetic resonance elastography,MRE)MRE是利用一种特殊的磁共振技术,获得反映剪切波在组织中传播情况的磁共振图像,对图像进行处理后得到组织弹性的量化图。MRE不受肝脂肪变性的影响,并且可用于伴有肥胖、腹水的患者,它能够检测出各个阶段的肝纤维化,操作失败率在5.6%以下[24]。MRE模型包括2D-MRE和3D-MRE,2D-MRE更常用于NAFLD肝纤维化的评估。一项Meta分析报道2D-MRE诊断SF、AF和肝硬化的ROC曲线下面积分别为0.87、0.90和0.91[25]。3D-MRE对AF的检测性能要优于2D-MRE[26]。与TE、ARFI及常见的生物标志物模型相比,MRE对于NAFLD肝纤维化的诊断都更准确[7]。研究表明,MRE诊断AF的ROC曲线下面积为0.96,灵敏度为84%,特异度为90%,优于Bard评分、NFS和TE[5]。鉴于MRE在纤维化诊断中较高的准确性,它被认为是监测纤维化进展变化和判断纤维化治疗终点的一种理想手段。然而MRE高昂的成本,以及对核磁共振设备的依赖限制了它的广泛应用。
总体上,血清标志物模型价廉、可行、重复性好,诊断肝纤维化有很好的阴性预测值,但阳性预测值相对较低,更有利于排除诊断。MRE对肝纤维化严重程度的诊断有极好的准确性,但由于其高成本和对设备的依赖,临床普及困难。TE是美国FDA认证的评估肝纤维化程度的技术,临床普及率高、费用相对低廉,但检测结果易受肥胖及肝脏病变的影响。ARFI和SWE是较新的成像技术,ARFI评估肝纤维化程度的准确性与TE相似,SWE的准确性高于TE和ARFI,但成本较高,二者在临床实践中尚未广泛应用,需要进一步的研究来证实其实用性。相关研究和指南建议将血清标志物模型与影像学方法结合起来诊断肝纤维化,可进一步提高诊断效能,减少不必要的肝活检。
3 与HCC的相关性
肝纤维化是NAFLD逐步进展至肝硬化和HCC的重要阶段,严重的肝纤维化与HCC的发生有关,是HCC的独立危险因素[27]。近年来的研究表明,一些无创诊断方法不仅可以评估肝纤维化程度,也有助于预测NAFLD患者HCC发病风险,动态了解患者病情进展,从而早发现、早诊断HCC,临床意义重大。
3.1 TELSM是影响HCC发生的独立危险因素,HCC患者LSM明显高于肝硬化患者[28]。有研究报道,当LSM≥24 kPa时,患者数年内进展为HCC的风险显著升高[29]。因此,利用TE技术无创检测LSM以动态监测患者的病情发展变化非常必要,较高的LSM可以提示目前无临床表现、但不久会进展为HCC的患者,提高临床医师和患者的警惕性。一项基于432例不同病因来源(包括病毒性、酒精性、非酒精性、胆汁淤积性及混合病因等)的肝硬化患者的多中心研究发现,LSM≥20 kPa时患者处于发展为HCC的高风险之中,且与20~25 kPa组相比,30~40 kPa组的风险比(hazard ratio,HR)为3.0(95%CI:1.1~8.3,P=0.037),40 kPa以上组的HR为4.8(95%CI:1.7~13.4,P=0.003)[30]。这项研究表明,LSM显著升高与HCC风险增加之间存在联系,TE可以作为一种可靠的无创方法对HCC风险进行分层,有益于动态监测患者HCC风险。关于LSM能够明确提示HCC的临界值,目前的研究结果尚不一致,可能由于研究对象的肝病原始病因、BMI、ALT及操作者水平等因素不完全一致引起。今后需要针对单一NAFLD来源的肝病患者设计严谨、科学的多中心随机对照试验,以进一步明确TE评估NAFLD患者HCC发病风险的作用。
3.2 APRI日本学者进行的一项针对NAFLD患者HCC发病的大规模长期随访研究表明,APRI>1.50的NAFLD患者发生HCC的风险显著升高(HR=25.03,95%CI:9.02~69.52,P<0.001),可以根据APRI对NAFLD患者监测和随访,从而有助于早期发现和治疗HCC[31]。该研究同时评估了Bard评分与HCC发病之间的关联,未发现相关性。
3.3 FIB-4研究表明,FIB-4评分与HCC的总生存期和无复发生存期有显著相关性,高FIB-4评分可能是HCC患者预后的独立危险因素,FIB-4越高,预示着HCC患者的生存率越低[32]。FIB-4评分可作为一种理想的预测HCC预后的无创方法。在Ito等[27]的研究中,NAFLD患者FIB-4≥2.67组总生存率明显低于FIB-4<2.67组(P=0.018),HCC发病率明显高于FIB-4<2.67组(P<0.001),表明FIB-4能有效预测NAFLD患者发生HCC的风险。他们同时研究了NFS,结果显示其预测作用与FIB-4类似。
3.4 ARFIARFI可以获得病灶的剪切波弹性值,能准确反映肝脏局灶性病变硬度的变化,对良恶性肝脏局灶性病变的鉴别诊断有用[33]。肝纤维化进展至肝硬化时,肝实质背景弹性值明显高于正常肝脏,与之相反,HCC的胶原沉积量明显较低,质地远比周围的肝实质软,弹性值很低。Rizzo等[34]基于慢性丙肝患者的研究发现,ARFI检测HCC结节的中位测量值为1.2 m/s,而周围肝硬化组织的中位测量值为2.2 m/s(P=0.05)。可见ARFI也能应用在肝硬化患者的随访中,可以早期识别HCC结节。然而,目前尚缺乏ARFI针对NAFLD患者中HCC早期识别作用的研究,需要进一步研究验证。
3.5 SWE利用SWE测得LSM也可作为预测HCC的独立危险因素,SWE与FIB-4和APRI预测HCC风险的能力相当[35]。Jeong等[36]研究了2D-SWE对预测HCC的作用,发现LSM≥10 kPa的患者发生HCC的风险是LSM<10 kPa患者的4倍。一项纳入273例不同病因慢性肝病患者(包括乙肝、丙肝、NASH、酒精性肝病、自身免疫性肝炎、原发性胆汁性肝硬化)的研究报道,SWE测量HCC患者的LSM(18.65±10.78)kPa显著高于非HCC患者(10.64±8.04)kPa(P<0.0001),ROC曲线下面积为0.791[37]。
3.6 MRE近年来,MRE越来越多地用于慢性肝病相关终点的评估,尤其是HCC的发生。一项对301例慢性肝病患者的病例对照研究显示,MRE测量的LSM是HCC发生的独立危险因素,比值比为1.38[38]。Lee等[39]随访217例代偿性慢性肝病患者,发现MRE测量的LSM是HCC发生的显著预测因子(P<0.001,HR=1.59,95%CI:1.25~2.03),最佳临界值为4.44 kPa。近期的一项研究发现,MRE测量的高LSM(>4.7 kPa)的慢性肝病患者进展为HCC的风险很高,在慢性肝病随访期间使用MRE纵向观察肝硬度变化可以对HCC发生风险进行分层[40]。需要注意的是,这些研究同样存在纳入对象肝病病因不同的局限性,未来需要更多针对单一病因的研究进一步明确。
4 结语
NAFLD患者肝纤维化平均7~10年进展一个等级,可最终发展为肝硬化及肝癌,全因死亡尤其肝病死亡风险随着肝纤维化的出现和进展而显著增加[2]。因此,在NAFLD患者中评估肝纤维化程度对预后判断十分重要。近年来研究出现多种无创方法,有望部分替代肝活组织检查,对不同血清学评估模型和影像学检查联合,可以进一步提高诊断肝纤维化的准确性。一些无创诊断方法不仅可以评估肝纤维化程度,也能有效预测NAFLD患者HCC发病情况,可用于对有高风险发展为HCC的患者进行病情监测。但由于肝脏疾病的复杂性和影响肝纤维化的各种因素,这些方法尚不能完全取代肝活检。相关研究本身还存在一定的局限性,研究数据仍不充分,一些诊断界值的确定尚未达成共识,需要进行更大规模、前瞻性、多中心的研究来进一步评估和验证。