AGREE Ⅱ评价肝脏弹性成像技术诊断肝纤维化的实践指南与循证解读
2021-07-03中山静子程广文陈世耀
陈 洁, 中山静子, 程广文, 丁 红, 陈世耀*
1. 复旦大学附属中山医院消化科,上海 200032 2. 复旦大学循证医学中心,上海 200032 3. 复旦大学附属华山医院超声科,上海 200031
肝纤维化和肝硬化是各种慢性肝病进展的转归。我国是世界上乙肝发病率最高的国家,近年来酒精性肝病、非酒精性脂肪肝、自身免疫性肝病等发病率也不断升高[1]。因此,慢性肝病是目前及未来很长时间内危害我国人民健康的常见疾病之一。目前评价肝纤维化的金标准是肝组织穿刺活检病理检查[2]。然而,有创、昂贵和局限性等诸多因素限制其在临床的应用。因此,利用无创方法评价肝纤维化一直是临床医师关注的热点。
弹性成像通过肝脏硬度值(liver stiffness measurement, LSM)来反映肝纤维化程度,主要包括瞬时弹性成像(transient elastography, TE)、点剪切波弹性成像(point shear wave elastography, pSWE)、二维剪切波弹性成像(two-dimensional shear wave elastography, 2D-SWE)和磁共振弹性成像(magnetic resonance elastography, MRE)等。弹性成像技术具有无创、简便、快捷和可重复等优点,其准确性亦在多种肝脏疾病的大规模临床研究中得到验证。为进一步指导和规范临床应用,全球范围内多位专家组织发布了弹性成像技术评价肝纤维化的共识或临床实践指南。然而这些实践指南质量参差不齐,目前鲜见研究对其质量进行评价。
本研究采用国际公认评价指南质量的AGREE Ⅱ 工具,对全球范围内弹性成像技术评价肝纤维化的专家共识或临床实践指南进行循证学评价,为日后进一步开展肝纤维化临床研究和指南更新提供理论依据。
1 资料与方法
1.1 纳入和排除标准 纳入标准:全球公开、符合指南定义、中英文发表的有关弹性成像技术评价肝纤维化的专家共识或临床实践指南(指南如有更新,纳入更新版指南)。排除标准:指南摘要、指南解读、指南翻译、技术操作指导和知识手册。
1.2 文献检索 由2名研究者独立完成文献检索和筛选,并进行交叉核对,如遇分歧则经讨论解决。手工检索检索CNKI、VIP、CBM、万方数据库网站,中文检索词包括弹性成像、肝纤维化、共识和指南;检索PubMed、Elsevier ScienceDirect、OVID、Web of Science、EMbase数据库网站和WHO官网、美国国家指南文库(NGC)、国际指南联盟(GIN)、英国国家卫生和临床示范研究所(NICE)网站,英文检索词包括elastography、stiffness、fibrosis、liver fibrosis、consensus、guideline、recommendation。检索截止日期为2020年9月1日。
1.3 文献评价 文献评价和统计学分析由3名研究者独立完成。3名研究者分别来自循证医学中心、超声科和消化科,均具备循证医学专业知识。正式评价前对其进行培训,确保每位评价员对AGREE Ⅱ 各个条目的理解正确、一致。提取纳入指南的基本信息,采用AGREE Ⅱ对指南进行评分,分为6条项目:范围和目的、参与人员、制订严谨性、表达清晰性、应用性、独立性,共23个条目和2个总体评估条目。每个条目最低为1分(表示强烈不赞成、完全不符合标准或未提及),最高为7分(表示强烈赞成、完全符合标准)。各项目最终得分(标化百分比)=(实际分-最低分)/(最高分-最低分)×100%。
1.4 评价一致性检验 采用SPSS 16.0软件和Excel 2017软件进行统计学分析。采用组内相关系数(intraclass correlation coefficient,ICC)对3名研究者评分结果的一致性进行检验: ICC<0.40,说明评价者间一致性差;0.40≤ICC≤0.75,说明一致性中等;ICC>0.75,说明一致性好。
2 结 果
2.1 纳入指南的基本特征 初步检索获得文献63篇,逐层筛选后最终纳入9篇指南(图1),包括中文指南3篇、英文指南6篇。指南发布或更新时间为2014年至2020年。纳入指南的相关信息见表1。
表1 纳入指南的基本特征
图1 指南筛选流程
2.2 AGREE Ⅱ 评价结果 一致性检验中,3名研究者的ICC值为0.84±0.43;对9部指南评价的ICC值均大于0.75,表明一致性很好。
结果(表2)显示:“范围和目的”得分中位数为78%,表明读者能快速了解自己的问题能从指南中获取答案,如目标患者的疾病种类、检测具体方法等。“参与人员”得分中位数为30%,仅有2部指南得分在50%以上,可见指南在制定时未关注目标人群的观点,参与人员未全部涵盖消化科、超声科、病理科和放射科等领域。“制订严谨性”得分中位数为33%,仅美国胃肠病学会(AGA)的得分超过50%(77%),说明大多指南的制定过程不够严谨,主要问题为证据的检索不全面或未描述检索策略,证据评价和推荐意见的形成不够清晰,受主观因素影响较大,同时缺乏指南改进意见及不足描述。“表达清晰性”得分中位数为81%,可见纳入指南的推荐建议明确,重点突出,读者能迅速识别重要的信息。“应用性”得分中位数为42%,纳入指南多未提供实施工具或建议,未比较不同技术的优势和劣势,仅亚太肝病学会(APASL)指南比较了成本效益。“独立性”得分中位数为47%,中文指南得分显著低于国外指南,普遍缺乏资金来源、公司赞助情况及指南小组成员利益冲突声明的描述。其中,AGA指南是推荐程度最高的指南,除“独立性”外,其余项目得分均在60%以上,其不足之处在于较多指南小组成员受超声公司赞助,使指南独立性受到影响。
表2 AGREE Ⅱ 评价结果
3 讨 论
我国是世界上乙肝发病率最高的国家,我国有约9 300万乙肝病毒携带者[3-4],而全球范围内慢性肝病的发病率高达12.5/10万人[5]。慢性肝病如不及时干预,将发展为进展期肝硬化,甚至肝癌。对肝纤维化的准确评价能早期发现高危患者,指导临床治疗,并为患者的临床随访和生活指导提供理论参考。肝穿刺活检是评价肝纤维化的金标准,但属于有创性操作,需要住院完成检查,同时医疗花费相对较高,患者接受度有限,且单一活检常不能全面反映肝脏的病变程度,以上因素限制了其在临床的应用。随着肝脏弹性成像技术无创评价肝纤维化的广泛实施,各国发布了临床实践指南,旨在协助和规范临床操作。
3.1 纳入指南的优劣 AGA在2017年发布相关指南,是本次评价中得分最高的一部指南。AGA探讨了TE技术的临床应用,采用系统的检索策略进行文献检索,从方法学角度清楚描述证据的强度、局限性和形成建议的方法,在发布前经过外部专家评审,并考虑到目标人群的观点。因此,AGA提供了严格的、基于循证医学依据的推荐建议,但这些建议多为中等推荐和低质量证据(GRADE分级),提示亟待更多高质量的临床研究证据,且AGA指南对于临界值的评估局限于单个阈值(是否存在肝纤维化),目的是减少假阴性(漏诊肝纤维化),而非多个序贯阈值(F0~4)。
澳大利亚肝病学会(ALA)在2014年发布了首个实践指南,然而由于原始研究有限,仅给出了TE检测在乙肝和丙肝患者中的应用意见,内容清晰性和应用性一般,参与人员均来自于澳大利亚的胃肠病科,严谨性亦较差,也缺乏证据质量和推荐程度的分级标准。
欧洲肝病学会(EASL)和拉丁美洲肝病学会(ALEH)在2015年联合发布了无创诊断肝纤维化的指南,对血清学指标和各种弹性成像技术进行了分析,对TE的准确性予以肯定,但指出其在腹水和肥胖患者中应用受限,同时指出pSWE和2D-SWE技术可能同样有效,但由于证据不足未与TE比较优劣。
APASL在2016年发布指南,评价多种肝纤维化的无创或有创检测方法,认为TE在诊断丙肝患者肝纤维化方面较肝穿刺活检更具有成本效益优势,pSWE与2D-SWE技术对肝纤维化分期的诊断效果与TE相当。该指南同时探讨了不同检查方法的局限性。
世界超声医学生物协会(WFUMB)在2015年发布了首个指南,当时证据质量差、异质性大,于2018年发布更新版指南,纳入更多全球范围内的研究证据,以OCEBM系统对证据质量进行分级,首次对脾脏硬度检测和SWE技术在脂肪肝患者和患儿中的应用提出建议。
中文指南方面,《中华肝脏病杂志》在2013年组织全国部分专家,结合当时的研究资料,首先发布了TE的临床应用专家共识,并于2015年进行更新。随着更多研究结果的公布,中华医学会感染病学分会联合肝病学分会、中华医学会超声医学分会在2018年分别发布了TE、2D-SWE的临床指南。指南说明TE检测目前更多地由消化科医师完成,而2D-SWE检测主要由超声科医师开展。
3.2 弹性成像临床研究的注意事项 关于弹性成像的临床研究,在研究设计、实施、分析和撰写论文阶段须注意以下因素。(1)目标技术的种类: TE、pSWE、2D-SWE、MRE ,包括仪器型号、操作步骤、探头类型和质控标准。(2)研究对象:通过详实纳入排除标准明确目标人群,提供研究对象的基线特征,包括肝病种类、体质量指数、合并症、肝功能和血小板水平等。(3)研究环境:如医院、研究所环境和操作者身份等。(4)研究设计:理想的诊断试验研究应为前瞻性研究,并且连续纳入研究对象,回顾性的队列研究和病例对照试验在研究设计层面已造成偏倚,可能高估目标技术的诊断效能。(5)混杂因素:避免选择偏倚,如诊断试验的研究对象应具有代表性,应包括各个病期(F0~4)的肝病患者,可用动态网络分析(dynamic actor network analysis,DANA)对患病率不同造成的疾病谱偏倚进行统计学校正;混杂偏倚,如禁食时间、肥胖、腹水等;测量偏倚,如操作人员数量、经验水平,以肝穿刺病理活检作为金标准时,需提供病理取材的时间、标本质控等信息。(6)统计学分析:由于F2、F3期阈值接近,区分度小,用受试者工作特征曲线下面积(AUC)无法比较不同检测方法的诊断效能差异,此时可选用更稳定的似然比;如果研究目的为评估诊断准确度,可通过诊断准确性研究报告规范( STARD 2015) 进行核对。
综上所述,实践指南是对临床工作最有指导价值的资料。高质量临床实践指南的形成需要高质量的原始研究证据,建议多关注证据等级高的临床证据,例如Cochrane协作网的系统综述。此外,提高临床研究的准确性和可信度至关重要。