川崎病治疗相关的系统评价再评价
2021-02-27余更生
明 黎,童 可,余更生
(重庆医科大学附属儿童医院心血管内科,重庆 400014)
川崎病(KD)是一种以全身血管炎症为主要病变的儿童急性自限性疾病,病变易累及冠状动脉[1]。未经治疗的患儿中发生冠状动脉病变(CAL),包括冠状动脉瘤(CAA)或冠状动脉扩张(CAD),从而引起缺血性心脏病、心肌梗死,甚至导致患儿猝死的概率高达25%,KD已成为发达国家或地区婴幼儿获得性心脏病的首要病因之一[2-3]。及时接受静脉注射免疫球蛋白(IVIG)联合口服阿司匹林治疗,CAL发生率可降至3%~5%[4]。但仍有10%~20%的KD患儿可发生IVIG无反应,并且此类患儿出现CAL的风险更高[5]。因此,越来越多的研究将目光转向了除IVIG之外的其他治疗方案,如糖皮质激素(GCs)、肿瘤坏死因子α(TNF-α)阻断剂、蛋白酶抑制剂、小剂量甲氨蝶呤和血浆置换等。
系统评价(SR)再评价是全面收集同一疾病或同一健康问题治疗或病因、诊断、预后等方面的相关SR并进行综合研究的一种方法,其可为证据使用者提供更为集中的高质量证据[6]。目前为止,针对KD或IVIG无反应型KD患儿的治疗,国内外已经公开发表了多篇SR,但其研究方法的质量和证据的可靠性尚不明确。因此,本研究应用SR再评价的方法对KD治疗相关SR存在的方法学偏倚及其结局指标证据质量高低进行评价,为临床工作者提供更为集中的高质量证据。以期为临床更好地向KD患儿提供治疗和开展规范化的临床试验研究提供参考。
1 资料与方法
1.1纳入与排除标准
1.1.1研究类型 基于随机对照试验的SR,文献语种限中、英文。
1.1.2研究对象及资料 临床诊断为KD的患儿,包括初治KD和IVIG无反应型KD,以及年龄、性别和种族不限资料。
1.1.3干预措施 干预措施不限,试验组和(或)对照组包括KD治疗的任一措施,如IVIG、GCs、阿司匹林、TNF-α阻断剂等。
1.1.4结局指标 (1)主要结局指标:CAL发生率;(2)次要结局指标:体温恢复状况及不良事件发生率。
1.1.5排除标准 (1)会议摘要、无法获取全文和重复发表的文献;(2)尚处于计划阶段的SR;(3)未对纳入的原始研究进行定量分析;(4)网状meta分析。
1.2文献检索策略 数据库包括Cochrane图书馆、Pubmed、EMbase、CBM、CNKI及Wanfang,搜集KD治疗相关的SR,检索时限均为建库起至2020年2月。英文检索词为mucocutaneous lymph node syndrome、Kawasaki、meta-analysis、systematic review等;中文检索词为川崎病、皮肤黏膜淋巴结综合征、meta分析、系统评价、荟萃分析、系统综述、汇总分析等。
1.3文献筛选与资料提取 2位研究者按照预先制定的纳入与排除标准独立筛选文献后进行数据提取。数据提取内容包括题目、第一作者、发表(或更新)年份、干预/对照措施、结局指标和结论、AMSTAR2质量评价的关键要素和证据质量情况等。过程中若遇分歧,通过讨论或咨询第三者协助解决。
1.4方法学质量评价和证据质量评价 采用AMSTAR2工具[7]评价纳入SR的方法学质量。AMSTAR2工具在AMSTAR工具的基础上进行了更新,确定了16个领域,其中领域2、4、7、9、11、13、15被推荐为可能影响SR结果有效性的重要领域,并基于重要领域存在缺陷的程度评定SR的可信度:没有或者1个非重要领域存在缺陷评为“高”;超过1个非重要存在缺陷评为“中”;1个重要领域加或不加非重要领域存在缺陷评为“低”;超过1个重要领域加或不加非重要领域存在缺陷评为“极低”[8]。采用GRADE评价系统[9-10]对结局指标进行证据质量评价,主要涉及局限性、不直接性、不一致性、不精确性和发表偏倚5个降级因素。随机对照试验被预设为“高级”证据,降1级为“中级”,降2级为“低级”,降3级为“极低级”。以上评价过程由2名研究者分别独立进行,完成后进行交叉核对,如有分歧通过讨论解决或通过第三者裁定。
2 结 果
2.1文献筛选流程及结果 初步检索共获得相关文献660篇,经逐层筛选,最终纳入16篇符合要求的SR文献[11-26]。文献筛选过程及结果见图1。
图1 文献筛选流程及结果
2.2纳入文献的基本特征 纳入的16篇SR文献中,中文文献10篇[11-20],英文文献6篇[21-26],4篇为Cochrane SR[22,24-26];研究发表年份在2004—2019年。8篇SR文献[11-16,23-24]涉及单用或在常规方案中联合应用GCs,6篇SR文献[17-22]涉及剂量不同、给药方式不同的IVIG间的比较,其余TNF-α阻断剂[26]和水杨酸盐[25]治疗的SR各1篇。13篇SR文献描述了对原始研究风险偏倚评估工具,其中7篇使用Cochrane手册推荐的风险偏倚评估工具,5篇使用Jadad量表,1篇使用Juni量表。纳入SR文献的基本特征见表1。
表1 纳入SR文献的基本特征
续表1 纳入SR文献的基本特征
2.3纳入文献的方法学质量评价 4篇为低质量研究,12篇为极低质量研究,见表2。针对关键条目中的符合情况:条目2的符合率为25.0%,条目4为31.3%,条目7为37.5%,条目9、15为43.8%,条目11为87.5%,条目13为62.5%。非关键条目中,条目1的符合率达100.0%,但所有SR均未符合条目10的要求,其余条目的符合情况表现不一,见图2。条目1:研究问题和纳入标准是否包括PICO各要素;条目2:是否报告SR研究方法在实施前就已确定,是否报告与计划书不一致的情况;条目3:作者是否解释了选择SR纳入研究设计类型的原因;条目4:作者是否使用了全面的文献检索策略;条目5:是否由两人独立完成文献筛选;条目6:是否由两人独立完成数据提取;条目7:是否提供了排除文献的清单及排除理由;条目8:作者是否足够详细地描述了纳入研究的基本特征;条目9:作者是否使用合理工具评估纳入研究文献的偏倚风险;条目10:作者是否报告了该SR纳入研究的资金来源;条目11:如进行了 meta 分析,作者是否使用适当的统计方法进行结果合并分析;条目12:如果进行了 meta 分析,作者是否考虑了纳入研究的偏倚风险对 meta 分析或其他证据整合的潜在影响;条目13:在解释/讨论SR结果时,作者是否考虑了纳入研究的偏倚风险;条目14:作者对SR结果中异质性是否给予满意的解释或讨论;条目15:如果进行定量合成,作者是否充分调查了发表偏倚,并讨论了其对研究结果的可能影响;条目16:作者是否报告了任何潜在的利益冲突,包括开展SR所接受的任何资助。
2.4纳入文献的GRADE证据质量分级 运用GRADE系统对纳入SR的105个结局指标进行证据质量评级。结果显示,无高级的证据质量;49个为低级,占46.7%;40个为极低级,占38.1%;中级证据质量为16个,占15.2%。见表3。
图2 方法学质量评价结果符合情况
表2 纳入研究的方法学质量评价结果
表3 纳入研究不同结局指标的证据质量评估
续表3 纳入研究不同结局指标的证据质量评估
续表3 纳入研究不同结局指标的证据质量评估
续表3 纳入研究不同结局指标的证据质量评估
3 讨 论
作者对纳入SR的结论进行了总结:不同剂量IVIG在改善CAL发生方面,2 g/kg单次给药的效果最为肯定,1 g/(kg·d)连用1~2 d与2 g/kg单次给药的效果相似,但其与400 mg/(kg·d)连用4~5 d的疗效存在争议,400 mg/(kg·d)连用4~5 d则不被推荐;在退热方面,2 g/kg单次给药与1 g/(kg·d)连用1~2 d的疗效无差异,均优于400 mg/(kg·d)连用4~5 d。针对GCs治疗KD的研究显示,对于初治KD患儿,不主张单独应用GCs,而在IVIG联合阿司匹林标准治疗中加用GCs可降低治疗失败率和缩短发热时间,但对CAL的发生没有统一的结论;对于IVIG无反应型KD患儿,GCs治疗亦未明确对降低CAL风险的益处。TNF-α抑制剂不能改善CAL的发生,但可降低治疗失败率和不良事件的影响。但作者对KD治疗相关的SR进行再评价发现其方法学质量和结论的证据质量整体较低。
本研究应用AMSTAR2工具对纳入SR进行了方法学质量评价。令人遗憾的是,纳入的SR均存在不同程度的方法学偏倚,主要体现在以下几方面:(1)SR作为一种观察性研究,为降低偏倚风险,研究者应该预先制定好方案,并以PROSPERO或Cochrane协作网注册、期刊发表等形式展现,同时在研究过程中严格遵循,但除Cocharne SR外的所有SR均未提供前期方案;(2)绝大部分SR均未对其原始研究类型的选择进行相应解释,在一定程度上影响了SR作为最高证据来源的严谨性;(3)研究证明将灰色文献排除在SR之外可能会引起发表偏倚并破坏结果的可靠性,对干预措施的效果将高估12%[27],而66.7%的纳入SR并未对相关的灰色文献进行检索;(4)因期刊论文有字数格式的限制,大部分SR仅描述了排除理由,而未列出排除文献的清单,使读者无法验证SR的实施过程是否存在文献纳入偏倚;(5)原始研究的偏倚可影响SR结果的稳定性,在研究存在不同程度的偏倚风险时,应该仅纳入低偏倚风险的研究或对结果进行敏感性分析,深入、清晰地讨论偏倚风险对结果的影响,但半数以上的SR并未做到;(6)尽管大部分SR应用散点图对发表偏倚进行了判断,受纳入研究数量偏少的影响,仍有部分SR未进行发表偏倚评估,可能对其研究结果的真实性造成影响,对读者产生误导;(7)所有SR均未交待纳入原始研究的经费来源,且多数SR尤其是以中文发表的SR未进行声明有无利益冲突,这些都可能会对研究结果产生一定影响。综上所述,KD治疗相关的SR在方法学质量方面仍待改善,建议研究者在进行SR研究时应注意遵守AMSTAR2量表相关条目的要求,严格把控文章的方法学质量。
GRADE作为一项关于循证医学证据质量评价的系统被全球50多个组织、机构认可[28],SR中的证据质量分级反映的是研究者认为的效应估计值正确的把握尺度,GRADE证据等级的高低对指导临床实践具有重要的参考价值。而本研究纳入的SR中仅有2篇[24,26]运用GRADE系统对其结论进行证据质量分级。本研究对纳入SR进行GRADE证据质量分级,发现低级与极低级证据质量占比最高,无高质量证据,表明各结局指标的可信程度不高。导致质量降级的原因包括局限性、不一致性、不精确性及发表偏倚。其中所有结局指标均在局限性方面进行了降级,大多数原始研究尤其是国内进行的,存在随机方法不明确、未描述是否采用盲法、分配隐藏等问题。而KD患儿CAL的诊断主要依靠超声心动图测量冠状动脉内径和体表面积校正的标准值(Z值)[29],超声测量者对结果具有主观影响,有研究表明对主观结果进行估计时,不适当的隐藏方案和未采用盲法分析对干预效果估计值的夸大效果明显[30]。为了给临床医生提供最佳的证据来源,在未来的临床研究中,原始研究应在设计和实施过程中做到真正随机化和隐藏分组,施盲评价疗效,并加强多中心间的沟通合作提高样本量,在报道结果时应遵照国际通用的报告规范。SR的研究者则应注重制定前期方案,尽量排除质量等级低的原始研究,研究方法实施全面,并且对结局指标进行证据质量分级。
本研究的局限性:(1)仅纳入了中英文发表的文献,且未对灰色文献进行检索,可能存在发表偏倚;(2)方法学质量和证据质量评价是一个主观过程,不同研究者对每个因素都有自己的独立判断,可能造成评价结果的偏倚;(3)仅评估了部分对干预措施的评价指标。
综上所述,目前针对KD治疗的SR方法学质量整体较低,并且其证据质量不高。因此,临床实践中应用这些证据进行决策时应当慎重,尚需结合患儿实际情况讨论后应用,期待高质量的原始研究和SR发表,为临床实践提供最佳的证据。