AGREEⅡ系统对现行国内外氧疗指南的评价分析
2020-06-19周慈航竺易君柴荣胡珍丽韩一平
周慈航 竺易君 柴荣 胡珍丽 韩一平
1长海医院全科医学规培基地,上海200433;2长海医院呼吸与危重症科,上海200433
18世纪80年代,人类发现氧气的存在,之后认识到氧在生命活动中的机制,氧气逐渐被应用到各种疾病的治疗中。氧气疗法简称氧疗,是指以高于环境空气(20.9%)的浓度给氧,以治疗或预防缺氧的症状和表现。作为临床上应用最为广泛的治疗手段之一,氧疗的合理性与规范性几乎很少得到评估,临床用氧的安全可能存在隐患[1]。氧疗指南的制订,对于规范临床诊疗过程、提高诊疗水平、减少不同医疗机构之间的诊疗差异及患者不良预后等方面具有重要作用[2]。国内外已有各式各样的氧疗指南,特别是近年来随着对氧疗认识的不断深入和重要性不断增加,新的指南层出不穷。但不同指南的异质性、评价策略不同,质量参差不齐,可参考性有待商榷。因此,对指南质量的综合评价有助于发现存在的问题,进一步规范临床诊疗过程。国际上现行的指南评价工具多达22种,各类工具的条目、内容及评价效能各不相同、良莠不齐。其中以临床指南研究与评估系统Ⅱ (appraisal of guidelines for research&evaluation Ⅱ,AGREEⅡ)被认为最具科学性和可行性,得到推广和广泛应用,被认为是指南质量评价的金标准[3-4]。AGREE评分系统由AGREE 协作组织集合13 个国家的专家力量于2003年开发,并于2009年发布第二个版本AGREEⅡ[5]。最近一次更新为2017年12月[6]。本研究拟采用AGREEⅡ系统对现行国内外氧疗指南进行评价分析,旨在进一步规范临床合理用氧,相关内容国内外尚未见报道。
1 资料与方法
1.1纳入与排除标准 纳入标准:(1)纳入2003-2019年氧疗综合诊治指南; (2)同一组织颁布的指南若有更新,则选择更新版纳入和评价;(3)文种限英语、汉语。排除标准:(1)非中英文发表的指南;(2)临床指南的介绍、评析、应用指导、应用效果评价等;(3)专家共识;(4)重复发表的指南;(5)高压氧治疗指南;(6)氧疗护理;(7)已被替代的旧版指南;(8)全文无法获取;(9)内容无明显相关。
1.2检索策略
1.2.1数据库 检索万方、中国知网、维普、中国生物医学等中文数据库和Pub Med、Cochrane、Elsevier、 Ovid、 Medline、 Cochrane Library、Embase、EBSCO 等英文数据库。同时补充检索了医脉通、谷歌学术和百度学术。
1.2.2检索词 中文检索词包括 “氧疗”“指南”“共 识”; 英 文 检 索 词 包 括 “guideline”“guidelines”“recommendation”“oxygen therapy”“oxygen inhalation therapy [Mesh]”。
1.2.3检索时间 检索时间限定为2003年1月至2019年1月。
1.3质量评价 AGREEⅡ系统包括范围和目的、参与人员、严谨性、明晰性、实用性与独立性等6个领域,由23个主要条目和2个总体评估条目构成。所有条目的评分为7分制等级,评分为1~7分,1分表示强烈反对,7分表示强烈赞同。当该条目报道不能满足全部标准或条件时,评估者则根据不同情况给予2~6分[5]。最后的总体评估部分,每个评估员结合6个领域得分情况对指南进行全面评价,并给出他/她是否推荐在临床实践中使用该指南,见表1。为增加评价的可靠性,确保每位评分者熟悉使用工具、对各个条目评分标准的理解基本一致,利用网上提供的培训工具对4位评估员进行评分培训 (http://www.AGREEtrust.org/resource-centre/AGREE-Ⅱ-training-tools/)。如存在分歧或模糊之处,进行充分讨论,必要时咨询循证医学相关专业人士。然后每名评估员采用AGREEⅡ工具分别对纳入指南评分,独立作业,在评估过程中没有沟通或协商。最后由独立评审员进行评分收集、整理和统计分析。
根据AGREEⅡ评分计算方法,每个领域得分等于该领域中每一个条目分数的总和,并标准化为该领域可能的最高分数的百分比。具体计算公式如下:各领域最终得分(标化)= (实际得分-最低可能得分)/ (最高可能得分-最低可能得分)×100%[5]。每个领域的得分情况分为良好 (≥80%),可 接 受 (60% ~79.9%),低 (40% ~59.9%),或非常低(<40%)[7]。参照指南推荐等级分级[8],若6个领域得分均≥60%,可不更改直接推荐,则评为A 级;若3个及以上领域得分≥30%,但存在<60%的领域,需要修改完善,为B级;若3个及以上领域得分<30%,暂不推荐,为C级。
1.4统计学分析 采用描述性统计分析法对每个评价者的总分和每个领域的得分进行分析。应用SPSS 24 软件计算组内相关系数 (intraclass correlation coefficient,ICC),评估4 位评价员的评分一致性。ICC 评定标准为:差 (ICC≤0.20);一般 (0.20<ICC≤0.40);中等 (0.40<ICC≤0.60);良好(0.60<ICC≤0.80);非常好 (ICC>0.80)[9]。比较各指南得分情况采用多配对样本的非参数Friedman检验。P <0.05为差异有统计学意义。
2 结果
2.1检索结果 检索出相关文献247篇,排除重复发表文献86篇,非中英文发表的文献15篇,排除非指南/共识、高压氧、氧疗护理、旧版指南、不相关、结果无法使用等,最终符合纳入标准的指南有8 篇,具体流程见图1。研究提取了指南标题、出版年份、发布国家、出版组织、作者数量、更新周期、参考文献数量、证据评价工具等相关信息,见表2。发布国家分别是英国2 篇,美国2篇,爱尔兰1篇,澳大利亚&新西兰2篇,中国1篇。内容上2篇为儿童用氧指南,3篇成人家庭氧疗,3篇成人急诊氧疗。
表1 临床指南研究与评估系统Ⅱ系统评分表
2.2不同评分者一致性分析 4位评分者对8篇指南的AGREEⅡ评价结果ICC 均>0.80 (P值均<0.000 1),根据ICC评定标准,可以认为4位评估员的评判标准一致性非常好,见表3。
图1 文献筛选流程
2.3AGREEⅡ评价结果 8篇指南在6个领域的得分情况,Friedman 检验统计量的观测值为27.008,相应的概率P 值为0.000 1。
2.3.1范围和目的 这一领域包括指南的总体目标、指南所涵盖的健康问题以及指南所针对的人群[5]。该领域中7篇指南的质量均≥80%,达到良好水平,仅1篇 (AARC 2007)得分65.28%为可接受水平,平均得分[(80.38±6.45)%],变异性最低,说明该领域各指南总体结果较好。
2.3.2参与人员 该领域评估是否包括了所有相关专业的人员,是否寻求了患者对制订指南的观点和选择意愿,是否明确规定指南的使用者[5]。指南在这一领域的得分普遍欠理想,总体平均分为[(76.91±13.46)%];8篇指南均未或极少寻求目标人群,特别是患者代表的观点和偏好。
2.3.3严谨性 开发的严谨性被认为是所有指南评估中最重要的领域,所含条目最多,包括检索方法、证据选择的标准、证据的强度和局限性、推荐意见的形成、利弊考虑、推荐意见和证据之间的联系、外部评审和指南更新步骤等。这一领域的得分普遍较低,平均得分[(57.88±25.4)%]。其中2篇(AARC 2007,CMDA 2013)质量非常低,得分<40%;5 篇指南严谨性勉强可接受;仅1 篇(BTS 2015)达到良好水平,说明各指南制订的严谨性普遍不高,有待提高。
表2 纳入指南的基本信息
表3 纳入指南的评价一致性分析结果
2.3.4明晰性 这一领域的重点是建议是否具体明确,对疾病或健康问题的管理有不同的选择,关键建议易于识别[5]。7篇指南的质量均≥80%,达到良好水平,仅1篇 (AARC 2007)得分65.28%为可接受水平,平均得分[(85.07±8.87)%],在6个领域中得分最高,说明6个领域中纳入指南的表达性总体最好。
2.3.5实用性 该领域涉及指导性实施的促进和阻碍因素、成本影响和监督、审计标准[5]。8篇指南平均得分为[(69.01±22.29)%],包括CMDA 2013得分21.88% (非常低),AAPC 得分57.29%(低),TSANZ 2016得分62.50% (可接受),4篇指南得分85.42% (良好水平),变异性较大,进一步说明各指南的实用性参差不齐。
2.3.6独立性 本领域评估供资机构如何影响指南内容,以及是否记录和处理了所有成员的利益[5]。评估结果显示,该领域平均得分[(60.16±37.62)%],各指南结果之间具有最高的变异性(SD=37.62%),AARC 2007和CMDA 2013得分都非常低,分别为6.25%,4.17% (最低);而BTS 2015得分最高91.67% (良好水平)。
2.3.7总体质量评估 5篇指南评级为A 级,分别是BTS 2015、TSANZ 2016、Irish 2017、ATS 2018、BMJ 2018,可直接推荐使用。而AARC 2007和TSANZ 2014 2篇指南评级为B,需要加以完善修订;CMDA 2013存在3个领域得分<30%,故不推荐使用,见表4。与早期相比,新发布的指南各领域得分普遍更高。
3 讨论
医用氧气是医疗保健中最常用的药物之一,在许多肺部和肺外疾病中被广泛使用。然而,不适当的使用不仅对患者的经济成本和舒适度产生影响,还会因过量而造成潜在伤害[18]。目前国内氧疗多处于随意性较强的状态,其中不乏一些模糊、错误、甚至有害的观念和做法[19]。BMJ 2018专家组提出:当血氧饱和度>9 6%时补充氧气可能会使病死率增加1%左右[17]。因此,急需基于研究证据的氧疗指南来降低临床实践的不一致性,规范医疗行为,使患者得到合理的治疗。
表4 纳入指南的临床指南研究与评估系统Ⅱ评分结果分布情况
本研究采用AGREEⅡ系统提供2003-2019年与氧疗使用和管理相关的临床操作指南的全面质量评估。分析显示,领域1 “范围和目的”和领域4 “明晰性”得分较高,且在所有调查的指南中质量得分均>60%。得分最低的领域是“严谨性”和“独立性”,6个领域各指南得分情况见图2。5篇指南推荐级别为A 级,2篇为B 级,1篇为C 级。总体上纳入的国内外氧疗指南质量较高,但在“参与人员”、“严谨性”及“独立性”等领域仍有待提高。大多数指南在患者和公众代表参与方面都存在不足,并且没有充分描述外部审查的方法。此外,评估人员之间良好的一致性也支持我们结果的有效性。
图2 8篇指南各领域得分情况
通过研究发现,多数高质量的氧疗指南是由具有更多潜在研究资源和资金的国家(如英国、爱尔兰、美国等)制订的。而且,西方国家对氧疗的研究和指南的开发普遍早于国内,且对氧疗使用及管理的重视程度远远超过我国。1991年美国呼吸治疗协会发布了 《住院急症患者氧疗临床实践指南》[20],首次对氧疗进行完整而具体的阐述,并提及氧疗的并发症,指出高流量吸氧的危害。2001年英国西北区氧疗协作组发布了针对呼吸困难患者的急症氧疗指南,包含院前处理、急诊及住院早期等不同阶段的氧疗规范[21]。我国卫生健康委员会(曾用名卫生部)于2005年发布了首个针对特殊人群制订的氧疗指南[22],规定了早产儿和低体质量新生儿给氧的指征、方式和注意事项,旨在降低早产儿视网膜病变的发生,并于2013年进行完善和修订[11]。2008年英国胸科学会制订并发布了较为完善、详细和权威的急症氧疗指南[23];2015年又补充发表了相应的家庭氧疗指南[13]。它的适用范围扩大到患有各种长期呼吸系统疾病的患者,以及目前正在接受家庭氧气治疗的其他患者群体,如心力衰竭和丛集性头痛患者。该指南探讨了使用不同形式氧气和患者相关预后(如对死亡率、症状和生活质量的影响)的证据基础。此后,规范化氧疗越来越受到临床的重视,各国相继制订了不同疾病情况和特定人群的氧疗规范,如TSANZ 2016、Irish 2017、ATS 2018、BMJ 2018等。众多的氧疗指南中,以英国胸科协会发布的指南最为经典,其出版的急诊氧疗使用指南填补了急诊这一领域的空白[24],可谓开启了临床氧疗规范的新篇章,具有里程碑和划时代意义。不管是其内容还是报告格式上对我国氧疗指南的开发、制订都具有极大的可借鉴之处和参考价值。
同时,本研究尚存在一些局限性。(1)AGREEⅡ评估不关注指南与公布的证据的一致性[25],也没有直接评估指南内容的质量[26]。 (2)7分量表并没有为每个项目的中间分数设定评分标准,没有用于区分质量高低的阈值分数[5]。(3)我们的研究仅限于以英文和中文发表的指南,导致潜在的选择偏倚。
近年来国内规范氧疗的呼声不断涌现,陆续有相关文章发表。2018年我国急诊氧气治疗专家共识组发表了《急诊氧气治疗专家共识》[27],这是国内首个关于急症氧疗的指导性文件[19]。同时,我们还应看到,对于氧疗的具体指导性建议缺乏统一规范是一个共性问题。我国当前临床实践指南开发不管其发展来源如何,都存在一些方法上的缺陷。指南制订者应采用AGREEⅡ工具,尤其是中国指南的制订[27]。刘道践等[28]采用Delphi法在借鉴国外成熟经验的基础上初步建立了一个适应中国自身的临床指南评价工具,对于今后我国临床指南的开发具有一定指导意义。AGREEⅡ应用在国内氧疗指南的制订过程以及制订报告这一领域有相当大的空间。我们建议指南开发者根据AGREEⅡ的原则,努力提高指南制订过程的质量。有关部门尽快制订符合国情的指南方针、推广氧疗处方的应用和实施目标氧疗策略,这对推进我国氧疗规范化进程具有重要的意义[1]。此外,在卫生政策专家的参与下进行实施分析有助于将证据转化为实践。例如,在制订指南/共识的早期,让政策层面的工作参与进来,有助于创造机会和开展合作[29]。指南开发者应共同努力提高指南的质量和一致性,以提高其在临床操作中的适用性。
利益冲突所有作者均声明不存在利益冲突