糖尿病初级保健临床实践指南方法学质量评价*
2021-04-28孙婧文黄雪梅徐晓媛
孙婧文,杨 帅,黄雪梅,徐晓媛
(中国药科大学,江苏 南京 211198)
糖尿病属慢性疾病,患病率高,患者经济负担重。国际糖尿病联盟(IDF)数据显示,2019 年全球20 ~79岁糖尿病患者数为4.63 亿,中国居首,造成经济负担7 603 亿美元[1]。初级保健干预措施能对2 型糖尿病患者的某些生化指标、临床症状、心理及健康状态相关的生活质量结果产生积极影响[2]。药学服务是初级卫生保健服务的重要组成部分,社区药师也扮演着越来越重要的角色[3-4]。我国糖尿病知晓率、治疗率和控制率均较低,防治任务艰巨,基层糖尿病防治能力和同质化水平有待提高,不同地区、不同医疗机构间差异明显[5]。实践指南是基于系统评价的证据并平衡不同干预措施的利弊形成的,能为患者提供最佳保健服务的推荐意见[6]。糖尿病初级保健临床实践指南与常规糖尿病防治指南相比,主要区别是指导其使用者(基层医师)能在诊疗水平、资源有限、经济条件较差的情况下,切实可行地开展有针对性的医疗行为[7]。指南的方法学质量是其能否高效推广、应用及推荐意见能否顺利实施的关键因素[8]。指南研究与评价Ⅱ(AGREE Ⅱ)系统可用于指南的制订和评价[9]。已有研究相对集中于糖尿病临床实践指南、护理指南的方法学评价,对比糖尿病专家共识和指南的质量差异[10-12],但较少关注应用于初级保健的糖尿病临床实践指南质量水平的评价。本研究中旨在运用AGREE Ⅱ系统对糖尿病初级保健临床实践指南的方法学进行质量评价,为其使用者及未来糖尿病初级保健临床实践指南的制订提供参考。现报道如下。
1 资料与方法
1.1 检索策略
以“Practice Guidelines as Topic”[Mesh],“Practice Guideline”[Publication Type],“guideline*”,“diabetes”,“Primary Care”,以及“基层”“糖尿病”“指南”等为检索词,在CNKI,PubMed,Web of Science,CBM,WanFang 数据库中进行检索,不限定语言,检索时间为自建库至2020 年2 月1 日。同时,手工检索Guidelines International Network(GIN),National Guideline Clearinghouse(NGC),National Institute for Health and Clinical Excellence(NICE),Scottish Intercollegiate Guidelines Network(SIGN)4 个指南数据库获取相关指南;检索International Diabetes Federation(IDF),World Health Organization(WHO)等国际组织网站及“百度学术”网获得相关指南;最后补充检索“医脉通”网。
1.2 纳入与排除标准
纳入标准:糖尿病初级保健相关指南,指南中需在初级保健中含有有关糖尿病预防、诊断、治疗、预后等的推荐意见;语言为中文和英文。
排除标准:专家共识;若存在新旧2 个版本指南,则排除旧版;非中英文发表或翻译版本的指南;重复发表的指南或非完整性指南;指南解读、应用;1 型糖尿病、妊娠期糖尿病、2 型糖尿病并发症指南;地区性、中医、伦理指南。
1.3 数据提取与质量评价
文献筛选分为题目、摘要筛选和全文筛选2 个阶段。确定纳入指南后,研究人员根据预先制订好的信息提取表对纳入指南进行数据提取。文献筛选与数据提取均由2 名研究人员独立进行,遇到分歧时双方讨论解决或请第三方介入。
2 名研究人员分别使用AGREE Ⅱ系统对纳入指南进行评价,为保证评价人员对评价条目及纳入指南的理解保持一致,正式评价前随机抽取2 篇指南进行预评价,对评价结果进行交流与讨论。AGREEⅡ系统包括范围和目的、参与人员、严谨性、清晰性、应用性、独立性等6 个领域23 个主要条目,各条目均按7 分划分等级(1 分代表很不同意,7 分代表很同意),并分别计算各领域的质量分值。每个领域得分等于该领域中每个条目分数的总和,并标准化为该领域可能的最高分数的百分比,即各领域得分=(实际分-最低分)/(最高分-最低分)[9]。
AGREE Ⅱ系统尽管已被广泛使用,但尚无统一标准来解释得分。为了促进与现有研究的一致性,本研究中采用以下方法:若一个指南中得分≥50%的领域有5 ~6 个,则被强推荐;有3 ~4 个,则被推荐;有1 ~2 个,则被弱推荐;若为0 个,则不被推荐[13]。
1.4 统计学处理
采用SPSS 19.0 统计学软件分析组内相关系数(ICC)值,其值<0.4 代表一致性较差,0.4 ~0.75 代表一致性一般,>0.75 代表一致性较好。采用Excel 软件计算纳入指南各领域得分、均值和标准差。
2 结果
2.1 指南识别与纳入
检索获取946 篇文献,运用Endnote 软件去除重复文献后获得文献930 篇,阅读题目和摘要后[8]排除890 篇,阅读全文后排除27 篇,最终纳入符合标准指南的文献13 篇[14-25]。详见图1。
图1 文献检索流程图Fig.1 Flow chart of the literature retrieval
2.2 纳入指南的基本情况
纳入指南从发布国家(或所属组织)来看,分别属中国(4 篇,30.77%),美国(2 篇,15.38%),澳大利亚(2 篇,15.38% ),英 国(1 篇,7.69% ),国 际 组 织(3 篇,23.08%);发布时间为从2001 年至2019 年,其中发布于2010 年 前、后 的 分 别 有2 篇(15.38% ) 和11 篇(84.62%),并有8 篇于2015 年后发布,时效性较好;发表在期刊上的指南为4 篇(30.77%),其余指南在其指定机构的官方网站上发布;纳入指南篇幅在8 ~232 页间,平均72 页,6 篇(46.15% )在50 页 以 上,10 篇(76.92%)在20 页以上。在指南类型和适用人群方面,8篇(61.54%)为综合性指南,即包含了预防、诊断、治疗、预后、康复等2 种或2 种以上类型推荐意见的指南,7 篇(53.85%)适用于2 型糖尿病患者。详见表1。
2.3 纳入指南方法学质量评价
2 名评价人员的评价结果的一致性良好,ICC 值为0.819[95%CI(0.717,0.885),P <0.05]。详见表2。
范围和目的:该领域平均值为6 个领域当中最高,大多数指南在范围和目的领域做得相对较好,所有指南得分≥50%。该领域总体质量平均得分为83%,分值区间53% ~97%。该领域主要涉及指南对社会和患病人群可能的健康影响,部分指南能详细描述指南的目的,指南预期得到的益处应针对明确的临床问题或卫生项目,准确概括指南所应覆盖的目标人群。
表1 纳入指南基本信息Tab.1 Basic information of included guidelines
表2 纳入指南得分百分比及推荐等级(%)Tab.2 Domain scores and recommendation grade of included guidelines(%)
参与人员:该领域平均值在6 个领域中属中等水平,61.5%的指南在参与人员领域得分不足50%,仅5部指南得分≥50%。该领域总体质量平均得分为47%,分值区间22% ~89%。对于指南开发过程中涉及的专业人员,2 部评分最高的指南包含指南开发小组的每个成员姓名、学科等信息,除本学科专家外,还至少包括了1 名方法学专家;同时在指南中描述获取患者或公众的观点和选择意愿的方法。多数指南明确规定指南的适用者,方便读者清晰判断自己是否适合其使用。
严谨性:该领域为指南的核心领域,平均值为6 个领域当中的最低,大部分指南做得不好,仅4 部指南得分≥50%。该领域总体质量平均得分为25%,分值区间0 ~66%,其中1 部指南得分为0。大多数指南未提供检索证据的详细策略、检索时纳入和排除证据的标准;没有说明证据强度和局限性、形成推荐建议的方法和如何得出最终的决定;指南在开发时也没有考虑推荐建议对健康的益处、不良反应和危险。5 部指南明确给出了更新的日期或时间间隔。
清晰性:该领域平均值在6 个领域中较高,大部分指南做得较好,所有指南得分≥50%。该领域总体质量的平均得分为81%,分值区间67% ~92%。大多数指南推荐建议明确,不含糊,考虑到糖尿病在初级保健中临床筛查、预防、诊断或治疗存在各种不同的选择,并用流程图、黑体字等标识出重要的推荐建议,便于使用者快速找到最相关推荐建议。
应用性:该领域平均值在6 个领域中属中等水平,少部分指南在应用性领域做得一般,9 部指南得分≥50%。该领域总体质量得分的平均数为59%,分值区间19% ~90%,此领域各指南分值差异较大。2 部指南未提供应用推荐建议时可能用到的工具,未提供附加的材料使之易于推广实施。4 部指南考虑了推荐建议应用时潜在的额外相关资源,可能对指南的实施有影响。
独立性:该领域平均值在6 个领域中较低,大部分指南在独立性领域得分偏低,且差异较大,有4 部指南得分≥50%。该领域总体质量的平均得分为37%,分值区间0 ~92%,2 部指南得分为0。4 部指南在指南中明确表示赞助单位的观点不影响指南的内容;并记载和公布指南开发小组成员的利益冲突。
3 讨论
根据《中国防治慢性病中长期规划(2017—2025年)》[26],基层将成为糖尿病防治的重要组成部分,但纳入研究的我国用于指导和规范基层糖尿病防治的2 部指南[14-15]仅范围和目的、表达的清晰性2 个领域评分≥50%,指南评价等级均为弱推荐。在制订过程中缺乏系统的检索、筛选及质量等级评价阐述。我国指南相对较少采用系统评价证据支持推荐意见[27]。虽引用参考文献,但未严格执行其开发程序,判断其可靠程度和适用性较困难[11]。
纳入指南中,发布国家为美国[17]、英国[22]及国际组织IDF[24]、WHO[25]的4 部指南评价等级为强推荐,在6 个领域评分中,仅英国版指南在独立性领域评分不足50%。从方法学质量角度来讲,这4 部指南整体评分较高,其报告质量较高。
药师作为糖尿病初级保健的参与者,使用者仅为药师的糖尿病初级保健指南不多见,纳入研究的3 部中有2 部在范围和目的、清晰性、应用性3 个领域评分≥50%;1 部[20]在范围和目的、参与人员、清晰性、应用性4 个领域评分≥50%。此3 部指南评价等级为推荐。严谨性作为核心领域,得分较低,无明确表明指南的制订是基于当前可得证据的系统评价。纳入使用者仅为药师的糖尿病初级保健指南方法学质量一般。
针对所纳入现行糖尿病初级保健临床实践指南方法学质量评价表明,以提高糖尿病初级保健临床实践指南方法学质量为目的时,制订者在未来的指南中应注意:1)考虑目标人群对卫生服务的需求。考虑目标人群观点和需求及潜在的资源投入问题,可降低指南可及性、利用度及实用性方面的缺陷[11]。2)指南给出明确的推荐意见。明确的推荐意见比证据级别对决策者的影响更直接,可帮助决策者在尽可能短的时间内了解采用某干预措施可能带来的利弊,从而增强决策者的信心[28]。3)提供指南更新的时间间隔或方式,便于及时获得最新版本指南指导实践,通常认为指南发布间隔以3 年左右为宜,因为新出现的证据可能改变指南的推荐意见[29]。4)充分考虑利益冲突。利益冲突包括可能影响组织或个体不受束缚解决科学问题能力的经济、知识产权或其他关系[30]。利益冲突可能对指南或共识的内容造成较大影响,因此将利益冲突声明并进行管理十分必要[31]。
本研究亦存在一定局限性。首先,AGREE Ⅱ系统在评价指南时不涉及对指南具体内容的评价,且对指南的推荐等级仅依据达到标准领域的个数,未衡量不同领域和条目所占权重[32]。其次,由于语言限制,仅纳入中文和英文的糖尿病初级保健临床实践指南,未评价其他国家相应指南,结果可能存在一定偏倚。