APP下载

基于AGREE Ⅱ工具对男性不育症指南的质量评价

2020-03-19邢鹏张娜梁辉王娜陈英李克用

生殖医学杂志 2020年3期
关键词:不育症指南领域

邢鹏,张娜,梁辉,王娜,陈英,李克用

(1.保定市妇幼保健院生殖医学科,保定 071000;2.河北医科大学第四医院生殖医学科,石家庄 050000)

不孕不育症是指有规律、无保护的性生活12个月后未能实现临床妊娠的疾病。其中,由于男性因素如精液参数或功能异常,生殖系统的解剖、内分泌、遗传、功能或免疫异常,慢性疾病等引起的,称为男性不育症[1]。根据2018年发表的一项包括8个省/市的18 571对夫妇的横断面研究显示,在我国的育龄夫妇中,不孕不育症的患病率达25%[2]。一般研究认为男性因素约占不育症病因的50%[3-4]。某些研究甚至表明,男性因素是生育力低下夫妇最常见的诊断[5]。多项对男性不育人群的研究,同样证明评估男性生育力的必要性[6-7]。因此,无论是专职的男科医生,还是泌尿科或从事不孕不育症诊断与治疗的妇产科医生,均应认识到男性不育症诊断与评估临床指南的重要性,并通过学习后应用于临床实践。但是,各个国际组织或我国制定的男性不育症指南存在年代跨距大、质量参差不齐等问题,这也给应用指南的临床医生带来挑战。本文拟采用指南研究与评价工具Appraisal of Guidelines for Research & Evaluation Ⅱ(AGREE Ⅱ)[8]对目前使用的国内外男性不育症的诊断与治疗指南进行质量评价,以便指导临床选择和应用。

资料与方法

一、研究对象

由2名专业男科医生根据以下标准,各自独立对指南进行检索和纳入。纳入标准:(1)语言为中文或英文;(2)公开发表的文章或书籍,并可获得全文;(3)有更新版的选择最新的版本。排除标准:(1)重复发表的指南;(2)指南的解读;(3)更新后的旧版指南。

二、研究方法

1.检索策略:(1)中文检索词:“不育”和(“指南”或“共识”或“规范”);中文检索数据库:中国知网(CNKI)、万方医学网、中国生物医学文献数据库(CBM)、维普网(VIP)、医脉通临床指南网。(2)英文检索词:(“male infertility”or“infertile male”or“subfertility”)和(“guideline”or“consensus”or“committee opinion”);英文检索数据库:PubMed、Web of Science、NGC(National Guideline Clearinghouse)。(3)手工检索国内外公开(或在线)出版的书籍。

2.评价方法:由经过AGREE Ⅱ在线培训工具培训后的4名研究人员对指南进行独立评价。AGREE Ⅱ包括6个领域:范围和目的、参与人员、制定的严谨性、表达的清晰性、应用性、编辑的独立性,共23个条目。按照指南内容与条目的符合程度进行评分,完全不符合为1分,至完全符合为7分。每个领域得分采用标化为百分比计算:各领域得分=(实际得分-最低可能得分)/(最高可能得分-最低可能得分)×100%。

综合指南各领域及总体质量得分,将指南的推荐级别分为3级:A级(推荐),指南6 个领域得分均≥60%;B级(修改完善后推荐),得分≥30%的领域数≥3个,但有<60%的领域;C级(不推荐),得分<30%的领域数≥3个[9]。

三、统计学方法

采用SPSS 21.0统计软件计算组内相关系数(Intraclass Correlation Coefficient,ICC),对4位评价者进行一致性检验。ICC信度系数低于0.4表示一致性较差,大于0.75表示一致性较高[10]。

结 果

一、纳入指南情况

本文共纳入指南7篇[11-17],文献检索流程见图1;其中英文指南5篇,中文指南2篇(表1)。指南发表的时间为2000年至2018年,时间跨度较大;更新版指南为4篇,但除了EAU Guidelines on Male Infertility(EAU2018)为第9版更新,并提供了继续更新的程序说明外,其他均为第2版更新,且无继续更新的程序说明。编委会人数为8~22人,参考文献篇数为19~287篇。

图1 文献检索与筛选流程图

二、评价人员指南分析的一致性分析

4名评价人员对7篇指南的一致性检验提示,ICC信度系数均大于0.75,F检验结果显示P均小于0.05,提示4名评价者的一致性较高(表2)。

表1 纳入指南的基本情况

注:a7篇指南以下分别简称为:WHO2000、AUA2010、ASRM2015、中西医2015、中男2017、EAA2018、EAU2018。

表2 7篇指南的评价一致性分析结果

三、AGREE Ⅱ评价结果

纳入的7篇指南经AGREE Ⅱ标准化评分后,6个领域的平均得分分别为50%、30%、25%、63%、17%、32%,其中表达的清晰性得分最高,而应用性得分最低(表3)。

1.范围和目的:本领域共包括3个条目,明确描述了指南的总体目标、涵盖的健康问题和指南使用的人群。本领域的平均得分为50%,分数相对较高,其中3篇指南高于60%。

2.参与人员:本领域共包括3个条目,具体列出了指南制定小组的成员组成的要求,是否考虑了目标人群的观点和偏好,以及指南的目标用户是谁。本领域的平均得分为30%,并且所有指南均低于60%,总体表现一般。

3.制定的严谨性:本领域共包括8个条目,系统说明了证据搜索方法、选择标准和证据体的优缺点,建议的制定方法、益处与风险及建议与证据间的关联性,以及这些内容是否进行了外部审查和是否提供了更新程序。本领域的平均得分为25%,只有EAU2018一篇>60%,普遍得分偏低。

4.表达的清晰性:本领域共包括3个条目,主要包括建议描述是否具体而明确,是否提出了管理或建议的不同方案,以及关键建议是否容易识别。本领域的平均得分为63%,为所有领域中最高分,其中5篇指南高于平均分。

5.应用性:本领域共包括4个条目,主要评价指南应用时的促进和阻碍因素,应用推荐建议时的意见和/或工具,应用推荐建议时可能产生的资源问题,以及监督和/或审计标准。本领域的平均得分为17%,为所有领域中最低分,所有指南得分均<30%。

6.编辑的独立性:本领域共包括2个条目,分别为供资机构的意见是否影响指南的内容和指南制定小组成员之间的利益冲突说明。本领域的平均得分为32%,其中3篇指南的得分>60%,均为英文指南。

表3 纳入指南的AGREE Ⅱ评价情况

四、7篇指南总体评价与推荐级别

7篇指南的总体评价平均得分为40%,>60%的指南2篇,其中最高得分为EAU2018的75%。指南推荐级别为:A级推荐指南0篇;B级推荐指南4篇,得分由高到低分别为EAU2018、EAA2018、AUA2010、WHO2000;C级推荐指南3篇,分别为ASRM2015、中西医2015、中男2017。

讨 论

随着辅助生殖技术的发展和病人认知水平的提升,临床指南的重要性更加明显,它既可以指导临床医生获得当前最佳的循证证据,又可以帮助患者获得指导性的临床实践建议。高质量的临床指南能提高临床工作者的科学决策能力,保护患者安全;而低质量的临床指南不仅浪费有限的医疗资源,甚至会给患者带来伤害[18]。男性不育症是一组病因复杂、临床表现多样的综合征,特点是辅助检查指标与生育力结局的联系性较差[19-20],治疗效果的判断受制于配偶的临床结局等,这无疑为制定男性不育症临床诊断与治疗指南带来了挑战。

从本文所纳入的7篇指南总体评价结果看来,发布时间新的指南质量优于旧的指南,英文指南优于中文指南。AGREE Ⅱ各领域评价结果显示:(1)制定指南的目的及适用范围应在指南的开篇中详细说明,以便读者可以选择适合自己学科的指南进行阅读和学习,该领域总体得分较为满意,但有1篇指南[15]未单独列出目的和范围,需要读者在后面的章节中总结。(2)在参与人员领域,得分均低于60%,主要原因为所有指南都未收集目标人群(患者、公众等)的观点和选择意愿,大多数指南未详细介绍每位专家在指南制定小组中的作用以及未说明指南制定小组中是否包括方法学家。(3)严谨性在AGREE工具中占据的条目最多,一定程度反映了该领域的重要性,其主要内容反映循证指南的要求,但本文纳入指南的严谨性较差,平均得分仅25%。其中只有1篇指南[17]提供了详细的搜索策略,2篇指南[12,16]简述了搜索策略,其余4篇未提供搜索策略。2篇指南[16-17]是基于GRADE证据强度分级。2篇指南[14,17]进行了同行评审。同时临床证据的不断更新和补充,要求指南3~5年更新1次[21-22],但只有1篇指南[17]提供了更新说明。(4)表达的清晰性在所有领域中得分最高,不管是英文指南还是中文指南都提出了具体而明确的建议和可供选择的不同方案。1篇指南[17]提供了“口袋版”的简化指南,3篇[11,15-16]指南提供了汇总表或流程图。(5)指南的应用性直接关系到指南的推广和实施,指南能否发挥最大作用,很大程度取决于推荐意见是否具有可操作性、科学性和实用性,是否具备指南实施所需的设施设备和环境条件等方面[23]。该领域得分最低,所有指南对实施的计划和障碍描述不清,均未论证医疗保健成本效益,均未提出指南建议应用的监测和/或审计标准。(6)编辑的独立性方面,4篇指南[12-13,16-17]声明了资助机构的利益未影响最终建议,3篇指南[12-13,17]声明了小组成员间无利益冲突。综合各领域得分,虽然B级推荐指南4篇,但是2篇指南[11-12]在关键的严谨性领域得分均<30%,整体质量偏低,不予推荐。最终,本文推荐指南2篇[16-17],即EAU2018和EAA2018。

2003年由来自加拿大、英国等13个国家研究人员组成的国际工作组发布了临床指南研究与评价工具AGREE,2009年发布了更新版AGREE Ⅱ,进一步提高了AGREE工具的可靠性和有效性。目前,AGREE Ⅱ已经成为国际公认的指南研究与评价的金标准[24],在新的指南制订过程中,建议对AGREE Ⅱ工具进行系统学习和研究。2016年,中华医学会针对我国专家对临床诊疗指南制订方法和原则不熟悉和指南质量普遍偏低的情况,发表了“制订/修订《临床诊疗指南》的基本方法及程序”[25]。提出指南制/修订过程须采纳循证方法;推荐建议按OCEBM、GRADE强度分级;在指南的制订和实施领域,均应邀请方法学专家参与;全体参与指南制订/修订的人员都必须提供利益声明报告等。2017年由中国专家牵头组成的国际协作组发表了“A Reporting Tool for Practice Guidelines in Health Care:The RIGHT Statement”的国际指南报告规范[26],以指导编写严谨规范的临床实践指南。因此,临床指南的制订/修订要严格按照国际规范的流程和标准进行,同时对发表后的指南进行严格评估。

根据以往的研究,我国指南往往存在报告形式不规范[27]、缺乏系统评价证据支持推荐意见[28]以及对指南制定小组成员的独立性重视不够等缺点,最终导致质量整体偏低。2017年中华医学会男科学分会发表的《男性不育症诊断与治疗指南》,是在中国的临床实践中不断修正和完善的,该指南在我国应用范围广,影响力大。其特点是:(1)将男性不育症的病因分为睾丸前性、睾丸性和睾丸后性等,这一分类方法逻辑性强,在我国应用时间长而广泛,可操作性优于英文指南;(2)诊断和治疗建议条理清晰,内容全面。正如下文局限性所述,仅凭工具学方法来判断指南的合理性,存在各领域权重分配不均,导致最终的评价结果与实际的应用性存在偏颇。值得一提的是,中国中西医结合学会男科专业委员会于2015年发表了全球第1部男性不育症的中医指南[14],这对国人普遍接受中医诊治的心理和情感依托提供了一定的证据支持。本指南对不育症的中医辨证清晰而明确,分类的实用性和可操作性值得中西医男科医生学习借鉴。但是,正如指南制定者开始介绍的,中医指南存在循证证据不足,分类方法不宜用西医的科学方法验证等局限性。同时,指南推荐的治疗方法中涉及多种中药、中成药,但并未提供利益相关性和编辑独立性声明。

但本研究也存在一定局限性:(1)在指南的评价过程中,评价人员专业知识背景的不同可能产生主观偏倚;(2)AGREE Ⅱ各领域得分权重相同,工具并未给出解释领域分数的统一标准。本文采用了推荐等级依据达到标准的领域个数的方法,这可能导致更重要的领域权重被弱化,而出现指南的推荐结果与指南质量不符的情况;(3)AGREE Ⅱ只能评价指南的方法学质量和报告规范性,无法评价推荐内容的有效性,可能导致指南方法质量和临床有效性相互矛盾。

综上所述,EAA2018和EAU2018两篇指南均为循证指南,可在适当修订后使用。我国男性不育指南在制定的严谨性、应用性和编辑独立性等方面仍有待提高,建议可以参照中华医学会生殖医学分会指南共识制定规范[29],制定证据等级更高的循证指南,以促进我国男性不育症的规范化诊治。

猜你喜欢

不育症指南领域
为什么男性不育症患者越来越多
男性不育症不用愁,科学家研发出新型治疗方法
领域·对峙
为什么男性不育症患者越来越多
指南数读
论碰撞的混搭指南
新常态下推动多层次多领域依法治理初探
菟丝子在男性不育症中的应用
肯定与质疑:“慕课”在基础教育领域的应用
3D 打印:先进制造领域的必争之地