中成药治疗功能性消化不良的系统评价再评价▲

2019-10-23谢宜春刘洪武黎丽群岑前丽罗贞艺

广西医学 2019年18期

谢宜春刘洪武黎丽群岑前丽余良罗贞艺谢胜

(1 广西中医药大学研究生学院，南宁市 530001，电子邮箱：2415728662@qq.com；2 广西中医药大学第一附属医院脾胃科，南宁市 530001)

功能性消化不良(functional dyspepsia，FD)是一种以早饱、上腹痛或烧灼感为主要临床表现的胃肠功能性疾病[1]。FD为临床常见病、多发病,西方国家患病率达10%～40%,亚洲国家为5%～30%，近年来全球患病率呈逐年上升趋势[2]，且女性多于男性[3]。该病虽不危及生命,但其反复性和难治性给患者带来了沉重的经济负担和心理压力[4-6]。目前，临床上多采用质子泵抑制剂、抗幽门螺杆菌、促胃动力药等药物治疗，短期效果显著，但长期疗效欠佳[6-10]。随着循证医学在中医药领域的发展，中成药治疗FD的临床研究日益增多，迄今为止，已有多篇关于中成药治疗FD系统评价的文献公开发表，结果均显示中成药治疗FD具有一定优势，但因缺乏对其方法学质量、证据质量的统一性的再评价研究，故本研究通过对有关中成药治疗FD的系统评价进行再评价，评估纳入研究的方法学质量和证据质量等级，以期为临床工作者提供参考。

系统评价是循证医学中最佳证据来源之一，其结果可用于评估临床疗效，并为临床指南的制定提供参考[11]，系统评价的质量等级越高，则循证医学证据级别越高，但发表偏倚、研究局限性以及方案设计缺陷等因素均可导致系统评价的质量及证据级别下降[12]，从而误导证据使用者。系统评价再评价是全面收集同一疾病或同一健康问题治疗和诊断等方面的相关系统评价进行再评价的一种综合研究方法，它能够从更高层面对系统评价证据进行综合，为证据使用者提供更为集中的高质量证据[13-14]。因此，进行系统评价再评价，明确证据质量等级，对于循证决策有着重要意义。本文应用多系统评价评估问卷AMSTAR2声明及GRADE分级系统对有关中成药治疗FD的系统评价进行再评价，以明确相关系统评价的方法学质量和证据等级，从而为证据使用者提供可靠的参考证据。

1 资料与方法

1.1 研究纳入标准 (1)研究设计：公开发表的所有关于中成药治疗FD的临床随机对照试验(random control trial,RCT)的系统评价，语言限制为中文及英文。(2)研究对象：诊断为FD的患者，无职业、性别、种族、年龄、发病时间、病程和病例来源的限制。(3)干预措施：观察组干预措施为中成药治疗，对照组干预措施为西药常规治疗。两组均无治疗时间、药物来源、剂量等限制。(4)结局指标：有效率、显效率、总体有效率、不良反应、临床症状疗效、痞满证疗效、胃排空疗效、症状总积分、腹痛胃痛积分、体倦乏力积分、饮食减少积分、抑郁评分、焦虑评分。

1.2 研究排除标准 (1)重复发表的系统评价；(2)系统评价未对纳入的原始研究进行定量分析；(3)综述类文章；(4)动物研究的系统评价；(5)数据无法提取且无法联系到原作者的文献；(6)会议摘要。

1.3 文献检索策略计算机检索中国知网、万方、维普和PubMed数据库，收集公开发表的关于中成药治疗FD的系统评价，并在广西中医药大学及广西医科大学图书馆进行手工检索相关文献。检索采用主题词和自由词相结合的方式，中文检索词包括消化不良、FD、功能性胃肠病、系统综述、荟萃分析、系统评价。英文检索词包括functional dyspepsia、dyspepsia、functional gastrointestinal disorder、Meta-analysis、systematic review。检索日期均为建库至2019年2月12日。

1.4 文献筛选及资料提取由两名研究者独立进行文献筛选，根据纳入排除标准，选择符合要求的文献，如遇分歧，可由第三人裁决。并根据预先设计好的数据提取表进行数据提取，提取内容包括第一作者、发表(或更新)年份、系统评价纳入的文献数及样本量、研究类型、干预/对照措施、方法学质量评价工具、Meta分析结局指标及主要结论。

1.5 纳入系统评价的方法学质量评价采用AMSTAR2量表[15]对纳入的系统评价进行方法学质量评价。该量表共有个16条目，根据评价标准的满足程度评价为“是”“部分是”“否”。条目内容为：条目1，研究问题和纳入标准是否包括PICO部分；条目2，是否声名在系统评价实施前确定了系统评价的研究方法，对于与研究方案不一致处是否进行说明；条目3，系统评价作者在纳入文献时是否声明纳入研究的类型；条目4，系统评价作者是否采用了全面的检索策略；条目5，是否采用双人重复式文献选择；条目6，是否采用双人重复式数据提取；条目7，系统评价作者是否提供了排除文献清单并说明其原因；条目8，系统评价作者是否详细描述了纳入的研究；条目9，系统评价作者是否采用合适工具评估每个纳入研究的偏倚风险；条目10，系统评价作者是否报告纳入各个研究的资助来源；条目11，作Meta分析时，系统评价作者是否采用了合适的设计方法合并研究结果；条目12，作Meta分析时，系统评价作者是否评估了每个纳入研究的偏倚风险对Meta分析结果或其他证据综合结果潜在的影响；条目13，系统评价作者解释或讨论每个研究结果时是否考虑纳入研究的偏倚风险；条目14，系统评价作者是否对研究结果的任何异质性进行合理的解释和讨论；条目15，如果系统评价作者进行定量合并，是否对发表偏倚(小样本研究偏倚)进行充分的调查，并讨论其对结果可能的影响；条目16，系统评价作者是否报告了所有潜在利益冲突的来源，包括所接受的任何用于制作系统评价的资助。其中有7个关键条目，分别为条目2、4、7、9、11、13和15。系统评价方法学的质量等级分为：(1)高质量，即无或仅1个非关键条目不符合；(2)中等质量，即超过1个非关键条目不符合，若多个非关键条目不符合时，可从中等降级至低等质量；(3)低质量，即1个关键条目不符合并且伴或不伴非关键条目不符合；(4)极低质量，即超过1个关键条目不符合，伴或不伴非关键条目不符合。

1.6 纳入系统评价的证据质量评价采用GRADE工具[16]对纳入的系统评价进行证据质量评定。基于所纳入的研究类型，对GRADE系统中的5个降级因素(偏倚风险、不直接性、不精确性、不一致性和发表偏倚)和3个升级因素(大效应量、剂量效应关系、负偏倚)进行综合评估，将证据等级分为“高”“中”“低”“极低”4个等级。

2 结果

2.1 文献筛选流程及结果根据检索策略，共获得相关文献1 294篇。根据纳入排除标准，通过阅读文题排除1 280篇，剩余14篇；再排除中成药非主要干预措施文献7篇，最终纳入7篇系统评价[19-25]。

2.2 纳入系统评价的基本特征纳入的7篇系统评价[17-23]均为中文文献，其中6篇期刊论文[17-22]，1篇学位论文[23]，文献发表时间为2009～2018年。纳入文献的基本特征见表1。

表1 7篇系统评价的基本特征

2.3 纳入系统评价的结局指标统计分析结果及主要结论 6篇文章评价了有效率[17-18，20-23]，均显示治疗组优于对照组，差异有统计学意义(均P<0.05)。3篇文章评价了不良反应[18-19，23]，1篇文献[19]显示组间不良反应的发生差异无统计学意义，其余2篇文献[18，23]仅报告了不良反应的种类。3篇文献评价了临床症状学积分，仅1篇文献[22]结果显示两组在体倦乏力症状积分方面差异有统计学意义(P<0.05)。2篇文献评价了胃排空率，其中文献[23]结果显示观察组在胃排空率方面优于对照组，差异有统计学意义(P<0.05)。文献[21]同时报告了腹痛胃痛、体倦乏力、饮食减少积分及焦虑、抑郁积分，结果显示观察组在降低焦虑、抑郁积分方面优于对照组，差异有统计学意义(P<0.05)，其他指标差异无统计学意义(P>0.05)。见表2。

表2 纳入系统评价的结局指标统计分析结果及主要结论

续表2

2.4 纳入系统评价的方法学质量评价采用AMSTAR2量表对纳入的系统评价进行方法学质量评价，结果显示所纳入的7个研究均为极低质量。见表3。

2.5 纳入系统评价主要结局指标证据质量分级应用GRADE方法对所纳入的7个系统评价进行证据质量分级，所有研究均进行了降级处理，降级因素主要为发表偏倚以及在随机、分配隐藏和盲法方面存在的偏倚。结果显示，所纳入的结局指标共有2个结局指标为中等级别，5个为低等级别，15个为极低级别。见表4。

表4 7篇系统评价的GRADE结局指标质量分级

注:① 试验的设计在随机、分配隐藏或盲法存在较大偏倚;② 漏斗图不对称;③ 可信区间重较少，异质性检验P值很小，合并结果的I2值较大;④ 研究纳入的患者和观察事件相对较少而致可信区间不够窄;⑤ 大效应量大于2或小于0.5。

3 讨论

目前，FD的具体病因尚不明确,其可能与幽门螺旋杆菌感染、精神因素、胃肠功能障碍等有关[24]。中医学并无“功能性消化不良”这一病名，根据其临床表现，可归属于“胃痞”“胃脘痛”“嗳气”“呕吐”等中医内科学范畴。FD被认为由饮食劳倦、脾胃虚弱、情志失调等因素造成,以肝胃不和型最为常见[25]。清代医家沈金鳌亦在《杂病源流犀烛》中指出“痞满,脾病也,本由脾气虚,及气郁不能运行,心下痞塞满”,大多数医家认为脾虚气滞是痞满的主要病因。

本研究共纳入7篇有关中成药治疗FD的系统评价，所有纳入的系统评价主要发表2009～2018年之间，多数文献发表的时间在近10年，提示有关应用中成药治疗FD的研究越来越受到重视。本研究结果显示，相对于西药治疗，应用中成药治疗FD在临床疗效、症状学积分、有效率、改善焦虑抑郁症状等方面有一定优势，但由于缺乏大量高质量证据的研究，目前对不良反应的发生尚不能形成统一的定论。

目前，中成药治疗FD的Meta分析或其他类型的系统评价仍相对较少，说明中成药治疗FD的研究力度还不够，仍需要积极开展更多的研究。本研究采用AMSTAR2量表对纳入的系统评价进行方法学质量评价，结果显示当前系统评价总体方法学质量偏低，均为极低质量。其中，所有的系统评价均未提供前期设计方案，这可能会导致系统评价缺乏严谨性；所有系统评价均未报告研究中潜在的资助来源，也未考虑到相关利益冲突，这可能会对证据的可靠性造成影响；所有的系统评价仅总结了纳入文献的部分研究特点，或未提供排除文献的清单，这种原始数据的缺失可能是潜在的临床异质性的来源。以上因素都可能会影响系统评价再评价的科学性和严谨性。

本研究还应用GRADE系统对所纳入的系统评价进行证据质量评级，结果显示，所纳入的结局指标共有2个结局指标为中等级别，5个为低等级别，15个为极低级别，说明本次系统评价再评价的结果可能与纳入系统评价的真实数据存在差异。证据升级主要受大效应量的影响，而降级主要是受局限性影响，其中局限性包括未描述具体的随机方法、未做到分配隐藏、多数研究对盲法未进行描述等方面。总体而言，本研究所纳入的系统评价均对中成药治疗FD的疗效给予一定的认可，但结局指标的证据级别多为低或极低级，2个中等级别的结局指标来自文献[19]，其Meta分析结果提示六味安消胶囊治疗 FD 的有效率高于胃肠促动力药。而GRADE指南对于中等级别结局指标的定义为“对效应估计值我们有中等程度的信心”，即真实值有可能接近估计值，但仍存在二者大不相同的可能性。该证据强度相对较高，可供给临床医生、指南制定者及患者参考。

从AMSTAR2量表和GRADE工具评价得出的结果来看，本研究针对中成药治疗FD的系统评价的方法学评价和结局指标的质量评级均存在不足：所纳入的系统评价中，有6篇采用主观性的结局指标(如有效率)，仅3篇提及客观性的指标(如临床症状疗效)；结局指标多为低或极低级别；中成药的应用也需四诊合参、辨证论治，因此其剂量、服药时间等具有多样性，这限制了盲法在中成药治疗FD系统评价中的运用。研究人员在今后需开展更加严谨、多中心、大样本并结合中医临床特色(如辨证论治、四诊合参、整体观念等)的RCT。

本次系统评价再评价不足包括：(1)仅检索中英文文献的系统评价，且纳入的系统评价均为中文文献，可能存在其他语言文献的数据缺失而影响结果的稳定性；(2)系统评价再评价中，研究员存在不可避免的主观性，可能造成评价结果的偏倚；(3)原始研究纳入的患者和观察事件相对较少，可能会对结果的稳定性产生影响。

总之，目前中成药治疗FD系统评价的方法学质量不高，其证据质量也较低。现有证据表明，六味安消胶囊治疗FD的效果或优于胃肠促动力药。