间接比较和多种干预措施比较的方法学及应用

2011-01-19杨智荣詹思延

中国循证儿科杂志 2011年6期

胡晶杨智荣詹思延

基于严格设计随机对照试验(RCTs)的直接比较(direct comparison)或称为头对头比较(head to head comparison)的系统评价，已被公认为是评价干预措施疗效的最高级别证据，称之为传统系统评价。但是，如果想进行一个系统评价，目的是比较两种干预措施AvsB的效果，但目前的RCTs没有两者的直接比较研究，却都有同干预措施C的比较(即AvsC和BvsC)，此时，可以将C作为公共比较组，借助间接比较方法得出AvsB的效果，或者虽然有直接比较研究证据，但这些研究数量较少或质量较低，此时也可以用间接比较证据进行补充。另外，在面对一个具体临床问题时，临床医生或决策者通常需要在众多的干预措施中选择对具体患者最安全有效的措施，此时传统Meta分析就显得无能为力，而需要多种干预措施比较，英文术语有network meta-analysis，mixed treatment comparison，multiple treatments meta-analysis等，多种干预措施比较既可以同时比较多种干预措施，也可以合并直接比较和间接比较证据。

本文分3部分，第1部分简要介绍传统Meta分析，第2部分介绍多种干预措施比较的基本假设和相关统计学方法，第3部分以一个实例介绍多种干预措施比较的应用。

1 传统Meta分析

传统Meta分析是针对AvsB的各个研究进行定量合并的一种方法，目的是增大样本量，提高检验效能，其基本思想是对各研究效应进行加权合并。在传统Meta分析中，一个很重要的假设是同质性假设，可以通过异质性检验来进行判断，目前常用的方法是Q统计量检验法，若检验结果为P>0.10，可认为多个研究具有同质性，采用固定效应模型进行合并，如果存在统计学异质性(P≤0.10)，需要探讨异质性来源，并通过敏感性分析、亚组分析、Meta回归来识别潜在的影响效应的临床特征或方法学特征，如果这些特征不能解释统计学异质性，则采用随机效应模型进行合并，或者提示不宜对各研究结果进行合并。

2 间接比较和多种干预措施比较的方法学

间接比较包括未调整间接比较(naive/unadjusted indirect comparison)和调整间接比较(adjusted indirect comparison)。如果想比较AvsB的效果，此时有两组试验AvsC和BvsC，未调整间接比较是直接从两组试验中提取出A和B的结果进行比较，即假设他们来自RCTs的两个组别，由于此方法破坏了随机特性(即A和B的人群并不符合随机原则)，故偏倚较大，可能会高估疗效[1]，早期发表的一些文献中曾采用此方法，现已不推荐使用。相比未调整间接比较，调整间接比较以C作为公共比较组(C可以是安慰剂或阳性对照组)，一个很大的优势是能够在一定程度上保留随机特性，偏倚较小，下文所描述的“间接比较”，均指调整间接比较。调整间接比较基本原理是：AvsC的效应为θAC，BvsC的效应为θBC，则AvsB的效应为θAB=θAC-θBC，AvsB的方差为var(θAB) = var(θAC) + var(θBC)。对于二分类变量，效应采用logOR或logRR表示，对于连续型变量，效应采用均数来表示，对于时间序列变量，效应采用logHR表示。

2.1 间接比较和多种干预措施比较的基本假设 Song等[2]提出多种干预措施比较应包括3个水平的假设(图1)，即同质性假设、相似性假设和一致性假设。在多种干预措施比较中，评价这些假设对确保结果的有效性和可靠性至关重要。

2.1.1 同质性假设与传统Meta分析相同。

2.1.2 相似性假设试验相似性一般从临床相似性和方法学相似性两方面来考虑，临床相似性是指AvsC和BvsC两个试验集中试验人群、干预措施、随访时间和结局测量等相似，方法学相似性是指上述两个试验集质量相似。评价相似性假设的方法是比较两个试验集的临床特征和方法学特征，如果特征相似，则可能比不相似更容易满足相似性假设，或者即使两个试验集某些特征不同但此特征可能不会影响试验效应，相似性假设仍然可能成立，但前提是需要所有影响试验效应的特征都是已知的，特征的选择一般来自流行病学家和临床专家的意见。有研究表明两个试验集如果足够相似，间接比较可以平衡两个试验集的偏倚，相比直接比较偏倚更小[3]。目前相似性假设没有公认的统计学方法来检验，只能通过比较试验特征进行主观判断，或者通过敏感性分析、亚组分析或Meta回归来识别和调整可能影响研究效应的特征[4,5]。目前发表的间接比较研究中，大多未重视相似性假设，Donegan等[6]评价了43项间接比较研究的报告质量和方法学质量，其中仅11项(26%)研究比较了试验相似性。

图1 多种干预措施比较的3个假设

2.1.3 一致性假设如果既有直接比较结果又有间接比较结果，或者同时有多个间接比较结果(如，AvsB可以通过AvsC和BvsC获得，也可以通过AvsD和BvsD获得)，在决定是否合并这些结果时，需要进行第3个水平的一致性检验，如果各比较结果之间差异小的话，认为符合一致性假设，可以进行合并，如果出现不一致性，常提示直接比较或间接比较证据存在方法学缺陷，或两者临床特征有差异，或两种原因同时存在，此时需探讨出现不一致性可能的原因并考虑是否应合并直接比较和间接比较证据。目前一致性检验有以下几种方法。

总体效应的方差为总权重的倒数。则下式中的统计量服从χ2分布

自由度为M-1[11]。

2.1.3.2 Lumley法 Lumley[12]提出线性混合模型，模型中包括2个随机效应，试验水平的异质性(τ2)和直接比较间接比较结果比较的不一致性(ω2)，如果不存在异质性和不一致性，模型简化为普通线性模型。此模型是通过估计ω2的大小来判断不一致性，当ω2很小时，认为不存在不一致性，可以进行合并。但研究并未给出如何定量判断ω2的大小，只是通过大致的估计来判断，另外，Lumley的方法仅适用于每个试验有两个臂的情况。目前发表的研究中有一些采用了Lumley法[13～15]。

2.2 合并直接比较和间接比较证据如果经过一致性检验，认为直接比较和间接比较结果满足一致性假设，可以进行合并，目前合并方法有两种，经典的频率学方法和贝叶斯方法。

2.2.1 频率学方法频率学方法目前主要应用的有倒方差法和广义线性(混合)模型。倒方差法实施相对简单，即将各研究的方差倒数作为权重，对各研究效应进行加权平均，总体效应的方差为权重之和的倒数。

广义线性混合模型(GLMMs)是考虑了随机效应，可以用Stata软件的gllamm程序，SAS的PROC MIXED (for a continuous outcome) 或PROC NLMIXED (for a binary outcome)程序来实现。但需注意此模型应用的前提是需要获得受试者个体数据(individual patient data, IPD)，二分类数据的四格表信息可看作个体数据，通过Logistic回归来实现[16]。

2.2.2 贝叶斯方法贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法[17]。P(θ|y)∝P(y|θ)P(θ)是由贝叶斯定理推导出的模型，其中，P(θ)是先验概率，是在获得数据之前对于事物的认识，y是指数据，把在θ的前提下发生的条件概率记为P(y|θ)，称为似然函数，P(θ|y)是后验概率，表明θ在y的前提下发生的可能性大小，后验概率与先验概率和似然函数成正比。

贝叶斯方法和频率学方法相比，建模更灵活，其优势在于可以利用后验概率对所有分析的干预措施进行排序，另外，因为频率学方法在参数估计时采用最大似然法，通过不断的迭代去估计最大似然函数，容易出现不稳定而得到有偏的结果，而贝叶斯法却不存在这个问题，所以相比频率学方法，估计值更为准确。马尔科夫链-蒙特卡罗(Markov Chain Monte Carlo, MCMC)是一种通过构造马尔科夫链模拟参数联合后验分布的一种方法，其中以Gibbs抽样的应用最为广泛。WinBUGS是用于Gibbs抽样的专用软件包，为免费软件，目前已广泛应用于贝叶斯方法的实施。廖炜圻等[18]详细介绍了贝叶斯方法和WinBUGS软件的应用。Smith等[19]提出将分层贝叶斯模型(Bayesian hierarchical models)用于传统的两两比较的Meta分析。Lu等[20]在此基础上将模型进一步扩展到多种干预措施比较。另外，Jansen等[21]提出了将分层贝叶斯模型用于连续型变量。近年来发表的多项研究都采用贝叶斯方法[22～24]。

3 实例

近年来，贝叶斯方法在多种干预措施比较中得到越来越广泛的应用，本文以一个Network meta分析为实例，介绍贝叶斯方法的应用。Trelle等[22]分析了7种非类固醇类抗炎药的心血管安全性，用RR值表示治疗效应，研究采用贝叶斯随机效应模型，方法选用MCMC法，选取无信息先验分布，其优势是计算出的后验概率不会受先验分布的影响，完全由观测到的数据决定，得到的结果与频率学方法相似。研究共纳入一种非类固醇类抗炎药vs其他非类固醇类抗炎药或安慰剂的31个RCTs(图2)。

图2 7种非类固醇类抗炎药的Network meta分析

研究共纳入116 429例受试对象，主要结局指标为心肌梗死，次要指标包括脑卒中、心血管事件死亡和全死因死亡。研究结果显示，与安慰剂相比，罗非昔布的心肌梗死风险最高(RR=2.12,95%CI:1.26～3.56)，其次是鲁米昔布(RR=2.00,95%CI:0.71～6.21)；布洛芬的脑卒中风险最高(RR=3.36,95%CI:1.00～11.6)，其次是双氯芬酸(RR=2.86,95%CI:1.09～8.36)；依他昔布(RR=4.07,95%CI:1.23～15.7)和双氯芬酸(RR=3.98,95%CI:1.48～12.7)的心血管事件死亡风险最高；7种非类固醇类抗炎药中萘普生的心血管危险性最低。

该研究结论与此前的观察性研究结果一致，但观察性研究偏倚较大，影响结果的论证强度，Network meta分析的优势是能在一个研究中整合所有的直接比较和间接比较证据，且保留随机的特性，因此，该研究提供了关于非类固醇类抗炎药心血管安全性的最佳证据，为临床合理用药提供了依据。

4 讨论

间接证据和多种干预措施比较现在已经越来越多地用以评价卫生干预措施。但是，当能获得直接比较证据时，是否仍需要间接证据目前仍存在争议，Cochrane handbook推荐当两种来源证据同时存在时，应优先考虑直接比较证据[25]。不过，当直接比较的试验数目或样本例数过少，不能综合得出比较结果，而间接比较能获得相对多的试验数目时，可以考虑间接比较或综合直接比较和间接比较结果。如果间接比较和直接比较证据出现不一致的情况，应对可能的原因进行详尽探讨。

有学者担忧与直接比较相比，间接比较的偏倚较大，可能会高估疗效[7]。但也有研究认为间接比较与直接比较结果基本一致，Song等[26]分析了44项发表的Meta分析来判定间接比较结果的可靠性，结果表明44项中有3项间接比较和直接比较结果有差异，指出间接比较的可靠性依赖纳入试验的内部真实性和试验集的相似性，即间接比较的统计学方法本身是无偏的，但需要满足相应的假设。Song等[3]的另外1项研究用3个实例，得出调整间接比较的偏倚可能小于直接比较。但在方法学部分，间接比较仍有一些需要进一步探讨的问题，如何更客观地检验不同试验集的相似性假设，分层贝叶斯模型如何用来评价RD值，仍需要进一步研究。

[1]Glenny AM, Altman DG, Song F, et al. Indirect comparisons of competing interventions. Health Technol Assess, 2005, 9(26):1-134

[2]Song FJ, Loke YK, Walsh T, et al. Methodological problems in the use of indirect comparisons for evaluating healthcare interventions: survey of published systematic reviews. BMJ, 2009, 338:b1147

[3]Song F, Harvey I, Lilford R. Adjusted indirect comparison may be less biased than direct comparison for evaluating new pharmaceutical interventions. J Clin Epidemiol, 2008, 61(5): 455-463

[4]Berlie HD, Kalus JS, Jaber LA. Thiazolidinediones and the risk of edema: a meta-analysis. Diabetes Res Clin Pract, 2007, 76(2):279-289

[5]Boonen S, Lips P, Bouillon R, et al. Need for additional calcium to reduce the risk of hip fracture with vitamin d supplementation: evidence from a comparative meta analysis of randomized controlled trials. J Clin Endocrinol Metab, 2007, 92(4):1415-1423

[6]Donegan S, Williamson P, Gamble C, et al. Indirect comparisons: a review of reporting and methodological quality. PLoS One, 2010, 5(11): e11054

[7]Bucher HC, Guyatt GH, Griffith LE, et al. The results of direct and indirect treatment comparisons in meta-analysis of randomized controlled trials. J Clin Epidemiol, 1997, 50(6): 683-691

[8]Bekkering GE, Abou-Setta AM, Kleijnen J. The application of quantitative methods for identifying and exploring the presence of bias in systematic reviews: PDE-5 inhibitors for erectile dysfunction. Int J Impot Res, 2008, 20(3):264-277

[9]Berlie HD, Kalus JS, Jaber LA. Thiazolidinediones and the risk of edema: a meta-analysis. Diabetes Res Clin Pract, 2007, 76(2):279-289

[10]Bolen S, Feldman L, Vassy J, et al. Systematic review: comparative effectiveness and safety of oral medications for type 2 diabetes mellitus. Ann Intern Med, 2007, 147(6):386-399

[11]Caldwell DM, Welton NJ, Ades AE. Mixed treatment comparison analysis provides internally coherent treatment effect estimates based on overviews of reviews and can reveal inconsistency. J Clin Epidemiol, 2010, 63(8):875-882

[12]Lumley T. Network meta-analysis for indirect treatment comparisons. Statist Med, 2002, 21(16):2313-2324

[13]Kearney PM, Baigent C, Godwin J, et al. Do selective cyclo-oxygenase-2 inhibitors and traditional non-steroidal anti-inflammatory drugs increase the risk of atherothrombosis? Meta-analysis of randomised trials. BMJ, 2006, 332(7553): 1302-1308

[14]Psaty BM, Lumley T, Furberg CD, et al. Health Outcomes Associated With Various Antihypertensive Therapies Used as First-Line Agents: A Network Meta-analysis. JAMA, 2003,289(19): 2534-2544

[15]Kyrgiou M, Salanti G, Pavlidis N, et al. Survival Benefits With Diverse Chemotherapy Regimens for Ovarian Cancer: Meta-analysis of Multiple Treatments. Journal of the National Cancer Institute, 2006, 98(22): 1655-1663

[16]Hasselblad V. Meta-analysis of multitreatment studies. Med Decis Making, 1998, 18(1):37-43

[17]Kotz S, 吴喜之. 现代贝叶斯统计学. 北京: 中国统计出版社, 2000. 4

[18]Liao WQ(廖炜圻), Chen PY. Bayesian mixed treatment comparisons and implementation using WinBUGS. Chinese Journal of New Drugs(中国新药杂志), 2010, 19(24): 2244-2248

[19]Smith TC, Spiegelhalter DJ, Thomas SL. Bayesian approaches to random-effects meta-analysis: a comparative study. Statist. Med, 1995, 14(24):2685-2699

[20]Lu G, Ades AE. Combination of direct and indirect evidence in mixed treatment comparisons. Statist. Med, 2004, 23(20):3105-3124

[21]Jansen JP, Crawford B, Bergm AN, et al. Bayesian meta-analysis of multiple treatment comparisons: an introduction to mixed treatment comparisons. Value Health, 2008, 11(5):956-964

[22]Trelle S, Reichenbach S, Wandel S, et al. Cardiovascular safety of non-steroidal anti-inflammatory drugs: network meta-analysis. BMJ, 2011, 342:c7086

[23]Mills EJ, Wu P, Chong G, et al. Efficacy and safety of statin treatment for cardiovascular disease: a network meta-analysis of 170 255 patients from 76 randomized trials. Q J Med, 2011, 104(2):109-124

[24]Bangalore S, Kumar S, Kjeldsen SE, et al. Antihypertensive drugs and risk of cancer: network meta-analyses and trial sequential analyses of 324168 participants from randomised trials. Lancet Oncol, 2011, 12(1): 65-82

[25]Green S, Higgins JPT, Alderson P, et al. Cochrane Handbook. The Cochrane Library. Version 5.0.2. 2008

[26]Song F, Altman DG, Glenny AM, et al. Validity of indirect comparison for estimating efficacy of competing interventions: empirical evidence from published meta-analyses. BMJ, 2003, 326(7387):472-475