APP下载

基线风险变化与二分类数据效应量选择

2016-12-19付文杰何倩许杨鹏陶圆张超牛玉明

中国循证心血管医学杂志 2016年11期
关键词:安慰剂基线异质性

付文杰,何倩,许杨鹏,陶圆,张超,牛玉明,4

· 循证理论与实践 ·

基线风险变化与二分类数据效应量选择

付文杰1,2,何倩1,2,许杨鹏1,2,陶圆1,3,张超1,牛玉明1,4

目的 探讨在二分类数据Meta分析中效应量的选取。方法 通过结合已发表实例数据,在考虑基线风险变化模型下,就二分类数据中常见的四种效应量指标即比值比(OR),危险差(RD),相对获益危险度[RR(B)]和相对有害危险度[RR(H)]进行比较。结果 当预测基线风险变化时,在绝对获益治疗效应指标中的RR(B)与RR(H)的结果也会随之改变。单纯依据异质性的大小来作为效应量的选取标准,将会导致观察结果与真实结果间存在偏差。结论 效应量的选取很大程度上受基线风险变化的影响,而单纯性依赖于异质性进行判定往往会导致结果偏差,与此同时,还需综合考虑经验证据及临床资料特征等相关因素。

Meta分析;效应量;基线风险;二分类数据

证据是循证医学的核心,系统评价/Meta分析是当前公认的最高级别证据。基于Meta分析合并的证据总是通过一定的效应量来表示,例如常见临床上随机对照试验(randomized controlled trial,RCT)中二分类数据通常采用的效应量有比值比(odds ratio,OR),相对危险度(risk ratio,RR)及危险差(risk difference,RD)。据相关研究[1]报道:由系统评价/Meta分析制作者水平良莠不齐等因素导致现已发表Meta分析研究中,就效应量的选取问题仍存在一定的理解与解释性偏差。本文结合已发表实例数据,就存在基线风险前提下结合经验证据信息与临床数据特征,来挑选最佳效应量以求获取最接近真实预期效益结果。

1 基本概念

在Meta分析中,通常效应量被作为汇总及描述试验中所观察到干预疗效的统计量。如RCT中的二分类数据,通常采取效应量OR、RR和RD,其中OR与RR应用较为常见。

OR,即比值比或优势比,是测量疾病与暴露联系强度的重要指标,为两组间某事件的比值之比。RR,即相对危险度,是反映暴露(干预)与事件关联的最有用的指标,为两组的事件率之比。RD,即危险差,是指暴露(干预)组和对照组结局事件发生概率的绝对差值。

效应量计算公式:

OR或RR=1时,表示两组间比较效益相当;若研究为有利事件时,OR或RR>1表示暴露组可能改善结局;若研究为不利事件时,OR或RR<1表示暴露组可能会降低结局风险。RD=0时,两组间比较效益相当;若研究结果为不利事件时,RD<0表示干预组可降低结局风险;若研究结果为有利事件时,RD>0表示干预组可改善结局。

2 合并效应量的统计学方法

Meta分析[2]是对来自多个单一研究资料进行合并的统计学方法。1985年Greenland与Robins[3]提出:若研究间异质性较理想时,选择固定效应模型,包括Mantel-Haenszel法(M-H法),Peto法和倒方差法(generic inverse variance,I-V法);若研究间异质性不理想时,选择随机效应模型,通常采用Dersimonian-Laird法(D-L法)。同时,当研究臂中出现0事件时,基于模型统计功效考虑,相应标准校正系数0.5将会给予相应调整。

异质性(heterogeneity)是由于纳入同一个Meta分析中所有研究间存在差异,因此将Meta分析中不同研究间的各种变异称之为异质性,即不相似。其在统计学层面上,决定了当前纳入研究是否能够直接进行合并。考虑到自由度干扰,同时,基于数据的数学特性,选取不同效应量会直接导致异质性评估效能,本研究将采用Cochran异质性的Q检验为检测标准。

3 实例剖析

本文将采用4个例子来剖析效应量选取中可能存在的问题。为了更好比较各效应量间优劣,本研究所有实例均采用OR,RD,RR(B)与RR(H)4种效应量予以展示,且同时使用固定效应模型(M-H法)与随机效应模型(D-L法)。实例软件操作采用Stata中的metan命令完成[4]。

3.1 多糖疫苗防治A型脑膜炎 本例[5]系统性回顾了接种多糖脑膜炎疫苗与不接种疫苗(或仅接种安慰剂)两种治疗方案,在对预防A型脑膜炎随访12个月间的疗效比较。7组试验中脑膜炎的发病率各不相同,其中5个试验在流行地区进行,年发病率为每1万人中发生1.0~5.3。然而另外2个正值流行地区进行的试验,年发病率为每1万人发生35~57。结果见表1,显示该疫苗是非常有效的。由于事件是罕见的,分析OR和RR结果相似,若将RD转换为RR则有可能大幅度增加异质性的风险。

3.2 在非溃疡性消化不良根除幽门螺杆菌 幽门螺杆菌是公认导致非溃疡性消化不良的致病菌之一。表1给出了根除幽门螺杆菌在非溃疡性消化不良试验的Meta分析[6]。由于事件发生率较低,因此,小的效应量结果对效应量的选取较敏感。例如:对根治12个月消化不良实例中,一篇[7]选RR有意义,而另一篇[8]选OR,则无统计学意义。由此可见,效应量选取会直接影响到最终的汇总结果。

3.3 600~650 mg单剂阿司匹林治疗急性疼痛 实例汇总了64例外科手术[9]中使用单剂阿司匹林和安慰剂治疗急性疼痛的比较。结果显示50%的患者疼痛得到缓解。本次的二分类数据是基于疼痛量表转换结果进行估计,且所有的分析结果显示治疗是有效的(表1)。

3.4 拉莫三嗪附加疗法用于治疗癫痫 本例[10]纳入了10组拉莫三嗪辅助治疗耐药性局部癫痫的所有年龄段患者安慰剂对照试验,其结果显示癫痫发作频率减少50%。该研究9组试验在成人中进行,其安慰剂的平均回应率为8.1%,另1组试验在儿童中进行,显示安慰剂回应率高达15.8%。

表1 4个Meta分析研究中OR、RD、RR(B)和RR(H)的结果

4 绝对获益与效应量选取的联系

4.1 实例的图形剖析 L’Abbe图通常用于定性估计Meta分析异质性。其主要是依据单个研究的干预组事件发生率与对照组事件的发生率所作的散点图。图1分别选取不同效应量绘制了OR、RD、RR(B)和RR(H)时,试验组事件发生率与对照组事件发生率的变化关系。其中,RR=1,OR=1和RD=0所绘制的线条(即图中对角线)为无效线,表示两者治疗效果相当;实线表示干预组可降低事件发生率;虚线表示干预组可增加事件发生率。无论哪种情况,线条离无效线越远,治疗效果越显著。

图1 效应量固定时,试验组事件发生率与对照组事件发生率的变化关系图注:该图形绘制了当OR、RD、 RR(B)和RR(H)一定时,试验组事件发生率与对照组事件发生率的变化关系。设RR和OR为0.2,0.4,0.6,0.8,1,1.25,1.67,2.5和5,RD为-0.8,-0.6,-0.4,-0.2,0,0.2,0.4,0.6和0.8。

通常干预措施旨在防止发生不良的结果(如复发、疾病恶化或者死亡)。其最理想的效果是降低总的不良事件发生率,在本文中被称为预防性的干预措施。图2中描绘了预防性干预措施的治疗效果。其中基线风险(PBR)为安慰剂治疗的事件发生率。治疗的绝对获益事件率减少的计算公式如下(1a-1d):

而干预措施旨在增加有利的结果(如缓解、恢复或治愈),其最理想的效果是增加总的有利事件发生率,在本文中被称为治疗性的干预措施。图3中描绘了治疗性干预措施的效果。其中,基线风险(PBR)为安慰剂的期望事件的发生率(在安慰剂对照试验中通过安慰剂反应率估计)。治疗的绝对获益事件率增加的计算公式如下(2a-d)。

图2 预防类措施效应的变化与基线风险的变化关系图注:该图形表示在预防性干预试验中,设OR,RD,RR(H)和RR(B)为定值,预防措施所减少的效应(图中描述为试验组每一百例中减少的患病数)与基线风险(图中描述为对照组中每一百例的患病数)的变化关系。试验结果不可能落在阴影部分。设OR为1、0.91、0.8、0.67、0.5和0.33;RD为 0、-0.01、-0.02、-0.05、-0.1和-0.2;RR(H)为1、0:91、0:8、0:67、0:5和0:33;RR(B)为1、1.1、1.25、1.5、2和3。其中,RR=1,OR=1和RD=0所绘制的线条(即图中水平线)为无效线,表示两者治疗效果相当。无论哪种情况,线条离无效线越远,预防效果越显著。

其中,RR=1,OR=1和RD=0所绘制的线条(即图中水平线)为无效线,表示两者治疗效果相当。无论哪种情况,线条离无效线越远,效果越显著。治疗的绝对获益(有时被称为疗效),常被临床医生作为研究应用中的首选结局[11,12]。如果对照组事件发生率被理解为患者的基线风险的估计值,假定Meta分析中的治疗效果被直接用于特定患者,图2和图3可被用来解释效应量估计特定Meta分析绝对获益的预测。此外,上图还显示了调整基线风险对预测绝对获益的影响关键取决于效应量的选择。

图4分别描绘了4个实例中绝对风险差异与对照组事件发生率的关系。脑膜炎疫苗疗效的例子是减少不良事件的发生率的预防性干预。因该事件的发生率较低,图中显示OR和RR(H)基本一致,两者在研究异质性方面也具有较好的一致性,同时,而RD与RR(B)的异质性通常比OR与RR(H)的异质性大(表1)。

图3 治疗干预类措施疗效的变化与基线风险的变化关系图注:该图形表示在治疗性干预试验中,设OR,RD,RR(H)和RR(B)为定值,治疗措施所增加的效应(图中描述为试验组中每一百例中增加的事件数)与基线风险(图中描述为对照组中每一百例的事件发生数)的变化关系。试验结果不可能落在阴影部分。设OR为1、1.1、1.25、1.5、2和3;RD为 0、0.01、0.02、0.05、0.1和0.2;RR(B)为1、1.1、1.25、1.5、 2和3;RR(H)为1、 0:91、 0:8、 0:67、0:5 和 0:33。其中,RR=1,OR=1和RD=0所绘制的线条(即图中水平线)为无效线,表示两者治疗效果相当。无论哪种情况,线条离无效线越远,治疗效果越显著。

图4 绝对风险差异与对照组事件发生率的关系图注:该图形为第三部分所描述的四个案例的绝对风险差异与对照组事件发生率的关系图,其OR、RR、RD值在表1中给出,试验结果不可能落在阴影部分。可见在图a中,表示OR与RR(H),RD与RR(B)的线条是重叠的。并且,案例1多糖疫苗防治A型脑膜炎为预防性干预试验,而其他三个案例均为治疗性干预试验,故图a的坐标轴标签与其他各图不同。

另3个例子均为治疗性干预。在消除幽门螺杆菌治疗消化不良实例中,显示绝对获益随着安慰剂事件率的增加而减少,因此,该情形适合于获得较差干预疗效的人群。该试验结果在最适拟合线的两个极端,所以治疗性RR不适用于该数据,同时临床上已经对所观察到的趋势提出解释。首先,具有较高的安慰剂疗效很可能来自于压力性相关消化不良;其次,通常不遵医嘱疗效与安慰剂相似,且很难达到理想的根治性疗效。仅依据这5个试验尚不能提供充足的理由来选择RR为预测剩余消化不良绝对获益的模型。

4.2 四个统计效应量局限性 效应量主要受预测值和边界值两方面的限制。OR模型在对照组事件发生率为0或100%时预测绝对获益是受约束的(见等式1a和1d),这限制了其作为效应量的适用性。临床上会存在对照组中没有患者治愈或未经治疗的所有患者恶化的情况。对于上述两种特殊情形,若采用OR效应量进行Meta分析合并时,可能会产生错误的预测结果。相比之下,RR模型只受到0事件的约束。对于预防性的干预而言,当RR(H)模型中对照组事件发生率为0时(见公式1c)或RR(B)模型中对照组事件发生率为100%时(见公式1c),预测绝对获益总为0。对治疗性的干预而言,当RR(H)模型中对照组事件发生率为0时(见公式2c)或RR(B)模型中对照组事件发生率为100%时(见公式2d),预测绝对获益总为0。

图形中阴影部分表示为预测的边界。与RD相交的阴影区域表示在确定的对照组中是不可预测的(预测治疗后的事件发生率低于0%或超过100%)。对采用预防性干预中的RR(B)与治疗性干预中的RR(H)的效应量来观察有效性的治疗措施时,两者效应区间存在区域性功能重叠,其他所有情况基本符合RR的逻辑预测。在实践中,如果基线风险仅发生在无界区域内,那么RR和RD的边界可能并不重要,可以将事件转换为RR模型来避免边界问题的发生。

4.3 基线风险绝对获益的理论模型 对于预防性干预而言,流行病学家已经提出了在处理风险结果中治疗的最大获益[13,14]。正如对RR(H)模型(图2c)假设为对照组事件发生率增加时其获益也随之增加。这种模型已经作为推测试验或特定风险组的系统评价结果的技术(计算需要治疗的人数或风险的绝对差异)。相关研究通过增加对照组事件发生率来增加获益的模型的方法,且试验中按风险组进行分层分析[13-15]。

对于治疗性干预而言,0事件对OR和RR(B)限制性的假设通常是不合理的,主要由于没有理由相信不会有绝对获益发生在无安慰剂组中。相反,当对照组的回应为100%时,0约束的绝对获益是合理的,支持RR(B)的潜在使用。RR(H)模型(图3d)的假定又一次提出了最大的绝对获益可以通过治疗组最可能差的结果来实现。然而与预防性干预措施不同的是,尚未发表经验证据支持这一假定。而其他方案可以被认为在没有采用安慰剂时,0事件对治疗绝对获益的约束是合理的。如某治疗在癌症早期是有效的,但对于晚期患者而言,无论缓解率还是治疗获益都是非常低的,因此选择合理的治疗性干预的效应量,可能会随临床背景的变化而受影响。

5 讨论

毋庸置疑,在临床上或科研中,通过事后分析与比较来推理理想的效应量为当前最佳方法。通常,效应量应依据基线风险与治疗疗效中不同数据模型特性来进行选取,可以通过图2和图3进行解释。对照组事件发生率的变化反映了系统回顾试验中患者之间特征差异,对照组采用措施,结局的定义与评估,研究质量及随访时长等相关研究特征。

若研究中可以确定对照组事件发生率差异的原因或者可以从图形中观察到事件发生率与治疗疗效间的关系,这样便有可能选出与模型最接近的效应量。相反,若仅依据个人系统主观判定通常是无法完成的,其主要原因可能来自于数据的缺乏、基线风险的多重干扰因素以及模型过度拟合等。相关研究[16,17]已就对照组事件发生率间存在差异性问题制定了正确估计相应的措施[18-20]。尽管,图1中展示了对照组事件发生率的治疗效应(图2~4),但本研究在选取最佳效应量[OR,RR(H),RR(B)或RD]时,并没有采用相应的回归方法,同时也未考虑对照组事件发生率变化。本研究方法仅处理各方面具有稳定可比性的差异情形,如对照组事件发生率稳定,即回避了估计治疗效果与基线风险之间影响。综上所述,对于最佳效应量的选取除了结合经验证据和临床资料特征外,还需考虑基线风险对绝对获益效应量模型的影响。

[1] Higgins JPT,Green S,Katsuyama K,et al. Effect of a human urinary protease inhibitor (Ulinastain) on respiratory function in pediatric patients undergoing cardiopulmonary bypass[J]. J Cardiovasc Surg (Torino),2002,43(4):437-40.

[2] Deeks JJ,Altman DG,Bradburn MJ. Statistical methods for examining heterogeneity and combining results from several studies in metaanalysis.In Systematic Reviews in Health Care: Meta-Analysis in Context, Egger M, Davey Smith G, Altman DG (eds)[M]. BMJ Books: London,2001.

[3] Greenland S,Robins JM. Estimation of a common effect parameter from sparse follow-up data[J]. Biometrics,1985,41(1):55-68.

[4] Bradburn MJ,Deeks JJ,Altman DG. sbe24: metan-an alternative metaanalysis command[J]. Stata Technical Bulletin,1998,8(44):4-15.

[5] Patel M,Lee CK. Polysaccharide vaccines for preventing serogroup A meningococcal meningitis[J]. Cochrane Database Syst Rev,2005,25(1):CD001093.

[6] Moayyedi P,Soo S,Deeks J,et al. Eradication of Helicobacter Pylori for non-ulcer dyspepsia[J]. Cochrane Database Syst Rev,2011,16(2): CD002096.

[7] Moayyedi P,Soo S,Deeks J,et al. Systematic review and economic evaluation of Helicobacter pylori eradication treatment for non-ulcer dyspepsia.Dyspepsia Review Group[J]. BMJ,2000, 321(7262):659-64.

[8] Laine L,Schoenfeld P,Fennerty MB. Therapy for Helicobacter pylori in patients with nonulcer dyspepsia.A meta-analysis of randomized, controlled trials[J]. Ann Intern Med,2001,134(5):361-9.

[9] Edwards JE,Oldman A,Smith L,et al. Single dose oral aspirin for acute pain[J]. Cochrane Database Syst Rev,2000,(2):CD002067.

[10] Ramaratnam S,Marson AG,Baker GA. Lamotrigine add-on for drug-resistant partial epilepsy[J]. Cochrane Database Syst Rev,2002,12(3)85-6.

[11] Laupacis A,Sackett DL,Roberts RS. An assessment of clinically useful measures of the consequences of treatment[J]. N Engl J Med, 1988,318(26):1728-33.

[12] McGettigan P,Sly K,O'Connell D,et al. The effects of information framing on the practices of physicians[J]. J Gen Intern Med,1999,14(10):633-42.

[13] Lubsen J,Tijssen JG. Large trials with simple protocols: indications and contraindications[J]. Control Clin Trials,1989,10(4 Suppl):151S-60S.

[14] Davey Smith G,Egger M. Who benefits from medical interventions? Treating low risk patients can be a high risk strategy[J]. British Medical Journal,1994,308(6921):72-4.

[15] Davey Smith G,Song F,Sheldon TA. Cholesterol lowering and mortality: the importance of considering initial level of risk[J]. BMJ, 1993,306(6889):1367-73.

[16] Sharp SJ,Thompson SG,Altman D. The relation between treatment benefit and underlying risk in meta-analysis[J]. BMJ,1996,313(7059): 735-8.

[17] Senn S. Importance of trends in the interpretation of an overall odds ration in the meta-analysis of clinical trials[J]. Stat Med,1994,13(3):293-6.

[18] McIntosh MW. The population risk as an explanatory variable in research synthesis of clinical trials[J]. Stat Med,1996,15(16):1713-28.

[19] Thompson SG,Smith TC,Sharp SJ. Investigating underlying risk as a source of heterogeneity in meta-analysis[J]. Stat Med,1997,16(23):2741-58.

[20] Walter SD. Variation in baseline risk as an explanation of heterogeneity in meta-analysis[J]. Stat Med,1997,16(24):2883-900.

本文编辑:姚雪莉

Relationship between variation baseline risk and selection of effect size of binary data

FU Wen-jie*, HE Qian, XU Yang-peng, TAO Yuan, ZHANG Chao, NIU Yu-ming.*Center for Evidence-Based Medicine, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China.

Objective To explore the selection of effect size of binary data in Meta-analysis. Methods Combining with the reported data, and considering the pattern of variable baseline risk, four indexes of effect size, including odds ratios (OR); risk differences (RD), risk ratios of benefit [RR(B)]; and relative risk of harmful [RR(H)] were selected and compared in binary data. Results When the predicted baseline risk changes, the results of RR(B) and RR(H) will change in absolute benefit indexes of treatment effect. There will be deviations between observed results and actual results when the size of heterogeneity is taken alone as the selective criteria of effect size. Conclusion The selection of effect size is influenced by the changes of baseline risk to a large extent, and heterogeneity is depended alone will lead to result deviations. At the same time, empirical evidence and clinical data features should be taken into consideration.

Meta-analysis; Effect size; Baseline risk; Binary data

R4

A

1674-4055(2016)11-1291-05

湖北省教育厅重点项目(D20142102)

1442000 十堰,十堰市太和医院(附属湖北医药学院)循证医学中心;2442000 十堰,湖北医药学院口腔医学院12级;3442000十堰,湖北医药学院影像医学院12级;4442000 十堰,十堰市太和医院(附属湖北医药学院)口腔科

牛玉明,E-mail:niuyuming@yeah.net

共同一作:付文杰,何倩

10.3969/j.issn.1674-4055.2016.11.04

猜你喜欢

安慰剂基线异质性
Meta分析中的异质性检验
18F-FDG PET/CT代谢参数及代谢异质性与胃癌临床病理特征的相关性
基于可持续发展的异质性债务治理与制度完善
航天技术与甚长基线阵的结合探索
一种SINS/超短基线组合定位系统安装误差标定算法
“神药”有时真管用
本体支持的生物医学领域元数据异质性与可兼容性研究
为什么假冒“神药”有时真管用
跟踪导练(3)
跟踪导练(三)2