APP下载

网络Meta分析研究进展系列(六):网络Meta分析发表偏倚的调整

2020-12-22武珊珊杨智荣董圣杰张天嵩田金徽孙凤

中国循证心血管医学杂志 2020年11期
关键词:概率效应变量

武珊珊,杨智荣,董圣杰,张天嵩,田金徽,孙凤

网络Meta分析(NMA)扩展了传统Meta分析的方法,可在一个证据体中同时评估多个干预措施,在证据一致性的假设下,将直接证据和间接证据合并得到干预措施效果的综合估计,并可获得干预措施间的疗效排序,为医疗保健决策提供信息[1,2]。然而,发表偏倚的存在会影响一致性和异质性假设,从而影响结果的真实性[3]。Chaimani等[4]对NMA的流行病学研究发现小样本研究更倾向于夸大阳性干预措施的效果。目前关于NMA发表偏倚的评估多采用校正比较漏斗图[5],但该方法仅能根据漏斗图是否对称来定性判断是否存在发表偏倚,无法定量评估发表偏倚的大小,且具有一定主观性。Trinquart等[6]对Meta回归模型进行了扩展,该方法可定量评估NMA网络中直接比较的发表偏倚,但无法对间接比较的效应值进行评估,且未考虑多臂研究中的内在相关性。为解决上述问题,Mavridis等[7]2014年提出了针对包含多臂研究的有闭合环证据体NMA的Copas选择模型,该模型基于一致性假设,将纳入分析的研究看作一个有偏的样本,通过引入“发表倾向”这一潜变量来模拟NMA中研究的选择过程,通过指定不同的概率组合进行敏感度分析,以评估是否存在发表偏倚及发表偏倚对结果的影响大小和方向。本文将介绍贝叶斯框架下NMA中的Copas选择模型及代码实现。

1 理论基础

1.1 设计×干预交互模型简介设NMA证据网络中共纳入N(i=1,2,……N)个研究,T(A, B, C,……T)种干预措施,D(d=1, 2,……D)种设计。令Td表示第d个设计中干预措施的数目,表示第d个设计第i个研究中两种干预措施X和Y之间的比较结果,则在随机效应模型下有:

其中λXY为X和Y之间对比的总效应,可视为固定参数,在一致性假设成立的情况下为随机效应项,服从N(0,τ2)的正态分布,τ2即为研究间方差,通常情况下为了模型估计方便我们假定所有干预对比有相同的研究间方差;为随机误差项,服从的正态分布,为研究内方差。因此,上述公式可以转化为

在多臂研究(multi-arm trial)中,因各个臂之间的效应存在相关性,第d个设计第i个研究的Td-1个效应值符合多元正态分布,以包含A、B、C三种干预措施的三臂研究为例,在相同研究间方差的情况下,我们需要估计的参数和符合:

1.2 Copas选择模型简介Copas选择模型[8]最初由Copas及其同事于2001年提出,用于传统Meta分析中发表偏倚的修正。该模型将纳入分析的研究看作一个有偏的样本,通过引入“发表倾向”这一潜变量Zi来模拟Meta分析中研究的选择过程,假设第i个研究因为潜变量Zi>0而被选择,研究i被发表的概率与其标准误(si)密切相关,具体关系为:

其中,φ为标准正态分布的累积概率分布,α和β为两个敏感性参数,α为研究被发表的边际概率,控制了整体研究被发表的比例,β则反映了标准误不同的研究之间发表概率的差异。若β=0,α是一个很大的数(如α=10),则任何研究(无论其标准误有多大)被发表的概率均为1,即不存在发表偏倚;我们假定β>0,则大样本研究由于其标准误较小被发表的概率往往更高。通过指定最小及最大标准误研究的不同发表概率组合来进行敏感度分析,以评估是否存在发表偏倚及发表偏倚对结果的影响。

此外,Copas等通过公式推导发现“发表倾向”这一潜变量与研究本身效应值相关,相关性为ρ(ρ=Corr(yi,zi))。若ρ=0,则说明研究被发表的概率与研究本身的效应值无关,即不存在发表偏倚;若ρ>0,则说明效应量越大的研究越可能被选择或发表,从而使得最终效应量被高估。

1.3 NMA中的Copas选择模型Mavridis等[7]2015年将NMA中的一致性假设与设计×干预交互模型考虑在内,对上述Copas选择模型进行了拓展,NMA中研究i被发表的概率除了与该研究本身的效应值及标准误(Sid)相关外,还与该研究的设计(d)密切相关,具体关系为:

其中,φ为标准正态分布的累积概率分布,αd和βd为两个敏感性参数。f(Sid)为第d个设计的方差-协方差矩阵:两臂研究中,f三臂研究中,因存在一定的相关性,

类似的,第d个设计的研究效应值与潜变量之间的相关系数ρd=Corr(yid,zid),i指第d个设计的所有研究。如果ρdXY=0,则说明研究被发表的概率与研究本身的效应值无关;如果ρdXY>0,则说明效应量越大的研究越可能被选择或发表,从而使得最终效应量被高估。当然,对于同一个比较(如干预措施X和Y的比较)来说,研究被发表的概率还与设计类型相关,因为可能ρ1XY≠ρ2XY。

在此基础上,我们可以估计出所有发表的和未发表的研究的总数TS,即

因此,在两臂研究(如干预措施A和B)中,第d个设计第i个研究的效应值与潜变量Zi的联合分布为双变量正态分布(如下),其中为示性函数,当时I为1,否则I=0。

而在三臂研究(如干预措施A、B和C)中,因存在一定的内部相关性,第d个设计第i个研究的效应值与潜变量Zi的联合分布为多元正态分布(如下),其中IZid>0为示性函数,当Zid>0时I为1,否则I=0。

由此,我们可得到最终效应值的条件期望和方差,分别为

在符合一致性假设的情况下,可推导出第d个设计的三臂研究效应值与潜变量之间的相关系数ρd满足以下关系:因而,在上述理论基础上,我们可通过指定最小及最大f(sid)研究的不同发表概率组合来进行敏感度分析,得出不同概率组合下的效应值及可信区间、异质性因子τ、研究总数(TS)和不同设计下各干预比较的效应值与潜变量之间的相关系数,以评估NMA中是否存在发表偏倚及发表偏倚对结果的影响。

2 实例分析及OpenBUGS代码实现

以抗血小板治疗维持血管移植/动脉通畅[9]为例,拟合改良的Copas选择模型。该NMA共纳入31个研究,包含安慰剂(A)、阿司匹林(B)和阿司匹林+双嘧达莫(C)3种干预措施,AB(d=1,T1=2, n1=7)、AC(d=2, T2=2, n2=14)、BC(d=3, T3=2,n3=4)、ABC(d=4, T4=3, n4=6)4种设计。研究结局为血管移植/动脉通畅失败。因等高线强化漏斗图显示第1种设计AB的7个研究不对称,其他设计下的各比较结果未见明显不对称,故分别设置以下5种概率组合来模拟不同程度发表偏倚的情况,进行敏感度分析(表1)。采用OpenBUGS软件进行分析,共迭代200000次,30000次预烧,设置2条MCMC链,通过rooks-Gelman-Rubin图和相关统计量来判断马氏链的收敛情况。收敛满意后,基于抽样数据进行参数估计与推断。模型代码及数据见附件,运行结果见表2~3。

由表3可见,无论发表倾向的高低,异质性因子τ无明显变化;OR结果显示当有研究未发表(场景2-5)时,阿司匹林和阿司匹林+双嘧达莫的效应值均有所下降,说明若仅纳入当前已有研究会高估其疗效;SUCRA和平均排序的结果显示,在大多数情况下阿司匹林均为疗效最好的干预措施,但在场景3中阿司匹林+双嘧达莫则变为了排名第一的干预,提示由于发表偏倚的存在使得效应值和排序结果出现了一定程度的不确定性,因此在结果解释时需谨慎。

?

?

?

3 讨论

最初Mavridis等[10]于2013年将传统的Copas选择模型扩展到了星型证据结构的NMA中,以衡量发表偏倚,但实际情况下大多数NMA均为有闭合环的混合比较的证据结构,且通常会纳入多臂研究,因而此模型的应用受到了一定的限制。随后,Mavridis等[7]2014年进一步将前述模型扩展到了包含多臂研究的有闭合环的证据体的NMA中,该扩展的Copas选择模型在一致性假设的基础上,将设计×干预交互效应考虑在内,NMA中每个研究被发表的概率除了与研究本身的效应值和标准误相关外,还与研究设计密切相关。然而设计可能与效应值和标准误相互作用,因此很难判断哪个因素对发表倾向的影响更大。Chan等[11]研究显示所有发表的RCT中26%为多臂研究,由于其研究设计特点或较大的样本量使其被发表的概率更大。政策制定者通常对“头对头”的多个干预之间的直接比较更感兴趣,且多为公共机构资助的大样本非劣效性研究,因而即使有些多臂研究的效应值较小或为阴性结果,其也更可能被发表。在以安慰剂为对照的研究中,阳性药物与安慰剂的比较通常在两臂研究中的效应值较多臂研究更大;但同样两臂或多臂的安慰剂对照研究,其被发表的概率也不完全相同,由于临床医生、患者及政策制定者等对新型干预更感兴趣,因而新型干预作为实验组的研究被发表的概率更大。

此外,该扩展的Copas选择模型的实现基于贝叶斯框架,相比频率学框架更优,主要表现在以下三个方面。首先,频率学框架采用似然比检验效应值与标准误之间的关联,以评价是否存在发表偏倚,但多数Meta分析纳入研究的数目较少,因而统计学检验的把握度不足[12]。该模型通过MCMC获得每个参数的后验分布及95%CI,以进行贝叶斯推断,弥补了上述频率学框架的不足。其次,该模型还可评价发表概率、异质性因子、效应值、SUCRA、排序及相关系数ρd等各参数的不确定性,以评估发表偏倚的大小,类似于敏感度分析,衡量估计结果的稳定性。第三,研究被发表的概率除与效应值、标准误及设计因素相关外,还可能与其他因素如资助类型等有关,该模型可将相关因素作为协变量引入进行探讨。如以指示变量Xid=0表示研究i未被资助,Xid=1表示研究i被资助,则有潜变量Zid=αd+βd/f(Sid) +γdXid+ξid。若γd=0,则提示研究被发表的概率与是否获得资助无关;反之,若γd≠0,则提示研究是否获得资助会影响到研究的发表情况。

当然,该选择模型也有一定的局限性,在应用时需要保证同一干预比较的各研究结果之间的一致性,否则可能无法识别出发表偏倚。例如探讨干预措施A和B疗效比较的研究,阴性结果的研究均未被发表,而阳性结果(A优于B及B优于A)的研究均被发表,此时该模型很可能得出效应值与潜变量的相关系数ρd为0即不存在发表偏倚的错误结论。因此在应用该选择模型进行发表偏倚的评估时需多加注意。

4 结语

本文针对贝叶斯框架下NMA的扩展Copas选择模型的理论及代码实现进行了介绍。该模型在漏斗图主观定性判断各比较有无发表偏倚的基础上,引入“发表倾向”这一潜变量来模拟NMA中研究的选择过程,通过指定不同的概率组合进行敏感度分析,既可以通过相关系数ρd的大小(ρd是否为0)来评估是否存在发表偏倚,又可以通过效应值及SUCRA的变化(通常发表偏倚存在时会高估效应值)定量评估发表偏倚的大小,结果更为客观,且可衡量结果的不确定性,对最终证据等级的评定及临床决策有较大意义。笔者于Web of Science数据库中检索,迄今为止该论文[7]已被引用28次,其中11篇为方法学研究,余下17篇采用了该模型对NMA发表偏倚进行了评估,未来可开发相应的R软件包以促进该方法的推广应用。此外,Ning等[13]于2017年将最大期望算法引入频率学框架下的最大似然估计,为未来将Copas选择模型扩展到基于频率学框架的NMA中奠定了一定的基础。但是,目前Cochrane手册[14]对于评估NMA发表偏倚的几种方法尚没有给出最优推荐,相信随着方法学的不断发展,NMA发表偏倚评估的方法也会日趋成熟稳健。

猜你喜欢

概率效应变量
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
寻求不变量解决折叠问题
抓住不变量解题
懒马效应
应变效应及其应用
分离变量法:常见的通性通法
变中抓“不变量”等7则