传统meta分析中漏斗图的合理使用

2023-10-31张天嵩

中国医院统计 2023年4期

张天嵩

上海市静安区中医医院,200272 上海

meta分析是针对2个或2个以上研究结果的统计合并[1],但合并结果受包括报告偏倚(reporting biases)在内的多种因素影响,可能产生一定的偏倚。所谓报告偏倚是指科学研究的传播受其结果的性质和方向(如结果阴性或阳性)影响,其中发表性偏倚(因结果的性质和方向导致研究发现发表与否)的控制较为困难且影响程度较大,因此发表性偏倚的识别与处理是meta分析过程中的重要步骤[1-2]。自Egger等[3]1997年在英国医学杂志(British Medical Journal,BMJ)上发表了应用漏斗图识别发表偏倚的研究论文后,得到广泛的应用,已成为BMJ引用最多的论文之一[4]。据笔者在Web of Science官网上检索(截至2023年4月5日),发现该文有34 428的引用频次。但实际应用中,该方法常被众多的引用者错误使用[4-5]。鉴于此,国外学者提出了附加轮廓线漏斗图(contour-enhanced funnel plot)方法以帮助识别传统漏斗图不对称是由发表偏倚引起还是由其他原因引起[6],并开发了相关的软件以实现[7]。虽然经过国内外学者进行推广和传播[2,4-5],但一直未能扭转众多研究者误用漏斗图的趋势,因此有必要再进一步阐释和推广。

1 误用实例

常见的错误使用情况有2种:

一是,直接简单地使用漏斗图法作为识别发表偏倚的方法,这种情况国内外期刊都很常见。如:PublicationbiaswasevaluatedbyfunnelplotasymmetryandEgger’slinearregressiontest[8]。

Weplannedtouseasymmetryoffunnelplotsasanindicatorofpotentialpublicationbias[9]。

Publicationbiasfor28-daymortalitywasassessedthroughvisualinspectionoffunnelplot.Fordatawithanasymmetricfunnelplot,Egger’slinearregressiontestwasadditionallyperformedusingStataversion14[10]。

二是,没有考虑引起漏斗图不对称的其他原因,将漏斗图不对称等同于发表偏倚[4]。例如有些论文把异质性导致的漏斗图不对称直接错误地解释为发表偏倚,如:Publicationbiasassessmentwasdonebyfunnelplot.Thegraphicalmethod,tocheckthePublicationbiasofstudieswasalsoconstructed(原文方法学部分)……Funnelplot[Figure3[showstwostudyoutofinvertedfunnel;therefore,publicationbiaswaspresent(原文结果部分)[11]。

2 误用辨析

2.1 漏斗图

传统漏斗图是meta分析过程中采用多个研究数据绘制成的散点图,以每个研究的效应量大小为横坐标,以效应量的权重如标准误、方差倒数或样本量等为纵坐标[5,12],最常用的是标准误[13]。如果漏斗图呈现“倒漏斗样”形状:效应量的精度随着样本量的增加而增加,其宽度随精度的增加而逐渐变窄,最后趋近于点状。也就是说样本量小的研究,数量多、精度低,分布在漏斗图的底部呈左右对称排列;样本量大的研究,精度高,分布在漏斗图的顶部,且向中间集中,说明不存在发表偏倚[2,4-5,14]。如果存在发表偏倚,则可能导致漏斗图不对称。但应注意,除了发表偏倚外,小型研究方法学质量低下、研究间异质性、造假和机遇均可以造成漏斗图不对称,Egger等[3]已在文献中讨论该问题,但引用者并未关注这点,导致误用。从逻辑上讲容易理解,上述多个原因均可导致漏斗图不对称,但不能由漏斗图不对称反推是由发表偏倚所致。

因为发表偏倚仅是导致漏斗图不对称的原因之一,因此漏斗图可以看成是检验小型研究效应(small study effects)的一种方法[15-16],而不是检验某种特定偏倚的工具。漏斗图不对称意味着存在小型研究效应(该术语一般是指小型研究干预效应有时异于,常常是大于大型研究的现象[17]),小型研究效应最为人所知的可能原因是发表偏倚。

漏斗图是否对称如果仅从视觉上来判断,不同的人可能会对漏斗图是否对称做出不同的结论,因此有学者提出了多种统计学方法检验漏斗图的不对称性,如秩相关检验法、(加权)线性回归分析法、剪补法等;但这些检验方法统计效能比较低,因此甚至检验没有提供不对称的证据时,也不能排除偏倚[4]。

2.2 附加轮廓线漏斗图

传统漏斗图不能鉴别其不对称的原因,Peters等[6]在2008年提出一种称为附加轮廓线漏斗图的增强型漏斗图,用来帮助判断漏斗图的不对称是由发表偏倚还是由其他原因引起。附加轮廓线漏斗图的绘制与传统漏斗图相同,但在传统漏斗图基础上,增加了统计学显著性(如0.01、0.05、0.10)的识别界线及其相对应的轮廓线,这些轮廓线将漏斗分成了不同统计学显著性的区域,从而利于识别出所绘制漏斗图上的点是否具有统计学显著性。首先判断是否存在不对称;如果存在不对称,结合剪补法,发现缺失的研究分布位置,从而分析漏斗图不对称是由发表偏倚还是其他原因引起[2,4,14]:如果存在不对称,且缺失的研究分布在无统计学显著性区域,则说明由发表偏倚导致漏斗图不对称,尽管还有其他解释;如果存在不对称,且缺失的数据分布在有统计学显著性区域,则说明不对称可能由其他原因而非发表偏倚导致。

2.3 实例辨析

以一项考克蓝系统评价[18]为例说明漏斗图的正确使用。该研究主要观察静脉注射镁离子与安慰剂相比,干预急性心肌梗死(acute myocardial infarction,AMI))患者早期死亡率和病死率等有效性,共纳入22项研究,除了4项研究外,其他研究均为小型研究,选择比值比(odds ratio,OR)为效应量,固定效应(共同效应)模型和随机效应模型估计合并效应量的点估计和95%置信区间分别为0.99(0.94,1.04)和0.66(0.53,0.82)。原作者针对死亡率测量结局,通过绘制漏斗检验发表偏倚和其他偏倚[18],如图1所示,并认为漏斗图不对称,潜在的发表偏倚不能避免[18]。

图1 文献[18]中使用RevMan软件绘制的传统漏斗图

笔者选取该系统评价中针对静脉注射镁离子干预AMI早期死亡率的meta分析数据,以OR为效应量,拟合共同效应模型和随机效应模型,使用R软件(ver 4.2.1)中的meta扩展包(ver 6.2-1)重新分析,得森林图如图2所示。因为纳入meta分析的“ISIS-4 1995研究”的样本量非常大,根据效应模型合理使用原则,选择拟合共同效应模型的结果进一步绘制传统漏斗图如图3、附加轮廓线漏斗图如图4、结合剪补法附加轮廓线漏斗图如图5等所示;并采用Harbord法对漏斗图进行不对称检验。

图2 森林图

图3 以R软件meta包绘制的传统漏斗图

图5 以R软件meta包绘制的剪补后附加轮廓线漏斗图

图4 以R软件meta包绘制的附加轮廓线漏斗图

如图2所示的森林图显示拟合共同效应和随机效应模型的结果中,可以发现研究间存在明显的异质性(Q统计量相应P<0.01,I2=64%,τ2=0.176 6)。共同效应模型提示AMI患者静脉注射镁离子未能获益,而随机效应模型提示获益。

从视觉上可以发现,如图3所示的传统漏斗图明显存在不对称,并经Harbord法检验结果(t=-4.88,P<0.000 1)进一步证实。从图2中可以发现多个小型研究未能提供静脉注射镁离子获益的证据;从图4所示的附加轮廓线漏斗图中多个结果阴性的小型研究分布在漏斗图底部,均提示仅以发表偏倚不能完全解释漏斗图的不对称。从结合剪补法的附加轮廓线漏斗图(图5)中可以发现,本次meta分析“缺失”了10个研究(图中的白色圈点),有5个缺失的研究分布在有统计学显著性区域(图5中白色区域和深灰色区域),有5个缺失的研究分布在无统计学显著性区域(图5中灰色和银灰色区域),因此传统漏斗图(图3)和附加轮廓线漏斗图(图4)不对称的原因除了发表偏倚外,方法学质量低下的小样本研究(例如标准干预措施的改变,如阿司匹林等干预措施的广泛应用等)、研究间异质性大等也是潜在的原因。

3 正确策略

当前,国外高影响力杂志刊载论文多采用漏斗图来检验小型研究效应(偏倚)来作为评价报告偏倚的指标,如:

Weassessedsmallstudyeffectswithfunnelplotsbyplottingthenaturallogarithmoftheoddsratiosagainsttheinverseofthestandarderrors,andasymmetrywasassessedwithEgger′stest[19]。

Ifwewereabletopoolmorethan10trials,wecreatedandexaminedafunnelplottoexplorepossiblesmall-studyandpublicationbiases[20]。

或者以附加轮廓线漏斗图来识别小型研究效应或发表偏倚,如:

Smallstudyeffects(potentialpublicationbias)wereexploredusingcontourenhancedfunnelplotsforoutcomesreportedin10ormorestudies[21]。

Small-studyeffectswereassessedbyvisualassessmentofthecontour-enhancedfunnelplotsandformalEggerregressiontest[22]。

4 正确使用漏斗图的建议

在meta分析中,漏斗图和对漏斗图不对称进行检验已被系统评价和meta分析人员广泛应用于检验偏倚。但在实践中,必须合理使用漏斗图和附加轮廓线漏斗图来识别发表偏倚,建议要点如下[1-2,4-6,17,23]:

1)不能将漏斗图不对称等同于发表偏倚,即不能把漏斗图存在不对称判定为存在发表偏倚。

2)应合理解释漏斗图不对称的原因。发表偏倚、小型研究因方法学质量低导致治疗效应夸大、异质性、抽样变异、机遇等均可导致漏斗图不对称。

3)附加轮廓线漏斗图可以用来帮助识别漏斗图不对称是由发表偏倚还是由其他原因引起。

4)可通过目测法和多种统计学方法来判断或检验漏斗图是否不对称。

5)作为一条经验法则,如果纳入meta分析的研究少于10个,则不建议对漏斗图不对称进行检验。

6)应根据数据类型、效应量、研究间异质性方差大小等合理选择漏斗图不对称的统计学检验方法。针对连续型数据,如果选择标化均数差为效应量,则应首选Egger法。针对二分类数据,如果选择OR为效应量,若研究间异质性方差小于0.10,则使用Harbord法、Peters法和Rücker法;如果大小0.10,则选用Rücker法。

7)漏斗图图形会受到结局变量、测量指标、纵轴权重的影响,如果纳入meta分析研究效应量的标准误非常相似,则无需对漏斗图进行不对称检验。附录A(实例辨析所用R软件实现的代码),附录B(思考题)请扫描本文开放科学(资源服务)标识码(OSID)。