观察性研究的敏感性分析：“E-value”解读

2020-05-25姜棋予孙丽君毕京峰

中国医药导报 2020年11期

姜棋予孙丽君毕京峰

[摘要] 通过对敏感性分析新方法E-value的解读，向读者介绍一种简单实用的观察性研究敏感性分析方法。该方法以相对危险度（RR）作为主要研究指标，构建了RR敏感性分析的统计学模型，从而预测能够将研究结果（RR值）解释掉的，未知混杂因素与暴露因素及结局的最小关联强度。该方法还通过统计学转换，将RR推广到优势比、风险比及结局变化的均值的敏感性分析。该方法为观察性研究的敏感性分析提供了一种简单、可靠的分析方法，建议在以后的观察性研究报告及论文发表中提供相应的敏感性分析结果，但须注意，该敏感性分析并不能替代严谨的科研设计。

[关键词] 观察性研究;敏感性分析;E-value;解读

[中图分类号] C81 [文献标识码] A [文章编号] 1673-7210（2020）04（b）-0181-06

Sensitivity analysis of observational studies： “E-value” interpretation

JIANG Qiyu SUN Lijun BI Jingfeng▲

Clinical Research Management Center， the Fifth Medical Center， Chinese PLA General Hospital， Beijing 100039， China

[Abstract] Through the interpretation of the new sensitivity analysis method E-value， a simple and practical sensitivity analysis method for observational research is introduced to readers. In this method， Relative Risk （RR） was used as the main research index to construct a statistical model of RR sensitivity analysis， so as to predict the minimum correlation strength of unknown confounders with exposure factors and outcomes that can explain away the research results （RR values）. The method also extended RR to sensitivity analysis of Odds ratio， Hazard ratio and mean of outcome changes through statistical transformation. This method provides a simple and reliable method for sensitivity analysis of observational research， and it is suggested to provide corresponding results of sensitivity analysis in future observational research reports and papers， but it should be noted that this sensitivity analysis cannot replace rigorous scientific research design.

[Key words] Observational study; Sensitivity analysis; E-value; Interpretation

在觀察性研究中，临床研究的结局可能受多种因素的影响，即使研究者已经根据前期调研结果采集到了足够的影响因素，但仍可能存在未知的混杂因素影响结果的可靠性。从流行病学的角度，研究者更希望知道研究结果的稳定性或可靠性有多高，即假如存在一个或几个未知的影响因素，这些影响因素需要有多大的“效力”可以完全解释掉该研究结果。国外的学者已经提出了多种探索敏感性分析的分析方法[1-19]，但这些分析方法在学术界也引起了一定的争议，部分技术被认为太过主观，研究者往往通过选择更为灵敏的参数，使结果相对于未知混杂因素的影响更为稳健[20]。其他批评包括，假设通常规定未测量的混杂因素是二元的[3]，或者只有一个未测量的混杂因素[4-5]，或者未测量的混杂因素与治疗结果之间没有相互作用[2-5]。

加州大学伯克利分校统计系丁鹏博士与哈佛大学公共卫生学院流行病学系博士Tyler J. VanderWeele利用混杂因素与暴露因素及结局的关联性，提出并构建了观察性研究的敏感性分析理论[14，20-21]，并组织编写了名为“EValue”的R包，为观察性研究的敏感性分析提供了一种简单、可靠的分析方法。本文将针对该方法进行介绍，以期为国内研究者提供观察性研究敏感性分析的新思路。

1 基本原理

1.1 统计学原理

设暴露因素为E，已经获得的协变量（混杂因素）为C，结局变量（二分类）为D，未测量的混杂因素为U（可以为两分类，多分类，连续变量，U=1，2……k）。将未测量混杂因素U与暴露因素E的关联强度称之为RREU，将未测量混杂因素U与结果D的关联强度称之为RRUD。RREU、RRUD与暴露因素、结局以及已经获得的协变量的关系见图1[21]。

2.2 E-value分析的3个扩展

在观察性研究中，针对不同研究设计和结果数据，logistic回归、Cox比例风险模型、多重线性回归是最为常用的多因素统计分析方法，其输出的统计结果分别是优势比（odds ratio，OR）、风险比（hazard ratio，HR）、结局变化的均值及其置信区间。E-value也通过RR的统计学转换为上述结果提供了敏感性分析方法。

2.2.1 OR值的敏感性分析如前所述，E-value的敏感性分析主要针对的是RR指标，关于OR值的敏感性分析则是基于RR值与OR值的相关性统计学理论取近似值，在E-value中，当结局事件的发生率<15%或>85%时，按RR=OR计算，当结局事件的发生率介于15%～85%时，按如下公式计算[21，23]RR=■，将OR近似地替换为RR，从而可以利用该RR的近似值进行敏感性分析。如在“基于剂量-反应关系的体力活动对血清肌酐水平的影响及其性别差异”[25]中，能量代谢当量大于821.50MET-min/week组（肌酐异常发生率35.24%）发生肌酐水平异常的OR值为1.47， 95%的置信区间为（1.13～1.92），肌酐异常总发生率为（192+216）/（804+613）×100%=28.79%（介于15%～85%）。其E-value的R软件实现：在R软件EValue包中，可直接利用以下函数进行估算：evalues.OR（X，low，high，rare =0或1），其中X表示观察性研究结果OR值，low表示OR值置信区间的下限，high表示OR值置信区间的上限，rare即结局事件的发生率是否在15%～85%之间，当在这个区间时rare=0，当<15%或>85%时，rare=1。将上述值代入EValue包“evalues.OR（1.47，1.13，1.92，rare =0）”，得到E-value=1.72，其值置信区间的低限为1.32，即如果存在某种未测量（未知）的混杂因素，其与暴露因素及结局的RR各达到1.32时（RREU=RRUD=1.32），就可以完全解释掉原研究结果RR=1.47。

2.2.2 HR值的敏感性分析 Cox比例风险模型输出的主要统计结果是HR值，同OR值相似，当结局事件的发生率<15%或>85%时，按RR=HR计算，当结局事件的发生率介于15%～85%时，E-value[21]按如下公式计算：RR≈[1-0.5sqrt（HR）]/[1-0.5sqrt（1/HR）]。R软件实现：同OR值敏感性的计算一样，在R软件EValue包中，可直接利用以下函数进行估算：evalues.HR（X，low，high，rare =0或1），其中X表示观察性研究结果HR值，low表示HR值置信区间的下限，high表示HR值置信区间的上限，rare即结局事件的发生率是否在15%～85%之间，当在这个区间时rare =0，当<15%或>85%时，rare =1。

2.2.3 结局指标变化均值及其置信区间的敏感性分析多重线性回归分析结果输出的是回归系数及其标准误。回归系数是指当调整了其他协变量后，研究变量每变化一个单位，结局指标的变化平均值。如Reinisch等[25]研究了苯巴比妥宫内暴露对男性智力的影响，暴露组为母亲在怀孕期间应用过苯巴比妥的男性，对照组为母亲在怀孕期间未应用过苯巴比妥的男性，经对家庭社会经济状况、教育、母亲是否尝试堕胎、母亲婚姻状况等协变量调整后。苯巴比妥对智力影响的估计值均数为-4.77，95%的置信区间为（-7.96～-1.58），标准误差为1.63，所有样本的总方差为11.83。研究者没有获得关于父母智力的数据，这可能是一个未测量的混杂因素。与OR、HR属于分类资料不同，上述研究中对智力影响的估计值属于连续性计量资料，首先需要将其转化为RR，才能够进行敏感性分析。E-value基于方差分解的统计学理念，通过计算结局指标变化均值占总方差的比例来获得RR，具体方法是：用对智力影响的估计值均数和标准误除以总样本的标准差，得到D=-4.77/11.38=-0.42和SD=1.63/11.38=0.14的结果。然后应用公式[21，22，26-27]：RR≈exp（0.91×d），置信區间：exp（0.91×d-1.78×sd），exp（0.91×d+1.78×sd），计算得到RR≈1.46，95%置信区间约为（1.14～1.88），再利用公式2即可以获得E-value值及其95%的置信区间，结果E-value=2.29，其95%的置信区间的下限为1.54。之所以在计算RR的估计值时，代入公式的是0.42而不是-0.42，是因为-0.42仅代表苯巴比妥对智力影响的估计值降低了0.42，“-”在这儿仅表示一个方向。R软件EValue包同样提供了相应的函数：evalues.MD（D，SD），如本例，evalues.MD（0.42，0.14），即可获得上述结果。

2.3 关于E-value几个需要说明的问题

2.3.1 RR值应>1 许多研究获得的RR往往<1，E-value一般要求如果RR<1，则应取该值的倒数使之>1。其实这不矛盾，RR本身是一个相对概念，一般代表的是暴露组与对照组的发病率之比，其倒数代表的是对照组与暴露组的发病率之比，在结果解释上是相同的。

2.3.2 E-value值代表什么？ E-value值可用于估算未测量的混杂因素能够将研究结果解释掉的，需要与结局指标相关联的最小关联强度，从而可以评估暴露因素与结局指标之间关联的稳健程度，并且当在E-value值比较大情况下，可能提供支持因果关系的有力证据。然而，在没有确凿证据的情况下，不能以E-value值的大小来判断原研究结果的对与错。从公式2中可以看出，E-value值与研究结果RR值（或由OR、HR等推导出的RR值）的大小是密切相关的，当RR值较小时，E-value值也较小。不能因为RR值较小，同时E-value值也较小就认为研究结果可能是错误的，因为暴露与结局的相关性事实上可能就是这个结果。

2.3.3 E-value需不需要確定一个固定的域值？既然获得了E-value，研究者可能会问，能不能象P值（P < 0.05被公认为有统计学差异）一样确定一个固定的域值，当E-value>该值时研究结果可认为更稳健，而当<该值时被视为不够稳健？“推荐Evalue”[22]认为，不应该设置这样一个域值。因为E-value值仅表示，假如有未测量的混杂因素能够解释掉研究结果RR，其与暴露因素及结局指标最小的关联程度。如上所述，可能在事实上，暴露与结局的相关性本身就是这个结果。

2.3.4 E-value还可以用于评估研究结果被低估的关联强度 E-value值除了可用于估算未测量的混杂因素能够将研究结果解释掉的，需要与结局指标相关联的最小关联强度外，也可以评估由未测量的混杂因素导致的，暴露因素与结局指标相关联的被低估的关联强度。二者的方法学原理是相似的。例如“血清白蛋白对心力衰竭患者院内死亡的影响”[23]研究中，RR=2，当我们想知道未测量的混杂因素需要具备多大的RREU和RRUD，会导致RR=3时，则RR′=2/3，然后利用公式2，将RR′替换RR即可获得相应的E-value值。

2.3.5 有了E-value还需要进行多因素分析吗？答案是肯定的。E-value评价的是观察性研究结果可能被未测量混杂因素解释掉的程度，多因素分析的结果无疑将更加稳健，其可能存在的未测量混杂因素的范围将更小，所获得的E-value值也更加确切。

2.4 E-value的局限性

如同任何一种统计学方法都有其局限性一样，E-value学说的发表也引起了一些争议，JPA等[28]认为，E-value方法在观察性研究中很容易被误用。E-value提供的是一个具有线性关系性质的一个比较简单的值[28]，是在假设未测量的混杂因素对暴露因素与结局具有相同的关联度的前提下获得的，代表的是一种最小关联强度。在医学实践中，这种关联程度未必相同，因此E-value值仅仅且只能作为一个参考指标，其是否反应了临床实际值得商榷。

E-value仅仅提供了一种敏感性分析结果，不能替代观察性研究所必须的，严谨的科研设计。E-value是在科学、严谨的设计，实施，统计，分析基础上所建立的一种相对简单、线性的敏感性分析方法，只能对假设的未知混杂因素能够将研究结果（RR值）解释掉的最小关联强度进行预测。由于这仅仅是一种未知的假设，其在评价过程中只能起一定的辅助作用，不能因为获得了较大的E-value值就认为结果一定是稳健的，也不能因为获得了较小的E-value值就认为结果不可靠。观察性研究结果的科学性决定于必须按照流行病学的研究原理，进行科学、严谨的设计，实施，统计，分析，并进行规范的报告[29]，方能得出令人信服的结论。准确地说，观察性研究结果的科学性和可靠性只与科学、严谨的设计，实施，统计，分析相关，E-value值只是为该研究结果提供了一种补充信息。

3 致谢

在本文的成文过程中，得到了E-value方法的原创者，加州大学伯克利分校统计系丁鹏教授的大力支持，并对文章进行了悉心指导和修改，在此谨表示衷心感谢并致以崇高的敬意。

[参考文献]

[1] Bross ID. Spurious effects from an extraneous variable [J]. J Chronic Dis，1966，19（6）：637-647.

[2] Schlesselman JJ. Assessing effects of confounding variables [J]. Am J Epidemiol，1978，108（1）：3-8.

[3] Rosenbaum PR，Rubin DB. Assessing sensitivity to an unobserved binary covariate in an observational study with binary outcome [J]. J R Stat Soc Series B，1983，45：212-218.

[4] Lin DY，Psaty BM，Kronrnal RA. Assessing the sensitivity of regression results to unmeasured confounders in observational studies [J]. Biometrics，1998，54（3）：948-963.

[5] Imbens GW. Sensitivity to exogeneity assumptions in program evaluation [J]. Amer Econ Rev，2003， 93：126-132.

[6] Vanderweele TJ，Arah OA. Bias formulas for sensitivity analysis of unmeasured confounding for general outcomes，treatments，and confounders [J]. Epidemiology，2011，22（1）：42-52.

[7] Bross ID. Pertinency of an extraneous variable [J]. J Chronic Dis，1967，20（7）：487-495.

[8] Lee WC. Bounding the bias of unmeasured factors with confounding and effectmodifying potentials [J]. Stat Med，2011，30（9）：1007-1017.

[9] Robins JM，Rotnitzky A，Scharfstein DO. Sensitivity analysis for selection bias and unmeasured confounding in missing data and causal inference models [M]// Statistical Models in Epidemiology， the Environment， and Clinical Trials. Springer New York，2000：1-94.

[10] McCandless LC，Gustafson P，Levy A. Bayesian sensitivity analysis for unmeasured confounding in observational studies [J]. Stat Med， 2007，26（11）：2331-2347.

[11] Brumback BA，Hernán MA，Haneuse SJ. Sensitivity analyses for unmeasured confounding assuming a marginal structural model for repeated measures [J]. Stat Med，2004，23（5）：749-767.

[12] VanderWeele TJ. Explanation in Causal Inference：Methods for Mediation and Interaction [M]. New York：Oxford University Press，2015，Chapter 3.

[13] VanderWeele TJ. Sensitivity analysis for contagion effects in social networks [J]. Sociol Methods Res，2011，40（2）：240-255.

[14] Ding P，VanderWeele TJ. Sensitivity analysis without assumptions [J]. Epidemiology，2016，27（3）：368-377.

[15] Gilbert PB，Bosch RJ，Hudgens MG. Sensitivity analysis for the assessment of causal vaccine effects on viral load in HIV vaccine trials [J]. Biometrics，2003，59（3）：531-541.

[16] Chiba Y，VanderWeele TJ. A simple method for principal strata effects when the outcome has been truncated due to death [J]. Am J Epidemiol，2011，173（7）：745-751.

[17] Huang TH，Lee WC. Bounding formulas for selection bias [J]. Am J Epidemiol，2015，182（10）：868-872.

[18] Robins J，Orellana L，Rotnitzky A. Estimation and extrapolation of optimal treatment and testing strategies [J]. Stat Med，2008，27（23）：4678-4721.

[19] Hernán MA，Lanoy E，Costagliola D. Comparison of dynamic treatment regimes via inverse probability weighting [J]. Basic Clin Pharmacol Toxicol，2006，98（3）：237-242.

[20] Ding P，VanderWeele TJ. Sharp Sensitivity Bounds for Mediation Under Unmeasured Mediator-Outcome Confounding [J]. Biometrika，2016，103（2）：483-490.

[21] VanderWeele TJ，Ding P. Sensitivity Analysis in Observational Research：Introducing the E-Value [J]. Ann Intern Med，2017，167（4）：268-274.

[22] 于彤彤，宋娇磊，刘双双，等.基于倾向性评分匹配法探讨血清白蛋白对心力衰竭患者院内死亡的影响[J].中华内科杂志，2015，54（11）：959-964.

[23] VanderWeele TJ. On a square-root transformation of the odds ratio for a common outcome [J]. Epidemiology，2017， 28（6）：e58-e60

[24] 许春杰，刘晓宇，尹素凤，等.基于剂量-反应关系的体力活动对血清肌酐水平的影响及其性别差异[J].郑州大学学报：医学版，2018，53（2）：225-229.

[25] Reinisch JM，Sanders SA，Mortensen EL. In utero exposure to phenobarbital and intelligence deficits in adult men [J]. JAMA，1995，274（19）：1518-1525.

[26] Hasselblad V，Hedges LV. Meta-analysis of screening and diagnostic tests [J]. Psychol Bull，1995，117（1）：167-178.

[27] Borenstein M，Hedges LV，Higgins JPT，et al. Introduction to Meta-Analysis [M]. Wiley：2009，Chapter 7.

[28] JPA I，Tan YJ，Blum MR. Limitations and Misinterpretations of E-Values for Sensitivity Analyses of Observational Studies [J]. Ann Intern Med，2019，170（2）：108-111.

[29] von EE，Altman DG，Egger M，et al. The Strengthening the Reporting of Observational Studies in Epidemiology（STROBE）statement：guidelines for reporting observational studies [J]. Lancet，2007，370（9596）：1453-1457.

（收稿日期：2019-09-02 本文編辑：顾家毓）

猜你喜欢

敏感性分析解读

城镇化下基本养老保险制度运行可持续性的敏感性分析

观察性研究的敏感性分析：“E-value”解读

猜你喜欢

杂志排行

中国医药导报的其它文章