临床研究中效应估计的统计分析与统计图表
2018-11-07谷鸿秋
谷鸿秋
在临床研究统计分析思路与统计图表系列的前两篇文章中[1,2],我们将临床研究的统计分析思路归纳为描述基线信息、估计效应大小及补充敏感性分析三部分,并对基线信息的统计分析与图表做了详细论述。基线信息是研究结果的重要部分,基线组间均衡性的比较是多因素校正的效应估计的基础,但临床研究的核心目的还需通过效应估计来实现。本文将结合研究实例阐述效应估计所涉及的统计方法和统计图表。
1 效应估计的概念与内容
临床研究的核心目的是回答某干预措施的效果如何,某暴露因素与结局的关联强度如何。估计某干预措施的效果,估算暴露因素与结局的关联强度,此即临床研究的效应估计。对随机对照临床试验,国际人用药品注册技术协调会(International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use,ICH)在其统计指导原则《ICH Harmonised Tripartite Guideline Statistical Principles Clinical Trails E9》的增补文件ICH E9(R1)中总结和强调了“估计目标(estimand)”的概念,从目标人群、目标变量、伴发事件、以及目标变量在目标人群层面的效应量四个方面对效应估计给出了更严格清晰的界定[3]。
依据结局变量的类型,临床研究中的效应估计可分为三大类:①连续性结局变量的均数差(MD);②分类结局变量的率差(RD)、危险度比(RR)以及优势比(OR);③生存结局数据的生存率和风险比(HR)。不同的效应指标,含义不同、适用的研究类型和数据类型也不同:如MD适用于有对照研究设计的连续性结局变量;RD适合前瞻性研究设计的二分类结局变量;OR最适合病例对照研究的二分类结局变量;RR和HR最适合随机对照研究和队列研究的二分类结局变量,具体见表1。其它效应指标如中位数、回归系数、相关系数以及RRR、APR、NNT等使用较少,不在本文讨论的范围之内。灵敏度、特异度、一致率、阴性预测值以及阳性预测值等属于诊断研究中专用的效应指标,也不纳入本文讨论的范畴。
此外,依据是否进行多因素模型的校正,效应估计分为粗略的效应估计和校正的效应估计。常用的多因素模型包括线性回归、Logistic回归以及Cox比例风险模型。不同的模型适用的结局变量类型不同,采用的效应指标也不同,具体见表2。
2 效应估计的展示形式与案例分析
效应估计结果的展示可借助统计图形或者统计表格。统计表格因其制作方便,且可提供精确数据,在学术期刊中使用更为普遍。统计图形因其形式丰富、色彩多样,更有“一图胜千言”的视觉优势,在学术壁报和幻灯中使用更为普遍。此外,也可将统计图表合为一体,充分利用二者的优势,如Meta分析中普遍使用的森林图即是此类。统计表格与统计图形各有优劣,如何选择效应估计的统计图表应结合项目数据的特点、目的以及具体的使用场景综合考量。
表1 临床研究常用效应指标的特征比较
表2 不同结局类型的效应估计指标与统计图形
图1 急性脑出血患者强化降压的ATACH-2研究的效应估计表格
图2 PLATO研究中替格瑞洛与氯毗格雷疗效与安全性的效应估计表格
效应估计统计表格的具体形式变化多样,但基本遵循一个通用的范式,具体形式可参考本系列首篇文章中的“表2”[1],典型案例见图1,急性脑出血患者强化降压的ATACH-2研究的效应估计表格[4]。随机对照临床试验由于组间均衡性可由随机分配机制保证,因此常不报告多因素校正的效应估计,如在急性冠状动脉综合征患者中比较替格瑞洛与氯毗格雷疗效与安全性的PLATO研究[5],见图2。效应估计表格中应针对每个结局的类别(连续变量、二分类变量、生存数据)分别做不同的统计描述和效应估计(表2)。结局为连续变量时,统计描述使用均数和标准差,效应估计采用多因素模型计算校正前后的MD及其95% CI和P值(如急性缺血性卒中患者强化降压的CATIS研究[6]);结局为二分类变量时,统计描述使用频数(百分比),效应估计中依据研究类型计算多因素模型校正前后的RD(如评估安定类药物是否增加老年痴呆患者死亡率研究[7])、OR(如急性缺血卒中患者动脉内治疗的随机对照MR CLEAN研究[8])或者RR(如比较卒中患者静脉t-PA溶栓后支架取栓与单纯静脉t-PA溶栓的SWIFT PRIME研究[9])及其95%CI和P值;生存数据,统计描述可直接使用事件数(百分比)(如比较氯毗格雷和阿司匹林治疗急性小卒中和短暂性脑缺血发作患者CHANCE研究[10]),为充分利用生存数据的特点,研究者常增加Kaplan-Meier估计的生存率(如PLATO研究[5],SAVOR研究[11]及SOCRATES[12]等研究),或者发病密度,即每人年的事件率(如2型糖尿病的强化降糖ACCORD研究[13,14]、伴心血管病高危因素的强化降压SPIRNT研究[15]),效应估计中计算多因素模型校正前后的HR值及95%CI和P值。
效应估计统计图形在本系列的首篇文章已有论述,具体参见表2的总结。典型案例如阿利吉伦与氨氯地平片降压试验中带误差限的条图[16],氯吡格雷高血小板反应性的急性冠脉综合征患者中,比较替格瑞洛和普拉格雷的血小板反应性研究的散点图与箱线图的组合图[17],阿利吉伦与氨氯地平片降压研究的条图[16],吸烟、戒烟对体重及肥胖的影响研究[18]和院外心脏骤停的发病及生存情况的时间变化趋势研究[19]中的带置信区间的点图,以及此前提及的CHANCE研究[10]的Kaplan-Meier生存曲线及ACCROD研究[13,14]的累积事件率曲线,见图3。
图3 临床研究常用效应估计统计图形实例
3 效应估计的统计方法与实现工具
临床研究常用的效应指标中,MD和RD的含义直观、易于理解和计算,而RR和OR的含义则需要借助列联表来说明。如下,假定由暴露和疾病两个属性定义的四种状态的人数分别为a,b,c,d。
RR表示暴露组与非暴露组疾病发病率之比,。OR最常见的含义是病例组的暴露比与非病例组的暴露比之比RR适合于前瞻性的研究设计,OR适合病例对照研究设计。当疾病的发生率很低时,RR≈OR,此时前瞻性的研究设计也可采用OR作为效应指标,如评价瑞舒伐他汀预防心脏外科围手术期并发症的随机对照临床试验中,效应指标即采用OR值[20]。HR则是暴露组与非暴露组在各时点的瞬时风险之比,其计算需要借助Cox比例风险模型。
校正的效应指标需要借助多因素回归模型估算。临床研究中常用的三种多因素回归模型为线性回归、Logistic回归以及Cox比例风险回归[21]。
线性回归适用于结局变量为连续变量的情形,模型通式如下:
其中x1,x2,…xm即为校正的协变量,b1,b2,…bm为m个自变量的回归系数。对于某一回归系数bk,其含义是控制了其它协变量(保持其它协变量不变的情况下),xk每增加一个单位所致的y的平均改变量。临床研究通常比较的是组间的效应差异,因此回归系数作为效应指标的可解释性要远低于校正的均数差,故研究者通常借助多因素线性回归计算组间校正的均数差,即LS-Means Differences。
Logistic回归模型适用于结局变量为二分类变量的情形。其模型通式如下:
②与①的区别仅在于等式左边的变换。由于分类反应变量的取值为离散的点,转而用出现某结局的概率P的logit变换即做为应变量,如此应变量的取值范围从单纯的几个点扩展到(-∞,+∞)。恰巧是流行病学研究中的比值(odds)的概念。当某影响因素xk取值1,0时(即有无此影响因素,或此影响因素增加一个单位),分别代入②式相减便可得回归系数,即,其中为流行病学研究中的比值比(OR)。当疾病发生率较低时,OR≈RR,而RR是流行病学研究里的危险度比。自变量xk每增加一个单位(如从0到1),则出现结局的危险是原来的ebk倍,如此,原本看似牵强的数学变换与有实际解释意义的流行病学关联指(OR和RR)就此巧妙地结合起来。不过需留意,Logistic回归直接得出的是校正的OR值,如需计算校正的RR,需采用相对危险度回归[22-24](Relative risk regression)或者基于Logistic、Log-Binomial、Poisson或者Cox回归改造而得[25,26]。
Cox比例风险回归模型适用于结局为时间-事件变量的情形,所谓比例风险是指要比较的组间出现某生存结局的风险比恒定,即不随时间而变化。Cox比例风险回归模型通常可写成如下通式:
其中h0(t)表示基础风险,即所有协变量为0时的风险,h(t)表示t时刻的风险。与logistic回归类似,当某影响因素xk取值1,0时,分别代入④式相减便可得回归系数而流行病学研究中的风险比HR,表示自变量xk每增加一个单位,出现结局的风险变为原来的ebk倍。由于Cox比例风险模型对基础风险h0(t)并无假定,限制条件少,使用广,因此在医学研究领域应用广泛。多因素Cox比例风险回归模型可直接获得校正的HR,但在应用时需留意时依协变量[27]及竞争风险[28]。
临床研究常用的效应指标及统计图形的SAS实现,具体见表3。SAS的绘图模块SAS/GRAPH在语法的一致性,编程的简便性上不如9.2版本推出的新绘图工具ODS Graphics,因此表3推荐ODS Graphics的SGPLOT过程。其它的绘图工具如R的ggplot2包[29],以及专门用于生存分析的survminer包[30]均可方便实现上述图形。
表3 临床研究常用效应估计及统计图形的SAS实现