APP下载

基于赢率分析临床复合终点的统计方法*

2019-09-17闫俊红杨紫荆侯雅文

中国卫生统计 2019年4期
关键词:白血病淋巴细胞急性

闫俊红 杨紫荆 侯雅文 陈 征∆

【提 要】 目的 当复合终点(事件)中组分结局事件的临床优先级问题存在时,传统基于风险比的方法常出现一定的估计误差。本文以急性淋巴细胞白血病患者预后研究为背景,讨论能解决该问题的统计方法。方法 介绍在组分事件之间的优先级非常重要时,一种新的指标赢率的概念和分析方法;随后将该方法应用于急性淋巴细胞白血病的预后研究,比较风险比和基于赢率的匹配、不匹配和加权赢率法的差异。结果 研究发现,赢率法显示GvHD预防是急性淋巴细胞白血病患者预后的危害因素,而风险比的结果与之相反,这是由于在含有多个优先级结局事件的研究中,风险比受第一结局事件的影响,结果往往存在一定的偏差,而赢率能更好的反映实际情况。结论 当组分事件之间的优先级很重要时,相对于风险比,赢率是一个更好的统计评价指标。

急性淋巴细胞白血病是一类造血干细胞恶性克隆性疾病,其主要表现为外周血中出现异常的白细胞,失去控制后在骨髓和其他造血组织中大量增殖,导致正常红细胞和血小板的生成减少。急性淋巴细胞白血病自然病程较短,若不治疗,一般多在6个月内死亡。但经过骨髓移植治疗后的患者,也会出现复发、发生不良事件、死亡等结局事件[1]。这种由多个结局事件组合而成的终点称为复合终点(composite endpoints),常被用作随机临床试验的主要终点,以提高试验的效率[2~3]。由于复合终点的事件发生率相对较高,较易发现组间差异,从而可以降低试验所需的样本量,减少研究时间和成本。另外,以复合终点作为主要终点,也可以避免多重性问题和竞争风险问题[4-5]。但传统复合终点的应用也存在一定的局限,它通常将所有结局事件视为同等重要,并且只考虑最先发生的结局事件,如在急性淋巴细胞白血病的临床研究中,复合终点定义为患者死亡和发生不良事件,若患者首先发生不良事件,之后更为重要的该患者是否死亡就被忽略了,也就是说,早期发生的非致命事件比后来发生的更严重的事件具有更高的优先级。因此,当各终点事件对患者的重要性不一致时,对结果的解释变得尤为困难[6-7]。

为了解决上述问题,Pocock等人[8]提出了“赢率”(win ratio)这一新指标或方法,它在传统复合终点的基础上将复合终点组成事件的临床优先级加以考虑,即根据研究目的及临床意义对组分结局事件的重要性进行排序,优先考虑重要性高的事件。本文将基于急性淋巴细胞白血病患者预后研究的实际数据,介绍赢率的定义、估计以及相应的统计推断方法,并将其与传统的风险比(hazard ratio,HR)进行比较。

资料与方法

1.研究对象

选用1985年至1998年在欧洲血液和骨髓移植学会(EBMT)注册的2279例急性淋巴细胞白血病患者数据,所有患者均在初次完全缓解时进行亲缘供者异基因骨髓移植术。随访期间记录的事件包括:发生不良事件、血小板恢复、复发和死亡。这里的不良事件定义为在移植后100天内出现2级及其以上的移植物抗宿主病。预后信息包括:供受者性别匹配、GvHD预防、移植年份和移植年龄。

2.调查内容

对GvHD预防的临床益处的进行评估,复合终点定义为患者死亡和发生不良事件,其中死亡具有较大的优先级,而其他状态作为右删失。

3.数据整理及分析

应用R 3.4.3进行数据整理、基线信息描述以及模型建立和估计。

4.研究方法

本研究运用3种赢率法来评估GvHD预防对急性淋巴细胞白血病治疗的临床益处。将进行GvHD预防的患者设为试验组,对照组由未进行GvHD预防的患者组成,根据患者的风险情况将两组患者进行两两配对,对于任一患者对(试验和对照组患者各一名),若试验组患者先发生终点事件,则该患者称为“失败者(loser)”,反之则这个试验组患者为“获胜者(winner)”。所有配对中获胜者总数与失败者总数之比即为赢率。若赢率等于1,则认为是平局,即两组疗效无差异;大于1时,认为试验组获胜,即试验组疗效更好,如赢率等于1.8,其含义是与对照组相比,试验组的获胜者多了80%。赢率包括未加权赢率(unweighted win ratio)和加权赢率(weighted win ratio),其中未加权赢率有两种计算方法,分别是匹配赢率法(matched win ratio)和不匹配赢率法(unmatched win ratio)。同时也应用传统HR的方法,与上述赢率的方法结果进行对比分析。

(1)匹配赢率

匹配赢率法考虑到患者个体风险,根据试验组和对照组患者的风险值进行匹配。这里风险值的计算基于Cox比例风险模型h(t|X)=h0(t)exp(β1X1+β2X2+…+βkXk),其中h(t|X)是具有协变量X的个体在t时刻的风险函数,t为生存时间,X=(X1,X2,…,Xk)′是可能影响生存时间的有关因素,也称协变量。h0(t)是基线风险函数,β=(β1,β2,…,βk)′为模型的回归系数。根据该模型,计算出每个患者的个体风险值(=β1X1+β2X2+…+βkXk)。若两组患者数量不等,则首先将样本量较大的组别的患者随机剔除,保证两组患者数相同。然后分别对试验组和对照组的患者进行风险值排序,两组中排序数相同的患者两两匹配。对每对患者首先研究优先重要事件(这里是患者死亡),主要观察谁最先发生该事件,若该结果无从得知,则观察谁先发生不良事件。图1说明了在每对患者中进行这种比较所涉及的步骤,可能有以下5种情况:

①试验组患者先死亡;

②对照组患者先死亡;

③试验组患者先发生不良事件;

④对照组患者先发生不良事件;

⑤以上情况均未出现。

图1 试验组和对照组患者的比较

上述5种情况的对子数分别定义为N1、N2、N3、N4和N5,则试验组的“获胜者”数量Nw为Nw=N2+N4,“失败者”的数量Nl为Nl=N1+N3。所以,赢率RW定义为

此时,试验组“获胜者”所占的比率PW为

该比率PW的95%可信区间是

所以赢率的95%可信区间是

两组比较时,对于原假设H0:RW=1(试验组与对照组不存在差异),检验统计量Z服从渐近正态分布。

(2)不匹配赢率

(3)加权赢率

设TH和TD是表示发生不良事件和死亡时间的两个随机变量,TC代表删失的时间。Y1=TH^TD^TC和Y2=TD^TC(^表示求最小值)。δ1和δ2分别为Y1和Y2的指示变量,如分别观察到不良事件或死亡,则对应δ1=1或δ2=1;否则,分别为δ1=0或δ2=0。观测数据(Y1i,Y2i,δ1i,δ2i,Mi),i=1,2…n,是(Y1,Y2,δ1,δ2,M)的独立同分布样本,其中M=1代表试验组,M=0代表对照组;y1,y2分别是该分布上Y1,Y2对应点的期望值。

对于某一患者对,假设患者j来自对照组,患者i来自试验组。定义W2ij=δ2jI(Y2i≥Y2j)以及W1ij=δ1jI(Y1i≥Y1j)分别表示患者i在死亡事件和发生不良事件上“获胜”,L2ij=δ2iI(Y2j≥Y2i)以及L1ij=δ1iI(Y1j≥Y1i)则为“失败”的情况,因此“平局”分别为Ω2ij=(1-W2ij)(1-L2ij)以及Ω1ij=(1-W1ij)(1-L1ij)。表1给出了该指标变量组合的9种情况。其中,情况W2ijW1ij、W2ijΩ1ij、W2ijL1ij以及Ω2ijW1ij属于“获胜”,Ω2ijΩ1ij属于平局,其余为“失败”。

表1 输赢指标变量图

设G2(·)和G1(·)分别是死亡与不良事件的加权函数,该加权函数可根据研究者的需要定义,通常取

则图1中①②③④的加权数分别为

所以,加权赢差(weightedwin difference)WD[12]为

WD(G1,G2)={W2(G2)+W1(G1)}-{L2(G2)+

然后,加权赢率为

假设(TH,TD)的联合分布是连续的,λDk(y2)=pr(TD=y2|TD≥y2,M=k)为第k组的TD的风险函数,λHk(y2|y2)=pr(TH=y1|TH≥y1,TD≥y2,M=k)为第k组TH的条件风险函数,λCk(y2)=pr(TC=y2|TC≥y2,M=k)为第k组TC的风险函数,其中k=0,1。定义λCT(y2)=λC0(y2)+λC1(y2)为删失的总风险函数。统计量WD(G1,G2)可用于检验原假设H0:WR(G1,G2)=1。这里原假设可分为两小部分H0=H01∩H02

H01:对于所有的y2,λD1(y2)=λD0(y2),

H02:对于所有的y1≤y2,λH1(y1|y2)=λH0(y1|y2)。

结 果

在纳入研究的2279例急性淋巴细胞白血病患者中,1496例患者在移植后发生复合终点事件,这其中有838例患者死亡。发生死亡事件的患者中位生存时间为3.64年,删失率约为63.2%;而发生复合终点事件的患者中位生存时间为0.14年,删失率约为34.4%。结合各变量的生存曲线图(图2)可发现,对于死亡事件(图2左侧),患者的累积生存率的下降相对较平缓;而对于复合终点事件(图2右侧),患者的累积生存率在随访开始阶段急剧下降,且最终都已小于50%。因为相较于死亡事件,患者不良事件的发生一般在随访前期。

对于GvHD预防变量进行log-rank检验,死亡事件(图2E)下显示未进行GvHD预防的患者生存率较高(χ2=11.8,P<0.001),而复合终点(图2F)给出相反的结论(χ2=4.6,P=0.03)。为探究该现象的原因,对GvHD预防进行临床益处的评估,见表2。对于匹配赢率法,在549对匹配患者对中,“获胜者”为未预防组的患者先死亡106对或者先发生不良事件100对,“失败者”则为预防组的患者先死亡211对或者先发生不良事件56对,共473对(86.16%)患者发生复合终点事件,这反映进行GvHD预防的患者可能有相对较差的预后。相应的赢率值为0.772(Z=2.829,P=0.002),这表示接受GvHD预防的患者的预后情况不如未接受GvHD预防的患者。不匹配赢率法比较每位接受GvHD预防与未接受GvHD预防的患者,所以共有1730×549 = 949770个患者对,其中825108对(86.87%)患者发生复合终点事件,复合终点的不匹配赢率为0.938(Z=0.994,P=0.320),虽小于1,但无统计学意义(Z=0.994,P=0.320),95%置信区间也包含1。加权赢率法通过对图1中①~④四种情况的患者数进行加权,所得数量均比未匹配赢率法大,其复合终点的赢率为0.792,有统计学意义(Z=3.390,P<0.001),且P值较前两种赢率更小,即更有把握认为GvHD预防是有害因素。对于风险比指标,当仅对死亡事件分析时,HR大于1(Z=11.710,P<0.001)表示GvHD预防是危险因素;而复合终点的HR小于1(Z=4.550,P=0.033),表明GvHD预防是保护因素。因不良事件往往先发生,所以GvHD预防对死亡率的影响会在复合终点的分析中部分丧失。

图2 各变量生存曲线图

匹配赢率不匹配赢率加权赢率HR†HR∗①预防组先死亡211317970416261.78/ /②未预防组先死亡106246454320357.62/ /③预防组先发生严重不良事件5610776236596.18//④未预防组先发生严重不良事件10015292238073.29//⑤以上均不是76124662///总对数549949770///点估计0.7720.9380.7921.3000.87895% CI(0.642,0.924)(0.827,1.064)(0.667,0.939)(1.118,1.51)(0.779,0.990)统计量Z2.8290.9943.390 11.7104.550P值0.0020.320<0.001<0.0010.033

†:死亡事件的风险比;*:复合事件的风险比。

讨 论

随机对照临床试验是目前测试治疗策略是否会改变特定结局事件的金标准。为了测试这一假设,研究人员需要建立一个详细的统计分析计划,以测定两种(或更多)治疗策略之间观察到的差异是否归因于偶然性[13]。当主要终点是死亡,而且问题的关注点在于干预是否改变了患者的生存时间时,传统的统计框架提供了一个较好的处理方式。但除非目标人群限于那些预后极差的患者,否则主要终点为死亡的试验很少进行。一个设计良好的临床试验前瞻性地将复合终点植入其主要分析计划中,以便观测到干预措施极小的影响。然而在随机试验中,复合终点的广泛使用引发了关于其适用性和结果解释的争议[14~16]。

本文共介绍了3种赢率法,当两组患者数量均衡时,匹配赢率法考虑患者自身的风险因素,能较好的估计干预因素对复合终点的作用,但是若两组患者的数量相差较大,会导致一大部分的患者被剔除,丧失生存信息,不匹配赢率法以及加权赢率法能弥补这一缺点。当样本量很大时,不匹配赢率法可信区间的估计较为费时,加权赢率法能较快的给出结果。

结合本文实例分析结果,复合终点的3种赢率均小于1,显示GvHD预防是危害因素(虽不匹配赢率法无统计学意义),这是因为GvHD预防通常是采用去除T细胞(TCD)的方法,该法虽可减轻GvHD,但却减弱了移植物的抗白血病作用,可增加感染和死亡率。当采用赢率法进行分析时,该法给予死亡事件更大的优先级,因此“GvHD预防增加死亡率”这一弊端被展现出来。而传统方法分析的HR将复合终点中的组分事件予以相同的重要性,但不良事件往往发生于死亡事件之前,因此死亡事件往往被忽略,这就导致复合终点的HR=0.878(Z=4.550,P=0.033),给出GvHD预防是保护因素的错误结论。因此,建议在非致命事件较常见的临床研究中,当组分事件之间的优先级很重要时,使用加权赢率法来进行分析,而不是采用风险比的方法。

猜你喜欢

白血病淋巴细胞急性
白血病“造访”,人体会有哪些信号?
遗传性T淋巴细胞免疫缺陷在百草枯所致肺纤维化中的作用
急性心包炎1例
甲状腺切除术后T淋巴细胞亚群的变化与术后感染的相关性
肝内T淋巴细胞单细胞图谱显示原发性硬化性胆管炎中肝脏幼稚样CD4+T淋巴细胞的扩增
ACS患者血清FSTL-1、外周血淋巴细胞中PPAR-γ、 MMP-9与冠状动脉狭窄程度的关系
中西医结合治疗HBV相关性慢加急性肝衰竭HBV DNA转阴率的Meta分析
走进儿童白血病的世界
阅读理解Ⅰ
白血病·患儿