APP下载

生存资料的成组序贯试验样本量估计及其PASS软件实现*

2015-03-09佳蒋志伟王陵李婵娟夏结来

中国卫生统计 2015年1期
关键词:成组样本量生存率

赵 佳蒋志伟王 陵李婵娟△夏结来△

生存资料的成组序贯试验样本量估计及其PASS软件实现*

赵 佳1,2蒋志伟1王 陵1李婵娟1△夏结来1△

以生存数据作为主要疗效终点的肿瘤等临床随访研究日益广泛,生存资料的临床试验也越来越多。与传统试验设计方法相比,成组序贯设计可以在试验进行过程中进行多次期中分析以提前得出结论结束试验,具有更强的灵活性。生存资料的成组序贯试验不仅可以节省时间和资源,加快有效药物的试验进程,还可以减少受试对象暴露于较差的治疗,更加符合伦理学要求,而如何进行成组序贯设计生存资料样本量估计是试验设计过程中需要解决的关键问题。

生存资料的成组序贯试验样本量估计方法有Reboussin[1]、Kim&Tsiatis[2]和Lakatos[3]等提出的方法以及模拟方法等。在PASS11.0软件中主要有Logrank Tests和Simulation模块。本文主要描述一般条件下适用于指数模型及比例风险模型的Reboussin方法和蒙特卡罗模拟方法以及相应的PASS软件实现。

方法与实例

1.公式计算法

生存分析关注的是事件数及事件发生所经历的时间。不同于计量资料和计数资料的样本量估计,生存资料样本量估计需分两步进行,首先估计事件数,然后通过事件数计算所需的样本量。

(1)估计事件数

对于生存资料,在不考虑序贯设计的情况下,Reboussin方法可以根据以下公式计算不同模型对应的固定事件数Ifixed。

公式中α为总I类错误,β为II类错误,Zα/2和Zβ分别为正态分布对应的临界值,HR为两组的风险比。

成组序贯设计需进行多次期中分析,需考虑α膨胀问题,事件数估计时若直接使用Ifixed无疑会增加I类错误。因此成组序贯设计合适的事件数大小Imax需要在原来Ifixed的基础上乘以相应的膨胀系数。膨胀系数与序贯检验的期中分析次数K、α和β以及选择的α消耗函数有关。如Pocock[4]和O′Brien-Flem ing[5]检验不同情形下对应的膨胀系数见表1,RP(K,α,β)表示固定K、α和β下Pocock法的膨胀系数,RB(K,α,β)表示固定K、α和β下O′Brien-Fleming法的膨胀系数。

表1 成组序贯设计Pocock和O′Brien-Flem ing法膨胀系数(双侧检验)[6]

(2)估计样本量

生存分析是根据事件数进行统计学检验的,但实际临床试验中,事件数往往要少于样本量即受试者例数,因为有受试者不会发生事件或有受试者删失等情况,所以生存分析最终样本量需要根据事件数和生存率指标来估算。

在已知事件数dk(即Imax)和两组生存率S1、S2以及两组等比例设置情况下,总样本量计算公式如下:

[实例1]某项成组序贯设计生存试验研究某新药对比标准治疗药物的疗效,根据以往资料生存时间服从指数分布,标准治疗的2年生存率为30%,预计新药治疗2年生存率可以增加20%,即达到50%,考虑检验水准α取0.05,检验效能取90%(1-β=0.9),进行4次期中分析,α消耗函数取O′Brien-Fleming法。样本量计算过程如下:

①计算两组风险比HR:

②计算固定事件数:

③选择O′Brien-Flem ing消耗函数,根据表1确定膨胀因子RB(K,α,β)=1.022,计算成组序贯设计对应的事件数:

④根据事件数和生存率计算总样本量:

即总共需要234例受试者进入试验研究,观察到140例死亡事件。分别在观察到35、70、105和140例死亡事件时进行相应的统计分析。

2.蒙特卡罗模拟法

用Reboussin方法直接计算样本量时必须指定试验组和对照组的生存率,并且要求两组样本量分配比例为1∶1。这些限制显然不能满足实际情况的需要,而应用蒙特卡罗模拟计算生存资料的成组序贯试验样本量或检验效能的方法能够满足很多灵活的设置,但是模拟方法的计算过程比较困难,需要借助计算机程序来完成。程序需要比较两组的生存曲线来决定成组序贯试验的样本量或检验效能。

除风险率h外,中位生存时间MST、生存率S(t)或死亡率M(t)三个参数也可用于生存分析的样本量估计,可以分别定义。当使用中位生存时间、生存率或死亡率时,可以将它们在模拟过程开始前转换为风险率。相应的转换公式分别如下:

①中位生存时间的风险转换:h=ln(2)/MST;

②生存率的风险转换:h=-ln(S(T0))/T0;

③死亡率的风险转换:h=-ln(1-M(T0))/T0。

上述转换公式中,T0为指定的时间点,S(T0)和M(T0)分别为给定时刻的生存率和死亡率。

生存分析样本量模拟计算是基于下列检验统计量[7-8]。

其中D为死亡时刻数,ti为第i个死亡时刻,W(ti)为加权函数[7],Yi1为在ti时刻对照组历险人数,Yi为在ti时刻两组历险总人数,di1为在ti时刻对照组发生的事件数,di为在ti时刻两组发生的总事件数。

进行生存试验样本量的模拟时,需要对α消耗函数类型、失访率、不依从率、入组时间和入组模式加以选择,指定蒙特卡罗模拟的迭代次数。模拟过程可以通过编写SAS宏程序,或借助PASS、EAST和nQuery等软件实现。

[实例2]某药物对比安慰剂治疗转移性结直肠癌的随机对照试验中,主要疗效评价指标选用肿瘤患者的总生存期,病例入组时间为12个月,随访时间为18个月,根据以往文献,研究者估计安慰剂组患者中位生存期为4.5个月,预期试验组患者中位生存期6个月,试验组与对照组样本量比例2∶1,考虑脱落率20%,总I类错误和检验效能分别取0.05和80%。拟采用O′Brien-Fleming设计的成组序贯设计,进行3次等日历时间间隔设计的期中分析,利用PASS11.0软件进行模拟计算样本量,其中表2第1列为PASS中所列相关选项,第2列为选项的具体说明,第3列是针对本实例数据的参数设置。

表2 PASS11.0关于实例2的参数设置及含义

PASS运行结果见表3。

表3 关于实例2的PASS运行结果

从表3中可以看出,总共需要样本量612例,其中试验组408例,对照组204例,在观察到91、288和442例事件数时,分别对试验进行期中分析,每次进行期中分析的累积检验效能分别为2.5%、44.7%和81.7%。

讨 论

样本量估计是临床试验设计阶段的重要环节,是不可忽略的重要问题。样本量估计正确与否直接关系到试验成败。对于计量资料、计数资料和生存资料,传统设计下的样本量估计文献较多,但很少有文献涉及生存资料的成组序贯试验的样本量估计,而随着成组序贯设计生存资料的日益广泛,其样本量估计问题不可避免。本文介绍了两种情况下的样本量估计,一种是Reboussin提出的方法,仅考虑两组生存率计算样本量。在具体实施过程中通过事先求出成组序贯设计事件数,再估计出样本量。本文列出了相关公式,读者可依据公式直接计算样本量,也可以采用PASS 11.0软件计算,结果一致。另一种是蒙特卡罗模拟的方法,此法较Reboussin方法灵活适用也更为复杂,样本量计算过程中不仅可以考虑风险率、中位生存时间、生存率或死亡率,还可以根据需要设定两组样本量分配比例、检验方法、删失情况和脱落情况、迭代次数等。样本量的模拟估计精度与模拟次数有关,要求的精度越高模拟计算越长。如果快速获得样本量估计,可以通过设置一组不同大小的样本量计算检验效能,经过尝试,找到所需的样本量。

成组序贯设计生存资料样本量估计的软件有很多,PASS11.0软件为模拟样本量估计提供了非常友好的界面,可以方便用户进行生存资料成组序贯样本大小的计算。除PASS外,gsDesign、EAST、nQuery和SAS等软件都可以用于生存资料成组序贯设计样本量的估计。其中,gsDesign是R软件包,适用于简单和复杂模型;EAST和gsDesign软件可使用Kim&Tsiatis方法实现生存资料成组序贯设计样本量估计。尽管多数软件可以实现模拟方法,但每种软件给定的条件及实现的方法有一定区别,需要进一步探讨。

1.Reboussin DM,DeMets DL,Kim KM,et al.Computations for group sequential boundaries using the Lan-DeMets spending function method. Control Clin Trials,2000,21(3):190-207.

2.Kim K,Tsiatis AA.Study duration for clinical trials with survival response and early stopping rule.Biometrics,1990,46(1):81-92.

3.Lakatos E.Sample sizes based on the log-rank statistic in complex clinical trials.Biometrics,1988,44(1):229-241.

4.Pocock SJ.Group Sequential Methods in the Design and Analysis of Clinical Trials.Biometrika,1977,64(2):191-199.

5.O′Brien PC,Fleming TR.A multiple testing procedure for clinical trials. Biometrics,1979,35(3):549-556.

6.Jennison C,Turnbull BW.Group Sequential Methods with Applications to Clinical Trials.New York:CHAPMAN&HALL/CRC,2000:39-55.

7.Klein JP,Moeschberger ML.Survival Analysis:Techniques for Censored and Truncated Data.Second Edition.New York:Springer,2003:201-238.

8.Andersen PK,Borgan O,Gill RD,et al.Statistical Models Based on Counting Processes.London:Spring-Verlag,1992:345-356.

(责任编辑:郭海强)

本研究获国家自然科学基金资助(81473069)

1.第四军医大学军事预防系卫生统计学教研室(710032)

2.辽宁中医药大学附属第二医院/辽宁省中医药研究院

△通信作者:李婵娟,E-mail:lichanjuan@fmmu.edu.cn;夏结来,E-mail:jielaixia@yahoo.com

猜你喜欢

成组样本量生存率
医学研究中样本量的选择
“五年生存率”不等于只能活五年
影响胃癌术后5 年生存率的因素分析
航天典型结构件成组加工工艺方法
基于FirmSys平台的核电厂成组控制研究及应用
人工智能助力卵巢癌生存率预测
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十)
日本首次公布本国居民癌症三年生存率
线性表成组链式存储结构研究