APP下载

IPCW法在肿瘤新药研发中的应用探讨*

2013-12-04李玉森夏结来蒋志伟王永吉

中国卫生统计 2013年1期
关键词:生存期交叉受试者

李玉森 夏结来△ 王 陵△ 陈 东 蒋志伟 王永吉

在抗肿瘤新药临床试验中,近期疗效评价标准〔1〕(依据WHO颁布的实体瘤近期疗效评价标准)即药物治疗后瘤体的变化,主要由四个指标表示:PR-肿瘤部分消失,CR-肿瘤完全消失,SD-肿瘤稳定或NC-肿瘤无变化(SD和NC算为同一指标),PD-肿瘤进展。主要的远期疗效评价标准〔2〕(根据美国FDA《关于批准抗肿瘤化学药和生物制剂临床试验终点指标的产业指南》),主要有六个指标:ORR(overall response rate有效率)、临床获益率、OS(overall survival生存时间)、PFS(progress free survival无进展生存期)、TTP(time to progression进展时间)、CR等指标。OS指标容易观察且不存在观察偏倚,并且可以直接评估临床获益,被认为是金标准终点指标。抗肿瘤药物的评价方法主要是生存分析,即通过比较受试者的生存时间、生存率、无进展生存期等判断药物是否有效。

在抗肿瘤新药的临床试验中,受试者在试验开始时被随机分为试验组和对照组。当试验进行若干周期后,经疗效评价发现试验药物有效,若对照组受试者要求接受新药治疗,依伦理学要求该受试者应转到试验组继续治疗;或者试验组的受试者认为此种治疗方法缺乏疗效,提出退出试验或转到其他方法治疗。对这些转换组别的受试者,其生存时间由单一的对照组变为对照组和其他治疗的混合,试验设计时的随机化就被破坏了。在这种情况下,传统的分析方法进行OS的计算会产生偏移。

方法的提出

对于临床试验中存在转换组别的受试者,即选择性交叉的受试者,传统的处理方法有四种:(1)不对交叉的受试者的数据做任何的适应性调整,直接进行意向性分析。(2)把交叉的受试者的数据看作缺失值处理。(3)把交叉的受试者的数据作为删失值处理。(4)进行Cox回归时,把是否交叉治疗当作一个随时间变化的变量来处理。但是,使用传统的处理方法解决问题时,会出现以下问题:当采用意向性方法分析时,统计分析结果会低估试验药的疗效。而把交叉患者的数据当作删失值处理或把删失时间放入Cox模型来估计药物效果时,若交叉的受试者与未交叉的受试者死亡率不同,则会出现偏倚,结果会夸大试验药的疗效。国外学者Robins与Rotnitzky在1994年针对单向交叉数据提出的一种处理方法,即逆概率删失加权方法〔3〕(inverse probability of censoring weighted method),简称 IPCW 法。英国的 NICE(national institute for health and clinical excellence)机构认为IPCW法是矫正单向交叉导致的偏倚的有效统计方法〔4〕,近年来被广泛用于新药临床试验的数据处理。

方法概述

在抗肿瘤药物随机对照临床试验中,ICPW法的应用主要是在出现受试者删失或单向交叉时,调整受治疗或暴露因素影响的、随时间变化的混杂因素所造成的偏倚。

该方法的主要原理是通过加权,建立一个假设未出现单向交叉的虚拟数据集,然后对该数据集进行统计分析。具体来说,如果一个对照组的受试者转到试验组,IPCW方法指定一个大于1的权重,对该受试者的前几个访视日期加权,作为该受试者的总生存时间(OS),代替该受试者转组后的生存时间,重新建立一个相当于未出现过转组的虚拟数据集。对虚拟数据集进行Cox回归分析,通过比较OS来评价试验药与安慰剂或对照药的疗效差异。

应用步骤

IPCW法的流程图如图1(假定访视三周期后出现转组):

1.建立面板数据集

根据访视和治疗情况,把每个受试者从随机化开始到出现终止性事件(删失、死亡或者转组)的整个研究时间划分为几个周期。在每个周期,计算可以标识终止性事件的指示性变量(如实验室指标、转移灶的出现、不良事件的发生、疾病进展的日期等)的值及从随机化开始到该周期的时间(一般以周数计),同基线资料合并,建立面板数据集。

2.计算每个周期的权重

IPCW法第二步是权重的计算。每周期权重的计算需要两个模型,计算时以是否转换组别为因变量,以基线数据和转组指示变量为自变量,拟合logistic回归模型,算得权重。第一个模型是把基线特征作为自变量纳入,以是否出现终止性事件(删失、死亡或者转组)为因变量,拟合logistic回归可得转组受试者理论上未出现终止性事件的概率P1。第二个模型中,以基线特征和标识转组的指示性变量为自变量同时纳入模型,以是否终止性事件(删失、死亡或者转组)为因变量,进行logistic回归,求得理论上未出现终止性事件的概率P2。从随机化开始到该周期结束,由第一个模型得到的概率P1(若在第一周期后则为累积概率)作为分子,由第二个模型得到的概率P2(若在第一周期后则为累积概率)作为分母,两个累积概率的比值即为该周期的权重。

图1 IPCW法应用流程图

受试者i在周期j的权重SW(j)i,其计算公式为〔6〕:

公式(1)中,C(k)i表示在周期k末期是否存在单向交叉或删失的函数,1表示存在单向交叉或删失,0表示不存在单向交叉或删失。

X(0)i:表示受试者的基线数据。

Y(k)i:表示在周期k开始前,随时间变化的变量的数据。

P[C(k)i=0|C(k -1)i=0,X(0)i]:表示在已知基线特征X(0)i数据的条件下,k周期前未单向交叉的受试者,在周期k末期可能不会出现单向交叉的概率。

P[C(k)i=0|C(k - 1)i=0,X(0)i,Y(k)i]:表示在已知基线特征X(0)i数据及受试者转组的指示变量Y(k)i数据的条件下,在k周期前未出现单向交叉的受试者在周期k末期可能不会出现交叉的概率。

3.进行Cox回归

在受试者单向交叉的时间点,根据步骤2算出的权重对原始数据进行加权。对于随机化分到试验组的受试者,权重定为1,即疗效评价指标总生存期不变;对于对照组转到试验组的受试者,在转组后生存时间的权重定为0,根据步骤2中所算得的权重,对该受试者的前几个访视周期进行加权,加权后的时间作为该受试者的总生存期;对照组中未转组受试者的总生存期不变。对加权后的数据进行Cox回归,因变量为受试者的总生存期,自变量为分组变量,基线数据特征,及转组指示变量(如ECOG评分),可算得风险比HR。

4.估计HR的置信区间

通过Cox回归算得HR,从而比较总生存时间的差异时,未调整HR的95%的置信区间由于权重的引入会有偏倚,所以通要过Bootstrap法估计HR的95%的置信区间。

数据模拟

本次研究采用Monte Carlo模拟产生试验组与对照组的数据,比较三种方法(IPCW法、ITT法、把转组的受试者数据作为删失数据处理(censored)方法)之间的检验效能与假阳性率差异。

1.三种方法的检验效能比较

模拟假定试验组中位生存期为400天,对照组中位生存期为360天,分别模拟产生指数分布的两组生总生存期(OS)数据;模拟产生正态分布的协变量年龄的数据,模拟产生Bernoulli分布的协变量性别的数据;模拟产生正态分布的转组指示变量ECOG评分的基线数据,分别模拟产生第一二周期试验组和对照组ECOG评分的增长量,第一二周期ECOG评分即为基线值加上各周期的增长量。该评分随着试验进行而增加,当在第二周期末该评分大于或等于4时,对照组受试者转到试验组。设定样本量从100增加到600,每一个设定的样本量模拟1000次。比较三种方法的检验效能,模拟结果见图2。

图2 三种方法检验效能比较

由图2可知,当模拟假设试验组的OS大于对照组,样本量从100增加到600时,三种方法的检验效能随样本量的增加而增大。censored法的检验效能最优,其次是IPCW法,ITT法检验效能最低。censored法检验效能虽然较好,但应用该方法分析时会高估试验药的疗效,因此不适合处理出现转组的生存分析数据。

2.三种方法的假阳性率比较

模拟假定试验组和对照组中位生存期都为400天,即假设试验组与对照组OS没有差异,其他变量模拟同检验效能模拟实验。设定样本量从100增加到600,每一个设定的样本量模拟1000次。模拟比较三种方法的假阳性率。模拟结果见图3。

图3 三种方法假阳性率的比较

由图3可知,当模拟假设试验组和对照组的OS相等,样本量从100增加到600时,ITT法和IPCW 法的假阳性率在0.05左右,而censored法的假阳性率在样本量为100时假阳性率大于0.05,并随样本量的增加而增加。出现这种情况是因为censored法会高估试验药的疗效,当模拟假设试验组和对照组中位生存期相等时,censored法处理时把转组受试者转组后的生存时间当作删失数据,使得试验药的OS高于对照药,样本量较大的情况下,即使试验药和对照药没有差异,也会得出试验药有效的错误结论。

3.模拟结论与讨论

模拟试验表明,当试验组与对照组OS有差异时,IPCW法检验效能优于传统分析方法ITT法。censored法虽然检验效能较高,但该方法会高估试验药的疗效,与新药临床试验倾向使用保守统计方法的传统做法相悖,且当两组OS相同时其假阳性率较高,因此不适合转组数据的分析。综上,IPCW法相较于ITT法阳性率控制良好且有较高的检验效能,是一种分析转组数据的较好的统计方法。

本次模拟研究的局限在于模拟时仅仅考虑了两个协变量(性别和年龄),作为转组指示变量ECOG评分设置较为简单,且对受试者转组前的方式周期仅仅划分为两个周期。探索增加协变量、增加访视周期、改变转组指示变量及转组条件对IPCW法检验效能的影响,将会是下一步研究的重点。

IPCW法应用实例

以1998年至2009年国际乳腺癌研究组织(BIG)进行的一项比较试验药来曲唑与对照药它莫西芬临床试验为例〔5〕,阐述IPCW法的应用。

受Novartis公司委托,国际乳腺癌组织进行了一项以评价新药来曲唑疗效为目的的临床试验。整个试验为随机双盲平行对照设计,在2003年完成入组,其中对照组它莫西芬组病例2459例,试验组来曲唑组2463例,试验共入组4922例。数据管理与统计分析委托美国国立癌症研究中心(NCI)进行。

2005年对受试者的数据进行统计分析,评价指标为无病生存期(DFS),统计结果表明:来曲唑与它莫西芬的比较中,HR=0.81(95%CI=0.70 ~0.93)),即来曲唑的疗效优于它莫西芬。根据伦理学原则,若患者要求,则可以由它莫西芬组转到来曲唑组。该评价结束后,对照组有25%的受试者选择转到试验组,随访继续。试验设计由随机对照临床试验变为观察性研究,并随访至2009年。

统计分析采用3种方法,主要分析指标为OS(O-verall Survival总生存期)。

1.应用ITT分析,按试验设计时的分组进行分析,比较来曲唑组与它莫西芬组的OS的差异,分析结果显示,HR=0.87,差异没有统计学意义(P>0.05);

2.把转组的受试者数据作为删失数据处理,分析结果表明,来曲唑与它莫西芬相比,HR=0.81,经检验差异有统计学意义(P<0.05);

3.逆概率删失加权方法(IPCW),数据处理时,纳入所有影响转组和试验结果的因素:基线数据(包括受试者年龄、病灶状态和肿瘤分级)、随时间变化的变量(即转组指示变量:体质状况评分)、标识是否出现终止性事件的二分类变量。通过拟合logistic回归模型,算得权重,以此权重给原数据中OS加权。对加权后的数据进行统计分析,比较试验组与对照组OS的差异;经分析,来曲唑与它莫西芬相比,HR=0.83,经统计学检验差异有统计学意义(P<0.05)。具体结果见表1、图 4。

由表1和图4可知,在2005年对受试者数据进行第一次统计分析,分析结果表明来曲唑的疗效优于它莫西芬,对照组(它莫西芬组)有25%的受试者出现了转组,因此最终进行ITT分析时,对照组中转组的受试者的生存时间包括接受来曲唑治疗的生存时间和转组后接受它莫西芬治疗的生存时间,分析时低估了试验药的疗效,以致两个药的差异结果没有统计学差异。而把转组的受试者数据当作删失数据处理时,对照组25%转组的受试者的数据作为删失数据,高估了试验药的疗效。应用逆概率删失加权法分析时,把转组受试者的数据剔除,对于与对照组转组的受试者相似者加权,建立一个相当于未出现转组的“虚拟数据集”,对该虚拟数据集进行统计分析,分析结果更为准确。

表1 三种方法分别对OS的分析结果

图4 三种方法分别对OS的分析结果

讨论与结论

在抗肿瘤药物的临床试验中,由于试验条件限制,同时要考虑到受试者受益的原则,理论上的最优设计通常无法在现实中实现。因此,数据收集与分析时,往往要损失部分信息〔4〕。如本文例子中所提,若肿瘤临床试验出现转组时,则试验设计时的随机化被破坏,传统分析方法分析会出现偏倚:如果按ITT原则分析时,因为试验药优于对照药才产生转组,对照组中发生转组的受试者的生存时间,是转组前在对照组观察时间与转组后在试验组的观察时间之和,因此统计分析会低估试验药的疗效;如果把发生转组的受试者的数据当作删失数据处理时,则会损失许多有用信息,同时对照组受试者在转组后实际生存时间大于试验开始到出现转组的时间点,会高估试验药的疗效。

针对上述情况提出和应用的一些新的统计方法如IPCW法、RPSFT法等,对转组的受试者的观察数据挖掘使用,信息利用更加充分,分析结果更为准确。本文所介绍的IPCW法,其实质是对转组受试者生存时间的填补,并且对于缺失数据的要求由MCAR(完全随机缺失)放松为SMAR〔7〕(连续性随机缺失)。该方法利用了转组受试者的数据资料,减少了信息的损失,同时考虑到了试验药和对照药的疗效差异,通过对原始数据的加权,衍生了新的相当于未转组的虚拟数据集,通过对虚拟数据集的统计分析来评价试验药与对照药的疗效差异,与传统的方法按ITT原则分析和把转组的受试者当作删失相比,更加客观。

IPCW法的应用也有一些局限:一是该方法要求试验设计是随机对照实验,并且与计算每个周期的权重有关的变量都已被准确计量〔8〕,否则权重计算错误,结果会出现偏倚。二是要求交叉判定必须准确,本方法的应用前提就是对受试者出现交叉或脱落做出准确判定。只有判定准确,应用才会有意义,评价判定准确与否的方法采用敏感性分析。

总之,IPCW法在临床试验数据分析中的应用会更加广泛,但是在应用时一定要注意它的适用条件。

1.陈智伟,廖美琳.RECIST标准在肿瘤治疗疗效评价中的应用.中国肿瘤,2004,13(10):616-618.

2.唐健元,马莉,张磊.欧美肿瘤药物评价策略简介及思考.中华肿瘤杂志,2008,30(10):798-800.

3.Hubbard AE,Vanderlaan MJ.Nonparametric Survival Estimation when Death is Reported with Delay.Lifetime Data Analysis,2000,6:237-250.

4.Finkelstein DM,Schoenfeld DA.Correcting for Discretionary Treatment Crossover in an Analysis of Survival in the Breast International Group BIG 1-98 Trial by Using the Inverse Probability of Censoring Weighted Method Satoshi Hattori.Mai Kato,2011:1093-1095.

5.Adjusting for Selective Crossover in Analyses of Letrozole Versus Tamoxifen in the BIG 1-98.Trial.http://www.ibcsg.org/Sitecollection Documents/Presentations/1-98_SABCS_2009_FINAL_SLIDES.pdf.

6.Pazopanib(Votrient(r))for the first-line treatment of patients with advanced renal cell carcinoma(RCC)ADDENDUM to GSKS SUBMISSION TO NICE 20 JULY 2010.http://www.nice.org.uk/nicemedia/live/12032/52299/52299.pdf.

7.Satoshi Hattori,Mai Kato.Approximate subject-deletion influence diagnostics for Inverse Probability of Censoring Weighted(IPCW)method,2009,79:1833-1838.

8.Karnon J,Kaura S.Updated Survival Based Analysis Using Inverse Probability of Censoring Weighted Analysis(IPCW)to Estimate the Cost-Effectiveness of Letrozole and Anastrozole,Versus Tamoxifen as Adjuvant Therapy in Postmenopausal Women with Early Breast Cancer.ASCO2010.http://www.asco.org/ascov2/Meetings/Abstracts?&vmview=abst_detail_view&confID=74&abstractID=52339.

9.Michael Branson,John Whitehead.Estimating a treatment effect in survival studies in which patients switch treatment.Statistics in Medicine,2002,21:2449-2463.

10.Honore BS.Khan J,Powell L.Handling drop-out in longitudinal studies.Stat.Med,2004,23:1455-1494.

11.孙振球,徐勇勇.医学统计学.第2版.北京:人民卫生出版社,2006,364-376.

猜你喜欢

生存期交叉受试者
派姆单抗作为二线可有效治疗晚期肝癌
涉及人的生物医学研究应遵循的伦理原则
涉及人的生物医学研究应遵循的伦理原则
菌类蔬菜交叉种植一地双收
涉及人的生物医学研究应遵循的伦理原则
“六法”巧解分式方程
涉及人的生物医学研究应遵循的伦理原则
感染性心内膜炎手术治疗的疗效观察
连数
连一连