APP下载

平均累积函数在临床试验重发不良事件分析的应用及SAS实现

2019-11-12南方医科大学公共卫生学院生物统计学系510515

中国卫生统计 2019年5期
关键词:置信区间频数临床试验

南方医科大学公共卫生学院生物统计学系(510515)

唐欣然 黄耀华 曹颖姝 陈平雁△

【提 要】 目的 介绍平均累积函数(mean cumulative function,MCF)在临床试验重发不良事件分析中的应用,并提供分析所用SAS程序,通过实例阐述该方法与传统方法的不同之处,为重发不良事件数据处理和分析提供方便可靠的工具。方法 首先介绍MCF方法基本原理,展示MCF点估计值及其置信区间,以及两组间MCF逐点的差值及其置信区间的计算公式,并提供用于分析的SAS RELIABILITY过程步核心语句。最后通过一项降糖药物临床试验实例分析组间不良事件发生情况,对比传统方法和MCF方法在分析不良事件的区别。结果 SAS软件RELIABILITY过程步可实现MCF在重发不良事件分析中的应用。实例中,传统方法得到试验组和对照组低血糖事件发生率分别为11.6%和11.7%,组间差异无统计学意义(P=0.958)。采用MCF方法,提示在治疗40周内,试验组和对照组的每个受试者低血糖事件平均累积发生频数分别为0.11和0.19例次,组间MCF差值及95%CI为-0.08(-0.16,-0.01);但在治疗40周之后,试验组低血糖平均累积发生频率明显增加,组间MCF无显著性差异。MCF方法能通过图形直观地观察两组不良事件累积发生的变化情况。结论 对于临床试验重发不良事件的分析,MCF相比传统方法能提供更多信息,并且能将不良事件发生过程通过图形展示,让研究者更直观充分地了解整个试验阶段不良事件的发生情况。

临床试验中的不良事件分析主要基于个体和事件两个层面,前者多用发生率或风险比描述,用率或比的比较方法进行统计推断;后者分为单发事件和重发事件(recurrent events)两种情况,单发事件系指每个个体最多只发生一种或一次不良事件,重发事件系指每个个体可能发生两种及以上不良事件或同一不良事件发生两次及以上。对于单发事件,其分析方法与基于个体的方法无异;对于重发事件,则是临床试验中更为常见的现象,实践中多用平均发生人次描述,而缺乏更深入的推断分析。本研究将介绍在临床试验的重发不良事件分析中鲜有应用的平均累积函数(mean cumulative function,MCF)方法,并提供重发不良事件数据整理及分析所采用的SAS程序,通过实例阐述该方法与传统方法的不同之处,以期为重发不良事件的数据处理提供方便可靠的工具。

方法介绍

1.平均累积函数

临床试验中的不良事件多具有重发事件的特征,并且在一定暴露时间内可能由于失访或提前退出研究等原因发生事件删失,Nelson[1]提出用于纵向数据分析的非参数MCF方法可以估计研究人群中平均每个个体在一定时间内事件发生的累积频数。假设试验中共n例受试者,在试验期间可能在t1,t2,t3,…,tN时间点发生事件或删失,那么到时间点tj,平均每个受试者不良事件发生的累积频数可表达为[2]:

其中,ek是到时间tk累积发生的事件个数,nk-1是时间tk-1之后处于风险的人数,即可能发生事件或删失的人数。在时间点tk-1处于风险的人数等于受试者总人数减去在时间tk-1之前删失人数。对于单发不良事件,MCF就等同于发生该不良事件的受试者比例。

2.单组MCF置信区间

采用Nelson提出的MCF方差估计方法[1],平均累积函数MCF在t时间的双侧C%置信区间的估计表示为:

M(t)±KC{v[M(t)]}1/2

其中,M(t)是平均累积函数在t时间的点估计值,KC是标准正态分布(100+C)/2的百分位数,v[M(t)]是M(t)的方差估计,Nelson的文章介绍中展示了MCF方差估计的表达式。

3.MCF组间比较

两组MCF的差值及其置信区间采用Doganaksoy和Nelson[3]提出的方法进行估计。两组间MCF差值逐点的置信区间计算公式为:

[M1(t)-M2(t)]±KC{v[M1(t)]+v[M2(t)]}1/2

如果以上两组MCF在时间t的置信区间不包含0,则提示两组某事件到时间t的累积发生频数差异有统计学意义。

4.MCF应用于临床试验不良事件分析

平均累积函数用于描述一定时间内平均每个个体发生不良事件的累积频数,可反映不良事件的发生强度。MCF应用于临床试验不良事件分析的四大特点是:(1)能估计重发不良事件的累积发生频数;(2)可考虑因失访等原因导致的删失数据和不同长度的随访时间;(3)可计算MCF逐点的置信区间,并用图形直观地展示;(4)可进行组间MCF的比较,计算组间MCF逐点的差值及置信区间,从而评价组间差异是否有统计学意义[4]。

此外M(t)点估计及其置信区间与t的关系图可为研究者提供一些关键信息,包括至时间t平均每个受试者发生不良事件的累积频数、不良事件的发生频数是增加、减少还是不变,以及组间不良事件的平均累积频数差异是否有统计学意义。通过个体和平均水平的MCF图可以对数据中的任何异常情况获得更多的了解。研究者可以使用SAS软件的RELIABILITY过程步计算和绘制各组逐个时间点的M(t)及其置信区间,并进行组间MCF的比较[5-6]。

平均累积函数应用的SAS实现

以下程序(1)应用DATA步实现将符合CDISC标准的ADAE(不良事件分析数据)和ADSL(受试者水平分析数据)转化为用于MCF分析的数据;程序(2)采用RELIABILITY过程步计算和绘制各组逐点的M(t)及其置信区间,若将分组变量改为受试者编号变量(SUBJID),则可绘制每个受试者逐点的累积发生频数图;程序(3)采用RELIABILITY过程步的MCFDIFF选项计算并绘制组间逐点的MCF差值及其置信区间。

(1)/*将符合CDISC标准的ADAE和ADSL转化成MCF分析数据*/

proc sort data=adae; by subjid; run; /*将ADAE和ADSL用SUBJID排序*/

proc sort data=adsl; by subjid; run;

data adae1; /*合并ADAE和ADSL,保留AE关键变量,识别有AE和未发生AE的受试者*/

merge adae(keep=SUBJID SAFFL AESEQ AETERM AEDECOD AEBODSYS ASTDT ASTDY AENDT AENDY where=(SAFFL=′Y′)in=ae)adsl(keep=SUBJID TRT01P TRT01PN SAFFL TRTSDT TRTEDT EOSDT EOSDY where=(SAFFL=′Y′));

by SUBJID;

if ae then withae=1;/*withae=1代表发生AE,=0代表未发生AE*/

else withae=0;

run;

/*变量解释:SUBJID=受试者唯一识别码、SAFFL=安全性分析集识别码、AESEQ=AE序列码、AETERM=AE名称、AEDECOD=AE首选术语、AEBODSYS=AE系统器官分类、ASTDT=AE开始日期、ASTDY=AE开始日期距随机天数、AENDT=AE结束日期、AENDY=AE结束日期距随机天数;TRT01P=治疗组别、TRTSDT=治疗开始日期、TRTEDT=治疗结束日期、EOSDT=试验结束日期、EOSDY=试验结束日期距随机天数*/

data adae2; /*产生MCF分析数据集,value=1代表发生AE,value=-1代表完成试验或删失,days/weeks代表发生AE或完成试验或删失的时间*/

set adae1;

by SUBJID aeseq;

if withae=0 then do;

days=eosdy; value=-1; output;

end;

if withae=1 then do;

if last.SUBJID=1 then do;

days=astdy; value=1; output;

days=eosdy; value=-1; output;

end;

else if last.SUBJID=0 then do;

days=astdy; value=1; output;

end;

end;

weeks=days/7;

run;

(2)/*计算各组各时点MCF及其置信区间,并绘制MCF-时间曲线*/

proc reliability data=adae2;

unitid subjid;

mcfplot weeks*value(-1)=trt01p / overlay font=arial haxis=0 to 52 by 16 vaxis=0 to 1.5 by 0.25

i=step ;

run;

(3)/*计算两组MCF差值及其置信区间,并绘制组间MCF差值-时间曲线*/

proc reliability data=adae2;

unitid SUBJID;

mcfplot weeks*value(-1)=trt01p / mcfdiff font=Arial haxis=0 to 52 by 16 vaxis=0 to 0.5 by 0.1

i=step ;

run;

实例分析

一项多中心、随机、双盲、阳性药物平行对照的Ⅲ期临床试验,评价某新型降血糖药物治疗对二甲双胍单药治疗效果不佳的2型糖尿病患者的有效性和安全性,其中低血糖事件是特别关注的不良事件。研究将应用传统不良事件的分析方法对治疗期间发生的不良事件以及特别关注的低血糖事件发生率进行分析,并采用MCF方法与其比较。

通过传统的不良事件发生率和例次的分析结果见表1。基于安全性分析集,在52周的治疗期间,试验组380例受试者中,共有148例(38.9%)发生316例次不良事件,其中44例(11.6%)发生68例次低血糖事件;对照组376例受试者中,共有144例(38.3%)发生284例次不良事件,其中44例(11.7%)发生76例次低血糖事件。对于总不良事件发生率和低血糖事件发生率,组间差异均无统计学意义。两组间总不良事件和低血糖事件发生例次差异亦无明显差异。

表1 不良事件发生情况(安全性分析集)

通过MCF方法,采用程序(2)绘制两组总体不良事件逐点的MCF,见图1。治疗48周时两组不良事件平均累积发生频数均为0.75,图中阴影边界代表M(t)置信区间界限,两组置信区间基本重叠,提示不良事件M(t)组间差异无统计学意义。

对于特别关注的低血糖事件,采用程序(2)绘制两组低血糖事件的M(t),见图2。两组M(t)置信区间重叠较少,尤其是治疗初期,对照组低血糖事件发生频率明显高于试验组。

图1 试验组和对照组总体不良事件逐点MCF及置信区间

图2 试验组和对照组低血糖事件逐点MCF及置信区间

对于特别关注的低血糖事件,进一步采用程序(3)绘制低血糖事件逐点的组间MCF差值(试验组MCF-对照组MCF)及其置信区间,见图3。治疗40周内,试验组和对照组受试者低血糖平均累积发生频数分别为0.11和0.19例次,组间MCF差值点估计及其95%CI为-0.08(-0.16,-0.01),置信区间上限小于0,提示试验组低血糖事件发生频率低于对照组;而治疗40周之后,试验组低血糖平均累积发生频数明显增加,此后两组MCF差异无统计学意义。

图3 组间低血糖事件MCF差值及置信区间

讨 论

本文实例展示了传统方法和MCF方法分析不良事件的区别,传统方法的结果仅分析了发生不良事件的例数、例次和发生比例的相关信息,得到两组之间差异无统计学意义的结论(11.6%VS 11.7%),对于不良事件在整个观察时间段发生情况如何变化,是否会因为观测时间段不同而呈现不一样的规律不得而知。MCF方法却能在这些方面发挥其优势,进行组间MCF的比较,计算不同时间点下组间MCF逐点的差值及置信区间,从而更加全面评价组间差异是否有统计学意义。在随机对照临床试验的重发不良事件分析中,MCF方法可以结合纵向数据的特征,考虑删失数据,基于不依赖数据分布特征的非参数方法,估计个体在一定时间内不良事件的平均累积发生频数,通过图形直观地观察不良事件累积发生的变化情况。基于SOC/PT或受试者水平的平均累积发生频率描述,可以用于不良事件的探索性分析,也可用在临床试验进行过程中的数据监管,来发现异常数据和情况。MCF还可以通过统计推断估计置信区间,对组间不良事件发生强度进行比较,对试验不同阶段的不良事件发生情况做更深层的分析和解读。另外,本文展示了MCF分析不良事件的SAS程序,程序所使用的是临床试验常用的数据集和相关变量,研究者只要基于符合CDISC标准的ADSL和ADAE数据集,便可直接套用此段程序,避免了繁杂的编程过程,大大提高了效率。

除了MCF方法,Poisson回归和生存分析等方法也可用于重发事件的推断分析[7-8],实例中作者通过

Gamma-Poisson回归得到组间(试验组vs.对照组)低血糖事件发生率的率比(RR,ratio rate)和95%CI为0.91(0.55,1.50),P值为0.710;通过生存分析独立增量模型得到组间低血糖事件发生风险比(HR,hazard ratio)和95%CI为0.83(0.59,1.15),P值为0.437。以上两种方法只能评估整个试验阶段重发不良事件的平均发生强度,而无法实现各时间点事件发生强度的组间比较。几种常用方法和MCF在随机对照试验中的重发事件分析的应用和更深入的比较将在后续研究中报道。

猜你喜欢

置信区间频数临床试验
定数截尾场合三参数pareto分布参数的最优置信区间
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
抗疫中第一个获批临床试验的中药——说说化湿败毒方
列车定位中置信区间的确定方法
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
频数和频率
盗汗病治疗药物性味归经频数分析
肿瘤治疗药物Tosedostat的Ⅱ期临床试验结束