APP下载

含截尾数据的时间相依的ROC曲线分析*

2014-03-10上海交通大学医学院生物统计学教研室200025张莉娜

中国卫生统计 2014年5期
关键词:相依临床试验面积

上海交通大学医学院生物统计学教研室(200025) 张莉娜

含截尾数据的时间相依的ROC曲线分析*

上海交通大学医学院生物统计学教研室(200025) 张莉娜

目的将时间相依的ROC曲线应用到临床试验的分析中。方法采用多中心、随机、双盲双模拟、阳性药物平行对照的治疗成人慢性乙型肝炎的Ⅱ期临床试验,通过三个模型,用时间相依的ROC分析方法考察两个次要疗效指标HBVDNA、ALT对疗效判定的诊断能力、两者的综合诊断能力以及各指标诊断能力的组间比较。结果对乙型肝炎疗效的诊断方面,HBVDNA比ALT诊断能力更强,HBVDNA和ALT两个指标的综合诊断能力最强,但与HBVDNA单指标诊断能力差别无统计学意义。HBVDNA、ALT以及两者对疗效的综合诊断能力上,试验组都要略高于对照组,且组间差别有统计学意义(P<0.05)。结论对于一个历时较长的临床试验来说,由于病例依从性的问题会存在一定的脱落,疗效的判定存在截尾数据,并且也是时间相依的,此时对各诊断指标诊断能力的考察就应该用时间相依的ROC曲线分析更符合实际。

截尾数据 时间相依 一致性概率 ROC曲线

含截尾数据的时间相依的ROC曲线分析是把生存分析和ROC曲线分析相结合起来分析的一种统计分析方法,其目的是为了分析某诊断指标的诊断能力,但同时也考虑到了数据存在截尾以及疗效的获得是时间相依等因素。在新药临床试验中,对药物疗效的判断往往不止一个疗效指标,可能有一个主要疗效指标和多个次要疗效指标,这时可以用主要疗效指标作为“金标准”来考察各个次要疗效指标对疗效的诊断能力。而对于一个历时较长的临床试验来说,由于病例依从性的问题会存在一定的脱落,疗效的判定存在截尾数据,并且也是时间相依的,此时对各诊断指标诊断能力的考察就应该用时间相依的ROC曲线分析。

另外,对同一种疾病用药疗效的诊断,往往有各种不同的诊断方法或手段,涉及的诊断指标是非常多的。不同的指标对疾病各方面敏感性是不一样的,因此在对用药疗效做出诊断时如何充分利用这些指标的诊断信息,就显得非常重要。

目前国内医学统计方面对此方法应用甚少涉及,未见较为全面阐述,故本文以一个药物临床试验为例,以Cox比例风险模型为基础,通过三个模型分别给出了单指标和多指标线性组合的时间相依的ROC分析方法。本文意在对读者展示该类含截尾数据的临床实验数据结构特点,统计方法原理与介绍,以及结果的解读,以期为临床实验工作者实际应用提供一个参考。

资 料

某新药是近年新合成的核苷类似物,具有抗逆转录病毒、嗜肝病毒和疱疹病毒的广谱抗病毒作用。国外临床试验研究表明,该新药对于乙型肝炎病毒具有显著的抑制作用。为了评价该新药治疗成人慢性乙型肝炎的有效性,采用多中心、随机、双盲双模拟、阳性药物平行对照的Ⅱ期临床试验,疗程为一年,主要依据HBVDNA定量和HBeAg阴转率、肝功能ALT的复常率来判断临床疗效。

(1)HBeAg阳性患者疗效评价标准:

完全反应:HBeAg、HBVDNA均阴转,ALT复常。

部分反应:HBeAg、HBVDNA一项阴转,ALT复常。

无反应:未达到上述指标者。

(2)HBeAg阴性患者疗效评价标准:

完全反应:HBVDNA均阴转,ALT复常。

部分反应:HBVDNA定量下降2个log以上,但未阴转,ALT复常。

无反应:未达到上述指标者。

完全反应或部分反应评价为有效,无反应评价为无效。

共228例受试者,其中试验组112例,对照组116例。原始资料名为yigan,数据结构见表1。

表1 两组慢性乙型肝炎患者基线及治疗后疗效、LOGHBVDNA和ALT情况

在这个临床试验中,临床疗效是主要指标,HB-VDNA和ALT是次要指标。在比较试验组和对照组疗效后,同时还想评价HBVDNA、ALT对疗效判定的诊断能力以及其疗效的诊断能力在两组中是否有差别。由于这是一个长达一年的临床试验,由于依从性的问题,对疗效的判定存在一定的截尾数据,疗效的判定是时间相依的。

原理和方法

1.时间相依的ROC曲线

(1)完全数据的ROC曲线

其中W为测量指标,c为阈值,D为二分类的结果变量,Se为灵敏度,Sp为特异度。根据不同的阈值计算灵敏度和特异度从而做出ROC曲线。

(2)时间相依的ROC曲线

在生存模型中,结果变量是时间相依的,所以灵敏度和特异度可看作是时间的函数。由条件概率和贝叶斯理论,有

其中s(t)=P(T>t)。在不同时间点,根据不同的阈值计算灵敏度和特异度从而做出时间相依的ROC曲线。

(3)软件实现:以上述资料为例,对于每一个固定时间点T0和阈值C0,计算S(T0|W<C0),P(W<C0)和S(T0),这些都可以用SAS9.1来实现具体计算。SAS程序如下:

2.时间相依的ROC曲线下面积

(1)完全数据的ROC曲线下面积(非参数法):

不失一般性,假定测量值较大为异常,ROC曲线下面积是阳性组测量值大于阴性组测量值的概率,即一致性概率。设Wi表示阳性组中第i个检测结果,Wj表示阴性组中第j个检测结果,阳性例数用n表示,阴性例数用m表示。则ROC曲线下面积A的估计值可以用下式计算:

(2)时间相依的ROC曲线下面积:

ROC曲线下面积可以由一致性概率来估计。Gönen和Heller已经证实,一致性概率的估计CPE(concordance probability estimate)可以由Cox比例风险模型获得。

AUCn标准误的估计建立在平滑或数值微分的基础上。

(3)软件实现:以上述资料为例,用SAS9.1宏程序得以实现。在宏程序中,DSN表示所分析的数据集名称,COVARIATES表示Cox模型中的协变量,SURV表示结果变量的诊断时间,CENS表示诊断结果:1表示有效,0表示无效(截尾)。

结 果

表2 各模型下两组ROC曲线下面积估计及比较

三个模型试验组的ROC曲线下面积估计值都要略高于对照组,即HBVDNA、ALT以及两者对疗效的综合诊断能力上,试验组都要略高于对照组,且组间差别有统计学意义(P<0.05)。

三个模型ROC曲线下面积的两两比较,模型I和模型II、模型III和模型II的ROC曲线下面积差别有统计学意义,模型I和模型III的ROC曲线下面积差别无统计学意义。此结果说明在对乙型肝炎疗效的诊断方面,HBVDNA比ALT诊断能力更强,HBVDNA和ALT两个指标的综合诊断能力最强,但与HBVDNA单指标诊断能力差别无统计学意义。

表3 三个模型ROC曲线下面积的比较

图1~3分别是试验组、对照组及所有病例在用药一年后各模型下的ROC曲线,从图中可直观的看出模型I(LOGHBV)和模型III(LOGHBV+ALT)的ROC曲线面积非常接近,即两者的诊断能力接近,而模型II(ALT)的ROC曲线面积相对最小,即诊断能力最差。

图4~6反映了试验组、对照组及所有病例在各个时间点的ROC曲线下面积估计,从图中可看出无论哪个模型在各时间点的AUC波动都很小,一年后曲线略有上升。这一结果也说明HBVDNA、ALT这两个指标对于疗效的诊断能力是相对比较稳定的。

图1 试验组用药1年后各模型下的ROC曲线

图2 对照组用药1年后各模型下的ROC曲线

图3 所有病例用药1年后各模型下的ROC曲线

图4 试验组各时间点的AUC估计

图5 对照组各时间点的AUC估计

图6 所有病例各时间点的AUC估计

讨 论

ROC曲线分析被认为是一种诊断试验评价中的理想和经典的方法。但在医学研究中,很多时候“金标准”并非能马上获得,是和时间存在依存关系的。并且在很多临床研究中,由于受试者的依从性常常会有截尾数据,此时对各指标诊断能力的评价就不能用传统的ROC曲线分析,而应该选用时间相依的ROC曲线分析更接近实际。

1.Cai Z,Sun Y.Local linear estimation for time-dependent coefficient in Cox’s regression model.Scandinavian Journal of Statistics,2003,30:93-111.

2.Heagerty PJ,Lum ley T,Pepe MS.Time-dependent ROC curves for censored survival data and a diagnostic marker.Biometrics,2000,56:337-344.

3.Heagerty PJ,Zheng Y.Survival model predictive accuracy and ROC curves.Biometrics,2005,61:92-105.

4.Gönen M.Analyzing Receiver Operating Characteristic Curves with SAS.Cary,NC:SAS Institute Inc,2007.

5.Gönen M,Heller G.Concordance probability and discriminatory power in proportional hazards regression.Biometrika,2005,92:965-970.

6.QihuaW,Lili Y,Peng L.Estimation of the area under ROC curve with censored data.Journal of Statistical Planning and Inference,2009,139:1033-1044.

7.Hung H,Chiang CT.Nonparametricmethodology for the time-dependent partial area under the ROC curve.Journal of Statistical Planning and Inference,141:3829-3838.

8.Petra W,Georg S,Kurt U.The use of ROC for defining the validity of the prognostic index in censored data.Statistics and Probability Letters,2011,81:783-791.

(责任编辑:郭海强)

*:上海交通大学医学院“085”工程研究生课程模块化功能群建设计划及“985”工程三期研究生课程体系建设项目“研究生核心课程群建设(生物医学统计高级教程)”。

猜你喜欢

相依临床试验面积
怎样围面积最大
最大的面积
巧用面积法解几何题
抗疫中第一个获批临床试验的中药——说说化湿败毒方
家国两相依
相守相依
巧用面积求坐标
相依相随
相依相伴
肿瘤治疗药物Tosedostat的Ⅱ期临床试验结束