含截尾数据的时间相依的ROC曲线分析*
2014-03-10上海交通大学医学院生物统计学教研室200025张莉娜
上海交通大学医学院生物统计学教研室(200025) 张莉娜
含截尾数据的时间相依的ROC曲线分析*
上海交通大学医学院生物统计学教研室(200025) 张莉娜
目的将时间相依的ROC曲线应用到临床试验的分析中。方法采用多中心、随机、双盲双模拟、阳性药物平行对照的治疗成人慢性乙型肝炎的Ⅱ期临床试验,通过三个模型,用时间相依的ROC分析方法考察两个次要疗效指标HBVDNA、ALT对疗效判定的诊断能力、两者的综合诊断能力以及各指标诊断能力的组间比较。结果对乙型肝炎疗效的诊断方面,HBVDNA比ALT诊断能力更强,HBVDNA和ALT两个指标的综合诊断能力最强,但与HBVDNA单指标诊断能力差别无统计学意义。HBVDNA、ALT以及两者对疗效的综合诊断能力上,试验组都要略高于对照组,且组间差别有统计学意义(P<0.05)。结论对于一个历时较长的临床试验来说,由于病例依从性的问题会存在一定的脱落,疗效的判定存在截尾数据,并且也是时间相依的,此时对各诊断指标诊断能力的考察就应该用时间相依的ROC曲线分析更符合实际。
截尾数据 时间相依 一致性概率 ROC曲线
含截尾数据的时间相依的ROC曲线分析是把生存分析和ROC曲线分析相结合起来分析的一种统计分析方法,其目的是为了分析某诊断指标的诊断能力,但同时也考虑到了数据存在截尾以及疗效的获得是时间相依等因素。在新药临床试验中,对药物疗效的判断往往不止一个疗效指标,可能有一个主要疗效指标和多个次要疗效指标,这时可以用主要疗效指标作为“金标准”来考察各个次要疗效指标对疗效的诊断能力。而对于一个历时较长的临床试验来说,由于病例依从性的问题会存在一定的脱落,疗效的判定存在截尾数据,并且也是时间相依的,此时对各诊断指标诊断能力的考察就应该用时间相依的ROC曲线分析。
另外,对同一种疾病用药疗效的诊断,往往有各种不同的诊断方法或手段,涉及的诊断指标是非常多的。不同的指标对疾病各方面敏感性是不一样的,因此在对用药疗效做出诊断时如何充分利用这些指标的诊断信息,就显得非常重要。
目前国内医学统计方面对此方法应用甚少涉及,未见较为全面阐述,故本文以一个药物临床试验为例,以Cox比例风险模型为基础,通过三个模型分别给出了单指标和多指标线性组合的时间相依的ROC分析方法。本文意在对读者展示该类含截尾数据的临床实验数据结构特点,统计方法原理与介绍,以及结果的解读,以期为临床实验工作者实际应用提供一个参考。
资 料
某新药是近年新合成的核苷类似物,具有抗逆转录病毒、嗜肝病毒和疱疹病毒的广谱抗病毒作用。国外临床试验研究表明,该新药对于乙型肝炎病毒具有显著的抑制作用。为了评价该新药治疗成人慢性乙型肝炎的有效性,采用多中心、随机、双盲双模拟、阳性药物平行对照的Ⅱ期临床试验,疗程为一年,主要依据HBVDNA定量和HBeAg阴转率、肝功能ALT的复常率来判断临床疗效。
(1)HBeAg阳性患者疗效评价标准:
完全反应:HBeAg、HBVDNA均阴转,ALT复常。
部分反应:HBeAg、HBVDNA一项阴转,ALT复常。
无反应:未达到上述指标者。
(2)HBeAg阴性患者疗效评价标准:
完全反应:HBVDNA均阴转,ALT复常。
部分反应:HBVDNA定量下降2个log以上,但未阴转,ALT复常。
无反应:未达到上述指标者。
完全反应或部分反应评价为有效,无反应评价为无效。
共228例受试者,其中试验组112例,对照组116例。原始资料名为yigan,数据结构见表1。
表1 两组慢性乙型肝炎患者基线及治疗后疗效、LOGHBVDNA和ALT情况
在这个临床试验中,临床疗效是主要指标,HB-VDNA和ALT是次要指标。在比较试验组和对照组疗效后,同时还想评价HBVDNA、ALT对疗效判定的诊断能力以及其疗效的诊断能力在两组中是否有差别。由于这是一个长达一年的临床试验,由于依从性的问题,对疗效的判定存在一定的截尾数据,疗效的判定是时间相依的。
原理和方法
1.时间相依的ROC曲线
(1)完全数据的ROC曲线
其中W为测量指标,c为阈值,D为二分类的结果变量,Se为灵敏度,Sp为特异度。根据不同的阈值计算灵敏度和特异度从而做出ROC曲线。
(2)时间相依的ROC曲线
在生存模型中,结果变量是时间相依的,所以灵敏度和特异度可看作是时间的函数。由条件概率和贝叶斯理论,有
其中s(t)=P(T>t)。在不同时间点,根据不同的阈值计算灵敏度和特异度从而做出时间相依的ROC曲线。
(3)软件实现:以上述资料为例,对于每一个固定时间点T0和阈值C0,计算S(T0|W<C0),P(W<C0)和S(T0),这些都可以用SAS9.1来实现具体计算。SAS程序如下:
2.时间相依的ROC曲线下面积
(1)完全数据的ROC曲线下面积(非参数法):
不失一般性,假定测量值较大为异常,ROC曲线下面积是阳性组测量值大于阴性组测量值的概率,即一致性概率。设Wi表示阳性组中第i个检测结果,Wj表示阴性组中第j个检测结果,阳性例数用n表示,阴性例数用m表示。则ROC曲线下面积A的估计值可以用下式计算:
(2)时间相依的ROC曲线下面积:
ROC曲线下面积可以由一致性概率来估计。Gönen和Heller已经证实,一致性概率的估计CPE(concordance probability estimate)可以由Cox比例风险模型获得。
AUCn标准误的估计建立在平滑或数值微分的基础上。
(3)软件实现:以上述资料为例,用SAS9.1宏程序得以实现。在宏程序中,DSN表示所分析的数据集名称,COVARIATES表示Cox模型中的协变量,SURV表示结果变量的诊断时间,CENS表示诊断结果:1表示有效,0表示无效(截尾)。
结 果
表2 各模型下两组ROC曲线下面积估计及比较
三个模型试验组的ROC曲线下面积估计值都要略高于对照组,即HBVDNA、ALT以及两者对疗效的综合诊断能力上,试验组都要略高于对照组,且组间差别有统计学意义(P<0.05)。
三个模型ROC曲线下面积的两两比较,模型I和模型II、模型III和模型II的ROC曲线下面积差别有统计学意义,模型I和模型III的ROC曲线下面积差别无统计学意义。此结果说明在对乙型肝炎疗效的诊断方面,HBVDNA比ALT诊断能力更强,HBVDNA和ALT两个指标的综合诊断能力最强,但与HBVDNA单指标诊断能力差别无统计学意义。
表3 三个模型ROC曲线下面积的比较
图1~3分别是试验组、对照组及所有病例在用药一年后各模型下的ROC曲线,从图中可直观的看出模型I(LOGHBV)和模型III(LOGHBV+ALT)的ROC曲线面积非常接近,即两者的诊断能力接近,而模型II(ALT)的ROC曲线面积相对最小,即诊断能力最差。
图4~6反映了试验组、对照组及所有病例在各个时间点的ROC曲线下面积估计,从图中可看出无论哪个模型在各时间点的AUC波动都很小,一年后曲线略有上升。这一结果也说明HBVDNA、ALT这两个指标对于疗效的诊断能力是相对比较稳定的。
图1 试验组用药1年后各模型下的ROC曲线
图2 对照组用药1年后各模型下的ROC曲线
图3 所有病例用药1年后各模型下的ROC曲线
图4 试验组各时间点的AUC估计
图5 对照组各时间点的AUC估计
图6 所有病例各时间点的AUC估计
讨 论
ROC曲线分析被认为是一种诊断试验评价中的理想和经典的方法。但在医学研究中,很多时候“金标准”并非能马上获得,是和时间存在依存关系的。并且在很多临床研究中,由于受试者的依从性常常会有截尾数据,此时对各指标诊断能力的评价就不能用传统的ROC曲线分析,而应该选用时间相依的ROC曲线分析更接近实际。
1.Cai Z,Sun Y.Local linear estimation for time-dependent coefficient in Cox’s regression model.Scandinavian Journal of Statistics,2003,30:93-111.
2.Heagerty PJ,Lum ley T,Pepe MS.Time-dependent ROC curves for censored survival data and a diagnostic marker.Biometrics,2000,56:337-344.
3.Heagerty PJ,Zheng Y.Survival model predictive accuracy and ROC curves.Biometrics,2005,61:92-105.
4.Gönen M.Analyzing Receiver Operating Characteristic Curves with SAS.Cary,NC:SAS Institute Inc,2007.
5.Gönen M,Heller G.Concordance probability and discriminatory power in proportional hazards regression.Biometrika,2005,92:965-970.
6.QihuaW,Lili Y,Peng L.Estimation of the area under ROC curve with censored data.Journal of Statistical Planning and Inference,2009,139:1033-1044.
7.Hung H,Chiang CT.Nonparametricmethodology for the time-dependent partial area under the ROC curve.Journal of Statistical Planning and Inference,141:3829-3838.
8.Petra W,Georg S,Kurt U.The use of ROC for defining the validity of the prognostic index in censored data.Statistics and Probability Letters,2011,81:783-791.
(责任编辑:郭海强)
*:上海交通大学医学院“085”工程研究生课程模块化功能群建设计划及“985”工程三期研究生课程体系建设项目“研究生核心课程群建设(生物医学统计高级教程)”。