APP下载

零膨胀联合脆弱模型在含终点事件的临床复发数据中的应用*

2018-11-05罗天娥于智凯

中国卫生统计 2018年5期
关键词:参数估计个体肺癌

郭 强 罗天娥△ 于智凯 段 燕

【提 要】 目的 探讨零膨胀联合脆弱模型在含终点事件的临床复发数据中的应用。方法 收集肺癌患者术后随访资料,构建零膨胀联合脆弱模型,采用高斯求积法进行参数估计,并与联合脆弱模型进行比较。结果 零膨胀联合脆弱模型既考虑了复发事件与终点事件间的关联,又对那些未发生复发事件的“结构零”个体建立logistic模型,提高了数据拟合效果,结果解释合理,软件实现便捷。结论 零膨胀联合脆弱模型适合分析临床研究中含终点事件的零膨胀复发事件数据。

在医学随访研究中常遇到复发事件数据(recurrent event data),如心脏病的反复发作、肿瘤复发等。脆弱模型(frailty model)考虑了复发事件的非独立性和异质性问题,广泛应用于复发事件数据的分析[1-3]。而对含有终点事件的临床复发事件数据而言,考虑终点事件与复发事件的依赖性,一般可用联合脆弱模型(joint frailty model)进行分析[4]。然而,在一些情况下,会遇到过多个体未发生复发事件(简称零事件)。这些零事件中一部分可能是“结构零”,即患者对复发事件有“不敏感”的倾向,随访中患者不经历复发事件;另一部分零事件是随机零事件,即由于复发事件发生前的各种情况导致的删失,如死亡事件的发生。当“结构零”事件过多时,数据往往有“零膨胀”的特征[5]。这种情况下若仍用联合脆弱模型分析,可能会因为未考虑过多的“结构零”事件而导致参数估计结果产生偏倚。本文拟对收集的肺癌患者术后资料构建零膨胀联合脆弱模型,参数估计采用SAS 9.4软件的NLMIXED过程实现。

原理与方法

1.复发事件的零膨胀脆弱模型

脆弱模型是通过引入一个随机效应项vi来拟合复发事件数据的一类模型,是Cox比例风险模型的扩展[3]。模型结构如下:

λ(t|νi)=λ0(t)exp(βTΖi+νi)

(1)

模型中β为回归系数,νi是第i个研究对象的共享脆弱因子。

当有过多研究对象未发生复发事件时,这些数据往往有“零膨胀”数据的特征。这些研究对象为“不敏感”事件,但会发生终点事件。假设A=1表示“不敏感”,而A=2表示其他情况(如对复发事件敏感或未治愈)。Rondeau等提出了治愈脆弱模型(cure frailty model),用于分析“结构零”过多的临床复发数据[6]。该模型第一部分是logistic模型,用以刻画患者对复发事件“不敏感”的概率,即pi=P(Ai=1):

logit(pi)=αTΖi

(2)

模型第二部分是脆弱模型,用于拟合未治愈或敏感者的复发风险,模型结构为:

λ(t|νi,Ai=2)=λ0(t)exp(βTΖi+νi)

(3)

2.联合模型

对于肺癌术后患者,目前基本无治愈可能。也就是说,当终点事件是死亡时,“治愈”事件是不可能发生的。因此,模型中删除Ai=2的条件限制,患者死亡风险可写作:

h(t|νi)=h0(t)exp(ηTΖi+γνi)

(4)

参数γ表示复发事件与终点事件(死亡)之间有关联。

将方程(2)~(4)联立,就构建了零膨胀联合脆弱模型[7]。假定Xi为随访时间,Xi=min(Ci,Di),Ci为删失时间,Di为终点事件时间。风险指示函数Δi=I(Di≤Ci)。Οi≡{Tij,j=1,2,…,ni,Xi,Δi,Ζi}表示所观测的数据,则所观测到的数据Οi的条件似然函数为:

(5)

(6)

3.参数估计

(7)

最后,对似然函数(7)进行最大化求得参数估计结果。

实例分析

欲研究影响肺癌患者术后复发及死亡的相关影响因素,收集某三甲医院123例肺癌患者术后随访资料。随访起始时间为患者在2010年1月1日以后因肺癌首次手术的时间,终止时间为2016年6月1日;记录每位患者的年龄、性别、肿瘤的相关指标以及患者结局指标(复发或死亡),并记录患者的手术日期。数据见表1,变量赋值见表2。

表1 肺癌术后患者的部分数据

表2 肺癌患者数据变量赋值表

*P10为H-score的第10百分位数

1.肺癌患者术后临床复发事件数据分析

123例肺癌患者中有57例未复发且仍存活,占总例数的46.3%,表明数据可能有“零膨胀”的特征;65例术后肿瘤复发(占52.8%);51例死亡(占41.5%)。

该数据为含终点事件的复发数据,建模时不仅要考虑复发事件的特征,还应考虑复发事件与终点事件间的相关性。另外,由于该数据中有46.3%的个体没有复发事件的发生,表现出“零膨胀”的特征。而联合脆弱模型未考虑数据的该特征,若采用该模型进行分析,可能会得出有偏的估计值。因此,本文拟构建零膨胀联合脆弱模型,并与联合脆弱模型的分析结果进行比较。构建零膨胀联合脆弱模型如下:

(8)

模型中Ζi=(sex,age,blfx,fhcd,lcfq,lbzy,smoker,Hscore),νi为脆弱项(服从E(ν)=0,Var(ν)=θ的Gaussian分布),α、β、γ、η为待估参数,pi为患者i不复发的概率。若数据不存在“零膨胀”情况,则删去公式(8)中的logistic模型,此时模型退化为联合脆弱模型。

2.肺癌患者术后资料的零膨胀联合脆弱模型分析

相关数据采用SAS 9.4软件分析,用NLMIXED过程实现参数估计。分别构建考虑“零膨胀”的联合脆弱模型与不考虑“零膨胀”的联合脆弱模型,并对结果进行比较。参数估计结果见表3。

模型拟合结果显示,未考虑“零膨胀”的联合脆弱模型参数估计绝对值和标准误均低于考虑“零膨胀”联合脆弱模型的估计结果;且脆弱方差θ的估计值也低于考虑“零膨胀”的联合脆弱模型。说明未考虑复发事件“零膨胀”的特点,可能会导致模型参数估计出现偏差。考虑“零膨胀”的联合脆弱模型与未考虑“零膨胀”的相比,-2LL分别为1079.9和1106.5。根据AIC和BIC越小模型拟合越好的原则,该资料构建零膨胀联合脆弱模型较为合适。

因此,该资料选择构建零膨胀联合脆弱模型。分析结果显示,对复发事件“不敏感”的患者,其肿瘤病理分型为腺癌的患者对复发事件“不敏感”的可能是鳞癌患者的0.74(RR=exp(-0.3)),肿瘤分化程度为III的患者对复发事件“不敏感”的可能是分化程度为II的患者的0.55(RR=exp(-0.6)),有淋巴转移的患者对复发事件“不敏感”的可能是无淋巴转移者的0.82(RR=exp(-0.2)),吸烟患者对复发事件“不敏感”的可能是不吸烟者的0.90(RR=exp(-0.1)),H-score高于P10的患者对复发事件“不敏感”的可能是H-score低于P10患者的0.61(RR=exp(-0.5))。

肺癌患者术后复发相关因素分析,H-score高于P10的患者术后复发的可能是H-score低于P10者的1.73(RR=exp(0.55))倍;患者的肿瘤临床分期每增加一个等级,术后复发的可能是原来的2.39(RR=exp(0.87))倍。

表3 不同联合脆弱模型估计结果

讨 论

复发事件数据是临床随访研究中较为常见的一类数据,具有非独立性和异质性。含终点事件的复发数据,不但有复发事件数据的特点,而且终点事件与复发事件间非独立。因此不能将终点事件看做复发事件的独立删失而建立简单脆弱模型,而应采用考虑复发事件与终点事件间关联的联合脆弱模型[4]。

本文的肺癌患者术后随访资料,既是含终点事件的复发数据,又有“零膨胀”的特征(46.3%的个体未出现复发),这些个体表现为对复发事件“不敏感”的倾向。若用联合脆弱模型分析,会忽略这部分“不敏感”个体对结果的影响,导致待估参数的方差增大,估计精度降低;而本文采用的零膨胀联合脆弱模型,考虑了复发事件“零膨胀”的特点,显示模型拟合效果较好,结果解释合理。

高斯求积法估计该模型的参数比较简单,且SAS软件实现便捷。用该方法进行参数估计时,无需假设特定基线(累积)风险函数的先验分布,而是用分段常数基线(累积)风险函数来代替,从而简化似然函数计算过程。EM算法和PPL方法需要采用重抽样方法(如bootstrap法)才能获得参数标准误的估计值,而高斯求积法可直接得到[10-11]。

本文只分析了一种复发事件,还可探索研究个体同时发生多种复发事件与一个终点事件(死亡)的情况,如局部复发、远处转移或扩散、死亡等。也可考虑复发事件或终点事件的影响因素中是否有时依协变量效应存在。

猜你喜欢

参数估计个体肺癌
对比增强磁敏感加权成像对肺癌脑转移瘤检出的研究
基于新型DFrFT的LFM信号参数估计算法
氩氦刀冷冻治疗肺癌80例的临床观察
误差分布未知下时空模型的自适应非参数估计
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
关注个体防护装备
明确“因材施教” 促进个体发展
浅谈死亡力函数的非参数估计方法
浅谈死亡力函数的非参数估计方法
microRNA-205在人非小细胞肺癌中的表达及临床意义