基于倾向性评分简单加权估计的慢性乙型肝炎抗病毒治疗的成本‑效果分析
2022-02-22陈舸杨朔周峰李丽霞周舒冬贾卫东郜艳晖3
陈舸,杨朔,周峰,李丽霞,周舒冬,贾卫东,郜艳晖3,
(1.广东药科大学公共卫生学院,广东 广州 510310;2.广州市第八人民医院信息科,广东 广州 510080;3.暨南大学基础医学与公共卫生学院,广东 广州 510270)
药物经济学研究中常用成本‑效果分析(cost‑effectiveness analysis,CEA)来评价不同药物治疗效果的优劣[1],对临床用药和药品政策的制定都能起到参考作用。通常采用随机对照临床试验、前瞻性队列研究、回顾性队列研究以及二次文献研究进行分析。《中国药物经济学评价指南》指出,回顾性队列研究的有关数据大多可以从现有的数据库获得、研究成本较低,且研究时间较短。因此,回顾性队列研究是缺乏前瞻性研究时的最佳选择[1]。然而,回顾性队列研究中由于患者的非随机选择导致的组别间疾病特征和治疗方案的差异,以及医疗费用数据的删失等问题给成本‑效果分析带来困难。
观察性研究中,费用数据由于患者出现删失,通常是不完整的。Lin等[2]指出,由于生存数据的费用不是非信息删失(non‑informatively cencored),即删失成本与潜在未删失成本之间不相互独立,传统处理删失生存数据的方法不再有效地用于分析删失成本数据。此外,由于出现删失,除非有更多的假设,否则无法估计整个健康史的成本和生存分布。因此,通常需要设置有限的时间范围,例如L年。Bang和Tsiatis[3]提供了生存数据成本估计的方法,即简单加权法。简单加权的方法是使用未删失的观测数据的费用信息,通过计算该时期无删失的逆概率权重,对每个具有完整数据的观测进行加权,从而对时间范围内的平均生存费用进行估计。另外,为了控制组间存在的混杂,可以采用倾向评分(propensity score,PS)的方法。该方法由Rosenbaum和Rubin[4]首先提出的。基于倾向评分,可以通过匹配、分层、加权和回归等方式对混杂因素调整。其中,逆概率加权(inverse probability of treatment weighting,ⅠPTW)[5]已成为首选方法。该方法利用倾向得分这个权重构造一个虚拟样本,使各处理组间基线协变量分布均衡,从而不同组间的结果能够进行比较。目前国内采用观察性数据进行成本‑效果分析的研究仍较少,希望通过本文的研究能对今后该方法在国内的应用提供参考。
1 原理与方法
1.1 倾向性评分简单加权法
假定一多组独立有删失生存数据,L为估计成本的时间范围,Yi(u)为到u时期的累计成本,Yi为在时间范围L内累计总成本。Ci为删失时间,设研究有i个观测对象,令ti为每个观测对象的生存时间,其中变量t受时间范围L限制。其中L可以根据需要进行设定,例如我们想要了解观测寿命年的成本。基于上述的设定,可以得到以下的参数:
Ti=min(ti,Ci)为观测在时间范围内的随访时间,且Ti=min(Ti,L);
δi=I(ti≤Ci)表示出现结局的指示变量,当δi=1时表示第i个观测的结局可以被观测;
Yi=Yi(ti)为δi=1的所有观测的总费用;
Zi=0,1,2,…,K表示有K个组别,Xi为协变量向量。
令K(u)=Pr(C≥u)表示观测在u时刻无删失的概率,其中K(u)可以从参数模型或非参数模型来估计得到。这里使用Kaplan‑Meier估计来估计K(u)。
令pik为第i观测成为k组的概率,pik=P(Zi=k|Xi),即为倾向性评分值。本文采用logistic回归模型估计倾向性评分,进一步计算ⅠPTW权重。ⅠPTW权重可分为非稳定权重和稳定权重。非稳定权重定义为稳定权重定义为,本文采用稳定权重进行加权。其中pt为K组别占总样本的比例。由此可得到平均费用:
在时间范围L内的平均生存时间可以通过生存函数曲线下面积来计算。为S(u)=Pr(T≥u)的估计值。然而,这个方法需要非信息性删失,并且不对混杂因素进行调整。Willan和Briggs[6]建议使用估计费用的加权方法来替代生存曲线下面积来计算生存时间(效果)。所以在这里,我们应用与估计成本费用相同的概念来估计:
根据上述公式,假设Z=1表示某治疗策略,Z=0表示某参照策略,我们可达到ΔC和ΔE为:
1.2 成本‑效果分析方法
(1)增量成本效果比(ⅠCER)
成本‑效果分析采用的评价指标为成本‑效果比(cost‑effectiveness ratio,CER),是将成本(cost,C)作为分子,效果(effectiveness,E)作为分母,计算两者的比值CER=C/E,由此可以获得单位效果所需的成本[1]。
当运用成本‑效果分析方法对多个方案进行评价与方案选择时,需要使用增量分析法,其指标为增量成本‑效果比(incremental cost‑effectiveness ratio,ⅠCER)。ⅠCER是指两种方案之间的增量成本除以增量健康产出,表示增加一个单位的健康产出所消耗的增量成本,可用于评价两个或两个以上治疗方案之间的相对经济性。增量成分‑效果比用式(5)表示:
运用增量效果比的判断标准为:如果一个治疗方案相对于另一个方案的ⅠCER低于某个特定价值标准,即人们意愿支付值(willingness to pay,WTP)(常用λ表示),则表示该方案经济性更优。根据世界卫生组织的建议[1],如果新的治疗策略额外获取一个效果所付出的额外成本低于3倍国内人均生产总值(gross domestic product,GDP),则认为该治疗策略是可以被患者接受的。因此,本研究将人们意愿支付的值设定为2016年的3倍国内人均GDP(155 594元/年)
(2)净效益值(NMB)
现阶段,卫生经济研究提倡使用净效益值(net‑monetary‑benefit,NMB)来对药物的成本‑效果进行评价[1]:
NMB是ΔC和ΔE的线性组合,用来测量在给定人们意愿支付的值λ的水平下的超额收益。
1.3 置信区间计算和概率敏感性分析
采用Bootstrap方法计算ⅠCER和NMB的置信区间。Bootstrap是一个非参数方法,利用概率理论从研究中得到样本的点估计值的置信区间。一般步骤为采用放回抽样的方法,从研究样本中抽取观测组成Boots样本,通过重复抽取n次(本研究抽取1 000次),进而得到参数5%~95%的可信区间范围,这可以使研究者得到不同治疗方案的所有可能性和极端情况[7‑8]。概率敏感性分析结果用成本‑效果可接受曲线表示。成本‑效果可接受曲线显示在人们意愿支付阈值下,某一种治疗方案成为最优治疗策略的概率是多少。
2 实例分析
2.1 数据来源
本研究数据来源于广州市最大的传染病专科医院。从医院电子病历系统中确认2008-2016年间诊断为慢性乙型肝炎(以下简称慢乙肝)、肝硬化和肝癌的所有门诊及住院患者,提取其门诊系统、住院系统和检验系统中相关信息,包括就诊时间、诊断、处方、费用和所有检验信息。
2.2 研究内容
本研究为回顾性队列研究。观察起点为慢乙肝初治患者开始抗病毒治疗时间,收集患者的人口学信息(性别、年龄等)、就诊信息(就诊时间、疾病诊断等)、抗病毒用药信息,包括干扰素(interferon,ⅠFN)、恩替卡韦(entecavir,ETV)、拉米夫定(lamivu‐dine,LAM)、阿德福韦酯(adefovirdipivoxil,ADV)、替比夫定(telbivudine,LdT)、实验室检查信息(HBV DNA、ALT水平及乙肝两对半检查结果等)、费用信息(抗病毒药费、其他药费、检验检查费、床位护理费、其他费用等)。如果患者出现疾病进展,则以发生该终点日期为终止时间。其中,疾病进展定义为发生肝硬化或肝癌。如果患者在队列终止前(2016年12月31日)未观察到疾病进展情况,则定义为删失。删失患者的观察终点为患者末次就诊时间。生存时间定义为患者首次抗病毒用药到观察终止所经历的时间。本研究使用无疾病进展生存时间(年)(progression‑free survival,PFS)作为衡量疾病治疗效果的指标,使用总医疗费用作为疾病治疗成本的指标,并采用5%贴现率对费用进行贴现。
2.3 统计分析
本研究使用SAS 9.4软件对人口学资料进行描述,使用PROC LOGⅠSTⅠC过程进行倾向性评分估计,使用PROC LⅠFETEST过程进行简单加权权重估计。根据相关公式,编写协变量调整简单加权后的成本‑效果分析估计以及Bootstrap的SAS程序。
3 结果
研究纳入1 626名慢乙肝初治患者,各组患者基线特征如表1所示,各组间基线年龄、性别、HBV DNA水平、HBeAg水平分布差异均有统计学意义。通过对各治疗组进行逆概率加权,使基线的混杂因素在各治疗组间的分布达到了平衡(表2)。这说明加权后各治疗组之间是可比的,解决了观察性研究中因非随机化分组而带来的混杂。
表1 不同抗病毒用药患者的基线特征Table 1 Characteristics of patients with different antiviral drugs
表2 逆概率加权后不同抗病毒用药患者的基线特征Table 2 Characteristics of patients with different antiviral drugs after inverse probability weighting
表3为不同治疗组的年直接费用结果。费用的均数大于中位数。其中ⅠFN组的年平均总费用最高,达到了9 567.41元,其次是ETV(6 258.83元)和ETV+ADV组(6 038.46元),年平均总费用最低的是ADV组(3 825.62元)。
表3 不同抗病毒用药患者的年直接医疗费用(元)Table 3 Annual direct medical expenses of patients with different antiviral drugs
基于倾向性评分简单加权法,估计各治疗组在3、5、8年治疗效果、治疗成本、增量效果、增量成本,结果如表4所示。ⅠFN组在3年、5年和8年均获得最好的效果,同时总成本也是最高的。在核苷(酸)类似物(NAS)方案中,LAM+ADV组则获得了最高的效果,其次为ETV+ADV联合治疗方案。
表4 不同抗病毒用药患者疗效与成本的估计Table 4 Estimation of effectiveness and total cost of different antiviral treatment in chronic hepatitis patients
以ADV组作为参比,各治疗组在3、5、8年成本‑效果分析结果如表5。3年总费用的成本‑效果分析结果显示:LAM组与ADV相比获得更低的效果和更高的费用,处于绝对劣势。在意愿支付阈值下,ADV比LdT更具扩展优势。ⅠFN产生的ⅠCER(223 626.00元/年)远远高于意愿支付的阈值,ETV、ETV+ADV、LAM+ADV 3种治疗方案所产生的ⅠCERs(ETV:26 534.63元/年,ETV+ADV:36 031.42元/年,LAM+ADV:28 231.21元/年)都低于意愿支付的阈值。进一步的计算净效益值发现,在这3种治疗方案中,LAM+ADV(17 830.79元)治疗方案的净效益估计结果均高于ETV(10 324.75元)和ETV+ADV组(14 347.51元)。5年总费用的成本‑效果分析结果显示:LAM产生的ⅠCER(142 614.00元/年)处于意愿支付阈值的临界。另外ⅠFN、LdT、ETV、ADV+ETV、LAM+ADV所产生的ⅠCERs都低于意愿支付的阈值。进一步的计算净效益值发现,LAM+ADV(50 337.06元)治疗方案的净效益估计结果最高,这提示了LAM+ADV治疗方案对其他治疗方案占据了优势。8年总费用的成本‑效果分析结果显示:LAM、LdT和ETV治疗方案与ADV组相比效果更好,成本更低,处于绝对优势。另外ⅠFN、ETV+ADV、LAM+ADV 3种治疗方案所产生的ⅠCERs都低于意愿支付的阈值。进一步的计算净效益值发现,ⅠFN(167 361.60元)治疗方案的净效益估计结果最高,其次为LAM+ADV(159 304.60元)治疗方案。
表5 不同抗病毒用药患者总费用的成本‑效果分析Table 5 Cost‑effectivenessof different antiviral treatment in chronic hepatitis patients
总费用可接受曲线结果显示,在人们意愿支付阈值下,接受治疗3年,LAM+ADV联合治疗方案成为成本‑效果最优方案的概率最大,高达80.7%;接受治疗5年,LAM+ADV联合治疗方案成为成本‑效果最优方案的概率最大(55.7%);接受治疗8年,ⅠFN单药治疗方案成为成本‑效果最优方案的概率最大(52.0%),见图1~图3。
图1 3年治疗的成本‑效果可接受曲线Figure1 Cost‑effectivenessacceptability curveof 3‑year treatment
图3 8年治疗的成本‑效果可接受曲线Figure3 Cost‑effectivenessacceptability curveof 8‑year treatment
4 讨论
针对真实世界数据存在的偏倚问题,除了设计科学合理的研究方案,在统计分析阶段还应采用合理的分析方法进行处理。本研究采用倾向性评分逆概率加权的方法对观测数据中的潜在混杂进行调整。该方法通过对多个协变量综合成一个得分值,进而构造出一个加权样本,能够很好解决传统方法无法处理的由协变量过多而导致的过度匹配、过度分层以及共线性等问题[9‑10],从而最大限度地减少混杂的偏倚。逆概率加权的权重设定包括了非稳定权重和稳定权重,由于非稳定权重会使样本量膨胀,容易出现极值,导致结局不稳定[11]。因此,本文中使用稳定化权重的方法进行加权调整,该计算方式保留了原始人群一样的样本量,减少极值的出现,减小了Ⅰ类错误。但逆概率加权的方法也存在无法处理未测量的混杂,要求在协变量不同水平下的不同分组均要有观测等问题。另外,虽然逆概率加权能够处理多个混杂因素,但并不是说能够随意选择协变量加入模型。过多或错误的选择协变量则会产生偏倚,从而导致权重的估计错误。
对于删失数据,可以通过排除发生删失的数据或把删失数据当作完整数据的简单方式进行处理。但是这些做法会造成受试者信息丢失、估值偏低等问题。本文采用了简单加权方法,假设删失为完全随机缺失(missing completely at random,MCAR)的数据,即认为受试者发生删失的原因与其他因素无关,出现删失的受试者与未出现删失的受试者的成本或疗效是相似的,因而可以利用未删失受试者的成本或疗效来估计删失受试者的成本或疗效[12]。然而本研究并未考虑利用删失受试者已有的成本或疗效进行估计,以及当其他混杂因素与发生删失存在关联,即该删失类型为随机缺失(missing at random,MAR)时如何对删失进行处理和估计。今后的研究可以对成本或疗效的方法进一步优化。
目前,药物经济学越来越受到重视,本文将基于倾向性评分简单加权估计的方法应用于慢乙肝抗病毒治疗的成本‑效果分析中,研究发现干扰素治疗方案在短期治疗(3年和5年)上不具有成本‑效果,但在长期治疗(8年)上是成本‑效果最优的治疗方案;在NAS治疗方案中,LAM+ADV初始联合治疗方案在3年、5年和8年的治疗中最具成本‑效果。基于本研究结果,对慢性乙型肝炎患者的抗病毒药的成本以及疗效有了更全面的了解,为医生对慢性乙型肝炎初治患者选择合适的治疗方案提供了参考,也为“真实世界”复杂医疗数据的长期疗效比较和成本‑效果的实证分析提供了方法选择。
图2 5年治疗的成本‑效果可接受曲线Figure2 Cost‑effectivenessacceptability curveof 5‑year treatment