基于分位数回归法的成人白血病患者住院费用影响因素分析
2021-02-17李长平马跃申王津雨
宋 振 李长平 崔 壮 马 骏 刘 毅 马跃申 王津雨 施 均
1 中国医学科学院血液病医院(中国医学科学院血液学研究所), 300020 天津;2 实验血液学国家重点实验室,300020 天津; 3 国家血液系统疾病临床医学研究中心,300020天津; 4 天津医科大学公共卫生学院,300020天津
白血病是一组造血干细胞恶性克隆性疾病[1],根据国际疾病ICD-10分类,白血病主要包括急性、亚急性和慢性白血病。根据国际癌症研究机构(IARC)2020年全球癌症统计数据显示,2020年全球约有47.4万白血病新发病例,死亡约31.1万例,发病和死亡情况不容乐观[2]。国内外研究均发现白血病患者疾病负担较重,国内有研究发现白血病患者的次均住院费用可高达20 000元,给社会和家庭造成沉重的经济负担[3-4]。目前常用的住院费用分析模型有多重线性回归模型,对于偏态分布的数据需要进行正态变换后建模分析。分位数回归(quantile regression, QR)在对多因素进行分析时,可以通过自变量对因变量和条件分布影响进行更精确的描述[5]。本研究旨在通过建立分位数回归模型和多重线性回归模型2种方法了解白血病患者住院费用的现况及其影响因素,探索住院费用分析方法的最优选择,以期能够为白血病患者住院费用分析方法的实际评价提供科学参考。
1 资料与方法
1.1 资料来源
研究资料来源于天津市2003年1月1日至2013年12月31日城镇职工基本医疗保险数据库。按照参保人群的50%进行分层(按市内6区、环城4区、郊县分层)随机抽样,共抽取5 044例白血病患者,年龄17~96(51.86±15.82)岁。
1.2 调查内容
1) 基本信息:患者的出生日期、确诊年龄、人员类别(在职、退休)、性别、医院级别(三级、二级、一级)、支付类别(门诊、住院)、入院时间、出院诊断名称、出院时间等。
2) 医疗费用信息:白血病患者的住院费用,如药品费、治疗费、床位费、手术费、医用材料费及住院费用合计等。
1.3 统计学方法
分位数回归模型是用于分析自变量X与因变量Y的分位数之间线性关系的方法,其模型特点为注重不同百分位数条件下影响因素的变化。模型可简要表述如下:
Y(τ)i|(X=Xi)=β0(τ)+β1(τ)iX1i+
β2(τ)iX2i+…+βm(τ)iXmi+ε(τ)i。
式中,τ表示因变量Y的第τ分位数,0<τ<1;i代表观测的编号,i=1,2,…,n;0代表常数项;“1,2…m”代表自变量的个数。当拟做多因素分析的原始数据中的定量变量为偏态分布或存在一定比例的异常值时,可以尝试采用分位数回归方法构建模型进行分析[6]。
本研究采用SAS 9.4软件对医疗费用的影响因素进行多重线性回归和分位数回归的建模分析。检验水准α=0.05。
2 结果
2.1 一般情况
白血病患者的住院费用主要包括治疗费、手术费、药品费、床位费、检查费、医用材料费、成分输血费、输全血费、其他费用。在本次抽样样本的住院费用总和中,药品费所占比例最高,为11 701.78万元(59.56%);除药品费外,其他排前3位的费用依次为检查费2 667.48万元(13.58%)、成分输血费2 525.52万元(12.85%)、床位费872.93万元(4.44%)。2003—2013年,白血病患者的治疗费、手术费、药品费、床位费、检查费、医用材料费及成分输血费总体呈上升趋势。
2.2 住院费用分析
2.2.1 多重线性回归模型
由于住院费用呈偏态分布,对住院总费用对数转换后进行多重线性回归分析。结果显示,女性住院费用低于男性;退休白血病患者住院费用低于在职白血病患者;进行手术的白血病患者住院费用高于非手术白血病患者;医院级别越高白血病患者住院费用越高;年龄越高住院费用越高,但是,年龄在45~<60岁的白血病患者住院费用低于其他年龄段;住院费用随着住院天数的增加而增加。见表1。
2.2.2 分位数回归模型
采用分位数回归的方法,将性别、人员类别、是否手术、医院级别、诊断年龄和住院天数作为自变量,建立第25、第50、第75分位数回归模型,对费用进行影响因素分析。
在费用的第25分位数,性别对住院费用的影响没有统计学意义(P=0.983);退休白血病患者住院费用低于在职白血病患者;进行手术的白血病患者住院费用高于未进行手术的白血病患者;医院级别越高住院费用越高;年龄越高住院费用越高,但是,年龄在45~<60岁的白血病患者住院费用低于其余年龄段;住院费用随着住院天数的增加呈上升趋势。见表2。
表1 住院总费用经对数转换的多重线性回归分析结果
表2 住院总费用第25分位数的回归分析结果
在费用的第50分位数,女性住院费用低于男性;退休的白血病患者住院费用低于在职白血病患者;选择手术的白血病患者住院费用高于未选择手术的白血病患者;医院级别越高患者住院费用越高;年龄越高住院费用越高,但是,年龄在45~<60岁的白血病患者住院费用低于其余年龄段;随着住院天数的增加白血病患者住院费用也随之增高。见表3。
在费用的第75分位数,患者性别对其住院费用的影响没有统计学意义(P=0.289);退休的白血病患者住院费用低于在职白血病患者;选择手术的白血病患者住院费用高于未进行手术的白血病患者;随着医院级别的增高患者住院费用也随之增高;年龄段在60~<75岁的患者住院费用高于其他年龄段;白血病患者住院天数越长其所支付的住院费用越高。见表4。
表3 住院总费用第50分位数回归分析结果
表4 住院总费用第75分位数的分位数回归分析结果
3 讨论
分位数回归由Koenker和Bassett于1978年提出[7],其应用条件宽松(不受随机干扰项的分布限制)、给出信息丰富(可给出因变量任意分位数下的回归拟合结果)、结果稳健(不受因变量极端值影响),尤其适用于因变量存在异方差、拖尾、尖峰分布的情况,因而得到广泛应用。多重线性回归只能考虑到不同的自变量对因变量均值的影响,而没有考虑到因变量的不同分位数条件下影响的异质性。较传统回归分析,分位数回归能够描述因变量在不同分位点上的变量关系,因此估计结果更加全面、稳健[8]。本研究采用的分位数回归方法能够更加完整地描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望,也可以分析解释变量是如何影响被解释变量的中位数、分位数等。
本研究分位数回归结果显示,年龄和性别在不同的分位数回归下是不相同的,即不是线性的关系,因此对不同分位数的住院总费用的影响是不同的。因此,对于研究的数据,分位数回归模型是较合理的。
在抽样的参保白血病患者住院费用总和中,药品费所占比例最高,由2003年的50.4%增加到2013年的60.86%。有研究显示,白血病患者住院费用中药费占了主要地位[9-10]。其可能的原因是,白血病的治疗包括药物治疗和造血干细胞移植等多种方式,移植治疗由于受寻找供者或者配型难度的影响,主要需要药物的维持。随着医疗技术的快速发展,对白血病治疗新药的开发研究也是目前医药领域争相发展的目标,因此,做好并不断优化患者诊疗费用的分析方法对于患者疾病负担的评价也显得尤为重要。
研究结果显示,随着住院天数的增加,住院费用整体呈上升趋势,而住院时间也可以反映疾病的严重程度,这与吴双等[10]的研究结果一致。随着医院等级的提升,患者人数和平均住院费用也随之增加。三级医院的住院患者人数远远高于二级和一级医院。出现这种情况的原因可能是:等级越高的医院,接收的患者疾病严重程度也越高,而且其医疗诊断水平、规模、技术水平更高,有助于重症患者的治疗。这与马跃申等[11]研究天津市参保脑出血患者住院费用影响因素发现的结果一致。此外,手术与否也是影响住院费用的因素之一,进行手术的患者,其平均住院费用48 661.24元,是没有进行手术患者住院费用(24 593.30元)的1.98倍,与杨秀玲[12]的研究结果一致。
本研究也存在一定的局限性。白血病的类型对于白血病费用的影响因素例如住院天数、移植手术等变量可能存在交互作用和间接影响。白血病分型众多,例如按疾病进展可分为急性和慢性,按细胞起源可分为髓系和淋系,不同亚型、不同进展对应的治疗方案也不同。同时,有研究发现,医院感染会增加白血病患者的住院费用[13],因此,在费用自变量设置方面,可将白血病分型、并发症和感染等变量作为影响因素的进一步研究方向。
综上所述,分位数回归模型分析方法能够更加完整地描述被解释变量条件分布的全貌,也可以分析解释变量是如何影响被解释变量的不同分位数等内容,比传统的多重线性回归模型可以给出更多的分析信息和关系探索。因此,模型在分析能力和估计结果方面更加全面,对于白血病患者住院费用的分析和相关政策制定方面可提供方法学参考。