APP下载

宁夏南部山区农村中老年患者住院费用影响因素分析

2023-09-21马喜民李培雯贺嘉慧李春生

医学与社会 2023年9期
关键词:位数决策树住院费用

马喜民,李培雯,贺嘉慧,李春生,乔 慧

1宁夏医科大学公共卫生学院流行病与卫生统计学系,宁夏银川,750004;2宁夏环境因素与慢性病控制重点实验室,宁夏银川,750004

在经济平稳增长、科技蓬勃发展的时代背景下,我国居民生活水平逐步提高,期望寿命也高于以往。与此同时,我国老年人口占总人口的比重逐渐增加[1],截至2021年,65岁以上人口已经突破2亿,占总人口的比重达到14.2%[2]。在我国,年龄达到45岁已经入中老年阶段,老龄化程度的加深,使人们对于疾病的抵抗能力变得薄弱,人群慢性病患病率出现显著增长,并给卫生体系带来沉重的压力[3-4]。由于中老年患者身体健康状况较差,患病风险高,对住院服务有较高的需求。因此,全面了解影响中老年患者卫生服务利用的现状,可以针对性地减少因身体疾病造成医疗费用支出而导致的家庭经济负担,对于我国巩固脱贫攻坚成果,阻止因病致贫、返贫具有重要意义。

目前,国内有较多关于住院费用的研究[5-9],在研究对象方面,许多学者针对的是不同地区三甲医院中某些特定疾病的患者,很少聚焦于宁夏南部偏远山区的农村中老年患者;在研究方法上,目前大多研究仍采用单一水平回归模型分析住院费用影响因素[5-9],鲜有研究涉及不同水平结合决策树模型对住院费用的影响因素分析,对分析住院费用的影响因素具有局限性。基于此,本研究在我国脱贫攻坚取得重大胜利的背景下,以宁夏南部山区的农村中老年患者为研究对象,采用分位数回归模型探究宁夏南部山区农村中老年患者住院费用的影响因素,在此基础上,结合卡方自交互侦测决策树模型构建住院费用分组模型,预测各因素共同作用对住院费用的风险高低,为完善中西部地区医疗保险制度,提高宁夏南部山区农村中老年患者健康水平提供参考。

1 资料来源与方法

1.1 资料来源

资料来源于宁夏医科大学公共卫生学院团队立项的国家自然科学基金项目与哈佛大学合作开展的试点项目2019年随访数据。采用多阶段抽样方法对宁夏海原、盐池、彭阳、西吉4个县进行抽样调查。第1阶段:将4个县53个乡镇下的208个行政村按照经济发展水平分为好、中、差3个水平。第 2 阶段:对每个乡镇的行政村通过简单随机抽样方法抽取40%作为样本村,简单随机抽样通过随机数表法抽取,将208个行政村编排号码为1-208;从随机数表中任一数字开始,按一定的顺序或间隔读数,选取编号范围内的数字,超出范围的数字不选,重复的数字不再选,直至抽取数量至40%的行政村为止,简单随机抽样方法则为结束。第 3阶段:每个样本村再通过系统抽样每隔5户抽取1户家庭,共随机抽取 20-33 户居民,选取在家常住 1年以上,年龄≥45岁且过去1年有住院经历的人作为调查对象。共选取调查对象1867人,发放问卷1867份,回收1867份,考虑到关键变量缺失,最终纳入分析1802名,问卷有效回收1802份,问卷有效应答率96.5%。

1.2 研究方法

研究自2009年开始基线调查,至2019年为第5次随访调查,由于前4次随访调查的数据分析显示问卷均具有良好的信效度,因此本研究延续之前调查自行编制的问卷,并由专家对问卷内容进行质量检验,自制问卷量表Cronbach's alpha=0.853, KMO=0.846, Bartlett's球形检验P<0.001,信效度良好。调查内容包括性别、年龄、婚姻状况、文化程度、职业、缴费方式、是否做手术、住院天数、住院次数、过去1年是否患有经医生诊断的慢性疾病、过去1年因住院所支出的自付医疗费用。

1.3 模型设定

1.3.1 分位数回归模型。是一种基于因变量y分布来拟合自变量x的回归方法。相较于单一水平回归,分位数回归可以选取任一分位数点进行参数估计,所以全面描述y|x的分布[10]。故采用分位数回归模型,模型可简要表述如下:

Y(τ)i∣(X=Xi)=β0(τ)+β1(τ)iX1i+β2(τ)iX2i+…+βm(τ)iXmi+ε(τ)i

式中,τ表示因变量Y的第τ分位数,0<τ<1;i代表观测的编号,i=1,2,…n;0代表常数项;“1,2…m”代表自变量的个数。当拟做多因素分析的原始数据中的定量变量为偏态分布或存在一定比例的异常值时,可以尝试采用分位数回归方法构建模型进行分析[11]。

1.3.2 CHAID(Chi-squared automatic interaction detector)决策树模型。 其核心思想是根据因变量和具有统计学意义的自变量进行最优分割,按检验结果进行最优分组[12]。参考以往决策树模型,分别选择父节点200,子节点100的个案数[13-14]。

1.4 统计学方法

使用Stata 16.0和SPSS 26.0进行数据分析,例数和构成比进行描述性分析,单因素分析采用秩和检验,多因素采用OLS回归和分位数回归,CHAID决策树模型中建立住院费用分组模型。检验水准α=0.05。变量及赋值见表1。

表1 研究变量名称及赋值情况

2 结果

2.1 调查对象基本情况及单因素结果

1802名宁夏南部山区农村中老年患者中,年龄60-74岁占比最高,有744例(41.3%);患有慢性病占比最高,有1298例(72.0%);未做过手术的占比最高,有1412例(78.4%);医院直接报销占比最高,有1015例(56.3%);住院天数在0-9天的居多,有805例(44.7%)。单因素结果显示,不同宁夏南部山区农村中老年患者的住院费用在年龄(H=11.944,P=0.003)、慢性病患病(W=-2.063,P=0.039)、是否手术(W=-10.998,P<0.001)、缴费方式(W=-5.124,P<0.001)、住院天数(H=144.839,P<0.001)之间,差异具有统计学意义。见表2。

表2 宁夏南部山区农村中老年患者基本特征

2.2 宁夏南部山区农村中老年患者住院费用

2.2.1 OLS回归模型。以住院费用为因变量,将表1变量赋值中的10个变量纳入自变量进行OLS回归,结果显示,手术(β=-6359.841,P<0.001)、缴费方式(β=1686.032,P<0.001)和住院天数(β=4299.840,P<0.001)是住院费用的影响因素。见表3。

表3 宁夏南部山区农村中老年患者住院费用OLS回归与分位数回归比较分析

2.2.2 分位数回归模型。在OLS回归基础上,将以上自变量纳入建立P10、P25、P50、P75和P90分位数回归模型进行住院费用影响因素分析。结果显示,以住院天数在0-10为参照,住院天数在15天以上在P10、P25、P50、P75和P90五个分位数点上均产生了显著的正向作用(β1=509.286,P1<0.001;β2=393.333,P<0.001;β3=585.714,P<0.001;β4=2800.000,P<0.001;β5=7700.000,P<0.001);以做手术为参照,未做手术在P10、P50、P75和P90分位数点上有显著负向影响(β1=-434.286,P1<0.001;β3=-828.571,P<0.001;β4=-4000.000,P<0.001;β5=-12200.000,P<0.001)。以先垫付后报销为参照,医院直接报销在P10分位数点有显著负向影响(β1=-157.857,P1<0.00),在P50、P75和P90分位数点上有显著正向影响(β3=485.300,P<0.001;β4=1300.000,P<0.001;β5=1866.667,P<0.1)。此外,以务农为参照,务工在P75分位数点有显著影响(β4=1400.000,P4<0.05)。

2.3 宁夏南部山区农村中老年患者住院费用的决策树模型

分组模型显示,住院费用最高的是做过手术并且住院天数在10-14天同时缴费方式为医院直接报销的宁夏南部山区农村中老年患者,住院费用最低的是未做过手术同时住院天数为0-9天的宁夏南部山区农村中老年患者。不同组合费用间差异有统计学意义(P<0.001),预测风险分值为0.083。见图1。

图1 基于决策树模型构建的宁夏南部山区农村中老年患者住院费用分组模型

3 讨论

3.1 住院天数、有无手术是影响宁夏南部山区农村中老年患者住院费用较为重要的因素

通过分位数回归对住院费用的影响因素研究,得到了P10、P25、P50、P75和P90分位数下的回归模型。结果显示,住院天数是住院费用的关键因素。住院天数多和做过手术的患者在P10、P25、P50、P75和P90分位数点上均对住院总费用具有显著正向影响。住院天数是反应医疗质量的指标[15],住院天数的增加伴随着医药费、床位费和药品等耗材费用的增加[16]。一方面,住院天数往往与患者疾病严重程度有关[17],严重的疾病治愈难度大且治愈时间长,即使病情缓解后也需要一定的康复时间,因此其住院天数增多,对住院费用影响较大;另一方面,由于研究面向宁夏回族自治区南部山区农村中老年患者,该地区因地理位置偏远,经济水平和医疗资源也较其他西部农村地区更为低下,当地居民患病后往往易忽视自身健康,在宁夏南部山区,“小病不看、大病不治、重病才住院”的现象较为常见[18],因此宁夏南部山区住院的患者病情更为严重,住院天数也会增多。是否手术是住院费用的关键因素。复杂的手术类型具有一定风险[19], 宁夏南部山区的农村中老年住院患者,由于个人健康意识较为薄弱,“小病拖,大病扛”较普遍,住院前身体就有一定的基础病,术后身体更处于虚弱欠佳状态,若术后恢复效果不佳,可导致病情反复,迁延不愈,都会导致住院费用的增加[20]。对此,医疗机构应根据病种标准和诊疗程序,对于风险较大的手术治疗,建议采取保守治疗的方式,减少不必要的手术。

3.2 缴费方式、职业对宁夏南部山区农村中老年患者住院费用有一定影响

结果显示,住院费用也受到缴费方式的影响。通过分位数回归进一步发现,在不同分位数点下,影响因素正负作用有所不同,在低分位数点上,医院直接报销的缴费方式对住院费用具有负向影响,而在高分位数点上,医院直接报销住院费用具有正向影响。究其原因,可能是因为医院对于住院费用的报销比例,低住院费用在医院的封顶线内,可以满足一定的报销比例[21],因此医院直接报销的方式可以缓解住院费用负担,当住院费用高于医院报销的封顶线时,超过封顶线的部分医疗费用无法报销,因此医院直接报销的缴费方式住院费用高分位数点上无法缓解医疗负担,这就提示政府部门既要继续完善医疗保险制度,根据当地卫生服务利用现状适当调整医院的起付线以及封顶线,加大住院费用报销比例,减少因重大疾病带来的经济损失。此外,通过以上分析,注意到职业为务工的患者在P75住院费用分位数点上显著高于务农的患者。其原因可能为:在宁夏回族自治区南部山区,由于地理位置偏远和经济水平低下等原因,为维持家庭生计,部分人选择外出务工。对于务工人员,长期外出打工造成居无定所,身体出现轻微疾病容易自身忽视,长期以来疾病累计造成身体出现恶化,因重大疾病造成了医疗负担较重,因此住院费用较高,而务农的患者大多时间居住在家中,身体出现小病可就近去基层医疗机构治疗,卫生服务可及性高,及时就近治疗可减缓疾病发展,疾病严重程度相对较低,因此住院经济负担较低于务工的患者。对此,当地基层卫生人员应重点对外出务工家庭的人开展健康知识科普,提高对外出务工人员健康意识;政府部门也针对此现状调整卫生政策,对外出务工等流动人员在医疗服务利用方面给予重点关注。

3.3 分位数回归结合决策树模型能稳健全面地反映宁夏南部山区农村中老年患者住院费用的重点因素

传统单一水平回归分析容易导致某些信息难以被发现。相比于传统的回归分析方法,分位数回归结果可以估计住院费用的总体条件分布,使用分位数回归估计结果更为稳健[22]。在本研究中,除传统OLS回归分析显示的影响因素外,分位数结果还提示职业在P75水平的住院费用中产生了一定程度的影响。较传统单一水平回归,分位数回归能描述因变量与自变量在不同水平间的关系,因此估计结果更加全面、稳健,对政策完善更具指导意义。

最终选择在分位数回归分析基础上,纳入有统计学意义的变量(职业、是否做手术、缴费方式、住院天数)进行住院费用分组分析。结果显示,是否手术、缴费方式、住院天数进入了决策树分组模型。研究构建宁夏南部山区农村中老年患者住院费用决策树分组模型预测风险较低,根据费用分组模型结果,对制定有针对性的改进措施提供指导意义,帮助减轻宁夏南部山区农村中老年患者疾病经济负担的同时,也为完善医保支付标准提供参考价值。

猜你喜欢

位数决策树住院费用
五次完全幂的少位数三进制展开
我国脑卒中患者住院费用及影响因素研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
桑植 卫生院住院费用全报销
基于决策树的出租车乘客出行目的识别
国家卫计委:2017年实现住院费用异地结算
基于肺癌CT的决策树模型在肺癌诊断中的应用
遥感卫星CCD相机量化位数的选择
“判断整数的位数”的算法分析