山西省某医院脑卒中病人住院费用的影响因素
2023-02-28周立业夏鑫婧郭志飞孙梦姣余红梅
周立业,夏鑫婧,郭志飞,孙梦姣,余红梅
·综合研究·
山西省某医院脑卒中病人住院费用的影响因素
周立业,夏鑫婧,郭志飞,孙梦姣,余红梅*
山西医科大学,山西 030600
:分析脑卒中住院费用的分布情况及影响因素,探寻高效的分析方法,为合理控制脑卒中住院费用提供理论依据。:收集山西省某三级甲等医院2017年—2019年脑卒中病人的住院信息,基于随机森林、支持向量机、Logistic回归3种机器学习算法建立预测模型,分析住院费用影响因素及其重要程度。:脑卒中病人药品费在住院费用中占比较大,住院天数、脑卒中分型、科室为脑卒中病人住院费用的主要影响因素。基于支持向量机算法构建的脑卒中病人住院费用预测模型性能较优。:应通过综合措施控制脑卒中病人住院费用,以减少住院天数为重点,强化对可控因素的管理,针对关键人群采取预防和控制措施,降低脑卒中病人的经济负担。
脑卒中;住院费用;疾病负担;影响因素;机器学习
脑卒中是一种高患病率、高死亡率、高致残率、高复发率和高经济负担五大特点的慢性病[1⁃2],是我国成年人死亡和残疾的首位病因,严重影响病人的生存质量[3]。据推算,我国心血管病现患人数3.3亿例,其中脑卒中病人1 300万例[4]。全球疾病负担(global burden of disease,GBD)结果显示,2016年我国因脑卒中死亡179.0万人,造成的伤残调整寿命年(disability adjusted life year,DALY)达3 862.3万人年[5]。我国每年的脑卒中社会经济负担达400亿元人民币,直接经济负担为每年243亿元人民币[6],给社会及家庭带来沉重的疾病负担。了解脑卒中的流行病学分布可以为脑卒中的防治工作提供重要的理论支撑。近年来,随着机器学习算法的发展,越来越多的学者开始将机器学习算法应用于医疗费用分析中[7⁃8],决策树、随机森林(RF)、支持向量机(SVM)等是使用较为广泛的机器学习算法,但其中较少应用多种机器学习算法进行对比检验。目前,由于没有具体标准划分住院费用的高低,许多研究人员根据主观看法划分住院费用,还有研究人员使用中位数方法将总住院费用分为两类。而聚类法对住院费用的分类比中位数法更好,而且不同数据类别之间的分界点完全不受中位数大小的影响[9]。因此,选择K⁃Means聚类法对住院费用进行分类,尽可能地避免人为因素的干扰。本研究以山西省运城市某三级甲等医院2017年—2019年脑卒中住院病人为研究对象,对脑卒中入院特征和住院费用进行针对性的分析,对脑卒中住院费用的影响因素进行探究,对于不同模型中筛选出的影响因素进行重要性排序,从而找出最重要的影响因素,旨在为脑卒中防治和减少疾病负担提供实证分析依据。
1 资料与方法
1.1资料来源数据来源于山西省某三级甲等医院2017年1月—2019年12月全年住院病人中疾病诊断编码为I60~I64开头的病人2 042例,收集脑卒中住院档案首页的关键信息,包括社会人口学特征(住院号、性别、年龄、婚姻状况、职业等)、临床特征(门诊诊断名称、住院天数、药物过敏等)、医疗付费方式、总费用以及各项医疗服务费用(药品费、治疗费、护理费、检查费、卫生材料费等)等。为保证研究数据的准确性,使分析结果更真实、可靠,对数据进行了预处理,剔除存在重要变量缺项、漏项以及有逻辑错误的病例,剔除极端值,如住院总费用低于100元或超过均数±3个标准差范围的病例,剔除病案质量为乙、丙或空缺的病例。
1.2研究方法
1.2.1统计分析方法运用SPSS 24.0软件进行统计学分析。对住院费用进行正态性分析,发现其呈偏态分布,因此对连续型变量采用Spearman秩相关分析进行单因素分析,对分类变量采用非参数检验(Mann⁃Whitney检验、Kruskal⁃Wallis检验)。运用R软件建立随机森林、支持向量机、Logistic回归模型。
1.2.2模型的构建与评价指标选用3种应用较为广泛的机器学习算法,即随机森林、支持向量机和Logistic回归,比较3种分类算法基于已有变量信息对脑卒中住院费用高低的分类。为了比较3种分类算法的分类效果,采用分层抽样,选择低费用组和高费用组70%的样本作为训练集建立模型,其余30%样本作为测试集评估模型性能。将3种方法在同一训练集上构建分类预测模型,并利用测试集数据进行预测,探究不同模型中住院费用影响因素排序的差异。通过灵敏度、特异度、准确度、受试者工作特征曲线下面积(AUC)和G⁃means对模型性能进行评价。
1.2.3变量离散化处理采用K⁃means聚类法将因变量(冠心病住院费用)分为低费用组和高费用组(低费用组=0,高费用组=1),将年龄、住院次数和住院天数进行离散化处理,见表1。
表1 脑卒中住院费用影响因素的变量赋值情况
2 结果
2.1脑卒中病人住院费用的基本构成本研究涵盖2017年—2019年数据,为了减少居民消费价格指数(consumer price index,CPI)带来的影响,根据中国国家统计局发布的CPI指数对费用进行调整,3年的CPI指数分别是101.6,102.1和102.9。脑卒中病人次均住院费用中位数为20 430.55元,其中药品费和卫生材料费所占比例排在前2位,分别占总费用的47.15%和14.75%,详见表2。
表2 2017年—2019年脑卒中病人次均住院费用情况(M)
2.2脑卒中病人住院费用影响因素的单因素分析(见表3)
表3 脑卒中病人住院费用影响因素的单因素分析(n=2 042)
2.3K⁃Means聚类过程及结果(见表4)
表4 脑卒中病人总住院费用K⁃means聚类结果 单位:元
2.4脑卒中病人住院费用影响因素的统计模型拟合结果在K⁃means聚类的基础上,将单因素分析中筛选的13个自变量纳入Logistic回归模型、随机森林和支持向量机模型。变量中包括4个二分类变量、9个多分类变量,处理时将9个多分类变量转化成哑变量,采用二元Logistic回归模型进行分析预测。随机森林模型的建立主要取决于两个重要参数:mtry(随机选择特征的数目)和ntree(树的数目)[8]。经验证,本研究中参数mtry设置为4,ntree设置为1 000时,随机森林模型表现最佳。在解决样本量较少,同时又是非线性的高维数据的分类问题时,支持向量机模型较其他模型更有优势,表现出预测精度较高的优点。针对不同特征的数据集选择适宜的核函数,适当的数据预处理以及选择最优的参数,都可以极大地改善支持向量机的性能。经验证,在本研究选择sigmoid核函数,将gamma的值设为0.01,cost的值设为100,此时模型分类效果更优秀。比较3个模型的输出结果,发现脑卒中住院费用影响因素的重要性排序在不同模型中存在差异:住院天数在3个模型中次序一致,脑卒中分型、是否手术、科室、职业、年份、付费方式、药品零加成政策前后在3个模型中次序基本一致,而科室是否一致、年龄、性别、入院途径、住院次数在3个模型中次序不一致。详见表5。
表5 脑卒中病人住院费用影响因素的统计模型拟合排序结果
2.53种模型性能比较采用同一训练集构建随机森林、支持向量机、Logistic回归的脑卒中住院费用预测模型,应用于同一测试集数据,比较各模型的预测效果,详见表6。
3 讨论
3.1支持向量机模型的综合性能优于其他2种模型本研究结果表明,随机森林模型和支持向量机模型比传统Logistic回归模型性能更优,随机森林模型的特异度最高(93.81%),支持向量机模型灵敏度、G⁃means及AUC表现最好。在以往的大多医疗费用研究中,学者们较多选择多元回归分析等传统统计方法,但这类统计方法都有着严格的应用条件,如线性、独立、正态、方差一致性。医疗数据的复杂性和高维性等特点,使其很难达到正态性、方差一致性等要求,在多元线性回归等传统方法中引入偏态数据,较大可能得出错误结论。支持向量机是近年来基于统计理论和结构风险最小化原则而开发的一种机器学习算法,对数据要求较少,可以很好地处理高维和复杂的资料,如医疗数据,同时还具备较好的泛化能力,其模型的建立是一个核函数和最佳参数选择的过程,适宜的核函数选择和参数的优化能够显著提高预测精度[10]。本研究结果证实,支持向量机对住院费用的建模分类和预测具有有效性和适用性,且分类效率高,模型稳定性强,在医疗领域有较好的推广前景和发展空间。
3.2药品零加成政策小有成效,但结构合理性仍需加强本研究结果显示,药品费呈现逐年小幅下降趋势,这与国家的药品政策密不可分。2017年7月山西省公立医院实行药品零加成政策,降低药品费用得到有力的政策支持。但药品费在脑卒中住院费用中占比仍然最高,与其他学者研究结果[11]相似,高于国外水平[12]。另外,治疗费3年年均占比约12%,护理费年均占比约5%,远低于药品费占比,且治疗费和护理费呈逐年下降趋势,这与公立医院的改革方向不一致,可从侧面反映出技术服务的价值认可度不高,医务人员劳动价值未能充分体现,费用结构不合理,急需探索降低药费比重、合理用药的措施,应在控制住院总费用和药品费的基础上继续降低药占比,避免增加医疗经济负担。同时,需要进一步完善补偿机制,提高技术劳务收费的比重,保障医务人员的合理收入,使其在医疗行为中的贡献真正得到体现。本研究结果还发现,3年间检查费在占比与数值均有所上升,与陈积标等[13]研究结果类似。提示医院管理者应当在运营管理上实现透明化、信息化,做好医院内部的成本管控,从粗放管理转为精细化管理[14],制定措施规范检查和诊疗方案,避免出现由“以药养医”转换为“以检验、卫生材料养医”的现象,进一步保障参保利益,提高老百姓的获得感[15]。
3.3脑卒中病人住院费用的影响因素本研究选用单因素分析筛选出的变量建立随机森林、支持向量机、Logistic回归模型,对影响因素进行重要程度排序,共13个变量被引入模型,可大致分为3类不同特征因素:客观因素(年份、药品零加成政策前后)、个体因素(性别、年龄、职业、付费方式、入院途径、脑卒中分型)以及临床因素(住院天数、住院次数、科室、科室是否一致、是否手术)。个体因素大多取决于自身情况及主观意愿,其中对于住院费用影响较大的为脑卒中分型。出血性脑卒中病情凶险且常伴有意识障碍,出血量大于30 mL时需采取手术治疗[16],术后长期康复治疗以及可能发生并发症(脑室出血伴脑积水、静脉血栓形成等),同时还伴随住院天数的增加,都是造成费用增高的原因,加重了个人及家庭的经济负担。职业在影响因素中的排名也较为靠前,本研究数据来源于运城市三级甲等综合型医院,数量较多且全面,数据分析也具有较好的代表性。根据职业分布来看,农民和工人占75.6%,且这类人群的次均住院费用高于其他职业。这类人群的工作生活环境存在较多的危险因素,如忽视自身保健、长期体力劳动等,他们普遍缺乏健康意识,对于基层卫生服务的利用率不高,部分社区或乡镇卫生院的卫生服务可及性也有所缺乏[17],长期积累导致病情加重,一定程度上增加了医疗支出。提示医疗机构可以依据本院就诊人群的分布特征采取针对性的措施,加强与社区服务中心、乡镇卫生院的联动合作,依据早诊早治的方针,深入乡镇,安排专家开展专题讲座,定期组织巡诊义诊等。同时,当地卫生部门也要因地制宜,统筹规划好各级医疗机构的职责,对于脑卒中这类慢性病,需要充分发挥社区卫生中心在脑卒中防治中的作用,加强慢性病的一级、二级预防工作,立足社区,做好重点人群的健康管理、健康教育工作,加大对基层护理人员的培训力度,更好地指导重点人群熟悉日常保健措施以及掌握疾病的应急处理措施,尽可能地减少出血性脑卒中这类危急病情的发生,最大限度地保护群众生命健康。
医疗因素中各因素排名均较靠前,其中住院天数排第1位,与王婷婷等[18⁃19]研究结果一致。有研究表明,将三级医院的平均住院日从20 d减少到7 d,可以降低49%的住院费用[20]。住院天数的不必要延长,例如等待检查或手术的住院天数,都会伴随着护理、诊查、床位等费用的增加,可能导致住院总费用上升。医疗机构应当采取综合性的措施提高临床科室和检查科室之间的有效配合,合理减少住院天数,长期住院会增加医院感染和并发症的风险,病情反复,迁延不愈。另外,脑卒中这类慢性病的特征决定了大部分病人出院后都要进行一段时间的康复治疗,康复治疗可以在一级、二级医院或社区、乡镇卫生服务中心完成,体现出分级诊疗的重要性,需要上级医院与下级医疗机构保持良好的配合和沟通,上级医院把控好出院指标,下级医院做好护理、康复的配套工作,不仅可以减轻病人的经济负担,同时也加快了三级医院的病床周转率,缓解病床紧张现象,提高资源利用效率。
[1] 赵庆,吴茜,孙晓,等.脑卒中患者延续性护理质量评价指标体系的构建[J].中华护理杂志,2020,55(2):171-176.
[2] 费囡.脑卒中再住院患者病耻感对健康促进生活方式的影响研究[J].中国医院统计,2020,27(1):55-58;63.
[3] 王陇德,刘建民,杨弋,等.我国脑卒中防治仍面临巨大挑战——《中国脑卒中防治报告2018》概要[J].中国循环杂志,2019,34(2):105-119.
[4] 中国心血管健康与疾病报告编写组.中国心血管健康与疾病报告2020概要[J].中国循环杂志,2021,36(6):521-545.
[5] GBD Causes of Death Collaborators.Global,regional,and national age-sex specific mortality for 264 causes of death,1980-2016:a systematic analysis for the Global Burden of Disease Study 2016[J].Lancet,2017,390(10100):1151-1210.
[6] 吴亚哲,陈伟伟.中国脑卒中流行概况[J].心脑血管病防治,2016,16(6):410-414.
[7] 高峰,郑二维,张清芝,等.基于决策树模型脑卒中患者住院费用DRG分组实证研究[J].中国卫生经济,2020,39(4):33-35.
[8] 于大海,李金,罗艳虹,等.随机森林模型和决策树模型在肝硬化上消化道出血预后中的应用[J].中国卫生统计,2019,36(2):162-166.
[9] YAN X,CHOWDHURY N A.Mid-term electricity market clearing price forecasting:a multiple SVM approach[J].International Journal of Electrical Power & Energy Systems,2014,58:206-214.
[10] 王娅玲,张铎龄,张译丹,等.多种统计模型在冠心病医疗费用影响因素中的应用与比较[J].中国卫生事业管理,2017,34(3):198-200;204.
[11] 钱治军,赵艳芳,何倩,等.上海市6所三级甲等医院脑卒中住院患者费用分析[J].解放军医院管理杂志,2014,21(10):978-980.
[12] YONEDA Y,UEHARA T,YAMASAKI H,.Hospital-based study of the care and cost of acute ischemic stroke in Japan[J].Stroke,2003,34(3):718-724.
[13] 陈积标,况杰,易应萍,等.2015—2019年江西省缺血性脑卒中患者特征及住院费用分析[J].现代预防医学,2021,48(8):1515-1519.
[14] 王俊娇,夏敬轩.公立医院管理信息化探索与研究[J].中国管理信息化,2020,23(18):97-98.
[15] 王予,徐沛瑶,朱敏.高血压患者住院费用及其影响因素研究[J].中国卫生统计,2019,36(4):574-577.
[16] 陈若青,马再鸿,王漫云.脑卒中首发病人住院费用分析[J].中国卫生经济,2008,27(11):52-54.
[17] 马婧,徐爱军.四种基本医疗保险制度下高血压患者卫生服务利用状况研究[J].中国全科医学,2018,21(28):3518-3522.
[18] 王婷婷,于丽华,郎婧婧,等.基于结构方程模型的肺癌手术患者住院费用影响因素分析[J].中国卫生经济,2019,38(6):61-63.
[19] 谭礼萍,吴晓云,郑银雄,等.脑卒中患者住院费用影响因素的通径分析[J].中国卫生统计,2012,29(4):574-575.
[20] WEI J W,HEELEY E L,JAN S,.Variations and determinants of hospital costs for acute stroke in China[J].PLoS One,2010,5(9):e13041.
Influencing factors of hospitalization costs of stroke patients in a hospital in Shanxi province
ZHOULiye, XIAXinjing, GUOZhifei, SUNMengjiao, YUHongmei
Shanxi Medical University, Shanxi 030600 China
stroke; hospitalization costs; disease burden; influencing factors; machine learning
YU Hongmei, E⁃mail: yu@sxmu.edu.cn
10.12102/j.issn.1009-6493.2023.03.025
国家自然科学基金项目,编号:81973154
周立业,副教授,博士
余红梅,E⁃mail:yu@sxmu.edu.cn
周立业,夏鑫婧,郭志飞,等.山西省某医院脑卒中病人住院费用的影响因素[J].护理研究,2023,37(3):517⁃521.
(收稿日期:2022-04-02;修回日期:2023-01-18)
(本文编辑 苏琳)