APP下载

基于决策树的胆总管结石患者住院费用分组研究

2021-10-13殷玉华吴华氽朱健倩

中国医院统计 2021年4期
关键词:决策树住院费用胆总管

殷玉华 吴华氽 朱健倩

1 浙江大学医学院附属杭州市第一人民医院城北院区质量管理部,310000 浙江 杭州;2 浙江大学医学院附属杭州市第一人民医院湖滨院区质量管理部,310000 浙江 杭州

目前胆总管结石的发病占所有胆石症患者15%~30%[1],其治疗方案较多,且由于患者自身特点差异,不同胆总管结石患者住院消耗医疗资源以及住院费用往往也不同。病例组合是根据疾病的治疗方式和患者的个体特征,将疾病治疗手段和病情严重程度相似,个体特征一致的患者相结合,可以用于测算在医疗资源消耗相似的情况下患者所花费的医疗费用[2]。目前国内对住院费用的病例组合研究比较常见,但对胆总管结石住院费用的病例组合研究较少。鉴于此,本文采用决策树E-CHAID模型对浙江省某三级甲等综合医院胆总管结石病例住院费用组合进行预测分析,为本地区医保支付改革以及提高院内医疗效率提供一定的数据支撑及理论依据。

1 资料与方法

1.1 资料来源

资料来源于该院病案首页数据,选取2017年1月1日至2020年12月31日出院主要诊断为胆总管结石(《国家临床版2.0疾病诊断编码(ICD-10)》编码为K80.300x005、K80.301、K80.302、K80.304、K80.402、K80.404、K80.501)病例建立数据库。纳入标准:(1)出院主诊断为胆总管结石(含伴有并发症);(2)出院时间为2017年1月1日至2020年12月31日。排除标准:(1)数据重要信息缺失或存在异常数值;(2)住院总费用与各项费用之和无法匹配;(3)日间住院患者。

1.2 数据预处理

由于患者住院费用呈偏态分布,采用中段区间法[3]对数据进行预处理,即数据下限为(P25-Q),数据上限为(P75+1.5Q)(P25为第25百分位数,P75为第75百分位数,Q=P75-P25)。经过中段区间法预处理后最终得到有效样本3 990例。

1.3 统计学方法

利用SPSS 21对数据进行分析。采用多元线性回归方法分析住院费用影响因素(变量赋值见表1)。将筛选出的住院费用影响因素纳入决策树模型,采用E-CHAID法进行影响因素的分类组合,判断各病例组合的收费标准。设置树的深度为3,父节点为400,子节点为200。决策树的拆分和组合检验水准α=0.05。决策树模型的合理性采用组内变异系数(CV越小,组内变异性越小),组间方差减少量(RIV越大,组间变异性越大)来评价[4]。

表1 变量赋值表

2 结果

2.1 胆总管结石患者基本情况

本次胆总管结石病例有效样本共3 990例。平均年龄(65.4±16.7)岁,年龄≤65岁1 858人,年龄>65岁2 132人。住院天数≤7 d 1 858人,住院天数>7 d 2 132人。住院费用最高65 600.63元,最低10 278.75元,平均住院费用(29 409.50±12 104.74)元,中位费用26 805.38元。

2.2 胆总管结石患者住院费用影响因素

经正态性检验,住院费用不符合正态分布,将住院费用进行对数转换。以住院费用对数值为因变量,住院天数、年龄、手术操作、并发症、住院期间有无告病危、入院途径、入院病情、转归情况共8个变量纳入多元线性回归模型筛选影响因素。结果显示,住院天数、年龄、手术操作、并发症、住院期间有无告病危5个变量为住院费用的影响因素。模型调整R2为0.461,说明住院费用46.1%的变异可以由这5个因素解释。方差膨胀因子均小于5,说明各变量间不存在多重共线性,模型拟合效果较好。见表2。

表2 胆总管结石住院费用影响因素多元线性回归分析

2.3 胆总管结石患者住院费用DRGs分组预测

将多元回归分析筛选出有意义的因素纳入决策树模型进行分析。采用E-CHAID方法进行树预剪枝,选取最小个案数父节点为400,子节点为200,树的深度为3,如果节点上的数量不能达到要求,则此节点为终点。采用10倍交叉验证法进行决策树计算效果的验证。决策树拆分和组合检验水准α=0.05。最终住院天数、手术操作、年龄3个变量进入决策树模型。决策树最终分为8个组合,模型风险为0.09,模型分组效果良好。各组费用变异系数CV均小于0.4,组间方差减少量RIV=0.67,组内同质性较好,组间异质性较高,模型分组合理。各DRGs组均费、例数、变异系数等见表3,决策树模型见图1。

表3 胆总管结石住院费用病例组合

图1 胆总管结石住院费用分组决策树模型

2.4 胆总管结石患者住院费用病例组合标准及相对权重

以各组合居中70%数据的均数为标准费用,以P75+1.5Q[5-6]控制费用上限,费用权重为各组均数与总体均数的比值,权重越高代表消耗医疗资源越多。见表4。

表4 胆总管结石患者各组合住院费用预测值

3 讨论

近年来医保改革虽然在不断持续,但收效甚微。单病种支付方式虽然在一定程度上缓解了医保按项目付费的费用压力,但由于病种覆盖面较窄,支付费用定价不够合理,且患者病情特点对疾病治疗费用的影响不能充分体现,存在一定的缺陷[7];而病例组合有利于调节患者、医疗机构以及医保三方关系[8]。病例组合付费不仅是一种新型的医保付费方式,也可以作为医疗机构质量管理工具,有利于医疗机构根据患者特点合理制定诊疗方案,节约医疗成本,减轻患者医疗负担,提高医疗效率。同时各级医疗机构还可以通过病例组合付费进行横向对比,提高医疗机构的竞争力。

决策树模型对住院费用的分组核心在于各组组间差异大,组内差异小,在某种意义上与病例组合原理不谋而和,应用决策树模型探索住院费用病例组合方式有一定的理论依据。本次研究显示,决策树模型各组组内同质性较好,组间异质性较高,说明决策树模型用于住院费用预测分组较可靠。目前国内决策树模型常用的方法有E-CHIAD、CRT、CHIAD 3种方法,E-CHIAD方法更适用于连续性变量的模型构建[9]。由于住院费用为连续型变量,故选取E-CHIAD方法构建决策树模型。决策树模型结果可靠性取决于对数据的剪枝处理,而纳入的变量数直接影响决策树剪枝的难度[10]。通过多重线性回归对自变量进行筛选,可以有效减少纳入变量的个数,决策树的效果更好。本研究将多重线性回归筛选出的5个变量纳入决策树模型,最终住院天数、手术操作、年龄进入决策树模型。有无并发症未进入模型,可能是由于胆总管结石大多伴有胆管炎、胆囊炎等并发症,有无并发症对费用差异的影响无法体现[11]。入院期间是否告病危未进入决策树模型,可能与决策树父节点以及子节点设置有关。

决策树第一层节点为住院天数,说明住院天数是住院费用的最主要影响因素。住院周期越长,患者消耗医疗资源越多,费用越高[12]。合理控制住院天数可有效降低资源消耗。决策树第二层节点为手术操作。胆总管结石患者主要治疗方案为胆管切开手术治疗以及腹腔镜下取石等操作治疗。腹腔镜治疗属于微创操作,可大幅度降低患者的手术创伤,患者恢复快,住院时间短,同样可减少医疗资源消耗[13]。决策树第三层节点为年龄。65岁以上患者基础疾病增多,住院期间需要同步治疗,医疗资源消耗也会随之增加。

本次研究胆总管结石患者住院费用共分为8个组,费用最高为>7 d、手术、>65岁组,标准费用为38 446.718元,费用最低为≤7 d、操作、≤65岁组,标准费用为18 268.276元,差异有统计学意义。这也与实际情况相吻合。<7 d各组中,超额比例为3.92%,>7 d各组超额比例为0.56%,说明低住院天数更有可能出现异常费用,提示医疗机构应给予重点关注。

用决策树构建住院费用病例组合不仅可以为医疗机构更早、更好地应对医保改革付费,也可以为医疗机构合理控制医疗费用,为患者节约医疗成本提供理论依据。但是病例组合并非一成不变,各地区应根据实际情况及时调整,及时纠正。病例组合付费改革是一个长期的动态过程,医疗机构应该在实践中不断验证与完善病例组合付费分组。

猜你喜欢

决策树住院费用胆总管
胆总管一期缝合应用于腹腔镜胆总管切开取石患者中的效果观察
我国脑卒中患者住院费用及影响因素研究
一种针对不均衡数据集的SVM决策树算法
ERCP+EST与LC+LCBDE治疗老年单纯胆总管结石的效果对比分析
决策树和随机森林方法在管理决策中的应用
桑植 卫生院住院费用全报销
基于决策树的出租车乘客出行目的识别
国家卫计委:2017年实现住院费用异地结算
胆总管囊肿切除术治疗先天性胆总管囊肿的术式比较
基于肺癌CT的决策树模型在肺癌诊断中的应用