基于决策树模型的白内障患者住院费用分组研究
2023-12-06翁小瑜席淑新
翁小瑜 席淑新 方 超
1 复旦大学附属眼耳鼻喉科医院医务部,200031 上海; 2 复旦大学附属眼耳鼻喉科医院医保办,200031 上海
在“十四五”全国眼健康规划中提到:“眼健康是国民健康的重要组成部分”[1]。白内障疾病是全球范围内最常见的致盲性眼病[2],白内障患者住院治疗费用在一定程度上给患者个人和家庭带来较大的经济负担。近年来,国家陆续出台相关通知文件,要求各地深化落实医保支付改革,积极推进疾病诊断相关分组(diagnosis-related groups,DRGs)付费工作。相关研究表明,DRG付费方式在兼顾治疗效果的前提下,能合理分配医疗资源、有效控制医疗费用、提升医疗质量[3-4]。DRG的分组原理与决策树模型的分组逻辑相近,本研究以白内障住院患者为样本数据,采用决策树模型进行病例组合分析,通过决策树模型对DRG分组方案进行细化,以期为推进本地区医保支付改革、医保精细化管理提供数据支撑与参考依据。
1 资料与方法
1.1 资料来源
资料来源于上海市某三甲专科医院病案首页数据,选取2021年1月1日至12月31日出院病案首页中主要诊断为白内障的病例。根据国际疾病分类(ICD-10)主要诊断编码包括H25-H26、Q12,附加编码包括H28.0*、H28.1*;主要手术编码(国家临床版3.0,ICD-9-CM-3)包括13.1902、13.41、13.4300x001、13.5900x001、13.6500x002。剔除标准:(1)关键指标信息缺失、错误或不完整的病例;(2)住院总费用与各项费用之和无法匹配者。
1.2 统计学方法
采用Excel 2016对病案首页数据进行整理汇总,采用SPSS 25.0进行统计分析。住院总费用为偏态分布,采用M(P25,P75)进行统计描述,用Mann-WhitneyU检验或Kruskal-WallisH检验进行住院总费用的单因素分析。取费用的自然对数为因变量,以单因素分析有统计学意义的影响因素为自变量,采用多元线性回归分析,检验水准α=0.05。将筛选出的影响因素纳入决策树模型,采用卡方自动交互检测(CHAID)进行影响因素的分类组合[5],计算不同病例组合住院费用标准和病种权重,设置决策树的深度为3,父节点为100,子节点为50,决策树的拆分与组合检验水准α=0.05。分组评价指标包括:(1)模型风险值越低,分组拟合越良好;(2)组内变异系数(CV)值越小,组内同质性越好;(3)方差减少量(RIV)越大,组间异质性越强[6-7]。
2 结果
2.1 基本情况
本次研究共纳入白内障病例有效样本6 321例,其中男性2 707人(42.83%),女性3 614人(57.17%);年龄<65岁3 260人(51.57%),年龄≥65岁3 061人(48.43%);住院天数<2 d 1 495人(23.65%),住院天数≥2 d 4 826人(76.35%);住院总费用中位数9 357.07元,P25=7 481.94元,P75=13 014.25元。
2.2 白内障患者住院费用单因素分析
Mann-WhitneyU检验或Kruskal-WallisH检验单因素分析结果显示,不同年龄、住院天数、住院次数、手术情况、治疗/主要手术方式的患者,其住院费用差异具有统计学意义(P<0.05)。见表1。
2.3 白内障患者住院费用多元线性回归分析
因住院费用不服从正态分布,将住院费用进行对数转换,以住院费用自然对数值为因变量,以年龄、住院天数、住院次数、治疗/主要手术方式为自变量,进行多元线性回归,α进入=0.05,α剔除=0.10,其中有序变量按照秩序进行赋值,无序多分类变量用哑变量赋值,变量赋值见表2。多元线性回归结果显示,年龄、住院天数、住院次数、治疗/手术方式进入回归方程(F=385.47,P<0.01)。调整后决定系数R2=0.328,表示该4个影响因素能解释白内障住院费用总变异的32.8%。共线性检验结果显示,各变量VIF<3,说明各变量间不存在共线性问题;DW=1.925,各变量之间不存在自相关。见表3。
表2 变量赋值表
2.4 白内障患者住院费用DRG分组预测
将多元线性回归分析结果中有意义的影响因素纳入决策树模型进行分析,以住院费用自然对数为因变量,年龄、住院天数、住院次数、治疗/主要手术方式为分类节点的关键变量,运用卡方自动交互检测(CHAID)构建白内障住院费用决策树模型,设置决策树最大深度为3,父节点为100,子节点为50,采用10倍交叉验证法进行决策树计算效果的验证。年龄、治疗/主要手术方式、住院天数3个变量进入决策树模型,最终分为6个组合,见图1。模型风险为0.03,模型分组效果良好,各分组CV:0.03~0.13,RIV=0.32,说明组内同质性较好,组间异质性较高。见表4。
图1 白内障住院患者分组决策树模型
表4 白内障诊断相关分组结果
2.5 各病例组合住院费用标准
根据分组结果,以每个分组的中位数为标准费用参考值,计算例均费用、标准差、P25、P75,按照P75加1.5倍四分位数间距(P75-P25)为参考费用上限,费用相对权重为各组均数与总体均数的比值,权重越高说明消耗医疗资源越多[8-9]。各组的标准住院费用分别为18 485.17、967.71、10 702.24、8 358.93、8 790.71、7 623.78元,相对权重分别为1.71、0.11、1.13、1.02、0.91、0.85。本研究中超出费用参考值上限病例数327例。见表5。
表5 白内障患者各诊断相关组住院费用标准
3 讨论
疾病诊断相关分组是一种以消耗医疗资源为分组轴心的病例分组模型,是相对合理的医疗费用管理和质量评价的方法[10]。目前,DRG付费的试点工作已在多地落实,可见其在推动医药卫生体制改革过程中的关键作用[11]。但在临床实际诊疗过程中,在以诊断和治疗方式形成不同病例组合的基础上,需进一步考虑手术术式、病例特征对疾病诊疗、费用的影响。
本研究通过对白内障患者住院费用的单因素及多元线性回归分析,筛选出影响因素,治疗/主要手术方式对住院费用的影响程度较大。而患者是否具有并发症/合并症不是影响因素,这与其他研究不同,可能是因为临床医师在收治患者住院前,往往先进行麻醉综合风险评估,若患者本身存在其他疾病的,一般会建议先诊治其他系统相关疾病,再择期进行白内障手术。多元线性回归决定系数值(R2=0.328)不高,可能是因为存在其他影响白内障住院费用的因素。例如手术中置入的人工晶体类型,国内虽然采取了耗材零差率、集中采购等政策措施,但白内障手术的人工晶体耗材费用占比仍较高[12],后期将进一步分析手术中人工晶体类型对住院总费用的影响。
本研究借助决策树模型统计学分析方法,探讨同一白内障病种,不同病例手术术式、特征情况进行分组,实现分组结果组间差异最大化,组内差异最小化,对现有病例诊断相关分组起到细化和补充的作用。决策树模型结果显示,第1层分类节点变量为治疗/主要手术方式。白内障是眼科常见疾病,不同住院患者的诊断和治疗方法相似,但住院费用存在差异,非手术治疗患者较手术者低。本研究中主要手术方式为飞秒激光/白内障超声乳化抽吸术,占97.07%。白内障超声乳化术目前是临床治疗白内障的主要术式,具有操作时间短、创伤性小等优点。此外,以飞秒激光撕囊的飞秒激光辅助白内障手术是新术式,对悬韧带不稳定及部分离断的白内障等复杂病例独具优势[13-14]。第2层分类节点变量为年龄,这与其他研究结果相同。白内障住院患者年龄越小,对手术中置入的人工晶体要求越高,住院费用较高[15]。此外,老年性白内障住院患者往往诊断明确、诊疗及护理有模式可循,治疗或主要手术方式差异较小,产生的医疗费用较为清晰与明确[16]。并且2004年上海市医保局在医保支付费用预算管理基础上,对老年性白内障住院患者实行按病种付费试点工作,一定程度上较好地控制了该病种的次均住院费用。第3分类节点变量为住院天数。住院天数在一定程度上能反映医院管理水平、医护质量、工作效率和效益等[17]。以日间手术模式收治白内障患者,可降低住院天数、加快周转,并降低患者住院费用。
综上所述,本研究基于决策树模型所形成的分组,可进一步细化现有白内障病种的诊断相关分组,医疗机构可结合分组结果及分组住院费用标准,对相关疾病费用合理管控,并为规范临床医师医疗行为、合理控制医疗运行成本提供决策依据,为医保管理部门动态调整与优化疾病诊断相关分组提供参考。