APP下载

广西乳腺癌患者疾病诊断相关分组的研究▲

2020-07-22

广西医学 2020年12期
关键词:总费用合并症决策树

李 艳 吕 炜 唐 忠

(1 广西医科大学附属武鸣医院统计室,南宁市 530199,电子邮箱:584288422@qq.com;2 广西壮族自治区疾病预防控制中心,南宁市 530021;3 广西医科大学信息与管理学院,南宁市 530021)

国家癌症中心公布的数据提示,乳腺癌已经成为我国女性发病率最高的恶性肿瘤,在恶性肿瘤中的构成比为16.51%[1]。因此,关注乳腺癌的发展、控制人群死亡率是我国癌症工作的重点。疾病诊断相关分组(diagnosis-related groups,DRGs)作为一种重要的医疗管理工具,许多国家和地区已成功引进并应用于医疗评价,效果较好[2]。控制医疗费用的快速增长,合理调整医疗费用的结构,减轻医疗保险基金的压力和风险,是我国医疗体制改革面临的重大问题,而广西医疗付费体制的改革也迫在眉睫。为此,本文通过探讨乳腺癌患者住院医疗费用的影响因素,研究广西乳腺癌病例的DRGs方案,为推进DRGs付费制度、完善医疗保障制度提供决策参考。

1 资料和方法

1.1 资料来源 数据来源于广西壮族自治区卫生健康委员会广西全民健康信息平台数据库,共纳入199家医院,包括所有与此平台建立数据接口的广西所有公立医院及部分私立医院,其中52家三级医院,其余为二级及以下或未评级的医院。筛选出院时间为2014年1月1日至2017年12月31日,主要诊断为乳房恶性肿瘤的病案首页数据。纳入标准:(1)主要诊断编码为C50开头(国际疾病分类-10标准);(2)基本信息、主要诊断、费用信息较完整。排除标准:(1)入院时间、出院时间在同一天;(2)住院总费用为0;(3)其他明显有错误、缺漏的不合理病例。共纳入原始样本36 731例,经过数据预处理后共纳入35 162例样本,样本纳入率为95.73%。提取的指标包括住院总费用、医院级别、医院等次、付款方式(包括城镇职工基本医疗保险、城镇居民基本医疗保险、新型农村合作医疗、全自费等病案首页中包含的9类医疗付款方式)、性别、年龄、民族、职业、婚姻状况、住院天数、合并症和并发症发生情况、治疗方式(有无手术)、麻醉方式。

1.2 研究方法 通过相关分析,得出影响全区乳腺癌住院总费用的自变量,采用文献分析法以及专家访谈法,结合相关系数选择纳入分组的最终变量;采用卡方自动交互检测算法构建决策树,采用交叉验证方法对决策树进行验证得到DRGs。采用变异系数对DRGs进行组内同质性评价;变异系数=标准差/均数,其是一个衡量数据集中各观测值变异程度的统计量,其数值越小表明组内异质性越小,组内同质性越大。采用方差减少量(reduction in variance,RIV)对DRGs进行组间异质性评价;RIV=(总离均差平方和-n个子集的总离均差平方和的合计)/总离均差平方和;RIV值越大提示组间的异质性越好,分组越合理。

1.3 数据处理工具 采用Microsoft Excel 2003软件进行数据的预处理;采用SPSS 17.0软件进行数据的预处理、统计学分析以及决策树分组和评价。以P<0.05为差异有统计学意义。本研究设置决策树的停止生长条件为最大层数3层,父节点最小样本数100,子节点最小样本数50,拆分合并的置信度为95%,交叉验证方法样本集群数为10;决策树停止生长的标准是同一个分支的数据具有相同的特征,并且无法再继续进一步的划分[3]。

2 结 果

2.1 乳腺癌住院总费用相关因素 由于住院总费用呈偏态分布,采用非参数检验秩相关分析。结果显示,医院级别、职业、住院天数、合并症或并发症、治疗方式与住院总费用呈正相关,医院等次、付款方式、性别、民族、婚姻状况、麻醉方式与住院总费用呈负相关(均P<0.05);年龄与住院总费用无相关性(P>0.05)。见表1。

表1 相关分析结果

2.2 DRGs及分组效果评价 由于变量过多或过少均可影响决策树的节点数量,树节点过多或过少对于分类效果的影响均较大,因此综合文献分析以及专家访谈及相关分析的结果,选择住院天数、医院级别、治疗方式、合并症或并发症为自变量,以乳腺癌患者住院总费用作为因变量,进行决策树构建。根据相关系数设置分层变量,以住院天数作为分组的第一层变量,医院级别作为第二层变量,合并症或并发症以及治疗方式作为第三层变量。最终得到以住院总费用为根节点,43个节点、24个终端叶子结点的决策树,即得到24个DRGs,平均总住院费用为17 406.15元;分组住院时间长、医院级别高、有手术、有合并症或并发症的乳腺癌病例住院总费用均相对较高。各分组变异系数为0.346~0.922,均小于1,说明组内同质性较强;24个诊断分组的RIV为53.23%,说明分组较为合理。见表2。

表2 DRGs及分组评价

3 讨 论

3.1 数据的代表性 国内现有几个较具影响力的DRGs分组器版本,但由于各地区经济水平不同,疾病谱不同,每个地区针对每一个疾病的DRGs均不相同,面向全国推广时,都需要更大范围的样本数据来支撑分组方案的验证与优化。此外,DRGs要根据各地样本数据的更新进行改进,而及时纠偏是一个长期任务;同时,在推广应用DRGs分组器时,还需要一定程度的本土化处理,制定适合本地区的DRGs方案,并定期调整和制定DRGs组合及其费用标准[3]。本研究的样本来自区内所有与广西全民健康信息平台数据库建立接口的公立医院以及私立医院,在本地区具有较强的代表性,可以作为DRGs的依据及进行区域内推广应用的参考。

3.2 分组节点变量的选择 决策树过大或过小对于分组效果都有较大影响。分组节点过少会导致决策树过小,不能很好地区分不同特征的患者,导致组内同质性弱;分组节点过多导致决策树过大,可能产生过度拟合现象[4]。相关分析结果显示,住院天数、医院级别分类是相关系数最大的两个变量;其次是麻醉方式和治疗方式,但选择麻醉的患者与治疗方式中有手术的患者基本一致,两个变量意义有重叠;医院级别和医院等次属于衡量医院综合水平的同一类型变量;职业变量虽然相关系数较大,但作为制定费用分组变量的实际意义不大;而合并症或并发症与其他变量的相关性相差不大。根据变量的实际意义以及专家咨询结果,本研究选择住院天数、医院级别分类、合并症或并发症、治疗方式作为分组变量,与国外以及我国其他省份的分类组合指标相似[5-7]。

3.3 DRGs结果 本研究结果显示,由决策树分类得到24个DRGs,组内同质性强,组间异质性好,提示分组合理。DRGs 12分组(住院天数1~2周,医院级别为三级或其他,有手术)、DRGs 16分组(住院天数2~3周,医院级别为三级或其他,有手术)是占比最大的两个分组,构成比分别为13.2%、15.2%,提示控制这两组患者的住院费用对控制总体住院费用有重要意义。DRGs19分组(住院天数3~4周,医院级别为三级或其他,无手术)住院费用中位数排在24个分组中的第2位,比同等条件有手术的费用高,提示应重点控制这部分患者的住院时间,以控制住院费用。

本研究中,第一层分类节点为患者的住院天数:随住院时间的增加费用逐步上升,所消耗的医疗资源也随之增加,因此控制患者的住院时间是控制住院费用的有效措施;第二层分类节点为医院级别:级别高的医院总费用高于级别低的医院,级别高的医院通常拥有更优质的医疗资源,因此医疗费用比低级别的医院高;第三层分类节点为合并症或并发症、治疗方式:经手术治疗的患者的总费用高于保守治疗的患者,有合并症或并发症的患者的总费用高于无合并症或并发症的患者,由于手术患者需要花费更多的医疗耗材和人力支出,而存在合并症或并发症的患者需要更多的额外的医疗照顾,因此费用也较高。因此,选择合适的治疗方案,严格控制并发症是控制住院费用的重要措施,与其他相关研究结论一致[7-10]。

本研究通过决策树分析得到的针对乳腺癌患者住院总费用的DRGs,从理论层面上得出乳腺癌住院患者的疾病分组补偿依据,也为其他病种的分类提供参考。要推进乳腺癌的DRGs付费改革,完善医疗保障制度,应从多角度采取综合措施减轻乳腺癌带来的疾病负担:首先,在临床上,通过提高医生诊疗水平、缩短住院天数、合理调整患者的治疗方案来控制医疗费用;其次,在医院管理上,通过控制过度医疗、加强医院管理、完善医院信息化,加强病案信息的管理等措施来控制医疗费用,以提高医疗资源的使用效率。

猜你喜欢

总费用合并症决策树
安庆农村老年高血压患者合并症的影响因素
针对性护理在妊娠合并症患者中的作用及效果分析
“健康中国2030”背景下京、津、沪、渝四直辖市卫生总费用的比较研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
减重手术可减轻肥胖相关合并症
对45例脑出血患者各种合并症的分析
基于肺癌CT的决策树模型在肺癌诊断中的应用
21世纪我国卫生总费用占GDP比例首次低于4%