费用数据离群值裁剪方法对某市CHS-DRG分组效能的影响*
2022-09-14北京大学公共卫生学院卫生政策与管理系100191
北京大学公共卫生学院卫生政策与管理系(100191)
张靓囡 李璟媛 冯 文△
【提 要】 目的 支付标准的测算是DRG实施中的关键环节,本研究旨在分析比较四种常用的数据裁剪方法,为实际付费做好准备,也为后续的研究与实践提供启示及方法改进的依据。方法 利用中段区间法和缩尾法对某市二级医院2017-2019年出院病例的住院费用离群值进行裁剪,用变异系数、总体方差减少系数、Kruskal-Wallis H统计量及ROC曲线评价不同方法裁剪后对DRG分组效能的影响。结果 四种方法裁剪离群值后对DRG分组效能指标均有改善,但改善程度各有不同,最适宜的裁剪方法为方法2(裁剪上限Q3+1.5IQR,裁剪下限Q1-0.5IQR)。综合评价离群值裁剪前后CV、RIV以及ROC曲线的变化,可以得到实现更佳分组效能的数据裁剪方法。结论 恰当裁剪离群值可规避医保基金的不必要浪费、维持医院经济平稳运行、减少患者疾病负担,地方医保局可根据实际住院数据恰当选取裁剪方法。
疾病诊断相关分组(diagnosis related groups,DRG)是综合考虑患者的疾病诊断、手术操作、治疗方式、个体特征等因素,将病例进行分类的一种患者分组方案[1]。该方法关注的是“临床过程”和“资源消耗”两个维度,分组结果要保障同一个DRG内的病例临床过程相似,资源消耗相近[2],进而以DRG组为单位制定费用标准进行付费。
在根据历史出院病例进行DRG分组及病组均数计算、权重测算时,若组内包含远高于大多数患者住院费用水平的病例,将会导致该组的住院费用平均值被高估[3],使该组的付费权重测算值增大,不仅会占用其余病组的预付金额,还会带来医保基金的浪费。反之,该病组的平均费用将被低估,付费权重测算值偏低,会使该类病组收不抵支,可能会导致医院推诿该类患者,不仅会对医院管理决策产生重大影响,也将给患者带来沉重经济负担[4]。
2019年10月《国家医疗保障疾病诊断相关分组(CHS-DRG)分组与付费技术规范》中提出“精确付费是DRG实施的重要保障”。同年,国家医保局、财政部、国家卫生健康委、国家中医药局联合印发的《关于印发按疾病诊断相关分组付费国家试点城市名单的通知》中指出“对于付费异常高值或异常低值的病组,可按项目付费”,但离群值裁剪的指标及范围如何界定目前尚无统一规定。
中段区间法(也称四分位间距法)(interquartile range,IQR)和缩尾法(winsorize)是目前最为常见的患者住院费用离群值裁剪的两种方法。在不同的研究中,研究者又设置了不同的参数。如欧洲学者分别在2003[3]和2008年[5]的研究中采用了中段区间法,但后者对极低界值的设定参数与前者不同。在缩尾法中,取上下2.5%[6]和上下1%[7-8]是常见的临界值设定方法。在国内各地试行DRG之后,学者在不同的研究中选择了不同的数据裁剪方法,如张宏等人的研究[9]选用住院费用的第75百分位数加1.5倍四分位数间距的方法裁剪高离群值,袁丽萍等人的研究[10]剔除了住院费用小于1%或大于99%的病例等。国际上,Francesc Cots[3]等人的研究中比较了不同离群值裁剪方法的效果和影响,而国内还鲜见相关比较研究。
本研究旨在通过对某市二级医院2017-2019年出院病例的住院费用进行裁剪,分析比较四种常用的数据裁剪方法的影响,从而选取较为合适的方法,达到降低DRG病组内数据变异程度、提升分组效能、提高DRG病组权重测算可靠性的目的,为后续实际付费做好准备,同时也为后续相关领域的研究提供启示及方法改进的依据。
资料与方法
1.资料来源
本研究采用2020年6月18日国家医保局印发的《医疗保障疾病诊断相关分组(CHS-DRG)细分组方案(1.0版)》(共618组)对我国西南地区某市21家二级医院2017-2019年52.8万条出院病例进行疾病分组,以DRG病组例数≥30例为稳定病组,保留526739条出院病例,共计369组。
2.方法
(1)数据裁剪方法
本研究采用四种常用的离群值裁剪方法,具体公式如下:
方法1:裁剪上限=Q3+1.5×IQR,裁剪下限=Q1-1.5×IQR,式中,IQR是住院费用分布的下四分位数(Q1)和上四分位数(Q3)之间的差值[3,11]。
方法2:裁剪上限=Q3+1.5×IQR,裁剪下限=Q1-0.5×IQR[5,12]。
方法3:针对CV>1的病组,按照方法1公式裁剪(为避免过度裁剪,该方法只裁剪存在较大变异问题的病组)。
方法4:裁剪上限=住院费用的第97.5个百分位数,裁剪下限=住院费用的第2.5个百分位数[13-14]。
(2)分组效能评价指标
①组内异质性评价:变异系数(coefficient of variation,CV)是检验统计数据聚类拟合度的重要指标[15],国际上通常把变异系数作为从ADRG到DRG寻找分类节点的标志[16]。本研究用DRG组内住院费用的变异系数,反映各DRG组内不同病例住院费用的差异度(离散度),原则上要求组内变异系数小于1。CV值越小,说明组内的变异越小,分组效果越好[10]。
②组间异质性评价
总体方差减少系数(reduction in variance,RIV):为DRG组间差异度,CHS-DRG用RIV来衡量DRG系统的分组效能,RIV越大说明DRG组间异质程度越强,分组系统的区分度越高,分组效果越好。通常要求RIV值达到70%以上[17]。
完全随机设计秩和(Kruskal-Wallis H)检验:可检验不符合正态分布的多个独立样本间是否来自不同的总体分布,当P<α(α为检验水准)差异有统计学意义时,认为多个总体间相比较有差异[18-19]。本研究中,各病组的次均住院费用不满足正态分布,故使用KW统计量检验各病组经不同裁剪方法得到的各组次均费用是否有统计学差异。
③分组效果合理性的综合评价:受试者工作曲线(receiver operator characteristic curve,ROC)的检验变量是分别用方法1、方法2、方法4判断病例是否为极值,状态变量是经裁剪强度最小的方法3判断病例是否为极值。
(3)统计学方法
采用Excel 2019及SPSS 26.0进行数据库的整理与分析。采用前述指标对DRG分组效能进行评价,Kruskal-Wallis H检验水准α=0.05。计数资料以率、百分比表示。
结 果
1.裁剪前患者住院次均费用分布
结果显示,各病组变异系数范围为0.25~2.87,有3个病组CV>2,有114个(31%)病组CV>1,说明在病组费用测算过程中,首先需要处理极值以减少对病组资源消耗水平的估计偏差。各病组患者的次均住院费用呈偏态分布,除2个病组偏度<0外,各病组的偏度系数均>0,说明病组普遍呈现正偏态分布。有17个病组的偏态系数>10,右侧长尾明显,极大值是影响病组费用分布的主要因素。各病组的峰度范围为-0.95~506.12,普遍呈现尖峰态,见图1。
2.入组病例住院费用裁剪基本情况
四种裁剪方法对于数据库的裁剪比例各有不同。对数据库裁剪强度最大的是方法2,其裁剪比例最高(8.35%),裁剪去除的极大值与极小值比例也最高,分别占5.36%和2.99%;其次为方法1(5.47%),其裁剪去除的极大值比例同方法2,而裁剪低限较方法2宽松,故裁剪去除的极小值比例低于方法2,为0.11%;方法4上下限各裁剪2.50%,裁剪比例低于方法1和2;裁剪比例最低的为方法3(1.30%),见表1。
图1 裁剪前患者住院费用变异系数、峰度与偏度
3.组内异质性评价
结果显示,入组病组和稳定病组有超过25%的病组内病例住院费用差异较大,方法1、2和3裁剪后数据库中有1.63%的病组内病例住院费用差异较大,方法4裁剪后数据库中仅0.54%的病组内(共计8例)病例住院费用差异较大,见表2。
表1 某市二级医院2017-2019年历史数据按 CHS-DRG细分组入组数据次均费用裁剪基本情况
表2 某市二级医院2017-2019年历史数据裁剪前后病组内次均费用变异情况
4.组间异质性评价
经过不同数据裁剪方式,RIV值从稳定病组的0.30最高提升至方法2裁剪后的0.57,即组间变异能够解释57%的总变异。相比之下,方法1对初始值的RIV贡献值低于方法2,为0.25;方法3对初始值的贡献仅为0.08;方法4最差,为-0.01。
多个独立样本的Kruskal-Wallis H检验结果显示,稳定病组库和经四种裁剪方式裁剪后病例库各DRG组间卡方值所对应的P值均为<0.001,说明各组间病例次均费用的差异有统计学意义,即分组效果较好,见表3。
表3 某市二级医院2017-2019年历史数据裁剪前后的DRG组间差异情况
5.ROC曲线评价
用ROC曲线评价病例组合分类合理性。结果显示,三种方法的曲线下面积均大于无效面积0.5(P<0.05)。其中方法1的曲线下面积最大,为0.979,高于方法2的0.964,方法4的曲线下面积略低,为0.695,详见表4、图2。
表4 三种数据裁剪方法的ROC曲线检验
图2 三种数据裁剪方法的ROC曲线
6.四种方法裁剪结果的综合评价
研究显示,不同的离群值裁剪方法对分组效能的改善程度不同。在有同样的CV值改善和KW检验通过的情况下,方法1和方法2在其他分组效能指标上各有所长,方法1在尽可能保留原始数据方面优于方法2,方法2对RIV值的改善程度略优于方法1。由于方法2对离群值的裁剪没有超过10%,因此,对于本次分组数据,本研究认为用方法2对DRG分组效能改善的程度最佳,方法1为次优选择,见表5。
表5 四种数据裁剪方法结果
7.数据裁剪对去除高费用病例数病组的影响
数据裁剪对不同病组的影响不同。本研究中方法1和方法2裁剪的高费用病例数最多(28219例),分析裁剪去除的高费用病例数占前10位的DRG组及其占比。结果显示,对“尿路结石、阻塞及尿道狭窄,不伴并发症或合并症”的影响最大,裁剪掉的高费用病例数超过10%,其次是“脑缺血性疾患”、“呼吸系统感染/炎症”,裁剪掉的高费用病例数占比分别为6.13%和5.81%,见表6。
表6 数据裁剪去除高费用病例数占前10位的DRG组及其占比
讨 论
DRG将几十万,甚至几百万份病例纳入600余个病组,故需要评价病例分组的合理性,即分组效能。本研究显示,除个别病组外,绝大部分DRG病组的费用数据呈现正偏态分布,数据分布陡峭,因此需去掉离群值再判断分组效能。本研究中费用数据的特征与既往研究一致[20],采用四种方法裁剪离群值,并通过CV值、RIV值、KW统计量、ROC曲线反映裁剪前后DRG分组效能。结果显示,四种方法裁剪离群值后对DRG分组效能指标均有改善,但改善程度各有不同。
就裁剪强度而言,方法2整体裁剪强度最大,其对极大值的裁剪强度与方法1相同,对极小值的裁剪强度超过方法1;其次是方法4;方法3裁剪强度最低,此法只针对CV>1的病组裁剪,裁剪比例最小,无论是极大值还是极小值裁剪例数均最少,裁剪后对RIV的改善不足,存在极值处理不足的情况。
数据裁剪降低了病组的组内变异,CV值明显减小,从最初139个CV值大于1的病组(共计97359例)最低减少到方法4裁剪后的2个病组(共计8例),起到了DRG病组归集的作用。组间变异结果显示,经KW检验后,四种方法裁剪后各组间病例次均费用差异均有统计学意义,但经方法2裁剪后RIV值改善最为明显,较初始值0.30已经有了较为明显的提升,方法1、3、4的RIV值依次降低,且方法4对组间变异较初始并无改善作用。
综合ROC评价结果显示,以方法3作参考变量,方法1的曲线下面积最大,方法2略低,方法4最低,且均大于无效面积。说明由不同方法裁剪后的数据库,各DRG组间的住院费用均有统计学差异,进一步说明裁剪后分组结果具有合理性,以方法1的裁剪效果最好。
去除离群值病例数前10位DRG组的分析发现,有9个组超高限病例数占比超过5%,其中包括1组占比超10%的LX15病组,提示医院可能存在住院适应症和诊疗行为不规范问题,提示地方医保局加强关注。
本研究通过对不同数据裁剪方法的比较,显示在特定的数据分布特征下,不同的离群值裁剪方法实现了不同程度的分组效能改善。对离群值进行恰当的裁剪帮助医保合理确定疾病治疗成本,进行精准定价;促使医院规范诊疗行为,加强成本管理,在控制费用的同时保障患者诊疗质量与安全,提高患者就医满意度,实现医、患、保的三方共赢。
离群值处理的效果首先取决于原始数据分布特征,本研究探索不同的数据处理方法后,确定了对于本次数据最适宜的数据裁剪方法,并不意味着该方法适用于所有地区、所有分组方案的DRG数据。不同地区和不同类型的医院,应该进一步探索对于不同分布特征的数据的处理方法,以把握DRG数据裁剪方法的普遍适用性。