不同粗分组方法建立DRGs模型的差异对比研究*

2017-07-18程亮亮李亚茜段占祺潘惊萍

中国卫生统计 2017年3期

程亮亮李亚茜段占祺张娟潘惊萍杨珉,3△

程亮亮1李亚茜1段占祺2张娟1潘惊萍2杨珉1,3△

目的利用2015年四川省病案首页280717例呼吸系统疾病病例，基于不同粗分组方法建立并评价DRGs模型。方法以临床诊断结合统计分析分组(粗分组一)、单纯临床诊断分组(粗分组二)两种方法对病例按临床特征进行粗分组，利用E-CHAID决策树方法进行细分组，并用变异系数(CV)对模型效度的组内同质性、方差减少量(RIV)对组间异质性进行评价；用回代检验评价模型的信度。结果粗分组一与粗分组二分别建立DRGs模型一(158个组合)和DRGs模型二(86个组合)。DRG模型一基于对数住院费用的CV平均值为32.77%，RIV为18.67%；基于原始住院费用CV平均值为69.21%，RIV为34.80%。DRGs模型二基于对数住院费用的CV平均值为41.09%，RIV为18.84%，基于原始住院费用CV平均值为77.87%，RIV为28.49%。总体上模型一在组内同质性及组间异质性优于模型二。回代检验显示DRGs模型一信度相对低下，而对数转换住院费用有提升模型效度的效应。结论不同粗分组下建立两组模型各有优缺点，需要多角度评价组内同质性及组间异质性，且有待建立综合评价指标体系。

诊断相关分组 DRGs 粗分组呼吸系统疾病效度评价信度评价

诊断相关分组(diagnosis related groups,DRGs)是指按照医疗资源消耗分类的病例组合方案，是一种直接、合理、有效的医疗产出测量单位，是国际上公认的比较合理和科学的付费方式[1-3]。尽管国家卫生和计划生育委员会在2011年明确指出实施疾病相关分组支付方式用于疾病分类、病案管理及医院评价工作，但目前我国DRG研究仍处于初步阶段，所使用的DRGs模型主要是引进国外的DRGs模型或在基础上进行改进，较少进行DRGs不同模型的对比评价[4-5]。本研究首次利用2015年四川省280717例呼吸系统疾病病例，以住院费用作为医疗资源消耗指标，采用两种不同粗分组条件建立DRGs模型，并对比基于不同方法的DRGs模型的效度和信度，在一定程度上为深入探讨DRGs分组方案提供科学基础。

资料与方法

1.资料来源

资料来源于四川省卫计委卫生信息中心住院病人病案首页数据报告系统，纳入746家综合医院包括2015年1月1日至2015年10月30日间主要诊断为J00～J99呼吸系统疾病的病例共300527例。剔除ICD编码不全、逻辑性差、住院天数少于1天、住院费用异常以及关键指标缺失的数据，获得有效病历280717例，占全部病历的93.41%。住院费用指标呈对数正态分布，故本研究对住院费用进行对数变换。

2.粗分组方法

利用临床诊断结合统计分析(粗分组一)、单纯临床诊断(粗分组二)两种方法对病历按临床特征进行粗分组。由于内科与手术操作治疗医疗资源消耗差异较大，粗分组时按照治疗方式分为内科组及外科组(外科组又分为非手术室操作和手术室操作)。

粗分组一是在ICD-10呼吸系统疾病病种(三位编码)的基础上，以住院费用及临床特征相似为合并原则，根据临床诊断相似及住院费用无统计学差异两个原则进行病种合并。即将呼吸系统病例按照ICD-10前三位类目先归为N类，进一步根据其临床特征相似性及医疗资源消耗的差异性无明显统计学意义(住院费用对数转化后采用t检验或方差分析进行组间比较)为原则继续归为M类。粗分组二考虑到实际操作分组数过多，每个组别样本量太少，故在内科组的粗分组上不考虑统计原理，仅仅根据IDC-10自身根据疾病诊断相似的原则将三位编码进行整合分组。粗分组二中的外科组与粗分组一相同。

3.细分组方法

通过MLwiN 3.0软件拟合多水平模型找出与出院费用相关的病案特征如年龄、并发症合并症(PCCL,patient clinical complexity level)、入院情况、是否有出院31天内再住院计划、性别、民族、婚姻、离院方式、主要诊断入院情况、住院次数、费用类别、入院途径、住院期间是否病急13个因素，并作为分类节点供决策树法分组；采用Clementine12.0软件决策树方法中的穷尽卡方自动互动检验法(exhaustive chi-square automatic interaction detector,E-CHAID)在粗分组基础上进行细分组。

4.DRGs分组评价指标

效度评价分为组内同质性和组间异质性评价。用变异系数(CV)衡量各DRGs组内的住院费用的变异大小，CV=住院费用标准差/住院费用均数。CV值越小，说明组内变异越小，分组效果越好。用方差减少量(RIV)反映组间异质性大小，RIV={TSSQ(住院费用的总离均差平方和)-TWGSSQ(n个子集住院费用的离均差平方和)}/TSSQ。RIV值越大则组间异质性越强，分组结果越好。

信度评价采用检测样本回带进行检验评价。通过设置训练样本和检测样本分别为总样本量的80%及20%，在训练样本得到DRGs分组结果的基础上，将检测样本回带到训练样本的各DRGs分组结果中，计算检测样本组合的住院费用以及效度指标，比较检测样本与训练样本的差异。差异越小则结果的信度较好。

结果

1.基本情况

呼吸系统病例在粗分组一过程中分为37组，其中内科组先按照ICD-10前三位类目归类为63类，进一步根据其临床特征相似性及医疗资源消耗的差异性有无明显统计学意义为原则归类为28个粗分组。同样，外科组根据临床诊断及手术操作进程归类，共分为9个粗分组，其中非手术室操作组4组，手术室操作组5组。粗分组二过程将全部病例分为19组，在分组上不依赖统计学原理分组，直接根据ICD-10将内科组粗分为10组，外科组粗分组为9组。分组情况见表1。

2.不同粗分组下DRGs分组结果

基于训练样本下，粗分组一共获得158个DRGs组。内科病例共形成122个DRGs组，其中按一个、二个和三个分类节点选入形成的分别有27组、61组和30组，另有四个细类未选入节点，分别为流行性感冒和其他下呼吸道感染。外科病例共获得DRGs分组36个，其中非手术操作类疾病分成了14组，手术操作类疾病分成了22组；按一个、两个和三个分类节点选入形成的分别有12组、19组和4组。外科疾病中有一个细类没有选入节点，为非手术室操作中的非手术治疗(功能性鼻镜术、物理治疗、雾化吸入)组。以急性胆囊炎的分组结果见表2。

在同样的建模样本下，基于粗分组二共获得86个DRGs组。内科病例共形成50个组，均有节点选入。按一个、二个和三个分类节点选入形成的分别有15组、18组和17组。由于粗分组一和粗分组二的区别仅仅在内科粗分组上，因此外科疾病中也获得36个DRGs组合，具体分组结果与粗分组一相同。以急性上呼吸道感染的分组结果见表3。

表2 基于粗分组一下呼吸系统疾病的DRGs分组结果(以急性胆囊炎为例)

表3 基于粗分组二下呼吸系统疾病的DRGs分组结果(以急性上呼吸道感染为例)

3.DRGs分组效度分析

(1)组内同质性

基于训练数据下原始住院费用计算CV，得到粗分组一(158个组合)的变异系数平均值为69.21%，其中变异系数小于1的有148个组合，占总组合数的93.67%；粗分组二(86个组合)的变异系数平均值为77.87%，变异系数小于1的有77个组合，占总组合数的89.53%。

基于住院费用对数值计算CV，得到粗分组二的变异系数平均值为32.77%，所有组合变异系数均小于1；粗分组二的变异系数平均值为41.09%，所有组合变异系数均小于1。可见采用住院费用对数值计算有缩小CV值的效应，综合比较下粗分组一组内同质性优于粗分组二。数据见表4训练样本栏。

(2)组间异质性

基于原始住院费用和住院费用对数值的情况下，粗分组一的DRGs组合RIV值分别为34.80%和18.67%，粗分组二的DRGs组合RIV值分别为28.49%和18.84%。对训练集粗分组一和粗分组二的DRGs组合分别进行秩和检验，均显示组合之间的费用差异有统计学意义(P<0.001)，组间具有异质性。采用住院费用对数值计算有缩小RIV值的效应，但粗分组一DRGs结果的RIV值大于粗分组二，即粗分组一组间异质性优于粗分组二(见表5)。

4.DRGs分组信度评价

比较检验样本与训练样本基于对数住院费用的两个效度指标间的差别，可见基于粗分组二获得的DRGs模型分组的平均CV值之差比基于粗分组一的差别更小，绝对差值分别是2.7%(P<0.001)和7.32%(P<0.001)；但平均RIV值两法间差别不大，绝对差值分别是3.29%(P<0.001)和2.59%(P<0.001)。提示两种粗分组法获得的DRGs分组都有较好的信度，但信度的一致性不稳定。

表4 基于不同粗分组获得的最后DRGs分组的组内同质性统计(%)

表5 基于不同粗分组获得的最后DRGs分组的组间异质性统计(%)

讨论

1.不同粗分组下DRGs模型有差别

本研究用大样本实例显示，不同粗分组下利用决策树可得到不同的DRGs模型的分类数以及不尽一致的分组效度。本次研究发现两个粗分组下的DRGs模型在分类节点选择上差别不大，均以年龄和PCCL为主，其次为入院期间是否加重、入院情况等因素。这可能与在分类变量的选择采用的统计模型有关。在分类数上，DRGs模型的目标之一就是分组数量少,组间区分度大。粗分组一DRGs模型同质性与异质性评价上优于粗分组二，但在分组数量上较粗分组二DRGs模型多，且评价指标信度相对偏低。当前国内外不少学者在不同的粗分组上及不同的分类变量上制定DRGs得到不同的模型。SchellerKD等人[6]对11个欧洲国家根据不同的分类变量，将乳腺癌手术患者的 DRG 系统分为 3至7 个DRGs组合,支付价格从波兰的 577 欧元到荷兰的 5780 欧元不等，不同国家差异较大；国内学者刘宏坤等人[7]在建立消化系统疾病DRGs时，根据ICD-10划分4个粗分组；而孙惠颖[8]在建立同样消化系统疾病DRGs时，根据泰国DRGs经验按照ICD-10结合主要诊断分类(major diagnostic catogory,MDC)、诊断分类(disease cluster,DC)、合并症及并发症严重程度(PCCL)分为43个粗分组，两者得到了不同的DRGs模型。故当前在DRGs研究中缺乏科学及统一的制定标准，在应用层面难免会出现支付不公平以及难以大面积推广等现象，所以亟待有更多的研究证据帮助卫生部门出台规范DRGs模型制定的相关措施。

2.多角度评价DRGs模型的同质性与异质性

目前部分研究采用算数均数和标准差反映集中趋势和离散趋势，即基于原始住院费用计算CV和RIV[9-10]，也有部分研究采用住院费用自然对数计算CV和RIV[11-12]。本研究的住院费用数据呈现对数正态分布，考虑样本量较大，故同时基于两种方法下计算同质性和异质性指标，并比较其差异。结果不难发现，两组方法下得到的主要结果是一致的，但住院费用对数值得到的RIV值较原始住院费用得到值明显增大，CV值明显变小，说明住院费用自然对数转换后改善了组内同质性并提升了组间异质性。当对数转换也不能使分组的数据分布成对称或正态分布时，需要改良目前DRGs组内同质性和组间异质性的评价角度，如可采用专门描述偏态分布的中位数及四分位数间距替代算数均数和标准差，进一步比较结果之间的差别[13-14]。

3.发展综合评价指标体系

目前DRG分组结果的评价较看重客观指标(如CV，RIV等)，其实主观指标在DRGs模型分组效果评价中的作用也非常重要，如临床合理性、临床可行性和管理的简便性等方面[15]。

但目前DRGs模型的主观指标和客观指标评价方法尚存在不足之处，主要是由于采用不同的方法进行DRG分组，其分组模型往往各有优点，难以取舍，因此可以考虑对各个评价(组间差异性、组内一致性、DRGs组数量和等)指标确定权重，把多个评价指标综合为一个评价指标，最终以综合评价分值最高者为最优模型[16]。当然，此处便又存在权重设置的争议问题，这是DRG研究领域需要进一步探讨的问题。

综上所述，我国的DRGs研究尚处在起步阶段[17]，不同国家、不同省区域制定DRGs分组均可能由于不同的卫生体系、疾病构成以及经济发展水平和细分组方法的不同使得DRGs体系不能通用[18]。

[1]Klastorin TD,Watts CA.On the measurement of hospital case mix.Medical Care,1980,18(18):675-685.

[2]Busse R,Geissler A,Aaviksoo A,et al.Diagnosis related groups in Europe:moving towards transparency,efficiency,and quality in hospitals.British Medical Journal,2013,346(23):1261-1264.

[3]李鹏锟，栗绍强，高莉敏.DRGs在国外的发展和启示.国外医学:卫生经济分册，2012，29(1):19-24.

[4]谢雁鸣，田峰.国内DRGs相关研究综述.中国中医药信息杂志，2009， 16(S1):119-121.

[5]杜剑亮，刘骏峰，陈倩.不同决策树算法建立DRGs模型的差异.中国病案,2014,15(07)：38-41.

[6]SchellerKD,Quentin W,Geissler A,et al.Breast cancer surgery and diagnosis-related groups(DRGs):patient classification and hospital reimbursement in 11 European countries.Breast,2013,22(5):723-732.

[7]刘宏坤,彭立军,廖曼玉.消化系统常见病种实行DRGs可行性研究.现代医院,2010,10(8):94-95.

[8]孙惠颖.运用泰国DRGs方法学对云南省四所公立医院住院病例的分组研究.昆明医科大学,2014.

[9]赵婷,韩芳,阿布都沙拉木·依米提,等.乳腺癌患者住院费用的诊断相关分组研究.中国病案,2013,14(11):56-58.

[10]杨晓蓉,吴明.循环系统病例DRGs组合研究.中国卫生统计,2010,27(02):163-165.

[11]陈梅,刘忠,陈国英,等.基于DRGs的呼吸系统疾病住院费用分析.中华医院管理杂志,2013,29(2):97-100.

[12]闫宇翔,谢知,罗艳侠,等.北京地区脑卒中患者DRGs分组研究.中国卫生统计,2008,25(4):347-350.

[13]董军,胡德奎,陈剑伟,等.病种费用控制标准实验研究.中华医院管理杂志,2001,17(9):529-531.

[14]阎玉霞,潘峰,徐勇勇.住院病人内外科治疗的病例组合研究.中华医院管理杂志,2001,17(10):588-591.

[15]朱滨海.用循环系统病例探讨疾病诊断相关组统计学分组过程.中国卫生经济,2005,24(11):54-57.

[16]马文莉.宁夏三级甲等医院常见疾病诊断相关分组研究.宁夏医科大学,2014.

[17]李范,赵玉虹,何欢.我国DRGs研究的文献计量分析.中国病案,2013(2):65-66.

[18]唐剑,陈武朝,王桂榕.疾病诊断相关分组(DRGs)研究及应用.中国病案,2014,15(5):36-39.

(责任编辑：刘壮)

Research on the Differences of DRGs Models Established by Different Crude Grouping Methods

Cheng Liangliang,Li Yaxi,Duan Zhanqi,et al

(WestChinaSchoolofPublicHealth,SichuanUniversity(610041),Chengdu)

Objective Using 280717 cases of respiratory system diseases from the first-page medical records of Sichuan Province in 2015,we established and evaluated DRGs models based on different crude grouping methods.Methods Two crude grouping methods were used for comparison purpose:clinical diagnosis grouping combined with statistical analysis(crude group1,CG1)and purely clinical diagnosis based grouping(crude group2,CG2).The E-CHAID decision tree was used for the fine grouping.Validity in terms of homogeneity within groups and heterogeneity between groups was measured by coefficient of variance(CV)and reduction of variance(RIV).Reliability by internal sub-sample test was performed.Results CG1 and CG2 established DRGs model 1(156 fine groups)and DRGs model 2(86 fine groups)respectively.Base on the logarithmic hospitalization expense,the DRGs model 1 demonstrated the average coefficient of variance(CV)at 32.77%and the average reduction in variance(RIV)18.67%,while as the DRGs model 2 showed the two measures at 41.09%and 18.84%respectively.Base on the actual hospitalization expense,the averages of CV and RIV of the model 1 was 69.21%and 34.80%,and 77.87%and 28.49%of the model 2 respectively.Although the DRGs model 1 had between validity than DRGs model 2 in general,the model 2 showed better reliability than the model 1.The logarithmic transformation had an effect of improving validity of models.Conclusion Both two models had their own advantages and disadvantages.We need to assess validity and reliability by multiple perspectives,and establish comprehensive evaluation index system.

Diagnosis related grouping;DRGs;Crude grouping;Respiratory system diseases;Validity evaluation;Reliability evaluation

四川省省级科研院所成果转化项目(15010112)；美国中华医学基金会CMB项目(12-106)

1.四川大学华西公共卫生学院流行病与卫生统计系(610041)

2.四川省卫生和计划生育委员会卫生信息中心

3.四川大学西部农村卫生发展研究中心

△通信作者：杨珉，E-mail:yangmin2013@scu.edu.cn