妇婴疾病诊断相关组的构建与比较研究*
2017-01-10广东省妇幼保健院510010魏凌云章徐金龙
广东省妇幼保健院(510010) 韩 栋 魏凌云章 莹 徐金龙
妇婴疾病诊断相关组的构建与比较研究*
广东省妇幼保健院(510010) 韩 栋 魏凌云△章 莹 徐金龙
目的本研究拟建立妇婴疾病诊断相关组(women&infant-diagnosis-related groups,W I-DRGs),并与CN-DRGs、MS-DRGs和AR-DRGs等代表性DRGs体系的分组效率进行比较,以初步评价和改进W I-DRGs。方法采用定性研究(专题组讨论、Delphi法等)与定量研究(线性回归、决策树等)相结合的方法,采用广东省某三级妇幼医院的妇婴专科住院患者资料建立W I-DRGs分组。同时比较W I-DRGs、CN-DRGs、MS-DRGS和AR-DRGs的分组效果。结果WI-DRGs系统费用变异减少(reduction in variance,RIV)为0.596,变异系数(coefficient of variation,CV)为0.10~0.54,平均住院日RIV为0.389,CV为0.02~0.22。W I-DRGs在妇婴疾病分组方面较优。结论WI-DRGs组间异质性和组内同质性较好,具有一定的科学性和实用性,但仍需扩展研究样本来源,引入更高效的分组变量和算法,以获得更有力的证据支持。
诊断相关组 妇婴 CN-DRGs MS-DRGs AR-DRGs 比较研究
DRGs(diagnosis-related groups)最初由美国耶鲁大学于上世纪60年代建立,以用于医疗质量监督的目的,1983年Medicare将DRGs应用于住院服务PPS,估计由此每年约节约170亿保险支付。之后,各国借鉴美国经验开展了DRGs相关研究和应用,目前在美国、澳洲、欧盟等国已广泛使用,在控制卫生费用,缩短平均住院日,提高卫生资源使用效率,提高卫生服务公平性等方面发挥了积极的作用。我国DRGs研究起步较晚,可比性较强且得到应用的研究主要有CNDRGs。但系统性的妇婴专科DRGs研究和应用则未见报导。因此,为了应对妇婴专科DRGs的差异远大于其他组别的问题,也为了切实推进《中国妇女发展纲要》和《中国儿童发展纲要》,本文拟探讨妇婴DRGs分组的构建与评价,从而利用DRGs优化妇幼卫生服务和提高妇幼卫生资源使用效率。
方 法
1.数据采集
收集某三级妇幼医院2008年1月1日至2014年12月31日共计172170例妇、产、婴相关专科住院患者病案首页及其他相关数据,其中2008-2012年数据作为训练样本用于建模,2013-2014年数据用于测试。具体分组变量包括患者基本资料、住院总费用(其中产妇和产婴费用进行分离)、住院日、主要及其他诊断、主要及其他手术操作、新生儿体重、胎龄等信息。
2.数据预处理
数据预处理措施包括:逻辑核查,核查内容包括缺项、漏项、性别冲突、年龄冲突、编码冲突(例如无效或错误诊断、操作)等;数据质量抽查,以确保数据的完整性和准确性;住院日和费用标准化转换,极值处理(剔除超过均数±3倍标准差以外的费用)和住院日等。经过预处理实际纳入研究的数据共计为2008-2012年99300份和2013-2014年68881份。年龄描述采用均数±标准差,总费用与住院日采用中位数(25百分位数~75百分位数)描述。
3.分组方法
主要诊断组(major diagnosis category,MDC)国内外基本一致,本研究直接参照。ADRGs(adjacent DRGs)和DRGs分组充分考虑在统计差异的基础上保证临床一致性,采用决策树模型和专家组评议结合的方法。
其中决策树采用多变量(本研究采用2个因变量,住院总费用和住院天数)回归树(multivariate regression tree,MRT)和条件推断决策树(conditional inference trees,CIT)。MRT是对决策树经典算法CART在多个因变量情况下的推广,与CART具有相似的优点,而CIT则是在条件推断架构下进行递归二叉树分割,可以解决目前决策树过拟合与选择偏倚的问题。父节点的样本量大于500时进行拆分,子节点小于100时分组才可进行,不限定树的深度。分组条件设定为最大RIV(reduction of variance)>0.4、变异系数<1.00[1]。为了保证分组的临床与保健意义,统计分组需经过专家组评议。分组变量探索由统计分组与专家分组迭代进行。详细分组过程参见《妇婴疾病诊断相关分组模型研究》一文[2]。
4.评价
DRGs组内同质性评价方法通常采用变异系数(coefficient of variation,CV)进行评价,CV表示组内同质性。数值越小,表示组内同质性越高。计算公式如下
DRGs组间比较最常用的指标是RIV。RIV表示DRGs分类系统可以解释个体变异的比例,同时RIV也表示DRGs系统基于个体信息对于医疗资源消耗的预测能力。RIV的计算公式为
其中,yi为第i个病人的指标值(费用或住院日),A是所有病人的指标的平均值,Ag为yi所在的DRGs分组为g的平均费用或平均住院日。RIV的取值范围为0~1,0表示分组划分对分组轴心的变异毫无解释作用,1表示分组划分可以完全解释分组轴心的变异。本研究采用W I-DRGs、CN-DRGs、MS-DRGs、ARDRGs分组逻辑(详见《妇婴诊断相关组进展及分组研究探讨》一文[3])对2013-2014年住院资料进行分组,并比较上述DRGs费用和平均住院日RIV。
结 果
1.W I-DRGs分组结果
MDC13中患者平均年龄36.48±10.73岁,中位住院日为6天,中位总费用为13137.00元(见表1)。分组变量主要包括主要诊断、手术(还包括是否腹腔镜)、肿瘤、并发症或合并症(complications and comorbidities,CCs)。分组后费用与住院日RIV分别为0.695和0.438。费用CV:0.02~0.10优于住院日CV:0.10~0.40。手术组平均费用和住院日最高的为P02盆腔清扫与切除—无腹腔镜组,达34613.94元和19.66天,非手术组平均费用和住院日最高的为P13女性生殖系统肿瘤—无OR,分别为6538.49元和5.75天。
MDC14中患者平均年龄29.59±4.92岁,中位住院日为4天,中位总费用为4674.20元(见表1)。分组变量主要包括主要诊断、手术、年龄与有无腹腔镜(异位妊娠组)。分组后费用与住院日的RIV分别为0.481和0.201。费用组内CV:0.02~0.11优于住院日CV:0.22~0.54。手术组费用最高的为O03异位妊娠—有腹腔镜组,平均13198.54元,住院日最大的组为O01:剖宫产—年龄>35岁,平均为6.43天。非手术组费用最高为O15流产—无手术—有CC,平均为4331.27元,住院日最大的组为O09先兆流产—有CC,平均住院5.68天。
MDC15中患者平均年龄2.89±5.568天,中位住院日为3天,中位总费用为3858.58元(见表1),其中男性8207(58.84%)例,女性5741(41.16%)例。分组变量仅纳入了体重、新生儿疾病或手术等。分组后费用与住院日的RIV分别为0.503和0.430,费用组内CV:0.04~0.22,住院日CV:0.16~0.37。费用最高和住院日最长的组均为N02体重≤1.25kg,达61420.75元和34.5天。W I-DRGs的分组结果达到DRGs应用的条件(RIV>0.4和最大CV<1.0)[1-2]。
表1 W I-DRGs各MDC基本信息描述
2.W I-DRGs与其他DRGs比较
因各系统DRGs的分组轴心以费用为主且费用的同质性通常优于住院日,因此,费用的RIV均高于住院日。W I、CN、MS和AR的三个MDC总费用RIV分别为0.596、0.458、0.510、0.552,而平均住院日RIV分别为0.389、0.313、0.319和0.410。女性生殖系统疾患(MDC13/MDCN)的费用RIV,WI-DRGs达到0.695,均高于其他三组。CN-DRGs亦高于MS和AR的费用RIV。妊娠、分娩及产褥期(MDC14/MDCO)W I-DRGs与CN-DRGs的费用RIV相近,均略高于MS-DRGs和AR-DRGs。新生儿及其他围产期新生儿疾病(MDC15/MDCP)的分组中,MS的费用和LOS的RIV均最少,WI和AR的主要分组变量为新生儿入院体重,划分结果相对较好。各系统DRGs费用和住院日的RIV见表2。
表2 各DRGs系统费用及住院日RIV
讨 论
对分类模型的整体评价一般包括模型的稳健性(robust)、组间差异性(例如RIV等)、组内一致性(例如CV、QCD等)。随着组数的增加,任何的分类系统都可以达到一个较高RIV值。当病人数等于分组数时,RIV值等于1。由于MS-DRGs、AR-DRGs和W IDRGs的DRGs组数有所不同,所以各系统RIV的差异有可能来源于组数的不同。因此可采用Feldman的方法[4]衡量分组数对RIV的影响,随机将N个对象分入K组中。各DRGs系统详见表2,结果为0.00067~0.00110,因此本研究由于分组个数导致的差异可以忽略,RIV的差异来源主要来自于各DRGs系统的分组规则差异。Palmer等[1]的研究表明剔除异常值的影响后,各DRGs住院日RIV在0.286~0.606,费用RIV在0.412~0.632。Wynn等[5]指出纳入CCs分级后RIV由0.352~0.366提升至0.4243~0.4458。
在DRGs建模方法学方面,自最初的DRGs研究开始一直主要采用线性或广义线性模型,各DRGs的改进主要体现在CCs的选择范围、选择方法及累计效应的算法。2015年7月开始澳大利亚实施了新的AR-DRG V8.0[6]。V8.0对卫生服务的输入与产出进行了更明晰的定义,对原线性模型进行了较大改进,不再使用住院日而只用费用进行分组。将原PCCL模型替换为ECC(episode clinical complexity sore)模型。CCs单位由DCL(diagnose complexity level)替代CC level(CCL),复杂性累积效应由ECCS(episode clinical complexity sore)替代PCCL。其中CCLs取值0~4,DCLs取值0~5。PCCL取值0~4,ECCs取值0~31.25。DCL由广义线性模型,采用渐进衰减因子计算获得。最终V8.0取消了住院日、入院病情、死亡结局等直接分组因子,含403个ADRGs和804个DRGs,目前该模型仍处于改进中。
此外,随着DRGs方法学的进展,决策树模型在DRGs建模方面的应用也逐渐扩展。英国的卫生资源分组(HRG)采用了CART。Grubinger等[7]使用Bootstrap对奥地利的CART分组方法进行了改进,不同大小决策树的均方误改进效果达1.09%至4.90%。阎玉霞[8]利用AID方法及分类变量将内科病例组合形成603组,外科病例605组。本研究的W I-DRGs[2]采用多变量回归树和条件推断决策树,同时对费用和住院日数进行分组,并经专家组评议(Delphi法)。W IDRGs的研究方法与上述方法比较一致。但国内高健民等[9]、何凡[10]、阎玉霞等[8]的研究从MDC到ADRGs范围与方法均与国际上常用方法及本研究具有较大的差异。
[1]Palmer G,Reid B.Evaluation of the performance of diagnosis-related groups and similar casemix systems:methodological issues.Health Services Management Research,2001,14(2):71-81.
[2]魏凌云,韩栋,徐金龙,等.妇婴疾病诊断相关分组模型研究.长治医学院学报,2015,2(2):116-119.
[3]魏凌云,韩栋,徐金龙,等.妇婴诊断相关组进展及分组研究探讨.现代预防医学,2015,42(15):2734-2737.
[4]Averill RF,Muldoon JH,Vertrees JC,et al.The evolution of casemix measurement using diagnosis related groups(DRGs).Wallingford:3M Health Information Systems,1998.
[5]Wynn BO,Beckett MK,HILBORNE L,etal.Evaluation of Severity-Adjusted DRG Systems.Interim Report to the CMS(Santa Monica,Calif.:RAND,2007),2007.
[6]National CACC,Australian HSRI,University OW.AR-DRG:Australian refined diagnosis related groups,version 8.0,definitionsmanual.Wollongong,N.S.W.:University of Wollongong,2014.
[7]Grubinger T,Kobel C,Pfeiffer KP.Regression tree construction by bootstrap:model search for DRG-systems applied to Austrian healthdata.BMC Med Inform Decis Mak,2010,10(1):1-11.
[8]阎玉霞,徐勇勇.病例组合分类结果的评价.中国卫生统计,2007,24(2):163-164.
[9]高建民,郑古峥玥,詹梅,等.疾病诊断相关分组分类节点变量的选择及其分组结果的合理性评价.中国卫生经济,2013,32(1):16-18.
[10]何凡,沈毅,刘碧瑶,等.浙江省住院病人病例组合研究.中华医院管理杂志,2006,22(7):460-464.
(责任编辑:邓 妍)
广东省自然科学基金资助(项目编号:S201210008269);广东省科技计划项目资助(项目编号:2014A040401042)
△通信作者:魏凌云,E-mail:1719076809@qq.com