APP下载

四川省三级医院慢性阻塞性肺疾病患者参加医疗保险类型与其住院时间的关系
——基于分位数回归模型的实证分析

2018-03-04蔡瑞烈潘

中国卫生政策研究 2018年11期
关键词:位数医疗保险住院

蔡瑞烈潘 杰

四川大学华西公共卫生学院 四川成都 610041

1 引言

慢性阻塞性肺疾病(COPD)是一种以气流阻塞为特征的常见慢性疾病,主要表现为慢性支气管炎和(或)肺气肿[1],严重影响患者的劳动力和生活质量。COPD患者人数众多,2000—2014年我国40岁以上成人COPD患病率为8.4%~10.1%。[2]在我国所有疾病中,COPD的疾病经济负担位列第四。[3]在如此高患病率和高负担的情况下,COPD患者对医疗资源的利用效率显得格外重要。

平均住院日作为三级医院评审的核心指标之一[4],是衡量一家医院医疗质量和管理水平的重要指标,综合反映住院患者使用医院医疗服务的水平。过长的住院时间不仅增加患者的经济和精神负担,还会浪费宝贵的医疗资源。[5]在床位紧缺的三级综合医院,平均住院日通常难以受患者主观因素决定,因此其一定程度上反映了医院是否存在过度提供医疗服务的情况。

基于以上背景,本文的研究问题是: 不同参保方式的COPD患者医疗服务资源的利用有无差别,医院是否对一些参保类型的患者存在过度提供医疗服务的情况?目前国内外大量学者已对住院时间或者医保参保类型进行研究。如研究不同疾病患者或不同特征患者住院时间的影响因素。[6]部分研究在讨论住院时间时,没有考虑住院时间数据呈现正偏态分布的特点,盲目使用正态分布假设下统计描述和统计推断方法,做出不恰当推断。因此,有学者建议在研究中使用中位数描述住院日的平均水平。[7]研究住院时间和参保方式的文献多采用构成比分析和单因素分析,不能有效控制其他混杂因素的影响,如疾病因素。多因素分析的研究使用的方法多为最小二乘法回归或logistic回归,只能估计相关因素的平均效应。对于研究结论,多数研究认为医保患者比未参保患者的住院时间更长,但也有研究发现参保降低平均住院日。[8]目前,医疗保险对平均住院日的影响尚存争议。另一方面,国外文献相比国内文献研究更为深入,主要定量分析某种治疗方法[9-10]或某一特定疾病[11]住院时间的各种影响因素,以及不同医院类型住院时间差异[12],使用方法也不局限于描述性分析和单因素分析,使用了包括Poisson回归、广义线性回归、分位数回归等更多类型的定量分析方法,但相关研究对象往往仅限于某一家医院患者,难以避免具体医院的选择性偏倚。目前,尚未见对住院时间与医疗保险类型关系展开系统研究的文献。

本研究使用四川省全省住院病人信息,运用分位数回归方法,研究COPD患者参保方式与住院时间的关系,为医院提高医疗质量和管理水平,以及医疗保险支付方式的完善提供参考。

2 资料和方法

2.1 资料来源

数据来源于四川省西医医院病案首页数据,时间为2016年第四季度。研究对象为三级医院中入院诊断为COPD的患者(ICD-10编码为J44),共计40 984例,剔除住院时间为0、参保方式缺失、转院和再住院、性别缺失观测的病例,最终得到总样本36 329例,提取患者的住院信息,包括病人的人口学特征和住院情况,如性别、年龄、现住址、参保方式、出入院情况和并发症等,此外,还结合统计年鉴数据,收集患者所在医院的相关特征。

本研究的因变量是住院时间(LOS),反映患者医疗服务利用时间的长短,在纳入观测时,剔除了住院时间为0的观测值(3例)。对于本研究关注的自变量,即参保方式,共计包括8种,鉴于样本量的因素,将医疗救助、商业医疗保险和其他社会保险合并为其他医疗保险,同样,剔除了参保方式缺失的观测值(2 112例)。综合上述的研究和机构的信息[13- 16],本研究最终纳入的控制变量有性别、年龄、职业、疾病严重程度、离院方式、手术、输血、感染、医院等次、医院床位数、医院类别、医院经济类型(表1)。

表1 各变量定义及统计描述表

(续)

注:SD(Standard Deviations)指标准差

四川省不同市/县的经济发展情况、医疗卫生服务能力、医疗卫生质量是存在差异的,这些因素是会影响患者住院时间的,为了解释这些因素的原因,加入了按地级市及地级市辖县划分的地区哑变量,共28个,以识别可能存在的固定效应。

还有其他研究提示教育程度和收入也可能影响患者住院时间[17],理论上,也应该纳入这些控制变量,但是这些信息无法获取。此外,转院的患者和再住院患者的住院时间应该比数据显示的更长,但是由于无法获取转院之后的信息以及无法识别再住院后的观测,所以这部分患者也被剔除 (2 539例)。

2.2 分析方法

2.2.1 分位数回归

传统的线性回归模型通常估计自变量和整个范围的因变量之间的关系,即自变量X对于因变量Y均值的影响。其中最基本的方法是使用普通最小二乘法(OLS)来估计回归系数,如果满足高斯—马尔科夫假定,那么回归系数的最小二乘估计为最优线性无偏估计(BLUE),如果进一步误差服从正态分布,那么回归系数为最小方差无偏估计(MVUE)。[18]但是实际中,这些假设往往很难完全得到满足,此时最小二乘将不会得到上述优良性质,且稳健性会很差。为了弥补普通最小二乘(OLS)在回归分析中的缺陷,Koenker和Bassett(1978)提出了分位数回归的思想。[19]

对于随机变量Y的一个随机样本{y1,y2,y3,…,yn},它的中位数线性回归一般采用最小一乘(least absolute, LA)准则,或最小绝对偏差和(minimum absolute deviations)[20],即:

minξ∑yi-ξ

(1)

记Y的第τ分位数为Q(τ)=infy:F(y)≥τ,中位数回归其实是分位数回归的特例(τ=1/2),而τ分位数的样本分位数线性回归则是要求满足:

(2)

其中对于任意0<τ<1,检验函数ρτ(μ) 为:

(3)

所以(2)式的展开式为:

τ∈(0,1)

(4)

在线性条件下,给定x后,Y的τ分位数函数为:

Qy(τ|x)=x′β(τ)τ∈(0,1)

(5)

对于不同的分位数τ,都能得到一个分位数函数,因此随着τ从0到1,就能得到y在x上的条件分布的轨迹,即一簇曲线,而不像一般线性回归只得到一条曲线。[21]

由此可见,百分位数回归其实是一种加权最小一乘(weighted least absolute, WLA),其优点表现为以下几个方面: (1)它对模型误差项不做任何假定,μ不需要服从正态分布,整个回归模型就具有很强的稳健性,这也正是它相较OLS的优势。(2)分位数回归没有使用一个连接函数来描述因变量均值和方差的相互关系,因此它具有较好的弹性性质。(3)分位数回归是对不同τ值下一系列的回归,对数据中的异常点具有良好的抗性。(4)不同于OLS,分位数回归对因变量具有单调变换性。(5)分位数估计出来的参数具有在大样本理论下的渐进优良性。[19]

因此,根据纳入的变量,本研究构建的分位数回归方程为:

(6)

其中,LOS代表住院时间,α代表截距,insurance代表参保方式,controls代表控制变量,包括性别、年龄、职业、疾病严重程度、离院方式、是否手术、是否输血、是否感染、医院等次、医院床位数、医院类别、医院经济类型、地区,τ代表分位数,ε代表误差项。

2.2.2 分位数分解

本研究采用Machado和Mata(2005)所使用的分解工资分布变化的方法(MM2005)。[22]这种方法是在条件分位数回归的基础上,借助概率积分转换得到边际密度函数的一致估计,再通过随机替换构造反事实分布,以解释产生差异的成因。

(7)

等式右边第一项由于研究问题的不同在工资性别差异分解中被称为“回报影响(return effect)”[23]或“性别歧视”[24],在本研究中,它表示由于参保方式不同所导致的患者住院时间差异部分,即“医保影响”; 等式右边第二项则是“变量影响(covariate effect)”,它表示不同分位数下由于随机抽样的样本变量分布不同所导致的住院时间差异部分。

3 结果

3.1 描述性分析

本研究样本量大小为36 329人,住院时间均值为11.86天,中位数为10天,各变量的描述性统计结果详见表1。对住院时间分布使用k-s法进行正态性检验,P<0.001,故住院时间不服从正态分布。对住院时间取对数后,按不同参保方式,绘制人口分布密度图(图1)。可见城镇职工基本医疗保险、城镇居民基本医疗保险和新型农村合作医疗患者分布较集中且形状类似,但是新农合患者曲线最靠左,城职保患者的曲线最靠右,说明新农合患者的住院时间总体偏低,城职保患者的住院时间总体偏高,城居保患者居中; 对于全公费患者,其人口密度最高点对应的住院时间和前三种相近,但是高住院时间的人口密度明显高于前三种,拖尾情况明显。

图1 各参保方式患者住院时间样本分布

3.2 回归分析

基于式(6),建立住院时间与参保方式及各协变量的分位数回归,各分类变量分别以新型农村合作医疗、男性、疾病不严重、医嘱离院、未手术、未输血、未感染、甲等医院、综合医院和公立医院为对照,回归系数见表2。其中模型(1)是只纳入了参保方式的简单回归模型,模型(2)是同时纳入了控制变量的全模型。中位数回归(τ=0.5)的结果显示,参保方式效应值最大的是全公费(1.480),其次是城镇职工基本医疗保险(1.178),表示在控制其他因素的情况下,全公费患者和城镇职工基本医疗保险比新农合患者在0.5分位数下住院时间多1.480天和1.178天。随着分位数的增加,各参保方式的系数均呈现上升趋势。而在各个分位数下比较模型(1)和模型(2),可以发现参保方式系数符号相同,大小相近,随分位数增加系数增加趋势相同,说明模型比较稳健; 此外,各分位数下模型(1)的系数普遍略大于模型(2)的系数,说明参保方式可能与各控制变量存在一定的正相关关系。

表2 分位数回归系数表

注:a分位数回归估计值,标准误估计使用bootstrap法b普通最小二乘估计值*、**、***分别表示P<0.05、P<0.01、P<0.001

通过建立各分位数下回归模型,得到各变量在各分位数下的系数变化情况,见图2(截距项被省略)。可以看出,除了性别为女性的曲线呈明显下降趋势,其他各变量的估计值随着分位数的增大,均呈现不同程度的上升趋势。参保方式中,全公费、全自费和其他医疗保险,在低分位数时估计没有统计学意义,而在中、高分位数有统计学意义; 在0~0.5分位数下,各参保方式估计值上升速度较慢,曲线平坦,而在0.5~1分位数下,各估计值上升速度快,曲线陡峭。此外,OLS估计值普遍与条件分位数为0.8附近的估计值相近,体现出了OLS估计不能全面稳定的描述参保方式的效应的变化情况,而在本研究中高估了其效应值。

通过分位数回归模型,还能计算出调整了控制变量后不同参保方式在不同分位数下的住院时间的估计值(图3)。可见各参保方式患者住院时间确实存在差异,全公费的住院时间最长,且在0.5~0.75分位数间与其他各参保方式差距最大; 城镇职工基本医疗保险、城镇居民基本医疗保险和新型农村合作医疗的曲线趋势类似,但是新型农村合作医疗的住院时间最少,甚至比全自费和其他医疗保险患者的住院天数更少。各参保方式住院时间随分位数上升速度特点为,0~0.5分位数间上升速度慢,0.5~1分位数间上升速度快,与系数估计值变化的结论相符。

注:限于篇幅有限,此图以参保方式为例图2 变量系数估计值变化图

图3 各参保方式患者住院时间在不同分位数下的分布

从图3可以看出,新型农村合作医疗患者的住院时间最短,与其他参保方式存在差异,那么,这种差异是由于不同参保方式的样本不同引起还是由于参保方式不同引起的,为了解决这个问题,分别对新型农村合作医疗与城镇职工基本医疗保险、城镇居民基本医疗保险和全公费医疗的差异进行了分解。通过构建反事实分布,将差异分解成两部分,即“医保差异”和“变量差异”(表3-表5)。各参保方式随分位数增加,总差异增加,医保影响占总差异百分比即医保影响度也在增加,而变量差异增加较少或趋于稳定,故变量影响度反而减少,而在极高分位数下,样本之间差异明显增大,变量影响占总差异比例相比中高分位数有所升高。全公费医疗和城镇居民基本医疗保险平均医保影响度在70%~80%左右,受样本影响度在20%左右,而城镇职工基本医疗保险平均医保影响度在60%左右,可见城镇职工基本医疗保险与新型农村合作医疗的差异大部分也是由医保不同造成的,但是相比全公费和城镇居民基本医疗保险,医保的影响度稍低。

表3 新型农村合作医疗和全公费医疗住院时间分解

注:aCI(Confidence Interval)置信区间,通过bootstrap计算

表4 新型农村合作医疗和城镇职工基本医疗保险住院时间分解

注:aCI(Confidence Interval)置信区间,通过bootstrap计算

表5 新型农村合作医疗和城镇居民基本医疗保险住院时间分解

注:aCI(Confidence Interval)置信区间,通过bootstrap计算

4 讨论

通过对住院时间建立各影响因素的分位数回归模型,可以看出对住院时间影响较大的几个因素是参保方式、离院方式死亡、是否手术、是否输血,这些因素的效应值较大,而且随着分位数增加的变化程度也较大。在其他因素一定的情况下,进行了手术的患者和进行了输血的患者的住院天数比没有进行的在不同分位数下高1~6天,效应呈递增趋势,因为当COPD患者需要进行手术或者输血时往往是由于急性感染等出现了并发症,这时患者需要更多的医疗服务利用以及更长的住院治疗时间,所以它们是住院时间的重要影响因素。对于离院方式死亡,其系数呈先下降后上升的趋势,符号在低分位数时为负,在高分位数时为正。说明在低分位数时,即住院时间较短时,死亡患者比医嘱离院患者有更少的住院天数,因为住院时间较低的死亡患者往往病情较急,还没有利用足够的医疗服务就发生了死亡结局,故住院天数更短; 而在高分位数时,即住院时间较长时,死亡患者比医嘱离院的患者有更多的住院天数,因为作为慢性病,COPD患者在长期住院过程中由于一直没有好转导致死亡结局,所以死亡患者比好转后医嘱离院患者会接受更多的治疗和服务,故住院时间会更长。由于离院方式是一个重要的住院时间影响因素,其中涉及患者治愈、好转、未治愈和死亡等状态,所以有研究也建议可用生存分析的方法研究住院时间。[25]

参保方式中,城镇职工基本医疗保险和城镇居民基本医疗保险在各分位数下均有统计学意义,说明不管住院时间长或短,城职保和城居保患者都比新农合患者利用更多医疗服务; 全公费、全自费和其他医疗保险在低分位数下没有意义,在高分位数下有统计学意义,说明在住院时间较短时,全公费、全自费、其他医疗保险和新农合患者卫生资源利用情况相同,没有差异,但在住院时间较长时,新农合患者的住院服务利用度较低。

在新农合和全公费、城镇职工医保、城镇居民医保住院时间差异上,随着分位数增加,新农合与其他参保方式的差异呈递增趋势且有统计学意义,分解出的“医保影响”占总差异的大部分,说明排除了各样本变量分布差异的影响后,医保差异仍然是造成住院时间差异的主要因素。在极高分位数下(τ=0.9),“变量影响度”有一定程度的上升,说明作为样本分布的极端边界,住院时间极长的患者间的样本差异是较大的。

在调整了其他因素后全公费住院时间最长,新农合最短,在中高分位数下,新农合甚至比全自费、医疗救助和其他社会保险更短。其中可能的原因包括患者存在医疗服务利用不足或过度利用,医院存在提供服务不足或过度提供,以及不同医疗保险的主办方监管力度不同。如果以全自费的患者为对照,假设医院考虑到患者没有医保报销,所以不会给全自费患者进行过量的诊疗服务。在控制了疾病相关因素后,全公费、城职保、城居保患者的住院天数仍然高于全自费,而患者很难自发延长自己住院时间,说明医院存在提供过度医疗服务的情况,而且对不同参保方式患者提供的过度医疗量不同,在住院时间较短患者中主要对城镇职工医保和城镇居民医保患者提供过度医疗,在住院时间较长的患者中主要对全公费和城职保患者提供过度医疗服务。而新农合患者的住院时间短于全自费,可能是由于新农合患者住院费用通常比城职保和全公费低的,故医院为了最大化经济效益,选择将新农合患者的床位转移给住院费用更高的全自费和城职保患者。这是一个较保守的假设,因为如果假设不成立,即医院会向全自费患者提供过度医疗,那么向全公费、城职保等患者提供过度医疗的情况将会更严重。除此之外,新农合的基金池压力大,城镇居民医保和城镇职工医保等保险的基金池压力较小,使得各医保主办方对医院的监管力度不同,从而也可能导致新农合与各医疗保险住院天数产生差异。

目前,医疗保险费用结算的方式大多采用的是总额控制下的按医疗服务项目付费的后付制。由于是后付制度,如果缺乏有效的制约机制,可能极大地刺激过度消费,诱使医院利用医患双方信息不对称提供过度医疗服务,对平均住院日的缩短产生负面影响。目前国外已有一些地区的医院尝试通过罚金的方式制约这种过度消费,但是Tor Helge等通过一项自然实验研究发现,使用罚金反而会增加患者的住院时间。[26]因此,为了消除这种过度消费,应当实施支付方式改革,建立总额预付制度。

本研究的分析方法是基于分位数回归模型的实证分析,尽管是一种相关关系的分析方法,不能回答因果关系,但结合本研究的具体内容,结果也有一定的因果含义。参保状态可以影响住院日,但一个人的参保状态很难由住院日来决定。此外,本研究也没有较明显的内生性问题。本研究的不足之处在于,患者教育程度和收入可能是住院时间较为重要的两个影响因素,但是由于本研究数据的限制,无法获取,可能会对参保方式系数的估计产生遗漏变量偏误,但是本研究纳入了地区哑变量,可以一定程度弥补收入等经济因素带来的问题。由于病案首页上医疗付款方式为单选,代表报销所用的参保方式,但是实际上一名患者除了参保基本医疗保险以外还可能参保其他非基本医疗保险,因此,医疗救助、商业医院保险对象往往会和新型农村合作医疗、城镇居民基本医疗保险和城镇职工基本医疗保险存在一定的重叠,而从现有数据中无法识别,但是本研究中参保方式关注的正是患者报销用的参保方式,可能患者参保了某种基本医疗保险但是报销使用的是其他医疗保险,而这个报销用的保险才是影响患者住院时间的因素。此外,本研究只纳入了四川省全部三级医院第四季度的患者,不同参保方式在不同等级医院和不同季度的关系和住院时间差异上是否有所不同,需要更进一步的研究。

作者声明本文无实际或潜在的利益冲突。

猜你喜欢

位数医疗保险住院
妈妈住院了
昆明市2012~2020年HIV/AIDS住院患者的疾病谱
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
精神病人住院自缢 医院担啥责
“三医联动”下医疗保险新走向
中国商业医疗保险的增长轨道
降低医疗保险拒付率
Alzheimer’s patient’s heart doesn’t forget a mother’s day tradition
遥感卫星CCD相机量化位数的选择