我国医疗服务效率的统计测度和区域差异比较研究*
——基于随机前沿模型
2022-06-08栾芸芸舒燕
栾芸芸,舒燕
(广州中医药大学公共卫生与管理学院, 广东 广州 510006)
随着各国政府医疗投入的不断增多,医疗服务的公平性和可及性问题得到了显著改善,医疗服务的效率性问题则逐渐成为了人们关注的焦点。由于我国为加快医疗保险的发展速度,实行了“赶超型”的发展模式,这使得我国基本医疗服务的公平性和可及性得到快速提高,但医疗服务的效率问题则长期被忽视。自2009年的“新医改”以来,我国各级政府和社会资本的卫生投入越来越多,根据《中国卫生健康统计年鉴》数据显示,我国政府卫生支出从2009年的4816.26亿元增长到2019年的18016.95亿元,年均增长率为15.78%,但“看病贵、看病难”的问题仍然没有得到根本解决[1]。医疗投入的大量增加提升了卫生服务的公平性,但如何能具有高效率则成为了一个新问题。在经济高质量发展阶段,医疗资源的有限性和医疗需求的无限扩张仍然是突出矛盾,单纯依靠政府和社会持续大规模提高卫生投入来提高居民健康水平并不现实,因此,提升医疗服务效率具有重要的理论和现实意义。
1 文献综述
Farrell(1957)率先提出了生产效率的概念,即是由决策单元的技术效率乘以配置效率[2]。Eatwell(1996)把技术效率定义为一个生产单元在既定的投入要素价格和技术条件下,可以获得的最大产出能力。Pigou早在1920就提出了配置效率概念,指的是既定投入要素价格和技术条件下,一个生产单元合理配置生产要素的能力。国内外学者们围绕医疗服务和生产效率做了许多有益的探索,主要的研究成果集中于以下几个方面:
1.1 医疗服务效率的评估
国内外学者们对医疗服务效率的评估研究多集中于在评估维度和指标、评估对象、评估方法等方面。在评估维度和指标研究方面,世界卫生组织(WHO)从健康水平、人口情况、资源配置、卫生需求满足度、政府卫生支出维度提出了卫生系统评估体系。世界经合组织(OECD)的卫生服务质量评估体系则包括4个维度:投入、产出、效率和公平。Abatermarco et al.(2020)从使用平等、按需分配、获得平等、健康平等等方面进行了医疗卫生服务均等化的评估研究[3]。在评估对象方面,多数文献都集中于微观层面的研究,以医院和医疗卫生机构等微观视角的研究最多,如崔爽等(2008)、董四平等(2014)的研究。申曙光和郑倩昀(2017),[4]俞佳立等(2020)则从宏观层面对中国的健康服务生产效率进行了研究[5]。在评估方法方面,国内外学者多运用参数方法和非参数方法进行生产前沿面研究。在参数方法方面,考虑到统计噪音和随机扰动等因素,运用随机前沿方法(SFA)对医院、基层医疗机构的效率研究较多(Michael,2004;王昕天,2014)。在非参数方法方面,一般的文献研究多采用数据包络分析法(DEA)和自由处理壳分析法(FDH)。Pina V&Torres L(2008)运用DEA方法评估和研究了非盈利医疗组织的生产效率;于本海等(2021)运用三阶段DEA方法测算了我国医疗卫生服务体系的效率。[6]
1.2 医疗服务效率的影响因素
国内外学者对医疗服务效率的影响因素研究多集中于宏观和微观方面,以微观研究的成果居多。在微观层面的影响因素研究中,学者们关注的焦点多集中在医院规模、医院所有权类型、医院区位、医院产出和市场结构等方面(Sang et al.,2018;[7]Pan et al.,2015;Abolghasem et al.,2017;[8]杜涛等,2017;[9]庞瑞芝等,2018[10])。在宏观层面的影响因素研究中,学者们多研究经济、社会和政策等对医疗服务效率的影响。Bjorvan(2018)以1999-2006年挪威医疗行业数据为样本,研究医疗市场的竞争程度对服务效率的影响[11]。丁姿等(2018)以2010-2016年中国省级数据为样本,分析了医疗服务供给结构对医疗服务效率的影响[12]。于明远(2021)运用DEA方法测算了中国医疗行业的生产效率,从医疗制度、技术、管理、竞争等方面研究其对医疗行业生产效率的影响机制[13]。
梳理国内外的相关文献,我们发现国内外学者对医疗服务效率问题进行了许多研究,但在研究视角和效率的测度方法方面仍存在较大的提升空间。已有研究多集中于医疗卫生体系的某个层级,如公立医院的效率等,对医疗服务效率的宏观研究较为薄弱;在医疗机构的效率测度上多采用“两步法”的分析框架,先测度生产效率,再运用回归分析影响因素,这可能会降低生产效率测算值的可靠性。综上所述,本文选取中国31个省市2010~2019年的数据为样本,运用熵值法确定医疗服务产出,通过随机前沿模型(SFA)分析其影响因素并进行效率测算,探索其区域差异。
2 研究方法和变量选择
2.1 研究方法
2.1.1 熵值法
熵值法源于信息学,是一种客观赋权重的方法。该方法基于“差异驱动”原理,根据同一指标的观测值差异程度来计算该指标的权重,并进行赋权。较之主观赋权法,熵值法的可信度更高。
假设Xij(i=1,2,…,n;j=1,2,…m)是第i个样本的第j个指标观测值,那么,熵值法的计算步骤如下:
(1)数据标准化处理,确定指标比重
(1)
式(1)表示在n个样本、m个指标中,第j项指标下第i个样本所占的比重,其中,i=1,2,…,n;j=1,2,…,m。
(2)计算指标熵值
(2)
(3)计算差异性系数
gj=1-ej
(3)
由式(2)可知,当j既定时,Xij的差异越小。当gj越大,该指标的权重就越大。
(4)计算指标权重
(4)
其中,j=1,2,…,m,wj是各指标的权重系数,总和为1。
(5)计算指标的总和得分
(5)
2.1.2 随机前沿模型(SFA)
借鉴Wang和Ho(2010)的固定效应随机前沿模型,为保证医疗服务效率模型的客观性和精准性,构建随机前沿模型,如式(6)所示。
LnOutputit=α0+α1LnJSit+α2LnHSit+α3LnBSit+νit-μit
(6)
在式(6)中,Outputit表示第i个样本t年的医疗服务产出,该值由熵值法计算所得;其余变量见表1。
2.1.3 非效率影响因素模型
μit=β0+β1LnPGDPit+β2LnDPit+β3LnGEit+β4LnOSit+β5LnNMKit
(7)
2.1.4 效率计算公式
借鉴Battese&Coelli(1992)的研究,医疗服务效率的计算公式如(8)所示,其取值范围在[0,1]:
Eit=exp(-μit)
(8)
2.2 变量选取和数据来源
2.2.1 变量选取
(1)医疗服务投入指标
医疗服务的投入一般多从人、财、物三个方面进行衡量,借鉴Murray&Frenk(2008)的研究,本文选取卫生技术人员数量、医疗机构数量、每千人口医疗机构床位数三个指标。Grossman(1972)的研究指出,医疗卫生支出是医疗行业最主要的投入要素之一,考虑到医疗服务的资金投入往往涵盖了部分技术人员引进的资金投入和医疗设备采购等的资金投入,与现有的投入指标可能存在重复计算问题,因此医疗服务投入指标仅计算人力资本投入和物质资本投入。为充分考虑各区域医疗服务供给的效率差异,选择医疗机构数量和每千人口医疗机构的床位数来衡量医疗服务的物资资源指标。
(2)医疗服务产出指标
现阶段的医疗服务主要包括门诊服务和住院服务,刘海英(2015)用诊疗人次和住院人数来表示医疗服务产出;[14]Flokou et al.(2017)选择了门诊诊疗人次、手术人次、住院人数作为产出指标;[15]于明远(2021)选取医疗卫生机构诊疗人次、出院人数来表示医疗服务的产出变量。鉴于数据的可获得性,本文在门诊服务中选择医疗机构诊疗人次,住院服务中选择手术人次、入院人数,这些指标能够量化体现医疗服务的产出情况。
(3)医疗服务效率的环境影响指标
从宏观经济环境、2009年“新医改”政策环境方面构建医疗服务非效率的影响因素组合。选择人均GDP、人口密度作为宏观经济环境变量,一般而言,人均GDP越高,医疗服务水平越高,医疗服务效率越高。人口密度越大,医疗资源投入越大,其医疗服务效率越高。选择政府卫生预算支出、平均住院天数、公立医院和民营医院数量之比作为2009年“新医改”政策环境变量,其中,政府卫生预算支出是政府在卫生健康领域的投入,在一定程度上可以反映政府对医疗服务领域的支持力度;用平均住院天数来表示医疗机构的管理水平,两者具有负相关关系,即平均住院天数越少,每位患者占用的医疗资源越小,说明医疗机构的管理水平越高;公立医院和民营医院的数量之比常用来衡量医疗市场的非市场化程度,该指标越高,说明医疗市场的非市场化程度越低,医疗服务效率越低。
2.2.2 数据来源
考察2009年“新医改”以来我国医疗服务效率及其影响因素是本文的主要研究目的,但囿于公立医院数量、民营医院数量等指标自2010年才有相关统计,本文以区域医疗为研究层次,选取2010~2019年中国31个省市的面板数据为样本。数据来源于2011~2020年《中国统计年鉴》《中国卫生健康统计年鉴》,具体的变量指标如表1所示。
表1 变量的具体情况
3 计量结果与分析
3.1 计量模型检验
3.1.1 运用熵值法确定医疗服务产出
在进行熵值法计算我国医疗服务产出的综合得分时,为保证数据处理的有效性,对原始数据进行无量纲化后进行了整体平移,以消除零值。鉴于尽可能地保持原始数据的内在规律性,整体平移的取值选取0.0001。表2是2010年、2015年、2019年我国医疗服务产出评价指标的熵值和权重。选取依据熵值法计算得出我国31个省2010~2019年医疗服务产出的综合得分,选取2010年、2015年、2019年的数据绘制成图1。
表2 我国31个省2010~2019年医疗服务产出评价指标的熵值和权重
从表2可知,在选取的样本年中,医疗机构的门诊诊疗人次权重最大,医疗机构住院病人手术人次次之,医疗机构的入院人数权重最小,但三者的差别较小。
从图1可知,我国31个省的医疗服务产出综合得分呈现明显的区域差异,广东排名第一,青海排名最后,但在三个样本年里,各区域的医疗服务产出综合得分差异较小,呈现一定的稳定性。
图1 样本年份我国医疗服务产出评价指标的综合得分
3.1.2 随机前沿模型的适用性检验
鉴于该面板数据可能存在的异方差性问题,对所有的投入变量和非效率因素变量均进行了对数处理,并运用Frontier4.1软件进行随机前沿模型的适用性检验,结果见表3。
表3 随机前沿模型的适用性检验
表3的适用性检验结果显示,LR统计量在5%显著性水平下拒绝了“不存在非效率项”的原假设,说明该模型存在非效率项,可以采用随机前沿模型进行估计。“非效率项不时变”的原假设被拒绝,其LR统计量大于5%显著性水平下的临界值,即该模型的技术效率存在时变性。
3.2 实证结果
3.2.1 随机前沿模型的回归结果与分析
基于式(6),分别运用时变随机前沿模型和时不变随机前沿模型对样本数据进行回归,结果见表4。从表4可知,时变随机前沿模型中的η值不等于0,拒绝原假设,说明技术效率随时间而变化,应该采用时变随机前沿模型。γ值为0.9884,并通过了1%的显著性检验,进一步说明了非效率项的存在。在两个模型的回归结果中,主要变量的系数符号保持一致,进而说明时变随机前沿模型回归结果具有稳健性。表4中的卫生技术人员数、每千人口医疗机构床位数都能显著增加医疗服务的产出,与预期一致。医疗机构数的估计系数为正,但未通过显著性检验,这可能是因为单纯依靠规模的扩张,并不能提高医疗服务产出。
表4 随机前沿模型的回归
3.2.2 非效率模型的回归结果与分析
为考察医疗服务效率的非效率项影响因素,运用一步法对非效率模型进行回归,结果见表5。在医疗服务的非效率模型中,当变量的系数为负时,表示该变量和医疗服务非效率具有负相关关系,即对效率的提升具有促进作用,反之则相反。
(1)宏观经济环境因素
人均GDP的估计系数为负,并通过了5%的显著性检验,这说明经济发展水平是医疗服务效率提升的促进因素,与预期一致。这可能是因为经济越发达的地区,其医疗设施越齐全,医疗技术水平也越高,不但可以高效服务于当地居民,而且可以吸引许多跨省就医的患者,促进医疗服务效率的提升。诸如上海、广东等发达地区的专科医院常常出现“一床难求”的现象。
人口密度的估计系数为正,通过了10%的显著性检验。一般情况下,该区域的人口密度越大,其群众就医的需要也越大,相应的医疗资源投入也越大。但可能由于跨省就医现象的存在导致部分区域医疗资源的投入出现冗余现象,降低了医疗服务的效率。
(2)2009年“新医改”政策环境变量
政府卫生预算支出的估计系数为负,并通过了1%的显著性检验,这说明政府在卫生领域的资金支持是医疗服务效率提升的促进因素。政府卫生预算支出的增加直接提高了医疗领域的资源投入,大大提升了居民的就医机会,可以在一定程度上缓解“看病难、看病贵”问题。
平均住院天数的估计系数为负,但未通过显著性检验。其原因可能在于:一方面,随着经济水平的提高,患者对医疗质量和服务要求也相应提高,经济条件较好的患者更倾向于选择VIP病房或者监护室等以获得更好的治疗,进而导致住院时间的延长;另一方面,由于国家医保政策的调整,患者自负比例的下降,这导致部分患者更倾向于选择在医院进行康复和护理,进而延长了住院时间。
医疗市场的非市场化改革和医疗服务非效率显著正相关,这说明降低医疗市场的非市场化程度,是可以提升医疗服务效率的。其原因可能在于:一方面,民营医院比重的增加带来了竞争效应,一改过去公立医院垄断局面,良好、有序的市场竞争促进了医疗服务效率的提升;另一方面,民营医院比重的增加带来了鲇鱼效应,民营医院的进入激化了医疗市场的竞争,倒逼公立医院进行改革,其生产效率反而得到了激活。
3.2.3 医疗服务效率的测算和分析
根据式(8)测算我国医疗服务的效率,当E=1时,表示我国医疗服务完全有效率;当E=0时,表示我国医疗服务完全无效率。运用测算出来的效率数据,对其变化趋势和区域分布情况进行进一步分析。
(1)以地理区位划分的医疗服务效率分析
借鉴学者们的相关研究,按照地理区位将我国划分为东部、中部、西部三大经济区域,其中,东部包括北京等11个省(市);中部包括山西等8个省(自治区);西部地区包括内蒙古等12个省(市、自治区)。为探索我国医疗服务效率的区域差异,将三大区域在2010-2019年期间的医疗服务效率绘制成图2。从图2可见,三大区域在样本年间的医疗服务效率整体呈上升态势,东部地区的医疗服务效率均值变动范围在[0.6631,0.6994],中部地区为[0.5767,0.6509],西部地区为[0.5582,0.6290]。东部地区的医疗服务效率均值明显高于全国水平,而中部和西部地区则落后于全国水平。但三大区域的差距越来越小,由此说明中部和西部地区的医疗服务效率增长速度高于东部地区,呈“西高东低”格局。
图2 2010~2019年区域医疗服务效率
但在东部、中部和西部的区域内部,各省(市、自治区)的医疗服务效率差异较为明显,而这种区域内部差异在以地理区位划分的分类中又无法体现。如在东部地区,广东的医疗服务效率均值高达0.9755,而海南的医疗服务效率均值仅为0.5375,低于全国平均水平。在中部地区,河南的医疗服务效率均值为0.8016,而同一区域的山西则仅有0.5282。在西部地区内部,四川的医疗服务效率均值为0.8186,而甘肃仅为0.5424。
(2)以医疗服务效率的新型地区聚类分析
为进一步探索我国医疗服务效率的区域差异,运用聚类分析方法对各区域的医疗服务效率重新进行分类,以确切描述其地区差异特征。根据2010~2019年我国31个省(市、自治区)的医疗服务效率现状,把我国医疗服务效率划分为三大类:高效区、中效区、低效区,通过SPSS21.0软件,将区域医疗服务效率进行了K均值的聚类分区,见表6。
表6 医疗服务效率的区域聚类分区结果
由表6可知,按照医疗服务效率进行的K均值聚类分区和地理分区既存在一定的共性,又具有显著的差异。在高效区中,原有东部地区仅有广东、江苏、上海、浙江、山东等地仍然在医疗服务的效率的高效区,这可能是因为部分区域虽然拥有先进的医疗技术和齐全的大型医疗设备,但可能由于资源约束较小而出现医疗技术人员冗余、医疗资源浪费等现象。位于中西部地区的河南、四川跃升高效区,这可能和近年来国家加大对中西部医疗服务领域的政策支持有关,核心地区发展迅猛,其医疗服务效率提升明显。原有中部地区和西部地区的大多数区域仍然在医疗服务效率的低效区,这说明医疗服务效率和区域经济发展水平、当地的资源禀赋仍具有一定的关联性。其中,北京作为全国的政治文化中心,对优势医疗资源具有聚焦效应,但往往出现“投入大,产出小”问题,医疗服务效率并不高,而且常常由于对“就医加号”的严格把控导致异地就医患者无法及时就医。
4 结论与政策建议
本文以2010~2019年中国31个省医疗服务投入产出的面板数据为样本,运用随机前沿模型测算了2009年新医改以来中国各省市的医疗服务效率及其区域差异,并对其影响因素进行了实证分析。研究结论表明:(1)人均GDP、人口密度、政府卫生预算支出、医疗市场的非市场化改革都对医疗服务效率具有显著的影响,和预期一致。(2)东部、中部和西部的医疗服务效率都呈稳步增长态势,其增长速度呈“西高东低”格局;在医疗服务效率的K均值聚类分析中,我们发现原有的地理分区中各省(市、自治区)的医疗服务存在较大差异。
基于上述的实证结果,为全面提升各区域的医疗服务效率提出政策建议:
4.1 提升医疗服务行业的管理水平
长期以来,我国医疗机构普遍存在“重技术、轻管理”“重发展规模、轻质量管理”的现象,这导致了医疗服务效率问题常常被忽视。随着“互联网+医疗”的快速发展,医疗卫生机构作为医疗服务的供给方,一方面要加快形成“管办分开”的高效管理模式,另一方面要从政策层面加大信息产业和医疗产业的深度融合,提升医疗服务效率。
4.2 加强医疗服务的市场化改革力度
“社会办医”的大力推动,尤其是民营医院设立门槛的降低,这对于打破公立医院垄断地位具有显著效应。不但为医疗服务市场带来了竞争效应、鲇鱼效应,而且也为医疗服务市场带来了互补效应,即民营医院可以提供多元化、多层次的医疗专科服务。加强医疗服务的市场化改革,进一步降低民营医院设立和运营门槛,加强医保和民营医院的对接服务,允许参保人员自由选择就医地点,不断提升医疗服务效率。
4.3 促进我国区域医疗服务的均衡发展
我国幅员辽阔,各区域由于经济发展水平、自然资源禀赋、财政支持力度等因素的差异,导致各区域优质医疗资源配置不合理、医疗服务效率存在显著差异。应从国家层面建立统一协调的管理体制,实现以市场机制为主体、政府调控为补充的医疗服务高效运行机制;各区域相关管理部门要立足医疗资源现状,充分考虑到经济发展、人口密度、患者就医等影响因素,优化区域优质医疗资源的布局,实现“抓强扶弱”并重,既要打造区域医疗“高地”,又要加快实现优质医疗资源的扩容、下沉,全面提升医疗服务效率。