基于GWR模型的我国卫生机构床位数影响因素研究
2018-09-20叶子容吴亚飞
叶子容 吴亚飞 周 鼒 方 亚△
【提 要】 目的 研究我国卫生机构床位数(下称床位数)的影响因素,为提高床位资源配置效率和制定卫生政策提供依据。方法 选取2013-2015年《中国卫生统计年鉴》及《中国统计年鉴》31个省份每千人卫生机构床位数(下称每千人床位数)资料,以省份水平为研究尺度,首先运用全局空间自相关从整体上判断我国床位数是否存在空间聚集性;进一步地,运用局部空间自相关探索床位数的空间聚集类型;最后,结合我国东中西部行政区域划分,采用地理加权回归(GWR)模型从空间角度研究性别比、老年人口比例、人均GDP、公路里程数、床位使用率及医疗卫生支出等因素对床位数的影响,同时,将GWR建模结果同普通最小二乘法(OLS)结果进行比较。结果 2013-2015年,我国平均每千人床位数分别为4.58张、4.86张、5.13张,呈稳步增长趋势,与全国平均水平相比,中部地区较高,西部和东部地区较低,尤以东部更显著。床位数在省份水平具有明显的空间聚集性,三年的Moran’I指数分别为0.157,0.185,0.223(P<0.05);三年内空间聚集类型显示,福建、广东及其周边省份呈低-低聚集,西藏和甘肃呈低-高聚集;自2014年起,出现以重庆为中心的高-高聚集区域。从空间分布影响因素来看,东中部主要受老年人口比例影响,而西部受男女比例、城镇人口比例及医院床位使用率的影响。同时,GWR拟合结果全面优于OLS。结论 我国床位数呈逐年增长趋势,但存在明显的地区差异,东、中、西部各具相应的分布特点和影响因素。
近年来,我国总体卫生投入不断增加,同时也伴随着卫生资源不平等程度的加剧[1-2]。卫生机构床位数是卫生资源的重要指标[3],其分布直接关系到居民健康和卫生服务质量及其公平性等问题,同时又受到经济状况、人口数、自然条件、交通、卫生政策等因素的影响,呈现出一定的空间分布格局[4]。因此,通过研究床位数的影响因素,进而指导卫生资源分配显得十分必要。
目前,对于国内床位数影响因素的研究,有的运用了经典线性回归模型[5-6],有的采用了全局空间回归模型[7],但是这些研究缺乏对空间自相关性和空间异质性的考虑,对空间信息利用并不充分。而地理加权回归(geographically weighted regression,GWR)可以同时考虑空间自相关性和空间异质性[8],因此,本研究拟用GWR方法,对我国31个省份2013-2015年床位数影响因素进行探讨,并从空间角度探索我国医疗卫生体系发展过程中存在的资源配置不平衡等问题,为我国医疗资源更加合理分配提供有力支持。
资料与方法
1.资料来源
选取2013-2015年《中国卫生统计年鉴》及《中国统计年鉴》各省份每千人床位数资料,结合文献综述,从以上统计年鉴中选取本研究的自变量,包括性别比、老年人口比例、人均GDP、公路里程数、床位使用率及医疗卫生支出。
2.分析方法
(1)描述性分析方法
基于中国大陆地区省份尺度地图,针对每千人床位数制图,以颜色深浅表示数值的大小。
(2)空间自相关方法
①全局空间自相关
本文采用Global Moran’s I指数作为统计量[9],计算公式如下:
(1)
②局部空间自相关
为进一步判断各省份床位数的聚集类型,本研究运用了局部空间自相关[10],拟采用Local Moran’I指数进行分析,计算公式如下[11]:
(2)
式中各个指标的含义同公式(1)。进一步采用蒙特卡洛模拟对Local Moran’I指数进行显著性检验。局部空间自相关旨在反映空间单元与其邻近空间单元的相似程度,解释空间聚集类型。利用数据可视化方法来显示空间聚集的四种模式:高-高(HH)区域,表示高值区域被同为高值的区域所包围的空间分布;高-低(HL)区域,表示高值区域被低值区域包围的空间分布;低-高(LH)区域,表示低值区域被高值区域包围的空间分布;低-低(LL)区域,表示低值区域被同为低值的区域包围的空间分布。
③GWR模型
GWR模型基于样本点存在空间自相关性这一前提,旨在分析各省床位数与自变量之间的空间异质性。在OLS基础上,将样本数据的地理位置嵌入回归系数中。其模型的一般形式如下[12]:
(3)
式中(ui,vi)是第i个省份的空间坐标;yi是第i个省份的床位数;而xij是自变量xj在(ui,vi)位置上的观测值;β0(ui,vi)和βj(ui,vi)分别表示第i个省份的回归常数和第j个回归系数;εi是该模型的误差项,其服从正态分布。
4.分析软件
本研究中,原始数据预处理及OLS模型的建立由SAS 9.2实现;GeoDa 1.8进行空间自相关分析及结果的地图展示;GWR模型通过GWR 4.0建立。
结 果
1.床位数一般情况
表1和图1表示2013-2015年各省份每千人床位数分布情况,呈稳步增长趋势。以历年全国平均每千人床位数为参照(4.58、4.86、5.13),三年均呈现中部普遍高于全国平均水平;西部小部分省份低于全国平均水平,但部分省份排名全国前列;而东部大部分地区普遍低于全国平均水平。图1-A显示,2013年中部地区仅河南、安徽、江西低于全国平均水平,西部以新疆、四川最为突出,排名全国前列。而东部仅辽宁、山东、江苏高于全国平均水平,其余省份低于全国平均水平,尤以广东、海南最为明显。2014年较2013年变化不大,仅河南由低变高(图1-B)。2015年各省份床位数差距变小,但与前两年大致相同,仅宁夏和山西由高变低(图1-C)。
2.床位数聚集性分析
以省份为单位,我国每千人床位数呈现明显的空间聚集性。从全局自相关分析结果来看,2013-2015年Moran’I指数逐年递增,均有统计学意义(P<0.05),分别为0.1569,0.1849,0.2226,说明聚集性逐渐变强。
进一步进行局部空间自相关分析,基于省份尺度的每千人床位数呈现4种空间分布格局(图2)。2013年(图2-A)主要呈现两种类型空间分布格局:LL区域,如广东、福建、江西;LH区域,如西藏和甘肃。相较于2013年,2014年(图2-B)新增以重庆为中心的HH区域。2015年(图2-C)的结果同2014年基本一致,局部空间聚集性变化不大,LL区域扩展到海南及浙江。
表1 2013-2015年各省份每千人床位数(单位:张)
3.床位数影响因素分析
经上述分析发现,各省份每千人床位数存在明显的空间聚集性,因此考虑空间相关性,采用GWR模型研究床位数分布的影响因素更为合理。进一步地,为检测第k个自变量是否具有空间变异性,我们建立原始模型,即所有变量均考虑其空间变异性,并在原始模型基础上固定第k个变量的回归系数,建立转换模型。比较两模型的AIC,若原始模型优于转换模型,则认为第k个变量具有空间变异性,反之则没有。利用上述办法,检验该研究的六个自变量,将具有空间异质性的变量纳入最终模型,建立多因素回归模型。
图3揭示了拟合优度指标R2的空间变异。2013-2015年GWR模型估计的R2分别为0.051~0.758,0.138~0.648,0.424~0.658,不同区域R2的差异较为明显。2013、2014年R2空间分布呈现西部、西南部较东部、东北部大,整体出现自西南部向东北部递减趋势。而2015年R2分布情况略有不同,东部、东南沿海各省R2较大,而西部和北部各省R2普遍较小。
进一步来看历年GWR建模结果。图4-A和4-B显示2013年老年人口比例和床位使用率对床位数的影响具有空间异质性。老年人口比例回归系数为-0.31~0.37,大部分省份的回归系数为正,且回归系数自南向北逐步减小,而北部部分省份的回归系数为负,提示老年人口比例增大对每千人床位数会产生负面影响。医院床位使用率的回归系数为-0.08~0.60,呈现自东向西逐步递增的趋势,尤其是西部地区,回归系数为正,说明床位使用率提高将增加床位数。
2014年男女比例和老年人口比例对床位数的影响具有空间异质性。从男女比例看,其回归系数估计值为-0.34~-0.10(图4-C),均为负数且绝对值呈现由东北向西南递增趋势,提示在全国范围内男女比例对床位数的影响均为负向,但这种影响在西南部比东北部更强。而老年人口比例回归系数为-0.03~0.16(图4-D),分布情况同2013年基本一致,整体回归系数有所增大,回归系数为负的省份仅有新疆。
2015年老年人口比例、城镇人口比例和床位使用率对床位数的影响具有空间异质性。老年人口比例回归系数为-0.11~0.40(图4-E),与2014年结果基本一致,但回归系数进一步增大。而城镇人口比例回归系数为-0.03~0.19(图4-F),自东南向西北递减,尤其西部、北部地区回归系数为负。床位使用率回归系数为-0.11~0.28(图4-G),整体变化趋势与2013年一致,西部地区为正,而其它地区则自东南向西北递减。
总体而言,各影响因素在不同区域对床位数的解释能力存在空间差异,在实际工作中可以根据各影响因素的实际情况合理分配卫生资源。最后,计算2013-2015年GWR残差的全局Moran’s I指数,分别为-0.0435(P=0.458),-0.0324(P=0.492),-0.1152(P=0.255),残差项均不存在空间相关性,说明GWR模型较好地拟合了各变量的空间效应。
4.OLS与GWR建模结果比较
建立经典的OLS模型,比较OLS与GWR的回归结果,同时将OLS回归与GWR模型的主要诊断指标进行比较,检验GWR模型的空间非平稳性。OLS参数估计结果见表2。
图1 2013-2015年各省份每千人床位数分布图
图2 2013-2015年各省份每千人床位数局部空间自相关聚集图
变量201320142015标准化系数P标准化系数P标准化系数P男女比例-0.4170.071-0.4640.031-0.5770.028老年人口比例-0.0080.975 0.1370.585 0.2100.474城镇人口比例 0.4930.383 0.4830.329 0.4380.369人均GDP-0.4950.390-0.5210.298-0.3950.396医院床位使用率 0.0700.765 0.0390.852 0.0180.929人均医疗卫生支出 0.0210.930-0.0190.938 0.2360.291
图3 2013-2015年GWR模型R2分布图
图4 2013-2015年GWR模型分析结果
经过OLS建模,结果提示2013年纳入的变量均无统计学意义,而2014、2015年仅男女比例有统计学意义,同GWR的结果差别较大,说明OLS建模纳入的六个自变量,在不考虑其空间异质性时对模型的拟合情况较差。
进一步地,依据Fotheringham等[13]提出的GWR模型评价标准,GWR模型历年建模结果均优于OLS(表3)。综上可知,OLS对数据的空间信息提取不完全,在本研究中GWR模型的建立具有较高价值。
表3 OLS与GWR模型主要诊断指标比较
讨 论
床位数是反映卫生资源配置合理化的重要指标,因此研究其空间分布特征及影响因素具有重要意义。以往研究普遍忽视床位分布的空间信息,不能充分挖掘其空间属性,而本研究在全局空间自相关基础上,进一步用GWR模型进行分析,较好地控制了空间自相关性。
本研究发现,2013-2015年间我国平均每千人床位数呈稳步增长趋势,而从空间分布角度来看,床位数呈现由西向东递减的趋势,与山珂等人的研究结果基本一致[14]。出现这一现象的原因可能是,东中部地区人口众多,可用于医疗规划的土地资源有限,因而床位数增长缓慢,而西部地区地域广,且国家实行西部大开发战略,一定程度上也促进了当地卫生事业的发展。
全局自相关分析显示,我国床位资源配置存在空间聚集特征。进一步通过局部空间自相关分析,揭示了我国床位数的空间聚集模式,重庆市HH聚集提示床位配置在重庆及其周边省份存在正的空间依赖性,且这些区域床位数普遍较高;广东、福建、江西、海南及浙江呈现LL聚集,说明这些地区及其周边省份也存在正的空间依赖性,但其床位数相对较低;西藏、甘肃呈LH聚集,提示应重点关注床位数低的区域,防止差距进一步扩大。
进一步地,GWR分析发现,三年间全国大部分地区床位数与老年人口数存在正相关关系,但区域影响程度不同,可能的原因是,随着老年人口增多,伴随的医疗需求增大,床位数也随之增加,但各地老龄化进程不平衡,所以会出现一定的地域差异,这与既往研究结果一致[15-16]。床位使用率对床位数的影响更为直接,本研究显示,2013、2015年东中部地区床位数与床位使用率存在负相关关系,可能是这些地方采用科学的床位管理方法,大大提高了床位使用率,有效地减少了不必要的卫生资源配置。所以,床位使用率的增加,在一定程度上会使床位数有所减少。相比而言,西部结果恰好相反,这与姜婷等的研究结果基本一致[17],可能是由于病人平均住院日延长,床位使用率提高但床位周转速度却变慢,导致床位资源紧张,因而床位数会相应增加,汪雅璇等的研究支持上述观点[18]。同时,研究表明2014年床位数与男女比例存在负相关关系,且这种影响在西南部比东北部大,可能的原因是随着男女比例增大,人口结构不合理,生育率下降,所需的产科、儿科和妇科床位减少。有研究指出近年来住院分娩需求上移[19],当女性比例下降后,相关床位可能减少,提示在床位规划时,要考虑地区性别比的影响。此外,2015年东北、西北部分省份床位数与城镇人口比例存在正相关关系,而东中部大部分城市床位数与该指标存在负相关关系,但影响都较小。可能是城镇居民健康意识、文化水平等较高,更加注重健康,卫生需求也比农村居民大。而东中部地区随着城镇一体化推进,农村医疗水平提高,农村居民健康观念也逐步增强,大量医疗资源流向农村,所以城镇人口比例的影响也越来越小。
最后,本研究运用GWR模型,同时考虑了空间自相关性和空间异质性,使估计结果更稳定;以31个省份为研究对象,探讨床位数的分布状况及影响因素,更具客观性;研究选取的分析指标不仅是卫生资源的重要指标,也涉及社会人口学、经济学、交通等领域,能够较好地对床位数的空间分布特点进行解释。但是,本研究也存在一些不足。由于受到资料限制,一些影响床位数的指标未能纳入,可能会影响到模型的拟合效果;另外,由于目前缺乏统一的床位资源质量评价指标,因此本研究主要探讨床位数的影响因素,尚未涉及床位资源配置的合理性问题。