福建省新冠肺炎的空间分布特征与影响因素
2022-08-02贺卓文
贺卓文,陈 楠*
(1. 福州大学空间数据挖掘与信息共享教育部重点实验室,福建 福州 350108;2. 福州大学数字中国研究院(福建),福建 福州 350108)
传染病关乎人类的身体健康和生命安全,关系到经济的大局稳定,对人类安全构成了巨大威胁。早期的严重急性呼吸系统综合症(SARS)、中东呼吸综合征(MERS)和甲型H1N1 流感等在世界范围内传播,给人类带来了重大灾难。2019 年12 月湖北省武汉市出现了首例新型冠状病毒肺炎(以下简称新冠肺炎)病例。作为一种新发传染病,新冠肺炎可通过呼吸道飞沫传播、接触传播以及粪—口传播,人群普遍容易感染、传染性强[1];且各地人员交流频繁,疫情迅速蔓延至全国,形势十分严峻,成为我国公共卫生重点关注的问题之一。
国内外针对传染病的研究多集中在生物学[2]、病理学[3]、临床医学[4]和流行病学[5]等方面,只是描述性地从非空间的角度考虑疾病的成因、过程、传播机理和解决对策;而传染病的发生与传播是其自身流行病学机制与环境因素相互作用的结果,这种相互作用使传染病发生在不同的地理区域上具有一定的差异性[6]。近年来,随着GIS的发展,疾病传播的空间分布特征与差异逐渐被人们所关注,也有部分学者[7-9]对传染病的空间集聚性进行了研究,说明不同地区传染病的流行情况存在差异性,邻近区域发病情况相似,但仅限于简单的空间统计分析。对传染病的影响因素研究中具有两个方面的特点:①研究尺度多元,从不同国家、省级、地级市和县级尺度进行研究[10-12];②研究方法的非空间性,传统的Spearman 秩相关分析[13]、多元Logistics回归分析[14]和最小二乘回归模型[15]均忽略了各地理单元之间的空间效应,可能会导致结果不够精准[16]。地理加权回归(GWR)模型是一种探测空间非平稳性的方法,能将各影响因素在不同地理位置上的差异性考虑在内,用于测量因变量与解释变量之间关系强度在不同区域的差异性,从而估计每个预测变量的局部回归系数[17]。在人口城镇化[18]、土壤[19]和房地产[20]等领域应用广泛,但仅有少数学者采用该方法从空间角度来研究疾病传播的影响因子,如HE Z M[21]等采用GWR 模型分析了内蒙古自治区手足口病与气象因素、人口密度和人均GDP的相关性,并检测了在不同季节的变化影响。王微[22]等采用空间自相关和时空扫描统计量分析了新疆结核病报告数量的时空集聚性,并利用GWR模型解释了结果的空间非平稳性。
新冠肺炎疫情发生后,石耀霖[23]、李陈晨[24]等对湖北省等疫情严重地区的疫情扩散速度、发展特征和防控策略做了大量研究,但新冠肺炎疫情具有地域差异性,应根据疫情的严重程度和空间传播规律制定科学、合理的疫情防控措施,以达到最佳防控效果。因此,本文选择非严重疫情区域的福建省作为研究区,以福建省所辖84个县域行政单元为研究对象,基于探索性空间数据分析方法和GWR模型,探究了福建省县域新冠肺炎疫情的空间分布格局以及影响因素的空间分异特征,有助于更好地发现高危感染地区,为制定高效的防控措施、合理分配医疗资源提供科学依据。
1 研究方法与数据来源
1.1 数据来源
本文采用的数据包括:福建省84个行政县的新冠肺炎确诊数,时间为2020-01-22—2020-02-18,数据来源于福建省卫生健康委员会官网(http://wjw.fujian.gov.cn/);相关的经济(人均GDP)、医疗(每平方公里拥有医疗机构数)和教育(人均公共财政教育支出)数据来源于《2019年福建省统计年鉴》或通过间接计算获得;交通数据为各县域到火车站的距离(在ArcGIS 中计算面的质心到火车站的距离)。本文通过ArcGIS软件将交通、经济、医疗和教育数据与每日的新冠肺炎确诊数关联到福建省县级行政区划图中,县级行政区划图来源于中国科学院资源环境科学数据中心(http://www.resdc)。
1.2 研究方法
1.2.1 探索性空间数据分析方法
探索性空间数据分析方法是一种检测某种属性的空间分布与邻近单元是否存在相关性以及相关程度的方法[25],主要包括全局自相关和局部自相关。本文利用全局Moran’s I 指数反映福建省新冠肺炎确诊数在研究范围内的空间聚集程度,以揭示福建省县域新冠肺炎确诊数空间差异的总体特征;利用局部Getis-Ord G*指数检测福建省新冠肺炎确诊数在县域是否存在空间上的局部高值和低值,从而弥补全局空间自相关无法识别聚集区的缺点[26]。
全局Moran’s I指数的计算公式为:
式中,n为空间单元(本文为县域)的数量;wij为空间权重矩阵;xi和xj分别为i县域和j县域的新冠肺炎确诊数;Xˉ为各县域新冠肺炎确诊数的平均值。
Moran’s I 指数的绝对值越接近1,表示空间相关性越大,接近0则表示空间不相关。
局部Getis-Ord G*指数的计算公式为:
式中,xj为要素j的属性值,本文为县域j的新冠肺炎确诊数;wij为要素i和要素j之间的空间权重;n为要素总数;s为要素的标准差;Gi*为局部统计量经过Z检验得到的Z得分。对于具有显著统计学意义的Z得分,若Z得分接近于零,则表示不存在明显的空间聚类;若Z得分高且为正数,则表示有高值(热点)的空间聚类;反之亦然。
1.2.2 GWR模型
GWR 模型是对传统回归模型(最小二乘法)的扩展。其优势在于考虑了数据的空间位置关系,反映了变量对局部区域的影响程度,能很好地解决因变量的空间异质性问题[27]。模型的表达式为:
式中,yi为因变量的值,本文为福建省各县域新冠肺炎的确诊数;(ui,vi)为第i个县域的空间位置,以县域的经纬度坐标表示;xij为第j个自变量在县域i处的值;εi为残差;β0(ui,vi)为县域i处的回归常数;βj(ui,vi)为第i个县域的第k个回归参数。
1.3 技术路线
在ArcGIS软件中建立新冠肺炎疫情数据库,利用探索性空间数据分析方法分析新冠肺炎疫情的空间相关性和空间集聚模式,但该方法无法解释各解释变量与新冠肺炎确诊数之间的关系;因此再引入GWR 模型分析解释变量对被解释变量在不同区域上的影响程度。本文的技术路线如图1所示。
图1 技术路线图
2 研究结果与分析
2.1 空间分布概况
福建省84 个县域的新冠肺炎确诊数空间分布如图2所示(限于篇幅,仅列出1月22日、2月4日和2月18 日的空间分布图),可以看出,福建省新冠肺炎疫情呈现东部沿海地区较严重、内陆地区较轻微的分布特征,且沿海地区的铁路网明显比内陆地区密集。随着火车和高铁的普及,交通的便捷性和多样化导致沿海地区人口流量较大;而内陆地区多山地,地形情况复杂,公路、铁路等修建困难,交通基础设施薄弱,因此需通过建立GWR 模型探讨新冠肺炎确诊数与各县到火车站距离的关系。
图2 1月22日、2月4日和2月18日的新冠肺炎确诊数空间分布图
2.2 新冠肺炎疫情的空间自相关分析
2.2.1 全局自相关分析
以福建省新冠肺炎确诊数为变量,计算逐日的全局Moran’s I指数(图3),从整体上把握县域间新冠肺炎疫情的空间关联水平和差异程度。福建省新冠肺炎确诊数的空间相关性大致经历了3个阶段:1月22日—1 月26 日Moran’s I 指数的绝对值均未超过0.1,说明空间相关性相对较弱,新冠肺炎疫情呈随机分布;从1月27日开始,Moran’s I指数迅速上升,并通过高显著性水平检验,说明新冠肺炎疫情存在较强的空间正相关性,表现出显著的空间差异性,空间集聚状态明显;1月31日—2月18日Moran’s I指数整体呈逐渐降低趋势并有微小波动,说明新冠肺炎确诊数的空间集聚水平开始有所下降,伴随小幅上升后趋于平稳。
图3 新冠肺炎确诊数的全局Moran’s I指数趋势
疫情爆发初期,正值春节前后,从武汉返乡和到武汉出差的人员流动性较大,且当时人们对于新冠肺炎疫情的警惕性严重不足,防范措施几乎为零,从而使福建省输入了新冠肺炎病例,呈随机空间分布特征。新冠肺炎具有潜伏期较长的特点[28],初期感染不易发现,必然存在无症状病毒携带者,且新冠肺炎传染性强,因此感染人数逐渐增多,空间集聚性显著增强。1 月30 日的空间相关性达到最高随后开始降低,这主要归功于有效的疫情防控措施和广大市民的积极配合,疫情扩散得到了有效控制,空间聚集性明显降低。因此,新冠肺炎疫情的空间分布模式与疫情的发展趋势具有一定的相关性,疫情聚集性的出现和增强可作为疾病由局部向大规模暴发的预警指示。Sims D L[29]和张仁杰[30]等在禽流感的研究中也发现了类似现象,随着流感疫情的蔓延,空间聚集现象越来越明显,反之亦然。全局Moran’s I指数的变化节点主要发生在1月26日、1月30日和2月18日,因此本文主要围绕这3个时间节点做进一步的分析。
2.2.2 局部热点探测分析
为进一步明确福建省新冠肺炎疫情空间集聚热点区的地理位置,本文分别计算了1月26日、1月30日和2 月18 日各县域新冠肺炎确诊数的Getis-Ord G*指数;再利用ArcGIS 的自然断裂法将结果进行可视化,如图4 所示,可以看出,新冠肺炎疫情的热点和冷点区域表现出较明显的空间演变特征,1月26日新冠肺炎确诊数的热点区域包括闽侯县、永泰县、晋江市、石狮市和鲤城区5个地区,未形成冷点区域;1月30日空间集聚性增强,热点区域逐步扩大,且呈向南部扩散的趋势,包括仙游县、城厢区、秀屿区、涵江区、福清市、荔城区、晋江市和鲤城区8 个地区,由各市卫生健康委员会官网数据可知,新冠肺炎患者大多为返乡人员和旅游人员,表明大量的人员流动是新冠肺炎广泛传播的重要因素之一,这些地区位于沿海地区,交通便利,第二、三产业比重相对较高,活动交往的频繁加速了人员流动,冷点区域包括建阳区和政和县,这两个地区多山地,交通可达性差,自然林业资源丰富,主要以农业生产为主,人员流动少;2 月18日的热点区域范围缩小,空间集聚性减弱,包括城厢区、秀屿区、涵江区和荔城区4个地区,无冷点区域,可见新冠肺炎确诊数较高的县域对周边的辐射效应降低,说明采取的疫情防控措施起到了很好的效果。因此,应根据各县域的情况,认清自身防控形势,继续加强对热点区域和周围次热点区的管理以及对密切接触者的隔离观察,减少人员流动,并根据疫情严重程度制定合理的防控策略,防止疫情的进一步扩散。
图4 1月26日、1月30日和2月18日的新冠肺炎确诊数热点分析结果
2.3 新冠肺炎疫情影响因素的空间分异特征分析
2.3.1 GWR模型构建
上述分析表明,福建省新冠肺炎疫情存在显著的地理空间关联特征,因此本文引入了考虑空间地理位置关系的GWR 模型,进而分析各影响因素对新冠肺炎疫情的影响程度。由于1月30日的全局自相关达到最高随后降低,本文选取1月30日的新冠肺炎确诊数作为因变量;传染病的发病率与经济、交通、医疗等多种社会因素相关,选取各县到火车站的距离、人均GDP、每平方公里拥有医疗机构数和人均公共财政教育支出作为解释变量构建GWR模型。运算结果表明,1月30日的相关系数为0.23,拟合效果良好。为避免各解释变量之间的相互影响造成计算结果偏差,本文对上述变量进行多重共线性检验,结果如表1所示,可以看出,各解释变量的方差膨胀因子(VIF)均小于10,表明本文所选取的解释变量不存在共线性关系。
表1 影响因素共线性检验
本文对GWR 模型的回归系数进行整理,选取了最大值、最小值、平均值、偏度系数和峰度系数5 个统计指标,结果如表2 所示,从最大、最小值来看,各县到火车站的距离与新冠肺炎确诊数呈负相关关系,人均GDP、每平方公里拥有医疗机构数和人均公共财政教育支出与新冠肺炎确诊数既有负相关又有局部正相关,整体表现为负相关关系,说明了影响因素的不稳定性;从平均值来看,4 个解释变量对新冠肺炎确诊数的影响程度依次为各县到火车站的距离>每平方公里拥有医疗机构数>人均GDP>人均公共财政教育支出,说明交通发达程度对新冠肺炎疫情的爆发具有关键性影响;从偏度系数和峰度系数来看,各县到火车站的距离为负偏低峰分布,即回归系数大于平均值的县域比小于平均值的县域多,样本频数形成的概率密度曲线坡度较缓,人均GDP、每平方公里拥有医疗机构数和人均公共财政教育支出为正偏低峰分布,即回归系数小于平均值的县域比大于平均值的县域多,样本频数形成的概率密度曲线坡度较缓。
表2 GWR模型回归系数统计分析表
由于各影响因素在不同的县域具有显著的空间差异,本文对4 个影响因素的空间异质性逐一进行分析。
2.3.2 各县到火车站的距离对其影响的空间分异特征
各县到火车站距离回归系数的空间分布如图5a所示,可以看出,各县到火车站的距离对新冠肺炎确诊数的影响存在明显的空间差异,且二者之间呈负相关关系。便利的交通出行,使得福建省感染新冠肺炎疫情的风险增加,这与前人的研究认为交通可达性会促进传染病的大规模传播与扩散是一致的[31]。原因在于交通发达地区能推动经济的快速发展,城乡和地区之间的联系日益频繁,文化交流和经济贸易的往来不可避免地带来了人口的流动。
从回归系数的分布来看,负向影响的高值区分布在东部沿海地区,低值区则大多分布在西部内陆地区,这是由于福建省东部沿海地区拥有优越的地理位置和丰厚的经济基础,交通路网发达,对外开放程度高,从而促进了当地的人文交流和对外贸易往来;且当时正值春节,返乡人员大量聚集,交通的可达性使得人口流动和人群来往比以往更密切,来自湖北省潜伏期无症状病毒携带者跨区域活动,很大程度上增加了疫情传播的可能。
2.3.3 每平方公里拥有医疗机构数对其影响的空间分异特征
每平方公里拥有医疗机构数反映了一个地区整体的医疗卫生水平。每平方公里拥有医疗机构数回归系数的空间分布如图5b所示,可以看出,每平方公里拥有医疗机构数对新冠肺炎确诊数具有负相关效应,部分地区表现为正相关。随着医疗卫生事业的快速发展,充足的医疗卫生资源可为新冠肺炎患者和疑似患者提供精准的诊断、规范的治疗和安全的服务,能做到早发现、早诊断、早隔离、早治疗,减少了新冠肺炎患者的传染几率,这与现有的研究结果医疗水平的提高会增加传染病的感染几率相反[32],可能是由于传染病传播机制的不同而导致的。每平方公里拥有医疗机构数对不同地区新冠肺炎的影响程度不同,回归系数绝对值的最高值出现在东部地区、向西部逐渐减小。随着医疗水平的不断提高,各县域在卫生服务资源投资以及政府政策上的不同,使得福建省东部地区对新冠肺炎确诊数的影响高于西部地区。
2.3.4 人均GDP对其影响的空间分异特征
已有研究表明传染病的发病率与社会经济发展水平具有显著负相关性[13]。人均GDP 回归系数的空间分布如图5c 所示,可以看出,人均GDP 对新冠肺炎确诊数具有显著的负相关关系,表明经济越发达的地区,新冠肺炎确诊数越少;回归系数绝对值的高值分布在东南沿海地区,并向内陆逐渐递减。福建省沿海地区邻近东南亚与港澳台,拥有天然的资源优势,经济得到快速发展,资源配置、基础设施和政府财政明显优于内陆地区[33];在政策的主导作用下,福州、厦门和泉州等沿海地区吸引了大量华侨和台商投资办产,第二产业发展较成熟,第三产业也相对较多,产业类型多样化,人口流动较大;内陆地区矿产、森林资源丰富,第二产业比重较高,但经济对外开放程度没有沿海地区高,从而导致沿海地区人均GDP对新冠肺炎疫情的传播影响较大。
2.3.5 人均公共财政教育支出对其影响的空间分异特征
人均公共财政教育支出对新冠肺炎确诊数的影响程度最低。在以往的研究中并未考虑教育因素的影响,人均公共财政教育支出回归系数的空间分布如图5d所示,可以看出,人均公共财政教育支出与新冠肺炎确诊数呈负相关关系,其原因在于重视教育程度越高的县域,居民对新冠肺炎的认知水平和自我保护意识越高,最大可能地避免了新冠肺炎的感染;回归系数绝对值的最高值出现在莆田、泉州和三明的部分县域,并向南北两侧递减,说明人均公共财政教育支出对莆田、泉州和三明部分县域的新冠肺炎确诊数的影响程度较大。
图5 GWR模型交通、医疗、经济和教育因素回归系数空间分布图
通过上述分析可知,交通、医疗、经济和教育4 个因素对福建省新冠肺炎疫情的影响具有显著的空间差异性,其中交通对新冠肺炎疫情的传播起着至关重要的作用,且中东部沿海地区受影响强度最大,这在一定程度上解释了新冠肺炎疫情的热点区域主要集中在中东部沿海地区的结论,其便捷的交通网络、跨区域的人口流动促使新冠肺炎确诊数的增加;所得结果进一步印证了前人关于传染病扩散影响因素的结论,为各区域制定不同严重程度的疫情防控措施提供了科学依据。
3 结 语
本文采用探索性空间数据分析方法和GWR 模型分析了福建省新冠肺炎确诊数的空间分布格局和影响因素的空间分异特征,有助于科学有效地制定新冠肺炎疫情防控策略,为完善疫情防控措施公共卫生事件应急管理体系与合理配置资源提供科学依据,也可为类似的突发疫情研究提供示范与借鉴。
1)福建省新冠肺炎确诊数的空间分布格局,在新冠肺炎疫情初期呈随机分布,后期呈显著正相关性,进而由随机分布转向集聚分布,空间集聚效应在大幅聚集后发生小幅扩散。
2)通过对福建省新冠肺炎确诊数进行局部热点探测发现,热点区域主要集中在福建省中东部沿海地区,呈先扩大后缩小的势态;冷点区域出现在政和县和建阳区后消退,与全局Moran’s I指数结果相吻合。
3)根据GWR模型的结果,各影响因素在不同县域存在显著的空间差异,其中各县到火车站的距离对新冠肺炎确诊数具有负向影响,其余指标既存在正相关也存在负相关,整体呈负相关。从影响强度来看,各县到火车站的距离对新冠肺炎疫情的影响程度最大。因此,在交通日益便捷的今天,为应对类似突发疫情的再次爆发,政府部门应做好长期的准备工作,优化相关地区的医疗资源,加强教育投资。