新型冠状病毒肺炎传播的时空特征及空间风险因子
——以广州市为例※
2020-05-31朱洪平孙满芳
朱洪平,孙满芳
(1.广东工业大学管理学院,广州 510520;2.厦门市海沧医院,厦门 361026)
目前关于新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)的研究主要集中在基因组学、流行病学、临床医学、防护学和心理学等方面[1-5],这些研究能够很好反映新冠肺炎基因结构、病毒宿主、临床表现和预防管理等信息,但无法反映新冠肺炎传播的时空特征。定量分析其时空特征能够全面了解新冠肺炎的传播规律及内在机制,为控制新冠肺炎和其他突发性传染疾病的扩散提供参考依据。
基于此,本课题以广州市卫生健康委员会提供的新冠肺炎确诊病例的时空数据作为研究样本,运用地理信息技术和空间统计学方法将新冠肺炎确诊病例的涉及小区和场所进行空间可视化处理,分析其空间分布模式,即研究全局空间相关性和局部空间相关性,识别空间风险因子,以期挖掘和阐释新冠肺炎传播的时序变化规律,以及空间聚集性、空间分异特征和空间风险因子等信息,为政府部门制定更具针对性的应急预案和防控措施提供理论依据和科学参考。
1.资料与方法
1.1 资料
本课题研究数据(2020年1月21日至3月10日的广州市新冠肺炎确诊病例时空数据)来源于广州市卫生健康委员会。将新冠肺炎患者的确诊时间作为新冠肺炎传播时间(图1)。由于原始数据是文本形式,无法直接运用于空间分析,因此采用空间化处理方法将新冠肺炎确诊病例的涉及小区和场所与广州市的电子地图底层信息进行人工匹配,把确诊病例信息定位到特定的空间位置点作为新冠肺炎传播的空间信息(图2),以此构成新冠肺炎传播的时空数据。
运用水经注软件选取百度地图上的城市兴趣点(Poin to Interest,POI),选取商店、饭店、宾馆、医院、旅游景点、公交车站6种类型的POI数据作为空间风险因子进行研究,其包含名称、商户类型、地址、经纬度等信息。在经过筛选、去重、校正地理坐标等步骤后,最终提取研究区域内商场3623个,饭店50369个,宾馆13643个,医院1198个,旅游景点536个,公交车站2691个,采集时间为2019年12月。
图1 广州市新冠肺炎确诊病例数量的时间变化图
图1显示,从整体上看,每日新增确诊病例呈波动式“爆发性增长-缓慢下降”的演变特征,由于新冠肺炎暴发初期人们防控意识薄弱以及春运人员的流动,新增确诊病例从1月下旬开始迅速上升,在短时间内形成一定规模的传播趋势,并于2月上旬达到高潮。随后,得益于政府部门的科学有效防控措施和人们增强的自我防护意识,每日新增确诊病例人数迅速降低,个别天数有波动,但整体呈平稳状态。
图2 广州市新冠肺炎确诊病例空间分布图
图2显示,新冠肺炎确诊病例在空间上具有较强聚集性,且分布规律比较明显。主要集中在越秀区、海珠区、荔湾区、天河区、白云区等经济发达、人口稠密和交通便捷的中心地带。相比之下,位于城郊地区的确诊病例呈现零散分布,其中从化区仅有1例。为了研究新冠肺炎传播在时间上的规律特征,将其分为3个阶段:第一阶段(1月21日至2月2日),第二阶段(2月3日至2月14日),第三阶段(2月15日至26日)。2月27至3月10日间仅3月5日新增一例确诊病例,故不单独划分阶段。从确诊病例的扩散过程中看(图3a~c),广州市新冠肺炎疫情的扩散主要集中在2月14日之前。
1.2 分析方法
核密度分析法:作为一种非参数估计方法,通过将研究区域内一系列离散的空间点转化为连续的密度图来对空间点群分布模式进行可视化展示[6]。其原理是运用数学函数来测度要素点到参考位置的距离,并统计出从参考位置到所有表面值之和,最后通过要素点的峰值来创建连续的平滑表面[7];核密度数值越高表示点分布越密集,反之,则表示点分布越稀疏。
波段集相关系数分析法:主要用于为栅格波段集的多元分析提供统计值,检验图层间的相关关系[8]。本课题运用波段集相关系数作为衡量新冠肺炎患者分布与各类风险因子相关性的指标。
Moran′s Ⅰ指数法:地理学第一定律表明,空间对象之间存在相关性,且关系的亲疏与距离呈负相关[9]。因此,探索对象间的空间相关性有助于分析对象间的联系,而Moran′s Ⅰ指数是用来明确空间相关性的一个重要指标,旨在揭示研究对象的整体分布状况,判断研究对象在全局层面上是否存在空间集聚性[10],本课题运用Moran′s Ⅰ指数判断新冠肺炎传播在整体上的空间相关性。
LISA指数法:是衡量局部自相关的重要指标,主要通过描述研究对象周围区域内某一属性的空间聚集程度,从而识别出对象属性的空间关联模式,并发掘出空间对象间的空间异质性[11];LISA指数能反映研究区域内对象的四种集聚模式,分别为高高聚集区(高值周围为高值),高低集聚区(高值周围为低值),低高集聚区(低值周围为高值),低低集聚区(低值周围为低值);本课题运用LISA指数来测度新冠肺炎传播在空间上的分布差异,并识别出热点区域。
(a)2月2日之前 (b)2月14日之前
(c)2月26日之前
在实际研究过程中,无论是基于核密度方法定量分析点群分布,还是从空间相关性角度考虑信息的完整性,均表明两者融合的必要性[12]。在地理对象的研究中,传统的样方分析法是将整个研究区划分为若干个子区域(即样方)进行研究,并以各样方内的特征值作为空间单元的属性值,但这种方法存在样方数据缺失和样方单元选择随意等缺点[13]。而核密度估计是基于“距离衰减效应”,认为对象的联系随着距离的增加而降低,得出的结果更符合对象在空间分布的连续性特征,探测的热点也更有效,可提高结果可信度。本课题拟用核密度方法计算新冠肺炎患者和各类空间风险因子在地理单元的密度值,再用波段集统计法对各风险因子进行相关性测算;并结合统计学方法计算出Moran′s指数和LISA指数。
1.3 统计学方法
GeoDa1.14是分析空间关联性的统计软件,广泛运用于统计分析中[14]。本课题通过GeoDa1.14软件测算出Moran′s指数和LISA指数。ArcGIS10.2软件具有定位准确特性,可综合分析各个要素在空间内的空间关系[15]。本课题运用ArcGIS10.2软件的核密度分析来测度要素点核密度的分布情况,并运用Band Collection Statistics功能来计算波段集相关系数,检验水准为α=0.05。
2.结果
2.1 广州市新冠肺炎的核密度估计
本课题运用核密度分析法来估算新冠肺炎确诊病例在500 m×500 m的网格单元上的空间分布密度值。关于半径的优化选择目前尚未有明确统一的标准,需根据实际需求进行筛选抉择。在本研究中,经过多次试验,最终将半径设置为5 km(图4)。如此设置既能保留空间要素点足够的局部特征,又能较好地展现其整体状况。
图4显示,广州市新冠肺炎确诊病例在空间分布中具有明显的聚集性,核密度高值区域主要集中在以市政府为核心的城市中心地段,并在花都区和番禺区形成两个次中心。相比之下,这些都属于经济繁荣、交通便捷和人口流动频繁的地段。从整体上看,新冠肺炎确诊病例在越秀区、荔湾区、海珠区和天河区的密度值较高,而远离城中心的城郊地区,如增城区、从化区和南沙区的密度值较低。
2.2 广州市新冠肺炎传播的空间相关性
新冠肺炎确诊病例的分布是否具有空间相关性?本课题通过计算各个网格中确诊病例的密度值,再测算Moran′s Ⅰ指数和LISA指数来分别从整体和局部展示其在空间上的集聚度。对广州市新冠肺炎分布密度的全局自相关性和局部自相关性进行定量分析如下。
计算出广州市新冠肺炎分布密度在99次MonteCarlo随机模拟环境下得到Moran′s Ⅰ指数为0.92,Z得分值为323.56,P小于0.01,结果证明新冠肺炎在空间分布上存在显著的正相关性。并计算出广州市新冠肺炎分布密度的LISA统计值,由此获得其在局部空间的集聚特征(图5)。
图4 广州市新冠肺炎确诊病例核密度分布图
图5 广州市新冠肺炎确诊病例局部空间特征图
从整体上看,广州市新冠肺炎传播的高风险区域(高高集聚区)主要分布在以市政府为中心的区域。广州市新冠肺炎疫情防控的效果明显,主因是高风险区域主要局限于市中心地带,没有造成大范围传播扩散。
广州市新冠肺炎的传播扩散具有明显的阶段性,新增确诊病例初期增长迅速,中期逐渐回落,后期基本无新增确诊病例。对各个阶段新增确诊病例的分布密度进行Moran′s Ⅰ指数的计算发现,Moran′s Ⅰ指数从第一阶段到第三阶段逐渐下降(图6),表明新冠肺炎传播的空间聚集性从强转弱。
2.3 广州市新冠肺炎传播的空间风险因子
流行病传播在无人为影响的自然情况下,往往呈现指数增长的模式,扩散速度极快[16]。新冠肺炎在空间上的传播受到多种风险因子影响,如道路交通状况和各类公共场所的空间分布状况等。本课题空间风险因子的选择主要根据广州市内的重要公共场所的POI数据,与传统的抽样数据相比,POI数据作为体现真实地理实体的点状空间数据,具有更新及时、内容详细且准确度高等特点[17]。因此,本课题选择商店、饭店、宾馆、医院、旅游景点和公交车站6种类型的POI数据作为空间风险因子进行研究,并运用核密度分析法对各类POI数据进行估计(图6a-f),为保持一致性,图6所选用核密度估计半径均为5 km,并对核密度图进行归一化处理,以消除因POI数量不等对密度差异的影响。
图6 广州市新冠肺炎Moran′s Ⅰ指数的时序变化图
对比分析各类风险因子的分布密度图(图7)、新冠肺炎确诊病例分布密度图(图4)发现,两者具有较强的对应关系。
以各个网格单元作为研究样本,对广州市新冠肺炎确诊病例和各类空间风险因子的密度值进行波段集相关性分析(表1)。
(a)商场 (b)饭店
(c)宾馆 (d)医院
(e)旅游景点 (f)公交车站
表1 新冠肺炎分布与各类空间风险因子的相关性系数
表1显示,各类空间风险因子分布密度值与新冠肺炎患者分布密度值呈高度正相关(均P<0.05)。其中,医院的相关系数值最高。通过对新冠肺炎空间因子的识别分析,挖掘其空间传播影响因素,对制定科学有效的防控措施具有积极作用。
3.讨论
本课题以广州市347例新冠肺炎确诊患者的时空数据作为研究样本,运用地理信息技术和空间统计学方法,探讨新冠肺炎传播时空特征及空间风险因子,基本结论与相关建议如下:
(1)新冠肺炎的传播整体上呈波动式“爆发性增长-缓慢下降”的演变特征。主要的原因在于新冠肺炎暴发的初期,正值春节期间,人员大范围密集流动,未被隔离的患者自由流动,以及民众的自我防护的意识较差和医疗、公共卫生经验不足等,使得新型冠状病毒的传播基本处于自由扩散的状态;随着广州市启动最高级别公共卫生事件应急响应机制,组织各方力量开展联防联控,将市内全部居住小区(村)实施封闭管理,颁布“口罩令”和实施一系列消毒措施,使得新冠肺炎在中后期的传播受到了很大限制,新冠肺炎患者的空间聚集性也随之减弱。
(2)新冠肺炎传播存在明显的空间相关性,空间聚集性呈现随防控措施的增强而逐渐降低的趋势。设立定点医院方案在实践中证明是有效可行的,能够集中资源,提高新冠肺炎治愈率。所以应根据地区面积、人口和医疗水平等因素建立相应的传染病收治医疗机构。
(3)新冠肺炎高高值区域主要分布在城市中心地区,并在花都区和番禺区形成两个次核心区,而低低值区域则主要集中在远离城市中心的城郊地区。城市中心作为公共活动的核心区域,各大商圈集中,流动人口复杂,极易造成病毒的传播和感染,应实施“内防扩散、外防输出、严格管控”策略,以免波及周边区域;安全区域(低低集聚区)主要位于远离城中心的区域,隐患区域(随机分布区)主要位于中间区域,这两个区域需实施“外防输入”策略。据此,有关部门需做好分区分级工作。
(4)商店、饭店、宾馆、医院、旅游景点和公交车站等空间风险因子能推动新冠肺炎的传播,且影响程度不同,新冠肺炎与医院的相关性最强。医院相关性最强的可能原因在于医院是传染源和易感染者集中的区域。因此,对医院的严格管控是抑制新型冠状病毒进一步扩散的有效手段。
(5)将流行病学与地理信息技术和空间统计方法相结合有助于高效、清晰识别患者的时空规律和交互模式。
综上所述,对于新冠肺炎突发性公共卫生事件,其应急和防控措施并不是某一学科领域的事情,涉及地理信息学、空间统计学、医学、心理学和行为学等多科学领域,高效有序的防控措施需要综合多学科进行探索研究。