基于多源数据的流行病学特征分析及传播影响因素分析
——以河北省为例
2021-08-23肖媛媛冯超颖蔡瑞鑫吴淑仪
肖媛媛 冯超颖 蔡瑞鑫 吴淑仪
(江西师范大学地理与环境学院,江西 南昌 330022)
2020 年初,新冠肺炎疫情席卷全球,世界卫生组织将新冠肺炎疫情列为“全球大流行病”。面对突如其来的新冠疫情,举国上下迅速应对,有效遏制了扩散趋势。随着疫情扩散趋势逐渐被控制,我国率先进入后疫情时代[1]。后疫情时代不是指病毒完全消失、疫情不会爆发,而是时起时伏,一种小规模爆发的状态[2]。但这并不意味着高枕无忧,还需要时刻警惕。
国内外目前关于新冠肺炎病毒的传播影响因素研究与传播趋势预测中,有毕佳[3]等学者结合人口、医疗、经济情况改良SEIR 模型对突发公共卫生事件演变趋势进行评估与预测,改良后的SEIR 模型拟合效果良好;有梁泽[4]等学者通过使用GWR 模型研究疫情爆发时期人口迁徙与社会经济因素对新冠肺炎发病率的影响,发现二者与新冠肺炎发病率有明显的空间依赖特征;马艺文[5]等学者通过研究小区物质环境、周边设施、居住人口三大类指标分析小区规模、人口流动性、小区品质等空间特征对疫情发展的影响范围;Mugen Ujiie[6]等学者通过泊松回归分析评估温度对日本COVID-19 传染性的影响,发现低温与COVID-19 感染风险增加之间可能存在关联,但在全球一级需要进一步的评估。但是国内外目前对于后疫情时代的新冠肺炎病毒的时空扩散影响因子研究仍然不足。
本文以河北省作为研究区域,以河北省2021 年1 月为研究时间,构建气象因子和城内出行强度两大要素,获取包括平均温度、湿度、风向角度、城内出行强度等多项指标,使用泊松回归分析对河北省后疫情时代新冠病毒传播的原因进行建模与分析,找到河北省后疫情时期新型冠状肺炎病毒传播的主要影响因子,为后疫情时期的疫情防控预警工作常态化提供新思路。
一、数据源
河北省2021 年1 月2 日-31 日疫情数据来源于河北省各市卫生健康委员会发布的“新型冠状病毒肺炎确诊病例信息通报”。病例数据包括累计确诊病例数、新增确诊病例数等;河北省2021 年1 月2 日-31 日气象数据来源于中国气象局,包含平均温度、湿度、降雨量及风向角度等数据;河北省2021 年1 月2 日-31 日城市出行强度数据,数据来源于百度迁徙-百度地图慧眼平台(https://qianxi.baidu.com/);河北省2020 年各市人口密度数据来源于德国的 Michael Bauer 研究中心,该研究中心每年都整理来自联合国、世界银行等发布的数据,以空间数据发布在线地图服务;河北省2019年各市综合医院数据来自于Esri 公司旗下面向全球用户的公有云GIS 平台ArcGIS Online(http://www.arcgisonline)中所公布的公开数据;河北省2019 年公共管理与公共服务用地、商业服务业设施用地、道路交通设施用地以及公用设施用地数据来源于《中国城市建设统计年鉴2019》。
二、研究方法
本文使用核密度分析、Possion 回归模型等方法分析多源数据的时空分布特征及拟合多源时空数据对每日新增确诊人数的泊松分布模型,对疫情爆发的主要解释变量的特征和原因进行分析。
(一)核密度分析
由地理学第一定律可知,任何的事物都是空间相关的,距离近的事物比距离远的事物的空间相关性更大[7]。核密度分析基于此理论,计算要素在其邻域中的密度,每个栅格像元中心的周围都定义了一个邻域,将邻域内要素的数量相加,然后除以邻域面积,即得到要素的密度。在设置的搜索半径范围中,要素密度值随着与要素距离的增大而减小。核密度估计是分析空间要素聚集特征的一种较为重要的非参数化方法[8],其计算公式为
(二)poisson 回归分析
Poisson 回归模型是基于事件的计数变量而建立的回归模型[9],常被用于描述概率较小的事件的发生规律[10]。
本文采用Stata16.0 对河北省每日新增确诊数据进行统计分析。由于疫情传播与人口流动、天气与气候变化等因素具有一定的相关性,且河北省每日新增确诊人数时间变化符合Poisson 分布函数,因此我们以2021 年1 月2日-31日河北省每日新增确诊人数数据为被解释变量,以2021年1月2日-31日气象数据(包括平均温度、湿度、风向角度)和城内出行强度为解释变量,建立Poisson 回归方程,评估河北省每日新增确诊数据与气象数据和城内出行强度之间的关系,分析河北省各市COVID-19 在时间上的扩散特征。
三、结果与分析
(一)河北省疫情时空分布特征
1.河北省疫情时间扩散规律。2021 年1 月2 日至2021 年1 月31 日,河北省累积报告COVID-19 确诊人数共有1172 例,主要来自石家庄市以及邢台市,两地市的累积COVID-19 确诊病例数分别为894 例和94 例,其他各市的累积COVID-19 确诊病例数仅占全省的15.7%。据图1 可知,河北省1 月份下旬开始累积COVID-19 确诊病例数趋于平缓,且每日COVID-19 新增确诊数据呈现先上升再缓速下降,在1 月15 日达到峰值,最高为150 例。截至北京时间2021 年1 月31 日,河北省多市并未发现确诊病例,说明河北省的抗“疫”措施取得了优秀的成果,并未造成大区域扩散。
2.河北省疫情空间扩散规律。为直观了解河北省COVID-19 疫情在空间格局变化规律上的细节特征,本文按照疫情整体变化趋势绘制了2021 年1月6日、1月12日、1月18日以及1月24日河北省累积确诊人数分布图(图3)。研究发现截至1 月6 日整体疫情形势较轻,确诊病例数量主要集中在石家庄市、唐山市以及邢台市这三个区域,最高累积确诊人数为62人;截至1月12日,累积确诊病例数量有明显的增加,尤其是石家庄市,累积确诊人数高达333人;截至1月18日,随着COVID-19疫情突破潜伏期爆发,河北省疫情大幅度爆发,其中省会石家庄的累积确诊病例数量高达774 例,成为河北省此次疫情的重灾区,此时邢台市的疫情状况也进一步严重;截至1 月24 日,疫情分布的空间格局基本稳定,同1 月18 日空间分布情况,仅石家庄市和邢台市的累积确诊比例数量有所增加。
(二)河北省疫情扩散影响因素特征分析
河南省COVID-19 的扩散影响因素包含了2021 年1 月2 日-31 日每日城内出行强度和气象数据(包括温度、湿度和风向角度)。首先是城内出行强度特征。河北省各市在2021 年1 月2 日-31 日的城内出行强度结果如图 3所示。其中保定市、沧州市、承德市、邯郸市、衡水市等地市的变化幅度较小,变化趋势基本一致,基本没有受到此次疫情的影响。而石家庄市和邢台市的变化幅度较大,出行强度明显低于其他地市。1 月6 日,石家庄市城内出行强度骤降,一直持续到1 月24 日,才缓慢上升。邢台市的疫情爆发不及石家庄市严重,因此其城内出行强度较高于石家庄市,在1 月7 日开始下降,1 月12 日开始缓慢上升。在1 月5-8 日之间,各市的城内出行强度均有一次骤降,结合图 4 可知,此时河北省受冷空气南下影响,出现了全省性的寒潮天气,温度骤降导致了各地人口出行强度下降。
其次是气象因素特征。河北省各市气象数据如图5 所示,结合河北省气候中心发布的《气候灾害监测公报》可以发现,2021 年1 月5-7 日河北省受极地的冷空气南下影响,自北向南出现全省性的寒潮降温天气。截至1月7日,河北省平均最低气温低至-20.7℃,是从1967 年至今最冷的一天,同时我们结合河北省COVID-19 疫情数据发现,累积确诊病例数据爆发的拐点时间也在1 月6 日-9 日之间,说明气象因素对河北省COVID-19 疫情扩散具有一定的影响。1 月5-7 日,河北省全省9 成地区的大幅度降温,主要集中在唐山、秦皇岛西南部、廊坊以及沧州等地。伴随着降温过程,河北省全省湿度也随之降低,变化趋势与温度大致相同。在此期间,河北省各市的风向角度也有较大差异。其中,保定市、邯郸市等区域日均风向角度变化幅度相较其他地市较大。张家口市以及石家庄市日均风向角度变化幅度较为平稳。
(三)河北省疫情扩散特征
本文分析了COVID-19 在河北省的扩散特征,表 1 为2021 年1 月COVID-19 每日新增确诊人数影响因素Poisson 回归模型分析结果。该模型结果显示,城内出行强度、湿度以及风向角度因素具有统计学意义且 R2为82.3%。
表1 Poisson 回归分析结果汇总
结论:本文运用Poisson 回归分析方法,结合多源数据对河北省2021年COVID-19 疫情爆发进行了归因分析,探讨河北省2021 年COVID-19 疫情爆发的传播规律,并且由河北省COVID-19 疫情整体的感染情况对各市的传播特征进行深入分析。得到以下结论:对河北省2021 年COVID-19 疫情传播的相关影响因素(每日各市城内出行强度和气象数据)进行Poisson 回归分析,结果显示多个影响因素具有统计学意义,且回归模型R2 为82.3%。总之,基于多源数据对河北省此次COVID-19 疫情传播进行评价分析,为河北省各市在后疫情时代进行有效规划管理提供科学依据,为其他地区对疫情的长期防范提供了范式参考。