基于时空加权泊松回归模型的全国布鲁氏菌病分布特征与影响因素分析*
2022-09-14新疆大学数学与系统科学学院830046
新疆大学数学与系统科学学院(830046)
毕圣贤 别思羽 张辉国 胡锡健△
【提 要】 目的 分析2014-2018年全国31个省、直辖市、自治区全年日照时长、平均气温与牛、猪、羊年底头数对布鲁氏菌病(简称布病)发病数影响的时空变化特征,为今后制定科学防治措施提供理论依据。方法 建立时空加权泊松回归模型,对系数函数进行置信区间检验与可视化分析,揭示变量间相互影响的时空非平稳性,并与地理加权泊松回归模型拟合结果相比较。结果 全国布病发病数时空分布特征明显,且与五个宏观因素密切相关;时空加权泊松回归模型能有效吸收时间信息与地理信息,回归关系与系数函数具有时空非平稳性,拟合优度检验(R2,AICc,RSS)结果优于地理加权泊松回归模型。结论 全国布病防治工作取得一定进展,但今后仍需重点关注北方疫情热点区域,并做好南方疫情冷点区域的监测工作,避免疫情向南方蔓延。
布鲁氏菌病(brucellosis,简称布病)是最常见的人畜共患慢性传染病之一,通过接触感染的牛羊等动物与未消毒的奶制品传播,其病死率低,但易复发[1-3]。2000年以来,我国人间布鲁氏菌病疫情进入了快速扩张阶段[4],成为公共卫生安全的重大威胁。
目前对布病的流行病学研究集中在时空相关性方面[5-8],通过时空回归模型研究布病发病与其感染人群所处环境间时空异质性研究尚未见报道。Huang等基于传统地理加权回归理论提出了时空回归模型理论[9],并进行了实证分析;张亚慧等与孙舒曼等分别利用地理加权泊松回归模型与时空加权回归模型分析了全国艾滋病发病数分布特征[10-11];赵媛通过线性回归方程、spearman相关分析与空间自相关分析研究了宁夏布鲁氏菌病的分布特征与影响因素[12]。本文在上述研究基础上,建立时空加权泊松回归模型,分析2014-2018年全国31个省、直辖市、自治区布病发病数与全年日照时长、平均气温、与牛猪羊年底头数的异质性关系,揭示变量间相互影响的时空非平稳性,并与地理加权回归模型拟合结果相比较。
资料来源与方法
1.资料来源与预处理
2014-2018年全国各地区布病发病率(每10万人)来自2015-2017年《中国卫生和计划生育统计年鉴》与2018-2019年《中国卫生健康统计年鉴》,各地区年底人口数(万人)、降雨量(毫米)、全年日照时长(小时)、平均气温(摄氏度)、平均相对湿度(%),牛、猪、羊年底头数(万头)来自国家统计局官网《中国统计年鉴》,布病发病人数由发病率与各地区人口数相乘得到。31个省、直辖市、自治区空间位置的平面坐标通过WGS_1984_Albers投影坐标系统转换得到。对降雨量、全年日照时长等七个宏观因素进行标准化处理,消除单位影响,建立线性回归方程,并通过逐步回归的方法筛选自变量,显著性水平取0.05,最终保留下的五个自变量是全年日照时长、平均气温与牛、猪、羊年底头数。
2.研究方法
广义线性泊松回归模型用来研究疾病发病数与各影响因素间的关系。本文以五个宏观因素为解释变量,2014-2018年各省、直辖市、自治区布病发病数为响应变量,分别建立时空加权泊松回归模型(GTWPR)与地理加权泊松回归模型(GWPR),通过研究不同模型系数函数间的关系,揭示回归关系与回归系数的时空非平稳性。
GTWPR模型[9]选取对数函数作为连接函数,其线性预测部分表达形式为:
ηij=ln(uij)
其中uij为第i地区第j年布病发病数,Xij1、Xij2、Xij3、Xij4、Xij5分别表示第i地区第j年的全年日照时长、平均气温与牛、猪、羊年底头数指标,βp(ui,vi,tj),p=1,2,3,4,5表征五个宏观因素对布病发病数的影响程度,(ui,vi,tj)反映系数函数的时空位置。
GWPR模型[13]线性预测部分表达式为:
ηi=ln(ui)
ui为第i地区布病发病数,系数函数只包含地理信息。两类加权回归模型核光滑方法均选用Gauss核函数,光滑参数通过AICc准则确定,非平稳性检验通过bootstrap置信区间算法完成。
GTWPR模型与GWPR模型系数函数的估计与bootstrap算法检验由R软件完成;2014-2018年全国布鲁氏菌病时空分布图通过excel 2013绘制;其他作图部分通过argis 10.2软件实现。
结 果
1.布病发病数的时空分布
2014-2018年全国布病报告病数共239228例,总体呈下降趋势。其中山西、陕西呈递减趋势;辽宁、黑龙江、河南、甘肃、宁夏、新疆在2015年达到峰值后稳步下降;河北、吉林报告病数逐年递减后在2018年出现小幅增长;内蒙古与山东布病疫情在2016年分别达到峰谷与峰顶后最终恢复到2014年状态;南方各地区报告病例数则一直维持在较低水平。总体来看,全国布病疫情时空差异明显,呈北重南轻分布。以甘肃、宁夏、陕西、河南、山东等地区构成的疫情缓冲带,将全国划分成新疆、内蒙古与山西、黑龙江与吉林等三个北方疫情热点区域,与南方疫情冷点区域,结果见图1。
图1 2014-2018年全国布病时空分布图
2.系数的估计
两类时空加权回归模型系数函数估计范围见表1。结果显示,GTWPR模型五个系数函数估计范围均表现从负到正,且四分位间距较大,提示在该模型中影响布病发病的五个宏观因素间存在较强的时空非平稳性;在GWPR模型中,β1、β4与β5系数函数估计结果表现正值,β2与β3系数函数表现负值,提示在该模型中全年日照时长、猪年底头数与羊年底头数对布病发病起正相关作用,平均气温与牛年底头数对布病发病起负相关作用。同时GWPR模型系数函数的取值范围都在GTWPR模型的系数函数取值空间内,提示地理加权模型估计结果能在时空加权模型中得到解释。
表1 两种模型系数估计范围
3.非平稳性检验
检验回归关系的非平稳性,实质就是检验模型参数是否为零,即检验假设:H0:βk(u,v)=0或βk(u,v,t)=0对某个参数成立。本文通过比较模型所有系数函数置信区间是否含零进行总体显著性检验,GTWPR模型与GWPR模型系数函数置信区间通过bootstrap方法得到,置信度为95%,结果见表2。结果显示,两类加权回归模型都通过总体显著性检验,存在时空非平稳性。同时,两类模型的β1、β4与β5系数函数置信区间表现正值,β2与β3系数函数置信区间表现负值,提示五个宏观因素对布病发病存在不同的正负相关作用。
检验时空加权回归模型中回归参数的非平稳性,即检验回归参数在不同时间位置与空间位置上是否有相同取值。推广Alireza等[14]通过比较置信区间宽度检验系数函数空间非平稳性的方法,检验GTWPR模型与GWPR模型系数函数的非平稳性,结果见表3。检验结果显示,GTWPR模型系数函数非平稳性检验指标优于GWPR模型。
表2 回归关系的非平稳性检验
表3 系数函数的非平稳性检验
4.拟合优度检验
拟合优度检验是衡量模型拟合优良性的重要准则[15]。分别对GTWPR模型与GWPR模型进行拟合优度检验,结果见表4。结果显示,GTWPR模型AICc信息准则、残差平方和RSS与均方误差MSE小于GWPR模型,可决定系数大于GWPR模型,表明GTWPR模型能更好拟合布病发病数与五个宏观因素的回归关系。
表4 拟合优度检验
5.系数的可视化分析
对GTWPR模型五个系数函数的估计均值进行可视化分析。结果显示,五个宏观因素在不同空间位置上对布病发病的影响存在显著差异。全年日照时长与布病发病呈正相关关系的是甘肃、青海等17个地区,呈负相关关系的是新疆、西藏、内蒙古等6个地区,东北、华北与江西、湖南等地区相关关系不明显,提示多数地区日照时长对布病发病有正相关作用。平均气温与布病发病呈正相关关系的是西藏、陕西等5个地区,宁夏、湖北、湖南、上海相关关系不显著,布病报告病例数最多的内蒙古、新疆、山西、河北等地区,均表现强负相关关系,提示较低的气温是影响布病发病的重要因素。牛年底头数与猪年底头数系数函数从西向东分别呈递增与递减趋势,西藏与西北地区在牛年底头数上的负相关作用最明显,西北地区在猪年底头数上的正相关关系最明显。羊年底头数方面,与布病发病呈强负相关关系的是西藏、云南、贵州、广西、广东、海南等疫情冷点区域,呈强正相关关系的是甘肃、青海两省,东南沿海地区按与疫情热点区域的距离正相关作用不断增强。畜牧业的三项宏观因素系数函数表现结果提示,西藏、云南、广东等南方地区受羊年底头数影响最大,处于疫情冷点;新疆、内蒙古、河北、山西等北方疫情热点地区单项畜牧业因素系数函数特征不显著;东南沿海地区受牛、羊年底头数的影响,疫情防控形势严峻,但猪年底头数对东南地区布病疫情影响不大,可能与该地区成熟的圈养模式有关,减少了家畜感染布鲁氏菌病的机会[5]。
讨 论
时空加权泊松回归模型将时间信息与空间信息引入到布鲁氏菌病发病的回归关系研究中,探究布病发病的时空分布特征与影响因素,能充分反映回归关系的时空异质性。逐步回归方法筛选出五个宏观因素,即全年日照时长、平均气温与牛、猪、羊年底头数对布病发病数均有显著影响。
时空分布图显示,全国各地区布病发病数具有时空聚集性,在时间上呈递减趋势,在空间上呈北重南轻、中间过渡分布态势,表明随着2014年加强布病疫苗接种工作以来,全国布病疫情时空扩散趋势已得到较好控制,但北方尤其是内蒙古地区仍是高发区域,存在疫情扩散风险。系数估计结果、非平稳性检验与拟合优度检验表明,GTWPR模型能更好拟合布病发病数与五个宏观因素的回归关系,且GWPR模型系数估计结果能在GTWPR模型中得到合理解释,进一步说明了GTWPR模型在解释布病发病异质性特征方面的优越性。
异质性分析结果表明,西南地区受羊年底头数较少影响,处于疫情冷点;东南沿海地区受牛、羊年底头数共同影响,虽然近几年疫情防控压力增加,但因其牛、羊基数较少,仍处于疫情冷点;北方尤其是新疆、内蒙古等疫情热点区域,受五个宏观因素综合影响,人间布病的感染居高不下。其原因可能是(1)畜间传播是导致布病发病的主要因素,北方尤其是内蒙古、新疆等地畜牧业发达,人畜同院、散养放养的传统饲养模式导致布病疫情多发;(2)北方地区充足的日照与较适宜的温度有利于布鲁氏菌的存活繁殖,也为发展畜牧业提供良好条件,从而增加传染源与传播的宿主密度,为布病疫情的扩散带去了便利[4];(3)人间布病的感染不仅受畜牧业的影响,还受环境因素、经济因素、社会因素与相关行业从业人员卫生防护意识、身体免疫力等的综合影响,东南沿海地区经济发达,从事牛羊养殖与屠宰职业人群较多,增加了布病防控压力。五个宏观因素的整体分析表明,畜间发病是引起人间布病的必要不充分条件,这与杨祖荣等[16]和吴晨等[7]通过分布滞后线性模型与空间回归模型研究布病发病影响因素的结论一致。
图2 GTWPR模型系数函数分布
布病防控是一项长期工程,需联系五项宏观因素并结合各地区实际采取有效措施。要密切监测北方牧区畜间疫情,提高监测水平与疫苗接种率,对病畜要及时捕杀、焚烧或填埋,并严格做好圈舍的消毒工作;要增强东南沿海地区牛羊暴露人群的健康教育,提升防护意识,同时加强西南地区跨地区畜牧产品检疫与管理,切实做好布病防控工作[17]。
综上所述,2014-2018年全国布病发病呈递减趋势,时空分布特征明显,且受气候因素与畜牧业因素等的多重影响。布病防控工作虽取得一定进展,但仍需重点关注新疆、内蒙古等疫情热点区域的发病情况,并做好南方疫情冷点区域的监测工作,避免疫情向南方蔓延。