APP下载

结合气象与经济因素应用长短期记忆网络模型预测郑州市手足口病的发病趋势

2023-06-28孙进刘今孙明丽刘宇琦姜玥吴伟

中国医科大学学报 2023年6期
关键词:郑州市气象预测

孙进,刘今,孙明丽,刘宇琦,姜玥,吴伟

(中国医科大学 1.公共卫生学院,沈阳 110122;2.第二临床学院,沈阳 110004;3.附属盛京医院妇产科,沈阳 110004;4.第一临床学院,沈阳 110001;5.公共卫生学院流行病学教研室,沈阳 110122)

手足口病(hand-foot-mouth disease,HFMD)是一种常见的儿童急性传染病,主要临床症状为手、足、口、臀部的皮疹、斑疹等,重症患者常因出现严重的循环系统、神经系统并发症而死亡[1]。导致HFMD的病毒为柯萨奇病毒A16型和肠道病毒71型,通过咳嗽或带菌者接触患者或其物品传播,学校、日托中心和运动队是感染以上病毒的常见环境[2]。河南省HFMD发病率总体呈上升趋势,尤其是2008年至2009年发病人数居全国前10%[3]。因此,对HFMD发病数进行精准的预测可为疾控部门提供必要的支持。

目前,HFMD的预测研究中最常用的模型为自回归移动平均模型(autoregressive integrated moving average model,ARIMA)[4]。在其基础上,还有应用小波分析[5]与加入气象因素[6]的ARIMA模型,以及ARIMA-BP组合模型[7]、ARIMA-GRNN模型[8]、灰色预测模型GM(1,1)[9]、ARIMA-RBF模型[10],预测效果超过一般的ARIMA模型,也已广泛应用于HFMD的预测。长短期记忆(long short term memory,LSTM)网络模型作为循环神经网络(recurrent neural network,RNN)中优秀的变体模型,预测效果良好,优于常用的ARIMA模型与分布滞后非线性模型(distributed lag non-linear model,DLNM)[11-12]。本研究采用LSTM模型结合气象因素与经济因素预测郑州市HFMD的发病趋势,旨在为HFMD的疫情防控工作提供理论支持。

1 材料与方法

1.1 数据获取与分析

根据郑州市疾病预防控制中心收集的HFMD相关数据,对2010年1月至2019年12月郑州市HFMD逐月发病人数绘制时序图,获取发病规律及发病高峰期。

从中国气象数据网(http://data.cma.cn)采集郑州市平均气温、降水量、极大风速等气象数据,并进行统计描述。

社会消费品零售总额能反映居民的消费水平,并作为国民经济核算的重要指标之一,反映消费过程中最重要的需求情况。由于春节效应[13],1月与2月社会消费品零售总额数据是合并值,使用MATLAB中分段3次Hermite插值的方法求得1月至2月数据。将郑州市当月社会消费品零售总额数据除以中国当月社会消费品零售总额数据,所得的数值作为数据变量进行分析,将该数据在本研究中定义为“经济比值”。从郑州市统计局官网(http://tjj.zhengzhou.gov.cn)收集郑州市社会消费品零售总额数据,从国家统计局官网(http://www.stats.gov.cn)收集中国社会消费品零售总额数据。

采用Spearman相关性分析探讨HFMD发病人数与气象及经济因素的相关性[14-15]。

1.2 LSTM神经网络构建

LSTM是RNN模型的一种变体模型,可很好地弥补RNN模型梯度消失、梯度爆炸以及长期记忆能力不足等问题[16]。其外部结构与传统的RNN结构大致相同,不同点在于其隐藏层,使LTM模型具备了遗忘和选择记忆的功能。典型的LSTM神经网络由输入门、遗忘门、输出门组成[17](图1)。

图1 LSTM模型示意图Fig.1 Schematic diagram of LSTM model

LSTM模型计算公式如下:

it为输入门,ft为遗忘门,ot为输出门。h t-1为先前的隐藏状态,wi1,wi2,wf1,wf2,wo1,wo2,xt为权重矩阵,bi,bf,bo为偏差向量。ct表示记忆细胞的状态,gt为候选信息。ht为最终的内存单元的输出[17]。

本研究将郑州市2010年1月至2018年12月的HFMD逐月发病数作为训练集,2019年的数据作为测试集。采用Python 3.9软件建立LSTM神经网络,对数据进行归一化处理,根据数据的特征选择最佳时间步为21,神经元数目为10,迭代次数为60。

1.3 评价指标

采用SPSS 26.0专家建模器完成传染病预测常用的ARIMA模型,为ARIMA(1,0,0)(0,1,1)12,将其与LSTM模型结果进行对比,以进一步验证本研究所构建的LSTM模型的有效性。用平均绝对误差(mean absolute error,MAE)和均方误差平方根(rooted mean squared error,RMSE)作为衡量模型的评价指标。MAE和RMSE的数值越小,说明模型的预测效果越好。

2 结果

2.1 郑州市HFMD发病情况统计与描述

绘制2010年1月至2019年12月郑州市HFMD发病人数时序图,结果如图2所示,HFMD逐月发病人数波动较大,存在明显的季节性流行规律,发病高峰期多出现于每年5月。

图2 2010年1月至2019年12月郑州市HFMD逐月发病人数时序图Fig.2 Time sequence diagram of monthly incidence of hand-foot-mouth disease in Zhengzhou City from January 2010 to December 2019

2.2 郑州市气象因素与经济因素统计结果

如表1所示,郑州市平均气温为(16.06±9.70)℃,平均降水量为(50.42±58.03)mm,平均经济比值约0.011 1。

表1 郑州市气象因素与经济因素统计Tab.1 Statistics of meteorological and economic factors in Zhengzhou City

Spearman相关分析结果如表2所示,平均气温与发病人数呈正强相关性,降水量与发病人数呈中等相关,经济比值与发病人数呈弱相关性。因此,本研究选取这3个因素纳入LSTM模型。最终共建立6种模型,其中,LSTM模型为不添加影响因素建立的模型,LSTMT、LSTMP、LSTME、LSTMPT、LSTMEPT分别为模型中加入平均温度、降水量、经济比值、平均温度与降水量,以及同时加入这3种影响因素。

表2 影响因素与HFMD发病人数秩相关系数矩阵表Tab.2 Correlation coefficients between the influential factors and the rank of HFMD

2.3 LSTM模型数据结果

LSTM模型数据结果如表3所示,加入某种单一气象因素或经济因素均能提高LSTM模型的预测效果。其中加入经济因素的结果不亚于单独加入气象因素的结果,同时加入3种影响因素的结果最好,并且其优于2种气象因素加入的模型。LSTM模型的训练集效果见图3。LSTM模型在2019年的预测效果见表4、表5、图4。

表4 2019年HFMD发病数与LSTM、LSTMP、LSTME模型预测值Tab.4 HFMD incidence and LSTM,LSTMP,LSTME predicted value in 2019

图3 LSTM模型训练集结果图Fig.3 LSTM model training set result diagram

图4 2019年LSTM模型的预测结果图Fig.4 LSTM model forecast results in 2019

为了验证模型的有效性,对比LSTM模型与ARIMA模型预测结果,如表6所示,LSTM模型的预测结果优于ARIMA模型,提示LSTM模型更加具有普遍性与适用性。

表6 ARIMA模型与LSTM模型拟合与预测结果Tab.6 Fitting and prediction results of ARIMA model and LSTM model

3 讨论

我国于2008年起将HFMD纳入丙类传染病管理,它是我国发病率最高、死亡人数最多的丙类传染病。近年来,HFMD的研究主要集中于病原体[18-19]、流行病学特征[20-21]、发病预测模型[22]等领域。HFMD具有季节性流行病学特征,如开学季、节假日、人口流动特点、气象因素[23-24]等多种因素都可能对HFMD的季节性流行特征造成影响。研究表明,气温[25-28]、相对湿度[28]、光照时长、降雨量[24]都可能影响HFMD的发病。HFMD的发病情况还与社会经济因素相关。LIAO等[29]研究发现,在四川省经济条件较好的地区,温度是HFMD发病的主要危险因素,而在四川省经济条件较差的县,国内生产总值则是HFMD发病的主要危险因素。有HFMD的调查问卷研究[30-31]表明,居民收入是HFMD发病情况的影响因素之一,居民收入越高,HFMD的发病率越低。本研究采用LSTM模型结合气象因素与经济因素预测郑州市HFMD的发病情况。结果显示,加入气象因素与经济因素均使HFMD预测结果更加精确,再次证明气象因素与经济因素对HFMD发病情况具有一定的影响。

目前神经网络模型在传染病预测方面的应用日益增多。高秋菊等[11]与WANG等[32]发现,应用LSTM模型对HFMD的发病情况进行预测的效果优于ARIMA模型或NAR模型,但所用LSTM模型纳入因素较少。马停停等[15]应用LSTM模型结合气象因素对济南市HFMD的发病情况进行预测,结果发现LSTM模型中同时加入温度与湿度因素能够取得最好的预测效果。本研究结果也验证了气象因素对HFMD发病情况的影响。此外,本研究还在预测模型中纳入了经济指标,结果证明纳入该指标再次提高了LSTM模型的预测精度,改进了经济指标这一影响因素在预测模型中的应用。此外,LSTM模型的应用远不止于HFMD一种疾病,LSTM模型或其组合模型还可应用于疟疾、肺结核、猩红热、肾综合征出血热等多种疾病[33-37]。

HFMD的发病情况受到多种因素影响,如地域、饮食习惯、城镇化程度、疾病的防控措施以及重大突发事件的发生等,均可能影响HFMD的发生与传播。另外,本研究仅针对郑州市的HFMD发病情况进行预测,但河南省作为中国人口大省,市级的空间分辨率较大,在区县级方面的应用可能稍显不足。HFMD作为丙类传染病中发病人数最多的传染病,对儿童造成的伤害尤为巨大,其疫情防控极其重要,了解和监测HFMD的发生,在疫情高峰期做好应对措施,是公共卫生专家以及临床医生必需重视的工作。

猜你喜欢

郑州市气象预测
无可预测
气象树
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
《内蒙古气象》征稿简则
郑州市
郑州市创新推进“八大群体”入会工作
大国气象
美丽的气象奇观
郑州市