基于深度学习的新型冠状病毒的防护措施研究*
2022-02-18王亦瑶关军龙陈欣宇
王亦瑶 , 韦 怡 , 关军龙 , 陈欣宇
(江西科技学院,江西 南昌 330200)
根据过去大量监测数据报告可知,伴随全球气候的巨大变化,多种极端天气出现的频率及强度越来越高。联合国政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)曾指出,未来气候变化的模拟结果提示人们极端天气的出现会加剧传染疾病的频发[1],而伴随着病例数的上升,有理由认为天气、降水等环境气候因素会影响新型冠状病毒的传播趋势[2]。并且,世界各地区在冬季寒潮效应期间[3],因居住环境温度低导致病毒的传播概率增加,加上有的地区因医疗落后等各种原因导致传染病的传播和扩散。而作为现阶段杀伤力最强的传染性疾病——新型冠状病毒肺炎,它的防控和治疗是目前全球公共卫生领域关注的焦点。但遗憾的是,由于分析方法和所得数据的限制,迄今为止仍没有强有力的流行病学数据,来证明气候环境对新型冠状病毒肺炎的发病和传播有相关影响[4]。因此,本研究重点对新型冠状病毒与气候特征的关系及其在环境传人下的防护措施展开探索,并基于深度学习、图像处理和神经网络等技术[5],构建VGG模型对气候变化导致的新冠肺炎发病和传播风险进行分析预测,同时根据风险预测结果,结合实际情况,提出关于在环境传人背景下新型冠状肺炎防控的有关建议。
1 基于深度学习的VGG模型
1.1 深度学习算法
深度学习是目前机器学习领域的研究热点,其中深度卷积神经网络是近年来发展最为迅速的计算机视觉技术,被广泛应用于医学图像分析中[6-13]。而基于深度学习的VGG模型是Oxford的Visual Geometry Group组织提出的,该网络的相关工作是在ILSVRC 2014上进行的。其主要内容是证明增加网络的深度,能够在一定程度上影响网络最终的性能。如图1所示,VGG16是由卷积层、池化层、全连接层等组成。本研究主要通过建立深度学习VGG模型,从生产的影像数据中自动分割出目标参数,并提取其可能存在的影响新型冠状病毒传播的气候特征。
图1 VGG输入输出网络结构
1.2 构建VGG模型
流行病学与计算机科学两门学科的结合,体现出大数据与人工智能时代的到来以及无行业不AI的思想。同时通过结合今年新兴起的深度学习方面的相关知识,建立模型对大量天气数据进行训练,从而得出一定的规律与预测概率,其中主要运用到的是卷积层中卷积的概念。
卷积的定义:我们称(f*g)(n)为f、g的卷积。其具体公式如下。
其连续的定义为:
其离散的定义为:
VGG16模型中使用了卷积神经网络的方向传播算法,如图2所示。反向传播算法公式:
图2 卷积神经网络的方向传播算法
其中,n_inn_in为上一隐藏层的输入子矩阵个数。注意到zl和zl−1zl−1的关系为:
因此,可以得出:
反向传播通过损失函数计算输出层的δl,然后L通过三种不同的情况进行反向传播算法计算,如果当前是全连接层则有:
如果当前是卷积层则有:
如果当前是池化层则有:
这里的pool指按照池化区域大小k和池化标准将输入张量缩小的过程。如果所有W,bW,b的变化值都小于停止迭代阈值ϵϵ,则跳出迭代循环输出各隐藏层与输出层的线性关系系数矩阵WW和偏移向量b。VGG模型的反向传播在一定程度上提高了模型的准确率。
2 气候数据的分析及防疫建议
2.1 气候数据的来源
基于钟南山院士所提出的环境传人的新观点,本文旨在研究天气气候特征的变化与环境传人的关系。而研究气象环境因素对新型冠状病毒的影响至少要获得三类数据,即气象数据、疾病数据及人口统计学数据。因相关数据来源不同导致可靠性的不统一,所以本文采用来自中国疾病预防控制中心、公共卫生科学数据中心、法定报告传染病监测系统的疾病数据。它们均是由中国疾病预防控制中心于2004年开始成立并运行的,至今为止报告的准确性已经接近100%。此外,气象数据来源于中国气象数据共享服务系统,可获得全国752个站点的气象信息。人口数据来自中国公共卫生科学数据中心。所以可以认为本研究所用的疾病数据、气象数据、人口数据的来源均具有科学性和可信性。
本研究以江西省赣州市为例,其数据分析的时间为2019年12月至2020年12月,时间尺度为月数据。其中,从当地的卫生行政部门获取疾病数据;从中国气象数据网获取该市的当前时间段气象数据及未来时间段的气象预估数据;从中国疾病预防控制中心、公共卫生科学数据中心获取当前时间段的人口资料并基于WHO公布的中国未来的人口增长率,同时结合当前时间段的人口数来预估研究区域的暴露人口数,这些数据的来源很大程度上是可信的。
2.2 气候特征的研究
通过对全国天气分布情况图的分析,进而获取赣州市1年的气温变化、气候分布及风向分布情况,高温对新型冠状病毒的传播和活性存在明显的抑制作用。同时对所得到的数据进行相关性分析,得知新型冠状病毒的病例数与平均气温、平均相对湿度、平均气候分布和平均风速成负相关。本研究以赣州市为例把其2020年的病例数(Y)作为因变量,将平均气温(X1)、平均相对湿度(X2)、平均气候分布(X3)、平均降水量(X4)和平均风速(X5)作为自变量,选择多元逐步回归法进行处理来进一步得出各气候对病毒的影响,如表1所示。结果表明:X2、X4和X5选入方程。方程为:
表1 新冠病毒病例与气象特征的相关性表
2.3 新型冠状病毒肺炎防疫建议
1)赣州市的1月至4月为年气温最低时期,新冠病毒在该阶段得到了极有利的传播条件,普通的天气温度或是空调暖气制热无法达到高温消除病毒的效果,且在这一阶段该市平均相对湿度(X2)较高,故而当Y>10时,表明在这一阶段各防疫部门应时刻保持紧急状态并严格控制人流聚集,同时呼吁各家各户保持家居环境的干燥以减少新冠病毒的传播。而对于外地人员必须建立体温检测、发热咳嗽等异常情况报告、应急处置等防控制度。市区体温日常检测应落实到每家每户,有发热症状者立即报告,同时送到定点医疗机构就诊,并加强对公共场所定期清洁消毒。
2)在5月至9月,即赣州市气温开始回升时期,此时新冠病毒的传播相对受到抑制,故而在该阶段,当Y≤0时,该市进行一些正常的防护措施即可,无须过度紧张新冠病毒的传播。对每家每户进行日常防疫宣讲,保证居住的住所每天开窗通风。同时可以通过煮沸的方法进行一些物品的消毒,保证室内温度及湿度相对稳定,从而降低感染新型冠状病毒的概率。另外市民在外出时,尽量戴好口罩。
3)在赣州市空气温度及空气湿度开始下降时,即在10月至12月期间,该市各部门应时刻关注并及时监测本市的平均气温、平均相对湿度、平均降水量、平均风速等影响新冠病毒病例数的因素的变化,积极应对在气温开始下降时新冠病毒的传播。当Y>0时,加强对市民外出的管控程度,严禁在雨天或低气温的天气出行,从源头降低人们感染新型冠状病毒的概率。同时通过化学手段(如紫外线、含氯消毒剂等)对医护所在地进行物理消毒,保证医院等感染新冠病毒高风险地点的环境整洁及干燥。
3 小结
2020年世界各国因新冠病毒大肆传播导致的确诊以及死亡人数居高不下,与此同时各国的经济状况也受到了不同程度的打击。因此,针对气候变化与疾病的关系,尤其是传染病方面的研究逐渐成为全球范围内的研究热点,而在钟南山院士及其团队提出新冠病毒出现环境传播这一新课题后,该研究热点已然成为目前全球共同关注的焦点。本文以赣州市一年的平均气温(X1)、平均相对湿度(X2)、平均气候分布(X3)、平均降水量(X4)和平均风速(X5)作为自变量,选择多元逐步回归法进行处理,最后,针对预测结果提出相关防疫建议。