模型驱动助力突发公共卫生事件应急决策
2021-07-28仰恩大学工程技术学院黄紫成
◇仰恩大学工程技术学院 黄紫成
突发公共卫生事件对人民群众生命健康造成重大威胁,科学的应急决策能最大程度降低其带来的损失。通过计算传染病的相似程度、构建基于C4.5决策树模型的方法,力图为分析疫情爆发风险等级提供参照。突发公共卫生事件决策模型根据一个地区的经济、医疗水平及气候环境等因素判断事件风险等级,为防控疫情提供技术支持。
突发公共卫生事件的风险评估,传染病疫情的监测预警,一直是专家学者的研究热点。大数据、人工智能、云计算等数字技术在疫情检测分析与防控发挥着重要的支撑作用[1-2]。本文探讨在爆发公共传染病疫情时,与现有法定传染病进行相似性计算,并依据结果,选取相似度最高传染病构建基于C4.5决策树模型,推测疫情爆发风险等级,为防控疫情提供辅助决策。
1 研究方法及过程
1.1 传染病相似性计算
截至2020年2月4日,国家法定传染病共40种,其中甲类传染病2种,乙类传染病27种,丙类传染病11种。通过收集这40种法定传染病的基本信息,提取典型的特征属性见表1。
表1 法定传染病典型特征属性
如甲类2种传染病:鼠疫,症状:“发热毒血症症状淋巴结肿大肺炎出血”,病因:“鼠疫杆菌”,传播途径:“鼠蚤叮咬飞沫 皮肤伤口 消化道感染”,多发群体:“全员”,平均潜伏期:3天,2015-2019年平均发病率:0.00012/10万,2015-2019年平均死亡率:0.00004/10万;霍乱,症状:“突然腹泻 继而呕吐血压下降 脉搏微弱”,病因:“霍乱弧菌”,传播途径:“直接接触间接接触”,多发群体:“全员”,平均潜伏期:“2”,2015-2019年平均发病率:“0.00142/10万”,2015~2019年平均死亡率:“0”。
在匹配目标传染病案例与历史案例时,需进行属性间的相似性的计算,本文采用如下几个函数进行计算[3-4]:
(1)相等函数。比较两个属性值是否相同,若相同,相似性计算为1,反之为0。
(2)间隔函数。定义标准间隔距离,计算两个属性值的距离绝对值,利用如下公式计算:
(3)余弦向量相似度。计算两个属性之间的夹角余弦来度量它们之间的相似性,公式如下:
本文在症状、病因、传播途径、多发群体四个属性特征,采用余弦向量进行相似度计算,平均潜伏期采用相等函数计算,平均发病率、平均死亡率采用间隔函数计算,间隔设定要大于两个属性距离之差的绝对值。
现假设泉州某个地区突发公共卫生事件且传染病为一种新型的病毒,患者主要症状有发热、咳嗽、全身肌肉酸痛、乏力;传播途径主要通过飞沫、直接接触和污染物品接触传播,全员皆可被传染,平均潜伏期4天,通过统计该区当前患者数据,发病率为55.65572/10万,死亡率0.007/10万。为了不给群众造成过度恐慌或者由于对该病毒认知的偏少而贻误最佳的隔离时机。首先通过计算与当前法定传染病相似性,计算结果显示该类传染病与底下三种法定传染病最接近,相似度如表2所示。
表2 三种相似度最高的法定传染病
从表2可以得到,流行性感冒与该种传染病的相似度最高,而该种新型传染病是否为大规模爆发由于缺乏有效数据还无法评定,借鉴该地区最相似的法定传染病数据,推测爆发的风险等级具有一定的借鉴意义。
1.2 基于C4.5决策树模型构建
由于传染病疫情传播风险等级通常和一个地区经济水平、医疗水平及气候环境有很大的关系[5-6]。通过收集该种相似性最高的传染病历次观测数据,预测分析是否爆发大规模传染的可能性。收集的数据由七部分特征组成为:疫情地区范围、人口密集程度、GDP(元/人)、人均医院床位、PM2.5、平均昼夜温差、平均相对湿度。对收集的数据进行等区间离散化处理,部分数据如下所示。
表3 该区流行性感冒历次监测数据
C4.5算法采用信息增益率来构建各个结点,定义如下:
通过计算得到首次信息增益率见表4。
表4 各节点的信息增益率
通过选取最大信息增益率构建根节点如图1所示。
图1 根结点决策图
重复计算剩余节点的信息增益率构建决策树,最终得到如图2所示的完整决策模型。
图2 基于C4.5决策树模型图
通过图2得到的决策树模型,结合现有的人口聚集程度、疫情覆盖范围及经济环境因素便可以分析出当前的新型传染病疫情爆发风险等级。如:该地区现有人口密度大,恰逢秋冬交替,昼夜温差大,并且整个地区已有较大覆盖范围,就可以推测出爆发大规模传染病的疫情等级高,政府决策部门应采取紧急联动措施应对该公共卫生事件[8-9]。
2 结语
“依靠科学、专业处置”是《国家突发公共事件总体应急预案》的六大原则之一,科学的决策可以有效降低突发公共卫生事件带来各种损失。新型传染病具有众多的未知性和不确定性,大数据、人工智能、云计算等数字技术为疫情检防控提供了众多的思路。本文利用传染病的相似性计算,结合人口密度、经济环境因素构建C4.5传染病决策树模型,该模型为分析疫情爆发风险等级提供一定的依据。