基于案例推理的地震应急物资需求预测
2021-01-22刘贾贾李凤刘龙马旭东刘晓丹刘志辉
刘贾贾,李凤,刘龙,马旭东,刘晓丹,刘志辉
(河北省地震局,河北石家庄 050021)
0 引 言
地震是我国严重的自然灾害之一,具有突发性、不确定性等特点。地震发生后可能会造成巨大的人员伤亡,通讯、道路也会受到破坏,导致决策人对信息的了解有限,影响震后救援。地震应急救援的主要任务是救治伤员和向受灾人口运送地震应急物资,但由于信息缺失,救灾物资会存在供需不平衡的情况,因此需要对地震应急物资进行预测,通过对应急物资种类和数量的分析,预测出合理的震后应急物资需求,可以提高震后应急工作的效率,是地震应急工作的基础保障。
傅志研基于归一化处理后的欧氏算法,通过关键因素寻找最佳相似源案例,建立了案例推理—关键因素模型[1];吴斯亮将时间序列预测与递归神经网络预测相结合形成基于递归神经网络的时间序列预测方法预测震后每日死亡人数,根据人口得出动态的每日应急物资需求[2];赵小柠等基于范例推理理论,利用最近相邻法和粗糙集理论预测了主震期应急物资需求量[3];刘德元等运用Hebb学习规则调整特征因素权重值,以贴近度寻求最佳相似案例,建立了应急物资需求模型[4];王兰英等将直觉模糊集与案例推理相结合,提出了基于直觉模糊案例推理的突发事件应急物资需求预测模型[5];郭子雪等引入对称三角模糊数表示影像因素的模糊特征,建立了基于多元模糊线性回归的应急物资需求预测模型[6];张磊在深入分析地震应急救援及物资需求特点的基础上,提出了“基于时序变化的救灾物资需求预测模型”,根据受灾人口的年龄分布对物资需求量的影响进行分析,建立了向量模型来描述人口结构对生活类救援物资的影响[7]。
上述研究多是基于与历史案例进行对比分析得出新的需求案例数据,这种方法为案例推理。案例推理是通过寻找与之相似的历史案例,利用已有的数据或者已经存在的方案来解决新的问题。当某个地区发生的地震灾害事件较少找不到规律的时候,可以借鉴其他地区的历史地震灾害事件,在灾害发生时找到最相近的相似地震案例数据,让决策者进行参考,做出合理的判断。基于上述分析,本文采用基于案例推理的方法对地震应急物资需求进行预测。
应急救援物资主要有食品、药品、帐篷和器械等。在搜集数据过程中发现搜集地震应急物资的来源渠道较多,统计困难。本文采取间接推理的方法,通过案例推理得出地震受灾人口数量,再通过人口数量和物资的需求量关系求得总地震应急物资需求量。食品、水和帐篷需求量与受灾人口数量有关[8],因此主要研究地震后食品、水和帐篷的需求量。本文利用采集到的案例数据库,采用熵值法及加权欧式距离的案例推理模型推导出最佳相似案例,利用得出的受灾人口数量求得应急物资的需求量。
1 模型建立
1.1 算法原理
在案例推理算法中,需要建立历史地震案例集,通过一定的规则推导找出与目标案例最相近的最佳历史案例,通过对数据分析得出目标案例的所求数据。
设历史地震案例集C中有n个案例,案例集为C={c1,…cn},ci表示第i个案例,其中i=1,2,…,n 。
设每个历史地震案例有m个属性,案例属性集为F= {f1,…fm},fj表示历史地震案例属性集F中第j个属性,其中j=1,2,…,m。
1.2 模型的建立
1.2.1 历史地震数据集
本文数据来源于中国地震局、国家地震科学数据共享中心、中国政府网、黑龙江省地震局和百度百科等网站,并查询了国家行政区划分和抗震设防烈度区划分等资料。选取了2000年至2019年6级以上破坏性地震,因江西九江地震、云南盈江地震受灾程度较大,也列入了研究范围,地震样本数据见表1。
表1 地震样本数据
1.2.2 数据分析
对样本数据进行相关性分析,样本属性相关性相关程度高的可以对数据进行降维处理,减少数据量。相关性分析采用Pearson相关系数(Pearson Correlation Coefficient)分析,其计算公式如下:
(1)
设两个变量为x和y,当|r|为0时,表示x和y没有相关关系;当|r|≤1时,表示表示x和y线性相关,且用“+”、“-”表示正、负相关,值越大,相关度越强。地震案例库数据相关性见表2。
表2 案例库属性值相关性
判断Pearson相关系数是否相关需要看显著水平以及相关系数。**样本显著性小于等于0.01,*样本显著小于等于0.05则显著相关。经过相关性分析得出,震中烈度和震级显著相关,震源深度、时间、季节、抗震设防等级、人口密度均不显著相关。经过分析可知地震数据具有高离散型,受灾人口不能属性因素自变量线性得出,案例推理的方法更适用于地震灾害事件数据的预测。
1.2.3 确定权重
因每个属性值对结果的贡献度不一样,需要确定每个属性的权值,采用熵值法对案例库的数据进行加权,具体方法如下[9]:
(1)数据标准化。每个属性的度量单位不一样,造成了数据分析的不统一,结果也会出现偏差,为了解决这个问题需要先对数据进行标准化处理:
(2)
式中Xij表示第i个案例的第j个属性值,Xij′为Xij归一化后的值。
(2)计算权值。对标准化数据运用熵值法求权重,通过熵值法得到各个指标的信息熵,信息熵越小,权重越大。
(3)
式中Pij表示第i个案例的第j个属性值占案例库总属性值的比重。
(4)
ej表示第j个属性值的熵值,k=1/ln(n),且ej≥0。
dj=1-ej
(5)
dj为第j个属性值信息冗余度。
(6)
wj为第j个属性值的权重。
1.2.4 确定最佳相似案例
计算案例属性之间的距离就是计算两个案例之间的相似度,计算目标案例和历史案例之间的相似度采用欧式距离的方法。因为案例属性的权重值不一样,本文采用加权欧式距离算法,距离的数值越小,案例之间的相似度越高。则加权欧式距离表示为:
(7)
1.2.5 地震应急物资与受灾人口数量关系
根据受灾人口对食物、水和帐篷的需求量关系来进行地震应急物资的预测。一般情况下,每人平均的饮水的需求量为2 L左右,但是饮水量会受季节的影响,冬天的饮水量系数为1,春秋为1.5,夏天为2[10];食物的摄入量为1 000 g左右;帐篷以家庭(3人)为单位计算,每3个人使用1顶帐篷。计算各类物资时计算公式为:
水的需求量=受灾人口×2L×季节系数
(8)
食物的需求量=受灾人口×1 000 g
(9)
帐篷的需求量=受灾人口/3
(10)
2 案例分析
2.1 案例验证
2012年9月7日11时19分,云南省昭通市彝良县与贵州省毕节地区威宁彝族回族苗族自治县交界发生5.7级地震,震源深度14公里,震中烈度为Ⅷ度,抗震设防烈度为7,具体相关数据见表3。彝良县位于云南省昭通市,地处地处滇川黔三省结合部,是革命老区县和国家重点扶持的贫困县,经济发展水平较低,彝良的基础设施差,人口多,房屋的抗震性能差,震中在峡谷地带。
表3 云南彝良地震相关数据
因样本5四川汶川数据和其他样本偏离太多,则以去掉样本5之外其他样本作为实验数据,见表4。
表4 实验数据
首先将实验数据进行标准化,求得属性值权重。然后计算目标案例与数据库案例的欧式距离,得出相似度。因为地震数据的离散性,对欧式距离最小的前3个历史案例进行分析,得出目标案例的最佳历史案例,根据最佳历史案例的历史受灾人口求得目标案例的受灾人口数量,依据受灾人口数量与物资的需求量求得地震应急物资。
将实验数据进行归一化处理进行标准化,利用熵值法对案例库的数据求属性值的权重,权重值代表着相应属性值的贡献程度,表5为得到的属性值权重。
表5 属性值权重
根据计算得出的属性值权重,利用加权欧式距离得出目标案例与历史案例的距离,距离越短,案例越相似。本文根据欧式距离从小到大排序的前的3个历史地震数据为样本4、样本10、样本12,经过与目标案例的对比分析,样本4与目标案例更为相似,则样本4为求得的最佳相似案例。样本4为江西九江地震,对该地震受灾人口进行信息收集得出相关数据见表6。
表6 江西九江地震相关数据
将江西九江地震和云南彝良地震属性数据进行分析得出两个地震的属性值很接近,在这种情况下考虑人口密度对受灾人口的影响,运用公式受灾人口(彝良)=人口密度(彝良)×{受灾人口(九江)/人口密度(九江)}。受伤人数和死亡人数均运用相同的公式进行计算,经过计算得出的结果和实际受灾人口对比见表7。
表7 云南彝良地震预测受灾人口和实际人口对比
从表7可以看出,受灾人口和受伤人数基本一致,预测死亡人数比实际死亡人数多很多。经过对彝良地震的深入分析发现,彝良房屋的抗震性能弱,部分房屋结构不具备抗震性,地震发生后有数万间房屋倒塌和损坏,且因为彝良为山区地形,道路出现坍塌,救援人员不能顺利进入,减缓了救援进程,这些因素都加大了死亡人数。
2.2 地震应急物资
地震应急物资的需求量和受灾人口数直接相关,按照各类物资计算公式进行计算,在云南彝良地震发生后救灾中心在初始时间内可向彝良地区运送物资见表8。
表8 应急物资需求量
3 结 论
因为地震的突发性和不确定性,地震应急物资的需求也具有相应的特征。针对该情况,本文通过对历史案例数据库进行数据分析,建立了客观的采用熵值法和加权欧式距离求得最佳相似案例的案例推理模型。经过对目标案例和最佳相似案例的对比分析求得目标案例的受灾人口数量和受伤人数,根据受灾人口数量和受伤人数对物资的需求关系求得目标案例的应急物资需求量。
通过对该模型的验证得出该模型预测的受灾人口和实际受灾人口基本一致,能够得到合理的地震初期应急物资需求量。而对伤亡人口预测存在较大差距,除了考虑地震相关因素外还要考虑房屋质量、地理环境等因素,将这些因素考虑进去可以得到更精准的伤亡人数,从而得出伤亡人员需要的医疗、器械等救援物资数量。