APP下载

基于BP神经网络和VSM的台风灾害经济损失评估*

2019-02-20林江豪阳爱民

灾害学 2019年1期
关键词:经济损失台风神经元

林江豪,阳爱民,2

(1.广东外语外贸大学 语言工程与计算实验室,广东 广州510006;2.广东外语外贸大学 信息科学与技术学院,广东 广州510006)

广东省位于太平洋西岸,濒临南海,是西太平洋台风登陆中国的主要地区。每年登陆中国的9.5个台风中,广东省就占了3.5个。自1985年以来因台风和洪水造成的直接经济损失超过200亿元[1]。

特别是随着全球气候变暖带来海平面上升等气候因素,对台风的强度和频度都有增强作用,台风灾害的危害将更为严重[2-3]。因此,深入研究台风灾害损失评估具有重大的意义。

自然灾害灾情统计是灾害评估、应急救助、灾后恢复重建等工作的基础。目前,我国对自然灾害灾情统计工作主要由各行政管理或业务部门完成,灾情信息大多以基层部门调查上报得到。由于各部门对灾情管理的侧重点存在差异,灾情统计内容不规范、不统一的问题十分突出,已成为提升自然灾害管理工作水平的瓶颈。因此,研究如何准确预测台风灾害损失,对提升台风灾害管理具有重大的意义。台风灾害损失评估方法大致可分为资料分析法、实验模拟法、数学模型法和遥感GIS法[4]。有采用基于主成分析和支持向量机技术,对房屋倒塌间数进行评估[5];应用基于主成分神经网络技术,实现灾害的经济损失评估[6]。也有综合评估台风灾害损失的方法,如刘少军等[7]采用可拓方法建立损失评估模型,并实现评估结果的GIS显示;文献[8]采用多元线性依赖模型,对中国的台风灾害损失进行评估;文献[9]结合GIS和图像识别理论,应用模糊灾害评价方法实现台风灾害的损失评估。文献[10]提出采用基于离散型Hopfield神经网络的台风灾情评估模型,主要对灾情的等级进行评估。文献[11]尝试探索广东台风灾情预测系统,并给出了系统的建设思路和必须解决的重要问题。文献[12]基于极值理论的POT模型拟合广东省历年台风灾害的经济损失。文献[13]采集了东南沿海1990-2010受台风影响严重地区的台风灾害统计数据资料,基于标准化变换的熵值法进行风险等级评估,然后运用聚类分析对评估结果进行等级划分并分析总体变化趋势。目前,对台风灾害损失评估的方法主要采用基于单模型的评估方法,容易受到训练数据统计不完整的影响,导致模型训练效果差,预测结果输出与实际偏离较远,存在评估结果不准确的缺点。鉴于此,本文提出一种基于BP神经网络和向量空间模型VSM(Vector Space Model)相结合的台风灾害经济损失综合评估方法,这种方法将训练BP神经网络作为评估模型,将VSM作为调整模型,可有效克服单一模型的适应性弱的缺陷,经验证模型能取得更高的评估准确性。

1 资料来源

为了确保统计数据的准确性,在充分考虑数据来源的可行性情况下,本文主要收集了广东省相关民政部门的最终台风灾情数据及广东省统计局的相关经济、人口等信息。还从《台风年鉴》和《热带气旋年鉴》等年鉴中,统计台风的信息。

主要统计了从1988-2008年对广东省造成直接经济损失的72个台风。其中,最高经济损失为9615号台风,损失高达171.62亿元;最低经济损失为9018号台风,损失金额为0.25亿元。台风数与经济损失分布如表1所示,所统计的台风灾害经济损失跨度较全面,分布比较符合台风的实际情况。抽取各个范围中的台风作为训练数据,训练所得模型将会比较符合台风的实际情况。

表1 台风数与经济损失分布情况

2 基于BP神经网络和VSM的台风灾害经济损失评估模型

2.1 BP神经网络预测

图1 BP神经网络网络图

采用如图2所示的训练模式对BP网络进行训练,参考文献[11],具体步骤如下。

图2 BP神经网络的训练过程

Step1:初始化BP网络,为层与层之间的连接权值和隐层、输出层节点的阈值为(-1,1)之间随机小量。

Step2:将数据集分为训练数据集Tr_set和测试数据集Te_set,设置训练精度acc∈(0,1)测试精度Te_acc∈(0,1)网络输出误差ε=1。

Step3:网络输入神经元为评估因子,中间隐层神经元数为输入层的75%,输出层只有台风经济损失1个神经元。训练函数采用Sigmoid函数,如式(1)所示。

(1)

则隐层神经元和输出层神经元的输出结果hj和yk:

(2)

(3)

式中:θj和φk为隐层和输出层的神经元阈值,wji为入层神经元i与隐层神经元j之间的连接权值,xi为入层神经元i的输入评估因子,ukj为层神经元j与输出层神经元k之间的连接权值。这里只有1个输出神经元,即k=1,式(3)可简化为式(4)。

(4)

Step4:第l个台风样本的网络输出的评估值yl与实际值Trl之间的误差Dl。

Dl=yl(1-yl)(yl-Trl)。

(5)

误差Dl网络连接反向传播过程中,当传播到隐层神经元出的误差为

Ej=hj(1-hj)∑Dluj。

(6)

按照Dl方向调整各层之间的权值和阈值。一般情况下,学习参数α,β∈[0.1,0.5],经实验验证这里取α=0.35,β=0.45。

Step5:将台风训练样本集Tr_set输入训练,计算均方误差ε,当acc≥ε时,停止训练,暂存网络;否则,更新学习次数,返回对样本再训练,直至满足误差精度。

Step6:将台风测试样本集Te_set输入Step5中的网络测试,计算均方误差Te_ε,当Te_acc≥Te_ε保存网络为M_set;否则,重新改变网络参数,再训练到满足误差精度。

2.2 VSM(Vector Space Model)调整

向量空间模型可用于并行信息检索[15]。由于不同时期发生的台风,其经济环境也不一样,如果直接将BP网络作为评估结果输出,比较适合特定时期内发生的台风评估,评估模型的适应性不强。鉴于此,本文考虑了结合不同时期的经济因子进行评估,利用VSM来检索待评估台风与台风样本集台风信息相似度度最高的台风,计算两个台风评估因子之间的距离,结合台风发生时段的物价指数、GDP等经济信息,对BP神经网络的输出进行调整。

检索时,遍历台风样本集中每一个台风,计算与评估台风之间的相似度,如式(7)所示。

(7)

通过max(Sim)获得与评估台风最大相似度的台风,对BP网络的输出进行调整。

(8)

式中:ybp为BP神经网络评估输出的经济损失额(万元);max(Sim)为最大相似度;w1和w2分别为评估台风发生时的物价指数和最相似样本台风发生时间的物价指数;GDP1和GDP2分别为评估台风发生时的GDP和最相似样本台风发生时间的GDP。

3 实验结果及分析

将收集的72个样本台风对广东省造成的经济损失信息如表2所示,GDP与物价指数来自广东省统计局,1988年为标准物价指数100。

表2 样本台风信息

将72个台风分为2组,一组用于训练模型的训练集Tr_set,共有63个台风;另一组用于测试模型的有效性,为测试集Te_set,共有台风10个。Tr_set与Te_set的台风样本数如表3所示。

表3 训练集和测试集台风数量分布

直接调用Matlab中的工具箱,建立BP网络,并训练。由BP网络直接输出的评估结果与经过VSM调整后输出的结果,如表4所示。

表4 BP网络直接输出与VSM调整比较

由表4可知,利用训练集Tr_set对BP神经网络进行训练,将测试集Te_set作为输入,BP网络的评估输出结果与实际经济损失结果对比,发现训练数据比较多的经济损失区间,其评估结果会与实际损失结果更接近。如经济损失区间在[1亿~20亿]和[20亿~40亿]分别训练数据占了67%和15%,这两个区间的评估结果相对比较准确。由此可以得出,仅利用BP神经网络对台风灾害损失进行评估,其评估结果受训练数据集的影响比较大,模型比较不稳定,适应性较差。对比VSM调整之后的结果,发现BP神经网络和VSM相结合的模型输出,明显优于仅使用BP神经网络,两者的误差率对比如图3所示。

图3 误差率对比

由图3可知,BP神经网络和VSM相结合的模型能保持在较低的误差率,特别是0814号台风,经济损失大于100亿元,训练数据只有3条,占训练集的比例的4.7%,但经过VSM调整之后,其误差率由49%降低到19%。台风编号0116经济损失为5 958.6万元,属于1亿以内的区间,训练数据集较少,经过VSM的调整,其误差率由60%降低到31%。由实验结果和误差率对比可知,采用BP神经网络对台风灾害经济损失进行评估,基于VSM模型对评估结果进行调整,可以获得与实际更接近的评估结果,同时评估结果受到训练数据集的影响非常小,模型具有较强的稳定性。

4 结论

针对现有台风灾害经济损失评估模型的不足,提出一种基于BP神经网络和VSM模型相结合的台风灾害经济损失评估模型,该模型能够有效降低训练数据不足对评估结果的影响,将平均误差由30%降低到14%。台风灾害经济损失评估一直是研究的热点,由于评估受到区域特点等因素的影响,今后的研究可在此基础上,引入区域因素,将地理信息网格化,实现精细化的数据源,同时结合Boosting方法来进一步提高经济损失的评估准确度。

猜你喜欢

经济损失台风神经元
交通运输部关于海上交通事故等级划分的直接经济损失标准的公告
美国供水与清洁基础设施不足造成每年85.8亿美元经济损失
台风过韩
《从光子到神经元》书评
台风来了
台风爱捣乱
跃动的神经元——波兰Brain Embassy联合办公
台风来时怎样应对
烧伤创面感染直接经济损失病例对照研究
基于二次型单神经元PID的MPPT控制