台风风暴潮损失评估方式的优化分析
2022-04-29郝婧刘强张晓琪
郝婧, 刘强, 张晓琪
(中国海洋大学工程学院, 青岛 266100)
近百年来,受全球气候变化的影响,中国出现了海平面快速上升、海洋变暖显著、极端事件增多以及海洋酸化加剧等现象[1]。中国是受风暴潮灾害影响最严重的国家之一,气候变化加剧和海平面持续上升,使风暴潮出现的强度、频率和持续时间均呈现增加的趋势,给沿海地区带来了严重的经济损失[2]。2000—2020年,在中国造成灾害的风暴潮高达131个,造成的直接经济损失超过 2 150 亿元。因此,对气候变化和台风风暴潮灾害进行科学有效的研究和管理,提升高效的损失评估能力对防灾减灾事业具有重大的现实意义。
依据灾害理论,灾害损失的评估方法主要为两大类,一类是基于统计模型的评估方法,另一类是基于风险关联的评估方法[3]。基于统计模型的评估,国外有FCHLPM[4]、FPHL[5]、GCOM2D/3D[6]和HAZUS[7]模型等,中国学者赵昕等[8]运用经济学角度的投入产出模型分析评估了风暴潮损失。基于风险关联的评估,主要包括危险概率评估、脆弱性曲线和指标体系评估等[3]。Mahapatra 等[9]依据GIS加入人口和物理变量的分析进行了沿岸风暴潮脆弱性的评估;Yang 等[10-11]基于极限理论和扩展卡尔曼滤波评估直接经济损失和人口伤亡预测,构建了我国风暴潮灾害风险评估模型。现阶段,已有学者将机器学习方法应用于风暴潮损失评估。张颖超等[12]、冯倩等[13]、王甜甜等[6]、江斯琦等[14]分别运用神经网络组合预测、支持向量机(support vector machine,SVM)组合反向传播(back propagation,BP)神经网络(SVM-BP)、天牛须搜索(beetle antennae search, BAS)优化BP神经网络(BAS-BP)、改进神经网络与GIS建立风暴潮损失评估模型,均实现了良好的灾害损失预测效果。
目前已有的研究成果为台风风暴潮灾害的预警和管理提供了理论支持,为进一步提高损失预测的精准度,基于机器学习理论,构建包括气候变化的评估指标体系,使用径向基(radical basis function,RBF)神经网络和支持向量回归构建台风风暴潮损失评估模型,并尝试使用熵权法将两种方法组合,比较发现组合方法能够克服单一模型评估效果不佳的问题,同时验证气候变化指标的重要性。
1 材料与方法
1.1 数据来源
本文中风暴潮灾害资料主要来自自然资源部(海平面、风暴潮及其所产生的损失信息)、中国气象局(温室气体信息)、广东省统计局(相关经济、人口、设施等信息)、农业农村部(相关经济信息)、《中国风暴潮灾害史料集》[15]。选取从1995—2020年间50个广东省发生的记录较为完整的台风风暴潮损失数据进行研究。所收集的台风风暴潮数据跨度较全面,如表1所示。
表1 台风风暴潮直接经济损失分布情况Table 1 Distribution of direct economic losses from typhoon storm surge
1.2 指标选取
目前,灾害损失评估指标体系的构建还未有统一的标准,主要依赖于专家的先验知识[16]。基于全球气候变化背景和风险评估理论,从气候变化、致灾因子危险性、承载体易损性和防灾减灾能力四个方面建立了台风风暴潮损失评估体系,如图1所示。
图1 台风风暴潮灾害损失评估指标体系Fig.1 Typhoon storm surge disaster loss assessment index system
1.3 影响因子预处理
在充分考虑台风风暴潮数据和减少主观影响的基础上,使用主成分分析进行降维处理,筛选出主要因素作为模型的输入量。主成分分析是一种多变量统计方法[17],使用线性变换提取出具有代表性的独立综合变量,能很好地抓住主要矛盾[18],便于进一步分析。
利用SPSS统计工具根据图2所示步骤计算主成分,最终得到气候变化、致灾因子危险性、承载体易损性和防灾减灾能力的综合变量作为4个输入变量,分别为F1、F2、F3和F4,表达式为
F1=0.58×(0.38Z11+0.58Z12-0.29Z13-0.59Z14+0.30Z15)+0.42×(0.45Z11-0.03Z12+0.54Z13+0.31Z14+0.64Z15)
(1)
F2=0.71×(0.34Z21-0.51Z22+0.51Z23+0.51Z24+0.33Z25+0.08Z26)+0.29×(0.54Z21+018Z22-0.24Z23-0.22Z24+0.55Z25-0.52Z26)
(2)
F3=0.79×(0.41Z31+0.41Z32-0.20Z33+0.40Z34+0.41Z35+0.40Z36+0.02Z37+0.38Z38)+0.21×(-0.10Z31-0.10Z32+
0.61Z33+0.14Z34+0.12Z35+0.15Z36-0.73Z37+0.12Z38)
(3)
F4=0.38Z41-0.41Z42+0.43Z43+0.42Z44+0.42Z45+0.39Z46
(4)
Z为数据正态标准化后的决策矩阵;Xij( i=1,2,…,m;j=1,2,…,n)为第i个评价对象的第j个评价指标值;rij为相关系数矩阵;Fi为第i个主成分的得分;F为主成分分析法的综合评价值图2 主成分分析计算步骤Fig.2 Principal component analysis calculation steps
2 损失评估模型的建立
以50个台风风暴潮为总样本,按时间序列,前40个样本作为训练集,后10个样本作为测试集,以MATLAB 2019b为平台,由主成分分析降维后的4个综合变量作为输入因子,直接经济损失和海水养殖受灾面积作为输出因子进行台风风暴潮损失评估。
2.1 RBF神经网络基本原理
图3 RBF神经元结构图Fig.3 RBF neuron structure diagram
2.2 SVR基本原理
支持向量机最早主要用于研究分类问题,后引入ε不敏感损失函数提出了支持向量回归(support vector machine for regression,SVR),得以解决支持向量机在回归拟合方面的问题且取得了很好的拟合效果,具有唯一的最优解。该算法的提出主要针对小样本问题,利用非线性变换将数据映射到高维特征空间来构造线性回归函数,基本思想是寻找一个最优的面使得所有原始的样本离该最优面的误差最小[20],如图4所示。
图4 SVR基本思想示意图Fig.4 SVR basic idea diagram
2.3 组合预测模型
Bates等[21]首次提出了组合预测方法,基于评估对象指标的复杂程度,单一的预测模型往往具有局限性和片面性,因此将多个模型通过定权方式进行有效组合。目前组合预测方法在国内已成为研究热点,王莉琳等[22]使用方差倒数法将灰色模型和自回归积分移动平均模型进行组合来预测电力需求;张颖超等[23]基于最优加权法组合广义神经网络、极限学习机和支持向量机预测浙江省台风损失;陈聪等[24]以熵权法确定动态权系数来组合预测飞机的燃油流量全航程。
目前常用的组合预测方法有熵权法、诱导有序加权几何平均(induced ordered weighted geometric averaging,IOWGA)算子、最优加权法和方差倒数法等。其中,熵权法基于信息熵原理是建立在原始数据的基础上,充分体现了样本的显性信息和隐性信息,适用于解决小样本或信息匮乏的样本问题[25]。因此,本文中采用熵权法组合预测支持向量回归(SVR)和RBF神经网络(SVR-RBF)进行台风风暴潮灾害直接经济损失评估。熵权法的基本原则是首先将指标分正负向原则进行无量纲化处理,计算各子模型的熵值、熵权,详细步骤见参考文献[25],最终确定SVR和RBF神经网络的权重。
3 结果与分析
3.1 预测检验指标
为了检验模型的精度,引入均方根误差(RMSE)作为参数选择指标,归一化均方根误差(NRMSE)、相关系数(CC)作为预测检验指标,其表达式[26-27]为
(5)
(6)
CC=
(7)
式中:N为测试样本数;ytest,i为测试样本;yi为预测结果。RMSE和NRMSE反映了预测数据偏离原始数据的程度,越接近于0,表示预测效果越好,预测结果越稳定;CC用于评估预测数据和原始数据的符合程度,接近于1,拟合效果好,精确度高。
3.2 气候变化影响的验证
为验证气候变化对损失评估的重要性,对比不考虑气候变化的台风风暴潮损失评估,将F2、F3和F4作为输入因子进行对比。本文实验中,RBF神经网络模型用实验法比较RMSE对径向基函数的扩展速度进行确定,SVR模型使用LIBSVM工具箱[28]利用交叉验证方法确定最优参数(t、c、g),各参数设置如表2所示。
表2 RBF神经网络和SVR模型的最优参数值设置Table 2 Optimal parameter value Settings of RBF neural network and SVR model
两种模型评估效果对比见图5和表3,在直接经济损失和海水养殖受损面积中,可以看出有气候变化指标的RBF神经网络和SVR模型均优于相对应无气候变化指标模型的评估拟合效果。在直接经济损失评估中,RBF神经网络模型在加入气候变化指标F1后的评估结果NRMSE降低0.042 7、CC
图5 模型测试集拟合结果Fig.5 Fitting results of model test set
表3 模型测试集评估效果对比
提升0.037 1,SVR模型评估结果NRMSE降低0.022 1、CC提升0.061 6;同样在海水养殖受损面积的评估结果中,RBF神经网络模型在加入气候变化指标F1后的NRMSE降低0.553 5、CC提升0.263 3,SVR模型评估结果NRMSE降低0.015、CC提升0.011。因此,基于两个模型的整体预测精度,可以验证气候变化对于灾害损失评估具有一定的影响。
3.3 组合预测
组合预测中的子模型和定权方式均对预测评估结果产生较大影响,根据上文的模型比较发现RBF神经网络在出现较大直接经济损失时预测误差较小且SVR在直接经济损失的预测中更具稳定性,可以作为子模型进行组合。根据熵权法求得SVR和RBF神经网络的最优组合权重为0.499 9和0.500 1,按组合预测对直接经济损失的测试集进行处理,求出预测集误差的绝对值如图6所示,可以看出组合预测模型相对于单一模型在直接经济损失上具有更好的预测稳定性。
图6 误差对比Fig.6 Error comparison
比较表4评估结果发现,在对台风风暴潮直接经济损失评估中,SVR-RBF神经网络组合预测模型的RMSE相对于单一模型更好,CC更优,预测效果更具稳定性。因此,组合预测方法发挥了单一模型优势,提高了灾害直接经济损失评估效果,增加了评估模型的稳定性和可靠性。
表4 组合预测模型测试集评估效果
4 结论
(1)从气候变化、致灾因子危险性、承载体易损性和防灾减灾能力四个方面建立了台风风暴潮损失评估体系,通过主成分分析降维得到4组综合变量。将直接经济损失和海水养殖受灾面积作为输出因子,分别使用RBF神经网络和SVR模型对比有无气候变化指标的评估效果,预测结果表明气候变化是台风风暴潮损失评估的重要影响因素,可为未来研究提供重要方向。
(2)RBF神经网络在较大直接经济损失时预测误差较小,而SVR在预测准确度上更具稳定性,提出熵权法的组合预测方式,对台风风暴潮直接经济损失方面比较RBF神经网络、SVR和组合预测模型的RMSE和CC得出结论:熵权法定权的组合预测模型充分发挥了单一模型的优势,提高了预测结果的可靠性,稳定了评估效果的精确度。
(3)在气候变化背景下,且不排除较大较小台风风暴潮的小概率事件,建立的台风风暴潮损失评估模型可以较好地进行预测,对灾害的管理可以提供科学参考。但由于气候变化指标选取较少,在此方面存在一定的局限性,且可获取的台风风暴潮完整样本过少,在预测准确性方面还有待提高。引入遥感技术对气候指标的获取是下一步的研究工作,以此来完善台风风暴潮的数据搜集工作。