基于FEEMD-GRU-FC模型的滑坡位移预测
2024-12-31何清李丽琳林子安
摘要:
水库库区滑坡同时受到降雨和水库水位周期性变化的影响,这会干扰滑坡位移预测模型在该类区域的预测性能。为此,提出了一种针对环境周期性变化特点的FEEMD-GRU-FC(Fast Ensemble Empirical Mode Decomposition-Gated Recurrent Unit-Fully Connected Layer)滑坡位移预测模型。该模型充分考虑位移数据不同频率之间的噪声影响,将位移分解为不同频率的子序列分别预测,采用PCC(Pearson Correlation Coefficient)方法选择影响较大的外部环境因素,添加全连接层完善GRU模型提取环境数据中周期性变化特征的能力,模型结合三峡库区八字门滑坡的实际数据进行模拟仿真,使用不同预测模型和评价指标进行多角度对比验证。实验结果表明:所提模型在八字门滑坡的预测效果要优于其他3种模型,其拟合度达到了98.6%,3种不同误差指标均为最低,证明了该模型可以准确预测库区滑坡位移。研究成果可为防灾减灾工作提供指导。
关" 键" 词:
滑坡位移预测; 皮尔逊相关系数; 门控循环单元; 全连接层; 非线性; 八字门滑坡; 三峡库区
中图法分类号: TV697.23; P642.22
文献标志码: A
DOI:10.16232/j.cnki.1001-4179.2024.07.014
收稿日期:
2024-01-12;接受日期:
2024-04-22
基金项目:
国家自然科学基金项目(U23A20280);广西科技重大专项(桂科AA23062038);广西重点研发项目(桂科AB21196041)
作者简介:
何" 清,女,工程师,主要从事智能交通和滑坡预警研究。E-mail:2606261503@qq.com
通信作者:
林子安,男,工程师,博士,主要从事人工智能和滑坡预警研究。E-mail:20031102010@mails.guet.edu.cn
Editorial Office of Yangtze River. This is an open access article under the CC BY-NC-ND 4.0 license.
文章编号:1001-4179(2024) 07-0108-07
引用本文:
何清,李丽琳,林子安.
基于FEEMD-GRU-FC模型的滑坡位移预测
[J].人民长江,2024,55(7):108-114.
0" 引 言
滑坡是对人类及其生存环境造成危害或破坏的复杂而常见的地质自然灾害[1],因其发生频率高、影响范围广、持续时间长,已成为中国最严重的地质灾害之一。根据中国2021年国家统计年鉴,2020年中国共发生地质灾害7 840起,其中滑坡4 810起,占中国地质灾害总数的61.3%,处理滑坡问题迫在眉睫。然而,由于滑坡形成机理和诱发因素的复杂性,对滑坡的预测仍是一项艰巨的任务。而滑坡位移预测的研究是解决滑坡问题、更好认识滑坡运动的有效手段[2]。
滑坡可以被认为是一种非线性的系统。滑坡的发生可以有多种原因,如地质、降雨或者人类活动等。关于滑坡位移预测的研究较多,现有滑坡位移预测模型可分为基于物理机理的模型和基于数据驱动的模型[3]。但是基于物理原理的模型由于滑坡自身的复杂性,并没有取得很好的预测效果[4]。近年来关于滑坡位移的预测模型大多都是基于数据驱动的。例如Wu等提出新的灰色预测模型,实现滑坡的位移预测[5]。李丽敏等将滑坡位移当作时间序列数据处理,使用原始GRU模型进行预测,但忽略了外部环境数据的周期性变化[6]。袁乾博等基于时间序列的传统GRU模型对三峡库区的八字门滑坡进行预测,对比一般的GRNN模型,其预测效果有了明显提高[7]。段功豪等设计了一种基于多演化阶段插值的滑坡位移预测,结果表明该方法得到的误差更低,相较于传统方法更具优势[8]。
然而,滑坡位移通常随着时间变化而逐渐增加[9],传统的静态预测模型没有考虑到滑坡位移是一种动态的时间序列数据[10],也忽略了滑坡容易受外部环境周期性影响的特点[11]。针对以上情况,本文提出一种针对周期性时间序列数据的FEEMD-GRU-FC滑坡位移预测模型。该模型使用FEEMD算法将滑坡位移及环境变量分解得到不同频率的子序列,通过PCC方法选出对滑坡位移影响较大的环境因素,根据GRU模型善于处理滑坡位移与环境因素之间非线性关系的优点,以及针对滑坡外部环境数据周期性变化特点,给GRU模型增加了全连接层以此提高模型提取周期性特征的能力。最后使用三峡库区的八字门滑坡相关数据进行仿真验证。
1" 模型介绍
1.1" 模型流程
FEEMD-GRU-FC滑坡位移的预测过程包括5个步骤,图1展示了完整的实现过程。
步骤1:获取滑坡位移以及滑坡外部的环境数据。
步骤2:使用FEEMD算法对滑坡位移和环境数据进行分解,得到多个不同频率的子序列。
步骤3:基于每个滑坡位移子序列与所有的环境数据子序列计算PCC值,选择相关性较大的环境数据子序列作为滑坡位移子序列的输入变量。
步骤4:GRU-FC模型对每个滑坡位移子序列进行分别预测,所有预测结果相加得到最终的滑坡预测位移。
步骤5:使用MAE、RMSE、MAPE和R2评估FEEMD-GRU-FC模型的预测性能。
1.2" FEEMD模型
FEEMD(Fast Ensemble Empirical Mode Decomposition)模型由Wang等[12]在2014年提出,是一种改进的EEMD算法,该算法可以有效提高EEMD的实时计算性能[13]。作为一种辅助信号处理方法,FEEMD将高斯白噪声引入到原始时间序列中再应用,其非常适合于非平稳和非线性信号的分解。FEEMD方法通过优化停止条件减少筛选次数来提升算法的执行效率,且能较好地对信号进行去噪[14],在有效去除噪声的同时也保证了有用信号的完整性[15]。FEEMD的分解过程遵循以下基本步骤:
(1) 设置FEEMD的集合数I=100;
(2) 在原始数据上添加选定振幅的白噪声序列,得到生成的序列x(t);
(3) 利用3次样条插值将x(t)的局部极大值点和局部极小值点联系起来,分别得到上下包络Ui(t)和Li(t);
(4) 计算上下包络Ui(t)和Li(t)的平均值mi(t),并指定xi(t)和mi(t)之间的差值为hi(t);
hi(t)=xi(t)-mi(t)
(1)
如果hi(t)满足,整个数据集中零点和极值点的个数相差1以内或者上下包络Ui(t)和Li(t)在任意点的平均值为零任意一个条件,那么算法会继续执行,否则会重复进入上述过程,直到hi(t)满足要求。
得到hi(t)后,计算出余项数据ri(t):
ri(t)=xi(t)-hi(t)
(2)
重复以上步骤,定义标准偏差SD用作停止条件,当SD小于0.2时会停止上述步骤并输出计算得到的N个IMF分量[16],SD的公式如下:
SD=Ni=1|hiM-1(t)-hiM(t)|2hiM-1(t)2
(3)
式中:M是筛选次数。
xi(t)表示为
xi(t)=Ni=1IMF(i)+ri(t)
(4)
式中:N表述IMF的数量,r表示余项数据。
1.3" PCC方法
PCC(Pearson Correlation Coefficient)是测量变量之间关系的常用方法之一,目前已被广泛用于计算事物之间的相关性 [17]。通常它是基于协方差用矩阵的数据计算来评价两个向量之间的相互强弱关系,其相关系数为1或者-1时,相关性越强;当相关系数接近0时则表示较弱的相关性。假设有两个变量ɑi和ɑj,则两者相关系数的公式可表示为
p=Cov(ɑi,ɑj)Var(ɑi)×Var(ɑj)
(5)
式中:Cov(ɑi,ɑj)是协方差,Var(ɑi)是ɑi的方差,Var(ɑj)是ɑj的方差。
当相关系数大于1时,一般认为p≤0.40为弱相关,p在0.40~0.70之间为中等相关,p在0.70~1.00之间为强相关或高相关,p≥0.9为极高相关[18]。本文也根据这一相关性划分选择中等相关及以上的环境因素参与滑坡位移的预测,认为中等相关及以上的因素对滑坡位移产生了实际影响。
1.4" GRU模型
GRU(Gated Recurrent Unit)是一种新型的卷积神经网络模型,是RNN模型和LSTM模型的改进模型,优化了LSTM模型的门函数,将神经元状态和隐藏状态混合[19]。GRU模型在保留了RNN处理时序数据优势的基础上,解决了长程依赖问题,能够使模型建立长距离时刻的依赖关系[20],在每个循环单元计算中可以自适应捕获不同时间尺度的相关性[21]。GRU模型也善于处理时间序列数据以及数据之间的非线性关系,可以有效缓解RNN模型梯度消失和梯度爆炸的问题,并且参数少于LSTM模型,可以有效减少处理数据的时间,其收敛速度快并且运行成本低[22]。GRU模型的结构如图2所示[23],公式为
rt=σ(wr·[ht-1,xt])(6)
zt=σ(wz·[ht-1,xt])(7)
Ct=(wc·[rt×ht-1,xt])(8)
ht=(I-zt)×ht-1+zt×Ct(9)
yt=σ(wo·ht)(10)
式中:xt是当前时刻的输入数据,ht-1是前一个时刻的状态储存变量,ht是当前时刻的状态储存变量,rt是更新门的状态,zt是重置门的状态,Ct是当前候选集的状态,yt是当前时刻的输出数据,wr是更新门的权重,wz是重置门的权重,wc是候选集的权重,wo是yt和xt与ht-1组成矩阵的权重,σ是sigmoid函数,
SymbolFC@ 是tanh函数,[]表示直接连接两个矩阵向量,·表示两个矩阵向量相乘。
1.5" GRU-FC模型
滑坡主要受降雨影响,而每年的降雨通常具有周期性和重复性。所以为了提高模型处理周期性数据的能力,对GRU模型进行改进,在GRU模型的隐藏层之后增加全连接层(Fully Connected Layer),使得全连接层的每个节点在预测时都不会忽略前面和后面的降雨信息。最终该模型使用输出单元计算预测的滑坡位移数据。目前全连接层的组合模型已应用于场景图像定位[24]、电网异常检测[25]等多个领域。GRU-FC模型的结构如图3所示。
1.6" 评价指标
本文为了准确估计模型的预测能力,采用评价指标用于评价模型的性能和精度[2],采用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)和决定系数(R2)4种不同的评价指标。MAE是一种基本的评价指标,反映了预测值和实际数据的整体差距。RMSE对异常值很敏感,如果预测数据不合理,RMSE值将受到很大影响。MAPE从整体考虑了预测值、实际数据以及误差之间的关系。R2则表示预测数据拟合实际数据的程度。
MAE=1nni=1|zi-yi|
(11)
RMSE=1nni=1(zi-yi)2
(12)
MAPE=1nni=1zi-yiyi
(13)
R2=1-ni=1(zi-yi)2ni=1(pi-yi)2
(14)
式中:n表示数据的数量;z={z1,z2,…,zn},表示预测的数据;y={y1,y2,…,yn},表示实际的测量数据;p={p1,p2,…,pn},表示实际测量数据的平均值。RMSE、MAE和MAPE这3个评价指标都是误差指标,其值越小,模型的预测性能和准确性越优秀;R2是拟合系数,其值越大,模型的预测性能和准确性越优秀。
2" 案例仿真
2.1" 数据来源
八字门滑坡位于三峡库区长江北岸支流香溪河右岸,地处湖北省秭归县归州镇,距离三峡大坝31 km。香溪河南北走向,几乎横穿长江,三峡水库淹没滑坡前缘。滑坡区内共有3个GPS变形监测点(ZG111、ZG110、ZG112)。本次研究选择ZG111作为八字门滑坡的监测点,因为该位置的现有监测数据序列最长,滑坡变形量最大。八字门滑坡地形如图4所示。
本次研究采用八字门滑坡60组数据。每一组都包含滑坡位移、降雨和水库水位数据。数据开始于2008年1月,结束于2012年12月,采集频率为每月一次,数据如图5所示。
2.2" FEEMD算法分解原始数据
由图5可以看出,滑坡位移在雨季的前几个月和水库水位下降时开始迅速增加。雨季过后,水库水位稳定后,滑坡位移变化基本结束,所以降雨和水库水位的变化是滑坡位移变化的诱发因素。本文对滑坡位移、降雨和水库水位进行FEEMD分解,将各数据分解得到不同频率的4个子序列,以便在之后预测单个子序列的过程中减少其他频率数据带来的误差,分解如图6所示。
2.3" PCC方法计算相关性
滑坡位移、降雨和水库水位经过FEEMD算法分解后,得到了多个不同频率的子序列。但并不是所有的降雨子序列和水库水位子序列对滑坡位移都会产生较大的影响,所以为了预测的准确性,本文采用PCC方法计算滑坡位移与环境影响因素的相关性,分别选出相关性较大的环境因素子序列作为各个滑坡位移子序列的输入数据,PCC方法计算结果如表1所列。
可以从表1中看出,降雨相对水库水位而言会对滑坡位移产生更大的影响,这可能是因为降雨会直接冲刷滑坡表面,提高滑坡含水率增加滑坡自身重量。根据表1的数据以及PCC的相关性等级划分,选择PCC≥0.4的环境因素作为各滑坡位移子序列预测模型的输入变量,IMF1、IMF2、IMF3和r的输入变量个数分别为6,7,6,8个。
2.4" FEEMD-GRU-FC模型预测滑坡位移
将60个月的数据分为两个部分,前48个月数据作为训练集训练FEEMD-GRU-FC预测模型,后12个月的数据作为验证集对模型进行验证,每个滑坡位
移子序列的预测过程完全一致,最后将各滑坡位移子序列的预测结果相加,得到最终的预测结果。模型的各参数进行如下设置:集合数I设置为100[12];偏差SD停止条件设置为0.2[16];PCC大于0.4为选择相关影响因素条件[18];由于八字门滑坡所处区域受到季节性降雨气候影响,所以将时间步长设置为12个月;经过多次实验,在仿真过程中发现学习率与隐藏层节点数不宜过大或过小,将其分别设置为0.01与50时模型效果最佳。预测结果与实际结果对比如图7~8所示,从图7~8中可以看出本文提出的模型能较准确地预测八字门的滑坡位移。
3" 讨 论
为了证明GRU-FC模型预测滑坡位移的优越性能,使用同为深度学习神经网络的RNN-FC模型、LSTM-FC模型和原始GRU模型对八字门滑坡位移进行预测,并与GRU-FC模型进行对比。为了便于比较,本文将GRU-FC模型、RNN-FC模型、LSTM-FC模型和GRU模型的时间步长统一设置为12,学习率设置为0.01,隐藏层节点数设置为50。预测结果如图9所示。
为了更直观地对比这几种滑坡位移预测模型的性能,列出这几种模型的两种评价指标结果见表2。
从表2中可以看出,无论是MAE还是其他3种指标,GRU-FC模型在这4种模型里面都是最优秀的。GRU-FC与RNN-FC和LSTM-FC模型相比,拥有更好的预测性能,这是因为GRU-FC模型解决了RNN-FC模型存在的梯度消失和梯度爆炸问题;而GRU-FC优于LSTM-FC模型,则是因为LSTM比GRU模型的结构更加复杂,参数量更多,所以在训练模型的时候成本更高,在数据量不多的情况下GRU-FC比LSTM-FC模型更占优势。GRU-FC模型的预测效果比GRU模型要好,是因为全连接层可以同时收集到滑坡发展过程中每个周期有着近似变化的数据,提高了GRU-FC提取周期性数据特征的能力,在面对八字门滑坡周期性的降雨和水库水位变化时会具备更优秀的预测能力。
本文提出的FEEMD-GRU-FC模型虽然可以对三峡库区的八字门滑坡位移进行有效预测,但仍有一些待改进的地方。模型没有经过在其他地区的滑坡或者其他类型滑坡位移数据的仿真验证,所以之后的工作还需要将该模型与其他滑坡数据结合使用,以提高模型的适用性。
4" 结 语
滑坡位移预测的研究已经进行了很长时间,但仍然是一个具有挑战性的研究,威胁着世界各地人民的生命和财产安全。针对这一挑战,本文提出一种针对非线性周期性时间序列数据的FEEMD-GRU-FC库区滑坡位移预测模型。该模型采用FEEMD算法快速将滑坡位移与环境因素分解成不同频率的子序列,再结合GRU模型和全连接层的优点,有效处理滑坡位移及其外部环境的非线性关系及周期性变化,准确地预测滑坡位移。并且与其他3种人工智能深度学习模型进行对比,仿真结果也证明了本文提出的FEEMD-GRU-FC模型能够有效地预测滑坡位移,为同类型非线性周期性变化滑坡的预防和治理提供了理论依据。未来可在实际项目过程中对模型进行修改完善,进一步提升模型的可行性和实用性,验证所提模型对于实际工程生产项目的帮助。此外,FEEMD-GRU-FC模型还可应用于其他预测领域,如降雨预测、发电量预测等,协助决策者不断改进合理判断的过程。
参考文献:
[1]" LIAN C,ZENG Z G,WANG X P,et al.Landslide displacement interval prediction using lower upper bound estimation method with pre-trained random vector functional link network initialization[J].Neural Networks,2020,130:286-296.
[2]" LIN Z A,SUN X Y,JI Y F.Landslide displacement prediction model using time series analysis method and modified LSTM model[J].Electronics,2022,11:1519.
[3]" LIU Z Q,GUO D,LACASSE S,et al.Algorithms for intelligent prediction of landslide displacements[J].Journal of Zhejiang University (Science A),2020,21(6):412-429.
[4]" DU H,SONG D Q,CHEN Z,et al.Prediction model oriented for landslide displacement with step-like curve by applying ensemble empirical mode decomposition and the PSO-ELM method[J].Journal of Cleaner Production,2020,270:122248.
[5]" WU L Z,LI S H,HUANG R Q,et al.A new grey prediction model and its application to predicting landslide displacement[J].Applied Soft Computing Journal,2020,45:5347-5361.
[6]" 李丽敏,张明岳,温宗周,等.基于奇异谱分析法和长短时记忆网络组合模型的滑坡位移预测[J].信息与控制,2021,50(4):459-469,482.
[7]" 袁乾博,肖诗荣,李春霞,等.基于GLSSVM模型的三门洞滑坡变形预测研究[J].人民长江,2020,51(7):130-135.
[8]" 段功豪,马迅,付杰.基于多演化阶段插值方法的滑坡预测研究[J].人民长江,2023,54(1):106-110,118.
[9]" ZHANG J R,TANG H M,TANNANT D D,et al.Combined forecasting model with CEEMD-LCSS reconstruction and the ABC-SVR method for landslide displacement prediction[J].Journal of Cleaner Production,2021,293:126205.
[10]YANG B B,YIN K L,LACASSE S,et al.Time series analysis and long short-term memory neural network to predict landslide displacement[J].Landslides,2019,16:677-694.
[11]LIN Z A,JI Y F,LIANG W B,et al.Landslide displacement prediction based on time-frequency analysis and LMD-BiLSTM model [J].Mathematics,2022,10(13):22032227.
[12]WANG Y H,YEH C H,YOUNG V H W,et al.On the computational complexity of the empirical mode decomposition algorithm[J].Physica A Statistical Mechanics amp; Its Applications,2014,400:159-167.
[13]LIU H,TIAN H Q,LI Y F.Comparison of new hybrid FEEMD-MLP,FEEMD-ANFIS,Wavelet Packet-MLP and Wavelet Packet-ANFIS for wind speed preditions[J].Energy Conversion and Management,2015,89:1-11.
[14]饶鸿江,何永泰,彭洁,等.基于FEEMD-NTEO的风电场送出线路故障定位[J].电机与控制应用,2024,51(1):106-116.
[15]殷礼胜,魏帅康,孙双晨,等.基于FEEMD-SAPSO-BiLSTM组合模型的短时交通流预测[J].电子测量与仪器学报,2021,35(10):72-81.
[16]蒲娴怡,毕贵红,王凯,等.基于FEEMD-PACF-BP_AdaBoost模型的风电功率超短期预测[J].计算机应用与软件,2021,38(11):91-97.
[17]刘若男,辛义忠,李岩.基于皮尔逊相关系数的动态签名验证方法[J].仪器仪表学报,2022,43(7):279-287.
[18]FU T,TANG X B,CAI Z K,et al.Correlation research of phase angle variation and coating performance by means of Pearson′s correlation coefficient[J].Progress in Organic Coatings,2020,139:1005459.
[19]赵兵,王增平,纪维佳,等.基于注意力机制的 CNN-GRU 短期电力负荷预测方法[J].电网技术,2019,43(12):4370-4376.
[20]郑宏舟,赵宇宸,孟飞.基于深度学习GRU网络的UWB室内定位优化[J].上海理工大学学报,2024,46(1):78-86.
[21]韦小多,陈艳,敖煜测,等.一种基于STGCN-GRU模型的交通流量预测[J].中国科技信息,2023(23):114-116.
[22]赵海峰,诸立凯,刘长松,等.基于注意力机制的CNN-GRU煤层气产能预测方法研究[J].煤矿安全,2023,54(12):11-17.
[23]FRANCIS C,HYODONG H,OOK L,et al.A novel hybrid deep learning approach to code generation aimed at mitigating the real-time network attack in the mobile experiment Via GRU-LM and Word2vec[J].Mobile Information Systems,2022,2022(1):1-11.
[24]薛朝辉,周逸飏,强永刚,等.融合 NetVLAD 和全连接层的三元神经网络交叉视角场景图像定位[J].遥感学报,2021,25(5):1095-1107.
[25]李清涛,任宇驰,王远,等.基于人工神经网络全连接层优化的线损异常诊断方法研究[J].电气应用,2020,39(4):82-88.
(编辑:刘 媛)
Landslide displacement prediction based on FEEMD-GRU-FC model
HE Qing1,LI Lilin1,LIN Zian2
(1.Science and Technology Information Department,Guangxi Transportation Science and Technology Group Co.,Ltd.,Nanning 530000,China;" 2.School of Computer and Information Security,Guilin University of Electronic Technology,Guilin 541000,China)
Abstract:
Landslides in reservoir areas are affected by rainfall and periodic changes in reservoir water level,which will interfere with the prediction performance of landslide displacement prediction models.A FEEMD-GRU-FC (fast ensemble empirical mode decomposition-gated recurrent unit-fully connected layer) landslide displacement prediction model based on the periodic environmental changes was proposed.The model fully considered the influence of noise among different frequencies of displacement data,divided the displacement into sub-sequences of different frequencies to predict them respectively,and used the PCC (Pearson correlation coefficient) method to select external environmental factors with large influence.The ability of the GRU model to extract periodic change features from environmental data was improved by adding a full connection layer.The model was applied by combining with the actual data of the Bazimen Landslide in the Three Gorges Reservoir area.Different prediction models and evaluation indicators were used for multi-perspective comparison and verification.The experimental results showed that the model proposed was better than the other three models in predicting Bazimen Landslide displacement.Its fitting degree was 98.6%,and three kinds of error indexes were the lowest,which proved that the model can accurately predict the landslide displacement in the reservoir area.The research results can guide disaster prevention and reduction.
Key words:
landslide displacement prediction; Pearson correlation coefficient; gated recurrent unit; fully connected layer; nonlinearity; Bazimen Landslide; Three Gorges Reservoir area