APP下载

基于长短期记忆网络的甘肃舟曲立节北山滑坡变形预测

2024-01-18高子雁李瑞冬石鹏卿周小龙

中国地质灾害与防治学报 2023年6期
关键词:北山监测站滑坡

高子雁,李瑞冬,石鹏卿,周小龙,张 娟

(1.甘肃省地下水工程及地热资源重点实验室,甘肃 兰州 730050;2.甘肃省自然资源厅地质灾害防治技术指导中心,甘肃 兰州 730050;3.甘肃省地质环境监测院,甘肃 兰州 730050)

0 引言

滑坡的突发性强,危害性大[1],是一种在陆地环境中普遍存在的地质灾害,对人类社会具有较大影响和威胁[2]。滑坡预警的研究一直以来都备受国内外学者的关注[3-4],很多国家在滑坡灾害的应对中,都选择布设了早期监测预警系统[5]。通过预警系统得到的相关位移数据,可直观地体现滑坡的变形演化。由此可见,监测预警数据在滑坡的预警预报中起到了至关重要的作用。

在这个信息技术快速发展的时代,人工智能被广泛应用,而机器学习是其中的一个重要分支。从20 世纪80年代以来,机器学习已在算法、理论和应用等方面获得了巨大的成功[6]。近年来,机器学习也在预测领域中得到了广泛的运用,常见的几种算法如随机森林[7]、支持向量机[8]、人工神经网络[9]和循环神经网络[10]等在环境、金融、电力和交通等方面都有相关的应用。长短期记忆网络(long short term memory network,LSTM)是一种时间循环神经网络,是循环神经网络(recurrent neural network,RNN)中的一个变体,但与传统RNN 不同,LSTM 的记忆单元更复杂,对于时间跨度较大的时间序列有良好的记忆[11],同时也解决了神经网络的易陷入局部最小值、梯度消失和梯度爆炸等问题[12]。LSTM 在语音识别[13]、图像处理[14]以及最常见的股票预测[15-16]中运用广泛,但目前在滑坡的位移时序预测中较少。

本文将LSTM 应用到立节北山滑坡的变形预测中,预测监测点位移数据,并将预测数据与实际数据进行对比分析,为立节北山滑坡提供新的预测参考。

1 研究区概况

立节北山滑坡灾害位于舟曲县西部的白龙江上游左岸立节镇的北侧山体,由多个滑坡共同构成,滑坡区涵盖已经发生过变形滑动的古滑坡体、老滑坡体、正在发生变形的新滑坡体以及已有明显变形迹象的但未发生位移的潜在滑坡体的区域,共有古、老、新滑坡10处,整体范围南北长1 388 m,东西宽610 m,总面积约0.85 km2。

根据立节北山的滑坡性质、地形条件、地层分布和滑动条件等特征将滑坡分为7 个块体(图1),以滑坡中部的地形转折处为界,分为上下两级。上级滑坡主要是老滑坡,其覆盖区域为H1,以及已有明显变形迹象但未发生滑动的潜在滑坡H1-1 和H1-2;下级滑坡主要为变形滑动明显,并且变形面积较大的H2—H7 滑坡。统计数据显示,滑坡区内堆积体总体积为3.270 54×106m3,滑坡变形量从大到小排序为:H4>H5>H3>H2>H7>H6>H1。

图1 立节北山滑坡GNSS 分布图Fig.1 The North Mountain of Lijie landslide GNSS distribution map

2 预测方法及数据源

2.1 LSTM 模型

LSTM 早在1997年就被提出,它的出现解决了隐变量一直存在的长期信息贮存和短期输入缺失的问题。和传统神经网络相比,LSTM 引入了记忆元和三种门结构(图2),其中记忆元(C)用于记录附加的信息,而门结构用于控制记忆元,分别为遗忘门(f)、输入门(i)和输出门(o)。

图2 LSTM 模型结构Fig.2 LSTM model structure

首先在遗忘门中决定记忆或忽略隐状态的输入信息,此处的sigmoid 激活函数(σ)将判断当前输入是否遗忘;其次输入门用于决定在记忆元中读取哪些信息,此处有两个分支构成,一个是记忆门决定要读入的值,另一个是tanh 激活函数得到新的候选记忆元t,通过这两个分支得到的值以传导新的信息;然后通过前两个步骤得到的ft和it·t以更新Ct-1得到新的记忆元Ct;最后输出门决定记忆元的哪些信息被输出,通过该处的sigmoid 激活函数(σ)得到Ot,再结合tanh 激活函数最后输出新的数据ht。整个过程中的详细计算如下:

其中,Wxf、Wxi、Wxo、Wxc和Whf、Whi、Who、Whc分别是遗忘门、输入门、输出门和候选记忆元的权值向量,bf、bi、bo、bc分别是遗忘门、输入门、输出门和候选记忆元的偏置向量,Xt是t时刻的输入值。

2.2 评价指标

为了衡量预测结果的精度,本文采用均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)以及可解释方差(Evar)作为评价指标,具体表达式如下:

式中:yt、——t时刻的真实值和预测值;

m——数据个数;

Var——方差。

2.3 数据源

立节北山滑坡监测点分布如图1 所示,共布设11个GNSS 监测点。本文的数据来源于监测点实时监测的位移数据,数据范围为2021年3—12 月的每日位移数据,其中有少量缺失数据,对其进行了采取邻日数据的中间值的填充预处理。

3 结果与分析

3.1 影响因素

立节北山滑坡稳定性除了受滑坡本身内在结构影响,也受外在因素影响。除累计位移外,图3 为GNSS1监测站垂直和水平位移和雨量的相关曲线,由图可知,位移量与雨量间具有明显相关性。雨水下渗需要一定的时间,将导致滑坡体的下滑力增大,因此影响滑坡的稳定性。

图3 GNSS1 累计位移与雨量关系Fig.3 GNSS1 relationship between cumulative displacement and rainfall

Pearson 相关系数是用来表示两个变量之间线性相关程度的大小与方向的指标,数值范围为-1≤r≤1,小于0 为负相关,大于0 为正相关,等于0 则不存在相关性,绝对值越大,则表示两变量间的相关程度越强烈。通过GNSS1 位移量与雨量的Pearson 相关性分析,得到相关系数值为0.993,接近于1,说明之间有显著的正相关关系,雨量对滑坡的应力状态影响明显,特征评价因子选取适宜。

将影响因素累计位移、雨量作为模型的输入变量,因数据的类型、量纲以及取值范围不同,需先对数据进行归一化处理,进而输出模型预测值。

3.2 确定隐藏层神经元数

本文基于LSTM 模型建立了立节北山滑坡的变形预测模型,首先以GNSS1 监测站为例,GNSS1 监测站发出红色预警,形变量显著,通过2021年4 月9 日至12月2 日的数据进行预测,其中GNSS1 因该处形变量过大,于12 月3 日掉落数据中断,所以采取前八月的数据进行相应的预测试验。运用Python 3.7 语言和PyTorch 1.12 机器学习框架进行构建LSTM 模型,在试验中,首先需要对参数进行初始化,发现采用不同的隐藏层神经元数预测结果的精度会有所不同。如图4 所示,选取8、16 以及几个32 的倍数为不同隐藏神经元数量进行精度对比:以64 为转折点,神经元数量在8~64 时,RMSE呈下降趋势;神经元数量在64~128 时,RMSE呈上升趋势,所以选取隐藏层神经元数为64,此时RMSE最低,精度最高。

图4 不同隐藏神经元数量的RMSE 变化Fig.4 RMSE variation with different numbers of hidden neurons

3.3 预测结果

通过参数初始化调整,设置LSTM 模型循环层数为2,隐藏层神经元数为64,序列长度为30,将数据集以6∶4 的比例,划分为训练集和测试集。首先对GNSS1的垂直位移进行预测,在LSTM 预测模型训练中,损失函数(Loss)变化正常,随训练次数的增加,损失函数值越接近于0(图5)。

图5 LSTM 模型训练中的损失函数数值变化Fig.5 Numerical changes in loss function during LSTM model training

测试集预测精度结果见表1,均方根误差为12.88 mm,平均绝对误差为6.56 mm,决定系数及可解释方差均达到0.99,精度评价良好,本文的LSTM 模型试验性能有效。

表1 GNSS1 垂直位移精度评价指标Table 1 Evaluation metrics for vertical displacement precision of GNSS1

监测站GNSS1 最终预测结果见图6,分别为垂直及水平位移的预测,测试数据与预测数据的比例为5∶1。

图6 GNSS1 位移预测结果Fig.6 GNSS1 displacement prediction results

为进一步验证本文LSTM 模型在滑坡位移中预测的广泛性,又选取了蓝色预警区域GNSS8 监测站数据,进行预测对比,评价指标见表2、3,决定系数及可解释方差均达到0.99,预测结果如图7。

表2 GNSS8 垂直位移精度评价指标Table 2 Evaluation metrics for vertical displacement precision of GNSS8

表3 GNSS8 水平位移精度评价指标Table 3 Evaluation metrics for horizontal displacement precision of GNSS8

图7 GNSS8 位移预测结果Fig.7 GNSS8 displacement prediction results

以GNSS1 水平位移为例,见图8 所示,对2021年12 月2 日后48 d(测试数据与预测数据的比例为2∶1)的数据进行预测,位移值超过20 000 mm 后,预测值增长趋势明显增加,故选取测试数据与预测数据的比例为5∶1。说明LSTM 模型具有短期预测的能力,但不适用于长期预测,长期预测呈现的效果不佳,可能导致模型失去预测效能。

图8 GNSS1 水平位移未来48 d 预测结果Fig.8 Forecasted results for horizontal displacement of GNSS1 for the next 48 days

本文以GNSS1 和GNSS8 两个发出预警的典型监测站为例进行预测试验,其中GNSS1 位于块体H4,其为立节北山滑坡变形量最大的块体,故以GNSS1 监测站为首要监测对象进行预测试验,GNSS8 监测站为辅,进行进一步验证。立节北山滑坡后续进行施工防治措施,如图9 治理工程三维地表分布图所示,上部进行了格构护坡和抗滑桩等的施工措施见图9(b),下部GNSS1处进行了削坡措施,见图9(c)。施工成效显著,目前处于稳定状态,本文仅以研究新方法与应用为目的进行相关预测。

图9 治理工程实施GNSS 三维分布图Fig.9 The GNSS three-dimensional distribution map of the

4 结论

本文运用LSTM 神经网络预测模型对立节北山滑坡的变形进行预测,并说明北山滑坡主要的影响因素,以选取恰当的特征因子,是将人工智能机器学习应用于北山滑坡变形预测的有效实验,实现了北山滑坡的定量位移预测。

GNSS1 在损坏掉落前,水平及垂直位移分别已达15 000 mm 和12 000 mm,通过本次LSTM 模型预测,可良好的预测出位移数值,对于测点仪器及财产安全也将起到良好的预警作用。

预测结果性能显示良好,精度评价较高,虽然LSTM模型在长期预测中表现不突出,但短期预测的能力显著,不仅为立节北山滑坡变形预测提供了辅助参考,也为滑坡预警预测打开了新的思路,对早期预警预报和地质灾害防治具有重要的意义。LSTM 模型更是在GNSS8监测站的水平位移预测值中的评价指标较为良好,均方根误差为4.00 mm,平均绝对误差为3.79 mm,体现出了在滑坡变形预测中很好的适用性,进一步说明在滑坡变形预测中引入人工智能,是一个可实行的策略方法。

猜你喜欢

北山监测站滑坡
张志民
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
北京市监测站布局差异分析
对辐射环境空气自动监测站系统开展数据化运维的探讨
心留北山回不来
去北山公园秋游吧
浅谈公路滑坡治理
与酷暑奋战的环保英雄——宜兴市环境监测站现场采样组的一天
基于Fluent的滑坡入水过程数值模拟
“监管滑坡”比“渣土山”滑坡更可怕