基于CNN-LSTM的大坝变形组合预测模型研究
2024-01-26王润英林思雨方卫华赵凯文
王润英,林思雨,方卫华,赵凯文
(1.河海大学水利水电学院,江苏南京210024;2.水利部南京水利水文自动化研究所,江苏南京210012;3.水利部水文水资源监控工程技术研究中心,江苏南京210012)
水库大坝在我国国民经济中占据了重要地位,由于大坝复杂的工作环境,随着工作时间的不断流逝,大坝常常会出现一些病害隐患或者伴有不同程度的缺陷[1-2],大坝一旦发生溃坝,将对周边的生命财产造成巨大的损失。因此,对大坝进行安全监控尤为重要。通常在大坝内设置监测仪器监测大坝工作的健康状态,大坝位移是直接反映大坝安全状况的指标之一[3],大坝变形监测在大坝安全监控中占据了主要位置[4],提高大坝变形的预测精度是当前研究的重要课题[5]。
大坝变形是由许多因素共同作用的非平稳、非线性的时间序列,准确预测其变形是困难的。近年来,人工智能技术的飞速发展,常将一些机器学习算法用于时间序列预测。利用深度学习长短时记忆(Long short-term memory,LSTM)神经网络对大坝变形进行预测时,LSTM神经网络属于循环神经网络(Recurrent neural network,RNN)的一种特殊形式。它能避免RNN网络梯度消失的现象,能存储更多记忆,拥有存储更多有效历史信息的能力[6],LSTM神经网络先通过遗忘层筛选长时间的记忆信息,选择保留重要信息以及舍弃无用信息,可适用于处理一些可能存在较长时间滞后的重要信息的时序问题[7],目前较多应用于大坝变形预测方面[8-9]。卷积神经网络(Convolutional neural networks,CNN)已广泛应用在语音识别、特征提取等领域,将其应用在大坝变形监测领域的实属不多,主要是因为其预测精度低,无法反映出大坝工作的真实性态。
为了提高大坝变形预测模型数据提取能力和模型预测精度,本文提出一种组合预测模型CNN-LSTM,该模型结合CNN神经网络特征提取能力和数据拟合能力,以及LSTM神经网络高预测精度的优点[10],通过对大坝变形进行预测,可以提高大坝监测原始数据的资源利用率,从而建立变形模型进行预测。同时,本文将CNN-LSTM模型的预测结果与单一的LSTM模型和CNN模型的预测结果进行对比,并通过计算评价指标均方根误差(Root mean squared error,RMSE)和平均绝对误差(Mean absolute error,MAE),分析各模型的残差结果,以及对比分析模型的预测精度。
1 基于CNN-LSTM神经网络的变形预测模型
1.1 模型架构
1.1.1 CNN神经网络
CNN神经网络是一种多层前馈神经网络,具有深度结构,并采用卷积计算。主要用于处理与图像有关的机器学习问题,也可用于处理时间序列问题。CNN通常由输入层、卷积层、池化层、全连接层和输出层组成,如图1所示[11],池化层通常紧随卷积层出现,通过池化操作减少卷积层之间的连接数量。在大坝变形的时间序列中,池化层有助于降维和进行第2次特征提取。池化层和卷积层交替出现,形成卷积单元,并最终连接全连接层。
图1 CNN神经网络结构示意
卷积层在CNN结构占据核心地位,每个卷积层由数量不等的卷积核组成,输入的数据在卷积核中进行运算,映射成相应的特征,特征则在池化层进行降维[12]。模型的激活函数选用RELU函数,该模型首先将大坝变形监测数据输入CNN模型,进行特征提取并将数据扁平化处理,然后将处理后的数据传递给LSTM模型进行变形预测。
1.1.2 LSTM神经网络
图2 LSTM模型单元结构
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
(3)
ot=σ(Wo·[ht-1,xt]+bo)
(4)
ht=ot·tanh(ct)
(5)
式中,ft为遗忘门;it为输入门;ot为输出门;ht-1和xt分别为时刻t-1的单元输出以及时刻的t的单元输入向量;ct和ct-1分别为隐藏层在时刻t与时刻t-1单元状态;Wf,Wi,Wo,Wc分别为遗忘门、输入门、输出门以及tanh单元的权重矩阵;bf,bi,bo,bc分别为对应的Wf,Wi,Wo,Wc的偏置向量。
1.2 CNN-LSTM组合预测模型
1.2.1 影响因素分析
本文以柏叶口水库混凝土面板堆石坝为例,分析混凝土受环境温度变化和水压作用,同时还受堆石体变形大小不同程度的影响。堆石体受温度引起的胀缩相较于混凝土较小,故在考虑堆石体变形影响因素时,不考虑温度场对其产生的影响。
堆石体变形主要受上下游水位和时间效应的影响,影响堆石体水平位移变形的因素有观测日当天坝前水深H1的一次方、二次方;时效分量有θ、lnθ,其中θ=0.01t,因此混凝土面板堆石坝堆石体水平位移变形S与影响因素之间关系为
(6)
1.2.2 组合模型结构
组合模型主要由一维CNN神经网络和LSTM神经网络两部分组成,第1部分使用CNN神经网络捕捉监测资料的空间特征,第2部分使用LSTM神经网络预测堆石体变形值,获取时间顺序特征。模型结构如图3所示。
图3 组合模型结构示意
1.3 模型实现过程
首先,对模型的输入数据进行标准化处理。先判断数据组是否存在严重缺失,当缺失数据达到30%时,舍弃这组数据;若缺失数据未达到30%,则对数据用均值填充法进行处理。其次,将输入数据放到CNN-LSTM组合模型进行训练,通过matlab2021a软件的训练结果得到评价指标,通过评价指标对模型性能进行评估,分析验证模型的优劣性。预测流程如图4所示。
图4 预测流程
1.4 评价指标
为评估CNN-LSTM模型在大坝变形预测方面的适用性,通常会采用预测精度指标均方根误差(RMSE)和平均绝对误差(MAE)进行评估。若模型预测精度越高,则评价指标RMSE和MAE越小。
(7)
(8)
2 实例应用
柏叶口水库位于山西省吕梁市交城县会立乡柏叶口村上游约500 m的文峪河干流上,2015年12月通过了竣工验收。水库控制流域面积875 km2,总库容10 173万m3。正常蓄水位1 133.0 m,防洪限制水位1 128 m,防洪高水位1 135.26 m。水库大坝为混凝土面板堆石坝,坝顶高程1 138.30 m,最大坝高88.3 m,坝顶宽10 m,坝顶长310.0 m。
2.1 监测资料分析
坝外部变形监测包括坝面竖向位移监测垂直坝轴线的水平位移监测和平行坝轴线的水平位移监测,外部测点布置如图5所示。规定监测水平位移向下游为正,向左岸为正,反之为负;垂直位移下沉为正,上抬为负。
图5 大坝外部变形监测点布置
2.2 建立模型
以柏叶口混凝土面板堆石坝的变形监测数据为例,建立CNN-LSTM组合模型对混凝土面板堆石坝堆石体水平位移变形的预测,将重点放在监测数据的预处理、选定CNN-LSTM组合模型参数、混凝土面板堆石坝堆石体的变形预测,将组合模型预测结果与文献[14]提出的LSTM模型和文献[15]提出的CNN模型的预测结果进行对比,分析验证CNN-LSTM模型在混凝土面板堆石坝变形预测方面的适用性。
2.2.1 数据预处理
本文选取了柏叶口混凝土面板堆石坝,从2019年1月1日至2021年8月4日坝内测点W21和坝顶测点W2自动化监测得到的坝顶水平变形数据,各测点均235个数据。其中,将前200个数据作为训练集,监测数据后35个作为测试集用以检验模型的预测能力,将其与模型预测值对比。在数据集处理过程中,采取如下步骤:
(1)处理缺失值,使用均值填补法替换缺失值。
(2)数据标准化处理采用式(9)Min-Max归一化,为了加快神经网络的训练速度、提高收敛速度和预测精度,在训练集中的200个数据上采用了该方法进行处理,即将数据映射在0~1之间:
(9)
式中,xj为输入变量j的时间序列j=1,…,235;x′j为归一化后的得到的时间序列。
2.2.2 参数设置
构建CNN-LSTM模型时,需考虑模型结构、隐藏层层数、训练单元数、优化算法、误差函数等。组合模型的输入层初步处理模型输入数据,本文将水位和时效因子作为输入变量,隐藏层是模型最重要的组成部分,输入的数据在隐藏层里完成一系列的计算处理,输出层则是得到模型输出的预测结果即面板堆石坝的位移变形值。
图6 组合模型
3 预测结果分析
CNN-LSTM建模工作完成之后,将柏叶口面板堆石坝堆石体坝内测点W21和坝顶测点W2水平位移变形监测数据以及库水位导入模型程序中,为验证组合模型的预测性能,与单一的LSTM模型和CNN模型,进行对比试验,计算出各模型的误差,预测过程线如图7所示,各模型的评价指标结果见表1。
表1 坝内测点W21评价指标
图7 测点W21和测点W2的训练集和测试集预测结果
由图7可知,CNN-LSTM模型的预测结果相较于与原型监测资料数据更接近,在其上下波动。虽然单一模型的预测趋势和组合模型的预测趋势相同,但随着预测时间的延长,单一模型的预测值与原型监测值之间的误差逐渐增大。这证明了CNN-LSTM模型能够记忆更长的时间序列,并挖掘数据组之间的关联性,这显著提高了其变形预测精度。据表1所示,对几个模型的预测精度评价指标RMSE和MAE进行比较分析,可以发现W21测点的CNN-LSTM模型相较于单一的LSTM和CNN模型有更低的RMSE和MAE,预测精度更高,相比LSTM模型,训练集RMSE降低64.91%、MAE降低了66.21%,测试集RMSE降低了52.89%、MAE降低了50.36%;相比CNN模型,训练集RMSE降低了31.28%、MAE降低32.01%,测试集RMSE降低了66.65%、MAE降低了69.17%,由此看来,CNN-LSTM模型很大程度上提高了大坝变形的预测精度,验证了其在大坝变形预测方面的适用性。
在用matlab2021a对模型进行训练时,组合模型训练时间相较于两个单一模型所用时间最长,训练时间长有助于提高模型的泛化能力,但并不是决定性因素,根据预测结果图可知组合模型对于新数据能够提供较为准确的预测结果,故其泛化能力相对单一模型好。
4 结 论
为了提高大坝变形预测模型精度和泛化能力,本文提出了一种名为CNN-LSTM的组合预测模型,该模型基于卷积神经网络(CNN)和深度学习长短期记忆网络(LSTM)实现。利用该模型对大坝变形进行预测,输入量包括水位、时效因子,输出量为坝体变形值,对输入数据进行标准化等预处理,构造模型进行训练,证明该组合模型在大坝变形预测方面相较于单一的LSTM模型和CNN模型效果更佳,也证明了其在大坝变形预测方面的适用性和可靠性。