APP下载

基于CEEMDAN-PE-LSTM 的混凝土坝变形预测

2021-07-05宋锦焘

水利水运工程学报 2021年3期
关键词:分量神经网络误差

宋 洋,杨 杰,宋锦焘,程 琳

(1. 西安理工大学 省部共建西北旱区生态水利国家重点实验室,陕西 西安 710048;2. 西安理工大学 水利水电学院,陕西 西安 710048)

混凝土坝凭借其在设计、施工、运行管理等方面的独特优势,已成为中国坝工建设中的主要坝型之一。然而,随着水利水电事业的快速发展,水库大坝的安全问题也越来越突出。高坝大库开发建设所面临的地形、地质、水文等工程条件越来越复杂,大坝在运行过程中受到各种动态、静态和特殊的循环荷载,使水库大坝建设与运行安全存在更大的不确定性。变形作为反映混凝土坝安全状态的综合变量,可以作为评判结构性能的重要指标。因此,对坝体变形值进行预测可以更好地了解坝体变形规律、预测坝体变形趋势,对混凝土坝的安全稳定运行具有重要意义[1-2]。

在实际工程中,由于大坝运行过程存在不确定性,变形数据序列具有明显的非线性、非平稳特征,且序列中不可避免地存在一定噪声。非线性、非平稳数据主要由多种不同尺度的信息组成,对隐藏信息进行挖掘并降低噪声,对变形数据的准确预测有重要意义[3]。目前常见的信号处理方法有小波变换法[4]、经验模态分解(empirical mode decomposition,EMD)[5]和集合经验模态分解(ensemble empirical mode decomposition,EEMD)[6]。对于小波变换法,当数据中存在白噪声时,去噪效果不理想。在EMD 分解中容易出现模态混叠现象,导致预测效果不佳[7]。EEMD 分解通过加入白噪声改善了模态混叠现象,但仍存在重构信号噪声残留的问题。Colominas 等[8]经过进一步完善,提出了基于自适应噪声的完全集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN),该方法通过对每阶残余量添加自适应白噪声,得到若干频率不同的IMF 分量,且重构误差几乎为0,对非线性时间序列的分解效果更好[9-11]。排列熵(permutation entropy,PE)是一种检测时间序列随机性和突变性的方法,由于计算简单、抗噪能力强、输出结果直观等优点被广泛用于非线性时间序列的处理[12]。通过计算各序列的PE 值判断其复杂度,并对复杂度相近的序列进行合并,可以在挖掘原始序列隐藏信息的同时降低计算规模。因此,本文基于CEEMDAN-PE 对原始变形序列进行处理。

近年来,随着大坝安全监控、人工智能等理论的迅速发展,已有众多数学模型应用到了大坝的变形预测分析中,常见的模型有BP 神经网络[13]、RBF 神经网络[14]、支持向量机[15],但每种模型都有一定的局限性。BP 神经网络收敛速度慢且容易陷入局部最优;RBF 神经网络在面对大样本数据时,网络结构过于复杂。支持向量机对参数和核函数的选择太敏感。同时,往往是由于多种因素的共同影响造成数据序列的非线性、非平稳性,各因素之间又存在复杂的时间关联性。传统神经网络由于同一层的神经元不会相互传递,忽略了时间相关性的影响。在深度学习模型中,循环神经网络(recurrent neural networks,RNN)通过对隐含层进行改进,使内部单元既有前馈连接又有反馈连接,增加了模型的记忆功能,在时间序列数据预测中有更好的适应性。但RNN 只具有短期记忆能力,对于长时间序列的预测精度不足。长短时记忆神经网络(long short-term memory,LSTM)对RNN 的隐含层进行了改进,通过加入门结构实现了对历史信息的存储,加强了模型对长时间序列的记忆能力,能够更好地学习时间序列的内部复杂规律,有效避免了RNN 存在的梯度消失和梯度爆炸问题[16-17]。因此,LSTM 模型适用于混凝土坝变形预测。

综上,本文提出了基于CEEMDAN-PE-LSTM 的混凝土坝变形预测模型,利用CEEMDAN 将原始变形数据分解为频率不同的多个固有模态函数(Intrinsic mode function,IMF),基于PE 对各个IMF 分量的复杂度进行判断,对相近序列合并重组为若干组新的序列,达到降噪目的的同时降低了预测模型的计算量。最后,利用LSTM 对重组序列进行预测,并进行叠加得到最终预测结果。

1 CEEMDAN-PE 数据分解与重组

1.1 CEEMDAN

EEMD 是一种噪声信号数据处理方法,主要通过在原始信号中加入高斯白噪声进行多次EMD 分解,而白噪声频谱具有均匀分布特性,可以有效改善EMD 分解存在的模态混叠现象。

CEEMDAN 是在EEMD 的基础上发展的,其分解原理可以有效解决EEMD 产生重构误差的问题。在CEEMDAN 算法中,xn(t)表示原始变形时间序列,ωn(t)为不同幅值ε 的高斯白噪声,表示对原始信号进行EMD 分解得到的第j 个IMF 分量。CEEMDAN 算法实现步骤如下:

CEEMDAN 与EEMD 获取第一个IMF 分量的方法相同,均通过对信号x(t)+εωn(t)进行EMD 分解得到,如下式所示:

(1)k=1 时,计算唯一的残余信号,如下式所示:

(2)将高斯白噪声ε1E1(ωi(t))加入残余信号r1(t),i=1, 2, ···, n,进行EMD 分解,直到获得第1 个IMF 分量,可得2 阶IMF 分量:

(3)同理,对于k=2, ···, K,由以上步骤可以依次计算出第k 个残余信号及第k+1 个IMF 分量:

(4)当残余信号的极值点不超过2 个时,残余信号便不能继续分解时,CEEMDAN 算法终止,共得到K 个固有模态函数,最终的残余量:

此时,原始变形时间序列可以表示为:

1.2 PE

排列熵(PE)是一种时间序列复杂性衡量方法,可以快速检测信号的随机性与突变性,适用于混凝土坝变形监测数据的复杂度分析。算法的基本原理如下:

首先对给定的时间序列{X(i), i=1, 2, ···, n}进行相空间重构,得到的相空间矩阵为:

式中:m 为嵌入维数,τ 为延迟时间,j=1, 2, ···, k。

对于重构矩阵的每一行向量,均可得到一组符号序列:

式中:j1, j2, ···, jm表示重构向量各个分量所在的列序号。g=1, 2, ···, l,且有l≤m!。

根据Shannon 熵的形式,将变形时间序列x(t)的PE 定义为:

式中:0 ≤Hp(m)≤ln(m!),当Pg=1/m!时,Hp(m)达到最大值ln(m!)。

HP值的大小代表时间序列的随机性,值越大说明时间序列的随机性越强;反之,随机性越弱,规律性越好。PE 值的计算与嵌入维数 m和延迟时间τ 有关。

2 CEENMDAN-PE-LSTM 预测模型

2.1 LSTM 神经网络

循环神经网络(RNN)是一种内部包含反馈结构的神经网络,反馈结构意味着每个时刻的输入不仅和当前输入、网络权值有关,而且也和上一时刻的隐藏层的状态数据有关。RNN 的记忆能力能有效运用在时间序列的预测问题上。然而实际应用中,RNN 存在梯度消失和梯度爆炸问题,最终导致模型训练中断。为此,Hochreiter 等[18]在1997 年通过改进RNN 循环神经网络提出了长短时记忆神经网络(LSTM)。LSTM 神经网络包含复杂的动力学结构,在循环神经网络基础上,将隐藏层的神经元换成了隐藏状态和3 个门结构(输入门、遗忘门、输出门),控制各个记忆存储单元的状态,并实现了控制信息在隐藏状态上的更新[19]。LSTM 神经网络的内部单元结构如图1 所示。

LSTM 神经网络计算公式如下:

图1 LSTM 的内部单元结构Fig. 1 LSTM internal unit structure diagram

式中:it、ft、ct、ot分别表示输入门、遗忘门、更新后的细胞状态及输出门;xt为输入信息; ht为获取的输出信息;W 为权重系数;bi、bf、bc和bo为偏置量;下标t 表示累计天数。

输入门用来控制单元的更新;遗忘门控制历史信息的保存;输出门控制计算后的信息输出。LSTM通过门结构使之前的输入信息能够继续向后传播而不消失,从而具有较好的长短时记忆能力,在预测中又有较好的拟合效果,能很好地进行变形时间序列的预测分析。

2.2 基于CEEMDAN-PE-LSTM 的变形预测模型

混凝土坝变形受温度、水位等多种因素影响,监测数据是典型的非线性、非平稳信号。本文通过构建基于CEEMDAN-PE-LSTM 的变形预测模型,实现对混凝土坝变形拟合预测分析。具体步骤如下:

(2)变形数据序列的分解重组:首先,利用CEEMDAN 对变形数据序列进行分解,得到各阶IMF分量及RES 分量;然后,利用排列熵算法计算每个分量的PE 值,以复杂度相似性为依据进行数据重组。

(3)重构数据预处理:由于不同环境影响因子量纲不同,为提高模型的预测精度,对重构数据进行归一化处理。

(4)变形数据预测:对处理好的数据分别建立LSTM 模型进行变形值预测。对得到的变形值进行反归一化处理,将每一项预测值进行累加,得到最终预测结果。

3 试验与结果分析

3.1 工程实例

某水电站是福建省牟阳河上实施梯级开发的引水式电站,主要挡水建筑物为碾压混凝土重力坝,坝基高程为562.0 m,坝顶高程634.4 m,最大坝高为72.4 m,坝顶长度为206 m。坝体共分为9 个坝段,其中1~4 和7~9 为非溢流坝段,5~6 为溢流坝段。该工程混凝土坝的变形监测项目主要为水平位移和垂直位移等。坝顶的水平位移监测采用引张线方法,引张线的固定端位于坝体右侧01+107.25,导向端位于坝体左侧0+93.50 处,总长度为200.75 m,引张线自动化监测系统观测频率为每天1 次,观测点布置如图2 所示。

图2 引张线观测点布置(单位:m)Fig. 2 Layout of the tension wire measuring points (unit: m)

本文选取坝顶引张线EX4 测点水平位移实测数据为因变量样本,对2016 年8 月5 日至2017 年10 月10 日的共431 组监测数据进行分析,EX4 测点水平位移序列过程线如图3 所示,其中2016 年8 月5 日至2017 年9 月20 日共421 组数据作为训练样本,2017 年9 月21 日至2017 年10 月10 日共20 组数据作为测试样本。由图3 可知,EX4 测点的水平位移具有明显的非线性、非平稳特征,该测点数据完整可靠,以此为基础进行基于CEEMDAN-PE-LSTM 的混凝土坝变形预测研究。

图3 EX4 测点水平位移实测序列过程线Fig. 3 Process line of measured sequence of horizontal displacement of EX4 measuring point

3.2 影响分量选取

研究表明,大坝的位移变形受多种因素影响,主要由3 个影响分量组成,分别是水压分量δH(t)、温度分量δT(t)和时效分量δθ(t)。大坝的位移可表示为:

模糊综合评价是多重目标决策的一种情形,主要用于模糊环境,通过对事物影响因素进行模糊关系方程匀速,针对一定的目的对事物做出综合评价. 模糊综合评判的过程包括综合考虑各种属性,建立被评判对象的因素集;建立评判集;进行单因素评判;为不同因素赋权值,根据权值和单因素评判结果得出综合评判结果[9].

3.3 变形时间序列CEEMDAN-PE 分解重组

首先对变形时间序列进行CEEMDAN 分解,分解结果如图4 所示。原始变形时间序列被分解为7 个不同尺度的IMF 分量,频率由高到低,对应的IMF 图像越来越平滑。

变形时间序列CEEMDAN 分解的百分比误差如图5 所示。可以看出变形时间序列分解误差非常小,量级约为10−6,说明序列完全分解,验证了方法的有效性。

为了减小预测模型的计算规模,对分解的各IMF 分量进行PE 值计算与分析,进而使数据重构。在PE 计算中,延迟时间τ 对于排列熵的影响较小,故取τ 为1。根据试验,选取嵌入维数m 为3。当m=3、τ=1 时,各IMF 分量的PE 值计算结果如图6 所示,各分量的PE 值分别为2.581、2.439、1.723、1.367、1.329、1.234、0.608。

图4 基于CEEMDAN 的变形序列分解结果Fig. 4 Decomposition result of deformation sequence based on CEEMDAN

图5 CEEMDAN 分解的相对误差Fig. 5 Relative error of CEEMDAN decomposition

图6 各IMF 分量的排列熵值Fig. 6 Permutation entropy values of each IMF component

由图6 可以看出各IMF 分量的PE 值随着IMF频率的降低逐渐减小,与图4 所示规律相同,说明由高频分量到低频分量的随机性程度逐渐降低。通过比较熵值间的相似性与接近程度对各IMF 分量进行重组,对PE 值相差0.2 以内的分量进行合并。其中,IMF1与IMF2分量的随机性最强且PE 值相差为0.142,因此将IMF1与IMF2合并;IMF3分量的PE 值与其他分量相差较大,因此IMF3独立分组;IMF4、IMF5与IMF6分量相邻且PE 值较为接近,因此将三者合并;IMF7分量的PE 值与其他项相差较大,故将其单独列为一组。综上所述,各IMF 分量合并方案见表1,重组序列如图7 所示。

表1 各IMF 分量合并方案Tab. 1 IMF components merger scheme

图7 经过CEEMDAN-PE 处理的变形重组序列Fig. 7 Deformed recombination sequence processed by CEEMDAN-PE

3.4 基于CEEMDAN-PE-LSTM 的变形序列预测

3.4.1 模型参数选择 在完成数据重构后,对4 组新的数据序列分别建立LSTM 预测模型,建立模型需要确定5 个超参数:输入变量数、时间步、隐含层的层数、隐含层神经元数以及输出变量数。在LSTM 神经网络中,隐含层和神经元的数量对模型训练和预测精度影响较大。若数量较少,会因训练过少使预测效果变差;若数量过多,则会导致模型出现过拟合现象。经过多次试验,本文设置2 层隐含层,第1 层神经元个数为64,第2 层神经元个数为32;时间步长为8;输入变量数为9;输出变量数为1。另外,设置模型的迭代次数为300,batch-size 为16,使用Adam 函数优化LSTM 神经网络的内部参数。

为验证本文提出的预测模型性能,分别采用偏最小二乘回归(partial least squares regression,PLSR)模型、支持向量回归(support vactor regression,SVR)模型、LSTM 模型对变形数据序列进行试验验证。其中对于SVR 模型,惩罚参数用于调整模型复杂性和经验风险,核函数参数影响样本在高维线性空间的分布,从而影响SVR 的性能。使用粒子群参数优化算法对SVR 模型进行参数优化,得到最优惩罚参数为64.6、核函数参数为0.02。LSTM 模型参数与本文提出的模型参数相同。

3.4.2 预测模型的评价指标 为了比较不同模型的预测效果,采用平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE)作为评价指标来分析模型的预测精度。

3.5 预测结果分析

各模型的预测结果与实际变形数据序列如图8所示,预测性能评价指标见表2。

通过对比图中各预测值与实测值曲线,可见PLSR与SVR 模型的预测结果都不理想,尤其是PLSR 模型在前几个测试点的预测误差较大;相比于PLSR与SVR 模型,单一的LSTM 模型对测试集的后半段预测值与实际值接近,但对前半段数据的预测效果不够好;基于CEEMDAN-PE-LSTM 模型的预测结果较好,虽然在部分拐点的预测值与实际值有所差别,但预测误差较小,总体结果与变形序列实际值基本一致,能反映EX4 测点水平位移的变化,较其他3 种模型的预测效果更好。

由表2 可知,采用LSTM 神经网络进行预测时,3 项评价指标均明显降低,反映了LSTM 模型能更好地对非线性、非平稳波动时间序列进行预测;与PLSR、SVR、LSTM 模型相比,CEEMDAN-PE-LSTM 模型的平均绝对误差、平均绝对百分比误差、均方根误差分别为0.037 mm、2.220%、0.046 mm,均远低于其他模型。就平均绝对百分比误差而言,本文提出的CEEMDAN-PE-LSTM 模型与其他3 种模型相比,分别降低了91.82%、75.55%和87.33%,说明其预测精度最高,误差最小;与单一的LSTM 模型相比,平均绝对误差、平均绝对百分比误差、均方根误差分别降低了76.43%、75.55%和74.73%,说明经过CEEMDAN-PE 处理的模型预测精度明显提高,能有效挖掘非线性数据中的隐藏信息,针对不同信息实现更准确地预测,进一步验证了该预测模型的性能较好。

图8 各模型预测结果Fig. 8 Prediction results of each model

表2 各预测模型性能指标对比Tab. 2 Comparisons of prediction performance indexes for each prediction model

4 结 语

混凝土坝变形时间序列具有典型的非线性、非平稳波动性特征,且数据包含一定的噪声,容易导致模型预测精度不高。鉴于变形时间序列预测的复杂性,提出了CEEMDAN-PE-LSTM 模型,并通过对某混凝土坝的实测水平位移数据进行试验研究得到如下结论:

(1)通过CEEMDAN 算法对变形时间序列进行多尺度分解,得到频率不同的多个IMF,有利于掌握变形时间序列的变化规律。基于PE 算法对各IMF 分量进行重组,获得复杂度差异明显的一组新的序列,达到挖掘隐藏信息目的的同时减小了组合预测方法的计算规模。与单一的LSTM 模型相比,经过CEEMDANPE 数据分解与重组的模型,能更准确地描述混凝土坝水平位移的变化趋势。

(2)与常规模型相比,本文提出的CEEMDAN-PE-LSTM 模型有更好的预测效果,各项评价指标均优于其他模型,能够充分发挥LSTM 神经网络在非线性时间序列预测方面的优势,为混凝土坝变形预测提供了一种新方法。

猜你喜欢

分量神经网络误差
基于递归模糊神经网络的风电平滑控制策略
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
神经网络抑制无线通信干扰探究
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
压力容器制造误差探究
基于神经网络的中小学生情感分析
论《哈姆雷特》中良心的分量
九十亿分之一的“生死”误差