基于CEEMDAN-GMDH-ARIMA的大坝变形预测模型研究
2024-03-09程小龙张斌刘相杰等
程小龙 张斌 刘相杰等
关键词:自适应噪声完备集成经验模态分解;数据处理群集法;差分自回归移动平均模型算法;大坝;变形预测;江西上犹江水电站
中图分类号:TV698.1+ 1 文献标志码:A doi:10.3969/ j.issn.1000-1379.2024.01.025
引用格式:程小龙,张斌,刘相杰,等.基于CEEMDAN-GMDH-ARIMA 的大坝变形预测模型研究[J].人民黄河,2024,46(1):146-150.
随着我国水利工程技术的快速发展,大坝数量不断增加,其作为我国重要的水利工程设施,具有建筑规模大、运行时间久等特点,在各种不确定因素的影响下,易产生变形[1] 。准确预测大坝变形趋势有利于维护大坝安全,保持大坝稳定运行[2] 。大坝发生变形是由水位、水压、温度和时效等多种因素导致的,各影响因素内在联系复杂,主次关系难以确定[3] ,很难做出准确可靠的大坝变形预测。目前,大坝变形预测常用方法包括回归分析法、时间序列法、支持向量机、神经网络等[4] 。这些方法各具特点,但也存在一些弊端,难以充分挖掘大坝变形数据的复杂性和非线性特征,预测精度较低。因此,越来越多的学者将数据处理方法引入大坝变形数据分析,并与神经网络模型进行组合来改善预测效果。例如:周兰庭等[5] 针对变形数据序列的非线性、非平稳性等特點,提出基于CEEMDANPSR(相空间重构)-KELM(核极限学习机)的大坝变形预测模型。鄢涛等[6] 采用集合经验模态分解(EEMD)和极限学习机(ELM)实现了大坝变形预测。董泳等[7] 采用EEMD 对经验模态分解(EMD)后的高频分量继续分解,实现有效变形信息的挖掘,提高了预测精度。但上述研究大都是针对非线性特征建模,忽略了大坝变形数据中的周期性和趋势性特征分析。因此,集成线性分析预测模型与非线性分析预测模型,对大坝变形预测分析具有重要意义。
神经网络具有良好的自适应性、自组织性、自学能力以及联想、容错、抗干扰能力,可以全面反映各因素的非线性特征,考虑各种因素对大坝变形的影响。与BP 神经网络、RBF 神经网络等一般神经网络相比,GMDH 神经网络能够专门针对复杂非线性系统进行自组织建模,对于高阶非线性系统的辨识更加有效[8-9] ,目前已被广泛应用于经济、工程、军事等领域[10-12] 。ARIMA 是一种用于时间序列分析预测的模型,能够捕捉数据中的线性关系,常用于处理分析线性信号[13] 。
针对大坝变形数据的复杂性和非线性等特征,本文建立CEEMDAN-GMDH-ARIMA 模型,并将该模型应用到江西上犹江水电站大坝变形预测,以验证该模型的合理性和可行性。
1 基本原理与方法
1.1 CEEMDAN 算法
CEEMDAN 算法是基于EMD 和EEMD 改进的一种信号处理方法,主要通过在原始信号上添加自适应高斯白噪声,有效避免EMD 的模态混叠现象,同时可以消除虚假信息干扰,使数据平稳化,算法实现主要步骤如下[14] 。
1.5 大坝变形预测流程
基于CEEMDAN-GMDH-ARIMA 的大坝变形预测流程见图2。首先进行数据预处理, 采用CEEMDAN 算法对大坝变形原始数据进行分解得到不同频率的模态分量,利用排列熵算法(PE)进行筛选,得到高频随机分量、中频周期分量和低频趋势分量;再采用GMDH 模型对去噪处理后的高频随机分量和中频周期分量进行预测,采用ARIMA 模型对低频趋势分量进行预测;最后将各模型预测结果叠加得到最终预测结果。
2 工程应用
2.1 水平位移监测数据
所选数据为江西上犹江水电站混凝土大坝2019 年11 月19 日至2020 年6 月1 日引张线监测点EX2 水平位移监测数据,数据采样间隔为1 d,共200 d 数据,把前140 d 数据作为模型训练集、后60 d 数据作为预测数据的测试集。监测点EX2 水平位移变化曲线见图3,发现水平位移数据具有明显的非线性和非平稳性特征。
2.2 模型应用分析
对监测点EX2 的水平位移数据进行CEEMDAN分解,设置加入500 组高斯白噪声信号,标准差为0.2,分解得到8 组不同频率尺度的IMF 分量,见图4。
为筛选分解后的模态分量频率,参考文献[18]的排列熵算法计算各模态分量的熵值,结果见图5。通过比较各个分量的相似性、接近程度和大小对各个分量进行分类重构。IMF1 至IMF8 的排列熵值逐渐递减,其频率逐渐降低,随机性逐渐减弱。IMF1、IMF2的熵值较大,具有明显的随机性,视为高频随机分量;IMF3~ IMF6 熵值居中,视为中频周期分量; IMF7、IMF8 的熵值较小,均小于0.2,视为低频趋势分量。
针对大坝变形数据的高频、中频、低频分量,分别构建GMDH 模型和ARIMA 模型进行预测。高频分量主要受变形数据噪声的影响,参考文献[19]中小波阈值法对高频分量进行去噪处理,高频分量IMF1 和IMF2 去噪前后对比见图6,原始数据降噪后的结果见图7。
利用GMDH 模型对去噪处理后的高频测试集分量和中频测试集分量进行预测,设置GMDH 模型网络层最大神经元数为25,最大网络层数为5,压力系数为0,学习率为0.7。利用ARIMA 模型对低频测试集分量进行预测,设置ARIMA 模型的自回归项数为3,差分次数(阶数)为3,滑动平均项数为1。将所有预测结果相加得到最终的预测结果。
2.3 模型预测性能对比
为验证CEEMDAN-GMDH-ARIMA 模型的预测性能,将其与BP 神经网络模型、RBF 神经网络模型、GMDH 模型和CEEMDAN-GMDH 模型进行对比。各模型的评估指标见表1。CEEMDAN-GMDH-ARIMA模型的预测精度最高, 其ERMS、EMA、r 分别为0.048 mm、0.035 mm、0.994,均优于其他模型的评价指标,证明了该模型应用在大坝变形预测上的可行性。
各模型的预测值与实测值对比见图8。单独使用BP 神经网络模型和RBF 神经网络模型分别进行预测,其预测结果与实测值具有明显的差异,误差较大;GMDH 模型预测结果趋势与实测值趋势一致,但具有明显的滞后性;采用CEEMDAN 进行数据分解后再预测,CEEMDAN-GMDH 模型预测效果得以提升;相比于以上模型,CEEMDAN-GMDH-ARIMA 模型预测效果最好,其预测曲线最贴合实测值曲线,波动周期大体一致,能够很好地体现监测点水平位移变化趋势。
CEEMDAN-GMDH-ARIMA 模型预测值与实测值的关系见图9,可以看出预测值与实测值吻合较好,体现出CEEMDAN-GMDH-ARIMA 大坝变形预测模型的有效性。
3 结论
针对大坝变形数据的复杂性和非线性等特征,本文建立了CEEMDAN-GMDH-ARIMA 大坝变形预测模型,并通过工程实例进行实验分析,得到以下结论:
1)将CEEMDAN 应用于大坝变形数据分解,有效降低了原始数据的复杂性,有利于大坝数据特征的分析及预测。
2)利用ARIMA 模型擅长处理线性平稳性数据的优势,弥补GMDH 模型在线性分析上的不足,提高了模型预测精度。
3)通过工程实例应用表明,CEEMDAN-GMDHARIMA模型的预测精度明显优于BP、RBF、GMDH 和CEEMDAN-GMDH 模型的,验证了该模型对大坝变形预测的准确性和可行性。
【责任编辑 栗铭】