NARX在土石坝渗流预测中的应用

2022-07-31谷艳昌吴云星

人民珠江 2022年7期

赵普，谷艳昌,2*，吴云星,2

(1.南京水利科学研究院大坝安全与管理研究所，江苏南京 210029;2.水利部大坝安全管理中心，江苏南京 210029)

坝体和坝基的渗流监测是土石坝安全运行监控不可或缺的部分，也是大坝整体稳定性分析的重点研究对象。目前，在大坝安全监控领域主要采用的数学模型分为传统模型和智能模型。传统模型主要为常规统计模型、确定性模型、混合模型3种[1]；而随着模糊理论、灰色关联分析、支持向量机和人工神经网络等的发展，各种智能模型也相继应用到大坝监测上来，这些智能方法有效地改善了传统方法非线性泛化能力不足的缺点，成为当下研究的热点。

人工神经网络有着自适应、自学习、自组织和高度容错性的特点[2]，能很好地解决传统回归分析很难建立多因素非线性分析的缺点。但人工神经网络在实际应用时也有一定局限性，如传统的反向传播(Back Propagation,BP)神经网络存在网络收敛速度慢、泛化能力弱、易陷入局部极小值[3]，且不能获取数据序列中的时间信息等缺点。

NARX(Nonlinear Auto-regressive with Exogenous inputs neural network，带外源输入的非线性自回归神经网络)神经网络最先由Siegelmann H T在1997年提出，并说明在涉及长期时间序列问题上，NARX具有优秀的表现[4]。NARX是一种动态神经网络，特点是加入了延时和反馈机制，增强了对历史数据的记忆能力[5]，可被应用于解决多种领域的非线性序列预测问题。传统神经网络的输入变量可以认为是彼此独立的，时序关系一般不考虑[6]，而NARX不仅考虑了历史值的影响，还将自身预测值作为反馈输入，在时序预测中更有优势。

范哲南等[4]将NARX引入到大坝变形预测中，应用结果表明，NARX在预测精度和收敛速度上都优于传统BP神经网络。朱新远等[7]将NARX用于短时交通流量预测，结果表明NARX具有良好泛化能力和较高预测精度。史如新等[8]建立了一种基于NARX的神经网络—小波分解组合算法，实现了对光伏发电的有效预测，相较于BP网络收敛速度更快、误差更小。

在大坝安全监控指标中，土石坝的渗透压力存在明显的滞后效应[9]，基于这一特点，引入NARX神经网络，利用其独特的延时输入机制来模拟坝体水流渗透的滞后性，分别建立多因子和单因子模型进行渗压预测，并与传统回归模型和传统BP神经网络做对比来表明其时序预测的优势。

1 NARX神经网络

NARX神经网络是一种用于描述非线性离散系统的模型，对时序数据有良好的拟合和预测能力。其函数关系表示为：

y(t)=f{u(t-Du),...,u(t-1),u(t),y(t-Dy),…,y(t-1)}

(1)

式中u(t)，y(t)——该网络在t时刻的输入和输出；Du——输入时延的最大阶数；Dy——输出时延的最大阶数；u(t-Du),…,u(t-1)——相对于t时刻的历史输入；y(t-Dy),…，y(t-1)——相对于t时刻的历史输出；f——网络拟合得到的非线性函数。

标准NARX网络是一个双层前馈网络，分别为隐藏层和输出层，其中在隐藏层有1个tanh-sigmoid传递函数，在输出层有一个线性传递函数[10]。

隐含层双曲正切传递函数：

(2)

输出层线性链接函数：

linear(x)=x

(3)

NARX是一种较早出现的递归神经网络，递归算法涉及多次使用单步模型，即使用前一个时间步的预测值作为下一个时间步预测的输入。该网络使用抽头延迟线来存储x(t)和y(t)序列的先前值。由式(1)可知，y(t)也是y(t-1)，y(t-2)，…，y(t-d)的函数，该网络的输出y(t)通过延迟反馈给网络的输入，可实现更精确的预测。

2 基于NARX的渗压预测模型

2.1 土石坝渗压影响因素

2.2 NARX网络多步预测模型建立

确定输入、输出变量后，选择一定长度的监测数据序列作为样本数据。序列过长会导致网络训练慢，还会出现过拟合，序列过短则会欠拟合，达不到预期效果。受到环境和仪器本身因素的影响，效应量监测数据往往由真实值和观测误差(噪声)组成[13]，因此需要对样本数据进行降噪处理，以取得稳定的网络训练效果。此外，为了消除水位和降雨之间的量级差，还需要用Min-Max函数对数据进行归一化处理：

(4)

式中x*——归一化值；xmax、xmin——数据中最大值和最小值。

NARX网络结构可分为开环(图1)和闭环(图2)。在网络训练过程中，真实输出是可用的，因此开环训练将使用真实输出而不是反馈输出。这样有2个优点：第一，前馈网络的输入更准确；第二，生成的网络为纯前馈架构，可以使用更高效的算法进行训练。训练完成后，将网络转换成闭环连接，此时预测值将反馈到输入层。

图1 NARX开环网络结构

图2 NARX闭环网络结构

2.3 性能评价指标

同时建立NARX多因子和单因子模型、BP多因子和单因子模型以及逐步回归模型，对同一组数据进行拟合预测，以均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对误差百分比(MAPE)作为精度指标，在3种模型中比较优劣。同时，在单因子条件下与传统BP网络对比，分析其时序预测的能力。NARX网络预测模型构建及评价流程见图3。

图3 模型构建及评价

3 实例应用

3.1 工程概况

某水库位于江苏省宜兴市，是一座大(2)型水库，水库正常蓄水位35.00 m，设计洪水位38.75 m，校核洪水位40.36 m。大坝为均质土坝，坝顶高程42.10 m，最大坝高24.10 m。大坝渗流压力监测采用测压管与振弦式渗压计组合形式，共布置8个监测断面、37个测点。

3.2 网络模型构建

选取该水库大坝桩号1+643的6号测压管，数据采样频率为1组/天，从2012年1月1日到2014年8月31日共974组数据作为样本数据，进行小波降噪后见图4。由于递归算法允许误差累积，随着时间长度增加，预测值有可能失真，故划分前944组数据用于网络训练和测试，以后30组数据对训练完成的网络进行仿真预测，建立对照组对预测结果进行评价。

图4 实测数据与降噪处理数据过程线

3.3 参数设置

网络运行环境为Matlab-R2020b，样本数据可分为训练集、验证集和测试集，其中测试集用来反映模型训练结果的好坏，而验证集在模型训练过程中可以防止过拟合现象。在测试集数量为总数据15%的条件下，通过建立多个对照组，确定验证集数量为15%，验证集对测试集的影响变化见图5。同理，其他参数通过对照试验确定最优。对于多因子模型，延迟数d设为2，即当前y值取决于前2个x值，隐含层节点数为10；对于单因子模型，由于输入变量维数减少，应当增加延迟数、适当减少隐含层节点，最终确定d=4、节点数为4；训练最大迭代次数为1 000。训练算法采用Levenberg-Marquardt (LM)，这种算法收敛速度快，适用于大多数问题的求解。