水工建筑物安全监控深度分析模型及其优化研究

2021-03-01任秋兵李明超李明昊

水利学报 2021年1期

任秋兵，沈扬，李明超，孔锐，李明昊

（1.水利工程仿真与安全国家重点实验室，天津大学，天津 300354；2.中国长江三峡集团有限公司，北京 100038；3.中国电建集团西北勘测设计研究院有限公司，陕西西安 710065）

1 研究背景

为达到防洪、发电、灌溉、供水等目的，需要修建不同类型的水工建筑物以控制和调配水流，如挡水建筑物（大坝、堤防等）、输水建筑物（渠道、渡槽等）、整治建筑物等[1]。结构安全是建筑物发挥调控功能的前提，而安全管理为建筑物正常运行提供保障，尤以长期安全监控为甚。将各种仪器布设于水工建筑物关键部位，通过监测变形、渗流等效应量，从不同维度综合反映其工作性态[2]。根据原型观测资料，利用统计学、机器学习等方法，构建多效应量数学监控模型，能够及时掌握和预测建筑物结构性能的重要变化，从而为评价建筑物安全状况、发现建筑物异常迹象提供科学依据[3]。

依据构建方法的不同，常规水工建筑物安全监控模型大致分为统计模型、确定性模型和混合模型。以统计模型为代表的三大常规模型应用颇广，时至今日仍然发挥着重要作用，其推导过程和适用范围详见文献[4]；然而，常规建模方法难以适应繁多因子与效应量间的复杂非线性关系，且易受不确定性因素干扰，故无法确保所建模型的准确性和稳健性[5]。20世纪末，人工智能技术攻关和行业应用发展势头迅猛。徐洪钟等[6]和苏怀智等[7]率先将人工神经网络（Artificial Neural Networks，ANN）、支持向量机（Support Vector Machine，SVM）等建模方法成功应用于水工建筑物安全性态分析；之后，利用机器学习算法对不同效应量进行建模预测一直是水工建筑物安全监控领域的研究热点[8-11]。Wang等[12]、Wei等[13]和李明超等[14-15]进一步发展并创新提出了组合模型、时空模型等一系列先进方法，并取得了丰富成果。据此，吴中如等[5]归纳总结出安全监控模型的总体发展趋势如下：三大常规模型逐渐向组合化、时空化和智能化发展，以此提高模型的准确性、鲁棒性和外延性。

随着安全监控理论和计算机技术的不断进步，智能化是水工建筑物安全监控发展的必然趋势，其主要体现在监测手段、数据管理和数值方法三个方面。目前，水利信息化建设偏重于监测仪器和信息集成系统的升级改造，而对数据分析方法的研究和创新关注较少[2，16-19]。这就引发数学监控模型的信息挖掘能力与数量日益庞大、形式日渐复杂的原型观测资料不相适应的问题，直接影响到模型的预测表现。尽管ANN、SVM 等浅层学习算法相较于统计模型在非线性信息提取方面有较大提升[20]，但在某些场景下仍旧难以满足监控需求。深层非线性网络模型[21]为解决上述问题提供了可行性。深度学习[22]是ANN发展的突破，亦是机器学习领域的拓展，其利用复杂结构或多重非线性变换处理层对数据进行高度抽象，因而在隐含信息挖掘方面优势明显。以长短期记忆网络[23]（Long Short-Term Memory，LSTM）为例，其能够充分挖掘时序数据中的时间依赖性以增加信息维度，从而实现对滑坡位移[24]、地下水埋深[25]等监测量的高精度预测。而在水工建筑物安全监控领域，有关LSTM等深度学习算法的应用探索还鲜有报道，仅有少量研究[26-29]将其用于大坝变形预报，目前尚未扩展到其他水工建筑物，亦未针对监测数据自身特性进行优化处理。

为此，本文在LSTM算法的基础上构建水工建筑物安全监控深度分析模型，并对算法进行优化，以提高所建模型的预测可靠性和工程适用性，其主要包括以下三个方面的内容：（1）界定水工建筑物安全监控大数据的概念，并阐明直接应用深度学习算法构建安全监控模型的局限性；（2）有针对性地提出适用于不同类型水工建筑物的安全监控深度模型构建及优化方法；（3）通过多类型水工建筑物的多效应量实测数据验证所提模型方法的有效性。

2 深度学习及其应用分析

2.1 安全监控大数据特性水工建筑物安全监控大数据并不完全符合信息技术行业大数据的“5V”特征[30]（即Volume、Variety、Velocity、Value和Veracity），具有其独特性，主要体现在以下五个方面。

（1）在容量方面，单一项目监测数据量不大，仍属于小规模数据集；繁多项目长期监测记录构成的数据库体量巨大，但远达不到PB级。

（2）在种类方面，数据多源自各种监测仪器，如三峡大坝安全监测系统布置的仪器种类有六十多种，数量达到一万余支；数据格式呈现“大部分结构化，小部分半/非结构化”的特点，且结构化数据演变形式复杂多样，总体上以周期性演变为主，但也不乏突变、噪声等情况。

（3）在获取速度方面，各种监测仪器本身采集频率较高，但受限于系统设置，一般以天为单位进行统一采样；且运行初期采样速度较快，后期逐步放缓，以至于数据存储时间间隔不固定。

（4）在价值方面，多数项目监测数据价值密度较高，即有价值的数据所占比例较大。

（5）在真实性方面，除非监测仪器发生故障或失效，否则数据质量往往较高，但也伴随着局部离群值等。

2.2 LSTM原理概述水工建筑物在施工和运行过程中所产生的监测数据大多为结构化时序数据。传统ANN每相邻两层节点全互连，同层节点却相互独立，故难以学习时序数据的内在延续性。循环神经网络[31]（Recurrent Neural Networks，RNN）将时序概念引入网络结构中，表现为隐层间节点相连，且隐层输入同时包含输入层输出与上一时刻隐层输出，使其在时序数据分析方面适应性较佳。但RNN 经过多次迭代容易出现梯度爆炸或梯度消失的问题，导致网络不稳定甚至无法收敛[32]。为此，LSTM[23]应运而生，其不仅克服了梯度问题，还提高了预测间隔或延迟较长的时序数据的能力，遂成为当前处理时序数据最流行的深度学习算法之一。

LSTM在RNN的基础上增加了特殊单元（即记忆模块），其学习当前信息的同时，还会提取长时间跨度数据之间的关联性，以此减缓信息丢失速度，实现持久记忆。如图1所示，记忆模块由遗忘门（）、输入门（）和输出门（）构成，用于决定数据更新或丢弃。具体来说，遗忘门控制上一时刻内部状态（）需遗忘的信息量，输入门控制当前时刻候选状态（）需保存的信息量，而输出门则控制当前时刻内部状态（）需输出给外部状态（）

（1）利用上一时刻外部状态（）和当前时刻输入（），计算出、和：

（2）结合和更新记忆单元状态（）：

（3）通过将信息传递给：

式中：σ(⋅)、tanh(⋅)分别为Sigmoid函数和双曲正切函数；w、b分别为权重矩阵和偏置向量；⊙表示两向量的标量积。

图1 LSTM单元内部结构[25]

2.3 深度学习算法适用性分析对于水工建筑物安全监控大数据，深度学习（如LSTM）与浅层学习相比，主要“深”在能够更为全面地获取数据潜在规律，从而为提升模型预测性能奠定信息基础。因此，LSTM算法在水工建筑物安全监控通用模型构建框架中，不仅能承担模型层的预测功能，而且能减少特征层中手工提取有效信息的工作量。再者，LSTM模型结构便于调整，可依据数据形式的复杂程度而定[33]。不过，根据监测数据特性，直接应用LSTM算法构建安全监控模型仍有以下几点不足：（1）监测数据中存在含噪失真、非等间距以及局部空值野值等现象，需加强数据前端处理；（2）监测数据处理讲究及时有效，模型难以实现全数据处理，需限定记忆区间以减少模型训练时长；（3）模型表现易受监测数据多重共线性等的影响；（4）模型超参数较多，而单一项目监测数据量并不大，容易发生过拟合；加之，监测项目众多，数据形式多样，对模型泛化能力提出了更高要求；（5）监测数据外延对模型多步预测精度和特殊场景应对能力亦较为重视。因此，有必要优化深度模型架构以适应安全监控大数据分析的需求。的信息量。其对应计算过程如下：

3 水工建筑物安全监控深度分析模型优化构建方法

针对上述不足，以LSTM深度学习算法为基础，从数据前端处理、网络拓扑结构和外延预测方法三个方面着手改进，提出一种适用于不同类型水工建筑物的安全监控深度分析模型。

3.1 数据前端处理为了提高安全监控模型的外延能力，需提前对原型观测资料进行清洗、降噪和变换等必要的处理。现给定包含T个数据的任一效应量监测序列yj(t)，t=1，2，…，T；j=1，2，…，J，其中缺失值和异常值分别用表示，那么前端处理具体操作步骤如下：（1）步骤1。数据清洗。利用笔者先前所提“插值填补”和“异常检测”算法分别对监测数据中局部缺失值异常值进行实时处理（详见文献[10]），得到修正序列不同于传统数据清洗方法[34]，“插值填补”算法能通过分布式建模充分利用缺失区域双侧已知监测数据估计未知空值yjnu(t)，而“异常检测”算法则能通过鲁棒分解对异常值起到明显放大作用，使其便于识别。

（2）步骤2。降噪平滑。一般认为，实际监测数据往往含有不同程度的噪声。在处理含噪数据时，为了最大限度还原真实信号，同时避免相移，先将输入序列按顺序滤波，再将滤波结果逆转并反向通过滤波器，最后将所得结果逆转后输出，即为降噪平滑序列其数学描述[35]为：

式中：hj(t)为所用数字滤波器冲激响应序列；分别为第一、二次滤波结果；分别为第一、二次滤波结果的逆转序列。

需要说明的是，上述步骤均是针对效应量yj(t)而言，若是对影响因子xi(t)，t=1，2，…，T；i=1，2，…，I进行前端处理，将yj(t)替换为xi(t)即可。此外，倘若优化深度模型选择对效应量yj(t)进行一元时序预测，就在上述步骤的基础上，补充运用分段三次Hermite 插值函数[36]完成数据均匀化。为表述方便起见，下文将经过前端处理的效应量（或因子仍称为yj(t)（或xi(t)）。

3.2 网络拓扑结构全部数据（包括效应量yj(t)及其影响因子xi,j(t)）经过预处理后，按照一定比例划分为训练集Tr、验证集Va和测试集Te，随后采取以下措施对深层网络拓扑结构进行优化改进。

（1）并联搭建深层网络LSTM1和LSTM（2统称LSTM1，2），其中LSTM1用于一元时序预测，直接根据历史监测数据对效应量yj(t)未来变化趋势进行外延分析；LSTM2则用于多元回归预测，即通过效应量yj(t)及其影响因子xi,j(t)间的因果关系构建数学模型，进而求解待估计参数。

（2）超参数调试对深层网络的预测效果影响较大。以LSTM2为例，通过试算和随机搜索算法，对隐层数nh、各隐层节点数nn、学习率lr和优化迭代次数ni等超参数进行迭代优化，选取最优超参数组合相较于LSTM2，LSTM1需将时序问题转化为监督学习问题，故增加时间窗口长度wt这一超参数。

（3）多数效应量监测序列存在长期相关性（即记忆性），通常越接近待预测值的数据对外延精度的影响越大，且过多的历史冗余数据会增加模型的复杂度[37]。在预设范围内，通过限定步长l改变Tr跨度，循环训练得到不同的网络根据Va多次评估选取精度较高的网络结构其对应的有效记忆区间Tr +Va（区间长度设为d）即可满足预测Te的要求。

（4）为避免LSTM1，2因Tr数据量较少而出现过拟合等问题，一方面，控制网络深度和训练周期，根据训练损失和Va性能评估确定何时提早停止；另一方面，采用L2正则化、Dropout、批标准化等方法对模型参数进行约束，提高模型的泛化能力[38]。此外，添加正则项也有助于解决共线性问题。

（5）针对不同应用场景，将多步预测精度和逐步误差累积作为竞选指标，自动择优选用或进行外延预测，并利用全连接层进行维度变换（一维输出），以此实现最优化数学建模。

3.3 外延预测方法直接多步预测（Direct Multi-step Prediction，DMP）能够一次返回多个时刻的预测值是目前安全监控模型中最常用的外延方法。DMP的学习、估计过程分别见下式：

式中：f1(⋅)为预测模型，文中指代LSTM2；ε为学习误差；H为外延步数。

与DMP 不同，滚动单步预测（Rolling One-step Prediction，ROP）是将上一时刻预测值yj(t) 作为下一时刻预测值yj(t+1) 的输入，利用动态更新间接实现多步预测，直至达到待预测步数H为止。ROP的学习、估计过程分别见下式：

式中：f2(⋅)为预测模型，文中指代LSTM1；d为有效记忆区间长度。

对于一个稳定的预测模型，无需高频次学习更新，通过设定更新时间tu即可完成周期性的模型迭代。

综合上述三个方面的改进，以LSTM算法为基础的水工建筑物安全监控优化深度模型得以构建，称为优化LSTM模型（Optimized LSTM，OLSTM）。

4 工程实例验证

图2 某混凝土坝IP4_01_X方向变形监测数据

图3 某调水工程多效应量监测仪器读数记录

基于上述模型方法，选取多组不同效应量实测数据作为典型应用场景，对OLSTM进行有效性和准确性验证，旨在通过此实例说明OLSTM在多类型水工建筑物安全监控方面的优势。为此，以某混凝土坝IP4_01_X方向变形监测数据（数据示于图2，竖线以右为预测期）与某调水工程关键部位钢筋计、测缝计、应变计和渗压计读数记录（数据示于图3，竖线以右为预测期）为例，设定3种实际应用场景，引入逐步回归统计模型（SRSM）和SVM、反向传播神经网络（BPNN）等浅层模型与OLSTM深度模型进行性能对比。仿真实验中需要注意以下几点：（1）确保各模型输入数据前端处理步骤（详见3.1节）的一致性，滤波结果示于图2和图3；（2）将浅层模型性能调至最优，SVM超参数（惩罚因子、高斯核函数参数）和BPNN 超参数（连接权重、阈值）均由随机搜索算法优化；（3）OLSTM 采用自适应矩估计算法更新内部参数，损失函数、隐层激活函数分别设为均方误差（MSE）和tanh 函数；（4）由于SVM、BPNN 和OLSTM 预测存在随机性，遂将各模型10 次运行结果取均值作为最终输出；（5）选用MSE、平均绝对误差（MAE）和平均绝对百分比误差（MAPE）作为量化评估各模型预测性能的统计指标。需要说明的是，本文限于篇幅仅在图2和图3中绘制出效应量监测序列。

4.1 场景一：数据量大，形式简单由图2可知，该测点变形呈明显的周期性变化，是工程中最常见也是最简单的一种数据演变形式[39]；监测数据样本量较大，数值变化幅度基本一致；存在几处分布较为离散的异常突变（图2红色框选处）。现采用SRSM、SVM、BPNN 和OLSTM 这4种模型对大坝变形进行外延预测，各模型的DMP结果如图4所示。从图4可以看出：（1）所有模型均未准确把握大坝变形的局部细微波动，仅预测出大致变化趋势；（2）SVM预测结果区别于其余3种模型，与实测值差距较大，说明其性能易受数据波动的影响；（3）前150 步内，OLSTM 预测效果明显优于SRSM 和BPNN，这正是此3 种模型性能差别的主要所在，表现出深度模型在大量数据挖掘分析方面的潜力。表1 是上述4 种模型的性能评估结果，各模型预测效果按照统计指标从优到劣排序为：OLSTM>SRSM>BPNN>SVM。

图4 IP4_01_X测点变形的多模型预测结果

表1 IP4_01_X测点变形多模型预测性能量化评估结果

4.2 场景二：数据量小，形式复杂正如图3（a）—（c）所示，该调水工程钢筋计、测缝计和应变计的读数记录是符合本应用场景的3个实例，其数据特征描述如下：与4.1节中大坝变形相比，3组数据样本量相对较小，演变形式复杂多样；钢筋应力数值变化幅度随着时间推移逐渐变大，且在预测期伊始陡然上升；裂缝开合度数值在实测期始末变化速率较快，中间呈平稳变化状态；应变数据中存在诸多幅度不一的波动，周期性特征被掩盖。现将不同模型（SRSM、BPNN和OLSTM）用于外推估计上述仪器读数，各模型的ROP结果如图5（a）—（c）所示。由图可知：（1）3种模型的预测误差均随外推步长的增加而增大（即误差累积效应），尤以SRSM为甚，表明传统统计模型难以适应非平稳数据处理；（2）BPNN和OLSTM短期预测效果相仿，OLSTM长期预测结果与实测值更为接近，说明深度模型可用以长期安全监控；（3）3种模型中仅有OLSTM 捕捉到局部数据波动，但仍存在一定偏差。从“多步预测精度”角度而言，3种模型在不同效应量预测中的性能量化评估结果（表2）亦能佐证上述观点，各模型预测效果按照统计指标从优到劣排序为：OLSTM>BPNN>SRSM。

图5 多效应量多模型预测结果

表2 多效应量多模型预测性能量化评估结果

4.3 场景三：因子缺失，形式复杂图3（d）中渗压计读数表现为密集型振荡模式，随机噪声较大；数据样本量较小，且缺失预测因子，难以依靠外生变量修正原始数据，准确预测未来趋势难度较大。在此场景下，无法使用传统统计模型，只能将BPNN和OLSTM用于水位变化的外延预测，两种模型的ROP结果如图5（d）所示。从图中可以看出：前10步内，OLSTM预测结果更加贴近实测值，且数值存在恰当的波动；10步之后，实测数据变化幅度增大，OLSTM保守选取中值作为预测结果，而BPNN一直维持固有速率呈下降趋势。总体而言，同等情况下深度模型能够抓取更多信息来提高逐步预测精度。

5 结论

针对复杂非线性安全监控大数据，从前端处理、网络结构和外延预测三个方面出发，通过改进加强LSTM深层网络，提出适用于不同类型水工建筑物的安全监控优化深度模型，为深度学习推广应用奠定了研究基础。基于所提出的模型，结合某混凝土坝和某调水工程多效应量监测数据，设置3种典型应用场景下的多模型性能对比仿真实验，结果表明该模型在外推估计方面优势明显，主要表现为：（1）相比于常规、浅层模型，深度模型适用于更多场景，且同一场景下其预测效果提升显著；（2）通过数据清洗、降噪平滑等前处理方法提高了数学建模效率，并改善了模型计算复杂度；（3）借助竞争机制和超参数优化，自动选取较优预测方式，不仅提高了模型的泛化能力，还减少了人工干预成本；（4）采用限定区间、早停、正则化等策略，缩短了模型训练时长，同时缓解了过拟合和共线性问题；（5）DMP重在把握整体演变趋势，ROP则能反映局部数据波动。

鉴于深度学习算法在水工建筑物安全监控领域的应用研究尚处于起步阶段，本文未能详尽讨论其他应用场景，现提出以下两点展望供相关人员参考：（1）深度模型预测性能与数据量密切相关，而部分地区水工建筑物历史观测资料完整性、可靠性均不足，如何利用有限数据开发高精度网络是一个重要的研究课题；（2）目前多数从业人员只能通过加深或加宽网络改善模型性能，而无法对网络内部进行有效的数学解释，因而亟待研究深层网络的可判读性和可理解性。