改进BP神经网络模型在索塔变形预测中的应用
2022-03-11高大龙
陈 帅,黄 腾,高大龙
(1.河海大学地球科学与工程学院,江苏 南京 2100982;2.江苏省地质矿产局第一地质大队,江苏 南京 210041)
钢壳-混凝土结构作为一种新颖的特大型斜拉桥索塔结构,对缩短桥梁的建设工期和提高桥梁的建造质量有重要意义。但是新结构也带来新挑战,工程中需要在建造安装时检测索塔姿态和预测索塔稳定窗口,为后期梁段的精密定位安装、斜拉索张拉提供基础数据,开展钢-混凝土组合索塔周日变形监测分析具有重要的工程意义。
1 函数模型及其相关算法
1.1 基于多元函数模型的岭回归算法
多参数的传统数据分析建模方法一般为多元线性回归模型:
式 中,θ0、θ1、θ2、···、θn为 待 估 模 型 参 数;x0、x1、x2、···、xn为观测值;假定观测误差ε服从正态分布,根据极大似然估计的思想,采用拉格朗日乘数法,可建立损失函数J(θ):
工程领域的监测数据较少,特征值往往较少,且数学模型较为复杂。对模型而言,自变量X之间有很强的相关性,使得近似接近奇异阵,数据有很小的变化就会造成参数估计和方差发生很大变化。为防止多重共线性的问题,提高模型的泛化能力,人为的在(式3)中加入对参数约束条件,放弃方程的无偏性,进行正则化改正。采用岭回归模型可以解决上述问题,其模型标准形式为:
式中,k为超参数,添加了正则项kl的模型,会使得的特征根远离零值,将会减小,从而提高了模型参数估计的可靠性。
岭回归模型最重要的就是确定岭参数的值k。常用的估计岭参数k的办法有基于方差扩大因子计算、基于残差平方和计算和岭迹法。本文结合索塔周日变形监测的实际情况,采用观察岭迹图来确定岭参数k和模型的自变量,即k在变化时,将中所有模型参数的变化曲线绘制在一张图上。根据张波[1-2]等的经验,岭参数和模型自变量的选取一般遵循以下原则:
1)合适的k应使得原模型参数变得稳定。
2)合适的k可以纠正原模型参数的符号,使得更贴合工程监测含义。
3)去掉原模型回归系数比较平缓且接近于零的自变量。
4)去掉岭迹图中不稳定但随岭参数k的增加迅速趋于零的自变量。
1.2 BP神经网络模型
神经网络模型和岭回归模型一样,都是求使得误差最小的各个特征值的系数,用以进行验证和预测。BP神经网络又称误差反向传播的神经网络模型,由输入层、隐含层、输出层构成,每层含有若干个神经元。层与层之间的神经元都通过一个带有权重的连接进行传递,再把这些传递的值累加得到一个总输入值并与阈值相比较,然后通过一个“激活函数”处理得到最终的输出。BP神经网络模型通过误差反向传播不断调整连接的权值和神经元的阈值,直到网络的误差最小,达到拟合的效果[3]。图1为BP神经网络的神经元结构模型图:[x1,..., ]xn为神经元的输入量即模型的自变量;[ω1,..., ]ωn为各个输入量的权值即模型中各个自变量的系数,f为传递函数,b为阈值,y为输出量;再通过传递函数的变换传入下一层的神经元。最终传入到输出层,通过计算反向传播误差函数,在不断调节网络连接权值和阈值使误差函数E达到最小。
图1 神经网络神经元结构模型
根据误差最小原则,将前项传播误差逐步展开至输入层可得:
式中,D为期望值;O为网络模型计算值;进而采用梯度下降算法(gradient descent,GD)进行迭代求解,快速找到最优的权值ω和常数b。
1.3 基于阈值的小波分解重构法去噪
基于阈值的小波去噪是小波变换的应用。小波变换实质上是2种及以上基函数来模拟原函数,小波分析在时域和频域都有表征信号局部信息的能力,因此对构造好的小波信号进行去噪。在实际监测的过程中,数据可分解为真值和噪声,使用小波变换将二者分离,根据阈值进行删除和调整,达到去噪的目的[4]。假设观测值为:
式中,y(i)为测量值;f(i)为真值;u(i)为噪声,其中噪声服从高斯正态分布。在信号分解过程中真值一般为低频信号,噪声是高频信号。不同的基函数、处理方式和阈值会产生不同的结果。一般的为保证在大部分情况下,降噪后的信号应该至少和原信号具有同等的光滑性,和降噪后的信号和原信号的方差估计应该是最坏情况下的方差最小,需要提前计算好阈值和处理方式,处理流程如图2。
图2 小波去噪流程
2 索塔监测方案
2.1 项目概况
南京长江五桥桥位现场位于南京西北部长江水域,桥梁结构为纵向钻石型塔中央双索面三塔组合梁斜拉桥,主塔采用钢壳-混凝土结构,双幅整体式构造,分为北、中、南三塔,均为纵向双肢结构,划分为承台、下塔柱、横梁、中塔柱、上塔柱。世界上首次采用的钢壳-混凝土组合结构,但是新型的索塔结构,更需制定较为合适的周日变形观测方案[5-6]。
2.2 监测的基本要求
为保证索塔结构安全,设索塔最大允许变形值为Δ,则索塔周日变形必要监测精度m为:
根据李朝奎[7-8]等的研究可设m=±6 mm。在实际测量中,采用全站仪三维坐标法测量监测点位,必要观测精度主要由控制点点位误差、仪器误差组成。即:
已知控制网最弱点点位中误差为1.3 mm,强制对中观测墩距索塔顶部监测点平距约为300 m,采用标称精度为测边0.6 mm+1 ppm,测角0.6″的全站仪,经计算m≈±1.8 mm,满足监测点的点位精度[9]。
根据邬旻昆[10]等的研究,索塔在一日内成周期性摆动,并受环境因素影响,为了能更好的研究周期变化的规律,进行大于2个周日的观测用以提供更多的观测数据。
2.3 环境变量的影响分析
钢壳-混凝土结构索塔主要在太阳热辐射作用下,由于太阳照射方向及强度不断变化,造成索塔内外壁、阴阳面的温度不均匀分布,导致索塔内部混凝土的膨胀量出现差异,产生不同方向的应力,造成索塔的变形现象。这一变形随着日照时长,在一日内呈现周期性的变化,称之为周日变形[10-12]。
影响索塔周日变形的因素很复杂,本文在进行索塔周日观测资料分析时只考虑外部影响因子。其构造的数学模型具体表达式为:
式中,F(x,y)为测点的观测值;F(T)为塔体四周温度变化;F(V)为风压作用在索塔上引起的变化;F(t)为随时间引起的索塔自有摆动频率和日照效果下的变形;δ为其他不确定的影响因素引起的索塔变形的总和。
1)温度变化分量F(T)。索塔周日变形的温度分量取决于整个索塔的内部温度场的变化。通过热传导方程计算出索塔内部温度梯度场,采用有限元模型划分,进而计算出由于温度应力产生的位移。在作定量分析时,假设测量时温度处在稳定状态,索塔内部温差主要与索塔四周气温、水气压、长江水温有关,因大体呈线性关系,测站温度也会影响观测精度,所以规定温度变化分量表示为:
式中,T1为平均干温;T2为平均湿温;T3为索塔表面背阳侧温度;T4为索塔表面向阳侧温度;p为一小时内平均气压;e为平均湿度。
2)水气压和风压分量F(V)。特大型斜拉桥跨越大型河流,四周空旷且多为低矮的丘陵,其特征为白天多有波动,午夜前后趋于稳定,具有一定的随机性,且风压作用的角度和索塔的受力面积均不相同,将风压分量分解为2个方向,具体表示为:
式中,v为风速;θ一般记录为方位角,需转换为顺桥向的夹角。
3)时间分量F(t)。当索塔建成之后,受外部环境影响,导致内部混凝土存在不同方向的应力,形成固有频率的摆动,该摆动为随时间t变化的周期函数。且随着日照时间τ增加,太阳辐射的半周日作用同样会影响索塔的偏移。时间分量表示为:
2.4 观测数据
以南京长江五桥北塔为例,共测得30组观测数据,如表1所示。
表1 北塔连续观测数据
3 模型建立
3.1 数据预处理
观测数据往往存在偶然误差,首先就要对原始观测数据进行去噪处理。小波去噪过程中,有thr阈值、SORH阈值处理方式、SCAL阈值调整方式、N小波分解层数和wname所用小波函数等几项需要确定参数。为确定最优参数,可计算不同参数去噪信号均差RMSE、信噪比SNR和平滑度来进行选择。根据张恒[13]等的研究,当信噪比未知时,使用db4小波基或与其接近长度的小波基可得到较好的处理结果,且使用软阈值的处理方式去噪信号的平滑度最佳。但是由于观测数据起伏较大,对于非平稳一维序列的数据去噪阈值和阈值调整方式就成为最大的影响因素。阈值选择规则有rigrsure自适应阈值选择、heursure启发式阈值选择、sqtwolog经验阈值选择和minimaxi用极大极小原理选择阈值。阈值调整方式有one不调整和mln根据噪声估计调整等方式如表2、3所示。
表2 对X数据不同阈值选择规则和调整方式的去噪效果指标
表3 对Y数据不同阈值选择规则和调整方式的去噪效果指标
为保证去噪数据与原数据最为贴合,采用r更接近1、SNR尽量大、RMSE尽量小的原则。X数据采用minimaxi和mln组合参数最为合适。同理,Y数据采用rigrsure和mln组合参数最为合适。去噪后数据如表4所示。
表4 去噪后数据/m
3.2 岭回归模型的建立
由于自变量之间存在多重共线性的问题,普通的多元线性回归会产生过拟合现象,而岭回归模型在参数求解中加入正则项,可以很好地解决这类问题。为了更好的确定参数对索塔的影响,首先进行数据归一化处理,并对30组数据进行分类,取25组数据为训练集,剩余5组数据为测试集。以观测值X为例,观察11个自变量的岭迹图可知,x7的岭回归系数稳定且绝对值比较小,应当去除;x1、x3随岭参数k的增加迅速趋于零,应当去除。x0为平均干温,当k>0.1时,x0的符号变为负号且趋于稳定,其中索塔施工坐标系以东南方向为X增加的方向,三面受阳,大里程方向受温度影响更大,符合温度增加X值减小的实际情况,所以可设k=0.1。同时使用RidgeCV方法进行交叉验证,结果为k=0.127,与观察岭迹图得到的k较为接近,选取k=0.1是合理的。
岭回归模型复相关系数R2=0.88,如图3、4所示,虽然岭回归模型拟合精度比较高,但是在某些点上的预测还有一定的误差,其残差分布呈现不稳定的状态。
图3 观测值X的模型回归系数岭迹图
3.3 岭回归-BP神经网络模型的建立及分析
选取归一化处理之后的全部自变量和经岭回归模型检验筛选的部分自变量进行神经网络的预测,其中隐含层的节点个数是模型拟合程度的关键,它的最优值取决于输入、输出层的神经元节点个数l、n和训练样本所蕴含规律的复杂程度a。本文使用试凑法(式13)通过寻找模型的最优验证性能(BVP)和最大确定系数R2确定隐含层节点个数。
图6 岭回归-BP神经网络模型预测对比
以观测值X为例,BP神经网络和岭回归—BP神经网络的输入层神经元个数分别为11和8,输出层均为1,计算得到隐含层节点数m在[4,10]间。图5、6为2个模型不同节点数预测结果与实测结果的对比。通过训练之后,得出当隐含层节点数为4时,BP神经网络模型的性能最佳,BVP为0.015 3,R2为0.93;当隐含层节点数为7时,岭回归-BP神经网络组合模型的BVP为0.011 7,R2为0.95。因此确立BP神经网络和岭回归-BP神经网络两模型的最优网络拓扑结构为11-4-1和8-7-1。通过岭回归筛选自变量之后的BP神经网络模型,性能更优,拟合程度更好,预测精度更高。
图5 BP神经网络模型预测对比
3.4 实验分析
本文采用均方根误差、平均绝对误差、平均相对误差三项指标对BP神经网络,小波-BP神经网络,小波-岭回归-BP神经网络3种模型进行评价,如表5所示。
图4 观测值X的小波-岭回归模型预测与残差结果
表5 3种模型的性能对比/mm
由表5可以体现,使用小波去噪后的数据能明显提高模型的预测精度,对单一使用BP神经网络模型有一定优化作用;小波-岭回归-BP神经网络的各项误差都相对较小,预测结果比另外2种更为出色。
4 结论
本文通过分析影响钢壳-混凝土索塔变形的环境因素,使用小波阈值去噪优化观测数据,使用岭回归模型筛选对模型产生较大影响的自变量,并建立了BP神经网络模型。通过不同算法组合模型的实验进行预测,比较分析出BP神经网络,小波-BP神经网络,小波-岭回归-BP神经网络3种模型的预测精度都很高,但是小波-岭回归-BP神经网络在RMSE、MAE、MAPE三项指标值都是最小的,结果表明该模型在钢壳-混凝土索塔的周日变形预测中有一定的参考价值。