基于数据关联度的监测数据预测方法

2020-09-04乔升访胡贺松唐孟雄李高堂

科学技术与工程 2020年22期

周岳，朱毅，乔升访*，胡贺松，唐孟雄，李鹏，李高堂

(1.珠海大横琴股份有限公司, 珠海 519000; 2.广州市建筑科学研究院有限公司, 广州 510440；3.中铁二十局集团有限公司,西安 710000)

智能化健康监测经过多年发展,已逐步应用于土木工程领域。如吴海军等[1]分析了桥梁健康监测系统中的影响因素；郁雯等[2]对超高层建筑施工阶段的动态变形进行监测分析；奚家米等[3]对基坑变形规律进行分析。智能化健康监测系统[4]由传感子系统、数据传输子系统和损伤识别及状态评估子系统三部分组成。其中,数据传输子系统发挥着承上启下的作用,现场传感子系统采集数据,通过数据传输子系统,录入数据库中进行评估分析。数据传输子系统与传统人工监测相比,可实现监测数据实时上传和连续监测。

尽管网络化控制的数据传输子系统[5]拥有众多优势,但是也存在着以下缺点:基于无线通信的网络传输会诱导网络延时、数据丢包和数据乱序等；仪器在工作过程中易受到外界环境、电磁波干扰、传感器和执行器故障等偶然因素干扰。由于以上诸多不确定因素的影响,监测数据经常出现丢失、病态等问题。数据病态与数据丢失现象都会对数据评价造成不良影响。当数据丢失发生在重要的数据段时,会对结构分析造成较大影响；当发生在不影响分析的数据段时,造成的影响较少。而病态数据是与实际监测数据趋势不符的数据点,在整体监测曲线中与大部分数据点相差甚远,具有较强的跳跃性,极易造成结构安全性状态误判和预警系统崩溃[6],会引起不必要的恐慌和经济损失。为此,合理分析病态数据尤为迫切。

为解决病态数据对监测结果造成的不良影响,本文探讨基于数据间关联度的监测数据预测方法,并采用珠海某立交桥监测系统中桩基础轴力监测数据进行验证分析。

1 基于数据关联度的监测数据预测方法

1.1 数据关联度模型建立

实际工程中常用的无线监测仪器有二通道、四通道、八通道及以上。由于众多不确定因素的影响,多通道中的监测数据存在丢失、病态等问题。为克服病态数据的影响,以BP神经网络算法建立监测数据间的关联度模型,并对病态数据进行预测和修正。

1.2 BP神经网络分析

BP神经网络[7]通过学习可实现以任意精度拟合任意函数,特别适合预测不满足叠加原理的系统。如陈涛[8]采用BP神经网络对大坝变形进行预测；黎善武[9]运用大数据技术对监测数据进行分析；韩大建等[10]基于用神经网络方法建立桥梁损伤评价模型。

BP神经网络算法的特征在于信号的前向传播和误差的反向隐藏层传播。在正向上,输入信号从输入层逐层传播至隐藏层,经处理直到输出层。如果在输出层不能获得期望的效果,将重复调整网络层中的权重和阈值,然后将BP神经网络转移至反向传播,图1为BP神经网络的结构。X1,X2,…，Xn代表BP神经网络的输入值Y1,Y2,…，Ym代表BP神经网络的预测值,wij和vij为网络的权值。

图1 BP神经网络训练结构图Fig.1 BP neural network training structure diagram

1.3 预测结果评价

通过误差Di与误差百分比Si两个指标对数据的拟合精度进行评价,具体如下:

Di=|Bi-Ai|

(1)

Si=|Di/Ai|

(2)

式中：Di为误差的绝对值；Ai为真实值;Bi为预测值；Si为精度，%。并运用相关系数、协方差、标准差等参数对预测数据规律进行分析：

(3)

式(3)中：Cov(Ai,Bi)为Ai与Bi的协方差；Var(Ai)为Ai的方差；Var(Bi)为Bi的方差。此时,Corr(Ai,Bi)可表征Ai与Bi间线性紧密程度。当Corr(Ai,Bi)较大时,可认为Ai与Bi相关程度较好；反之,则认为Ai与Bi相关程度较差[11]。

2 案例分析

2.1 项目概况

图2 某监测桩基础图Fig.2 Monitoring pile foundation diagram

依托某立交桥工程项目,该项目位于珠海市横琴新区,场地内分布深厚软土层(可达40 m),钻(冲)孔灌注桩的长度可达90 m,如图2(a)所示。由于场地条件复杂、不确定因素多,需要对超长桩基础受力状态进行实时监控,为此采用振弦式钢筋计监测桩基础纵筋受力变化,运用4通道无线自动采集仪实现监测数据采集,并通过4G无线模块将采集数据实时上传至监控云平台,如图2(b)所示。现场监测仪器安装与保护如图2(c)、图2(d)所示,限于篇幅,这里不再详细介绍桩基础自动化监测系统。

2.2 建立数据预测模型

采用该监测系统中95组4通道监测数据作为样本数据,如图3所示,其中4条数据曲线分别代表无线自动采集仪四个通道(CH1、CH2、CH3、CH4)在某一时间段内的监测数据。其中前90组数据作为样本数据库进行数据训练,挖掘无线应变监测仪中通道数据间关联度,并利用训练样本数据库对余下5组数据进行预测,进一步将预测得到的5组数据与实际监测数据进行对比分析。

图3 采用的样本数据组Fig.3 Data sets for this study

主要对三个通道和四个通道数据间的关联度进行讨论。其中,三个通道间的关联度是指两个通道数据组合预测余下一个通道数据情况,四个通道间的关联度是指三个通道数据组合预测余下一个通道数据的情况。两个通道数据预测一个通道数据具有多种组合情况,这里随机选择三种情况下的两个通道数据进行预测,尽量减少耦合因素影响；四个通道数据间相互预测的组合情况有四种,将全部进行分析。具体流程如图4所示,采用不同通道数据组合,分别对四个通道的数据进行预测分析。YC3表示三个通道数据预测余下一个通道数据，YC2表示两个通道数据预测余下一个通道数据，YC1表示自身数据进行预测。以CH1为例，分别由CH2、CH3和CH4的数据组合进行预测得到，CH2和CH4的数据组合进行预测得到，以及CH1自身数据进行预测得到，进而分析不同预测情况下的变化规律。CH2、CH3、CH4与CH1的数据预测流程相同。为此，可分别得到5组数据的预测值，如图5所示。

图4 案例分析流程图Fig.4 Flow chart of case study

图5 预测数据与真值比较Fig.5 Comparison of prediction data and true value

2.3 预测结果讨论

在图5中,每组4个数据值,包括3个预测值(YC1、YC2、YC3)和1个真值；组数1～5表示CH1的预测值和真值；组数6～10表示CH2的预测值和真值。如此类推,可得CH1～CH4的数据预测值,共20组。根据图5,可得20组预测情况下的频率误差,如图6所示；同时可得到每个预测值对应的应力值及误差值,如图7、图8所示。由图6可知:YC3的预测误差为-3～3 Hz,精度为0.06%～0.28%,且波动较小；而YC2和YC1的预测误差分别为-22～15 Hz (0.09%～0.37%)和-26～24 Hz(0.08%～2.35%),且预测误差值的波动较大。另外,由图8可知:YC3的预测应力误差为-0.05～0.05 MPa,且波动较小；而YC2和YC1的预测应力误差分别在-2.2～1.2 MPa和-2.3～1.6 MPa,且波动较大。由此可见,YC3的预测结果最贴近真值,预测精度最高,而且预测精度波动最小。另外,YC3、YC2和YC1的预测误差值标准差分别为1.34、7.45、10.34 Hz,相应预测值与真值的相关系数分别为0.99、0.95和0.89。这说明多通道数据组合关联的预测精度比单通道更高,且随着通道组合数的增加,预测精度会得到进一步提高。此外,对振弦式传感器而言,尽管自身通道数据的频率预测值具有较高精度(误差3%以内),但应力误差却可达-2.3～1.6 MPa。

图6 预测精度Fig.6 Prediction accuracy

图7 预测应力与真值比较Fig.7 Comparison of prediction stress and true value

图8 预测应力误差Fig.8 Prediction error of stress

2.4 预测精度影响分析

影响数据预测精度的因素众多,其中样本训练模型的监测数据组数和通道组合数对数据预测精度影响较大。这里探讨数据组数(30组、20组、10组)和通道组合数对预测结果的影响,选取图4中待预测5组数据最近的30组、20组和10组数据分别作为训练模型的样本数据。这样组数与通道组合数的情况共有9种,分别是110、120、130、210、220、230、310、320、330。百位数字表示通道组合数(1、2、3分别表示YC1、YC2、YC3),十位和个位代表为数据组数。为此,5组数据预测结果如图9所示。根据图9可得不同通道组合数下的预测应力误差,如图10所示。其中,区域A中样本训练模型的数据组数是10组,B、C分别为20、30组。

图9 预测应力比较Fig.9 Comparison of prediction stress

图10 预测应力精度Fig.10 Prediction accuracy of stress

由图10可知:YC3的应力误差曲线最平稳,而YC1的误差值曲线波动最大,这说明通道组合数越多,数据预测精度越多,这与上文结论一致。区域A数据波动幅度最大；区域B次之；区域C最小,这意味着样本训练模型组数对预测精度影响较大,数据组数越多,预测精度越高。其次,数据组数对YC2和YC1的精度影响较大,而对YC3的精度影响较小。这也表明采用单通道数据进行数据预测时,需要的样本训练模型组数足够大时,才能满足预测精度要求；而利用多通道数据间关联度进行数据预测时,对样本训练模型组数需求较小,通过较小的数据量即可满足预测精度要求。