基于时间序列预测模型的基坑监测数据处理
2022-08-10杨月恒左帅
杨月恒,左帅
(1.华北理工大学 矿业工程学院,河北 唐山 063210;2.华北理工大学 机械工程学院,河北 唐山 063210)
在基坑项目的基础工作过程中,基坑被毁的事故时有发生,造成了一定的经济损失和人员伤亡,对基坑坍塌事故作出合理的解释成为必不可少的环节。基坑变形是普遍存在的现象,由于不同的随机因素的影响,决定发展趋势的变形是不定向的[1-2]。
基坑的理论研究[3-4]表明,理论、经验和监测结合只是指导基坑工程设计和施工的重要途径。一方面受复杂的地理条件、大幅度地开挖以及长时间地暴露等不可控性因素的影响,通过对基坑工程的动态监测以及对工程建筑物结构的牢固性进行检测,分析各项监测数据,判断基坑的现状以及未来的发展趋势,依照情况及时对设计方案进行商讨和调整,确保基坑周边建筑的安全。另一方面,基坑工程的设计理论还不成熟,随着监测分析资料不断丰富,能对一些假说进行验证,为建立合适且实用的变形预测模型做好铺垫。在基坑开挖过程中,理想值与监测值之间往往存在差值,设计专家组要对基坑工程的动态监测数据进行综合分析,检查设置参数是否满足要求,如果发现问题及时作出相应的措施,为设计整改提供可靠的数据支撑;施工方根据每段时期的监测数据,预测基坑变形未来发展状况,针对基坑进行更准确的指导施工,以便积累不同阶段的基坑施工的经验[5]。
1 时间序列预测模型
1.1 时间序列预测模型原理
时间序列分析法[5]是一种对数据进行处理的方法,它认为观测所得到的数据值并不是单独存在的,而是在这些观测值数据之间隐藏着一种相互影响的关系,该关系能够应用时间序列分析来对系统所存在的发展趋势以及动态变化作出解释,利用观测数据之间的这种自相关关系建立起预测模型,从而利用现存的观测数据来预测未来发展趋势。倘若时间序列数据量特别多时,该方法处理的效果会越好。时间序列分析模型分自回归模型、滑动平均模型、自回归滑动平均模型,其原理为:
设一组平稳的数据{Xt},考虑Xt的取值和之前各个取值Xt-1,Xt-2…,Xt-n存在一定关系,此外还和干扰成分εt-1,εt-2,…,εt-m有着关联(n,m=1,2,…),一般根据多元线性回归思想,取得模型表达式:
xt=a1xt-1+a2xt-2+…+anxt-n-β1εt-1-β2εt-2-…-βmεt-m+εt
(1)
(2)
式中,at(t=1,2,…,n),为自回归参数,βj(j=1,2,…,n)为滑动参数,{εt}为异常值序列。该式作为Xt的自回归滑动平均模型,记为ARMA(n,m)模型。
且当βj=0时,也就是说明滑动参数等于0,式中只含有自回归参数,则上式可化为
xt=a1xt-1+a2xt-2+…+anxt-n+εt
(3)
该公式称为n阶自回归模型,记为AR(n)模型。
当at=0时,也就是说明自回归参事等于0,式中只含有滑动参数,则上式可简化为:
xt=εt-β1εt-1-β2εt-2-…-βmεt-m
(4)
本公式称为m阶滑动平均模型,记为MA(m)模型。
1.2 建模方法
时间序列模型的建模过程主要包括数据采集与预处理、模型识别、模型参数估计、模型检验和模型预测等几大步骤[6-7]。通常情况下一次完整的建模过程需要多次重复实验,不能以一次结果就作为最终结果,需要经过多次模拟,才能得到合适的预测模型。
研究采用两种方法,一是移动平均法,二是指数平滑法。
1)移动平均法。移动平均法[8]是以原始数据值为发展基础,通过建立好的数据基础,对未来值进行补充。中心思想是在数据中找到时间序列的信息,计算平均值,从而找到数据发展的趋势。当受主观和客观因素的影响时,数据之间存在落差较大,无法正确地呈现出事件发展。移动平均法可以解决这一难题,进而准确地表现出事件的新进展。
计算过程为:
(5)
式中:ft为第t期的预测值;Xt为第t期的实际值;n为分段平均中数据的个数。
移动平均法容易上手,容易被学者接受,但也存在着一些不足:它要求保留充足的先前数据,且每个数据分配到的权重是相同的,还不需要考虑数据距离现在时间的长短,通常默认时间长短并不影响预测结果;第t+1期的预测值就是第t期的数据应用一次移动平均法计算出来的数据,当时间序列呈现出了明显的线性趋势时,该预测趋势比原始数据呈现的趋势有一定的延迟。
2)指数平滑法。指数平滑法[9-10]是一种特殊的改变权重的移动平均法。主要差别是对于过去的观测值的态度,指数平滑法给予数据不一样的权重,近期数据的权重数比早期数据的权重数要大,最后处理得到的预测值就是之前所有观测值的加权和。该方法是通过平滑系数的大小来呈现近期和远期的数据对预测结果的影响效果,只要简单地改变α的值便可改变指数平滑预测模型的敏感程度和预测的能力[11]。
随着起始时间的距离越来越远,一组数据呈现出按照指数的方式减少的权数序列,此序列可定义为:
α+α(1-α)+α(1-α)2+α(1-α)3+…+
α(1-α)n
显然,上式是一个几何级数,当0 <α< 1,n→∞时,此级数收敛,收敛于1,序列只是无限接近于单位和1,却永远取不到单位和1,随着时间的推移,序列开始递减。
设用指数加权序列来求解其平均数μt:
μt=αdt+α(1-α)dt-1+α(1-α)2dt-2+
α(1-α)3dt-3+…
(6)
式中:dt为第t期的实际值;μt为第t期对下一期的预测。
对于式(6)进行变形可得(7)式:
μt=αdt+(1-α)[αdt-1+α(1-α)dt-2+
α(1-α)2dt-3+…]
(7)
将式(6)中μt用μt-1代替,把式中每个下标减1,可以得到下面的加权平均数:
μt-1=αdt-1+α(1-α)dt-2+α(1-α)2dt-3+
α(1-α)3dt-4…
(8)
μt-1为式(7)方括号中内容,将其代入式(7),得到指数加权平均基本式:
μt=αdt+(1-α)μt-1
(9)
应用式(9)时注意:μt-1为上期的平滑值(预测值);μt为本期的平滑值(预测值);dt为本期的实际值。
常以第1期的实际值d1作为第2期的预测值μ1,即令μt=d1。
只要简单地改变α的值便可改变指数平滑预测模型的敏感程度以预测的能力,α值越高,预测值的灵敏度就越高,α值越低则越平稳。实践中很少采用过低或者过高的值。
根据平滑次数的不同分为:一次、二次及三次指数平滑等。但是其基本思想不会随着平滑次数的改变而发生改变,不同数值在整个过程中所享有的比重不同,预测值是所有值的加权和。
一次指数平滑法其预测模型为:
μt+1=αdt+(1-α)μt
(10)
式中:α为平滑系数(指数平滑系数与阻尼系数的“平滑系数+阻尼系数=1”);dt为原始数据序列,以第t周期的一次指数平滑值作为第t+1周期的预测值。
二次指数平滑法:根据一次指数平滑值,再进行一次指数平滑,最后建立预测模型。
二次指数平滑的预测模型为:
y=at+btT,T=1,2,…
(11)
三次指数平滑法:利用二次指数平滑值,在其上再进行一次平滑。
三次指数平滑法的预测模型为:
y=at+btT+ctT2
(12)
其中,at=3μt-3st+vt,
(4-3α)vt],
2 工程实例概况
某工程的布设观测点总共22个点,从2019年6月13日到10月7日,间隔两天采集一次数据,总共54期数据。点4在8月19号受到破坏,在8月25日进行了重置;点8在8月14日被柱埋,在8月25日进行了重置;点10在7月30日被墙埋,在8月16日进行了重置;点13、14在8月6日被墙埋,从8月14日正常测量;其中点20、21、22从8月6日开始测量。本文所使用的的数据主要源于基坑周围环境的沉降数据。利用本文介绍的移动平均法和指数平滑法两种方法对基坑变形监测数据进行预测,通过预测结果比较出更具可靠性的方法。
3 基坑变形监测数据处理
3.1 数据预处理
变形监测数据预处理使用小波去噪的方法。可以通过MATLAB软件中自带的小波工具箱来实现,选择biorNr.Nd函数进行数据预处理。biorNr.Nd函数主要应用于信号与图像的重构,能够解决分解和重构的问题。当应用于处理建筑物沉降的数据时,具有比较大的技术优势,采用双正交小波,具有良好的线性和相位性,能够很好地解决实际建筑工程的设计应用中的很多复杂问题。
选择双线性小波bior3.3函数进行分解,分离层数5层,分解过后,接下来对数据进行修正,如图1所示,处理后的信号更加平滑了,去噪过程要选择不同的函数和阈值处理,不断调整最合适的参数,从而达到最好的效果。
3.2 基坑变形监测数据对比分析
1)移动平均法。由于基坑监测数据量比较庞大,本次研究只对第一个点进行数据处理分析,当N=2时,一次移动平均误差平方和为12.678 7;当N=3时,一次移动平均误差平方和为21.318 0。针对N=2、3的计算结果进行对比分析,可以发现当N=2时,误差的平方和相对来说更小,所以当N=2时的预测值更贴近于原始数据。
图1 去噪结果
选择N=2,对原始数据进行两次移动平均,一次移动平均的误差平方和为12.678 7,MSE为0.243 8;二次移动平均的误差平方和为0.671 8,MSE为0.013 4。通过对比,发现二次移动平均的误差平方和以及均方误差均比一次移动平均小,而且差距明显,因此用二次移动平均对数据进行预测相对来说比较合适。
2)指数平滑法。由于选择阻尼系数的大小不能确定,凭借经验[9-11]找到一个大致区间,再进一步确定。为确保最后的结果更加准确,选择α为0.8、0.4、0.2进行试验,由图2可以看出,当阻尼系数为0.2时,第1期到第17期的预测值比其他两个图更贴近于原始数据,要选择阻尼系数为0.2,为了进一步确定阻尼系数的大小,接下来就又实验了阻尼系数为0.1、0.2、0.3。
图2 阻尼系数
当阻尼系数为0.1时,其误差的平方和为7.070 0,均方误差为0.133 4;当阻尼系数为0.2时,其误差的平方和为8.801 9,均方误差为0.166 1;当阻尼系数为0.3时,其误差的平方和为11.251 1,均方误差为0.212 3。利用不同阻尼系数对原始数据进行一次指数平滑得到相应的预测值,通过计算各个不同阻尼系数产生的预测值与原始数据的误差的平方和以及均方误差,可以得到,当阻尼系数为0.1时,更加贴近于原始数据,因此接下来的二次平滑以及三次平滑都将以阻尼系数为0.1为基础。
由于沉降数据的本身具备的特点,需要再次进行指数平滑,二次指数平滑的误差平方和为0.789 9,MSE为0.015 2;三次指数平滑的误差平方和为0.015 2,MSE为0.009 2。通过对误差平方和、均方误差进行比较,可以发现,当阻尼系数为0.1,且进行三次指数平滑时,误差平方和、均方误差比较小。
3)预测模型的对比分析。通过以上两节的数据处理和分析,可以发现:当采用移动平均法进行数据预测时,选择合适的间距对数据进行二次移动平均,其误差的平方和相对来说比较小;当采用指数平滑法进行数据预测时,调整适宜的阻尼系数,对数据进行三次指数平滑,误差的平方和相对来说比较小。当对这三种预测模型进行对比时,可以发现:三次指数平滑比二次指数平滑、二次移动平均更能够准确地描述未来基坑的发展状况与趋势。
为了能够得到更准确且合适的预测模型,且适合本次监测数据,对第二组、第三组数据进行二次移动平均、二次指数平滑、三次指数平滑,见表1、表2。
表1 第二组数据三种预测模型结果
表2 第三组数据三种预测模型结果
由表1、表2可知:三次指数平滑的误差平方和、均方误差比二次移动平均、二次指数平滑小,由此可以确定三次指数平滑更能准确地拟合基坑沉降数据的时序分析。
3.3 预测模型的预测分析
根据上节的预测模型的对比分析,最后选择三次指数平滑作为研究基坑变形的预测模型。根据第一组的54组数据,预测出第55、56、57期的数据,其结果见表3。
表3 指数平滑
此次研究只计算第55期预测值的置信区间,其过程为:
置信区间的上限为:
置信区间的下限为:
令显著水平a=0.05,定义预测模型数据处理的预测值的置信区间:(9.755 6,10.139 8),当未来的实际值落在置信区间内时,认为预测模型数据处理的预测值可信。
4 结论
本文主要讨论了基于某基坑工程的监测数据,经过一系列的小波去噪,然后建立时间序列预测模型,其中选择最具代表性的两种方法——移动平均法和指数平滑法,以实验数据作为基础,接着又进行了基坑发展趋势分析,最终选择三次指数平滑作为预测模型。其主要内容为:
1)利用时间序列预测方法中的移动平均法、指数平滑法对数据进行数据处理和分析,发现三次指数平滑模型的误差平方和以及均方误差这两种精度评定指标均小于其他任何一种预测模型,由此选择三次指数平滑模型作为预测模型。再利用其他的点进行以上预测模型的数据处理和分析,同样从这两种精度评定指标出发,对第二组、第三组数据处理结果对比分析,进一步验证了三次指数平滑模型优于其他预测模型。
2)利用构建的三次指数平滑预测模型,对第一个点的第55、56、57期进行预测,并做出第55期数据的置信区间,当未来的实际值落在置信区间内时,认为构建的三次指数预测模型的预测值可信。
3)通过大量的实验发现,一次指数平滑将会更适合处理直线型基坑监测数据,能够很容易地描述出原始值的变化的形态与趋势,虽然有一定的滞后性,但是有着比较突出的时间性及季节性;二次指数平滑可以通俗地说成加强版的一次指数平滑,也就是,可以应用于直线型基坑监测数据处理,而且处理的效果要比一次指数平滑稍微好些,滞后性比较小;三次指数平滑可以应用于抛物线型的基坑监测数据处理,通常建立非线性模型。由于本次的基坑的沉降位移经过小波去噪的处理,数据所形成的曲线都呈现出非线性,针对这一现象,最后选择三次指数平滑法,这样能够更准确地描述基坑数据未来的发展形态和趋势。