APP下载

基于线性回归对比稳健估计的沉降监测数据分析

2022-01-05刘巍汪金花

关键词:原始数据残差线性

刘巍,汪金花

(华北理工大学 矿业工程学院,河北 唐山 063210)

引言

楼房的变形监测对于人们的生活和生命安全有着重要的意义,沉降观测的数据起着决定作用。楼房沉降监测的观测分为3个时期:第一个时期为基坑开挖后要进行及时的观测;第二个时期为施工期间,在施工阶段观测的频率要大些,一般按3 d、5 d、7 d等确定周期;第3个时期为工程竣工后,竣工后的阶段观测频率可以相应减少,这主要是根据地基土类型以及地基沉降速度的快慢来决定,一般分为1个月,3个月或者半年不等。在沉降监测过程中,无论使用多么精密的仪器,总是无法避免人为因素和外界环境的影响所导致的粗差。当观测值中不含有粗差时,通常使用最小二乘法进行处理,线性拟合的效果较为准确;但在实际外业中,采集数据时会产生粗差,最小二乘法由于不具有抗差性而不能剔除粗差,有一定的局限性,而稳健估计则可以在数据含有粗差的时候进行抗差处理,进而减少粗差对观测值的影响,从而得到更好的拟合效果。国内部分学者对稳健估计处理沉降监测数据进行了研究,梁景辉[1]采用IGGIII稳健估计和最小二乘法分析大坝沉降数据,结果表明,使用IGGIII稳健估计法能够抗拒异常值干扰,提高数据精度。同时,稳健估计在其他领域应用也十分广泛。董元[2]等以水泥胶砂试块为实验对象,对它的光谱数据进行处理,分析水泥胶块质量大小与光谱反射率两者的线性关系,实验结果表明,在光谱数据含有噪声的情况下,稳健估计法拟合更加稳定。李卫强[3]在坐标拟合中进行GNSS坐标系的转换时,为避免粗差导致结果失真,引入了稳健估计模型从而提高了转换精度。上述研究结果表明,稳健估计在处理含有粗差的数据方面有着较多的应用,由此将稳健估计引入对房屋沉降监测数据的处理。

采用了线性模型和指数模型,在此基础上分别使用最小二乘和稳健估计2种方法对房屋沉降监测数据进行处理,通过对结果进行比较,得出2种方法的优缺点以及适用情况。

1 数据源

周口恒大时代新城位于周口东新区,占地面积为16.437 7 hm2,共有16栋楼,楼层高度在42~78 m之间,建筑面积为41.500 0 hm2。工程建设的任务是商住两用,小区所处的区域地貌整体平坦。该项目是对该小区的5#住宅楼进行沉降观测,基坑等级为一级。该楼的工程示意图如图1所示。

图1 工程示意图

该研究以二等沉降观测的要求为标准,监测点的测站高差中误差为0.5 mm,精度满足二等水准观测。根据建筑物沉降观测精度要求,本次外业观测采用的水准仪为天宝电子水准仪DINI03,观测方式采用往返观测,其中观测站为偶数站时采用前-后-后-前的顺序;奇数站时采用后-前-前-后的顺序。该项研究的数据为施工期间获取的数据,观测周期较为频繁。沉降的预警线为10 mm。

2 处理方法

2.1 原始数据

此次沉降数据为对周口恒大时代新城5#C3点进行了连续46 d的观测,每2天记录一次,数据如表1所示。

表1 10~11月沉降量观测数据

由表1可以看出,累计沉降量处于缓慢上升的状态,最后趋于平稳。在这个观测过程中,可能会产生一些误差,因此通过2种数学模型并结合平差的原则对数据进行分析,分析过程可以采用图2所示的流程方法。

图2 流程图

2.2 建模方法

一元线性回归是回归模型中较为基础的回归模型,它是用来描述一个变量的变化对另一个变量变化的影响程度,该实验数据中含有2个变量,时间是自变量,累积沉降量是因变量,用数学形式表示出来

y=β0+β1x+ε

(1)

其中(β0+β1x)表示x对y的影响,β0和β1为未知参数,ε为不确定的随机因素对因变量y的影响,一般情况下随机因素ε是不可预测的。

为了估计模型参数,需要对变量进行n次观测,得到n组观测数据(yi,xi)(i=1,2,…,n),代入方程(1)时有n个方程[4]:

yi=β0+β1xi+εi(i=1,2,…,n)

(2)

2.3 平差约束法则

利用最小二乘准则求未知数据,使这些数据与实际数据的误差平方和最小。

(3)

由此得到观测值yi的中误差为:

(4)

稳健估计中最为关键的是权函数的选择,根据残差值的大小来进行不同程度的降权,达到剔除粗差的效果。

M估计准则为:

(5)

误差方程为:

(6)

(7)

BTPV=0

(8)

将误差方程代入,可得M估计的法方程为:

(9)

(10)

3 实例分析

3.1 对比分析

以周口恒大时代新城某栋楼房的沉降数据为实验数据,由于在施工过程中沉降量随时间的变化可能是一种线性的关系,也可能是一种指数的关系,对此分别建立2种模型进行分析。图3为原始数据残差图,图4为原始数据拟合图,图5为指数数据残差图,图6为指数数据拟合图。

图3 原始数据残差图 图4 原始数据拟合图

图3 指数数据残差图 图4 指数数据拟合图

由最小二乘得到的系数为β0=0.331 3,β1=0.038 8,因此一元线性方程为:

y1=0.038 8x+0.331 3

(11)

由稳健估计得系数为α0=0.257 4,α1=0.039 8,因此稳健估计方程为:

y2=0.039 8x+0.257 4

(12)

表2所示为原始数据中2种方法的中误差和方差。

表2 原始数据中误差和方差

从图4可以看出,在含粗差的情况下,一元线性回归方程拟合的直线产生了较大偏差,而稳健估计的拟合直线只产生了微小的偏差。由表2可知最小二乘算得的中误差为0.454 4,稳健估计所得中误差为0.413 6,结合图像以及中误差,可得在有粗差的情况下,稳健估计的抗差性效果好于最小二乘法,其结果也更加准确[7]。

从图5可以看出,原始指数数据中含有粗差,基于含有粗差的情况,来分析最小二乘和稳健估计在指数模型中的抗差性。

由最小二乘法得到的系数为a0=0.419 6,b0=-5.653 2,因此指数方程为:

(13)

由稳健估计法得到的系数为a1=0.773 0,b1=-10.119 2,因此指数方程为:

(14)

表3所示为指数数据中2种方法的残差平方和。

表3 指数数据的残差平方和

从图6可以明显看出,基于稳健估计的拟合效果要优于最小二乘法,并且由表3可知稳健估计的残差平方和小于最小二乘法,结合以上两点可以说明稳健估计的抗差效果较好,因此,在含有粗差的情况下选用稳健估计的方法更为合适。

4 结论

通过对这2种模型的分析可以得出房屋沉降量随时间变化的关系,不同的方法产生的误差也不同。在数据较为准确的情况下,采用最小二乘简便可行,但在实际测量中无法避免出现粗差,这时稳健估计就体现出优越性,通过剔除粗差来得到准确的结果,同时也为房屋施工提供了精度保证。

猜你喜欢

原始数据残差线性
多级计分测验中基于残差统计量的被试拟合研究*
基于残差-注意力和LSTM的心律失常心拍分类方法研究
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
融合上下文的残差门卷积实体抽取
关于非齐次线性微分方程的一个证明
非齐次线性微分方程的常数变易法
线性耳饰
论航空情报原始数据提交与应用
对物理实验测量仪器读数的思考
常数变易法的理论依据