时间序列在地铁隧道变形监测数据处理中的应用
2015-04-21谢文国高俊强徐东风
谢文国,高俊强,徐东风
(南京工业大学 测绘学院,江苏 南京210000)
变形监测的目的之一就是对变形监测数据进行正确的处理,并建立合理的数学模型,从而对未来的变形量做出准确预测,以减少工程事故的发生。时间序列分析法的特征是选择合适的数学模型来近似模拟动态数据,以达到控制与预测的目的。本文从时间序列分析基本方法和原理出发,对南京地铁某监测点的变形监测数据进行分析研究,建立模型并进行数据预测,结果证明该方法具有较好的拟合和预报精度,很好地预测了变形监测点沉降的变化规律。
1 时间序列模型的建立
1.1 时间序列的基本模型
正态、平稳、零均值的时间序列为 {xt},{xt}的取值与前p步的xt-1,xt-2…xt-p值有关,也与前q步各干扰值at-1,at-2,…,at-q有关,根据多元线性回归思想可得{xt}的自回归滑动平均模型,记为模型ARMA(p,q),其表达式为
式中:φi,θi为参数,{ai}为白噪声序列。
式(1)中,当θi=0时,原式为
式(2)称为p阶自回归模型,记为AR(p),当φi=0时,原式变为
式(3)称为q阶自回归模型滑动平均模型,记为MA(q)。
1.2 数据检验与预处理
数据的平稳性是时间序列模型建模的重要前提,建模前首先要检验观测数据是否满足正态、平稳、零均值的要求,即是否为平稳性数据。对于不满足平稳性的数据要进行预处理,处理方法主要有差分法和提取趋势项两种。
1.3 时间序列模型的识别
平稳性数据的主要特征是一阶和二阶统计性质不随时间改变而改变,即均值和方差为常数。可通过其自相关和偏相关函数的变化趋势来判断平稳、正态、零均值的时间序列采用何种模型。
自相关函数估值计算
偏相关函数的估值计算
模型识别的依据:根据样本的自相关函数及样本偏相关函数的变化趋势识别模型类型。如果{xt}的样本自相关函数ρk在k>q后截尾,则判断{xt}为MA(q)序列;如果偏相关函数φkk在k>q后截尾,则判断{xt}为AR(p)序列。如果ρk和φkk都不截尾,只是按负指数衰减趋于0(即拖尾),则判断其为ARMA序列,但还不能判定阶次。
ρk和φkk截尾性的判断:理论的自相关ρk和偏相关φkk的截尾性是指从某个p或q值后全为0。但由于参数估计的随机性,ρk和φkk都是随机变量,即使{xt}为MA或者AR模型,在k>p或k>q之后,ρk或φkk也不全为0,只会在0附近上下浮动。因此,对于ρK或φKK的截尾性,只能凭借统计手段进行检验和判别。
1.4 常用AIC时间序列定阶准则
AIC准则,即最佳准则定阶法,AIC准则表示方法为
其中:k为参数数量,l为似然函数。
假设条件是模型的误差,服从独立正态分布。AIC准则是对模型参数极大似然估计的计算,对模型的阶数和相应的参数给出的一组最佳估计,一般在给出不同模型的AIC计算公式基础上,选取使AIC达到最小值时的阶数为最佳理想阶数。
1.5 时间序列模型参数估计
模 型 的 未 知 参 数 包 括φ1,φ2,…,φp和θ1,θ2,…,θq。模型的参数估计分为粗估计和精估计,这里主要采用的是精确估计中的最小二乘参数估计法。对于时间序列Y= {y1,y2,…,yn}和未知参数β= {β1,β2,…,βn},他们之间有线性关系:Y=Aβ+ε,其中ε= {ε1,ε2,…,εm}为观测噪声,其中A为可由Y计算得到的n×m维矩阵,此时,可求得β的线性最小二乘估计β= (ATA)-1ATY。
1.6 模型适用性检验
通常对残差平方和进行F检验,检验公式为
其中N为样本长度,r=p+q参数总个数,S为被检验参数个数,A0为ARMA(p,q)的残差平方和。A1为 ARMA(p-1,q-1)的残差平方和。若F>Fa,则表示所选模式的不合适,应继续提高阶次建模,否则 ARMA(p-1,q-1)为合适模型AR(p)和 MA(q),模型的F检验过程类似,只需改变S和r即可。
2 实例分析
2.1 概况
以南京市地铁某个变形监测点为实例,取等时间间隔一段时间内的30期沉降数据,用前25期沉降数据进行时间序列模拟与建模,后5期的数据进行验证模型预测的可靠性,观测数据如表1所示。
表1 南京市地铁某监测点变形监测数据
2.2 建模
时间序列建立模型的基本条件是:正态、平稳、零均值。经检验原数据不是平稳性数据,因此要先对数据进行平稳和零均值处理,然后计算出其自相关和偏相关函数(见表2)。
从自相关和偏相关的数据变化趋势,可以看到他们是拖尾的,因此可设为ARMA模型,由表2可知自相关1~5阶较显著,并且从第6阶开始大幅下降,数值也不显著,因此先设定q=5。偏相关1~3阶都显著从第4阶下降很大并变为不显著,因此先定p=3,计算p=1~3,q=2~5取值时AIC的值(见表3)。
表2 自相关和偏相关函数
表3 ARMA模型AIC参数估计的阶数值
依据AIC准则,选取最小值所对应的阶数,表3中 ARMA(2,3)取最值为0.653 984,所以 ARMA(2,3)为最佳模型。使用最小二乘估计法对模型参数进行估计,得到该时间序列模型为:xt=-0.032-0.827xt-1-0.248xt-2+at-0.491at-1-1.088at-2-0.804at-3。
2.3 模型适用性检验
对模型的残差进行F检验,取s=1,p=2,q=3,取样本长度N=15。可求得ARMA(2,3)模拟的残差平方和A=0.071 16,求得 ARMA(3,4)的残差平方和A0=0.104 289,根据公式可求得F=3.731 705 9,取a=0.05,查表可得F0.05(2,8)=19.37,比较得到F<Fa,所以认为 ARMA(2,3)为适合的模型。
2.4 数据预测
预测模型曲线与实际曲线对比,如图1所示。
图1 ARMA(2,3)模型预测曲线
使用该模型对后5期数据进行预测,结果如表4所示。
表4 真实值与预测值的对比
表4中看到利用ARMA模型预测的5期数据,预测误差均小于0.06mm,预测数据准确合理。
3 结束语
通过分析地铁变形监测数据,建立时间序列模型,从得到的预测结果看出此方法能够以较高的精度对观测数据进行拟合和预测,适用于地铁沉降数据处理分析。但从预测数据与真实数据对比中看到预测误差整体上是逐渐变大的,并且预报的效果逐渐降低。所以在实际应用中为保持较高的预报精度,要不断地根据新观测的数据进行新的计算,建立新模型,以求达到精确的预报结果。
[1] 张英莹,吴正,郭明旻.交通流实测数据的时间序列分析[J].复旦学报:自然科学版,2011(6):762-772,229.
[2] 梅红,岳东杰.时间序列分析在变形监测数据处理中的应用[J].现代测绘,2005(6):14-16.
[3] 刘大杰,陶本藻.实用测量数据处理方法[M].北京:测绘出版社,2000.
[5] 王军德,杨国清.时序分析模型在高挡墙沉降预报中应用[J].北京测绘,2012(3):63-66.
[6] 史玉封,孙保琪.时间序列分析及其在变形监测数据处理中的应用[J].金属矿山,2004(8):13-15.
[7] 皱利.回归分析在大坝变形监测数据处理中的应用研究[J].工程地球物理学报,2007,4(6):644-647.
[8] 王晓华,胡友建.变形监测研究现状综述[J].现代测绘,2006(2):130-132.
[9] 杨晓松,张双成.新陈代谢GM(1,1)模型在建筑物沉降监测中的应用[J].交通科技与经济,2014,16(3):100-102.
[10]张松,田林亚.时间序列分析在地铁沉降监测中的应用[J].测绘工程,2014,23(10):63-66.
[11]唐估辉,黄腾,赵兵帅.GOM和时间序列组合模型在地表沉降预测中的应用[J].测绘工程,2014,23(2):70-72.