APP下载

基于Adaboost.RT算法的隧道沉降时间序列预测研究

2019-11-08陆慧娟叶敏超

中国计量大学学报 2019年3期
关键词:阈值隧道样本

李 伟,严 珂,陆慧娟,叶敏超

(中国计量大学 信息工程学院,浙江 杭州 310018)

隧道沉降问题不仅影响着城市轨道交通的发展,同时对城市居民的生命财产安全都有极大的威胁,因而对隧道沉降的预测研究一直备受关注。国内外学者对隧道的沉降预测进行了大量的研究,研究方法大致可以分为两类:理论计算经验法和实测数据分析法[1]。理论计算经验法以Peck经验公式法为代表,包括数值分析法、数值模拟法、半理论解析法和随机理论模型等。如:WU等提出的基于正态分布函数的盾构隧道地下沉降计算方法[2]。ISLAM和GNANENDRAN提出的粘土弹性-粘塑性模型(EVP)对高岭粘土、香港海洋沉积物粘土和Fukakusa粘土进行了诸多实验研究[3],均取得了良好的预测效果。ZHU和LI提出一种新的GP模型准确地表达了沉降槽中VL和最大SS的关系,有效地对隧道沉降进行了预测[1]。LI[4]等人使用理论结论法和实验分析法研究了循环荷载作用下软土地基超载预压低路堤沉降,提出了软土路堤在循环荷载作用下沉降的计算公式。GUO[5]等人从时间与沉降的关系入手,从数学上证明了适用于建筑和路堤工程的线性荷载作用下的沉降曲线为“S”形,在此基础上,提出了一种新的沉降预测模型——Poison模型,对建筑和路基沉降进行了有效的预测研究。

实测数据分析法分为基于统计学的方法和机器学习方法,尤其是机器学习的研究应用,为解决隧道沉降预测问题提供了许多新的解决思路。如:龙熙华等人分析了地铁隧道沉降因素并结合BP神经网络提出ANP-BP模型对西安地铁隧道进行了精准预测[6];OCAK等针对EPBM(earth pressure balance machines)隧道地表沉降,采用SVM进行沉降预测[7],试验结果证明,SVM具有较高的适用性;AZADI和POURAKBAR等提出使用有限元法对隧道周边的建筑进行沉降研究,然后使用神经网络对各种沉降情况进行分析,最终得出对隧道沉降的预测结论[8];MOGHADDASI等使用了ICA优化的ANN算法对隧道沉降进行了预测研究[9]。

理论计算经验法的有效性取决于土体模型的合理性和土体参数的获取方法,所以理论计算经验法的泛化性较差;而实测数据分析法的有效性取决于大量的样本数据,因而泛化性较好,但是因为使用单一的模型,所以对复杂的非线性回归问题预测精度不高。

时间序列是指系统中某一变量的观测值按时间顺序排序成一个序列[10],它是受系统中其它各种因素影响的总结果。通过对此序列的研究,可分析出事物的变化特征和发展趋势、规律。时间序列现已被广泛应用于许多方面,如工程中隧道沉降,经济领域中的金融股票等。

本文研究数据即为单维时间序列数据,所以鉴于样本数据为随机性极强的单维时间序列,同时研究的问题是复杂的非线性回归问题,因而本文提出使用Adaboost.RT算法集成多种学习模型的方法对隧道沉降进行预测研究。

1 集成学习

集成学习理论基础源于KEARNS和VALIANT提出的可学习性(Probably approximately correct, PAC)学习模型[11]。其主要思想是训练若干学习器后,使用一定的策略将学习器结合得到一个比任意单个学习器效果更好的强学习器。

1.1 Adaboost算法原理

Bagging和Boosting是目前使用最多的两种集成学习算法,二者都已有许多成功的应用。然而BAUER等人的研究表明在整体模型中作为Boosting家族最具代表性的Adaboost算法效果普遍优于Bagging算法[12]。因而本文选用Adaboost作为提升算法。

AdaBoost是一种迭代提升算法,其核心思想是:根据随迭代次数不断更新的学习样本权重确定一个由不同弱学习器构成的强学习器。最初所有训练样本的权重被赋予相等值,随着训练迭代样本权重不断的更新,预测误差大的样本权重将增加,这样便加大了弱学习器对难以预测样本的关注以实现更高精度的预测。最后根据样本权重、预测误差等将弱学习器加权整合得到唯一的强学习器模型。

最初的Adaboost算法被用来解决分类问题,如Adaboost.M1和Adaboost.M2[13]算法。后来Adaboost被应用到解决回归问题,便出现了Adaboost.R,Adaboost.R2[14-15]和Adaboost.RT[16]算法。

1.2 Adaboost.RT算法

Adaboost.RT算法是SOLOMATINE和SHRESTHA[16]在Adaboost.R和Adaboost.R2等Adaboost回归算法的基础上做出的改进算法,他们在Adaboost算法中引入了一个阈值,通过对训练误差和阈值的比较将训练集分成好坏两类,从而将回归问题转化为简单的二分类问题。Adaboost.RT算法已被广泛应用于诸多工业和经济领域回归问题。

Adaboost.RT算法流程如下:

第一步 输入,一组训练样本集W={(x1,y1),(x2,y2),…,(xm,ym)},弱学习器;

第三步 训练,对于t=1到T进行迭代,

依据权值分布Dt对原始训练集经行采样,并使用采样样本数据训练弱学习器,

第四步 输出最终的强预测器:

2 基于Adaboost.RT算法集成多学习模型的隧道沉降预测方法

2.1 基学习模型的选取

为获取泛化性能强的集成强学习模型,集成中的弱学习器应尽可能相互独立,但在实际任务中无法做到。大多数研究者们都是选用相同的基学习模型并使用不同的训练样本训练以得到不同的弱学习器。本文选择使用不同的基学习模型作为弱学习器来得到一个泛化性强的强学习模型。然而,因为研究的隧道工程数据量较少,是一个小样本数据,所以需要适合处理小样本数据的模型;同时考虑到模型的训练会花费不少的时间,因而选择了三种不同的学习能力强且适合处理小样本数据的基学习模型——SVR,BP,ELM作为基学习器。

SVR从SVM支持向量机发展而来[17],具有很强的泛化能力,可以较好地解决小样本、过学习、高维度以及局部最小等问题;BP神经网络[18]具有较强的自适应性、自组织性、自学习性和非线性映射能力。它克服了传统反馈方法的不足,近年来得到了越来越广泛的应用。ELM极限学习机[19]较传统的梯度下降算法具有更快的收敛速度和较高的预测精度,并易于获取全局最优。

2.2 方法流程

本文使用Adaboost.RT算法训练三种学习模型得到不同弱学习器,然后加权获得最终的强学习器。Adaboost.RT集成三种不同基学习器的算法描述。

算法1:Adaboost.RT集成三种基学习模型

输入:训练集X={(x1,x2,x3,y1),(x2,x3,x4,y2),…,(xm,xm+1,xm+2,ym)};

三种基学习模型L1,L2,L3.

迭代次数T=3.

阈值φ,样本权重Dt

过程:

2)fort=1,2,Tdo;

3)依据样本权重Dt划分训练集,训练基学习器Lt:ft(x)=Lt(X,Dt)→y,

7)end;

在Adaboost.RT算法中阈值的选取对算法的效果具有很大的影响,然而目前并没有一种确切可靠的阈值自动选择算法,所以本文采用手动调整阈值的方式,重复不断地调整阈值。

3 仿真实验和结果分析

3.1 数据来源

本文数据来源于隧道工程实际采集的时间序列数据,工程项目为珠海市2015—2016年交通隧道上方采集的地表沉降数据。数据为工程每个采集点按时间顺序依次记录的地表沉降数值,所以是单维的时间序列数据。实验随机选取部分(采集点序号:180~250)实测数据进行预测研究。

因为样本数据为一维时间序列,存在样本维度过低问题,所以本文使用灰色理论中的等维新息方法[20]将原单维数据拓展成多维数据。经多次实验验证,取历史数据数为3,即每次使用前三个历史点预测第四个点,这样原本单维样本数据便拓展成为三维样本数据,以此解决维度过低问题。

3.2 实验结果

实验选取珠海轨道交通工程采集点数据进行仿真,通过多次训练调整阈值,得到最终的实验结果。实验拟合如图1。

图1 预测拟合曲线Figure 1 Prediction fitting curve

选取回归模型通用的3个评价标准对各个方法的性能进行评价,RMSE(Root mean squared error)均方根误差,MAE(Mean absolute error)平均绝对误差,MAPE(mean absolute percent error)平均绝对百分比误差。各评价指标计算公式如下:

(1)

(2)

(3)

各个方法性能指标结果如表1。

表1 Adaboost集成多模型算法和SVR、BP network以及ELM性能比较Table 1 Performance comparison of Adaboost integrating multiple method algorithm with SVR,BP network and ELM

本文同时做了与Adaboost.RT算法集成单一模型方法的对比实验。为与所提的方法保持一致,且在实验中发现增加集成的模型数量,最终的强学习器预测效果没有明显的提升,所以对比实验中亦选择训练三个弱学习器模型得到最终的强学习器,每个方法预测性能结果如表2。

表2 Adaboost集成多模型方法与Adaboost集成SVR、Adaboost集成BP network、Adaboost集成ELM方法性能比较Table 2 Performance comparison of Adaboost integrating multiple models method with Adaboost integrating SVR methodl, Adaboost integrating BP network method and Adaboost integrating ELM method

3.3 结果对比分析

图1是Adaboost.RT集成三种模型预测结果与三种模型各自的预测结果拟合曲线,从图中可以明显的看出,Adaboost.RT集成多种模型的方法在预测精度上有较为明显的提升;表1是各种方法预测性能数据对比,无论是RMSE、MAE还是MAPE,均是Adaboost.RT集成多学习模型的方法表现最好,鲁棒性最强。

为继续验证基于Adaboost.RT集成多模型算法对隧道沉降时间序列的预测效果,本文同时做了与Adaboost.RT集成SVR、Adaboost.RT集成BP和Adaboost.RT集成ELM方法的对比分析。从表2可以看出在预测精度和泛化性上,使用Adaboost.RT集成多学习模型比使用Adaboost.RT算法集成任意单一模型方法表现都要好。所以,我们得出使用Adaboost.RT算法集成多学习模型的方法可以有效地应用于隧道沉降时间序列地预测中。

4 结 论

针对目前隧道沉降预测单一模型或统计方法预测精度较低、泛化性差等问题,本文提出使用Adaboost提升算法训练提升不同的弱学习模型,加权后得到一个强学习模型。仿真实验结果表明,本文使用Adaboost.RT集成训练多种弱学习器而得到的强学习器模型,在对隧道沉降的预测研究中不论是预测精度还是泛化性上都要优于任意单一的学习预测模型。所以此方法可以有效的应用于实际工程中对隧道沉降的预测研究。后续工作可从Adaboost集成何种基学习模型或改进Adaboost算法等方面进行研究。

猜你喜欢

阈值隧道样本
土石坝坝体失稳破坏降水阈值的确定方法
用样本估计总体复习点拨
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
预见2019:隧道的微光
神奇的泥巴山隧道
规划·样本
大型诱导标在隧道夜间照明中的应用
随机微分方程的样本Lyapunov二次型估计
黑乎乎的隧道好可怕
基于迟滞比较器的双阈值稳压供电控制电路