APP下载

改进极限学习机的不同类型滑坡位移预测

2018-08-10高彩云

西安科技大学学报 2018年4期
关键词:训练样本监测点滑坡

高彩云,高 宁

(1.河南城建学院 测绘与城市空间信息学院,河南 平顶山 467036;2.东华理工大学 江西省数字国土重点实验室,江西 南昌 330013)

0 引 言

中国是世界上滑坡灾害最为严重的国家之一,据中国地质环境信息网发布的中国地质灾害通报显示:2006至2015年10年间全国共发生地质灾害260 353起,其中滑坡发生的比例居于地质灾害首位,占地质灾害总数的73.79%,这10年期间由滑坡造成的伤亡、失踪人数共计11 281人,直接经济损失435.05亿元,不仅如此,滑坡所带来的次生灾害也是难以估计的。因此,采取必要的手段对其监测,进而科学、有效地对滑坡灾害进行预测预报,具有重大的经济价值及社会意义[1-2]。

滑坡从孕育到成灾受到地形地貌、地质结构、降水、工程爆破以及其他人类活动等多种因素影响[3],可以看作一个具有开放、复杂和耗散等特点的非线性动力学系统,其位移变形特点既具有确定性,也具有随机性,为此,众多学者以智能算法为主要研究手段开展了滑坡的位移预测研究,如经典智能算法中的BP(Back Propagation)、RBF(Radial Basis Function)神经网络以及SVM(Support Vector Machine)等得到了广泛应用,然而,从实际应用情况来看,上述算法存有如下缺点[4-10]

1)BP算法基于梯度下降训练网络,在训练过程中易陷入局部极小,网络收敛速度慢,且最优网络拓扑结构难以确定;

2)RBF算法在网络训练过程中需以“聚类算法迭代”为基础选取基函数中心,当建模样本数量较大时,训练耗时较大,也易陷入局部极小;

3)SVM虽然具有小样本、全局优化能力等优点,但待优化关键参数众多,如惩罚函数、核函数等。

ELM作为一种新型的前馈神经网络学习算法,其网络训练时只需设置隐含层节点数,计算过程中,网络权值及隐含层的偏置一旦被随机确定,则网络训练过程中不需要调整,并能产生唯一的最优解,具有网络参数少、且易于选择、学习速度快、网络泛化性能强等优点,逐渐引起众多学者的重视,如周超,殷坤龙等利用小波分析对滑坡位移序列进行分解,进而利用ELM算法对其分解量进行预测,并将其应用于三峡库区八字门滑坡位移预测[11];李骅锦,许强等基于ELM算法对长江三峡库区白水河滑坡的趋势项和周期项进行了建模预测[12];仲维清等采用粒子群算法对ELM的输入权值及隐含层阈值进行了优化选取[13],上述文献对极限学习机进行了研究并取得了一些成果[14-17],但对最佳隐含层神经元个数和激励函数等参数优化的深入研究较少,为此,文中提出了一种基于改进的ELM算法,并将其应用于不同类型的滑坡位移预测中,并对其适用性进行讨论。

1 典型滑坡位移模式及状态辨识

滑坡体从开始孕育变形到最终形成破坏,都历经较长的时空变化。随着内、外界影响因素(地形地貌、地质结构、降雨等)的变化,其可以演变为一完整的连续破坏过程,也可能在某时间段趋于稳定,直至停止,也可以是周期性时滑时移,对其进行位移模式及状态辨识是根据有限的初期变形监测值来对将来可能的位移趋势和最终位移值进行预测,以便根据其演化趋势采取适当措施,将滑坡位移控制在一定水平,从而确保滑坡体稳定。

典型滑坡变形时序分可以分为4类[2,4],如图1所示。

图1 滑坡变形位移曲线分类Fig.1 Classification of landslide deformation displacement curve

图1中,第(1)类、第(2)类为典型的简单滑坡位移曲线,也是(3)、(4)2类复杂曲线的基本组成部分。对于第(1)类滑坡体,前期趋势性特点明显,变形过程中,位移增量逐渐减小,位移加速度由负向零转变,后期位移速度趋于恒定,可视为滑坡匀速变形,变化起伏小,规律性强,易于外推预测;对于第(2)类滑坡体,变形过程中,位移速率从恒定到逐渐增大,位移加速度由零向正转变,且有逐渐增大趋势,若趋势变化急剧,外推预测较为困难;第(3)、(4)2类滑坡体融合了前2类的变形特点,非线性特征明显,演化规律复杂,相对于第(1)类、第(2)类而言,更难以准确预测。

2 ELM学习机理

ELM是一种新型的单隐含层前馈神经网络学习算法,网络由输入层、隐含层和输出层组成。设m,L,n分别为输入层、隐含层和输出层的节点数,假定存在N个不同的样本 (xi,ti),其中xi=[xi1,xi2,…,xim]T∈Rn,ti=[ti1,ti2,…,tim]T∈Rm;xi为网络输入;ti为网络的期望输出,则ELM训练模型可表示为[18-23]

式中yi表示ELM期望输出;βi为隐含层第i个神经元与输出层神经元间的连接权值;wi表示输入层神经元与隐含层第i个神经元的连接权;bi为隐含层神经元的阈值;g(x)为激励函数。假定训练样本数量N与隐含层神经元节点数量L相等,则对于任意给定的wj,bi,ELM都可以零误差逼近训练样本,即

顾及(1)式,则上式可改写为

将其以矩阵的形式表达

H·β=T

(4)

式中H为隐含层输出矩阵;T为网络输出矩阵。ELM的网络训练目标可以归结为如下式的优化问题

Minimize:‖H·β-y‖and‖β‖

(5)

式中H+为隐含层输出矩阵H的Moore-Penrose广义逆。

3 ELM网络特点剖析及改进

3.1 ELM网络特点剖析

由ELM学习机理可知,相对于经典智能算法而言,具有如下特点[2,12-13]

1)ELM无需迭代计算,当随机产生输入层与隐含层间的连接权值wi和隐含层神经元的阈值bi后,网络在学习过程中无需调整,只需要设置的网络参数为L(隐含层神经元个数);

2)ELM所求解的参数仅为βi(网络输出权重),且βi的求解基于最小二乘法,其解具有唯一性和全局最优性,在理论上可以提高网络的泛化能力;

3)ELM在理论上可以获取最小的训练误差。

3.2 隐含层神经元个数和激励函数的优选

由3.1节可知,利用ELM构建滑坡位移预测模型时,所需考虑的网络参数仅仅为隐含层神经元个数L,因为L的个数将直接影响参数wi,bi,βi,H的确定,目前,对于L取值的确定问题,并无确定性的方法,多数采用“试算法”,具有一定的盲目性;顾及(1)式,当ELM的所有参数确定后,激励函数g(x)的构造形式将对滑坡位移预测效果带来一定的影响,而g(x)通常可选取Sigmiod,Sine,Hardlim 3种类型,如下所示。

Sigmiod型

g(x)=1/(1+e-x)

(7)

Sine型

g(x)=sinx

(8)

Hardlim型

为了确定ELM隐含层神经元个数L,同时对g(x)进行优选,作者提出了一种二维区间搜索算法[2]:利用MATLAB自带均方误差性能函数在二维区间(L,g(x))内对参数最优解进行搜索,达到参数优化的目的。

4 ELM滑坡位移预测建模流程

基于ELM的滑坡位移预测步骤如下

1)ELM输入、输出的确定。输入量为已知滑坡位移值,输出为位移预测值(注:为了体现位移数据时效性对预测的影响,文中建模时,采用了数据滚动建模法[2]);

2)根据滑坡位移监测数据样本量,划分训练样本(用于ELM网络训练)和检验样本(评估ELM的泛化能力);

3)将训练样本和检验样本变换到[0.1,0.9]之间,以提高ELM的训练速度;

、4)ELM滑坡预测模型的构建,采用二维区间搜索算法确定L和g(x);

5)利用训练样本对ELM进行训练,进而利用检验样本进行滑坡位移值预测;

6)将ELM网络输出值进行逆变换,恢复到原始量纲,并进行预测效果评估。

5 算例分析

5.1 数据源

为了验证ELM应用于不同类型滑坡位移预测的有效性,文中选取4组滑坡位移数据

1)链子崖滑坡GA监测点11期位移数据[5],前9期作为训练样本,后2期为检验样本;

2)卧龙寺滑坡5#监测点52期位移数据[3],前48期作为训练样本,后4期为检验样本;

3)古树屋滑坡3#监测点33期位移数据[6],前28期作为训练样本,后5期为检验样本;

4)新滩滑坡B3监测点89期位移数据[25],前80期作为训练样本,后9期为检验样本;

4组滑坡位移时序经辨识后分别属于图1中的(1)、(2)、(3)、(4)类特征时序曲线。

5.2 隐含层神经元个数和激励函数的优选

以链子崖GA监测点位移数据为例进行ELM隐含层神经元个数L和激励函数g(x)的优选实验:采用2期数据滚动建模,在3种激励函数及不同隐含层神经元下,以训练样本均方根误差最小为目标函数,采用二值区间搜索算法,获取两参数的最优值,训练过程中测试误差相对于隐含层节点个数的变化曲线如图2所示。

图2 3种激励函数下隐含层神经元节点数对预测性能影响Fig.2 Effect of the number of hidden node on the ELM performance under different activation function

从图2可知,不同激励函数和隐含层神经元个数对于ELM预测影响较大,在链子崖GA点建模过程中,在相同神经元下,Sigmoid函数效果优于Sine和Hardlim函数,在同样的激励函数下,随着隐含层神经元个数由0~1 000的不断增加,预测精度逐步提高,直至趋于平稳。最终获取最优神经元数量为6,激励函数为Sigmoid.

5.3 ELM用于4种类型滑坡位移预测性能测试

5.3.1 链子崖滑坡体GA点验证实验

改进ELM网络拓扑结构为:输入节点为2(输入节点数量即为滚动建模数据维数),输出节点为1(后一期预测值),隐含层神经元数量6,激励函数Sigmoid(选取过程如5.2节)。

未改进ELM网络拓扑结构为:输入节点为2,输出节点为1,隐含层神经元数量4,激励函数Sigmoid.

2种算法对检验样本预测结果见表1.

5.3.2 卧龙寺滑坡5#点验证实验

改进ELM网络拓扑结构为:输入节点为20,输出节点为1,隐含层神经元数量68,激励函数 Sigmoid(选取过程同5.2节)。

未改进ELM网络拓扑结构为:输入节点为2,输出节点为1,隐含层神经元数量25,激励函数Sigmoid.

2种算法对检验样本预测结果见表2.

5.3.3 古树屋滑坡3#点验证实验

改进ELM网络拓扑结构为:输入节点为3,输出节点为1,隐含层神经元数量7,激励函数 Sigmoid(选取过程同5.2节)。

未改进ELM网络拓扑结构为:输入节点为3,输出节点为1,隐含层神经元数量4,激励函数Sigmoid.

2种算法对检验样本预测结果见表3.

表1 不同算法对链子崖GA点位移预测结果(单位:mm)Table 1 Results of different algorithms for point GAof Lianziya landside

表2 不同算法对卧龙寺5#点位移预测结果(单位:mm)Table 2 Results of different algorithms for point 5# of Wolongsi landside

表3 不同算法对古树屋3#点位移预测结果(单位:mm)Table 3 Results of different algorithms for point 3# of Gushuwu landside

5.3.4 新滩滑坡B3点验证实验

改进ELM网络拓扑结构为:输入节点为20,输出节点为1,隐含层神经元数量7,激励函数 Sigmoid(选取过程同5.2节)。

未改进ELM网络拓扑结构为:输入节点为20,输出节点为1,隐含层神经元数量25,激励函数Sigmoid.

2种算法对检验样本预测结果见表4.

表4 不同算法对新滩B3点位移预测结果(单位:mm)Table 4 Results of different algorithms for point B3 of Xintan landside

5.4 ELM用于4种类型滑坡位移预测效果的讨论

由表1至表4,同时结合作者建模过程(由于篇幅限制,文中未给出各滑坡体建模样本的拟合结果),从如下角度讨论ELM的预测效果。

5.4.1 整体逼近效果方面

1)链子崖滑坡GA监测点变形位移曲线在形式上属于减速-匀速型(图1(1)),前期趋势性特点明显,后期位移变化起伏小,规律性强,易于进行外推预测,故无论是利用改进的ELM神经网络,还是未改进的ELM,进行外推预测时,均效果良好(见表1);

2)卧龙寺滑坡5#监测点变形位移曲线在形式上属于匀速-增速型(图1(2)),虽然前期趋势性特点明显,但后期位移变化出现了突变,故外推预测时,利用未改进的ELM预测时,整体残差偏大;而采用改进的ELM预测时,整体残差较小;

3)古树屋滑坡3#监测点和新滩滑坡B3监测点的变形位移曲线分别属于减速-匀速-增速型、复合型(图1(3)和(4)),经历了减速、匀速、增速等多种形式的变化,数据波动起伏较大,且存在多个拐点或突变点,故利用未改进的ELM进行预测时,出现了部分曲线段吻合效果好、部分曲线段离散程度大的状况;而采用改进的ELM预测时,较未改进的ELM更为接近原始监测值。

5.4.2 预测效果方面

由表1至表4的统计结果,可知

1)改进的ELM神经网络用于4种类型的滑坡变形位移预测时,其预测精度明显优于未改进的ELM;

2)对于滑坡变形拐点或突变点预测而言,改进的ELM有一定程度的改善;

3)改进的ELM的外推预测能力较好。

6 结 论

1)基于改进的ELM滑坡位移预测模型,通过二值区间搜索算法确定最佳隐含层神经元个数L和激励函数g(x),可获得较高的预测精度,预测最小相对误差为0.017%,最大为3.712%;

2)由4类滑坡实例验证,改进的ELM能获取更高的预测精度。

猜你喜欢

训练样本监测点滑坡
保定市满城区人大常委会为优化营商环境固定监测点授牌
天津南港LNG接收站沉降监测点位布设
抚河流域综合治理监测布局优化
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
全站仪极坐标法监测点稳定性分析方法研究
人工智能
滑坡稳定性分析及处治方案
浅谈公路滑坡治理
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究