基于时间序列与人工蜂群支持向量机的滑坡位移预测研究*
2019-09-06范宣梅
杨 帆 许 强 范宣梅 叶 微
(①地质灾害防治与地质环境保护国家重点实验室(成都理工大学) 成都 610059)(②四川大学商学院 成都 610065)
0 引 言
滑坡的预测预警是国内外学者研究的热点问题。自20世纪60年代日本学者斋藤(Satio, 1965)提出滑坡位移经验公式预报法以来,众多学者对斜坡变形破坏及滑坡预报方法进行不断的探索(张倬元等, 1994)。目前,滑坡预报手段通常有两种方法:一是基于降雨阈值方法进行预报,通常在特定地区范围较为适用(伍宇明等, 2014; Palladino et al., 2017); 二是基于现场实测数据进行预报(包括位移变形、孔隙水压、含水率及微震监测等方法)(Busslinger, 2009; Li et al., 2012)。由于后者监测数据具有实时动态的特点,在一定程度上具有更高的预报精度。针对滑坡位移预报方法多种多样总体可分为确定性模型、统计预报模型和非线性预报模型3类(苏爱军等, 1990; 廖野澜等, 1996; 黄润秋等, 1997; 兰恒星等, 2000; 李秀珍等, 2003; 汪洋等, 2004; 尹光志等, 2007; 许强等, 2008; 杜鹃等, 2009; Li et al., 2012; 董秀军等, 2015; 苗发盛等, 2016; 郭子正等, 2018; Li et al., 2018; 杨背背等, 2018; Zhu et al., 2018)。
随着现代科学技术的不断发展,滑坡位移监测及预测预报手段越来越丰富,监测精度得到显著提升。滑坡预测预报研究已从之前的单因素预报方法,逐渐转变为基于实时监测数据,结合定性、定量及现代数值预报技术等多种手段的综合动态预报,并开发自动化预警系统,实现主动防灾减灾的新阶段(许强等, 2004, 2014; 苏白燕等, 2018)。选用适合的方法对位移-时间曲线的监测数据进行分析,将其应用于滑坡监测预警系统作为预警判据,对防灾减灾具有十分重要的意义。
随着模式识别与智能计算的发展,一些数据挖掘的方法(如神经网络模型、灰色模型、时间序列分析模型、小波分析模型、极限学习机模型、支持向量机、混沌序列模型等)被应用到滑坡位移预测研究中(刘晓等, 2005; 杜鹃等, 2009; 徐峰等, 2011; 张俊等, 2015; 周超等, 2015; 阙金声等, 2016; 邓冬梅等, 2017; 郭子正等, 2018; Li et al., 2018; Zhu et al., 2018)。刘晓等(2005)用BP神经网络方法提取位移趋势项,结合时间序列ARMA进行滚动预测; 杜娟等(2009)结合BP神经网络分别对滑坡趋势项和周期项位移进行预测,根据时间序列提取趋势项并预测,以BP神经网络方法对周期项位移进行预测。徐峰等(2011)结合灰色模型和自回归AR模型的滑坡位移预测方法,采用灰色模型和自回归AR模型进行预测研究; 张俊等(2015)采用多项式及PSO-SVR对趋势项和周期项位移进行预测; Li et al.(2018)用小波函数联合ELM、OS-ELM建立滑坡位移预测模型。均取得较好的结果。邓冬梅等(2017)在张俊等(2015)成果基础上,加入集合经验模态分解(EEMD)的粒子群优化-支持向量机回归方法进行位移预测研究; 在前人研究成果基础上,郭子正等(2018)基于小波分析的三角函数模型进行周期项位移预测研究; 杨背背等(2018)运用基于时间序列与长短时基于网络(LSTM)进行位移预测研究。
上述方法中,杜娟等(2009)存在研究样本年份过短、单个多项式对趋势项位移进行拟合精度不高、灰色系统对于非线性序列研究误差较大等问题(徐峰等, 2011); 人工神经网络缺乏完备的理论基础,存在模型结构难确定、精度难保证及泛化能力不高等缺点(张俊等, 2015)。支持向量机是Corinna Cortes和Vapnik于1995年首次提出的一种基于统计学习模型的监督式机器分类技术(Vapnik, 1995),有坚实的数学理论基础,可以较好地解决小样本、非线性和局部最小等问题(杨帆等, 2017)。在模型训练过程中特征子集的选取以及参数的设定对分类结果有显著的影响(Zhao et al., 2011)。常用支持向量机参数优化算法有遗传算法(GA)、蚁群算法(ACO)、粒子群算法(PSO)及模拟退火算法等(Shelokar et al., 2004; 杨成祥等, 2005; Huang et al., 2006; Niknam et al., 2010; Zhao et al., 2011; 刘爱军等, 2013; 吴华锋等, 2013; 陈健飞等, 2016)。但上述传统算法的性能很大程度上依赖其选用的参数,同时,在解决多峰值问题的寻优过程中,结果容易陷入局部最优问题,从而直接影响预测结果的准确性(陈健飞等, 2016)。人工蜂群算法具有较好的全局搜索能力,鲁棒性强,可较好地解决上述问题,避免陷入局部最优。
针对上述问题,本文提出了一种基于时间序列与人工蜂群算法支持向量回归机(ABC-SVR)的滑坡位移预测模型。以三峡库区白水河滑坡为例,用时间序列加法模型结合平滑法中的移动平均法,将监测点位移数据分解为两项:滑坡位移趋势项和滑坡位移周期项。用多项式最小二乘法对位移趋势项数据进行分段拟合,由人工蜂群支持向量机基于位移周期项数据进行训练及预测。同时选取长江库水位、本月累积降雨、前一月累积雨量、前两月累积雨量、前一月库水位变化量、前两月库水位变化量与监测点年累计位移量7项因子结合灰色系统关联分析法研究各因素与周期项位移间的关联性。将趋势项、周期项位移预测值叠加得到总位移预测值并同实际监测位移进行对比。通过与BP神经网络和PSO-SVR模型预测结果的对比,该模型表现出较好的预测结果。
1 滑坡位移预测方法介绍
1.1 时间序列加法模型
地壳表层是个复杂的开放系统,滑坡在其发展演化的过程中会受到多种因素的影响与控制,其位移时间序列理论可概括为3部分(杨叔子, 1991):包括受地形、地质构造等内部地质因素影响的趋势项; 受降雨、地下水及库水位变动等外部作用影响的周期项; 以及一个随机项。 由于在现有技术条件下,难以对随机项因素进行准确评估,因此,在本文的滑坡位移预测研究中暂不考虑随机项因素,时间加法序列模型可以简化为:
X(t)=φ(t)+η(t)
(1)
式中,X(t)为时间序列函数,φ(t)为位移趋势项,η(t)为位移周期项。
1.1.1 趋势项位移提取
滑坡位移趋势项代表了滑坡位移长期发展的趋势。采用移动平均法提取趋势项位移,可削弱或消除时间序列中季节和不规则周期变动的影响。计算式如下:
(2)
1.1.2 周期项位移提取
由时间序列加法模型公式(式1)可知,用滑坡总位移减去滑坡位移趋势项即可得到滑坡位移的周期项。
1.2 支持向量机
支持向量机,是1995年由Corinna Cortes和Vapnik首次提出的一种基于统计学习VC维(Vapnik-Chervonenkisdimension)和结构风险最小化理论的监督学习分类技术。该模型采用核映射思想,在解决小样本、非线性、高维数的问题时表现出很好的优势(Vapnik et al., 1995),能较好的克服神经网络等方法的固有缺陷,在处理非线性问题时具有一定的优越性(杨晓伟等, 2013; 杨帆等, 2017)。
支持向量机(SVM)可用于解决线性可分问题,而对于线性不可分问题,利用核函数将低维数据映射到高维空间,从而低维空间上线性不可分问题便转化为高维空间上的线性可分问题,求解后将其映射到低维空间。假设数据集为S,原始空间集Rn,从低维到高维映射关系为:φ:x→φ(x),具体运算步骤为:
(1)寻找一个核函数K(s,t)使得
K(xi,xj)=(φ(xi),φ(xj)),
(3)
(2)构造并求解凸二次规划问题:
(4)
(3)计算b
(5)
(4)构造非线性函数
(6)
本文核函数选用径向基核函数(RBF):
K(xi,xj)=exp(-|xi-xj|2/2γ2)
(7)
1.3 人工蜂群算法
人工蜂群算法(Artificial Bee Colony)是一种受蜂群行为启发的代数优化算法,由Karaboga等人在2005年提出(杨淑莹等, 2015)。该算法具有较强的发现最优解、信息正反馈、收敛速度快、鲁棒性强及易于和其他方法结合等优点,能较大程度上避免陷入局部最优的问题。算法步骤如下:
1.3.1 蜜源初始化
初始化种群参数,随机生成SN个可行解(与雇佣蜂数量相同),计算适应度(Fitness)。随机产生可行解公式:
(8)
式中,xi(i=1, 2,…,SN)为D维向量,D是待优化参数的数目。j∈(1, 2,…,D)。
1.3.2 蜜源更新公式
引领蜂与跟随蜂依据下列公式记录截止目前的最优值,且在当前蜜源邻域内搜索最优值:
vi, j=xi, j+φi, j(xi, j-xk, j)
(9)
式中,j∈(1, 2,…,D),k∈(1, 2,…,SN),k随机生成且k≠i,φi, k∈[-1, 1]的随机数。
1.3.3 选择雇佣蜂概率公式
(10)
式中,fit(xi)为第i个Fitness解所对应的富源度。
1.3.4 侦查蜂的产生
若有蜜源连续未被更新的次数大于limit时,则对该蜜源进行重新初始化。算法流程图(图 1):
图 1 程序流程图Fig. 1 Flow chart of the procedure
2 三峡库区白水河滑坡位移监测分析
在我国三峡库区,由于季节性降水的分配不均及水库水位的显著波动等因素,水库沿岸滑坡灾害频发,据统计,截至2014年长江三峡库区崩滑地质灾害点多达5000余处(许强等, 2014),对长江沿岸居民生命财产安全造成严重威胁。因此对持续变形的滑坡进行位移预测被认为是减少或避免滑坡灾害造成损失的重要且经济的方法(殷跃平, 2003; 许强等, 2004; 许强,2012; Zhu et al.,2018; Ma et al.,2018)。
2.1 滑坡工程地质概况
白水河滑坡位于三峡库区宽河谷段,长江主干道南岸(凸岸),距三峡大坝约56km,属秭归县沙镇溪镇乐丰村。秭归县地处亚热带季风气候区,降雨连续集中且雨季多暴雨。地势南高北低,为侏罗系下统香溪群砂岩组成的顺向岸坡,岩层产状15°∠36°,滑坡前缘高程约70m,后缘高程约410m,东西两侧为近南北向山脊,北侧为白水河单面山体。该滑坡南北向约600m,东西向约700m,滑坡总体坡度约30°,滑坡总面积0.42km2,滑坡体积126×105 ̄ ̄m3(图 2)。
图 2 白水河滑坡平面示意图Fig. 2 Plane sketch map of Baishuihe Landslide
白水河滑坡历史上就曾发生过滑动,多年来,随着库水位的不断波动及汛期强降雨,该滑坡变形特征较为强烈。2003年6月随着三峡水库蓄水至135m后,该滑坡出现明显的位移增长趋势,特别是2007年6月后,受强降雨和库水位等联合作用,滑坡变形骤然增加(图 3)。ZG93和ZG118监测点从2003年6月开始监测。2005年5月和10月又陆续加设了XD1、XD2和XD3、XD4监测点。
本文选用ZG93及ZG118监测点数据进行研究并建立模型。因为相比于其他监测点,ZG93和ZG118持续监测时间长,且均位于白水河滑坡体中部区域,可以较好的记录和反映滑坡位移运动的整体趋势。
图 3 2003~2013年白水河滑坡月降雨量及长江水位与累计位移关系图Fig. 3 Displacements, rainfall and reservoir level during the period 2003~2013
3 预测模型的应用
滑坡变形的产生受内部地质因素和外部诱发因素共同影响,本文以三峡库区白水河滑坡为研究对象,选用ZG93和ZG118位移监测点自2003年6月至2013年3月间的监测数据进行分析,将总位移分解为趋势项和周期项位移,分别用多项式最小二乘法、人工蜂群支持向量机模型进行拟合训练及预测分析。
3.1 趋势项位移分析
移动平均可以削弱或消除原时间序列中季节和不规则周期性的变动,从而分离出趋势项。移动平均法中取周期长度M=12个月,根据移动平均法公式(式(2))提取出滑坡位移趋势项,利用多项式最小二乘法对其进行分段拟合。
由于趋势项提取值曲线呈现明显的分段特征,故本文将其分为3个阶段(2004年6月~2007年5月, 2007年6月~2008年7月, 2008年8月~2011年6月)进行研究。ZG93和ZG118滑坡监测点趋势项位移的提取值和预测值(图 4)。
图 4 趋势项位移的提取及预测(ZG93、ZG118)Fig. 4 Extraction and forecasting the displacement of trend term(ZG93、ZG118)
利用Matlab2010年对趋势项位移提取值进行多项式最小二乘法拟合(图 4),拟合方程及精度结果如下:
监测点ZG93:
监测点ZG118:
3.2 周期项位移分析
3.2.1 周期项位移提取
根据时间序列加法模型公式(式1),周期项位移等于总位移量减去趋势项位移。因此,监测点ZG93与ZG118的周期项位移提取值如图 5所示。
图 5 监测点周期项位移提取值Fig. 5 Periodic displacement value of monitoring points
3.2.2 周期项位移预测
降雨和库水位的变化是滑坡位移的两个重要的诱发因素(杜鹃等, 2009; 杨背背等, 2018)。通过选取合适的影响因子,研究分析各诱发因素与滑坡位移之间的响应关系,可以更好地对滑坡位移进行研究和准确评价。本文在比对了前人研究资料的基础上(杜鹃等, 2009; 张俊等, 2015),选取长江库水位、本月累积降雨、前一月累积雨量、前两月累积雨量、前一月库水位变化量、前两月库水位变化量与监测点年累计位移7项因素,结合灰色系统关联度分析法研究各因子同滑坡监测点周期项位移间的关联度,取分辨系数为0.5,从而得到监测点周期性位移与各影响因子间的关联度rk如表 1所示。其中,长江库水位、前两月降雨、前一月降雨、本月累积降雨同监测点ZG93周期项位移监测数据之间的关联度分别为0.8525、0.8203、0.7984、0.7912,并且后3项数值比较接近; 与监测点ZG118表现出的现象近似。反映出监测点“阶跃式”累计位移同长江库区水位有密切的关系; 同时,降雨因素在滑坡位移中稍有滞后性。
表 1 滑坡位移周期项与各因子的相关性Table 1 Correlation between periodic terms of landslide displacement and various factors
3.3 模型预测及对比分析
用可优化选参的人工蜂群算法(ABC)与支持向量回归机(SVR)结合,构建ABC-SVR滑坡位移预测模型,ABC算法可寻求最优的惩罚因子C及核函数参数g,可提高模型的预测精度(许国根, 2012; 杨景明等, 2014; 卓金武, 2014; 高雷阜等, 2016)。以白水河滑坡2004年6月~2011年6月间的滑坡周期项位移数据为训练样本,釆用ABC-SVR模型对2011年7月~2013年6月间的周期性位移进行预测。详细过程如下:
(1)样本数据预处理。以离差标准化(Min-Max Normalization)对原始数据做线性变换,使结果映射到[0,1]之间。
(2)模型参数初始化。规定蜂群规模为NP=20,蜜源数量为NP/2,最大搜索次数limit,最大迭代次数maxcycle,核函数使用RBF核函数,支持向量回归机待优化参数的取值区间。
(3)训练ABC-SVR模型,用ABC算法搜寻SVR惩罚因子C及核函数参数g的最优值,用得到的最优参数值带入支持向量回归机中进行学习训练和预测。并且用ABC-SVR模型与文献中的BP神经网络模型、PSO-SVR模型的预测结果进行对比,对比结果见表 2。
表 2 不同模型预测精度对比Table 2 Comparisons of prediction accuracy of different models
预测结果显示,监测点ZG93的均方根误差MSE及平均绝对百分误差MAPE分别为0.0311, 0.0768,相关系数(Correlation coefficient)为0.96,监测点ZG118的均方根误差MSE及平均绝对百分误差MAPE分别为0.0418, 0.0828,相关系数(Correlation coefficient)为0.95,预测精度较高。
从上表可知,PSO-SVR在时间上优于ABC-SVR,但预测效果低于ABC-SVR。BP神经网络预测模型运行时间较长,预测结果不如其他两个模型。综上所述,ABC-SVR预测模型预测效果最优,说明其具有较好的寻优性能及预测效果。
3.4 累计位移预测
根据时间序列加法模型公式(式(1))可知,监测点趋势项与周期项位移预测值的数量和即为监测点滑坡累计总位移的预测值。将滑坡累计位移预测值与实测值进行对比(图 6)。结果显示,预测结果与实测值变化趋势较为一致,预测结果较好。ZG93和ZG118累计位移预测拟合优度值R2分别为0.97、0.96,平均绝对百分误差MAPE分别为0.083和0.078,说明基于时间序列人工蜂群支持向量机模型具有较好的预测精度,可以用于滑坡位移的预测研究。
图 6 监测点累积位移的预测Fig. 6 Prediction of cumulative displacement of monitoring points
4 结 论
(1)本文提出了一种基于时间序列分析的结合人工蜂群算法优化支持向量机(ABC-SVR)的滑坡位移预测模型。用移动平均法从滑坡累计位移监测数据中提取滑坡趋势项位移,用多项式最小二乘法对趋势项位移进行分段拟合和预测。该模型的提出解决了灰色系统误差较大问题,避免了神经网络存在的模型结构难确定、精度难保证及泛化能力不高的缺点,为非线性滑坡预测模型在寻优过程中易陷入局部最优的情况提供了新的思路。
(2)根据灰色系统关联分析法,分析7项影响因子与滑坡周期性位移数据的关联度。结果显示,长江库水位、前两个月累积降雨和前1个月累积降雨为相关性rk最大的3项,分别达到(ZG93监测点)0.8525、0.8203、0.7987,表明库水位变动在滑坡位移中的重要性,并且降雨因素对滑坡位移影响具有一定的滞后性。
(3)将人工蜂群算法优化支持向量机(ABC-SVR)模型所得结果同BP神经网络及PSO-SVR方法的结果进行对比,ABC-SVR模型展现出较好的位移预测结果。表明基于时间序列的人工蜂群支持向量机位移预测模型可以较好地对滑坡位移进行预测研究,有较好的实用性及应用前景。