基于AdaBoost集成的WPSO-RBF大坝变形监控模型
2018-05-17,,,,
, ,,,
(1.河海大学 a.水利水电学院;b.水文水资源与水利工程科学国家重点实验室,南京 210098; 2.中国电建集团 贵阳勘测设计研究院有限公司,贵阳 550081)
1 研究背景
变形是大坝安全监测的必设项目,具有直观、可靠性好等特点。建立准确的变形安全监控模型对大坝安全稳定运行具有重要的意义[1]。现阶段,应用较为广泛的监控模型分为统计模型和以人工神经网络为代表的人工智能算法[2-3]等。由于影响大坝安全的因素众多而且复杂、监测数据的非线性化、建模参数选择的主观性强,容易导致数据拟合时“过拟合化”,泛化能力差。
为了克服这些不足,传统的神经网络(BP,SVM等)大多在结构设计和参数训练上进行改进,但结构越复杂,需要的参数越多,对修正算法的要求也就越高。径向基(Radial Basis Function,RBF)神经网络是一种前向神经网络,因其网络结构简单、学习收敛速度很快且能够逼近任意非线性函数[4],被广泛应用于时间序列分析、函数逼近、回归问题以及预测等领域[5]。根据已有试验结果,用标准PSO算法优化RBF网络3个参数时,随着惯性权重的减小,标准PSO算法收敛速度会降低,进而影响其全局收敛性。考虑到大坝变形影响因素的复杂性,用单一函数模拟具有局限性。而AdaBoost算法作为一种集成算法,它的核心思想是训练不同的弱分类器(Weaker Classifier),然后再把这些弱分类器按照不同的权重叠加(Boost)起来,构成一个更强的最终分类器(Stage Classifier),使预测分类更加准确[6]。为此,本文首先采用由Shi等[7]提出的线性递减权重(Linear Decreasing Inertia Weight,LDIW)的方法实现对权值的调整,建立基于WPSO-RBF的大坝变形监控模型,并将其作为大坝变形规律的弱分类器。然后采用AdaBoost算法,建立基于WPSO-RBF-AdaBoost的大坝变形监控模型,最后结合实际工程,利用实测数据进行验证。
2 基于WPSO-RBF-AdaBoost的大坝变形监控模型
2.1 基于WPSO-RBF模型的建立
2.1.1 径向基(RBF)神经网络
RBF神经网络是一种3层的前向神经网络,在参数选取适当的前提下,能够以给定的精度逼近任意的连续函数。RBF神经网络拓扑结构[8]简单:由信号源节点组成的输入层;由径向基函数激活的隐含层;对输入模型响应的输出层。其神经网络结构如图1所示。
图1 RBF神经网络拓扑结构Fig.1 Topological structure of Radial Basis Function
RBF径向基神经网络常用的径向基函数是高斯函数,表示为
(1)
i=1,2,3,…,h,j=1,2,…,N。
(2)
式中:ci为隐含层节点的中心;wij为隐含层到输出层的连接权值;yj为与输入样本对应的网络的第j个输出节点的实际输出;h为隐含层节点数;N为输出样本数。
2.1.2 粒子群算法优化RBF神经网络
由式(1)和式(2)可知,RBF神经网络学习算法需要求解的参数[9]有3个:隐含层基函数的中心c、宽度d及隐含层到输出层的权值w。经比较,粒子群算法操作简单,需要运行参数较少,收敛较快,在函数优化、神经网络训练等领域得到广泛应用[10]。
粒子群算法[11](Particle Swarm Optimization,PSO)首先在可解空间中优化一群粒子,每个粒子都代表优化问题的一个潜在最优解,用位置、速度和适应度表示粒子特征。粒子在解空间运动,通过跟踪个体极值Pbest和群体极值Gbest更新个体位置。假设N维空间中,有m个粒子组成的种群X=(X1,X2,…,Xm),则第i个粒子的位置(即问题的一个潜在解)Xi、速度Vi、个体极值Pi分别为:
Xi=(xi1,xi2,…,xiN)T;
(3)
Vi=(Vi1,Vi2,…,ViN)T;
(4)
Pi=(Pi1,Pi2,…,PiN)T。
(5)
种群的全局极值Pg=(Pg1,Pg2,…,PgN)T,在每次迭代中,粒子通过个体极值和全局极值更新自身的速度和位置,更新公式为:
(6)
(7)
式中:ω为惯性权重;D=1,2,…,N;i=1,2,…,m;k为当前迭代次数;ViD为粒子的速度,c1,c2为非负的常数,称为加速度因子;r1,r2为分布于[0,1]之间的随机数。评价各粒子适应度,按归一化均方根误差定义适应度函数,即
(8)
式中:M为输入变量组数,本文选取影响大坝变形的160组数据进行拟合;yj(k)为大坝变形拟合值;y(k)为大坝变形实际值。
2.1.3 动态权重粒子群算法优化RBF神经网络
惯性权重体现的是粒子当前速度多大程度上继承先前的速度,Shi等[12]最先将惯性权重引入到PSO算法中,并分析指出一个较大的惯性权重值有利于全局搜索,而一个较小的惯性权重值则更利于局部搜索。为了更好地平衡算法的全局搜索和局部搜索能力,其提出了线性递减惯性权重(Linear Decreasing Inertia Weight,LDIW),即
ωt=ωmax-(ωmax-ωmin)t/T。
(9)
式中:t为当前迭代次数;T为最大迭代次数;ωmax,ωmin分别为初始最大、最小惯性权重。经过大量的试验,Shi提出当ωmax=0.95,ωmin=0.4时,算法的性能最优[13]。
基于WPSO-RBF的大坝变形监控模型[14]是用改进的粒子群算法优化隐含层基函数的中心c、宽度d及隐含层到输出层的权值w,用式(9)更新惯性权重。步骤流程见图2。
图2 WPSO-RBF模型的步骤流程Fig.2 Flowchart of WPSO-RBF model
2.2 基于WPSO-RBF-AdaBoost模型的建立
AdaBoost算法的思想[15]是合并多个“弱”分类器的输出以产生有效的分类。其基本思路是:对于样本空间中M组训练数据,权重都是1/M,然后用弱学习算法(WPSO-RBF算法)迭代运算T次,每次运算后按照分类结果更新训练数据权重,对于分类失败的训练个体赋予较大的权重,下一次迭代后运算时更加关注这些训练个体。T次迭代之后得到由多个由WPSO-RBF弱分类器组成的强分类器。WPSO-RBF-AdaBoost预测模型流程见图3,具体步骤如下。
图3 WPSO-RBF-AdaBoost模型的算法流程Fig.3 Flowchart of WPSO-RBF-AdaBoost model
步骤1:选取数据和网络初始化。从样本空间中随机选取M组训练数据并归一化,初始化测试数据的权值Dt(i)=1/M,其中M=160,利用图2建立WPSO-RBF弱分类器。
步骤2:弱分类器预测。训练第t个弱分类器时,用M组训练数据训练WPSO-RBF神经网络并且预测训练数据输出,得到预测序列g(t)的预测误差和et,误差和et的计算公式为
(10)
式中:g(t)为预测分类结果;y(t)为实际分类结果。
步骤3:计算预测序列权重。根据预测序列g(t)的预测误差et计算序列的权重at,权重计算公式为
(11)
步骤4:测试数据权重调整。调整公式为
i=1,2,…,M。
(12)
式中Bt为归一化因子,使得分布权值为1。
步骤5:重复步骤2至步骤4,得到T个弱分类器ht(x)。参考文献[14]和试验拟合取T=10。
步骤6:由T组弱分类器组合得到强分类器(强预测器),即
(13)
3 基于WPSO-RBF-AdaBoost的大坝变形监控模型实现流程
步骤1:初始化训练数据和测试数据,确定影响大坝变形的输入层节点数m、隐含层节点数h、输出层节点数k。
步骤2:粒子向量Lm=(cji,dj,wj),i=1,2,…,m,j=1,2,…,h,维度D=mh+h+hk。种群规模M,最大迭代次数T,速度更新系数c1=1.494 45,c2=1.494 45,粒子速度的边界Vmax=1。经过T次迭代得到最优个体适应度和对应粒子的位置,将粒子位置映射到RBF神经网络,建立基于WPSO-RBF大坝变形监控模型。
步骤3:循环步骤2,建立T个WPSO-RBF弱分类器,利用AdaBoost集成算法集成WPSO-RBF-AdaBoost强分类器。
步骤4:用已建的WPSO-RBF-AdaBoost与常用神经网络和传统统计模型对测试数据进行拟合,并分别与实测值进行比较,分析比较各模型的拟合效果和预测精度。
4 工程实例
向家坝水电站位于四川省宜宾县和云南省水富县交界处,大坝为混凝土重力坝。该坝于2012年10月10日下闸蓄水开始监测,2013年9月12日蓄水至正常水位,并维持水位在380 m左右运行,已在左非7、左非1、航1、泄1、泄4、泄6等坝段布置了完整的正倒垂线。
现选取左非溢流7号坝段的垂线监测资料对所建模型的拟合效果和预测精度进行测试。选取2013年1月8日—2015年5月2日共160组变形位移数据用于拟合,2015年5月11日—2015年12月21日共24组数据用于预测。大坝变形考虑水压、温度、时效的影响,影响因子取9个[16]。其中水压因子取(H-H0),(H-H0)2,(H-H0)3三项(H,H0分别为监测日、始测日对应的上游水头);时效采用线性项和对数项模拟,即取θ-θ0,lnθ-lnθ0两项(θ为监测日到始测日的累计天数t除以100,θ0为建模系列第1个测值日到始测日的累计天数t0除以100);由于没有实测的温度资料数据,温度影响采用周期项模拟,即温度因子取
四项(i为监测日到建模资料系列第1个监测日的累计天数)。
输入层节点数m=9,隐含层节点数采用K-means[17]算法,通过实验仿真不断尝试调整K值大小,最后确认h=10,输出层节点数即大坝变形k=1,RBF结构为9-10-1结构。
对9种变形监测数据进行预处理(降噪处理等),降低观测误差对样本的影响。改进的PSO算法中每个粒子的位置向量Lm=(cji,dj,wj),i=1,2,…,9,j=1,2,…,10。维度为D=9×10+10+10×1=110。粒子群算法种群规模为M=20;最大迭代次数T=100;速度更新系数为c1=1.494 45,c2=1.494 45;粒子速度的边界Vmax=1。当适应度函数值达到最小时,WPSO算法优化得到一组RBF网络最优参数,如表1所示。
表1 WPSO算法优化得到的RBF神经网络最优参数值Table 1 Optimal parameter values of RBF neural network optimized by WPSO
表2 WPSO-RBF弱分类器参数Table 2 Parameters of WPSO-RBF weaker classifier
得到最后的强预测器为
H(x)=0.1421h(1)+0.1200h(2)+
0.0917h(3)+0.0748h(4)+0.1421h(5)+
0.0680h(6)+0.1359h(7)+0.0810h(8)+
0.0743h(9)+0.0701h(10) 。
(14)
为直观地进行分析,将强预测器WPSO-RBF-AdaBoost模型与常用的神经网络模型(本文选取BP神经网络)和统计模型(采用多元回归分析法)进行比较,如图4所示。从图4可知,WPSO-RBF-AdaBoost的训练效果最好。
图4 不同模型训练拟合值与实测值对比Fig.4 Comparison between fitted values of model training and measured values
图5 不同模型预测值与实测值对比Fig.5 Comparison between values predicted by different models and measured values
图5是3种模型的预测值与实测值的对比图,从图5中可知:WPSO-RBF-AdaBoost模型预测值与实测值近乎一致,残差最小;BP模型预测值与实测值虽有所偏差,但总体趋势一致,残差居中;统计模型预测值与实测值偏离较大,残差最大。
表4 强预测器与弱分类器的误差比较Table 4 Comparison of error between stage classifier and weaker classifiers %
利用复相关系数R、均方差FMSE比较WPSO-RBF-AdaBoost模型、BP模型和统计模型的拟合精度(见表3),可以看出,WPSO-RBF-AdaBoost模型的复相关系数最大,均方差最小,曲线拟合精度最好。表4是选取拟合数据中的8个大坝变形位移对弱预测器和强预测器进行比较,可得出经过AdaBoost集成算法,可有效地提高模型的预测精度和拟合效果。
表3WPSO-RBF-AdaBoost模型、WPSO-RBF模型和RBF模型的拟合精度对比
Table3ComparisonoffittingaccuracyamongWPSO-RBF-AdaBoostmodel,WPSO-RBFmodel,andRBFmodel
5 结 论
通过对工程实例的建模分析,验证WPSO-RBF-AdaBoost模型较BP模型和统计模型具有更好的预测精度和泛化能力,但同时也存在一些问题。
(1)WPSO-RBF神经网络预测模型克服了RBF神经网络由于参数选取不当而影响其收敛性的弊端,WPSO-RBF模型相比原RBF预测精度高。
(2)利用AdaBoost集成算法优化改进WPSO-RBF模型,将优化后的WPSO-RBF模型按照预测精度赋予不同的权值,并用加权的方式进行集成,建立WPSO-RBF-AdaBoost模型,该模型的精度优于传统BP神经网络和统计模型,值得在工程实践中推广。
(3)改进的PSO算法仍然需要初始化参数,在迭代次数足够多的情况下,参数的初始化对PSO算法影响不大,然而计算量增大。在保证改进PSO算法性能的基础上,如何选取好的初始值并减少算法的工作量是下一步的研究重点。
(4)用弱分类器集成强分类器时,影响因子选取单一,构建的弱分类器模型单一,后续研究中可构建特征差异明显的弱分类器,以得到更好的预测模型。
参考文献:
[1] 吴中如.水工建筑物安全监控理论及其应用[M].北京:高等教育出版社,2003.
[2] SU Huai-zhi, HU Jiang, WU Zhong-ru. A Study of Safety and Early-warning Method for Dam Global Behavior [J].Structural Health Monitoring, 2012, 11(3): 269-279.
[3] 王 凌.智能优化算法及其应用[M].北京:清华大学出版社,2001.
[4] PARK J, SANDBERG I W. Universal Approximation Using Radial-Basis-Function Networks[J]. Neural Computation,1991,3(2):246-257.
[5] 张 辉,柴 毅.一种改进的RBF神经网络参数优化方法[J].计算机工程与应用,2012,48(20):146-149,157.
[6] 胡德华,郑东健,付浩雁.AdaBoost-BP模型在大坝变形预测中的应用[J].三峡大学学报(自然科学版),2015,37(5):5-8.
[7] SHI Y H, EBERHART R C. Empirical Study of Particle Swarm Optimization[C]∥Proceedings of the 1999 Congress on Evolutionary Computation-CEC 99. Washington, DC, USA, July 6-9,1999:1945-1950.
[8] 黄剑竹.改进RBF-AdaBoost模型及其在年径流预测中的应用[J].人民珠江,2015,(1):32-36.
[9] 胡 昊,魏继红.基于PSO-RBF的边坡安全系数预测[J].河南科学,2016,34(5):747-751.
[10] CHEN S, HONG X, LUK B L,etal. Non-linear System Identification Using Particle Swarm Optimization Tuned Radial Basis Function Models[J]. International Journal of Bio-inspired Computation, 2009,1(4): 246-258.
[11] 周 驰,高海兵,高 亮,等.粒子群优化算法[J].计算机应用研究,2003,20(12):7-11.
[12] SHI Y H, EBERHART R C. A Modified Particle Swarm Optimizer[C]∥Proceedings of IEEE International Conference on Evolutionary Computation. Anchorage Alaska, USA, May 4-9, 1998: 69-73.
[13] 刘建华.粒子群算法的基本理论及其改进研究[D].长沙:中南大学,2009:22-46.
[14] 卢金娜.基于优化算法的径向基神经网络模型的改进及应用[D].太原:中北大学,2015.
[15] 王小川,史 峰,郁 磊.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2016:42.
[16] 蒋 明,郑东健,张 凯,等.FA-SVM模型在大坝变形预测中的应用[J].水力发电,2015,41(4): 79-81,99.
[17] 乔俊飞,韩红桂.前馈神经网络分析与设计[M].北京:科学出版社,2013.