APP下载

改进鲸鱼算法优化混合核支持向量机在径流预测中的应用

2020-07-24周有荣

中国农村水利水电 2020年7期
关键词:径流鲸鱼权重

周有荣,王 凯

(1.临沧润汀水资源科技服务有限公司,云南 临沧 677000;2.云南省水文水资源局临沧分局云南,云南 临沧 677000)

1 研究背景

径流预测预报受气候、下垫面条件等诸多因素的影响,传统数理统计等方法难以获得理想的预测精度。支持向量机(support vector machines,SVM)由于良好容错性、智能化和自学习等优点,已在水文预测预报[1-3]及枯水期月径流预测[4,5]中得到应用。但在实际应用中,SVM存在核函数等关键参数选取困难以及单一核函数制约SVM性能两方面的不足。目前,除遗传算法[3](GA)、粒子群优化(PSO)算法[4]等常规智能算法用于SVM核函数等关键参数的选取外,灰狼优化(GWO)算法[2]、入侵杂草优化(IWO)算法[6]、布谷鸟搜索(CS)算法[7]等新型群体智能算法尝试用于SVM关键参数的选取,并取得了较好的应用效果。研究表明,除SVM关键参数选取外,选取合适的核函数是改善SVM预测效果的重要手段[8],高斯核(gaussian kernel)函数属典型的局部学习能力强而泛化能力弱的局部核函数[9];多项式核(polynomial kernel)函数的优缺点与高斯核函数相反,其属典型的局部学习能力弱而泛化能力强的全局性核函数[10]。为提升SVM性能,国内学者基于多项式全局核函数、高斯径向基局部核函数构建混合核SVM(hybrid kernel support vector machine,MSVM),并将之用于金融时间序列分析[9]、磨矿粒度预测[12]、卷烟销售量预测[13]等领域,取得较好的预测效果。目前,SVM用于水文预测预报的应用研究中,90%以上均选用高斯核SVM,其预测精度尚有进一步提升的空间[13]。

为进一步提高水文预测预报精度,本文构建基于多项式核与高斯核相融合的混合核支持向量机(MSVM);针对基本鲸鱼优化算法(whale optimization algorithm,WOA)存在的易陷入局部极值、收敛速度慢等不足,提出基于拉普拉斯交叉算子改进的拉普拉斯鲸鱼优化算法(laplace whale optimization algorithm,LXWOA),利用LXWOA优化MSVM关键参数和混合权重系数,提出LXWOA-MSVM径流预测模型,并构建高斯核LXWOA-GSVM、多项式核LXWOA-PSVM及LXWOA-BP作对比预测模型,以云南省清水江水文站枯水期1~4月月径流预测为例进行实例研究,旨在验证LXWOA-MSVM模型用于枯水期月径流预测的可行性和有效性。

2 拉普拉斯鲸鱼优化算法

2.1 鲸鱼优化算法

鲸鱼优化算法(Whale Optimization Algorithm,WOA)是澳大利亚学者Mirjalili通过模拟鲸鱼捕食行为而提出的一种新型智能算法。WOA 算法的位置更新行为主要分为:游走觅食、包围收缩以及螺旋捕食这三种行为。参考文献[14,15],基本WOA算法3种捕食行为简述如下:

(1)游走觅食。WOA采用种群中的随机个体位置来导航寻找食物,其利用式(1)更新鲸鱼空间位置:

(1)

式中:X(j+1) 为第(j+1)次迭代鲸鱼空间位置;X*(j)为当前最佳鲸群空间位置;D=|CX*(j)-X(j)|表示个体X在位置更新前距离种群随机个体X*的长度;A和C是系数变量,其中A=2ar-a,C=2r,a=2-j/M,M最大迭代次数;r为[0,1]上的随机数。

(2)包围收缩。人工鲸鱼在寻找到食物后,其利用式(2)更新鲸鱼空间位置:

X(j+1)=Xrand-A|CXrand(j)-X|

式中:Xrand表示当前种群中随机一个鲸鱼个体所在的空间位置。

(3)螺旋捕食。鲸鱼以螺旋式的移动方式向当前最优个体靠近,将螺旋式数学模型引入,利用式(3)更新鲸鱼空间位置:

(3)

式中:D′ 表示第i头鲸当前位置和当前最优个体之间的距离;b表示对数螺旋形状常数;l为[-1,1]之间的随机数;p表示[0,1]上的随机数。

2.2 拉普拉斯鲸鱼优化算法

WOA 具有较好的寻优性能,但在解决复杂优化问题时存在易陷入局部极值和收敛速度慢等不足。本文基于拉普拉斯交叉算子(LX)改进WOA。LX采用拉普拉斯分布的密度函数系数代替算术交叉算子系数,假设在第j代的2个鲸鱼个体X1和X2之间进行交叉,则交叉后所产j+1代的2个新鲸鱼个体表示为[16]:

(4)

拉普拉斯随机分布数β由以下规则创建:

(5)

式中:s、q为拉普拉斯分布参数,s∈R是定位参数,q>0是尺度参数;u表示在[0,1]上均匀分布的随机数。

3 LXWOA-MSVM预测模型

3.1 混合核支持向量机

SVM回归用核函数将数据映射到高维特征空间,再在高维特征空间中进行线性回归,依据结构风险化最小化原则,将其学习过程转换为凸优化问题[1-7],即:

(6)

最终回归函数为:

(7)

为进一步改善SVM预测效果,本文融合多项式核函数和高斯核函数优点,基于libsvm工具箱构造一种满足Mercer条件的混合核函数,表达式为:

Kmin=ρKpoly+(1-ρ)KRBF

(8)

式中:Kpoly=[g(xxi)+1]3表示三次多项式核函数;KRBF=exp(-g‖x-xi‖2),g>0,表示RBF核函数;ρ表示权重系数。

式(8)中,ρ值决定单一核函数在混合核函数中所占的比重,当ρ>0.5时,多项式核函数占主导地位;ρ<0.5时,高斯核函数占主导地位[13]。

3.2 LXWOA-MSVM预测实现步骤

LXWOA优化MSVM关键参数有惩罚因子C、核函数参数g、不敏感系数ε和权重系数ρ,其预测实现步骤可归纳如下:

Step1 确定训练、检验样本数量;设定惩罚因子C、核函数参数g、不敏感系数ε和权重系数ρ的搜寻范围;利用式(9)对实例数据序列进行归一化处理。

(9)

Step2 选用平均相对误差绝对值之和作为LXWOA-MSVM适应度函数:

(10)

Step3 设置LXWOA最大迭代次数M,群体数目N,对数螺旋形状常数b=2,拉普拉斯分布参数s、q。令当前迭代次数t=1,初始化鲸鱼种群个体空间位置。

Step4 计算每个鲸群个体适应度值,计算种群的适应度,找到并记录种群中的最优个体位置X*。

Step5 迭代阶段。若j≤M时,更新a、A、C、l和p;当p<0.5时,若|A| <1,利用式(1)更新鲸群空间位置;若|A| ≥1,则从当前群体中随机确定鲸群位置Xrand,并利用式(2)更新鲸群空间位置;若p≥0.5时,利用式(3)更新当前鲸群个体的空间位置。

Step6 交叉运算。利用式(4)随机选择2个鲸鱼个体X1和X2以之间进行交叉,产生新的鲸鱼个体。

Step7 计算更新后的鲸群个体适应度值,若新鲸群个体适应度优于前代鲸群个体适应度,则新鲸群个体位置替代原鲸群个体位置;否则保留原鲸群个体位置。

Step8 令t=t+1。判断算法是否达到终止条件,若是,输出最优个体位置X*及其适应度值算法结束;否则重复Step5~Step8。

Step9 利用LXWOA优化获得的最优个体位置X*,即惩罚因子C、核函数参数g、不敏感系数ε和权重系数ρ代入LXWOA-MSVM模型进行预测。

4 实例验证

(1)数据来源及分析。本文以云南省清水江水文站1971-2005年枯水期1-4月月径流预测为例进行验证分析。利用SPSS软件分析清水江水文站1971-2004年上年度月径流与次年度枯水期1-4月月径流相关关系,结果见表1。

从表1来看,该站上年度8-12月月径流与次年度1-4月月径流存在较好的相关性(除次年4月与上年度3月相关性较差外)。本文分别选取表1中带“**”的月均径流量作为影响因子预测次年枯水期1~4月月均径流量,并选取前24组实测月径流作为训练样本,后10组月径流作为预测样本。样本归一化处理见式(9)。

表1 上年度1-12月月均流量与次年1-4月月相关系数

(2)参数设置。LXWOA最大迭代次数M=200,群体数目N=50;待优化参数搜索空间设置为: MSVM模型参数搜索范围:惩罚因子C∈[2-10,210]、核函数参数g∈[2-10,210]、不敏感系数ε∈[2-10,210]、交叉验证参数V=5,变量维度D为4维,权重系数ρ搜索空间为[0,1]。BP模型网络隐含层和输出层传递函数均分别采用logsig和purelin,训练函数均采用trainlm,设定期望误差为0.001, 最大训练轮回为100次,搜索空间∈[-1,1]。

(3)模型构建及预测。基于上述分析,分别构建LXWOA-MSVM、LXWOA-GSVM、LXWOA-PSVM和LXWOA-BP月径流预测模型,选取平均相对误差绝对值MRE、最大相对误差绝对值MaxRE作为评估指标评估各模型预测效果,见表2。并绘制图1~图4各月份拟合-预测相对误差效果图。

表2 实例枯水期1-4月月径流训练、预测结果及其比较表 %

图1 1月月径流拟合-预测相对误差效果图

图2 2月月径流拟合-预测相对误差效果图

图3 3月月径流拟合-预测相对误差效果图

图4 4月月径流拟合-预测相对误差效果图

(4)优化结果。经优化,确定LXWOA-MSVM预测模型枯水期1-4月关键参数和权重系数分别如下:1月,惩罚因子C=21.482 0、核函数参数g=2-2.763 4、不敏感系数ε=2-4.295 6和多项式核函数权重系数ρ=0.341 9;2月,惩罚因子C=22.250 2、核函数参数g=2-2.530 5、不敏感系数ε=2-4.558 5和多项式核函数权重系数ρ=0.526 7;3月,惩罚因子C=27.291 4、核函数参数g=2-3.253 5、不敏感系数ε=2-2.165 8和多项式核函数权重系数ρ=0.832 0;4月,惩罚因子C=29.048 7、核函数参数g=2-0.461 9、不敏感系数ε=2-2.343 6和多项式核函数权重系数ρ=0.564 6。

从表2及图1~图4可以得出以下结论:

(1)LXWOA-MSVM模型对实例1-4月月径流预测的平均相对误差绝对值分别为4.09%、3.32%、3.51%和5.64%,预测精度分别比LXWOA-GSVM模型提高了13.7%、27.0%、54.7%和36.3%;比LXWOA-PSVM模型提高了31.3%、40.3%、15.0%和16.8%;比LXWOA-BP模型提高了43.1%、60.8%、54.7%和54.8%。表明:①LXWOA能有效优化MSVM模型的惩罚因子、核函数参数、不敏感损失系数和权重系数,优化结果合理、可靠,优化结果使LXWOA-MSVM模型获得较好的预测精度和泛化能力;②LXWOA-MSVM模型能有效融合多项式核函数和高斯核函数二者优点,弥补各自在实际应用中的不足,有效改善SVM的预测精度和泛化能力。③LXWOA-MSVM模型用于枯水期月径流预测的可行性和有效性,模型及方法可为水文预测预报及相关预测研究提供新的途径和方法。

(2)LXWOA-MSVM模型具有较好的拟合-预测精度,其获得的MRE和MaxRE均优于LXWOA-GSVM、LXWOA-PSVM和LXWOA-BP 3种模型,尤其是对于2月、3月的预测精度为最高,其MRE分别达到了3.32%和3.51%。

(3)从LXWOA优化MSVM获得的多项式核函数权重系数ρ来看,1月的权重系数ρ=0.341 9,表明高斯核函数占主导地位;3月的权重系数ρ=0.832 0,表明多项式核函数占主导地位;2月和4月的多项式核函数权重系数ρ略大于0.5,表明多项式核函数、高斯核函数均占主导地位,但多项式核函数权重略大于高斯核函数。

(4)LXWOA-MSVM模型具有通用性,即LXWOA-MSVM模型适用于影响因子与预测因子之间满足一定的相关性,且为多输入、单输出的预测实例。

(5)LXWOA-MSVM模型预测精度优于LXWOA-GSVM模型和LXWOA-PSVM模型,远优于LXWOA-BP模型。LXWOA-GSVM、LXWOA-PSVM模型的预测精度在伯仲之间。

5 结 语

分析了SVM用于水文预测预报中存在的不足,基于多项式核函数与高斯核函数构造MSVM。针对基本WOA存在的收敛速度慢和易陷入局部最优等不足,提出拉普拉斯鲸鱼优化算法(LXWOA)。利用LXWOA同时优化MSVM关键参数和混合权重系数,提出LXWOA-MSVM径流预测模型,并构建LXWOA-GSVM、LXWOA-PSVM和LXWOA-BP 作对比模型,以云南省清水江水文站枯水期1-4月月径流预测为例进行实例研究。结果表明:LXWOA能有效优化MSVM模型的惩罚因子等关键参数,获得较好的预测效果;LXWOA-MSVM模型能有效融合多项式核函数和高斯核函数二者优点,弥补各自在实际应用中的不足,有效改善SVM的预测精度和泛化能力; LXWOA-MSVM模型用于枯水期月径流预测的可行性和有效性,模型及方法可为水文预测预报及相关预测研究提供新的途径和方法。

猜你喜欢

径流鲸鱼权重
格陵兰岛积雪区地表径流增加研究
流域径流指标的构造与应用
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
基于SWAT模型的布尔哈通河流域径流模拟研究
权重常思“浮名轻”
迷途鲸鱼
雅鲁藏布江河川径流变化的季节性规律探索
鲸鱼
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹