APP下载

飞蛾火焰优化算法-投影寻踪回归模型在需水预测中的应用

2017-05-17崔东文

关键词:需水飞蛾投影

崔东文

(云南省文山州水务局,云南 文山 663000)



飞蛾火焰优化算法-投影寻踪回归模型在需水预测中的应用

崔东文

(云南省文山州水务局,云南 文山 663000)

基于用水时间序列构建投影寻踪回归(PPR)需水预测模型。针对PPR模型矩阵参数难以确定的不足,利用一种新型群体智能仿生算法——飞蛾火焰优化(MFO)算法优化PPR模型矩阵参数,提出MFO-PPR预测模型,并构建MFO-BP模型作对比,以1980—2013年上海市需水预测为例,分别利用实例前20组和后10组数据对模型参数进行率定及预测。结果表明:MFO-PPR模型对实例后10 a需水预测的平均相对误差绝对值和最大相对误差绝对值分别为1.84%、4.20%,预测精度优于MFO-BP模型的2.06%、4.61%。MFO算法具有较好的全局寻优能力,将MFO算法应用于PPR模型参数寻优,可有效地提高PPR模型的预测精度。

需水预测;飞蛾火焰优化算法;投影寻踪回归;参数优化

需水预测在区域水资源开发利用、“三条红线”目标管理以及社会经济发展规划中均具有举足轻重的作用。目前,除水力定额法、人均综合用水量法等传统方法用于需水预测外,人工神经网络法[1-3]、支持向量机法[4-5]、灰色预测法[6-7]、SD法[8]以及Logistic模型法[9]等非常规方法也被广泛应用于需水预测,并取得了较好的预测效果。投影寻踪(Projection Pursuit,PP)是由美国科学家Kruskal首先提出的,其原理是将高维数据投影到低维空间,并在低维空间进行数据分析研究的统计方法,现已广泛应用于各行业及领域[10-11]。投影寻踪回归(Projection Pursuit Regression,PPR)是Friedman 于1981年基于投影寻踪理论提出的一种用来分析和处理高维非正态多元数据的统计方法,其核心是用若干个岭函数加权和的形式来逼近回归函数,以解决高维空间中的回归问题[12]。在实际应用中,PPR模型矩阵参数的确定对于提高PPR模型的预测精度及其泛化能力具有重要影响。目前,用于PPR模型的相关参数优化的智能算法主要有遗传算法[13]、蚁群优化算法[14]、免疫进化蛙跳算法[15]等,其在改善PPR模型性能及提高模型预测精度上均获得了较好的应用效果。飞蛾火焰优化(Moth-Flame Optimization,MFO)算法是Mirjalili[16]于2015年提出的一种基于自然界飞蛾横向定位导航机制发展起来的新型群体智能仿生算法,与传统智能仿生算法相比,MFO算法在收敛速度和收敛精度等方面均表现优秀,目前已在地下水参数反演[17]、马斯京根模型参数优化[18]中得到应用。

本文拟利用MFO算法来优化PPR模型矩阵参数,并提出MFO-PPR需水预测模型,同时构建MFO-BP模型作对比,以1980—2013年上海市需水预测为例进行验证,旨在为需水预测及PPR模型参数优化,拓展新的思路和方法。

1 预测模型

1.1 MFO算法数学描述

[16-18],描述MFO算法的数学模型如下:

1)初始化。用式(1)矩阵表示飞蛾种群规模为n、优化问题维度为d的飞蛾所处空间位置;并利用式(2)矩阵存储飞蛾个体的适应度值。

(1)

(2)

2)火焰空间位置。MFO算法中另一关键部分是火焰。其矩阵类似于飞蛾矩阵,用式(3)表示,并利用式(4)矩阵存储火焰的适应度值。

(3)

(4)

3)MFO算法定义。飞蛾和火焰均为候选解,其区别在于两者在进化过程中位置的更新方式。飞蛾通过在搜索空间附近移动,从而驱动火焰不断逼近最佳位置(候选解)。MFO算法可定义为:

MFO=(I,P,T)。

(5)

式中:I为随机生成的飞蛾种群规模和对应的适应度值;P为飞蛾在搜索空间移动的函数,其为飞蛾的M矩阵和位置更新的返回值;T为终止条件的判别函数。

4)飞蛾-火焰算法位置更新。定义用于模拟飞蛾螺旋飞行路径的MFO算法可表示为:

S(Mi,Fj)=Di·ebt·cos(2πt)+Fj。

(6)

5)火焰更新。为保证MFO算法具有较快的收敛速度,提出自适应火焰数量更新机制,数学描述如下:

(7)

式中:FN为自适应火焰减少的数目;l为当前迭代次数;N为最大火焰数量;T为最大迭代次数。

1.2 投影寻踪回归模型

PPR模型预测的核心是用若干个岭函数加权和的形式来逼近回归函数,以解决高维空间中的回归问题。将其模型用于需水预测的数学表达式,可表示为:

(8)

式中:Yk为第k年需水量预测值;m为岭函数个数;αi为第i个岭函数的权重;Fi(·)为第i个岭函数;xj为第j个需水量预测的影响因子(j=1,2,…,n);n为年需水量影响因子个数;βij为第i个岭函数在第j维向量的权重。

式(8)可简化为如下矩阵形式:

(9)

由式(9)可知,在需水预测中,利用MFO优化的PPR参数包括m个αi和m×n个βij。本文岭函数的个数m取2,年需水量的影响因子个数n取4。因此,利用MFO优化的PPR模型参数的维度为2+2×4=10。

1.3 MFO-PPR模型实现步骤

MFO-PPR模型预测实现的步骤归纳如下:

步骤1 确定PPR模型参数搜索范围;选取训练样本和预测样本进行归一化处理,并利用训练样本对模型参数进行率定。

步骤2 确定MFO算法的适应度函数。本文选用式(10)作为适应度函数。

(10)

步骤3 初始化算法参数。设置飞蛾种群规模n、最大迭代次数T、搜索空间维数d以及最大火焰数量N,令当前迭代次数l=0。

步骤4 计算飞蛾个体适应度值,找到并保存当前最好的飞蛾个体位置。判断终止条件是否满足,若满足则转至步骤8,否则执行步骤5。

步骤5 迭代过程。利用式(7)更新火焰数量;计算火焰与飞蛾间的距离,并利用式(6)更新飞蛾-火焰位置。

步骤6 计算飞蛾个体适应度值,利用式(2)、(4)分别保存飞蛾及火焰空间位置。

步骤7 找到当前最好的飞蛾个体空间位置。如果当前位置优于前次保留位置,则保留当前火焰位置为最佳位置。判断终止条件是否满足,若满足则转至步骤8,否则令l=l+1,并执行步骤5—7。

步骤8 输出火焰最终所处的空间位置及所对应的适应度值,算法结束。

步骤9 将最终火焰所的处空间位置(参数α、β)代入式(9)得到Yk表达式,并利用该表达式对预测样本进行预测。

2 实例应用

2.1 数据来源与分析

数据来源见文献[19]。利用自相关系数的方法确定1980—2013年上海市用水时间序列滞后数为4时(自相关系数为0.688),PPR模型具有较好的预测效果,输入、输出数据矩阵见表1。

表1 1980—2013年上海市需水预测数据矩阵 亿m3

注:资料来源于《2014年上海市统计年鉴》。

利用1980—2003年上海市的用水量数据对模型相关参数进行率定,并对2004—2013年的数据进行检验,最后利用式(11)对各序列数据进行归一化处理:

(11)

2.2 模型构建及参数设置

2.2.1 模型构建

在Matlab R2011b软件环境下,基于表1构建4输入和1输出的MFO-PPR、MFO-BP预测模型,选取平均相对误差绝对值MRE、最大相对误差绝对值MaxRE对各模型的预测效果进行评价。

2.2.2 参数设置

1)MFO-PPR模型。飞蛾种群规模n及最大火焰数量N均设为50,最大迭代次数T取300,参数α、β搜索空间均设为[-1,1]。

2)MFO-BP模型。网络结构采用4-7-1,隐含层和输出层传递函数分别采用logsig和purelin,训练函数采用traingdx,期望误差取0.001,最大训练轮回设为1 000次,权阈值搜索空间设为[-1,1],MFO部分的算法设置同MFO-PPR模型。

2.3 预测结果及分析

利用MFO-PPR、MFO-BP模型对2004—2013年上海市的需水量进行预测,结果见表2。并绘制MFO-PPR、MFO-BP模型的进化过程图及拟合预测效果图,如图1—3所示。其中,利用MFO算法优化的矩阵参数可表示为:

α=[ 0.948 477 -0.967 230],

将优化后的矩阵α、β代入式(9),可得到式(12),将式(12)反归一化即可得第k年的需水量预测结果。

(12)

图1 MFO-PPR模型进化过程图

图2 MFO-BP模型进化过程图

图3 两种模型的拟合效果图

1)从表2及图3可以看出,MFO-PPR模型对于上海市1980—2013年共34 a的用水序列具有很好的拟合和预测效果;其中,2004—2013年上海市需水预测的MRE、MaxRE分别为1.84%、4.20%,预测精度优于MFO-BP模型的2.06%和4.61%,表明MFO-PPR模型具有较好的预测精度和泛化能力,可以满足需水预测的精度要求。

2)从图1—2可以看出,MFO-PPR模型约进化到第60代左右即可获得全局相对最优解,具有较快的收敛速度和全局寻优能力。其最佳适应度值为0.727 55,优于MFO-BP模型的0.795 48,再次验证了MFO-PPR模型用于时间序列需水预测的可行性和有效性。

3 结语

利用一种新型群体智能仿生算法——MFO算法优化PPR模型的矩阵参数,提出MFO算法与PPR相融合的MFO-PPR需水预测模型,以1980—2013年上海市需水预测为例进行实例验证,结果表明:

1)MFO算法具有调节参数少、收敛精度高等特点。利用MFO算法寻优PPR模型矩阵参数,实现了PPR模型矩阵参数的自动确定,有效地提高了PPR模型的预测精度,可为相关优化及预测研究提供技术参考。

2)从实例验证及结果比较来看,本文基于用水时间序列提出的MFO-PPR模型具有较好的预测精度和泛化能力,将其用于需水预测是合理可行的,且是有效的。

3)本文提出的MFO-PPR模型计算简便,适用性强,能有效地克服“维数祸根”等问题,可有效地解决其他相关回归预测问题,具有良好的应用前景。

参 考 文 献

[1]温家鸣,郭纯青,李新建,等.基于BP神经网络的桂林生态城市建设需水量预测[J].水资源保护,2012,28(3):47-50.

[2]崔东文.基于相空间重构原理的遗传神经网络模型在城市需水预测中的应用[J].水利水电科技进展,2014,34(1):85-89.

[3]崔东文.GA-Elman多元变量需水预测模型及其应用[J].水电能源科学,2013,31(8):38-41.

[4]崔东文.加权平均集成神经网络模型在城市需水预测中的应用[J].水资源保护,2014,30(2):27-32.

[5]赵晶,越一新,黄强.基于神经网络方法和支持向量机的西安市水资源需水预测[J].西北农林科技大学学报(自然科学版),2013,41(7):217-223.

[6]王有娟,冯卫兵,李奥典.基于灰色组合模型的浙江省需水量预测[J].水电能源科学,2015,33(3):22-26.

[7]崔东文,郭荣.BP神经网络模型与灰色GM(1,1)模型在需水预测中的应用[J].水资源研究,2012,33(3):19-22.

[8]张雪花,张宏伟,张宝安.SD法在城市需水量预测和水资源规划中的应用研究[J].中国给水排水,2008,24(9):42-46.

[9]续缤,郭立山.城市水资源需求量预测Logistic-ARIMA耦合模型[J].水利经济,2008,26(5):14-16.

[10]付强,赵小勇.投影寻踪模型原理及其应用[M].北京:科学出版社,2006.

[11]王柏,张忠学,李芳花,等.基于改进双链量子遗传算法的投影寻踪调亏灌溉综合评价[J].农业工程学报,2012,28(2):84-89.

[12]马森林,林娟,江希钿,等.投影寻踪回归方法在林分出材率预测中的应用[J].福建林学院学报,2012,32(1):60-63.

[13]徐刚,余冲.基于遗传算法的参数投影寻踪回归径流预报模型及应用[J].水电能源科学,2013,31(9):20-23.

[14]候景伟,孔云峰,孙九林.蚁群算法在需水预测模型参数优化中的应用[J].计算机应用,2012,32(10):2952-2955,2959.

[15]李祚泳,刘韵,汪嘉杨.基于指标规范值的水安全评价的投影寻踪回归模型[J].水利水电技术,2014,45(7):10-12,17.

[16]MIRJALILI S.Moth-flame optimization algorithm:a novel nature-inspired heuristic paradigm[J].Knowledge-Based Systems,2015,89(7):228-249.

[17]崔东文.飞蛾火焰优化算法在承压含水层参数反演中的应用[J].长江科学院院报,2016,33(7):28-33.

[18]崔东文,金波.飞蛾火焰优化算法在马斯京根模型参数优化中的应用[J].人民珠江,2016,37(8):30-34.

[19]崔东文,金波.基于和声搜索算法的BP神经网络需水预测模型应用研究[J].人民珠江,2015,36(4):123-126.

(责任编辑:张陵)

Application of Projection Pursuit Regression Model Optimized by Moth-Flame Optimization Algorithm in Prediction of Water Demand Prediction

CUI Dongwen

(Yunnan Province Wenshan Water Bureau, Wenshan 663000, China)

Based on water use time series, a projection pursuit regression (PPR) water demand forecasting model was constructed.Aiming at the problem that the PPR model matrix parameters are difficult to be determined, a new group intelligent bionic algorithm - Moth-Flame Optimization (MFO) algorithm is used to optimize the PPR model matrix parameters. The MFO-PPR model is proposed. Compared with the MFO-BP model, taking the water demand prediction of Shanghai from 1980 to 2013 as an example. The parameters of the first 20 groups and the last 10 groups were used to estimate and predict the model parameters respectively. The results show that: the absolute value of the average absolute error and the maximum relative error of water demand forecast of MFO-PPR model in the last 10 years of example are 1.84% and 4.20%, respectively, indicating that the prediction accuracy is better than that of MFO-BP model. MFO algorithm has better global optimization ability. The MFO algorithm is applied to the optimization of PPR model parameters, which can improve the prediction precision of PPR model.

water demand prediction; Moth-Flame Optimization algorithm; projection pursuit regression; parameter optimization

2016-10-10

崔东文(1978—),男,云南玉溪人,教授级高级工程师,从事水资源与水环境方面的研究。E-mail:cdwgr@163.com。

10.3969/j.issn.1002-5634.2017.02.006

TV211.1

A

1002-5634(2017)02-0025-05

猜你喜欢

需水飞蛾投影
研究揭示大尺度干旱半干旱区生态景观格局与区域作物需水之间的潜在关联性
可爱的你
Trolls World Tour魔发精灵2
解变分不等式的一种二次投影算法
基于最大相关熵的簇稀疏仿射投影算法
飞蛾说
马铃薯各生育时期需水关键技术
找投影
找投影
勇敢的小飞蛾