APP下载

基于改进型极限学习机的新疆库尔勒市城市需水量预测

2017-07-31司马义阿不都热合曼

水资源开发与管理 2017年7期
关键词:学习机需水量权值

司马义·阿不都热合曼

(新疆塔里木河流域巴音郭楞管理局, 新疆 库尔勒 841000)

基于改进型极限学习机的新疆库尔勒市城市需水量预测

司马义·阿不都热合曼

(新疆塔里木河流域巴音郭楞管理局, 新疆 库尔勒 841000)

城市需水量系统具有大惯性、强耦合、非线性等特性,采用机理分析法,难以建立其准确的数学模型,导致预测效果差。鉴于此,该文将基于正交基函数的改进型极限学习机对城市需水量因子进行辨识,并利用经验模态分解方法确定网络隐含层节点数,建立了库尔勒市城市需水量预测模型。结果表明:模型有效性为0.9714,实测值与预测值的拟合关系比较理想,说明基于正交基函数的改进型极限学习机对城市需水量进行系统辨识是可行的。

城市需水量; 预测; 极限学习机; 经验模态分解; 正交基函数

城市需水量预测对区域水资源规划、城市供水系统管理和改扩建具有重要指导作用[1-2]。由于城市需水量是一个典型的非线性、大惯性、强耦合和时变的复杂系统,因此,它的预测模型很难通过机理法用简单的数学公式或传递函数来描述[3]。随着人工智能技术的飞速发展,学者们开始利用人工智能技术解决需水量建模的相关问题,其中人工神经网络技术在建模中的应用特别突出[4-5]。人工神经网络可加快计算速度,并提高物理过程参数的精度,能利用有限的参数描述复杂的系统。人工神经网络建模相对于传统建模方法主要优点是不需要用数学表达式,更适合于长期预测。本文以新疆库尔勒市1997—2013年城市需水量及相关影响因子数据为例,针对城市需水量具有的非线性时变等特性,利用基于正交基函数的极限学习机(extreme learning machine,ELM)对城市需水量因子进行辨识,并利用经验模态分解(empirical mode decomposition,EMD)方法确定网络隐含层节点数,研究结果对于实现区域需水量的精确预测提供了重要参考。

1 极限学习机(ELM)算法

针对上述缺陷,本文提出基于正交基函数的改进型极限学习机,并利用经验模态分解方法确定网络隐含层节点数。

2 基于正交基函数的改进型极限学习机

2.1 正交基函数

依据最佳平方逼近多项式存在性定理[6,7],任意非线性函数y=f(x)都可由一组正交基函数线性表示:

(1)

式中G(x)——正交基函数;W——相关系数; 余项R(x)——逼近精度误差。

根据式(1),正交基函数神经网络的数学模型可定义为

(2)

基函数G(x)=[g1(x),g2(x),…,gL(x)]作为隐含层神经元的激励函数,将网络输入层与隐含层神经元的连接权值设置为1,隐含层神经元与网络输出层的阈值也设置为0。常见的正交基函数有Chebyshev、Hermite和Fourier[8-9],本文选用Fourier正交基函数作为ELM隐含层神经元的激励函数,具体如下:

式中x——正交基函数神经网络的输入;p,q——Fourier正交基函数的系数。

2.2 EMD算法

经验模态分解算法[10]是一种基于时域的信号处理方法,它仅仅基于这样的假设:任何信号都是由不同的本征模态函数(intrinsic mode function,IMF)组成,其目的是把复杂的信号分解成有限个本征模态函数之和。

每一个本征模态函数都具有相同的极值点和过零点,在任意两个相邻的过零点之间仅有一个极值点,且上下包络曲线是关于时间轴局部对称,任意的两个本征模态函数之间是相互正交的。本文利用经验模态分解方法确定网络隐含层节点数。

2.3 网络隐含层节点数确定

目标函数Y经过EMD分解后得n个相互正交的分量c1,c2,…,cn,由EMD的完备性可知:

(3)

(4)

于是得:

(5)

(6)

含有L个隐含层节点的ELM网络的数学模型可表示为

(7)

式中x∈Rn,wi∈Rn,βi∈Rm;wi——网络输入层与第i个节点的连接权值;bi——第i个隐含层节点的阈值;βi——第i个隐含层节点与输出层的连接权值;gi(wi,bi,x)——第i个隐含层节点的激励函数。

故具有L个隐含层节点的能量总贡献率可表示为

(8)

式中V——能量总贡献率,且0≤V≤1;vi——第i个隐含层节点的能量贡献率,且0≤vi≤1。

选择的隐含层节点数量越多,能量总贡献率越高,逼近精度越高,若L=n,则逼近精度V=1。

本文对训练样本(1997—2007年)的城市需水量进行EMD分解,分解所得的IMF分量个数为9,故网络隐含层节点数为9。

2.4 网络输出权值确定

根据统计学习理论可知,实际的风险既有经验风险又有结构化风险。如果想获得一个良好的模型,需要同时考虑这两种风险。因此在输出权值最小化和误差最小化之间做出折中,即:

式中H——隐含层输出矩阵;β=[β1,β2,…,βL]——隐含层与输出层的连接权值;T——系统实际输出。

3 模型应用

3.1 研究区概况及数据来源

库尔勒市位于新疆塔里木盆地北缘,天山支脉库鲁克塔格山和霍拉山山前冲积平原,全市总面积7268km2,是新疆巴音郭楞蒙古自治州的州府所在地,也是当地政治、经济与文化中心。库尔勒市因盛产库尔勒香梨而有“梨城”美誉,这里光照充足,昼夜温差大,降水稀少,蒸发强烈,为典型的暖温带大陆性干旱气候,多年平均气温11.5℃,降水量55.6mm,蒸发量2388.2mm(E20小型蒸发器),年日照时数2990h,无霜期210d。

库尔勒市1997—2013年城市需水量及相关影响因子数据均来自《巴音郭楞蒙古自治州2014年统计年鉴》,考虑数据的可获取性,城市年需水量及相关影响因素值见表1。

表1 新疆库尔勒市1997—2013年需水量及相关数据

续表

3.2 模型评价指标

模型性能以均方根误差RMSE(root mean square error)和模型有效性MV(model validity)为指标,来衡量模型的泛化能力和精度。

均方根误差RMSE表示为

(9)

模型有效性MV表示为

(10)

均方根误差RMSE反映模型输出曲线在实际曲线上的波动情况,模型有效性MV反映了模型输出与实际值的偏差相对于数据的离散性,性能良好的模型有效性MV为1。

3.3 模型预测结果分析

以库尔勒市1997—2007年城市需水量相关数据为训练样本,以2008—2013年城市需水量相关数据为预测样本,模型计算结果如下。

3.3.1 传统ELM模型

传统ELM算法在建立模型前仅需确定网络激励函数和隐含层节点数即可,本文选用Sigmoidal函数作为传统ELM算法的激励函数,网络隐含层节点数为9。基于传统ELM网络的城市年需水量预测曲线如图1所示,误差范围为-558万~406万m3。

图1 改进ELM模型与传统ELM模型的城市年需水量预测

3.3.2 基于正交基函数的改进ELM模型

在基于正交基函数的改进ELM模型中,其隐含层神经元激励函数系数为:p=25,q=12,网络隐含层节点数为9。基于正交基函数的改进ELM网络的城市年需水量预测曲线如图1所示,其误差范围-136万~171万m3。两种不同的ELM模型性能对比见表2。

表2 基于正交基函数的改进型ELM与传统的ELM性能对比

根据表2可知,与传统ELM模型相比,运用基于正交基函数的改进ELM模型的城市需水量均方根误差减小了278.1万m3,模型有效性相对提高了0.1868,这说明运用基于正交基函数的改进ELM模型对城市需水量进行模拟预测是行之有效的。但是城市需水量误差波动剧烈,离散性大,这是由于需水量受到各种随机因素的影响,并且数据中可能含有噪声,造成ELM算法过多的拟合了噪声,最终造成城市需水量的误差波动剧烈,离散性大。

4 结 论

本文提出利用基于正交基函数的改进极限学习机对城市年需水量进行预测。首先对训练样本进行EMD分解,根据IMF分量的个数确定网络隐含层节点数目;接着,在统计学习理论的基础上,同时考虑经验风险与结构化风险,在输出权值最小化和误差最小化之间做出折中,求解出满足输出权值与误差之和最小化的网络输出权值计算公式。结果表明,与传统ELM模型相比,运用基于正交基函数的改进ELM模型对城市需水量进行模拟预测是行之有效的。

但是,选用Fourier正交基函数作为ELM隐含层神经元的激励函数,激励函数中的系数为经验值,需要经过多次试算才能找到最佳值,其他正交基函数有待验证。

[1] 杨艳,李靖,马显莹.基于小波神经网络的城市用水量长期预测研究[J].云南农业大学学报:自然科学版,2010,25(2):272-276.

[2] 梁学玉,张鑫,孙天青.组合灰色预测模型在城市用水量预测中的应用[J].人民黄河,2010,32(4):79-80.

[3] 李黎武,施周.基于小波支持向量机的城市用水量非线性组合预测[J].中国给水排水,2010,26(1):54-58.

[4] 王军玺,刘严如,李月娇.基于区域发展目标的兰州市水资源可持续承载能力预测研究[J].水利建设与管理,2013(3):81-86.

[5] 宓永宁,陈默,张茹.灰色拓扑法在大伙房水库总氮预测中的应用[J].水利建设与管理,2009(3):72-73.

[6] 曾喆昭.神经计算原理及其应用技术[M].北京:科学出版社,2012:181-185.

[7] 孟广伟,李广博,李锋.多项式基函数神经网络的结构可靠性分析[J].北京航空航天大学学报,2013,39(11):1460-1463.

[8] 叶军.基于模拟正交神经网络的电热干燥器温度控制[J].农业工程学报,2005,21(10):105-108.

[9] 杨胡萍,左士伟,涂雨曦.基于混沌理论和Legendre正交基神经网络的短期负荷预测[J].电测与仪表,2015,52(13):63-67.

[10] 张瑜,汪小旵,孙国祥,等.基于集合经验模态分解与Elman 神经网络的线椒株高预测[J].农业工程学报,2015,31(18):169-174.

Prediction of Xinjiang Kurle urban water demand based on improved limit learning machine

SIMA Yi·Abudureheman

(XinjiangTarimRiverBasinBayinguolengAdministration,Kolla841000,China)

Urban water demand system is characterized by large inertia, strong coupling and nonlinearity, etc. Mechanism analysis method is adopted. It is difficult to establish an accurate mathematical model, thereby leading to poor forecast effect. Therefore, urban water demand factors are identified by the improved limit learning machine based on orthogonal basis functions in the paper. The empirical mode decomposition method is used for determining network hidden layer node quantity. An urban water demand prediction model in Korla is established. Results show that the model validity is 0.9714. The fitting relationship between the measured value and the predicted value is more ideal. It is obvious that it is feasible to systematically identify urban water demand by improved limit learning machine based on orthogonal basis functions.

urban water demand; prediction; limit learning machine; empirical mode decomposition; orthogonal basis functions

10.16616/j.cnki.10-1326/TV.2017.07.018

TV211

A

2096-0131(2017)07- 0061- 05

猜你喜欢

学习机需水量权值
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
南京城市中心区生态需水量探析
极限学习机综述
基于极限学习机参数迁移的域适应算法
分层极限学习机在滚动轴承故障诊断中的应用
组合预测模型在区域需水量预测中的应用
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
帕满灌区供需水量平衡分析