APP下载

局域法邻近点选取对供水量预测精度的影响

2017-06-27任刚红杜坤刘年东周明李诚

土木建筑与环境工程 2017年4期
关键词:基准点欧式时序

任刚红++杜坤++刘年东++周明++李诚

摘要:

混沌局域法预测模型适用于非线性、非平稳的城市日供水量预测,而邻近相点个数的选取对该模型预测精度有直接影响。传统方法通常以嵌入维m作为参考值,凭经验选取m+1个邻近相点,且仅使用欧式距离法计算当前相点距离,无法反映相点的运动趋势,易引入伪邻近相点,导致预测精度的降低。鉴于此,将演化追踪法引入城市日供水量预测,通过挖掘邻近相点的历史演化规律对参考样本进行优选,以提高预测精度。最后,采用实际日供水量数据验证所提出方法,结果表明,运用演化追踪法优选邻近相点能显著提高日供水量预测精度,预测平均绝对误差由2.501%降低到1.683%。

关键词:

混沌理论;局域法;邻近点;演化追踪法;供水量预测

Abstract:

The chaotic localregion forecasting model is suitable for nonlinear and nonstationary urban daily water supply forecast, and the neighbourhood selection has a direct impact on the model prediction accuracy. The traditional method usually takes the embedded dimension m as a reference, and selects m+1 nearest neighbours by experience. It usually introduces the pseudo nearest neighbours, which leads to the reduction of the prediction accuracy. Accordingly, the evolutionary tracing method is introduced into the prediction of urban daily water supply. By mining the historical evolution of nearest neighbours, the reference samples are optimized to improve the prediction accuracy. The proposed method is validated by the actual daily water supply data. The results show that the optimal approach is significantly improved by using evolutionary tracing method, and the average absolute error is reduced from 2.501% to 1.683%.

Keywords:

chaos;localregion method;neighbourhood selection;evolutionary tracing method; water supply forecast

现今水资源极度缺乏,城市供水优化调度显得尤为重要,而供水量预测又是供水优化调度的重要组成部分,其预测准确与否直接影响到给水系统调度决策能否是有效制定 [13]。供水系统是一个具有时变特性的复杂系统,其本身影响因子表现出非线性、非平稳的特性。供水量预测模型一般分为传统预测模型和基于新技术的方法模型,传统预测模型的参数筛选复杂,且多基于数学理论假设的基础上,预测效果难以保证。例如多元回归分析、统计预测法、专家意见法等[4]。混沌理论是一种新的预测技术,其通过历史观测数据, 找出蕴含其中的内在演化规律,对整个系统进行描述和解释,进而对系统做出预测。它的出现为供水量的预测研究提供了新的思路,Chang等[5]在相空间重构的基础上,对城市日用水量时序进行了分析,计算出符合案例实际情况的嵌入维数、嵌入延迟和Lyapunov指数。Jayawardena[6]为优选局域预测模型的邻近点个数,提出一种基于广义自由度的新方法。张琴等[7] 针对时供水量短期高精度预测难题,提出一种基于横向分时段和纵向残差修正的联合时序短期混沌预测方法。高金良等[8]利用Lyapunov指数构造供水预测模型,避免了主观因素的影响。总之,基于混沌理论的时序预测技术具有很好的应用前景。

一般预测模型可分为3个步骤:1)为刻画实测数据蕴含的信息该采用何种样本形式;2)选择多少个样本作为参考样本;3)选择预测模型。混沌局域法:1)相空間重构;2)确定参考邻近点数;3)局域模型进行预测。通过对文献的总结,笔者发现绝大多数运用混沌局域法对供水量预测的研究都侧重于相空间重构及预测模型的选择,即第1和3步 ,很少考虑第2步“选择多少个样本作为参考样本”,即对邻近点选取问题的研究较少。实际上,混沌局域法的预测精度和计算量是由邻近点来决定的,邻近点数选取过少,大量有效信息可能被忽略,导致系统历史运动趋势无法被充分反映。邻近点数选取过多,易引入无效参考样本,而且,局域法的线性假设条件也可能不满足。因此,在使用混沌局域法对供水量进行预测时,研究邻近点的选取对预测精度的影响是十分有必要的。本文提出基于演化追踪法来确定局域法邻近点数的定量方法,最后利用实测日供水量数据对该方法进行了分析验证。

1混沌局域法多步预测模型

研究表明,混沌局域模型对噪声较大的复杂系统的预测较其他模型更具优势[9],它不是用所有状态向量来拟合重构函数,而是选定相空间最后的一状态点作为基准点XrM,再挑选邻近XrM的K个状态点来拟合,故其拟合速度快,预测精度高。

1)相空间重构[10]。其基本思路是将一维混沌时间序列映射到高维的空间,目的是恢复有规律的吸引子,从而使蕴藏在时间序列中的信息显露。设混沌时间序列{x1,x2,…,xN}则相空间重构为

2)选取邻近点。在相空间中找出基准点XrM的参考邻近点集{Yri,i=1,2,…,K} (传统邻近点数确定方法为K=m+1),计算出各邻近点到XrM之间的欧式距离为di,设dmin是di中的最小值,定义{Yri}的权重系数矩阵〖WTHX〗Wi,得

3)计算拟合参数。设XrM的S步演化相点为XrM+,对一阶多步局域预测模型进行线性拟合, 得

2演化追踪法原理

多数学者在运用混沌局域模型预测供水量时,往往忽略邻近点的选取问题,一般认为当基准点与邻近点间的欧式距离小于某阈值则为有效邻近点,或简单地取邻近点数为K=m+1,并不考虑邻近点的运动与演化趋势,易引入“伪邻近点”或“弱相关点”,这些无效参考点可能会导致模型预测效果不佳甚至失效[13]。

局域预测法认为混沌吸引子外的任一点都与其邻近点域有相同的演化行为,因此通过拟合各邻近点运动趋势就可推断出预测点的运动趋势。如图1所示,设到基准点XrM的欧式距离满足某一阈值的邻近点有{Yri,i=I,J,K,L},{Yri}上一步历史相点则为{Yrj,j=I-1,J-1,K-1,L-1}。同理,{Yri}的下一步未来相点则为{Yrk,k=I+1,J+1,K+1,L+1}。邻近点的4种可能的演化情况如图1所示:①线YrJ与XrM的历史相点YrJ-1与XrM-1很接近,但未来相点YrJ+1与XrM+1却相距甚远,说明两个相点的演化趋势差逐渐偏离,XrM的演化趋势不能YrJ预示,YrJ是伪邻近点;②线YrI与XrM相应的历史相点、未来相点皆接近,YrI为理想的参考邻近点;③线YrL和XrM的历史相点YrL-1与XrM-1距离虽较远,但未来相点YrL+1与XrM+1却慢慢靠近,说明其与基准点的演化行为趋于一致,YrL是一般的参考邻近点;④线YrK与XrM的历史相点、未来相点都相距较远,虽满足邻近点定义,但与XrM+1的演化趋势无相关性,YrK是伪邻近相点。

若基准点XrM及其历史相点XrM-n与对应的邻近点“一直邻近”,即说明基准点与邻近点的演化行为相同,进而可推出预测点的演化趋势,这就是演化追踪法的基本原理。

3城市供水量预测实例

3.1预测实例

根据文献[15],原始供水数据中含有季节性、趋势性和噪声,为消除这些不利影响、提高预测精度,仅选取2005—2011年每年1月的日供水时序作为单独的时间序列进行预测,对于其它月份的预测可照此方法依次处理。由小数据量法计算得该时序的Lyapunov指数为λ=0.132,说明该供水系统是一种混沌系统。采用文献[16]中推荐的方法计算嵌入维度m=10,则传统法邻近点个数计为K=11。考虑到互信息法[17]较其他嵌入延迟算法,更适用于提取高维混沌系统的非线性特征,因此选用互信息法计算嵌入延迟得τ=6。

利用演化追踪法回溯两步历史选取邻近点 [18],先计算基准点XrM的K(K≤N-(m-1)τ)个初始邻近点欧式距离Yr0i(i = 1,2,…,K),从中寻找与XrM在演化过程中“一直邻近”的邻近点。再计算XrM的上一步历史点XrM-1的K个初始邻近点欧式距离Yr1i(i = 1,2,…,K);再计算XrM的前两步演化点XrM-2的K个初始邻近相点欧式距离Yr2i(i = 1,2,…,K);若Yr0i的上一步演化点欧式距离在{Yr1i(i = 1,2,…,K)}中,且Yr0i的前两步演化点在点集{Yr2i(i = 1,2,…,K)}中,则点Yri是基准点XrM的真邻近点(即Yri = Yr0i∩Yr1i∩Yr2i),否则,为伪邻近点。同理,依次判断剩余的相點,此案例计算得邻近点个数K=7,比传统的参考邻近点个数少4个。

选取210个日供水量时序进行相空间重构,考虑到局域模型只能进行短期预测及Lyapunov指数,则验证样本数为1/λ个日供水时序。总体预测趋势如图2示,局部预测细节如图3示。

由图2、3可见,“K=7预测值”与真实值总体走势相同,其能较好地把握供水系统的总体运动趋势;演化追踪法与传统法二者预测值虽走势相同,但演化追踪法对系统的走势细节把握更准确。图4可见,演化追踪法的相对误差总体小于传统法相对误差,说明演化追踪法能提高预测精度。

3.2模型精度检验

这里选取常用的平均绝对百分比误差作为模型精度的检验标准,计算式为

相同预测步数情况下, K值大的预测精度反而低,说明初始邻近相点中存在伪邻近相点或邻近程度较弱的相点,对预测起负面作用,需要进行辨识并剔除。运用演化追踪法对邻近点进行优选,预测精度有显著提高,其平均绝对误差由2.501%减少到了1.683%。

4结论

1)在利用混沌局域法模型预测具有混沌特性的城市日供水量时,传统方法通常凭经验选取邻近点,可能会引入伪邻近点,预测精度不理想。

2)一般地,K值越大越容易掺杂伪邻近点,运用演化追踪法挖掘邻近点的历史演化信息,可有效辨别真、伪邻近点。实例中日供水量预测的MAPE由2.501%降低到1.683%,说明该方法提高了预测精度。

3)演化追踪法能辨别、剔除伪邻近点,获取有效参考样本,克服了凭主观经验或多次试验来确定邻近点个数问题,也为其他模型优选参考样本提供了新思路。

参考文献:

[1] LILY H P, BETHANY P. Effects of urban spatial structure, sociodemographics, and climate on residential water consumption in hillsboro, oregon [J].Journal of the American Water Resources Association, 2010, 46(3):461472.

[2] YASAR A, BILGILI M, SIMSEK E. Water demand forecasting based on stepwise multiple nonlinear regression analysis [J]. Arabian Journal for Science and Engineering, 2012, 37(8): 23332341.

[3] 孫月峰,闫雅飞,张表志.基于TS模型的模糊神经网络城市需水量预测方法研究[J].安全与环境学报, 2013, 13(2): 136139.

SUN Y F, YAN Y F, ZHANG B Z. Fuzzy neural network method based on the TS model for the urban water demand forecasting and its application [J]. Journal of Safety and Environment, 2013,13(2): 136139.(in Chinese)

[4] MOMBENI H A, REZAEI S, NADARAJAH S, et al. Estimation of water demand on SARIMA models [J]. Environmental Modeling and Assessment, 2013, 18(5): 559565.

[5] CHANG K, GAO J, CHEN M L, et al. Urban daily water demand shortterm forecasts based on the chaos theory[C]// International Conference on Natural Computation, IEEE Computer Society, 2008:696699.

[6] JAYAWARDENA A W. Neighbourhood selection for local modelling and prediction of hydrological time series [J]. Journal of Hydrology, 2002, 258:4057.

[7] 张琴,汪雄海,朱庆建.基于联合时序的混沌时用水量短期预测调度[J].灌溉机械工程学报,2011,29(4): 353360.

ZHANG Q, WANG X H. Shortterm prediction of chaotic hourly water consumption based on united time series[J]. Journal of Drainage and Irrigation Machinery Engineering, 2011, 29(4):353360. (in Chinese)

[8] 高金良, 常魁, WEN Y W,等. 城市用水量预测的混沌理论研究[J]. 哈尔滨商业大学学报(自然科学版), 2009, 25(1):8891.

GAO J L, CHANG K, WEN Y W,et al. Study on urban daily water demand shortterm forecasts based on chaos theory [J]. Journal of Harbin University of Commerce (Natural Sciences Edition), 2009,25(1):8891. (in Chinese)

[9] BAI Y, WANG P, LI C,et al. A multiscale relevance vector regression approach for daily urban water demand forecasting [J]. Journal of Hydrology, 2014, 517: 236245.

[10] TAKENS F. Determining strange attractors in turbulence [J]. Lecture Notes in Mathematics, 1981, 898: 361381.

[11] 韩敏.混沌时间序列预测理论与方法[M].北京:中国水利水电出版社,2007:2839.

HAN M. Prediction theory and method of chaotic time series [M].Beijing: China Water&Power Press, 2007:2839. (in Chinese)

[12] DU K, PH D, LONG T Y. Inversion model of water distribution systems or nodal demand calibration [J].Journal of Water Resources Planning and Management,2015,4(15): 112.

[13] 刘年东, 杜坤, 周明,等. 局域法邻近点选取对降雨量预测精度影响研究[J]. 给水排水, 2016,42: 285288.

LIU N D, DU K, ZHOU M, et al. Study on the influence of select the localregion method nearest neighbours on rainfall forecasting accuracy [J]. Water & Wastewater Engineering, 2016,42:285288. (in Chinese)

[14] 唐巍,谷子.基于相关邻近点与峰谷荷修正的短期负荷时间序列预测[J].电力系统自动化, 2006,30(14) :2529.

TANG W,GU Z.Shortterm load time series forecasting based on correlative neighboring points and peakvalley correction [J].Automation of Electric Power Systems, 2006,30(14):2529. (in Chinese)

[15] 张善文,雷英杰,冯有前. MATLAB在时间序列分析中的应用[M].西安:西安电子科技大学出版社,2007:2027.

ZHANG S W,LEI Y J,FENG Y Q.The application of MATLAB in time series analysis[M].Xi'an: Xidian University Press,2007:2027. (in Chinese)

[16] MIRMOMENI M,LUCAS C. Model based method for determining the minimum embedding dimension from solar activity chaotic time series [J]. Materials and Energy Research Center, 2008, 21(1):3141.

[17] JIN S H, PETER L, MARK H. Linear and nonlinear information flow based on timedelayed mutual information method and its application to corticomuscular interaction [J]. Clinical Neurophysiology, 2010,121: 392401.

[18] 高俊杰.混沌時间序列预测研究及应用[D].上海:上海交通大学,2013: 5355.

GAO J J. Study and application of chaotic time series prediction [D].Shanghai: Shanghai Jiao Tong University,2013: 5355.

猜你喜欢

基准点欧式时序
清明
欧式花边的中西宫廷时尚表现
你不能把整个春天都搬到冬天来
欧式新古典风格室内软装饰设计资源的运用原则探讨
浅析建筑物的沉降观测技术及方法
深基坑监测技术的应用与探讨
一种面向文物本体微小变化监测的三点重定位方法
简欧别墅室内空间设计与表现分析
巴洛克风格庭院设计
光威4GB DDR4 2133