基于小波变换和LSSVM-DE的天然气日负荷组合预测模型
2014-10-20乔伟彪陈保东吴世娟李朝阳毛建设马剑林
乔伟彪 陈保东 吴世娟 李朝阳 毛建设 马剑林
1.中国石油大学(华东)储运与建筑工程学院 2.辽宁石油化工大学石油天然气工程学院 3.华润(南京)市政设计有限公司 4.西南石油大学石油与天然气工程学院 5.中国石油集团工程设计有限责任公司西南分公司 6.中石油煤层气有限责任公司 7.中国石油西南管道公司
随着我国天然气工业的大力发展,燃气企业的市场化运作,作为燃气企业重要组成部分的负荷预测受到越来越多的重视。近年来,国家积极提倡节能减排,因而对天然气短期负荷的预测精度提出更高的要求。天然气短期负荷是一个复杂的非线性系统[1],系统本身具有伪周期性、随机性和趋势性等特点,此外天然气短期负荷也与温度等多种气象自然因素息息相关,同时还受重大事件及国家法定节假日的影响。因此,建立精确的负荷预测模型具有重要的意义。
现有的天然气短期负荷预测方法主要包括两种:一种是物理方法[2],其利用天气预报的结果如温度、湿度、风速、云量等物理信息建立刻画天然气短期负荷的模型进行预测;另一种是统计方法,即根据过往的历史样本数据建立系统输入与输出的非线性映射关系来进行预测,如小波分析综合模型[3]、GM(1,1)灰色理论模型[4]、BP 神经网络模型[5]、时间序列模型[6]等。物理方法不需要大量实测的历史样本数据,但是预测误差较大,而统计方法共同的特点是预先建立时间序列的主观预测模型,然后根据建立的主观预测模型进行计算及预测。对于绝大多数由实际测量数据所组成的系统(尤其是城市天然气日负荷)来说,其外部影响条件,包括天气、节假日、经济及异常情况等,都随着时间的变化而变化,不会保持恒定,这样的系统往往表现出波动性、非平稳性的特征,刘涵[7-8]等利用最小二乘支持向量机进行天然气日负荷预测时,考虑了天气、节假日、经济及异常情况的影响,但其未对日负荷预测的波动性规律进行分析,所以是否可以考虑将小波变换和LSSVM这两种方法相结合并应用到日负荷预测中,以提高预测精度,笔者试图从这一思路着手来提高天然气日负荷预测的预测精度。
笔者以某市2013年4月1日至2013年8月31日实际采集的天然气日负荷时间序列为例进行研究。首先,对该时间序列进行小波分解,母小波采用Db3(Daubechies3)分解为3层,运用 MATLAB软件,分解出第3层低频信号序列、第1层高频序列、第2层高频序列、第3层高频序列,以识别日负荷时间序列的波动特性;其次,分别采用LSSVM-DE、LSSVM、ANN预测模型对分解出的第3层低频信号序列、第1层高频序列、第2层高频序列、第3层高频序列进行预测;最后,对预测结果进行小波重构,该过程为小波分解的逆过程。为了评价各预测模型的预测精度,采用国际上普遍采用的5种定量评价方法进行评价。结果表明:小波变换和LSSVM-DE组合预测模型的预测精度明显高于单独应用LSSVM、ANN预测模型,为实际工程的在线应用提供了理论基础。
1 小波变换基本理论
1.1 小波分解
时间序列进行小波分解与重构的常用算法统称为Mallat算法,该算法与快速Fourier变换相类似,具有快速、简洁的特点,因此被广泛应用[9-10]。将天然气日负荷时间序列看成复杂信号,采用Mallat快速算法对其进行分解,分解出不同频带的信号,分析不同频带的信号,可得到时间序列信号的一些特征,考虑到分解层数多可能引起累积误差,造成对预测精度的影响,笔者采用3层分解,母小波采用Db3小波,分解算法如图1所示。
图1 小波分解算法示意图
图1中d0为原始信号序列,d3为第3层低频信号序列,g1、g2、g3分别为第1层高频序列、第2层高频序列、第3层高频序列,图1依据的公式为:
式中l为低通滤波器系数;h为高通滤波器系数。
1.2 小波重构
小波重构算法与小波分解算法的过程相反[11],重构算法如图2所示。
图2 小波重构算法示意图
图2依据的公式为:
2 LSSVM(最小二乘支持向量机)基本理论
支持向量机是由Vapnik在统计学习理论的基础上建立起来的一种很有潜力和新的机器学习方法[12-13],该方法的基本思想为:给定训练样本集(xi,yi),i=1,…,m,xi∈R,选择一非线性映射φ(x)把样本的输入向量空间映射到高维空间F,然后在此空间上构造最优线性决策函数。
式中ω为权值向量;b为一个偏量。
根据结构风险最小化原理,引入间隔的概念,并考虑拟合误差(ξi)和函数的复杂度,得出优化问题为:
约束条件为:
式中γ为正则化参数;T为矩阵的转置。
针对天然气日负荷预测问题,笔者认为该问题属
于回归问题,因此选择LSSVM进行预测。
约束条件为:
式中C为惩罚因子。
对应于优化问题式(7)、(8)的Lagrange函数为:
式中αi为Lagrange乘子。
根据 KKT(Karush-Kuhn-Tucker)条件[13]可得如下方程组:
式中 Ωij=φ(xi)Tφ(xj)=K(xi,xj),Y= (y1,…,ym)T,1=(1,…,1)T,α=(α1,…,αm)T。
将式(10)变形为:
式中H=Ωij+γ-1I,s=1T(H-11)。
求解式(11)可参照本文参考文献[12],可得变量α和b,写成统一的形式为:
由于H是对称正定的,上述方程用超松弛迭代法来求解,解出α和b后,将α和b带入下面的方程:
式中K(x,xi)为核函数,本文选用高斯径向基核函数,其形式为:
式中σ为核宽度。
3 基于小波变换和LSSVM-DE的天然气日负荷预测模型
3.1 小波分解
实验软件采用Matlab小波分解工具箱,母小波采用Db3小波,分解层数为3层,根据式(1)、(2)进行小波分解。
3.2 LSSVM预测
实验软件采用LSSVMLAB软件,根据LSSVM优化回归理论可知:高斯径向基核函数核宽度(σ)以及惩罚因子(C)对预测精度影响较大。σ和C的求解方法一般为将σ和C分别采用单独的优化方法进行优化,笔者采用组合优化方法进行参数组合优化,具体为差分进化算法[14](DE),LSSVM 预测模型的预测参数见表1。
表1 LSSVM预测参数表
3.3 小波重构
小波重构为小波分解的逆过程,基本条件同小波分解,根据式(3)进行小波重构。
4 实例研究
为了验证笔者提出的基于小波变换和LSSVMDE的天然气日负荷预测模型的预测精度,选取某市2013年4月1日—2013年8月31日的153个数据作为样本点,选取2013年9月1日—2013年9月30日的30个数据作为验证,并与单独应用LSSVM和ANN预测模型进行对比分析,日负荷随时间变化如图3所示,从图3可以看出除个别样本点值突变较大外,其余各点日负荷用气量值在27 500~40 000m3波动,并表现出非平稳性。
4.1 小波分解
小波分解结果如图4所示。
图3日负荷随时间变化图
图4 小波分解图
4.2 LSSVM各层预测
4.2.1 影响因素分析
影响天然气日负荷变化的主要影响因素有:日期类型因素、天气因素、经济因素、异常情况。下面就其中主要的节假日因素和天气因素进行分析。
4.2.1.1 节假日因素
城市天然气用户在平常日、星期六和星期天、重大节日的天然气用气量具有明显的差异,在预测中必须要将这种差异考虑进去,否则就会出现星期六和星期天、重大节日欠预测、平常日过预测的现象。
4.2.1.2 天气因素
据本文参考文献[2]可知,在各种气象因素(包括温度、适度、天气状况、风速等)中,对城市天然气用户用气量影响较大的是温度,尤其是日平均温度。根据其分析可知:4个季节中,冬季和夏季对其影响较大,并提出了冬季和夏季的城市天然气日负荷与日平均温度的相关系数,分别为-0.628 8(冬季)和-0.259 9(夏季),说明城市天然气日用气量与日平均温度呈负相关,换句话说,温度升高,日负荷量减少;温度降低,日负荷量增加,而且冬季受日平均温度影响较大。
应用LSSVM预测时,考虑节假日因素、天气因素对预测结果影响较大,因此输入向量为三维向量,分别为节假日权重系数、日平均温度、天然气日负荷,其中节假日权重系数参考本文参考文献[2],具体见表2,日平均温度参考2012年同日的实际数据。
表2 不同日期类型的权重系数表
4.2.2 各层预测结果
各层信号预测结果见图5。
4.3 小波重构
小波重构结果如图6所示。
图5 各层信号预测结果图
图6 小波重构结果图
4.4 对比分析
天然气日负荷预测的常用模型有LSSVM预测模型、ANN预测模型,将笔者所建立的小波变换和LSSVM-DE组合预测模型与上述两种常用的预测模型进行对比,采用的定量评价方法为国际上普遍采用的5种误差评价方法,分别为相对均方误差、归一化均方误差、归一化绝对平方误差、归一化均方根误差、最大绝对误差,具体公式可参照本文参考文献[15]。定量评价结果见表3,定性评价结果见图7。
表3 不同预测模型的误差性能比较表
图7 不同预测模型的预测值与实际值对比图
分析图7和表3可知:小波变换和LSSVM-DE组合预测模型较单独应用LSSVM、ANN预测模型所得的预测值与实际值更为接近,主要是因为经小波分解处理后,滤掉了原始时间序列的非显著信息,消除了非显著信息对预测结果的影响。因此,小波变换和LSSVM-DE组合模型预测值与实际值最接近。从定量方面来看,组合预测模型的相对均方误差、归一化均方误差、归一化据对平方误差、归一化均方根误差、最大绝对误差分别比单独应用LSSVM、ANN预测模型分别低 1.662%、1.14%、3.96%、2.99%、15.53% 和1.942%、1.01%、3.07%、1.86%、12.26%,各个误差指标均为正数,表明所建组合模型预测精度较高,能够准确预测天然气日负荷,同时能够紧跟其变化趋势,尤其是1日—4日之间、13日—30日之间,5日—12日之间虽然与实际值存在误差,但是相比其他两种预测方法,预测误差较小。ANN预测模型虽然也能较好地跟随实际运行数据的变化趋势,但其预测效果仍然远不及组合预测模型和单独应用LSSVM预测模型的预测效果。
5 结论
提出了一种基于小波变换和LSSVM-DE的组合预测模型,相比单独应用LSSVM、ANN预测模型,组合预测模型具有较高的预测精度,为天然气负荷预测提供了一种新的思路。
1)采用快速Mallat算法对实际采集的天然气日负荷时间序列进行小波分解,分解出第3层低频序列、第1层高频序列、第2层高频序列、第3层高频序列。
2)分别采用LSSVM-DE对分解出的各序列进行预测,单独应用LSSVM、ANN对原天然气日负荷时间序列进行预测。
3)对LSSVM-DE预测模型的各序列预测结构进行小波重构,将重构结果与单独应用LSSVM、ANN预测模型的预测结果进行对比分析,结果表明所建组合模型能够取得很好的预测效果,具有较高的预测精度,为工程应用提供了有益的参考。
[1] 焦文玲,廉乐明,崔建华,等.城市燃气短期周期负荷预测的时序模型[J].天然气工业,2002,22(1):92-94.JIAO Wenling,LIAN Leming,CUI Jianhua,et al.Time series model of prediction short period city gas load[J].Natural Gas Industry,2002,22(1):92-94.
[2] 何春蕾,段言志,邬宗婧,等.基于气温的城市燃气短期日负荷预测模型——以四川省成都地区为例[J].天然气工业,2013,33(4):131-134.HE Chunlei,DUAN Yanzhi,WU Zongjing,et al.A shortterm forecasting model of city gas daily load based on air temperature[J].Natural Gas Industry,2013,33(4):131-134.
[3] 李持佳,焦文玲,赵林波.燃气短期负荷预测的小波分析综合模型[J].天然气工业,2007,27(8):103-105.LI Chijia,JIAO Wenling,ZHAO Linbo.A synthesis wavelet analysis method for short-term gas load prediction[J].Natural Gas Industry,2007,27(8):103-105.
[4] 焦文玲,展长虹,廉乐明,等.城市燃气短期负荷预测的研究[J].煤气与热力,2001,21(6):483-486.JIAO Wenling,ZHAN Changhong,LIAN Leming,et al.Study of forecasting for short term load of city gas[J].Gas& Heat,2001,21(6):483-486.
[5] 杨昭,刘燕,苗志彬,等.人工神经网络在天然气负荷预测中的应用[J].煤气与热力,2003,23(6):331-332.YANG Zhao,LIU Yan,MIAO Zhibin,et al.Application of neural-network in natural gas load forecasting[J].Gas &Heat,2003,23(6):331-332.
[6] 焦文玲,赵林波,秦裕琨.城市燃气负荷非平稳时序预测模型的研究[J].煤气与热力,2003,23(8):451-453.JIAO Wenling,ZHAO Linbo,QIN Yukun.Study on load forecast of city gas with unstable time series model[J].Gas& Heat,2003,23(8):451-453.
[7] 刘涵,刘丁,郑岗,等.基于最小二乘支持向量机的天然气负荷预测[J].化工学报,2004,55(5):828-832.LIU Han,LIU Ding,ZHENG Gang,et al.Natural gas load forecasting based on least squares support vector machine[J].Natural Gas Industry,2004,55(5):828-832.
[8] 苗艳姝.城市燃气负荷预测的研究[D].哈尔滨:哈尔滨工业大学,2006.MIAO Yanshu.Research on the city gas load forecasting[D]Harbin:Harbin Institute of Technology,2006.
[9] 宋彤,李菡.基于小波回声状态网络的混沌时间序列预测[J].物理学报,2012,61(8):90-96.SONG Tong,LI Han.Chaotic time series prediction based on wavelet echo state network[J].Acta Physica Sinica,2012,61(8):90-96.
[10] 朱佳,王振会,金天力,等.基于小波分解和最小二乘支持向量机的大气臭氧含量时间序列预测[J].气候与环境研究,2010,15(3):295-302.ZHU Jia,WANG Zhenhui,JIN Tianli,et al.Combination of wavelet decomposition and least square support vector machine to forecast atmospheric ozone content time series[J].Climatic and Environmental Research,2010,15(3):295-302.
[11] 刘明才.小波分析及其应用[M].北京:清华大学出版社,2005:32-34.LIU Mingcai.Wavelet analysis and its applications[M].Beijing:Tsinghua University Press,2005:32-34.
[12] 杨晓伟,郝志峰.支持向量机的算法设计与分析[M].北京:科学出版社,2013:63-69.YANG Xiaowei,HAO Zhifeng.Design and analysis of the support vector machine algorithm[M].Beijing:Science Press,2013:63-69.
[13] 周湶,孙威,任海军,等.基于最小二乘支持向量机和负荷密度指标法的配电网空间负荷预测[J].电网技术,2011,35(1):66-71.ZHOU Quan,SUN Wei,REN Haijun,et al.Spatial load forecasting of distribution network based on least squares support vector machine and load density index system[J].Power System Technology,2011,35(1):66-71.
[14] 张文专,龙文,焦建军.基于差分进化算法的混沌时间序列预测模型参数组合优化[J].物理学报,2012,61(22):120-126.ZHANG Wenzhuan,LONG Wen,JIAO Jianjun.Parameter determination based on composite evolutionary algorithm for reconstructing phase-space in chaos time series[J].Acta Physica Sinica,2012,61(22):120-126.
[15] 张学清,梁军.风电功率时间序列混沌特性分析及预测模型研究[J].物理学报,2012,61(19):70-81.ZHANG Xueqing,LIANG Jun.Chaotic characteristics analysis and prediction model study on wind power time series[J].Acta Physica Sinica,2012,61(19):70-81.