基于残差修正的冬季天然气日负荷预测模型
2019-11-12付川刘刚赵忠德郝迎鹏刘四洋
付川 刘刚 赵忠德 郝迎鹏 刘四洋
1山东省油气储运安全重点实验室
2中国石油大学(华东)
3中国石油天然气股份有限公司规划总院
4中国石油天然气股份有限公司天然气销售分公司
2017年,受宏观经济持续改善和能源结构优化影响,全国全年天然气实际消费量由2016年的2 058×108m3增加到2 373×108m3,同比增长15.31%[1]。且随着居民“煤改气”的推进及北方部分城市环保力度加大,冬季天然气消费量不均匀性愈加明显,北京市月度最高日负荷与最低日负荷相差约2 000×104~3 000×104m3,天然气日负荷预测难度增加。
有学者基于天然气负荷自身变化规律的时序建模方法证明了历史负荷变化趋势对日负荷预测的重要性[2-3],在后续学者建立基于外界多因素影响的天然气短期预测模型中,将相邻日负荷作为输入层变量进行连续日负荷预测。但由于模型本身误差及气象预报误差的存在,在迭代计算过程中将造成误差累积,且随预测时间增加误差累计造成的精度下降更加明显,需进行修正。
本文从天然气短期负荷预测(周度分日、月度分日)的应用全流程实际出发,选用小波神经网络(WNN)进行初步预测,根据北京市供暖季数据变化特征,引入残差修正模型以降低误差累积对连续多日负荷预测结果的影响,提升天然气日负荷预测模型整体精度。
1 模型误差来源分析及修正方法
1.1 误差来源及误差累积
大量预测实验发现,负荷预测的误差主要来自两个方面:一方面是模型本身误差,包括影响因素选取、数据量化、函数选择等,该部分误差可针对不同地区,通过采取不同数据处理方法、优化算法[4-6]等方法进行修正;另一方面是气象因素等预报误差对预测结果带来的误差,该部分误差随着测量设备及算法的不断更新在逐步缩小,但目前仍不可避免。
误差累积是指在连续预测多天日负荷过程中,由于天然气负荷的时序性及气象因素影响的误差累积效应[7],输入变量参数中常包含相邻日的负荷值。若相邻日的预测结果由于模型本身误差或气象因素预测误差产生偏差,则在迭代过程将对后续预测结果造成误差累积,使预测精度下降,因此需要进行修正。
1.2 修正方法
采用残差修正的方法减小误差累积,依据历史数据建立预测模型后,利用该模型进行连续多天预测,与真实值对比得到残差序列。在时序模型中的残差序列,赵卓峰等[8]采用将相同符号的残差值取平均值加到原始序列的方式进行循环修正。余凤[9]利用支持向量机求得残差序列,与真值加和作为预测值,该方法对于解决极端气象条件下(指由于极低温等因素导致日负荷偏高)数据预测偏差较大及误差累积现象具有局限性。
本文以温度为标准,将温度分为“日常温度”和“极端温度”分组进行残差修正。在极端温度下,由于极端温度出现的频率较低,在历史训练集中极端低温数据占比较小,当未分类直接进行训练时,预测值常偏低。BP 残差修正网络训练过程中输入层及输出层分别为负荷预测值及残差值,对残差值较大的预测值敏感性较高,利用该修正网络将模型预测值修正至实际值附近。残差修正网络通过修正“极端温度”条件下每日天然气负荷预测值,减少误差累积效应,从而提升模型预测准确性。
2 预测模型建立思路
2.1 数据预处理
选取在不同城市适用且可获取的影响因素,基于影响因素与天然气负荷变化的相关性对其进行量化。根据相关性分析及生产运行经验,并结合相关文献的参数选取,选取影响因素为气象因素、日期类型、相邻日的负荷值及相邻日影响因素[10-12]。选取如表1所示共11维变量作为影响因素输入层。
表1 输入变量情况Tab.1 Input variable conditions
2.2 建立小波神经网络预测网络
小波神经网络是一种基于小波变换理论构造的前馈神经网络,具有学习能力更强、收敛速度更快的特点[13],在模式判别与回归预测中有着广泛的应用[14-16],紧凑型小波神经网络(图1)中小波变换和神经网络内嵌式融合,把小波基函数作为隐含层节点的传递函数,通过误差反向传播来修正网络的权值和小波参数。
设天然气负荷信号f(x)∈L2(R),积分核函数为ψ(x),则日负荷的连续小波变换表示为
式中:a、b分别为尺度因子和伸缩因子,a≠0,b∈R;Wf(a,b)为f(x)的小波变换,即小波系数;ψa,b(x)为小波基函数,它具有自适应性,能够提取局部化信息。
小波基函数采用Morlet 小波基函数,该小波基函数是高斯包络下的单频率复正弦函数[17-18],其表达形式如下
其中,e为自然对数。
图1 紧凑型小波神经网络拓扑图Fig.1 Topological graph of compact wavelet neural network
2.3 残差修正网络
选用BP 神经网络建立残差网络对预测结果进行修正。利用已训练好的小波神经网络输入训练集数据进行拟合得到拟合序列Y,并与负荷真值进行对比得到残差序列D,如公式(3)所示
式中:D(i)为第i天的残差值;Y(i)为预测第i天的预测值;为第i天的负荷实际值。
通过对数据集观察,数据集中北京日负荷处于高负荷(高于1.2×109m3)天数为21天,其中平均温度低于-3 ℃占20天,占总高负荷日的95.6%。设置低于-3 ℃为“极端温度”临界点,将极端温度条件和日常温度条件下数据分组进行BP 网络训练,输入层为小波神经网络预测值,输出层为残差值。
2.4 建立小波神经网络预测网络
基于BP 网络残差修正的小波神经网络预测模型整体流程图如图2所示。
(1)训练过程。分为WNN 训练及BP 残差网络训练。其中WNN 训练中输入层为影响因素x1~x11,输出层为预测日负荷。BP 网络训练过程为:①重新将训练集输入WNN,计算第1天的天然气负荷y1,进行第2天预测时,将y1作为输入层相邻日负荷输入WNN 输入层进行迭代预测,以此类推得到训练集拟合序列,由拟合序列Y与实际负荷序列>得到残差序列;②根据预测日温度条件分组,分别进行BP 神经网络训练,得到训练完成的BP 残差修正网络。
图2 BP-WNN天然气短期负荷预测流程Fig.2 Forecasting flowchart of BP-WNN natural gas short-term load
(2)验证过程。验证过程为:①输入验证集,利用WNN 进行连续预测得到验证集初步预测值;②将初步预测值分组后输入BP 残差网络,得到预测残差值;③将预测残差值与初步预测值相加得到修正后日负荷;④将残差负荷修正值作为相邻日负荷与其余影响因素代入WNN中计算最终预测值。
3 实例分析
选取北京市冬季供暖季负荷数据作为预测研究对象(数据已做保密处理)。选取2017—2018年供暖季作为研究对象,12月、1月数据作为训练集,2月、3月数据为验证集。
3.1 历史数据拟合效果分析
图3 北京市天然气日负荷残差修正网络修正拟合结果对比Fig.3 Correction fitting result comparison of the network for daily load residual correction of natural gas in Beijing
使用残差修正的BP-WNN 及仅使用WNN 网络对训练集连续拟合结果进行修正,结果如图3所示。由图3可以看出,残差修正前后的负荷拟合值平均绝对误差(MAPE)分别为3.59%与1.90%,证明残差修正网络能够有效降低拟合误差。特别针对第1~10天处“日常温度”条件下的预测异常值的修正,以及对第54~58天中处“极端温度”条件下拟合值偏小具有较大的提升,可减少模型预测误差累积效应。
3.2 预测效果对比
(1)初步预测网络对比。利用BP 神经网络和WNN 网络相同的数据集进行预测对比(表2)可知,WNN 和BP 神经网络平均绝对误差分别为11.91%与5.21%,WNN 相比BP 神经网络具有更高的精度。分析其原因是由于WNN 算法采用Morlet小波函数作为神经元的激励函数,相比于BP 神经网络中采取的Sigmod 函数具有更高非线性程度,可形成更为复杂的椭球分割面平面,增强了神经网络非线性拟合能力,故选用WNN 作为初步预测网络。
(2)残差修正网络效果分析。添加残差修正网络对北京市2月中旬至3月中旬数据进行预测误差如表2所示,BP-WNN 的MAPE 下降至2.98%,相比于WNN进一步提升了模型整体精度。
表2 北京市天然气日负荷BP、WNN、BP-WNN计算结果对比Tab.2 Calculation result comparison of BP,WNN and BPWNN for natural gas in Beijing
BP神经网络、WNN、BP-WNN网络分日预测情况如图4所示,BP神经网络在预测过程中误差累积现象明显,预测值普遍低于实际值。对比由WNN 及BP-WNN 对北京第7~17天天然气日负荷预测过程中的误差情况(表3),自第9天起由于寒潮来临造成的日负荷陡升,训练集中极端温度下的数据占比小,利用神经网络对低温数据变化学习不充分,致使预测值偏小,WNN误差增大至10%以上,又由于误差累积存在致使连续多日的预测精度持续偏低。残差修正网络可对“极端温度”条件下预测值及误差值进行拟合修正(图3第54~58天修正),又由于相邻月负荷变化具有相似性,残差修正网络能够修正每日天然气负荷预测值(表3中第9~17天BP-WNN误差均低于WNN预测误差),从而减少误差累积效应,提升模型预测准确性。
图4 北京市分日天然气日负荷BP、WNN、BP-WNN预测结果Fig.4 Prediction results of BP,WNN and BP-WNN for natural gas daily load in Beijing
表3 北京市某第7~17日天然气日负荷预测值误差对比Tab.3 Predictive value error comparison of natural gas daily load in Beijing from 7th to 17th day
4 结论
(1)在考虑相邻日负荷的天然气负荷预测中,由于模型本身及气象预报误差将导致在连续迭代预测中会产生误差累积现象,使得误差整体精度降低。
(2)本文提出的残差修正后的预测模型(BPWNN)对未来一个月的天然气负荷预测有较好的预测精度(经残差修正后,北京市天然气日负荷预测的平均绝对误差由5.21%降低至2.98%),满足工业应用要求。
(3)训练集中极端温度下的数据占比小,利用神经网络对低温数据变化学习不充分,致使预测值偏小,又由于误差累积存在致使连续多日的预测精度偏低。残差修正网络通过修正“极端温度”条件下每日天然气负荷预测值,减少误差累积效应,从而提升模型预测准确性。