基于深度学习分位数回归的电力负荷区间预测方法
2022-10-25余登武刘敏蒲凡诺秦序胜秦先鑫谢若昕
余登武,刘敏,蒲凡诺,秦序胜,秦先鑫,谢若昕
(1.国网重庆市电力公司万州供电分公司,重庆 404000;2.贵州大学 电气工程学院,贵州 贵阳 550025)
短期负荷预测对电力系统的安全经济运行具有重要意义。常规的电力负荷预测能得到的是确定的负荷预测序列,难以满足电力市场中市场成员全面分析市场风险的需要。如果能够得到预测结果的区间分布,就可以帮助企业做出更好的管理决策,发电公司也可以更好地在市场中占据主动地位[1-4]。
按照预测结果的形式,负荷预测可以划分为确定性负荷预测、概率性负荷预测、负荷区间预测。确定性负荷预测的预测结果是任意时刻的确定性具体值,简单直观,是调度系统中常用的一种预测模式[5-7]。概率性负荷预测的预测结果是负荷取不同值的分布概率,现有的大多数概率预测方法都是假设预测结果服从一定的概率分布,利用模型预测数据,得到预测数据的概率分布函数参数,从而完成概率负荷预测。这种方法的前提是假定其分布服从某种特性,具有主观性,而且计算分布参数时需要大量预测模型,训练成本比较高[8-13]。负荷区间预测区别于前面2种预测方法,给出同一时刻的预测结果可能出现的区间,在预测结果准确性和可靠性上高于确定性负荷预测,在分析复杂性上低于概率性负荷预测。随着分布式电源、多元复合和储能的快速发展,电力平衡能力不确定性变大,市场成员对负荷预测精度的要求也在不断提高,确定性负荷预测已不能满足市场交易分析和计量的需要,尤其是对风光发电的预测。综合考虑使用的便捷性和准确性,是研究负荷区间预测的重要方向[14]。
目前,许多专家从理论上对负荷区间预测做了大量的工作。文献[15]提出一种利用高斯核密度估计将点负荷预测转化为负荷区间预测的方法。文献[16]首先使用核密度估计方法将单个分位数预测转化为概率密度曲线,然后建立优化问题以获得不同概率密度预测的加权组合,提出基于多分位数预测的日负荷区间密度预测方法。文献[17]提出了大规模用户场景下用电量模式的层次聚类方法和用户聚类识别模型,基于用户集群识别结果,提出一种条件残差模拟负荷概率预测模型,对用户进行负荷分层概率预测,实现对用户的精细功耗管理。文献[18]利用卷积神经网络和门控循环神经网络提取母线负荷的高阶特征,然后建立了分位数回归概率区间预测模型。文献[19]利用历史负荷数据建立候选特征集,然后通过k均值特征提取方法对候选特征集进行分类,提出基于k均值特征提取和改进高斯过程回归的短期负荷概率区间预测方法。
负荷区间预测是先确定区间预测的中心结果,在此结果上设置一定的区间宽度,从而获得区间预测。如何设置区间宽度是负荷区间预测的难点:区间设置得越窄,对调度运行方式的计划安排越具有指导性;而区间宽度越宽,负荷预测值落在区间内的概率性越高。为了解决上述问题,研究并提出一种基于深度学习分位数回归的电力负荷区间预测方法,可以并行生成预测负荷的多个分位数预测结果,给出预测结果的上下限,具有较好的可行性和有效性。
1 负荷特性分析
某地每日0时负荷的年负荷曲线如图1所示(图中P为负荷),从图中可以看出:夏季负荷比较高,峰值出现在8月左右迎峰度夏期间,是电网每年的大考;在春节期间和国庆期间出现明显低谷。
图1 某地年负荷(每日0时负荷)曲线
电力负荷是一种时间序列数据。原始负荷等于负荷趋势(以下简称“趋势”)加周期性负荷变化(以下简称“周期性变化”)加噪声负荷(以下简称“噪声”)。利用相邻数据差分方法可以得到周期性变化、趋势和噪声,具体做法如下:如果在1星期的水平上存在周期性成分,那么周期性变化等于当前时刻负荷减去上星期同日同时负荷值,趋势加噪声等于原始负荷减去周期性变化。以某地区7月份2个星期的负荷为例,通过移动相邻差分得到负荷P的周期性变化、趋势和噪声,如图2所示,其中负荷P采样点的采样频率为每15 min 1次。从图2中可以发现该地区1星期内有6日负荷数值都差不多,另外1日的负荷值明显低于其他日,在短时间内周期性数据不会发生明显变化。
图2 负荷曲线分解
天气因素是影响短期负荷预测的主要因素,在一定条件下,电力负荷会急剧增加[20-21]。计算某地负荷与天气数据的皮尔逊相关系数,得到最高温度、最低温度、平均温度、相对湿度、降雨量与电力负荷的皮尔逊相关系数分别为0.425、0.456、0.456、0.083、0.052,可以看出温度的影响最为显著。当天气变得非常寒冷或炎热时,大量的取暖负荷和制冷负荷投入运行。温度对负荷也有累积效应,对于某日负荷,连续3日高温与突发高温之间可能存在显著差异。天气影响因素具有“隐式”:一部分隐藏于历史负荷数据当中,当天气没有剧烈变化情况下,仅用负荷数据就能取得良好的预测效果;另一部分是无法从历史负荷数据表现出来的,需考虑天气因素的影响。
综上所述,负荷与季节、节假日(春节、国庆)、工作日、气温有着明显联系,在进行短期负荷预测时,应考虑上述因素的影响。
2 负荷区间预测思路
常规区间预测方法是计算各个确定性负荷预测模型的预测值的概率分布函数,计算分布函数的标准差,然后在确定性负荷上加减标准差即为区间预测的上下限,但这种方法具有一定主观性,一开始就已经设定其分布满足某种分布函数;因此,为了能更客观地反映出历史数据的分布规律,本研究采用统计的方法对历史负荷预测误差进行归类统计,从侧面反映随机事件的规律性。
通过比较历史负荷预测值和相应的实际值,可得出负荷预测误差。通过对负荷值的长期统计分析,可发现预测误差具有规律性,且其规律性会随着地区和时间段的变化而变化。
a)以工业负荷为主的地区:白天为正常工作时间,负荷曲线有明显的规律可循,预测误差相对较小;在非正常工作时间,由于赶工期等其他原因需要加班,这种紧急情况使得预测负荷更加困难,误差可能较大。
b)以居民负荷为主的地区:夜间高峰时段的误差可能较大,难以准确预测;早晨的低谷时间是休息时间,较容易预测,一般误差变化相对较小。
c)天气的突变往往会导致负荷预测的困难(尤其是在白天),预测误差会相应增加。负荷预测误差规律从另一个侧面反映了该地区相应季节性负荷波动的剧烈情况,对实际工作具有很好的指导意义。
d)通过对实际预测误差的大数据分析,发现预测误差分布具有明显的峰值特征。预测误差的峰值状态意味着:在大多数情况下,短期负荷预测的误差总是相对较小的;一些极端事件(如极端天气、重大经济事件等)的发生,会对预测的准确性产生重大影响,并大大提升预测误差。实际情况也是如此。具有峰值特征的分布函数能更好地描述预测误差的分布特征。
负荷区间预测是常规确定性负荷预测的延伸。在验证预测误差的概率分布具有实用价值后,可以利用误差统计规律分析负荷整体确定性预测值中各负荷值的可能分布,从而给出未来负荷可能值的区间结果。它反映了预测工作中隐含的风险因素,为今后研究企业运营中遇到的风险问题和可靠性提供了前提和基础。
为实现负荷区间预测,需估算负荷变化范围,并了解该范围的可靠性,包括负荷值的真实值。采用区间估计代替点估计可以更好地反映负荷可能波动的区域。