APP下载

基于时间序列的台区配电负荷峰值预测

2018-08-07

电力科学与工程 2018年7期
关键词:误差率台区配电

刘 升

(国网福建省电力有限公司,福州 350000)

0 引言

随着我国社会经济发展和人口增长,各地区用电量不断增长,屡创新高,这给基础台区配变供电带来巨大压力,超载及严重超载现象时有发生,严重影响台区正常的生产生活。为了满足不断增长的用电需求,各省相继提出台区配变扩容的规划,而台区配电负荷的预测是扩容规划的重要前期工作,准确的台区负荷预测尤其是对负荷日峰值的预测能为扩容规划的安全性与稳定性提供有力保障[1~3]。

与区域电网(省网,市县网)相比,影响具体台区配电负荷的因素更难以分类和量化,可获得的统计数据种类少、质量差,这些因素使得台区配变负荷的预测成为一大难题。关于配电负荷预测国内外许多学者对配电负荷预测进行了大量的研究,取得了丰富的研究成果。回归分析模型[4]、时间序列模型[5]、灰色预测模型[6]、神经网络模型[7]等在配电负荷的预测上都有着广泛应用。

根据所研究的时间周期长度的不同,配电负荷的预测可以划分为:以年为周期的长周期;以月或季为周期的中周期;以日为周期的短周期;以小时为周期的超短周期等不同类型。文献[8]对不同周期的配电负荷预测方法进行了比较与研究,认为长周期的年度负荷预测适合使用回归类模型,中周期的月度负荷预测适合使用各类基于相关性的预测模型,而在以日为周期的短期负荷预测中适合使用时间序列预测模型。文献[9]基于聚类算法与支持向量机(SVM)对电力系统短期负荷的预测进行了研究,研究结果显示,以日为单位的电力负荷数据一般呈现出周期性特征。在中长期电力负荷的预测,文献[10]将不同的预测模型进行组合,通过二次规划求解的方法得到最优的预测模型。文献[11] 基于时间分析模型对某居民小区的用电负荷小时数据进行了建模与预测,并验证了模型的有效性,因此,使用时间序列法分析低频负荷序列具有很高的实用性和可靠性。

然而,现阶段负荷的对象大多集中在区域电网(省网,市县网)领域,细化到具体台区的相关研究较少。相较于区域电网(省网,市县网),具体台区配电负荷的相关数据呈现出区域性明显、数据种类单一、数据非结构化、影响因素难以量化等特点。分区域电网的研究方法无法完全适用于台区配电负荷的研究,同时过于复杂的模型也限制了其在现实应用中的推广。本文选择以日为周期的负荷峰值作为研究对象,研究日负荷峰值时间序列的短期波动特征。在模型的选择上,因为日负荷峰值数据存在明显的周期性特征,不适用于传统的回归分析,故本文选择使用时间序列模型进行研究。相比其它预测方法,时间序列方法基于台区负荷的历史数据,能够反映不同时期负荷数据之间的相关关系,模型简洁,无需引入其他变量,克服了台区负荷影响因素繁杂,差异性大的困难,在实际推广应用中有较大的优势。

本文主要做了以下工作(1)对原始数据甄别与修复(2)建立时间序列模型(3)使用模型进行了实证分析,并做出了预测。

1 数据的甄别与修复

本文通过电力系统的采集终端获得台区配电负荷的日数据,提取每日配电负荷数据的最大值,构成负荷日峰值时间序列。在实际采样过程中,由于外界环境变化、突发情况干扰和采集终端不稳定,会导致时间序列中的部分数据出现缺失或失真等异常。异常数据会直接影响模型稳定性和预测精度,因此在建立模型之前,需要对失真的数据进行甄别并剔除失真数据值,在此之后使用插值法对缺失数据进行合理的修复。

设负荷日峰值数据的时间序列为:

Yt=(Y1,Y2,…,Yn)

(1)

1.1 数据甄别

(2)

(2)定义数据点偏离率ρi为t期数据偏离t期基准数据绝对值的比率:

(3)

(3)失真数据的甄别与剔除。

根据经验数据取阀值e=0.5,当ρt

1.2 数据修复

使用线性插值法对缺失数据进行修复。首先选取数据不为空的点作为样本的起始点,解决起始点缺失数据从而导致无法修复的问题。对于位于时间序列中间的缺失数据,根据缺失数据是否相邻分为单一缺失与多个缺失两种情况:

(1)单一缺失:如第i点为缺失数据点,将其相邻一期数据点值的平均值作为修复值:

(4)

(2)多个缺失:设相邻缺失点数量为k个,起始点为i,则缺失时间序列如式(5)所示:

Yi,Yi+1,…,Yi+k-1

(5)

Yi+j(0≤j≤k-1)为其中任一缺失点,取

r=max(j,k-j)

(6)

将缺失值修复为:

(7)

2 时间序列方法建立预测模型

台区配电负荷日峰值属于典型的时间序列数据。通过构建时间序列模型能够以量化的方式刻画出负荷日峰值时间序列之间的相关关系、外部冲击的传播方式、时间序列均值等特征,并且能够根据模型对下一期负荷日峰值数据作出预测。

为了量化负荷日峰值数据的时间序列特征,本文建立了时间序列模型,其一般表达式如式(8)所示。模型由自回归与移动平均两个部分构成。在自回归部分,本期的随机变量将受到之前期数随机变量的影响,体现出不同期数随机变量之间的关联性,是时间序列内在规律性的体现。在移动平均部分,本期的误差项将受到之前期数误差项的影响,体现出偶然因素对随机变量的影响以及该影响的持续性与衰减速度。

时间序列模型的一般表达式为:

φp(B)(1-B)d(Yt-u)=φq(B)εt

(8)

式中:B为向后位移算子,BYt=Yt-1;p为自回归参数个数;d为差分阶数;q为移动平均参数个数;u为Yt的期望。

φp(B)=1-φ1B-,…,-φpBp

φq(B)=1-φ1B-,…,-φqBq

使用最小二乘法对时间序列模型进行参数估计。该方法通过使误差平方和

(9)

达到最小,估计p个自回归参数φ1,φ2,…,φp和q个移动平均参数φ1,φ2,…,φq。

与标准的时间序列模型——自回归移动平均模型(ARMA)相比,通过时间序列模型的一般表达式来构建模型的灵活性更高,模型的解释能力更强。使用时间序列模型的一般表达式能够准确地刻画负荷日峰值数据的周期性特征。传统的自回归移动平均模型在处理高阶自回归与移动平均时,模型的复杂度会大幅上升,这将大大增加模型的计算量并降低模型的可靠性,模型结果也难以解释,而采用时间序列模型的一般表达式构建模型能够针对数据的周期性选择合适的滞后阶数,以剔除无关变量,简化模型,提高模型稳定性与预测精度。

2.1 周期性因素的确定

大量研究显示,负荷日峰值数据存在明显的周期性特征。故在构建模型的自回归部分时,可以根据对先验知识与自相关分析的结果进行综合考量来确定纳入模型的自回归阶数,这有助于更完整地提取样本特征并简化模型,具体步骤如下:

针对日峰值数据Yt=(Y1,Y2,…,Yn)进行自相关分析,得到自相关函数图像,根据图像确定自相关函数峰值间的阶数,设为a,表明Yt与Yt-a具有相关性,将Yt-a纳入模型的自回归部分。其后,考虑到典型的电力数据呈现出周、月、年3个不同时距的周期性特征,本文将向后位移算子为7、30、365的随机变量纳入模型的自回归部分,最后建立了如式(10)所示的自回归方程:

φiBi)(Yt-u)=ωt

(10)

2.2 渐变性因素的确定

在(10)式中,模型的移动平均部分由ωt表示,可以被理解为剔除周期性影响后的数据。为了确定移动平均部分的滞后阶数,本文通过自相关分析得到ωt的自相关函数,并根据经验数据将相关系数的临界值设定0.1,取显著大于0.1的作为滞后阶数,设为b,并建立时间序列模型的移动平均部分,如式(11)所示:

ωt=φb(B)εt

(11)

该方程体现了日负荷峰值的渐变性特征。

综上,将式(11)代入式(10)即能构建时间序列模型的一般表达式:

φiBi)(Yt-u)=φb(B)εt

(12)

根据最小二乘法,使误差

(13)

最小,得到参数φa,φ7,φ30,φ365,φ1,φ2,…,φb的估计值,建立时间序列预测模型。

3 实验分析

选择某省某台区(额定容量为250 kVA)2010年9月29日至2012年7月31日的配电负荷作为实验数据,首先提取日负荷数据的峰值构成时间序列,然后甄别失真的数据并剔除,再修复序列中的缺失值,最后对缺失值进行修复,修复后的负荷日峰值曲线如图1所示。图1清晰地展现出负荷日峰值时间序列存在明显的周期性特征。

图1 甄别修复后负荷日峰值曲线

对修复后负荷日峰值的数据进行自相关分析可知:相邻年的同一日及相邻星期的同一日表现出显著正相关,相邻月的同一日无明显相关性。故本文将滞后阶数为7与365的随机变量纳入模型的自相关部分。对剔除周期性因素影响的数据进行自相关分析可知,当滞后阶数小于等于4时,其相关系数显著大于0.1,故本文将渐变性因素确定为4阶。结合随机变量的自相关部分与移动平均部分即能得到最终的时间序列模型,如式(14)所示:

(1-φ7B7-φ365B365)(Yt-u)=φ4(B)εt

(14)

根据最小二乘法对模型进行参数估计,得到参数的估计值为:

φ7=0.574 8,

φ365=0.408,

φ1=1.576 4,

φ2=1.614 6,

φ3=1.140 1,

φ4=0.735 5,

u=81.132 35。

其中φ7=0.574 8、φ365=0.408分别表示台区日负荷峰值会受到自身滞后7期与滞后365期的影响,方向为正,存在明显的周期性特征。φ7>φ365表示当期日负荷峰值受到相邻星期同一日的影响大于相邻年同一日的影响。φ1=1.576、φ2=1.614 6、φ3=1.140 1、φ4=0.735 5分别表示了滞后阶数为1~4阶的误差项对当期误差项的影响,可见随着滞后阶数的增加,与当期误差项的相关关系大致呈现出衰减的趋势。

根据预测结果,可以计算出反映模型预测准确性的误差率ηt:

(15)

表1为误差率的误差率分布。

表1 误差率分布

图2 预测效果与原始数据对比

图2可以看出预测曲线准确地刻画了原始曲线长期上升趋势,在长期预测中体现出较好的稳定性。整体上看,预测曲线贴近原始曲线,模型的拟合度较高。图3为频数直方图,由表1和图3可知87.6%的误差率分布在0.2以下,仅有1.6%的误差率落在0.4以上,模型预测精度高。图4为误差率散点图,由样本误差率构成的时间序列。在大部分时间内,样本的误差率小于0.2的临界值,误差率超过临界值的样本点呈现出聚集性特征,对照图2可知,当原始曲线出现连续地大幅度异常波动时,预测的准确率将会下降。

图3 误差率频数直方图

图4 误差率散点图

综上所述,本文所建立的时间序列负荷预测模型的预测精度高,模型整体预测效果良好。

4 结论

本文对台区配电负荷的预测问题进行了初步探索。针对台区配电负荷自身特性,选择时间序列方法建立模型对台区负荷日峰值时间序列进行预测,模型由自相关部分与移动平均部分构成,通过综合先验知识和自相关的分析结果,设定了负荷峰值的滞后项来描述数据的周期性特征。实例结果显示:台区日负荷峰值存在明显的周期性特征,周期长度分为7日的短周期与365日的长周期,这与实际的台区用户用电习惯和季节变化的周期性特征相符。仅使用配电负荷数据是该模型的一大优点,配电负荷数据的可获得性好,数据质量高,大幅降低了实际推广的难度,有利于进一步推广,提高了模型的可比性。

猜你喜欢

误差率台区配电
生化检验全程中质量控制管理方式及应用意义
降低评吸人员单料烟感官评分误差率探讨
配电自动化的应用及其发展趋势
10kV及以下配电线路运行维护
配电自动化技术在配电系统中的应用分析
降低台区实时线损整治工作方法
无线传感器网络定位算法在环境监测中的应用研究
电工仪表测量中容易忽略的几个问题
三合一集中器作为台区线损考核表计的探讨
多功能低压台区识别设备的研制