APP下载

分位数回归方法在盛夏日用电量预测中的应用

2018-06-06穆海振

电力需求侧管理 2018年3期
关键词:盛夏位数用电量

穆海振

(上海市气候中心,上海 200030)

受气象条件、节假日、大用户生产调度安排等因素影响,短期电力负荷经常会出现较大的波动,及时准确的预测对电力系统调度运行极为重要。已有较多关于短期电力负荷影响因素分析及预测模型研发方面的研究成果,常用方法包括均值回归、人工神经网络、支持向量机和灰色理论等[1—8],但这些模型往往只能够给出预测对象的确定性预测,对极端事件的预测能力比较欠缺,对预测结果的不确定性描述不够,在电力调度运行风险分析中的应用受到一定限制。

文献[9]、文献[10]提出的分位数回归方法为解决上述问题提供了新的思路,分位数回归可以较好地克服均值回归方法的不足,能够完整地考察响应变量的整个条件分布,在经济、金融和卫生等很多领域获得了广泛应用[11—17]。有学者探索了分位数回归方法在电力负荷预测方面的应用,文献[18]建立基于支持向量-分位数回归的短期负荷预测模型,文献[19]提出了基于神经网络分位数回归的概率密度预测方法,文献[20]构建了电力负荷特性指标面板预测模型,文献[21]应用分位数回归方法研究了电力负荷影响因素,但针对日用电量的分位数预测研究还较少。本文利用我国南方某市盛夏用电量和气象数据,建立了日用电量分位数预测模型,并与实际用电量数据进行对比检验,以期为改进和完善中短期电力负荷预测方法提供参考和借鉴。

1 数据和方法

1.1 日用电量和气象数据

本文所用电力资料为我国南方某市2010—2012年盛夏(7—8月)日用电量数据,气象资料为该市2010—2012年盛夏期间日最高气温、最低气温、相对湿度和降雨量观测数据。为剔除经济发展和双休日因素影响,按式(1)对用电量数据进行了均一化处理,得到了研究时段内逐日用电量系数序列,并将2010年和2011年逐日用电量系数用于分位数回归方程建模,2012年数据用于模型检验分析。

式中:ECi为历年逐日用电量系数;Ei为逐日用电量;EAVE为逐日用电量平均值,当计算日期为工作日(周末)时,EAVE为该年盛夏期间所有工作日(周末)用电量平均值。

1.2 分位数回归方法

考虑受k个因素X1,X2,…,Xk影响的随机变量Y,其分布函数为

则Y的第τ分位数为满足F()y≥τ的最小τ值,即

文献[9]、文献[10]提出了如下的线性分位数回归模型

式中:Qy(τ|x)为响应变量;Y为在解释变量X=[X1,X2,…,Xk]T给定条件下的条件τ分位数;τ为分位点,τ∈(0 ,1) ;β(τ)为回归系数向量,β(τ)=[β0(τ),β1(τ),β2(τ),…,βk(τ)]T。

式(4)中β()τ的求解,可转化为求解以下优化问题

式(5)表明,对回归系数的求解,实质是求解关于y与其拟合值之间加权残差最小的问题,等同于求解一个线性规划问题。

分位数回归是对以常用均值模型为基础的最小二乘法的延伸,它用选定的分位函数来估计整体模型。分位数回归法的特殊情况就是中位数回归(最小一乘回归),用对称权重解决残差最小化问题,而其他条件分位数回归则需要用非对称权重解决残差最小化问题。分位数回归模型优点主要体现在以下几个方面:首先,它对模型的随机扰动项不做分布的假定,回归模型的稳健性较好;其次,分位数回归由于是对所有分位数进行回归,对数据中出现的异常点具有耐干扰性,优于传统的基于最小二乘法的均值回归;第三,分位数回归能够给出预测对象的条件概率分布,能够更好实现对小概率事件的预测和分析,这些小概率事件往往在实际工作中产生的影响更大,受到的关注更多,使其在风险评价的应用价值较均值回归模型更高。

2 用电量系数序列分析及预报因子选择

图1给出了经过均一化处理的2010年和2011年用电量系数时序演变图,从图1可以看出,原始日用电量序列经过均一化处理后,序列的线性趋势系数仅为0.000 15,没有通过显著性检验,即剔除了经济和社会发展对用电量长期变化趋势的影响,消除了日用电量的线性变化趋势项。从图1中还可以看出,剔除经济社会发展和周末因素对用电量的影响后,由于盛夏期间日用电量的变化还受到气象条件的影响,序列还呈现出较为明显的波动变化特征,故选取了该市盛夏日最高气温、最低气温、相对湿度和降水量数据,分别和同期的日用电量系数进行相关分析,相关系数分别为0.87、0.77、-0.68和-0.27,均通过了α=0.05的显著性检验,其中日最高气温与用电量系数的相关性最好。

图1 用电系数时序演变图

为分析均一化处理剔除周末效应的效果,计算了2010—2011年日用电量系数的滞后相关系数,用电量系数的滞后相关系数如图2所示。从图2可以看出,序列的自相关系数随滞后日数的增加呈现明显降低的趋势,滞后1日的相关系数最大(0.85),在6—7 d处即周循环处也没有出现明显的回升,这说明均一化序列也剔除了用电量的周变化影响。

图2 用电量系数的滞后相关系数

通过以上分析可以看出,剔除节假日和经济发展因素的影响后,用电量系数变化主要受气象因素和前期用电量的影响。因此,在建立日用电量系数预报方程时,通过上述相关系数筛查,选取相关性最好的2个变量,即前1日用电量系数(ECi-1)和当日最高气温(TMAXi)作为预报因子,选取当日用电系数(ECi)作为预报变量,利用R语言中的分位数回归分析工具包,对分位点τ=0.1,0.2,…,0.9分别作分位数回归并建立分位数回归方程,其中τ=0.5时即为中位数回归方程。

3 预测模型分析及结果检验

3.1 回归方程分析

表1给出了利用2010—2011年数据建立的各分位点回归、均值回归方程系数及显著性检验情况,从表1中可以看出,在各个分位点气温和前1日用电量系数预报因子都通过了显著性检验,说明选取的变量较为合适,能够较好地解释预报对象的变化。T统计量值的变化可在一定程度上说明预报对象对预报因子的敏感程度,TMAX系数在高分位区的T统计值量要比低分位区统计量明显偏大,这说明用电量高值时段对气温变化敏感性较强;EC系数在高分位区和低分位区的T统计量差别不大,高值区主要位于中位数附近,这说明中值附近用电量对前1日用电量最为敏感。

3.2 预测结果检验

利用表1中的回归方程系数,计算给出了2012年盛夏用电量系数分位数回归预测、均值回归预测和实际情况对比(图3),从图3中可以看出,实际日用电量系数与中位数及均值回归模型预测结果具有较好的一致性,两者的变化趋势较为一致,绝对误差均为0.02,相关系数均达到了0.91,模型的预测效果较好。

表1 回归方程系数及检验

表2 2012年盛夏日用电系数预测一致率检验

图3 2012年盛夏用电系数分位数预测模型检验

与均值回归模型相比,分位数回归的优点在于可以利用各分位点预测结果给出未来用电量预测条件概率分布,即在给定日最高气温和前1日用电量情况下,可利用式(6)计算预测值的条件概率分布情况。

式中:Qτi为第i个分位点预测值;为在处的概率密度;F(Qτi)为预测值小于Qτi点的概率。以2012年7月2日为例,根据表1可计算出在各个分位点上的预测值,按照式(6)可计算得出参考点的概率密度近似值,日用电量系数回归概率密度分布图如图4所示。从其分布情况可以看出7月2日日用电量系数的概率密度分布情况,即用电量系数低于1.04或高于1.12的可能性较小。

为进一步评估分位数预测方程对预测结果不确定性的预测能力,统计分析了实际日用电量系数相对于预测分位数值的区间范围一致率,2012年盛夏日用电系数预测一致率检验如表2所示。结果表明,实际用电量系数在[0.4,0.6]分位预测值之间的比例为15%,此后随预测分位值区间加大,一致率逐渐增大,在[0.1,0.9]分位预测值之间的比例达到83%,达到了较高的一致率,这说明正确的运用分位数回归模型不仅能够给出单独分位上的预测值,也能够给出预测值的可能区间分布和信度,即对预测值的不确定性进行定量描述,这可为电力调度和风险管理提供更多的科学决策参考信息。

图4 2012年7月2日用电量系数回归概率密度分布图

在实际业务应用中,可参考已有中长期电力负荷研究成果[22],对本年度的预测期内用电量平均值进行预估,利用式(1)和当日用电量计算得出当日用电量系数,结合次日最高气温预报值,利用不同分位点的回归方程预测得到次日用电量系数分位值和条件概率分布情况,可为电力调度提供更多的科学决策支撑信息。

4 结论

本文利用南方某市盛夏用电量和气象资料,探索了分位数回归方法在日用电量预测中的应用,主要结论如下:

(1)通过比值法对原始日用电量序列进行均一化处理后,剔除了经济社会发展和周末效应的影响,新建日用电量系数序列的波动主要受前期用电量和气温等气象因素变化影响。

(2)将前1日用电量系数和当日最高气温作为预报因子建立的日用电量分位数预报方程较好地解释了日用电量的变化,其中当日用电量系数在高值时段时对最高气温较为敏感,在中值时段时对前1日用电量较为敏感。

(3)独立样本检验表明,分位数预测结果与实际情况较为一致,相较于常用的均值回归模型,分位数回归预测方法能够给出预测值的条件概率分布情况,在电力调度和风险管理中具有较好的应用前景。D

[1] 李凯,赵滨滨,曹占峰,等.基于回归分析和虚拟变量的短期用电量预测管理模型[J].电气应用,2017(2):59-65.

[2] 李婉华,陈宏,郭昆,等.基于随机森林算法的用电负荷预测研究[J].计算机工程与应用,2016(23):236-243.

[3] 吴毅良.基于SVM的大工业用电量预测[J].机电信息,2016(33):161-163.

[4] 黄磊,陈浩,衣乔木,等.基于k⁃means聚类和BP神经网络组合模型的用电负荷预测[J].电力与能源,2016(1):56-60.

[5] 周国亮,王桂兰,葛佳,等.基于云计算的用户侧短期用电负荷预测技术[J].电力信息化,2012(3):111-114.

[6] 沈百新.利用专家系统预测地区用电负荷[J].电力需求侧管理,2005(2):49-50.

[7] 钱志.基于改进型SVR的电网短期负荷预测[J].中国电力,2016,49(8):54-58.

[8] 唐学用,万会江,叶航超,等.贵州统调电网典型日负荷特性分析与预测[J].中国电力,2015,48(9):24-30.

[9] Koenker R W,Bassett J G.Regression quantiles[J].Econometrica,1978,46(1):33-50.

[10] Koenker R,Machado A F.Goodness of fit and related inference processes for quantile regression[ J].JASA,1999(94):1 296-1 310.

[11] 季莘,陈峰.百分位数回归及其应用[J].中国卫生统计,1998(6):11-13.

[12] 荀鹏程,顾坚,顾海雁,等.中位数回归模型及自回归模型在北京市SARS发病预测中的应用[J].中国卫生统计,2004(4):28-30.

[13] 许启发,徐金菊,蒋翠侠.基于神经网络分位数回归的多期CVaR风险测度[J].数理统计与管理,2017,36(4):715-730.

[14] 于潇,孙悦.城镇与农村流动人口的收入差异--基于2015年全国流动人口动态监测数据的分位数回归分析[J].人口研究,2017(1):84-97.

[15] 陈建宝,丁军军.分位数回归技术综述[J].统计与信息论坛,2008(3):89-96.

[16] 陈娟,林龙,叶阿忠.基于分位数回归的中国居民消费研究[J].数量经济技术经济研究,2008(2):16-27.

[17] 李育安.分位数回归及应用简介[J].统计与信息论坛,2006(3):35-38,44.

[18] 牟宏,王春义,顾洁,等.基于支持向量-分位数回归的短期负荷预测及风险分析[J].电力科学与技术学报,2016(3):51-56.

[19] 何耀耀,许启发,杨善林,等.基于RBF神经网络分位数回归的电力负荷概率密度预测方法[J].中国电机工程学报,2013(1):93-98.

[20] 薛承荣,顾洁,孙金华,等.基于分位数回归的电力负荷预测影响因素研究及应用[J].电气应用,2015(12):134-138.

[21] 秦玥,顾洁,杨宗麟.基于分位数回归的电力负荷特性预测面板数据模型[J].电力需求侧管理,2014(3):7-11.

[22] 穆海振,孙兰东,侯依玲.上海市全社会月用电量预测模型[J].中国电力,2016(6):146-150.

猜你喜欢

盛夏位数用电量
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
五次完全幂的少位数三进制展开
国家能源局:3月份全社会用电量同比下降4.2%
盛夏的果实
盛夏,你要哪一种白?
1~10月全社会用电量累计56552亿千瓦时同比增长8.7%
盛夏正当时 早秋已入荷
遥感卫星CCD相机量化位数的选择
“判断整数的位数”的算法分析