APP下载

计及经济因素的混合模型电量预测研究

2021-03-05徐久益李自明姚剑峰杨晓雷屠一艳

四川电力技术 2021年1期
关键词:用电量电量预测

徐久益,李自明,姚剑峰,杨晓雷,屠一艳,李 杰

(1.国网浙江桐乡市供电有限公司,浙江 桐乡 314500;2.国网嘉兴供电公司,浙江 嘉兴 314000)

0 引 言

电力系统规划设计和运行管理依赖用电量数据。同时,用电量又是经济变化的“风向标”。因此,月度用电量的准确预测既是实现电网安全、经济运行的基础,也对把握宏观经济发展趋势起到至关重要的作用[1-2]。

月度用电量预测是电力需求侧管理重要的市场预测技术手段,精确的用电量预测对于平衡区域电力电量、精准的电网投资、电力现货市场交易、有效实施电力需求侧管理和节能降耗战略等[2]都有着十分重要的意义。

传统的电量预测方法如回归分析法、时间序列预测法、灰色预测、神经网络等预测方法[3-6],其预测精度已经不能满足当前电网发展需求。目前,电量预测技术和理论不断涌现,一些学者对月度用电量的预测方法进行研究,在传统预测方法上面不断改进,也取得新的成果。文献[7]在传统时间序列预测模型基础上,提出了考虑经济因素时滞效应的月度电量预测方法。文献[8]从影响月度用电量的因素出发,利用计量经济学中的协整检验以及格兰杰因果检验来分析经济因素与用电量的关系,提出一种基于协整-格兰杰因果检验和季节分解的月电量预测方法。近年来,中国的经济发展进入转型期,各地区月度用电量的变化也呈现差异性和多样性,因此,这些预测方法的运用也存在一定的局限性。基于此,通过对区域历史数据的研究分析,挖掘其发展的规律和特点,并结合两种算法优势建立电量预测模型,创新性地提出了一种计及经济因素的混合模型电量预测新方法,为地区月度用电量预测提供了一种新选择。

1 数据分析与挖掘

电量预测的核心是根据区域用电量的历史数据以及对用电量产生影响的经济、气候等因素的历史数据,建立数学模型来表述用电量发展变化规律。因此,在建立数学模型之前,首先需要对历史数据进行分析和处理,研究和挖掘出历史数据发展的内在规律性[9]。

1.1 数据分析

所用数据来源于中国中西部某区域电网公司,如表1和表2所示。

1.2 数据预处理

通过分析半年度电量与半年度经济总量的关系可以发现,电量以及相关4类经济数据具有较强的时序特征,但2015年和2016年上半年的电量与经济总量的增长率存在明显的不一致性,其余年份对应的电量与经济总量增长率基本保持一致。

针对以上非一致性问题,将对原始数据进行预处理,主要是数据清洗,即对原始数据中的明显错误值、缺失值、异常值、可疑数据,选择合适的方法进行“清理”,使“脏”数据变为“干净”数据,也包括对重复记录进行删除。这里通过比较多种方法进行数据预处理,鉴于篇幅,仅介绍最终选择的箱形图检测方法,箱形图原理如图1所示,即对于一组数据,计算中位数、上下四分位数和上下限,若数值超过上下限则为异常值。下、中、上四分位数的位置计算方法为

f(Qi)=i(n+1)/4

(1)

图1 箱形图检测法的基本原理

式中,n=12,表示数据个数。经电量数据检测发现,存在异常的月份有2014年7月,2015年2月、8月,2016年2月、8月和12月,共6个月份。

检测出异常值后,需要通过分箱法对异常值进行平滑处理,具体实现方法:若存在纵向两个数据则取纵向两个数据的均值a,再取横向两个数据的均值b,再取a、b的均值作为异常点的替代值。最终将上述存在异常的6个月用电量数据依次替换为 5082、5021、5821、5518、6194、5822 GWh。

表1 中西部某区域电网公司近年各月电量情况 单位:GWh

表2 中西部某区域相关经济数据

2 建立月度售电量预测新方法

2.1 模型的建立

建立合适的电量预测模型,是电量预测核心,针对本项目原始数据分析,2014—2018年电量曲线波动不大、趋势平稳,且原始样本数据量小。而现代预测方法如神经网络、时间序列[10]等需要大量数据进行训练才能得到比较准确的模型,对于本项目数据量较小的情况下,预测效果不好。

研究采用传统的回归分析法和指数平滑法[11]相结合来建立电量值的预测模型,优点是这两种预测方法比较成熟,模型参数设置较少,几乎不需要人为调参,且在数据量较小的情况下仍能得到比较准确的结果。本项目所提模型和算法的整体流程如图2所示。

图2 月用电量预测模型流程

1)区域用电量曲线具有一定的周期性、时序性,一般以年为单位,每年电量曲线变化趋势相同。选取同样次数的多项式分别拟合2014—2017年的用电量曲线,多项式的系数采用最小二乘法[12]原则确定,即误差平方和最小,得到用电量与时间的关系式。多项式次数的选择采用自动寻优,选择效果最好的值。自动寻优找出最优拟合次数9次。

2)指数平滑法是一种数据预测方法,利用预测数据的变化在短期内保持历史数据的惯性特征,当前的数据与历史数据有关,且离现在时刻越近,对当前数据影响越大。本模型采用线性指数平滑模型:

Ft+m=at+btm

(2)

式中:

(3)

将步骤1中得到的2014—2017年的多项式函数的系数运用指数平滑法外推,得到2018年用电量与月份的关系:

f(x)=0.000 081 38x9-0.004 741 82x8+

0.116 814 56x7-1.584 389 12x6+

12.920 345 13x5- 65.031 307 13x4+

199.920 938 01x3-358.480 374 09x2+

337.644 679 21x-62.318 446 43

(4)

然后便可计算出2018年1—12月电量预测值,这是一个初始预测值,后续需要做修正。

3)采用多元线性回归法[13],将用电量与其影响因素(即4类经济因素)进行拟合。用多元线性表达式来拟合半年电量和与这些经济数据的关系,表达式为

h(x1,x2,x3,x4)=ax1+bx2+cx3+dx4

(5)

式中:h(x1,x2,x3,x4)为半年电量和;x1、x2、x3、x4分别为规模以上工业增加值、固定资产投资、社会消费品零售总额和出口总值。2018年上下半年的经济数据与用电总量关系拟合表达式为

f(x)= 0.043 239 8x1+ 0.014 314 24x2+

0.072 597 81x3-0.326 030 59x4-46.704 427 381

(6)

4)作为一个多输入系统而言,考虑越多输入量对系统的输出预测越准确,但是为了简化电量预测模型,需要找到影响程度较大的因素,这就需要进行相关性分析。

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析[14]。分析不同元素的相关性需要计算它们之间的相关系数,其定义为

(7)

式中:r为样本相关系数;n为样本总数;x、y为样本观测值,在本项目中x为电量,y为经济性因素。

需要计算各经济指标因素与电网电量的相关系数,找出对电网电量的影响大且影响较为稳定的因素,相关性结果如表3所示。

表3 4类经济因素与电量的相关性

从表3可以看出,4类经济数据与电网电量的相关度均较高,相关系数均大于0.95,其中社会消费品零售总额相关度最高,因此,将4类经济数据作为电量预测建模研究的关键因素。

5)用半年电量和修正初始预测值,如果经济数据得到的2018年上半年电量和与步骤2中得到的初始预测数据的2018年上半年电量和相比,更接近实际数据,那么经济数据得到的2018年下半年电量和也会更接近,故用经济数据得到的电量和对步骤2得到的初始预测数据做修正。如果经济数据得到的2018年上半年电量和更不接近于实际数据,则不对初始电量预测数据进行修正。

修正的具体方法为整体倍数法:

β=(S1+S2)/2

(8)

式中:S1为经济数据得到的2018年下半年电量和;S2为步骤2中得到的2018年下半年电量和,对于2018年8—12月的初始预测数据都乘以β,得到本模型最终的预测结果。

3 算例分析

3.1 模型的验证

为了验证所提方法的实际运用效果,对给定的中国中西部某区域电网公司2018年1—7月的月用电量进行了预测,与目前使用最广泛的BPNN预测、灰色预测进行比对,并计算平均绝对百分误差(mean absolute percentage error,MAPE)。三者预测结果见表4。

表4 不同预测方法预测结果对比

由表4可以看出,所提方法预测平均绝对百分误差最小,为0.83%,由此可见,所提方法预测精度得到了有效提高,且具有更高的稳定性。

所建模型对未知的2018年8—12月的电量进行预测,并用经济数据对预测结果进行修正,结果如表5所示。

表5 2018年8—12月的电量预测结果修正 单位:GWh

3.2 模型的应用

3.2.1 力助电力部门辅助决策

在已知浙江嘉兴地区月用电量数据与4类经济数据的前提下,将所建模型运用于与中西部区域电量波动、气候条件以及经济结构完全不同的嘉兴地区,对预测精度及通用性进行验证。表6为浙江嘉兴地区2018年8—12月份月用电量预测值。

表6 嘉兴2018年8—12月月用电量预测值 单位:GWh

经计算,所建模型预测的MAPE为2.31%,证明其具有较高的预测精度且通用性强,可适用于不同地区的电量预测。

通过月用电量预测,进一步勾勒出嘉兴地区电量预测曲线,如图3所示,可更加精准地对地区用电量特性进行分析,为电网公司或电力部门提供辅助决策[15],包括:为发展策划部门提供规划、决策、投资的依据;为财务部门提供电力现货交易市场的清晰判断;为营销部门提供增供扩销形势的判断。

图3 嘉兴地区月用电量预测曲线

3.2.2 提升主动服务能力

所建模型运用于某水泥厂大用户月用电量预测,可以了解用户电力消耗发展趋势,预测曲线如图4所示。

图4 大用户月用电量预测曲线

通过大用户电量预测曲线分析,供电公司可以为企业客户提升主动服务能力[16],包括提前感知客户的容量变化需求、有的放矢地为客户提供增容等业务支持、辅助企业确定节能方法、为用户提供有竞争力的差异化服务等用途。

4 结 语

将回归分析法和指数平滑法这两种预测方法相结合,建立电量预测模型,模型中所有参数都采用算法自动寻优,减少了人工干预带来的误差。通过对中西部区域实际历史数据精细和深入的挖掘,先用历史电量数据初步预测未来几个月电量,再用与电量相关性很高的经济因素修正电量初步预测值,新方法实际预测精度得到了有效提高。

算例分析的结果表明,预测MAPE为0.83%,而模型在客观条件完全不同的嘉兴地区进行预测,MAPE也仅为2.31%,证明模型具有通用性。所提预测方法为地区电量预测工作提供了一种可供选择的新思路,同时,也为供电公司加强电力需求预测和供电负荷管理等工作提供了有益的方法支撑和必要的决策手段。

猜你喜欢

用电量电量预测
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
无可预测
储存聊天记录用掉两个半三峡水电站电量
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
物联网智能燃气表电量自补给装置
基于功率的电量智能修复算法研究
国家能源局:3月份全社会用电量同比下降4.2%