APP下载

考虑温度累积效应下基于LS-SVMR电力负荷预测研究

2023-09-05缪智伟

关键词:向量效应负荷

缪智伟,方 睿

(汕头大学数学系,广东 汕头 515063)

0 引 言

较高电力系统负荷最大值的预测准确率有助于帮助电力部门进行电力调度与电力的规划[1-4].当电力负荷最大值预测偏高时,会导致调度过多的电力资源,出现电力不合理分配的情况,造成电力资源的浪费;当电力负荷最大值预测偏低时,电网公司不能提供充足的电力资源,严重的话,甚至可能会出现地区大面积停电的现象.因此,电力规划及调度部门应具备精确预测电力负荷最大值的技术,从而制定调度智能化、分配合理化、节省电力资源、可持续发展的科学决策和方案.

传统电负荷最大值预测模型是根据数学方程组的方式建立电负荷预测模型,其模型训练的速度快,但是缺乏一定模型泛化能力和自主迁移能力[5-8].面对96 个时点电负荷数据时序性和非线性的特性,难以建立一个预测精度高、训练速度快的电负荷预测数学模型[9-12].为解决该问题,张永伟提出了基于KPCA-SVM 模型的电力负荷最大值短期预测方法[13],该方法提高了预测电力负荷最大值的精度,但预测速度还需改进.此外,赵志强提出了一种基于小波分解和ID3 算法的短期日负荷最大值预测方法[14],该方法收敛速度慢,模型训练时间较长,收敛速度慢等缺陷会降低或者影响电负荷预测模型的精确度.人工神经网络(ANN)在许多预测问题上运用最为广泛[7],Beccali[15]构建了一种无监督与有监督相结合的神经网络模型,成功预测了某地区电力需求.Bashir[16]在电负荷预测模型训练参数的阶段,引入鸟群算法来求解最优参数,大大优化了负荷预测的泛化能力和预测能力.

与神经网络算法采用经验风险最小化原则不同,支持向量机(SVM)采用的是结构风险最小化原则,弥补了神经网络的缺陷,依据最小二乘支持向量机(LS-SVMR)能够很好地处理非线性、高维数以及容易陷入局部极小值等问题. 首先基于支持向量机(SVM)的理论研究基础,利用模型训练误差的平方代替松弛变量,取消了不等式约束,用等式约束来替代,从而提出最小二乘支持向量(LS-SVMR)的电力系统最大值负荷预测模型,避免求解一个二次规划问题,加快模型的预测速度,提高模型的预测精度.

此外,气象是影响极值电负荷的主要因素,考虑人体对于温度的适应具有一定的生理惯性,多日连续高温时,即使温度变化不大,负荷也会增长,这就是温度对电力最大值负荷的累积效应.通过对预测日前几日的最高温度进行加权后,对待预测日的最高温度进行修正,从而体现出多日连续高温的留存影响.这就是最大温度对最大电力负荷值的累积效应.本文提出了气温累积效应的日最高气温修正模型,并利用实例验证了最高气温累积效应对最大电力负荷的影响,并且验证了修正后的最高温度可以提高模型的预测精度.

1 电力负荷最大值影响因素

要提升现在最大值电力负荷预测模型的泛化能力以及精确度,就必须要探究影响电力负荷最大值的因素,对电力负荷最大值影响因素主要包含以下方面.

1.1 气候因素

气候对负荷最大值的影响是显而易见的.影响电负荷的气象因素主要是温度、天气等.在冬季,当气温降低到一定程度,人们取暖用电的需求不断增加,导致负荷的用电量有所提高.在夏季,随着使用空调的频率不断增加,用电负荷的压力也会增加.

1.2 日期类型

日期类型是影响负荷的另一个重要特征. 目前中国城市工业具有较大的用电需求,工业的用电量占比比较大,非工作日(法定节假日、周末)的电力负荷量与工作日(周一到周五)用电量有明显的差异,非工作日的用电会比较少. 本文将日期类型列入影响负荷预测结果的因素之一. 为了避免多重共线性,周一至周六转换为6 个0,1 的哑变量,将节假日类型分为三类,分别为:大长假、小长假、短假,并依次用数值1,2,3量化.

1.3 近似日负荷因素

由于电负荷受到季节、天气的影响比较大,所以电负荷具有明显的周期性.通过分析不同日最大电负荷的自相关性和偏自相关性,可以明显的发现预测日的电负荷与延迟一阶和延迟七阶的最大电负荷具有较高的相关性.

本文将原始最大负荷数据、气象数据、工作日和节假日因素构建成中期负荷预测特征工程,如表1 所示.

表1 电负荷预测模型特征工程

2 改进最小二乘支持向量(LS-SVMR)网络模型

2.1 最小二乘支持向量(LS-SVMR)网络模型

式中:w 为高维空间中的权重系数向量;b∈R 为常数.

将回归问题转换为最小二乘支持向量机数学模型,如下:

式中:ei为回归函数值与实际值的误差,γ>0 为惩罚系数;用拉格朗日法求解这个目标规划问题,将带有约束目标问题转化为无约束目标问题,在对偶高维空间中得到如下数学表达式:

对式(4)消去w 和ei可得到如下线性方程:

从训练最小二乘支持向量机过程中存在的问题,发现参数γ 与和核函数σ 可以通过二次判别分析算法在模型训练参数的阶段直接调用.

2.2 实验评价指标

为了准确的衡量模型的精确度,参考国家电网有限公司评价电负荷最大值预测精度的指标,采用平均绝对误差百分比(MAPE)和决定系数R2作为模型预测效果的评价指标:

式中:yi表示第i 个日的实际最大负荷值;表示第i 个月所采用预测算法下的最大负荷值.MAPE 值越小表示预测值越准确,所采用的模型效果越好.

式中:yi表示第i 个月实际大负荷值;表示第i 个月所采用预测算法下的最大负荷值;表示测试样本实际最大负荷值的平均值.R2反映实际值与预测值关联程度,其值越接近1 表明拟合的优度越好.

3 电负荷温度累积效应

在负荷日最大值预测中,最高温度和日最大电负荷的线性相关性可以通过温度累积效应的修正进一步提高.下面介绍如何对日最高温度值进行合理地修正.

温度累积效应的主要思想是:考虑人体对于温度的适应能力存在一定的生理惯性,多日连续高温时,即使温度变化不大,最大负荷也会持续地增长.通过对预测日前几日的最高温度进行加权后,对待预测日的最高温度进行修正,从而体现出多日连续高温的留存影响.

式中,T′i为考虑电负荷的温度累积效应后,经过模型修正后的日最高温度值,Ti-j为第i 日前j 天的日最高温度实际值,d 为考虑最大的温度累积效应的天数,kj为Ti-j对应的权重.

有研究表明,当d 大于等于3,即高温持续天数达3 天及以上时,累积效应的强度对天数不再敏感.所以要考虑温度累积效应进行日最大温度修正,需要求解d 和权重kj,具体的求解方法如下:

(1)划分温度区间

因为日最高温度和对应的日最大负荷不是线性关系,故根据日最高温度划分为不同的区间,分段进行线性拟合.根据统计,选取Tlow=25 ℃,Thigh=37 ℃.

表2 温度划分区间

(2)计算步骤

算法的核心是对于每一个不同的d,将样本集划分入按温度划分好的n 个区间中,形成n 个方程组.每个方程组中有数量不定的等式,方程组一般为超定多元线性方程组.最终对方程组采用最小二乘法进行求解得到权值kj.计算流程如图1 所示.

图1 温度累积效应计算流程图

经过算法修正后,日最高温度与区域日最大负荷的皮尔逊相关性系数从78.43%提高到了81.29%.

4 算例分析

为验证本文所提方法的科学性和可靠性,本文实验使用基于广东省某地区2018—2022 年每日最大电力负荷数据作为数据集,电负荷单位是kW,构建模型结构如表1 所示.最后将实验结果与传统BP、RBF 神经网络负荷预测方法的预测结果进行对比分析可知,本文所提模型取得了较好的预测准确率.

4.1 数据处理

1)缺失值处理

时点负荷数据的缺失主要是由于采集器发生故障或进行检修时设备暂停导致的数据缺失.面对缺失的负荷数据我们将根据历史近似日的时点负荷数据采用KNN 最近邻插补,这基于一个假设,即排除其他外在因素干扰的情况下,地区负荷的用电规律应该是一致的.通过找出K 近邻样本,并根据距离确定权重,求取平均值对缺失值进行插补.

2)负荷数据标准化

鉴于神经网络在训练过程中需要保证节点的输出值在激活函数的适合范围内,而电力负荷数据波动性较大,需要对历史负荷数据进行标准化处理.因此,我们在模型预测输入的数据时会对进行均值方差标准化.

其中,均值方差标准化是一种将数据转化为标准正态分布的标准化方法.在回归模型中,服从正态分布的自变量和因变量往往对应着较好的回归预测效果.均值方差标准化的计算公式为:

公式中,x 表示单个数据的取值,μ 表示对应列的均值,σ 表示对应列的标准差.

3)天气状况数值化

对天气状况进行切分,可以得到每日最好天气状况和最坏天气状况,例如“晴/小雨”分割后最好为“晴”,最坏为“小雨”.原本只有一个天气状况的则最好最坏天气相同.对分割后的所有天气统计得到17 个天气状况,进行分组数值化编码,具体如表3.

表3 分割后的天气状况和对应数值编码

我们对分级后的天气进行打分,天气越好评分越高,这是因为夏季天气相对较好,且夏季负荷用量多一些.这样尽量减小组内的差距,而组与组之间则有明显的差异的做法,可以使数量较多,次序较为模糊的天气状况数据变为有序、层次分明的数据.而且每组能体现不同程度的天气状况特征.

4)节假日特征数值化

考虑不同节假日对负荷的影响,将节假日类型分为3 类,分别为:大长假、小长假、短假,并依次用数值1,2,3 量化.不同法定节假日的归类以及量化结果如表4 所示.

表4 节假日分类与量化

5)训练集和测试集划分

选用2018 年9 月1 日到2021 年5 月30 日的数据作为训练集,选用2021 年5 月31 号到2021 年8 月31 号共三个月的数据作为测试集.

4.2 实验结果分析

应用考虑温度累积效应基于改进的LS-SVMR 负荷预测模型进行预测分析.经过样本数据训练得到该地区3 个月最大电负荷实际值与预测值的对比,如图2 所示.从图2中可以看出,改进LS-SVMR 模型预测值与实际值较为接近.

图2 改进LS-SVMR 电负荷模型预测结果

为进一步说明本文构建模型的有效性,分别采用4 种方法对该地区进行电力负荷最大值进行预测,分别是有无考虑温度累积效应的LS-SVMR 模型和BP、RBF 预测模型,预测结果如表5、图3 所示.

图3 电负荷预测结果对比

表5 电负荷预测模型比较结果

首先对比有无考虑温度累积效应基于改进的LS-SVMR 预测模型测试结果可以看出,考虑温度累积效应基于改进的LS-SVMR 预测模型的预测误差更小,结果更加精确,表明对最高温度进行修正,不仅可以提高温度与最大电负荷的相关系数,还可以提高模型的预测效果.

其次与BP、RBF 神经网络负荷预测结果对比,本文基于改进的LS-SVMR 预测模型预测方法的平均绝对误差百分比(MAPE)只有4.73%,且决定系数值最高,相比于其他2 种电负荷预测模型,本文构建的预测模型的精度更高,拟合精度更优,其结果证明该预测方法可以满足时序性、非线性的电负荷预测的预测要求,体现了本文所提出的负荷预测方法的优越性、合理性.

5 结 语

本文发现最大气温对最大负荷的影响具有累积效应,本文首先从分析最大电负荷与最高气温的关系入手,建立了气温累积效应的日最高气温修正模型,并利用实例验证了最高气温累积效应对最大电力负荷的影响,在此基础上,提出一种基于最小二乘支持向量(LS-SVMR)网络,并采用遗传算法求解最优参数,对广东电力系统的历史最大负荷进行预测,预测结果表明与传统负荷预测方法BP、RBF 神经网络相比,体现了本文所提出的负荷预测方法的优越性、合理性.

猜你喜欢

向量效应负荷
向量的分解
铀对大型溞的急性毒性效应
聚焦“向量与三角”创新题
懒马效应
应变效应及其应用
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
负荷跟踪运行下反应堆一回路控制系统仿真与验证