电力系统短期负荷预测
2017-06-19董林葛悦琴钱圳冰
董林+葛悦琴+钱圳冰
[摘要]文章是一个研究多重变量之间的关联程度的问题,通过利用多项式回归方程拟合的思想,偏最小二乘回归法、线性回归和曲线拟合的方法建立了电力系统短期负荷预测的模型。模型考虑了数据相对于时间的变化情况、数据之间存在的相互影响关系,对未来的电力系统短期负荷情况进行了合理的预测。
[关键词]偏最小二乘回归;时间序列分析;拉格朗日乘子法;自回归滑动平均
[DOI]1013939/jcnkizgsc201716194
1问题分析
电力系统负荷的变化有其自身的规律,一方面,呈现期性,随着春、夏、秋、冬四季更迭,负荷在每个季节有着其自身内部的发展规律;从周一到周五的5个工作日,负荷也有着较大的相似性,但是周末的负荷值往往低于工作日,整体呈现周期性。另一方面,电力系统负荷的变化也受许多不确定因素的影响,比如天气、人们活动等因素。
通过综合考虑各个气象因子之间的相互作用,详细地描述了综合气象因子和负荷指标间的回归方程。定性分析了综合气象因子与负荷值之间的关系,并且通过回归理论绘制出拟合曲线,建立回归模型,进一步定量分析综合气象因素与负荷之间的相关性。
在对短期负荷的预测时,结合往年的数据以及近阶段的天气情况,我们通过加拉格朗日乘子法来修正所建立的回归模型,使得模型预测的结果更加准确。
2名词解释
21多元线性回归分析
指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法,是一种普遍应用的统计分析与预测技术。多元线性回归中,一般采用最小二乘方法估计回归系数,以使残差平方和达到最小。
22拉格朗日乘子法
将约束优化问题,根据效用函数方法,将其转变成无约束问题,同时对无约束的效用函数利用拟牛顿算法求解其最优解,更新乘子。其主要思想是引入一个新的参数(即拉格朗日乘子),将约束条件函数与原函数联系到一起,使能配成与变量数量相等的等式方程,从而求出得到原函数极值的各个变量的解。
3基本假设
(1)假设2015年1月11日至17日气象因素与往年差别不大。
(2)假设不会因数据采集系统或管理系统自身出现故障导致部分负荷数据的丢失。
(3)假设数据的采集过程是正确并且真实的,没有因意外或其他特殊原因引起的数据非规则性变化。
(4)假设统计数据不会因电网负荷统计的标准不同而产生误差。
(5)假设不会因为其他人为因素而导致数据出现异常情况。
4问题一的模型建立与求解
41数据综合处理
题目所给的数据存在一些问题,需预先处理:地区一、二的天气因素中有几项缺失,需要参考数据进行修正补加,同时减少由于节假日因素影响到的数据。
42模型建立过程
(1)将因变量组和自变量组进行n次标准化,得到n标准化观测数据阵分别记为:F0和E0。
问题二中自变量为5个气象因素,因变量为日最高负荷值、日最低负荷值、日平均负荷值,即m=5,p=3。
43模型的结论
如果要用气象因素来提高负荷预测精度,在诸气象因素中,笔者会优先推荐最高温度、最低温度、平均温度。偏最小二乘回归方法的模型对研究两组多重变量之间的依赖关系的构造是合理,并且有效的,可以很好地解决所求问题。
5问题二的模型建立与求解
51问题二的分析
问题二要求我们以已知数据作为参考,预测两地区2015 年1月11日至17日共7天的电力负荷。我们采用了时间序列预测法中的ARMA 模型(自回归滑动平均模型),利用已掌握的比较完备的历史统计数据,采取一定的数学方法进行科学的加工整理。在这个模型中,因为只有前几年同一时间段各地区负荷量的每日数据,所以选择平稳时间序列预测法较为准确地预测两个地区2015 年1月11日至17日共7天的电力负荷。
52模型的构建说明
ARMA 模型(自回歸滑动平均模型)是时序方法中最基本的模型。该模型具有随机差分方程的形式,即
假定当k>0时,at+kat与xt不相关,也就是期望E(at+kat)=0(k>0)
利用Excel数据挖掘的方法中的Trend函数,得到了2015年的预测值。而我们在问题三中只有前六年的数据,信息资料的质量和数量都不是很高,所以预测得到的结果误差应该较大。
6问题三的模型建立与求解
61模型原理
问题3涉及了气象因素的负荷值预测,该预测值主要由两部分构成:一为问题三中预测的负荷值;二为约束条件:2015年气象因子综合对负荷值的一个影响值。在问题二中,已经得到过去几年气象因子对负荷指标的回归方程。基于原函数和约束条件的相关分析之上,问题四所采用的优化算法为“拉格朗日乘子法”。
62模型建立
记y=f(x)为我们希望得到的线性回归方程,其中f(x1)为问题三中预测到的第i(i=1,2,…,7)天的日负荷值的高阶函数拟合方程,λf(x2)为已知数据2015年的气象因子综合对日平均负荷值的一个影响值。模型如下:
y=f(x)=f(x1)+λf(x2)
63模型的求解
(1)运用MATLAB对问题三中2015年1月11日至1月17日预测值进行处理,得到日负荷值的曲线,我们选用十三阶多项式进行拟合,效果很好,得到拟合方程系数阵。
(2)在第2问的基础上,代入2015年1月11日至1月17日的相关指标,重复问题二,得到气象因子综合对日平均负荷值的回归方程。
(3)将2015年1月11日至1月17日的气象因子代入步骤二所得方程预测日平均负荷值,我们所求的,最后得到高阶回归方程组。
下图是经过修正拟合后的和未记及气象因素的一个比较图:浅色为修正后的曲线,深色为未记及气象因素的拟合图,7幅图分别代表了7天,纵坐标为电力负荷值。从图上我们可以清晰地看出修正后的图平滑度更好,说明修正是合理有用的。
7模型的推广
由于我国领土面积大,南北距离大,各个地方气候因素不近相同,我们的模型可以进一步预测南部地区高温对电力负荷的影响,也可以预测在东北地区严寒条件下对负荷值产生的影响。
我国某些城市第二产业和第三产业发达,特别是服务业,因此我们的模型可以预测这个地方电力负荷值的主要特征以及预测该地区当地的相关服务业的发展趋势。
参考文献:
[1]余胜威MATLAB优化算法案例分析与应用[M].北京:清华大学出版社,2014
[2]姚泽清,郑旭东,赵颖全国大学生数学建模竞赛赛题与优秀论文评析2005—2011年B题[M].北京:国防工业出版社,2012
[3]张志涌,杨祖樱MATLAB教程[M].北京:北京航空航天大学出版社,2015
[4]姚泽清,郑旭东,赵颖全国大学生数学建模竞赛赛题与优秀论文评析2005—2011年A题[M].北京:国防工业出版社,2005
[5]章文波,陈红艳实用数据统计分析及SPSS 120应用[M].北京:人民邮电出版社,2006