APP下载

基于主成分分析降维和支持向量机回归的短期负荷预测方法研究

2020-11-17王国彬殷占贵

吉林电力 2020年4期
关键词:降维向量负荷

王国彬,武 晗,白 杨,张 羽,刘 会,殷占贵

(1.国网宁夏电力有限公司电力科学研究院,银川 750011;2.国家电网有限公司营销部,北京 100032;3.国网(宁夏)综合能源服务有限公司, 银川 750011;4.国网宁夏电力有限公司, 银川 750011;5.国网中卫供电公司,宁夏 中卫 755000)

精准的负荷预测能够保证发电计划的合理规划,并且使供电能够有效有序地进行,有效提升整个系统的运行效率。一方面,短期负荷预测对于电力调度安全具有重要意义;另一方面,随着我国电力市场逐步走向成熟,电力市场交易对于电力系统的短期负荷预测提出了新的要求,负荷预测的精度对于参与市场交易的主体而言,意味着直接的经济效益。

电力负荷的变化由社会经济因素和自然因素共同决定,依据电力系统历史负荷数据的连续性和周期性等特点可以预测出未来某一时间段的负荷数据,已经可以达到较高精度;但随着电力现货市场交易等新的要求,对预测精度提出更高要求,同时随着大数据、采集存储等信息技术的快速发展,利用高维度、大量数据提高预测精度逐渐得到重视[1],但大量数据的使用也带来了“维数灾难”。一方面,“维数灾难”造成关键的因素和数据被淹没,无法被挖掘,进而造成预测精度陷入瓶颈,难以继续提高;另一方面,高维度的、巨量的数据造成预测模型越来越复杂,计算速度也越来越慢,不得不对计算能力不断扩容,造成计算能力的浪费,所以,在电力短期负荷预测中,为了不断提高预测精度,降低预测模型的复杂程度,在构建特征向量集时先对高维度的数据进行降维处理是必要的。在电力负荷预测中,数据处理的复杂程度有限,主要采用主成分分析法( PCA)和核主成分分析( KPCA)降维方法[2]。

支持向量机( SVM)是一种广泛应用于统计分类和回归分析的人工智能算法,属于监督式学习的方法,近年被用于短期电力负荷预测[3-4],具有理论成熟、鲁棒性好、计算简单等优点。

随着科学研究的深入,短期电力负荷预测方法不仅种类繁多、与时俱进,而且逐渐发展成熟,理论体系逐渐完善[5-8]。但是,对于不同种类算法,尤其是人工智能预测算法的适用性研究尚未得到有效开展。实际应用中,每一种智能算法均有其适合的应用场景,针对电力负荷预测,多种智能算法均有相关研究,但是少有研究者结合特征降维方法和智能算法,通过算法的耦合进一步提高预测精度。

本文重点研究主成分分析的特征降维方法和支持向量机的智能预测算法,提出基于主成分分析和支持向量机的短期负荷预测方法。

1 短期负荷的影响因素

影响短期负荷变化的因素包括时间因素、气象因素、特殊活动因素及其他因素等[9]。

1.1 时间因素

时间因素主要包括季节因素、节假日因素和工作日因素等。季节因素主要是由于随着春夏秋冬季节的变化,加上气温的影响,造成短期负荷存在季节性差异。典型的节假日因素如春节、国庆等重大节日,工厂停工、学校停学,第二产业用电负荷将降到最低,对短期负荷预测具有非常大的影响。工作日因素体现为每一周的工作日负荷与周末具有一定差异性。

1.2 气象因素

气象因素对于短期负荷具有重要影响。主要的气象因素包括日最高温度、日最低温度、日平均温度、相对湿度、降水量等。当某种气候现象发生时,可能造成用电负荷发生重大变化,如夏季最高气温显著上升时,制冷负荷显著增加,造成用电负荷增加。

1.3 特殊活动因素

特殊活动主要包括特殊的政治活动、大型体育赛事等,也包括重要节假日产生的人口迁徙活动等。政治活动期间,如APEC会议、北京“两会”等,有可能要求提前停工,将对短期负荷产生直接影响。

1.4 其他因素

除了以上3种因素外,还包括一些自然灾害、设备故障、大停电事故等因素。地震发生后对区域供电的影响,如台湾大停电事故等。

2 基于PCA降维和支持向量机的短期负荷预测方法

PCA作为一种特征降维的方法,可以提取主成分的特征数据,从而达到降低数据维度的效果。支持向量机回归(SVR)是SVM的一个重要分支,以SVR为基础,建立短期的电力负荷预测模型,可以有效提高预测速度。本文结合两者的优势,提出一种基于PCA和SVR的短期负荷预测模型。PCA对数据样本进行预处理,通过线性变换,消除数据之间的噪声和相关性,将多个指标组合成少数几个能包含样本数据信息的指标,降低样本空间的维数,进而节约空间,简化计算过程,提升SVM运算速度。

2.1 对数据进行主成分分析

对短期电力负荷样本数据展开主成分分析,获得降低维度的主成分分量。把所有历史负荷数据整理成样本矩阵,矩阵大小为m×k维:

(1)

中心化样本矩阵:

(2)

计算特征数据集的协方差:

(3)

计算协方差矩阵的特征值并取出最大的个特征值所对应的特征向量,输出投影矩阵,假设通过变换后的坐标系是{w1,w2,…,wd},其中w为标准正交基向量。如果将数据降维后,特征数据xi于低维坐标系的投影为zi=(zi1,zi2,…,zid),基于zi来构造xi,结果为:

(4)

(5)

(6)

以式(6)为约束函数,得出PCA降维之后的主成分分量。

2.2SVM算法训练

为建立短期负荷预测模型,使用前文2.1所得的经PCA降维之后的主成分分量为样本数据,再进行SVM算法训练。获得目标模型后,将模型付诸实际应用,预测未来的短期电力负荷。

运用SVM算法求解回归问题,PCA算法降维之后得到m个n维主成分样本数据,其中n

(7)

构成新的训练样本集{(xi,yi),i=1,2,…,m},其中xi∈Rn,yi∈R,分别为输入值和输出值,Rn和R分别为n维和1维实数空间。

首先,基于SVM算法,使用非线性内积函数将输入的数据转换到高维空间,然后在高维空间中,把转换后的数据进行线性回归分析构造估计函数。假设训练样本集为 {(xi,yi),i=1,2,…,n},其中xi∈RN为N维样本输入值,yi∈R为样本输出值,n为样本数。引入非线性支持向量机估计函数,表达式如下:

f(x)=ω×φ(xi)+b

(8)

式中:ω×φ(x)为高维空间向量ω与非线性映射φ(x)的内积,ω的维数即为高维空间维数,b∈R为偏置量。将松弛变量ξ和ξ*引入到式(8)中,并求解ω、b使得整个解空间(包括样本点)满足函数:

(9)

其约束条件为

(10)

式中:C为惩罚系数,C越大表示对训练误差超过 的数据样本惩罚越大;ε为不敏感损失函数,它规定回归函数的误差要求,ε越小回归函数与输出值的误差越小,估计精度就越高。其表达形式为:

L[y,f(x)]=|y-f(x)|ε

(11)

由于上述问题属于高维特征空间的凸二次问题,因此引入任意对称函数K(xi,xj),并使其满足Mercer条件,从而作为核函数代替非线性映射φ(x)。采用Wolfe对偶定理并结合拉格朗日乘子法,将该问题转化为对偶函数进行求解:

(12)

其约束条件为:

(13)

对式(11)所示目标函数进行求解,可得支持向量机的回归估计函数:

(14)

(15)

式中σ2为核函数的形状参数。

以SVM的短期负荷预测作为基础,PCA降维输出的历史短期负荷主成分分量作为训练样本集,训练得到基于PCA降维和支持向量机的短期负荷预测模型。

以式(14)、(15)所示模型预测未来短期的电力负荷。

2.3 算例分析

采用某城市日用电负荷数据作为原始数据,相关因素数据包括天气阴晴、日最高气温、日最低气温、日平均气温、相对湿度、降水量、星期、节假日、月度GDP、国家PMI指数、国家CPI指数、重大活动、灾害事故。先使用历史1年的数据进行学习,然后预测下一个月的用电负荷。分别采用人工神经网络(ANN)、SVR和本文提出的PCA+SVR预测算法模型,得到预测结果见图1、图2,3种预测方法预测结果指标对比见表1。

图1 3种预测方法预测结果的平均绝对百分比误差(eMAPE)

图2 3种预测方法预测结果的均方根误差(eRMSE)

表1 3种预测方法预测结果指标对比

PCA降维后前5个主成分的累计方差贡献率达到了92%,选择前5个为主成分特征向量。预测算法运行时间上集中在2 000~8 000 ms,多次运行取平均值,SVR、ANN和PCA+SVR运行时间约为3 815、5 951和3 398 ms。

预测结果显示,采用本文算法的PCA+SVR预测模型效果最佳,MAPE和RMSE指标远优于SVR和ANN模型。ANN和SVR两种模型的预测精度接近,MAPE和RMSE指标差异较小。直接对比PCA+SVR和SVR模型,MAPE平均降低62.5%,RMSE平均降低62.9%,运行时间减少12%,说明本文提出算法预测精度和速度均得到提高。

3 结论

本文重点研究了基于主成分分析降维和支持向量机回归的短期负荷预测方法,通过PCA降维与SVR智能算法的耦合形成新的预测模型,提高了短期负荷预测精度和速度。

猜你喜欢

降维向量负荷
混动成为降维打击的实力 东风风神皓极
向量的分解
聚焦“向量与三角”创新题
降维打击
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
负荷跟踪运行下反应堆一回路控制系统仿真与验证
Savitzky-Golay在含冲击负荷短期负荷预测中的应用