基于k-means聚类与BP神经网络的用电负荷预测方法
2022-07-29李冰冰
李冰冰
华北水利水电大学,河南 郑州450046
0 引言
在国家出台“双碳”目标的背景下,对不同行业进行电力负荷预测,有利于了解各行业的生产经营状况,评判各行业的发展趋势,引导其正向发展,对国家电力发展意义重大[1]。
负荷预测需要建立在庞大的数据基础上,文章结合某地区的每15 min负荷数据、行业日负荷数据和气象数据深入分析相关数据,最终解决以下问题:对某地区每15 min的用电负荷进行量化分析,建立用电负荷趋势的数学模型,在此基础上确定未来10 d每15 min的负荷[2]。
1 基本思路
首先,对该地区电网未来10 d每15 min的负荷数据进行预处理。然后,对新的数据表进行可视化分析[3]。考虑到所用数据会影响模型的准确度,选择2020年8月31日—2021年8月31日近一年的数据进行预测。文章将气象条件作为解释变量,每15 min测得的总有功功率作为被解释变量进行短期预测。采用聚类分析与BP神经网络相结合的预测方法,先对该地区的历史数据进行k-means聚类,然后将聚类结果作为BP神经网络的输入层进行训练,得到BP神经网络的预测结果。为了测试模型的精度,选取后一个月的数据作为样本进行训练,将所得预测结果与真实结果进行对比,得出模型的精度,即误差。为了预测未来10 d的负荷,需要得知未来的气象条件,因此对气象条件中的因素进行简单的时间序列预测,根据所得的气象条件及一天中每15 min的变化情况,得出最终的结果[4]。
2 负荷影响因素的确定
影响电力系统短期负荷预测精度的因素众多,文章选取多个因素(最高温度、最低温度、白天风力风向、夜晚风力风向、天气)作为解释变量从而提高模型的精度。经过可视化分析,天气的晴朗程度与总有功功率成反比,恶劣的天气会导致用电的增加,电能的增加使得总有功功率也增加[5]。
天气和白天风力风向、夜晚风力风向3个因素与总有功功率的数字关系不明显,根据风级和天气晴朗程度的不同,赋予各因素不同的等级;每天的天气均有变化,将天气划分为两个部分。给天气(晴、局部多云、多云、阴、小雨、中雨、大雨)赋予不同等级(1~7);根据风级的不同,编序为无持续风向<3级、北风3~4级、北风4~5级。
3 负荷预测方法
3.1 k-means聚类算法
k-means(k均值)聚类算法作为无监督算法,可以根据各个因素的相关性,以欧式距离为参照,找出最优的质心,将因素分为不同的簇[6]。k-means聚类算法可以根据各个影响因素的欧式距离的差异,以欧式距离的反比反映两个不同影响因素之间的相关性,以此聚成不同的簇[7]。
文章选取了众多影响因素作为负荷短期预测的解释变量,而各个影响因素之间具有一定的关系。因此,除了计算各因素对负荷的影响,还应将各因素之间的相关性纳入考虑范围。需要先对该地区的历史数据进行k-means聚类,然后将聚类结果作为输入层并使用BP神经网络预测,能够达到很好的效果[8]。
3.2 BP神经网络
各地区的负荷与其影响因素之间是一种非线性关系,存在较严重的随机性[9]。BP神经网络兼具非线性映射数学能力、自学习与自适应性、泛化能力及容错性等多重优势,使用BP神经网络进行预测能够避开一些限制问题,让负荷的短期预测更加顺利[10]。BP神经网络算法的基本公式如下。
对于输出层:
式中:ok为第k个输出变量的实际输出;f(netx)为变换函数;k为输出变量的个数;netj为神经网络输入层;m为输入层的个数;j为第j个输入层;wjk与θt为隐含层到输出层的权值与阈值;yj为隐含层输出。
对于隐含层:
式中:f(netj)为变换函数;vjk与θi为输入隐含层的权值与阈值;xi为隐含层输入层;n为隐含层输入层的个数;i为第i个隐含层的输入层。
3.3 负荷预测模型的搭建
使用上述方法搭建的负荷预测模型如图1所示。
图1 负荷预测模型框架
4 实证分析
4.1 解释变量的聚类
2018—2019 年,该地区的总有功功率出现明显的波动,之后,该地区的总有功功率的大小和波动趋势逐渐稳定。根据总有功功率的走势可以推出,在2019年之后负荷近似呈现以年为单位的周期性变化,因此采用2019年8月一个月的数据进行跨度为10 d(2021年9月1日—9月10日)的负荷预测。
使用k-means聚类算法,根据最高温度、最低温度、天气、白天风力风向和夜晚风力风向等因素将数据大致聚为4类。聚类分析得到的结果如表1所示。
表1 聚类分析结果
4.2 负荷预测
聚类之后,使用近期一个月的数据进行预测。首先,使用前25 d(2019年8月1日—8月25日)的数据预测未来6 d(2019年8月26日—8月31日)的总有功功率,测试模型精度;然后,预测未来10 d(2021年9月1日—9月10日)的总有功功率。
4.2.1 未来6 d的负荷预测
部分预测值与真实值的误差如表2所示。预测值波动较小,且都位于合理区间,可以进行下一步预测。
表2 部分预测值与真实值的误差
4.2.2 未来10 d的负荷预测
最高温度和最低温度具有季节性特征,对最高温度和最低温度需要采用三次指数平滑法。预测未来10 d总有功功率时,需要得到未来10 d的气象条件,因此使用SPSS对天气、最高温度、最低温度、白天风力风向、夜晚风力风向进行简单的时间序列预测,得到的结果如表3所示。
表3 不同解释变量的时间序列预测结果
将预测得到的各个解释变量的值代入聚类结果,寻找与其最接近的聚类中心作为输入层进入BP神经网络进行计算,预测未来10 d的负荷,部分预测值如表4所示。预测结果的走势和大小与历史相近,预测值波动较小,且都位于合理区间,说明预测结果相对合理。
表4 未来10 d的部分预测值
5 结束语
文章介绍了一种结合k-means聚类与BP神经网络的新型预测方式并进行了实证分析。结果显示,构建的模型精度较高,并且能够较好地解决解释变量间存在非线性关系的问题。同时,模型还存在一定的不足,在预测电负荷之前,还需要对解释变量(即气候条件等众多因素)进行预测,这不仅增加了操作难度,还在一定程度上降低了预测的精度。总的来说,该新型预测方式可操作性强、结果精确度良好,可以推广应用。