深度学习在电力系统预测中的应用

2023-01-07崔家瑞王义轩

工程科学学报 2023年4期

苗磊，李擎，蒋原，崔家瑞，王义轩

1) 北京科技大学自动化学院，北京 100083 2) 工业过程知识自动化教育部重点实验室，北京 100083

现代电力系统结构日益复杂，规模不断扩大，若仅仅依靠传统的物理建模方法，难以充分应对运行分析需求[1].结合多源数据，深度学习已广泛应用于电力系统预测.通过采集运维数据、设备数据等电力系统各环节基础数据，结合深度学习技术，可以较好地拟合影响电力系统后续运行状态各因素之间的非线性关系[2]，建立预测模型，实现电力系统预测，如负荷预测[3]和出力预测[4]等.本文着重对目前研究较多的几种预测，包括电力系统负荷预测、新能源出力预测和电力设备健康状态预测的应用情况进行归纳和梳理.针对不同的应用场景，电力系统负荷预测分为面向民用场景的负荷预测和面向工业场景的负荷预测；针对不同的预测对象，出力预测分为光伏出力预测和风电出力预测；针对不同的设备种类，健康状态预测分为机械类设备健康状态预测和非机械设备健康状态预测.

1 深度学习模型

1.1 深度信念网络

深度信念网络（Deep belief networks,DBN）改善了模型训练易陷入局部最优，且学习（收敛）耗时偏长以及需要大量标签数据等问题[5].由于采用前馈式网络结构，DBN 适用于处理前后无关联序列数据，并凭借深度特征提取能力强等优点，被广泛应用于电力系统预测领域，为新能源出力预测[6-7]、负荷预测[8]、电力设备健康状态预测[9]等方面提供了新的解决思路.

1.2 卷积神经网络

卷积神经网络（Convolutional neural networks,CNN）与DBN 相比，最主要的差别在于随机初始值和逐层训练方式，并且在卷积操作后，数组内的元素仍可保留原始位置关系[10].同时，由于在运算中共享卷积核，因而进一步减少了模型参数数量，并适用于处理多维数组.在电力系统预测分析实际应用场景中，常用于考虑时空相关性的负荷预测、出力预测及健康状态识别等[11-13].

1.3 循环神经网络

循环神经网络（Recurrent neural networks,RNN）由于各层神经元之间包含前馈和反馈连接[14]，因而适用于处理具有前后依赖关系的序列数据.为解决RNN 只能记忆“短期”信息这一缺陷[15]，一些改进后的RNN 结构被提出，其中，门控循环单元（Gate recurrent unit,GRU）和长短期记忆模型（Long short term memory,LSTM）即为典型代表[16-17].RNN常用于改善功率剧烈波动场景下的预测精度，如面向工业现场的负荷预测[18]、复杂天气条件下的新能源出力预测[19]等.

1.4 堆叠自编码

堆叠自编码（Stacked auto encoders,SAE）与DBN模型结构相似，二者主要区别在于：每层自编码器之间为非对称连接[20]，因而模型结构更加易于拓展.研究者们在原始自编码器的基础上进行了一系列优化，使之更适用于电力系统预测，如基于去噪自编码器的配电设备健康状态预测[21]，基于卷积自编码器的光伏出力预测[22]等.

基于以上分析，几种典型的深度学习预测模型对比如表1 所示.

表1 典型的深度学习预测模型对比Table 1 Comparison of typical deep learning prediction models

2 电力系统负荷预测

电力系统负荷预测是指在一定时间尺度下，通过探寻负荷历史数据中的规律，即建立输入输出之间的非线性关系，来预测未来电力负荷需求值，对减少由于意外负荷变化引起的电力调度问题，优化区域内电力工程建设规划，保证电力系统的稳定运行，具有重要意义[23-24].按照应用场景不同，可分为面向民用场景的负荷预测和面向工业场景的负荷预测.选取了19 篇负荷预测代表性文献，分类总结如表2 所示.

由表2 可知，负荷预测多采用RNN 模型，占总数的52.6%.

表2 电力系统负荷预测分类Table 2 Classification of power system load forecasting

2.1 面向民用场景的负荷预测

面向民用场景的用电负荷具有一定的分散性，通常要将多个用电单元整体考虑.Cheng 等[30]提出了一种基于CNN 的民用建筑负荷预测方法，首先，将历史负荷序列按时间依赖程度划分为两个部分；并将来自多个数据采集位点的温度、湿度等气象数据进行聚类；其次，结合区域内历史负荷和气象数据，通过在CNN 网络中引入压缩和激励网络，自动得出不同特征的重要程度，并用权值表示.在此基础上，结合时间依赖程度，对关联程度不同的特征做进一步加强或抑制，改善了特征冗余问题，实验结果表明，相对于采用支持向量机、LSTM 等方法，这种方法的预测精度提升了15.1%～20.9%.Peng 等[39]利用SAE 提取了不同层次的历史数据特征，在此基础上，分别构建了不同参数和结构的预测模型，通过将每个预测模型的输出进行叠加重构，获取负荷预测输出.

Hosein 等[36]提出了一种基于LSTM-GRU 的负荷预测模型，如图1 所示.将历史负荷数据和温度数据的输入序列重新排列成二维矩阵：

图1 基于双向LSTM-GRU 的居民区用电负荷预测Fig.1 Residential area load forecasting based on bidirectional LSTMGRU

式中，L1…L24D和T1…T24D分别为历史负荷值和环境温度值.在特征提取阶段，使用二维卷积层提取电力负荷和温度数据的重要信息，卷积核的行数fcol和列数frow分别为：

式中，ACCn表示滞后阶数，在负荷时间序列中，TH＞0.8；在温度时间序列中，TH＞0.9.完成特征提取后，通过GRU 前向传播和LSTM 反向传播，可同时利用前后两个时间间隔内的特征信息.相对基于前馈神经网络或支持向量机等方法，预测精度提高了6.9%～11.7%.

现有大多数深度学习方法只能单独捕获认知不确定性（预测模型结构或超参数的不确定性）或偶然不确定性（输入数据的不确定性），并转化为模型参数或输出的概率分布[40].为此，Sun 等[37]通过对LSTM 的网络权值和偏差参数分别构造先验分布以及推导输入数据的后验分布，同时捕获认知及偶然不确定性，结果表明，与未引入贝叶斯估计的LSTM 预测模型相比，预测结果的均方根误差降低了27.6%.

2.2 面向工业场景的负荷预测

与民用或商业建筑用电方式不同，工业用电场景需考虑大功率冲击负荷带来的影响，相比民用场景下的负荷预测，工业场景随机性波动较强，负荷预测难度相对更高[41-42].

工业电力系统各用电环节之间通常会存在一定的耦合关系，Mao 等[27]提出了一种基于LSTM的负荷预测模型，通过增加样本多样性来减少模型的方差，并引入参与因子来表示相邻节点之间的耦合关系，预测结果的平均误差降低了25.4%.

Kong 等[43]提出了一种基于DBN 的工业场景负荷预测方法，在模型优化阶段，通过将受限玻尔兹曼机（Restricted boltzmann machine,RBM）中的可见层节点二值变量替换为带独立高斯噪声的实值变量，来构造高斯-伯努利受限玻尔兹曼机（Gaussian-Bernoulli RBM,GB-RBM），以此来解决实值数据转换为二进制数据时，易产生噪声的问题[38].GBRBM 的能量函数E(v,h|θ)以及可见单元vi和隐藏单元hi状态为(v,h)时的概率分布P(v,h|θ)分别为：

式中，θ={W,ai,bi}为GB-RBM 的结构参数；W表示vi与hi之间的连接权重；ai表示vi的偏置；bi表示hi的偏置；σi为vi对应的高斯噪声的标准差.在性能优化阶段，通过采用误差约束和无监督学习的混合预训练方法，使GB-RBM 模型的输出最大程度地拟合训练数据.实验结果表明，该方法可以更有效地处理实值序列数据，负荷预测的平均相对误差维持在0.9%～3.7%.

3 新能源出力预测

新能源出力预测主要通过,构建反映光照强度、风速与输出功率之间非线性关系或功率变化趋势的预测模型，并充分利用历史出力数据、天气数据，对深度学习模型进行训练，最终实现多尺度新能源未来出力情况的全面感知和精准预测[44-45].选取了26 篇出力预测代表性文献，分类总结如表3 所示.

表3 电力系统出力预测分类Table 3 Classification of power prediction

由表3 可知，出力预测多采用CNN 和DBN 模型，分别占总数的34.6%和30.8%.

3.1 光伏出力预测

光伏出力受云量、雨、雾等天气条件影响较大，需结合多源天气数据来获得较为精确的预测结果[63].文献[51-53]利用光伏发电历史数据、云量图像等，分解出包含不同特征信息的二维数组，预测了不同时间尺度下，不同容量光伏阵列的输出功率.Zang 等[54]提出了一种基于混合CNN 架构的光伏出力预测模型.通过引入Residual network，建立前后层之间的“短路连接”，有助于训练过程中梯度的反向传播，改善了网络模型退化问题；通过引入Dense convolutional network，增强了特征传播及特征复用，有助于降低模型的复杂程度.与预测模型中单独采用Residual network 或 Dense convolutional network 架构相比，预测结果的均方误差分别降低了22.2%和29.4%.Wang 等[58]在基于长短时记忆递归神经网络的日前（0～24 h）光伏功率预测模型的基础上，考虑了基于序列相关性，通过同时跟踪光伏历史出力、天气等数据反映出的出力周期性波动和随机性波动规律，改善了训练数据不足时，LSTM 预测模型易出现的过拟合问题结合历史出力数据的不同特点，按早晚时段或高低频率等方式，先对预测对象进行分解，再按照分解结果分别进行预测是目前光伏出力预测的研究热点之一[59,64].Yan 等[55]利用快速傅立叶变换进行频谱分析，并结合历史数据特征，得到光伏功率波形高低频率的最佳分界点.如图2 所示，在此基础上，使用CNN 分别对光伏出力波动高频部分和低频部分进行预测，与反向传播神经网络相比，分解后采用的CNN 预测模型，预测结果平均绝对百分比误差降低了45.2%，预测模型的训练效率提高了84.3%.

图2 基于CNN 和频域分解的光伏出力预测Fig.2 Photovoltaic power forecasting based on CNN and frequencydomain decomposition

3.2 风电出力预测

与光伏出力相比，风电出力受天气影响相对较小，但波动性及间歇性更强，因而历史数据的随机性更加明显[65].Khodayar 等[48]针对时空风速预测问题，采用递归LSTM 模型来提取每个风电场的时空特征，并将该时空特征输入图卷积神经网络中，与其他深度学习模型，如DBN 和SAE 相比，可以更好地从历史风速序列数据中学习更深层次的风电出力特征.Wang 等[66]考虑到输入数据的不确定性，通过K-means 聚类对天气数据进行预处理，得到了对预测精度影响较大的样本数据，为提高DBN 模型的预测性能，将可见层受限玻尔兹曼机替换为高斯-伯努利受限玻尔兹曼机，实验结果表明，相对于传统反向传播神经网络，预测精度提高了44.2%.Song 等[60]提出了一种集合经验模式分解—稀疏自编码器的超短期风电出力预测方法.针对高频部分，建立了SAE 预测模型；对于低频部分，引入了埃尔曼神经网络预测模型，与高低频同时采用埃尔曼神经网络的预测模型相比，加入SAE后的预测模型均方根误差降低了1.8%.Zhang 等[49]利用奇异谱分析，将原始风电功率序列分解为趋势和随机波动两部分，如图3 所示，利用DBN 和最小二乘支持向量机（Least square support vector machine,LSSVM）分别对趋势分量和随机波动分量进行预测，与两个分量都采用LSSVM 相比，加入DBN 后的预测结果均方根误差降低了21.2%.

图3 基于DBN 和奇异谱分析的风电出力预测Fig.3 Wind power forecasting based on DBN and singular spectrum analysis

在整个出力预测过程中，仅采用一种深度学习模型，可能无法达到期望的预测效果[50]，在特征提取、模型训练等不同环节分别采用深度学习模型变得越来越流行，此类方法提高了风电出力的预测精度，但也增加了算法的复杂程度.Liu 等[57]将原始风电数据分解为时间特征（不同时段）、空间特征（相邻风机的数据）和运行特征（桨距角控制），在此基础上，通过CNN 网络，从多个维度提取风电出力的潜在特征，最后训练相应数量的GRU 编码器和全连接解码器单元，完成风电出力预测模型的构建，与单独采用GRU 预测模型相比，预测结果的均方根误差降低了14.5%.Hossain等[61]提出了一种由CNN、GRU 和全连接神经网络组成的深度学习预测模型，CNN 从原始数据中自动学习复杂特征，并结合GRU 模型，防止梯度随时间的推移而不断下降，与传统反向传播神经网络相比，预测模型的平均绝对百分比误差降低了24.1%.

4 电力设备健康状态预测

电力系统健康状态预测主要通过各类运行数据、系统参数以及专家知识等，结合深度学习方法建立预测模型，从而对关键设备未来的健康状况进行预测[67].按照不同的部件划分，可以分为机械类设备健康状态预测和非机械设备健康状态预测.选取了18 篇代表性文献，分类总结如表4 所示.

由表4 可知，电力系统健康状态预测多采用SAE 模型，占总数的44.5%.

表4 电力系统健康状态预测分类Table 4 Classification of power system health state prediction

4.1 机械类设备健康状态预测

电力系统机械类设备健康状态预测主要集中在发电环节，如风机齿轮、旋转轴承等部位.Jiang等[78]提出了一种基于去噪自编码器（Denoising autoencoder,DAE）的风机齿轮健康状态预测方法.首先，构建DAE 模型，同时将滑动窗应用于时间序列数据，以获取不同健康状态特征之间的非线性关系和对时间的依赖程度；其次，利用多元正态数据离线建立参考故障指标；最后，将处理后的实时采集数据与参考故障指标阈值进行比较，在线识别风机齿轮的潜在故障.经实际历史数据验证，此方法的预测误差率低于10.0%.

当数据量足够时，深度学习方法可提供更为良好的实现效果；若没有足够的数据量支撑时，预测效果往往难以体现[82].Lu 等[72]在使用生成对抗网络进行数据扩充的基础上，结合ISO10816-3∶2009 定义的各阶段轴承健康状态阈值对LSTM 预测模型训练，完成轴承退化轨迹预测，经轴承运行故障数据集测试，平均预测误差降低了29.2%.为了充分利用有限的原始输入数据，Meng 等[79]在已有研究的基础上，通过注入高斯噪声来改变正则化参数，随着预测模型层数的增加，正则化参数会不断优化，与支持向量机和反向传播神经网络相比，预测准确率分别提高了46.1%和35.5%.

传统健康状态特征提取方式通常需要手动或在系统中增加额外的测量装置来获得设备运行数据，为此，Yang 等[71]考虑两种最常见的退化模式（突然增加趋势和缓慢增加趋势），为每个待训练模式建立了不同的早期健康状态判别模型和风机轴承健康状态CNN 预测模型，实际验证结果表明，相对于已有预测模型，如支持向量回归模型，均方根误差降低了58.3%.Xia 等[80]结合历史数据，将发电机轴承生命周期划分为n个健康阶段，如图4 所示，利用相应退化阶段的训练数据，构建并训练电机轴承健康状态预测模型，与同样采用SDA 进行特征提取，但未进行健康阶段划分的方法相比，预测平均相对误差降低了18.7%.

图4 基于SDA 的发电机轴承健康阶段划分及健康状态预测Fig.4 Health stage segment and health state prediction of generator bearing based on SDA

4.2 非机械设备健康状态预测

非机械类设备健康状态预测多集中在电气控制装置、变压器等部位[83]，在实际工况中，这些设备的工作状态频繁变化，因而采集到的一般为不规则信号，增加了健康状态特征提取的难度，为此，Sun 等[81]提出了一种基于堆叠去噪自编码器的风力发电系统通信及传感器健康状态特征提取方法.首先，分析了数据集中的异常值特征；其次，利用堆叠去噪自编码器来提取故障特征；最后，采用基于密度网格的聚类方法，对故障特征进行聚类，并通过添加窗口，根据异常数据的持续时间，将异常值分类为孤立异常值、缺失数据和可用故障数据.经风机实际运行数据验证，该模型可有效地从高维数据集中提取更深层次的健康状态特征.

Su 等[74]基于互相关系数的变分模态分解来分离原始振动信号的有效模式，并采用短时特征双阈值法来完成特征状态划分.由于单通道收缩自编码器提取的特征缺乏时间维度信息，因此选择多个收缩自编码器通道，以均匀采样时间间隔同步提取连续特征向量，同时，将多个并行收缩自编码器在不同时间提取的特征融合在一起，从而使得最终提取出的特征具有时间信息，在此基础上，构建了针对单个断路器的多通道卷积自编码器LSTM 预测模型，与CNN 等预测模型相比，预测精度提高了9.8%.

Ma 等[75]提出了一种基于LSTM 的变压器健康状态预测方法.假设变压器健康状态出现误判时，由于误判造成的损失程度，即损失权重值可表示为：

式中，ni是第i个训练样本的状态标签；为样本处于误判状态时的概率.在得到损失权重值的基础上，构建了具有可变阈值和动态权重的交叉熵损失函数：

式中，Eal表示交叉熵损失.建立交叉熵损失函数的目的，是为了减少残差收缩网络中的误差传递，提高网络对正常和异常变压器状态的敏感性.实验结果表明，所提预测模型平均误差可维持在0.3%以内.

5 展望

在碳达峰、碳中和目标指引下，电力系统在能源高效调配、新能源电力高比例消纳、电力设备高稳定性运行等方面的挑战也在不断增强.未来，可以从以下3 方面开展进一步研究：

（1）现有负荷预测方法通常以历史负荷作为模型训练数据，实际上，负荷变化情况与温度、风速甚至现阶段国家或地方政策，电力用户所在行业的经济形势等多种因素密切相关，例如面向工业场景的中长期负荷预测，外部经济形势直接影响着工业厂区生产经营状况，进而影响用电负荷.因此，可考虑加入更多的相关影响因素，以进一步改善负荷预测精度.

（2）当前的新能源出力预测基本以集中式新能源出力为主，对分布式新能源出力预测的研究仍有待进一步展开.与集中式相比，分布式新能源出力的波动性与随机性更加突出，影响因素更多，除温度、风速、云量等常规天气数据外，地形、地貌等地理条件对于预测精度的影响不容忽视.深度学习方法可以有效地提取多源数据的时间和空间特征，并进行融合，从而展现出分布式新能源出力预测方面的潜力.

（3）电力系统故障往往具有并发性特点，即某种故障除了直接影响特定电力设备正常运行，也可能会间接造成其他设备失效，现有基于深度学习的健康状态预测方法多针对不变工况以及单一设备失效问题，在实际工程应用中缺乏泛化性，可考虑对变化工况及多种设备失效模式下的电力系统健康状态预测进行深入研究.