APP下载

基于CNN-BiLSTM 的风功率异常数据识别和清洗方法研究

2023-11-16龚亚雄高佳浩李逸黄志华

能源与环境 2023年5期
关键词:风电场风电风速

龚亚雄 高佳浩 李逸 黄志华

(1 中机国际工程设计研究院有限责任公司 湖南长沙 410000 2 哈电风能有限公司 湖南湘潭 411101)

0 引言

风能作为1 种重要的绿色能源,已被世界各国广泛利用,对于各国化解能源危机、减污降碳、提高清洁能源占比具有重要意义[1-3]。随着风能装机容量的增加,风电场的运维成本也相应提高。监测风电机组发电性能,有利于合理安排维护计划,防止故障发生及降低运维成本[4-5]。为评估风力发电机组的发电性能,常采用风功率曲线对风电机组净功率输出与风速间的关系及风机运行特点进行准确描述。但在风电数据采集过程中,受检测装置故障、传输过程受到干扰、强制弃风等因素影响,可能会产生大量的风电-功率异常数据,而该异常数据将会对风电预测准确度造成严重影响,因此需对异常数据进行精确识别和有效清洗[6-7]。

目前,针对风电机组异常数据识别和清洗的研究工作主要集中在突变点检测、建立等效边界、对异常数据进行重构等方面。

文献[8]将异常数据按照数据位置划分为不同类型的数据,并在数据分类基础上,采用变点分组算法和四分位算法进行数据处理。该方法清洗效率高,但容易产生过度清洗,即数据中心聚集区域呈锯齿状。此外,目前较多采用基于距离或密度检测算法进行数据清洗,如k-means 聚类[9]、局部离群因子(LOF)[10]、Thompson tau-[11]等,但此类方法识别效果较差。为解决该类算法的不足,文献[12]根据生成机制对异常数据进行分类,采用DBSCAN 算法、截断法、斜率控制法、核密度估计等方法进行分类识别。该方法对特定类别下的异常数据清洗效果明显,但需依靠人工干预,数据清洗步骤繁琐。文献[13]采用最优组内方差算法根据排序数据计算滑移值,以此识别异常数据。但该方法场景特征相对有限,在异常数据与正确数据差异不明显的情况下,其可行性尚未得到有效验证。参考文献[14]提出了1 个置信度等效功率边界模型,该模型利用风速与功率之间的相关性,通过Copula 函数对数据进行清洗,但该方法得到的置信度等效边界线因风速区间不同而有较大差异且计算复杂度较高。此外,文献[15]和[16]提出了消除异常数据的图像识别方法,为数据清洗提供了另一种可行的解决思路。

然而,上述方法需一定程度的数据预处理过程,算法复杂程度较高,且清洗效果不佳。为此,本文综合考虑异常数据识别清洗的时间、模型建立的复杂程度以及识别清洗方法的效率,将卷积神经网络和Bi-LSTM 方法相结合,利用卷积神经网络特征提取能力强与Bi-LSTM 分类效果佳的特点对采集的风电机组异常数据进行有效识别和清洗,通过贵州电网某风电场的实际数据为算例进行实验和结果分析,并对比几种现存的风电异常数据识别和清洗方法。

1 风功率曲线

基于实测风速和功率的风功率曲线可用于评价风电机组的性能和运行状态,对风电机组故障的检测具有重要价值。而风电机组相当一部分异常数据是由弃风、维护、通信故障等不可控因素产生的,必须进行清洗。

1.1 理论和实际输出功率

风力发电的原理是风电机组将流经风机叶轮毂处的风能吸收并带动机组发电机运转转化为电能。单位时间内作用于叶轮的理论输出功率[17]E 可表示为式(1):

式中:ρ0为参考空气密度;A 为风轮扫掠面积;v 为风速。

因受到气动特性等因素的限制,风电机组风轮只能将其中部分风能转化为发电机运转的机械能[20],根据风力机叶片的空气动力特性,风能转换效率Cp是尖速比λ 和桨距角β 的函数[18],即Cp=f(λ,β)。风电机组捕获的风能Pm可以表示为式(2):

式中:R 为风轮转子半径;Cp(λ,β)为风机的功率系数。

根据贝兹极限理论,在理想条件下,作用于叶轮的理论输出最大功率Pmax为式(3):

根据以上可得风电机组的理论最大效率Cp见式(4),其中Cp也被称为理论风能利用系数[19]。

根据以上推断,即在理想情况下,风轮吸收风能的最大值只占总风能的59.3%。而风电机组实际有用功率为式(5):

风电机组实际输出功率P 随流经轮毂高度处风速v 变化而呈现一定的关系如式(6):

式中:v 为风速;vi为切入风速;vr为额定风速;v0为切出风速;P为额定功率。

1.2 风速功率曲线

风速功率曲线是描述风速与机组输出功率之间的函数关系曲线。它不仅是风电机组控制系统设计和开发的重要参考依据,还是研判风电机组发电性能和风电场运行状况的重要指标。

本文采用贵州电网某风电场的实际数据,该风电场的装机容量为2 000 kW,切入风速3.5 m/s,额定风速12 m/s,切出风速25 m/s,风速与出力数据采样时间间隔为10 min。1 号风电机组原始数据v-p 散点图如图1 所示。

图1 风电机组原始数据v-p 散点图

2 基于CNN-BiLSTM 风功率异常数据检测

2.1 卷积神经网络

CNN 是一种前馈神经网络,可有效地应用于风电机组风功率数据时间序列特征的准确提取。从图2 所示的卷积神经网络模型框架可知,典型的CNN 是由可训练的多层架构组成,其中包括卷积层、池化层、全连接层等[20]。在CNN 的结构中,卷积层通过卷积运算学习输入数据的特征,池化层学习卷积运算得到的特征并进行降维和二次特征提取操作,全连接层对池化运算后得到的输入数据特征进行聚合。本文可以提取输入数据的隐式信息,实现对时间序列的更快、更稳定的特征提取功能。

图2 卷积神经网络模型框架

在卷积层,对采集风功率输入数据进行卷积核卷积,激活函数生成输出特征向量,本文采用相同的卷积核,式(7)为卷积层的计算过程:

式中:Yc表示卷积层的输出;f 表示ReLU 激活函数;Wc表示权重因子;⊗表示卷积核;Xc表示输入数据;bc表示偏置值。

卷积神经网络拥有表征学习能力,其对输入数据能够按其网络结构层层学习,且基于卷积神经网络提取特征效果明显以及对数据没有额外的特征工程要求,因此本文采用卷积神经网络对用户用电数据特征自适应提取。

2.2 Bi-LSTM 算法

长短时记忆网络(Long Short-Term Memory,LSTM)为1 种改进循环神经网络(Recurrent Netural Network,RNN),相比于CNN 有更好的局部特征提取能力,既能关注用户负荷数据的时序特征,又能通过特殊的“门”内部机制有效解决了RNN 中用电数据长序列训练时梯度消失和梯度爆炸缺陷[21]。

为更有效且更全面获取时间序列数据上下文信息,双向长短时记忆(Bidirectional Long Short Term Memory,Bi-LSTM)为基于LSTM 优势上,集合了输入时间序列在前向和后向方向信息,将RNN 神经元分为两个方向,即前向状态和后向状态,输出层可同时从前向和后向状态获取信息,如图3 所示为Bi-LSTM 模型结构图。前向LSTM 读取输入时间序列数据从x=(x1,x2,…,xn),并计算前向隐藏状态序列。前后LSTM 以相反的顺序读取输入时间序列数据,即x=(xn,xn-1,…,x1),并生成反向隐藏状态序列。通过连接前向隐藏状态和后向隐藏状态,可得最终输出序列数据为y=(y1,y2,…,yt,…,yn)。

图3 Bi-LSTM 模型结构图

2.3 CNN-BiLSTM 异常检测

CNN-BiLSTM 异常检测模型结构如图4 所示,风功率数据实质上为一维的时间序列数据,其中一维的卷积神经网络CNN 用于提取分功率数据的特征以产生特征向量,Bi-LSTM用于提取周期性时序特征,以此增强风速-功率特征敏感度;全连接层的全连接神经网络对Bi-LSTM 获取的每个特征向量进行预测,将得到的输出神经元sigmoid 函数σ(·)的分类器完成最终分类预测。

图4 CNN-BiLSTM 模型结构

基于CNN-BiLSTM 的风功率异常数据检测模型的具体网络参数设置如表1 所示。

表1 CNN-BiLSTM 模型的参数设置

3 算例实验

为验证本文所提的风电机组异常数据识别和清洗方法的有效性,本文采用贵州电网某风电场某一年1 月至12 月整年的实际数据进行验证。该风电场的装机容量为2 000 kW,切入风速3.5 m/s,额定风速12 m/s,切出风速25 m/s,风速与出力数据采样时间间隔为10 min。随机采用1 号机组数据为研究对象,如图5 为去除在散点图中表现为横向堆积型数据的预处理后的原始数据图。

图5 预处理后的原始数据图

根据2.3 节的识别和清洗流程,针对1 号机组的异常数据进行识别、清洗。清洗后散点图如图6 所示。

图6 清洗异常数据后的散点图

为了进一步验证本文所提方法的有效性,对比几种现存的风电异常数据识别和清洗方法。本文通过比较现存的2 种常见的风电机组异常数据清洗方法,即局部离群因子LOF 方法和四分位法。此外,本文将文献[11]中Thompson tau-识别清洗方法参与比较,利用上述采用的1 号机组,以及相同风电场的14 号和20 号机组为研究对象进行验证。验证结果如表2所示。

表2 不同方法数据清洗结果

由表2 可知,本文所采用方法在不同机组数据下,均能有效地实现异常数据删除,且删除率均大于30%,与表中其他方法相比,本文方法对异常数据删除率均更优,因此可以验证本文所提方法的有效性。

4 结语

针对传统风速-功率异常数据识别和清洗算法所建立的模型复杂,而现有基于人工智能的算法清洗效果有待进一步提高等问题。本文以风速-功率数据为对象,提出了基于CNNBiLSTM 的机器学习算法对风速-功率异常数据识别方法。实验结果和分析表明,基于CNN-BiLSTM 的风速-功率异常数据识别和清洗算法在不同的风电场均可有效识别和清洗。与其他方法相比,该方法对异常数据的去除精度更高,进一步验证了该方法的有效性和优越性。在今后的工作中,作者将进一步对风电领域的其他变量进行数据清理,并对缺失数据进行重构,以保证数据的完整性。

猜你喜欢

风电场风电风速
基于Kmeans-VMD-LSTM的短期风速预测
基于最优TS评分和频率匹配的江苏近海风速订正
基于PSS/E的风电场建模与动态分析
海上风电跃进隐忧
分散式风电破“局”
风电:弃风限电明显改善 海上风电如火如荼
基于GARCH的短时风速预测方法
含风电场电力系统的潮流计算
重齿风电
考虑风速分布与日非平稳性的风速数据预处理方法研究