APP下载

基于多层级时空图神经网络的风电机组在线异常检测

2024-03-29王承民刘保良杨镜非黄淳驿

电力系统自动化 2024年5期
关键词:子图风电注意力

郑 毅,王承民,刘保良,杨镜非,黄淳驿

(1.上海交通大学电子信息与电气工程学院,上海市 200240;2.沈阳工程学院电力学院,辽宁省沈阳市110136)

0 引言

风能作为清洁和可再生能源的佼佼者,过去二十年的发展历程中见证了其在商业化应用上的显著成功[1]。近年来,由于风能资源丰富的山区、远海等偏远地区的风电机组数量持续增长,当地的极端环境(如极端的温差和强风)使其故障率远超其他发电设备[2-3]。传统的风电场机组维护策略主要依赖于定期和故障后维护,然而这仅能处理风电场机组的部分检测和预警问题[4],加之备件部署周期长,大型风电场的故障维护成本仍旧居高不下。因此,如果能在早期发现风电机组故障,将有助于显著降低维修成本。由此可见,风电机组的故障检测无疑是风电产业发展的关键技术环节之一。

目前,数据驱动方法已成为风电机组故障诊断中的热门技术,其基于数据分析技术,通过深入挖掘离线和在线大数据,找寻故障特征并确定故障的发生原因、位置及时间,这种方法通常归结为信号处理方法和大数据方法两大类[5-6]。

基于信号处理的方法,是对监测设备捕获的信号进行分析,如润滑状态、声发射和振动信号等,通过对比正常状态与故障状态下的信号特性进行故障诊断[7-8]。文献[9]表明,采用稀疏时频表示方法能有效提高基于振动信号的风电机组故障诊断的准确性。然而,信号处理方法仍受制于诸如成本高、传感器耐用性高、检测信号不足等多种因素的影响。

基于大数据技术的诊断方法主要依赖于统计学、机器学习、深度学习等技术,对海量数据进行高度自动化的分析,将状态检测所获得的数据转化为反映退化行为的相关模型。由于无须安装额外的数据采集设备,基于数据采集与监控(SCADA)系统数据驱动的大数据方法已成为目前较为经济适用的风电机组故障诊断方法[10]。然而,故障状态数据相对于正常状态数据出现的概率较低,导致样本标签不均衡,这无疑对风电机组故障诊断的准确率造成影响[11]。虽然可以通过人工标注的方式缓解故障标签稀缺的问题,但由于故障数据场景的复杂性[12],需要投入大量的时间成本,对技术人员的专业背景也有较高要求。因此,开发更低成本且无需人工干预的方法是这一领域的发展方向。

近年来,正常行为建模(normal behavior modelling,NBM)作为一种仅利用历史健康数据建立故障检测模型的方法,已受到越来越多的关注[13-14]。NBM 方法通常分为预测阶段和故障检测阶段。在预测阶段,基于历史健康数据,NBM 方法构建正常行为预测模型,进而计算预测值与实测值之间的残差。在故障检测阶段,NBM 方法依据得到的残差构建正态分布模型来识别异常值,从而判断目标风电机组是否处于异常状态,故NBM 故障检测方法被视为一种具有潜力的低成本解决方案。文献[15]提出了一种结合相关向量机和基于残差的风电机组故障检测与隔离的方法。文献[16]则提出了一种利用堆叠自编码器来识别健康状态,进而诊断旋转机械部件故障的方法。

在风电机组故障检测领域,NBM 模型的性能主要取决于模拟正常运行模式的精确度。目前,尽管已有一些正常行为预测方法,但拟合精度仍有待提高。这主要是因为当前的算法在处理风电机组系统的时空关联特性方面存在局限。时空关联特性涵盖了两个关键维度。首先,空间关系是指风电机组的各个子系统或组件之间的相互依赖以及耦合关系。这种复杂关联也体现在部署于不同位置的传感器所测量的各状态参数之间。例如,当风电机组速度增加时,会引发多个变量的相应改变,比如,振动频率上升、温度增高和电流增加等。其次,时间关系主要指风电机组的SCADA 系统的时间序列数据在不同时间点之间的动态相关性[17]。比如,在风电机组出现故障前的亚健康期,其数据通常与故障发生时的数据有一定的相关性。

因此,有效挖掘风电机组SCADA 系统数据的时空关联特性对NBM 模型在故障检测方面的表现有着至关重要的影响。在解析空间相关性方面,卷积神经网络以及其变体,如多核融合卷积神经网络和残差网络,已被成功应用[18-20]。这些网络通过权重共享和模式识别可以有效捕捉空间关联性,但在处理风电机组SCADA 系统传感器数据的非欧氏空间依赖时面临挑战。为应对这一问题,图神经网络逐渐受到重视,它们用拓扑图描述不同节点和边的关系,并成功应用了如快速图卷积网络(GCN)和图注意力(GAT)机制网络等先进的图卷积算法[21-23]。在时间关联性方面,循环神经网络及其变体,如长短期记忆网络和门控循环单元(GRU)等,已被证明能有效捕获风电机组的时序数据特性[24-26]。这些模型都在一定程度上成功地识别了风电机组的故障模式。最近,基于自注意力机制的Transformer 模型也在风电机组故障检测方面表现出色,尤其在处理数据的较长时间依赖关系方面[27]。

然而,现有的大多数研究主要集中在单一的时空尺度上,缺乏对风电机组系统多维特性的综合考虑。例如,虽然GRU 在处理复杂、非线性的时间序列数据方面表现得相对优秀,但由于没有全面地分析风电机组系统的空间特性和时间相关性,其在基于NBM 模型的风电机组故障检测方法中的效率仍有待提升。因此,未来的研究需要更加综合地考虑时空关联特性,以进一步优化NBM 模型在风电机组故障检测方面的性能。

针对风电机组故障检测研究中现存的问题,本文提出了一种新的在线诊断方法,该方法以多层级时空图神经网络为基础,进行风电机组运行状态的在线诊断。具体来说,本文研究的主要贡献如下:1)基于风电机组的物理结构,运用多层级构图方法,通过划分风电机组功能单元来构建与物理结构紧密关联的预测模型;2)采用GAT 机制对风电机组的全局传感器节点特征进行重构,并通过融入多头注意力机制,综合性地提升了正常行为预测模型的空间关联特性;3)设计动态图神经网络模块,进一步更新每个风电机组功能单元内部的传感器节点特征,引入时间序列的注意力机制模块,增强正常行为预测模型各个时刻的时域关联特征。为了证明该方法的有效性,文中所提方法已在中国上海某风电场的真实数据集上进行了实验,并得出了积极的效果,证明了该方法具有实际应用价值。

1 风电机组在线故障检测框架描述

本文提出了一种新的风电机组异常状态检测方法,该方法主要包括风电机组正常行为预测建模以及生成风电机组异常状态自适应阈值的流程,如图1 所示。对于风电机组正常行为预测模型,采用了由GAT 机制网络层、7 个并行子图网络层和多头注意力机制网络层构成的结构。每个子图网络层又由动态图神经网络模块、时间序列注意力机制模块和向量化模块组成。生成风电机组异常状态自适应阈值的过程,主要包括构建先验概率模型、构建风电机组输出功率正态分布模型和生成在线检测的自适应阈值。

图1 风电机组在线故障检测的总体框架Fig.1 Overall framework of online fault detection of wind turbines

1.1 正常行为预测建模

在多层级时空图神经网络正常行为预测模型的训练过程中,输入特征采用上一个时间窗口的各个风电机组功能单元的检测参数。而该模型的输出标签为下一个时间窗口的风电机组状态参量。本文选用风电机组输出功率作为正常行为预测模型的输出标签,不同功能部件也可选择不同的状态参量。例如,检测轴承故障时,可以选用轴承温度作为预测模型的输出标签。因此,风电机组正常行为预测模型可以描述如下:

式中:v=[x1,x2,…,xi,…,xN]表示输入节点特征矩阵,其中,N为SCADA 系统的传感器的总数,xi为 传 感 器i的 节 点 特 征;A为 邻 接 矩 阵;Ŷ=[pt,pt+1,…,pt+T]表示预测模型的输出标签矩阵,其中,pt+T为t+T时刻风电机组状态参数的预测值,T为时间窗口的大小。

1.2 风电机组异常状态自适应阈值生成方法

本节将逐一详解故障检测过程的关键步骤。为了确保实时检测结果可从历史运行数据中获得有力的指导,采用一种综合性的方法,包括使用最大后验概率估计、文中所提的正常行为预测模型(即多层级时空图神经网络模型)以及历史健康数据。通过这一多元化的策略,构建了风电机组在正常运行状态下不同时间窗口状态参数的正态分布模型。进一步地,采用了四分位距(interquartile range,IQR)方法来确定异常状态的自适应阈值。此方法基于已经构建的不同时间窗口下的正态分布模型,为风电机组在正常状态下设置了动态调整的异常阈值,具体过程如下。

1.2.1 先验概率模型构建

首先,对历史健康数据应用Z-score 模型进行标准化处理,然后基于这些数据建立如式(2)所示的正态分布模型。

式中:μ和σ分别为正常历史数据的均值和标准差;y′为风电机组正常状态下的状态参数预测值;p(y′)为y′的概率分布函数。

1.2.2 正常状态下风电机组输出功率的正态分布模型构建

在这一部分,基于一个关键假设:每个健康数据样本都遵循正态分布,该正态分布的参数是基于历史正常运行数据得出的。因此,每个时间窗口内风电机组在正常运行状态下的状态参数的正态分布均值也将服从先前在1.2.1 节中得到的先验概率分布。为了构建这一正态分布模型,该部分使用最大后验概率估计来计算风电机组在正常运行状态下各个时间窗口内预测样本集的中位数,如式(3)所示。这一估计方法的优势在于,它能同时考虑历史健康数据和当前的预测数据。具体来说,利用风电机组在正常状态下的预测状态参数(来源于多层级时空图神经网络模型)以及先验概率分布(通常基于历史数据)来估计正态分布的参数。

式中:p(Ŷ|θ)表示在给定模型参数θ(例如,风速、温度等外部条件)的风电机组正常状态下,Ŷ的概率密度;θ̂MAP为风电机组正常状态下,Ŷ的正态分布的中位数;Pt为t时刻预测的风电机组正常状态下的状态参数,例如,预测的风电机组功率或轴承温度;Pr(Pt|θ)表示在给定模型参数θ下,Pt的预测值出现的概率;Pr(θ)表示在给定模型参数θ下的先验概率分布。

1.2.3 风电机组异常状态自适应阈值生成

在得到与风电机组健康状况相关的各时间窗口正态分布模型后,利用IQR 方法生成风电机组异常状态自适应阈值,如式(4)—式(6)所示。这种方法确保了历史运行数据的经验能够被继续利用,从而提升在线检测的准确性。

式中:CDF(·)表示累积概率密度函数;CDFPt(·)表示t时刻状态参数Pt取值小于或等于某个特定的状态参数(即式(5)的Q3,t、Q1,t)的概率;σt为t时刻状态参数的标准差;Q1,t为t时刻的上四分位值;Q3,t为t时刻的下四分位值;μt为t时刻风电机组目标状态参数正态分布模型的中位数,即式(3)通过最大后验概率估计所得的θ̂MAP;δIQR为Q1,t与Q3,t的差值;VUT,t、VLT,t分别为风电机组上、下边界阈值。

2 多层级时空图神经网络设计原理

为了深入挖掘风电机组SCADA 系统数据中的时空关联特性并提升预测模型的精度,提出了一个创新的设计理念:基于风电机组的物理结构,利用多层级构图方法来构建正常行为预测模型。这种模型将风电机组的功能单元进行划分,使得预测模型与物理结构形成紧密的联系。

SCADA 系统实时监测的主要目标包括风电机组的变桨、机舱、齿轮箱、变流器、出力质量及自然环境等单元,这涉及总计37 个监测参数。表1 详细列出了各个机组单元所包含的监测参数[28-29]。基于此,设计的多层级图主要由以下部分组成:风电机组全局传感器节点互联特征图、风电机组各功能单元的传感器互联特征子图以及各功能单元全局互联特征图,具体如图2 所示。

图2 风电机组多层级图Fig.2 Hierarchical diagram of wind turbines

接下来,将基于所提出的多层级图结构,详细阐述在构建基于多层级时空图神经网络的正常行为预测模型的过程中,GAT 机制网络层、子图网络层以及多头注意力机制网络层的设计原理。

2.1 GAT 机制网络层

在训练正常行为预测模型的过程中,模型首先进入一个专用GAT 机制网络层,以便对输入数据进行高密度优化。这个网络层主要包含两个核心模块:1)GraphConv 图神经网络层;2)由Masked 注意力机制支持的GAT 机制。

具体而言,模型首先通过GraphConv 图神经网络层进行预处理。在这一阶段使用如式(7)所示的邻域聚合法来更新每个节点的属性。式中包含两个可学习的权重参数W1和W2,W1用于传递自节点信息,W2用于聚合邻域节点信息。与传统的GCN模型相比,GraphConv 图神经网络层使用这两个独立的权重参数来分别优化自节点和邻域节点的影响,从而有效提升模型的性能。

式中:σ(⋅)表示激活函数,例如LeakReLU、Sigmoid函数;vj为邻居节点j隐藏层的输入特征;vi为自节点i隐藏层的输入特征;ej,i表示节点j和i之间的连接状态,为了求得任意两个传感器节点之间的影响程度,所有的ej,i将被视为1;si表示节点i的隐藏层的重构特征;Ni表示节点i的邻居节点集合。

在完成GraphConv 图神经网络层的处理后,模型转入由Masked 注意力机制构建的GAT 机制环节,旨在精确地量化风电机组SCADA 系统内各传感器节点间的相互影响。首先,模型执行一个维度变换,通过可学习的权重参数将输入的隐藏状态从F维映射到F′维,以便捕获更为复杂的特征关联。接着,模型应用一个共享的线性变换函数(如式(8)所示),为接下来的注意力计算准备适当的特征表示。在这一步骤中,LeakyReLU 被用作激活函数,并通过Masked 注意力机制来计算节点i和节点j之间的关联特征。这些关联特征经过归一化处理,进而计算出两个节点间的注意力系数。最后,这些注意力系数通过可训练的权重参数被融入节点特征中。具体来说,它们以均值化的方式嵌入由式(7)定义的节点特征中(如式(9)所示)。在模型的初始化阶段,所有与注意力机制有关的权重参数都会被随机初始化,通常采用Glorot 初始化或He 初始化等方法[29]。随着模型训练的进行,这些权重参数将通过梯度下降或其他优化算法进行持续更新。通过使用均方误差等损失函数,模型能更精确地捕获各功能单元和传感器节点间的相互影响强度。

式中:si,j表示节点i的邻居节点j隐藏层的重构特征;aT(Wsi//Wsi,j)表示通过将节点i和j的经权重矩阵W变换后的特征向量进行拼接,并与可学习的权重向量a进行点积,以计算出GAT 机制中这两个节点之间的关联强度;K表示GAT 机制中注意力头的数量;s′i表示节点i在GAT 机制网络层的最终输出特征;αij,k表示注意力头k中节点i和j之间的注意力系数;Wk为注意力头k的可训练的权重参数。

2.2 子图网络层

在GAT 机制网络层完成风电机组全局传感器节点特征的重构和关联性捕捉后,该模型将进入子图网络层进行更深一步的设计和实现。通过多层级方法,按照表1 所示,将GAT 机制网络层重构的风电机组传感器节点特征划分为7 个不同的功能单元子图。这些子图随后被输入图1 所示的7 个并行子图神经网络层中,以便进行独立训练。

在这一环节,每个并行子图网络层都由动态图神经网络模块、时间序列GAT 机制模块和向量化模块组成,如附录A 图A1 所示。其中,动态图神经网络模块首先接受每个功能单元子图的节点特征和边信息作为输入,再经过计算输出更新后的节点特征。这些更新的节点特征随即作为时间序列GAT机制模块的输入,目的是进一步应用时间序列注意力机制来捕捉节点特征在时间维度上的波动性,输出为具有时间关联性的节点特征。最后,这些时间关联性的节点特征被传递到向量化模块,该模块通过池化和降维操作将每个功能单元子图的特征矩阵转化为一个单一的特征向量,作为该模块的最终输出。这一系列操作是为了在后续的多头注意力机制网络层中更精确地分析各功能单元子图间的关联度。这样的设计框架旨在更高效地捕获风电机组各功能单元和传感器节点间的复杂相互作用。

2.2.1 动态图神经网络模型

如式(10)—式(12)所示,通过上一时刻子图d的隐藏状态hd,t-1和当前时刻子图d经历GCNConv模型(GCNConv 模型是GCN 的一个变体,与GraphConv 模型相似,只是图结构的聚合方式不同,GraphConv 模型以式(7)的方式聚合,GCNConv 模型以式(10)的方式进行聚合)重构后的状态特征,GRU 模型计算得到控制更新的门控状态zt和控制重置的门控状态rt。通过重置门控状态将上一时刻隐藏状态的信息传入当前时刻的隐藏状态h͂t,如式(13)所示。在更新记忆阶段,通过让上一时刻选择性遗忘的信息和当前时刻选择性记忆的信息保持联动,得到了同一子图内的时空特征的重构特征hd,t,如式(14)所示。

式中:Âd,t为t时刻子图d的邻接矩阵;D͂d,t为t时刻子 图d的 度;表示基于边的归一化操作;Xd,t为t时 刻 子 图d的 输 入 特 征;X′d,t为t时 刻 子图d在经历GCNConv 模型重构后的特征;θd为子图d在GCNConv 模 型 中 的 训 练 参 数;h͂t为t时 刻 候 选隐藏状态;Wz、Wr、Wh͂分别表示更新门的权重矩阵、重置门的权重矩阵、候选隐藏状态的权重矩阵。

2.2.2 时间序列注意力机制

引入时间序列注意力机制模块,以进一步强化各时刻的时间特性,增强各训练时刻特征的相关性。首先,利用两个隐藏层网络将目标子图d的时间窗口特征矩阵映射为一个特征参数矩阵ed,如式(15)所示。然后,利用式(16)对各时刻的特征参数进行归一化。最后,通过式(17)将所求得的各时刻的权重参数融入原有的各时刻输入特征中。

式中:Hd={hd,t,hd,t+1,…,hi,t+T}为子图d的隐藏层输入状态特征;ed=[ed,t,ed,t+1,…,ed,t+T]为子图d的隐藏层映射状态特征组成的矩阵;w(1)、b(1)分别为第1 层网络映射的权重参数和偏差;w(2)、b(2)分别为第2 层网络映射的权重参数和偏差;αd,t为t时刻子图d的特征在整个时间窗口中所占的权重;Cd,T为子图d嵌入关联特征的时间窗口特征。

2.3 多头注意力机制网络层

在风电机组各功能单元全局互联图的基础上,本节将借助多头注意力机制网络层(如附录A 图A2所示),进一步揭示风电机组各功能单元全局互联图的高阶空间特性。值得一提的是,多头注意力机制可以视为自注意力机制的扩展,它不仅增加了模型的容量,还允许模型从多个不同的子图空间的表征中捕获信息。在启动自注意力运算前,该模型需要首先生成一组投影矩阵:查询矩阵Q、键矩阵K和值矩阵V。这些投影矩阵是通过将特征矩阵X(由7 个子图向量构成)与3 个可学习的权重矩阵WQ、WK和WV相乘得到的,如式(18)所示。

此步骤是自注意力机制中的关键环节,目的在于将输入特征矩阵转化为一组新的表征以便于后续计算。在模型初始化阶段,采用随机初始化方法,例如Xavier 或He 初始化[29]来对3 组可 学习的权重矩阵WQ、WK和WV进行初始化设置,这些初始化设置的权重会在多次迭代和反向传播的过程中逐渐优化,以达到模型最佳性能。

上述步骤之后,在多头注意力机制中引入Qd、Kd、Vd,它们分别是每一个“头”中的查询、键和值矩阵。在这里,每一个“头”都有一组自己的Qd、Kd、Vd,这些矩阵是由特征矩阵X和对应的可学习权重矩 阵WQd、WKd、WVd通 过 矩 阵 乘 法 得 到 的(用Attention(Qd,Kd,Vd)表示各个输入特征之间的关联程度)。每个“头”在其子空间中进行自注意力计算,对Qd和Kd矩阵进行点积计算,并采用Softmax函数得到各个子图节点特征之间的关联权重,这些权重随后与输入值投影矩阵Vd相乘,形成融合了相邻子图特征的新全局特征,如式(19)所示。

应用多头注意力函数MultiHead(⋅)(如式(20)所示)来全面反映各子图间的不同权重关系。对于多头注意力机制,该模型不仅在单个“头”上执行上述操作,而且将多个这样的“头”并行运行并将结果进行拼接(用Concat(⋅)表示拼接操作,共有h个“头”)。每个“头”都有自己的一组权重矩阵,这些权重矩阵在训练过程中都是可学习的。在多头注意力机制的应用中,每一个“头”都具有独特的能力,以捕捉风电机组全局互联图(包括变桨、齿轮箱、机舱、微气象仪、出力质量、变流器、发电机7 个子图)的不同方面,以适应更复杂或更不确定的正常环境特征。例如,“头”head1可能专注于捕捉与变桨和微气象仪之间的交互,如风速和风向如何影响桨叶的调整;“头”head2可能关注发电机和变流器之间的关系,如发电机的转速和变流器的功率调节之间如何相互影响;“头”head3可能研究出力质量与其他各个单元(如发电机或变流器)的关联性,例如,电流波动与变流器调节的关系。

最后,权重矩阵W0也是一个可学习的参数。这样不仅得到了风电机组的全局图特征,还确保这一特征全面考虑了每个子图的重要程度评分,这些权重和系数都是在模型训练过程中自适应地学习所有相关的权重和注意力系数,确保了模型能够全面地捕捉风电机组各功能单元在全局图中的复杂交互关系。

3 实验论证

为了验证本文提出的基于多层级时空图神经网络的风电机组在线异常检测方法的优势,实验部分选择了Pytorch 框架进行编程,并在CUDA 1.11 环境中进行训练。利用Intel Core i9-11900K 3.5 GHz CPU 和NVIDIA GeForce RTX 3090 显 卡,对SCADA 系统数据进行了深度训练。这部分工作的主要目标是验证本文所提方法在处理风电机组在线异常检测任务上的高效性和准确性。

3.1 数据描述

首先,本文利用2019 年中国上海某风电场1 台风电机组前9 个月的历史健康SCADA 系统数据进行模型训练,以预测其正常行为。然后,使用第10个月的SCADA 系统数据对风电机组故障诊断的准确性进行验证。具体而言,选择上一时间窗口的状态参数(如表1 所示),与风电机组的各功能单元相匹配,作为正常行为预测模型的输入,并以下一个时间窗口的风电机组输出功率作为预测模型的输出标签。研究对象为每10 min 间隔采样的标准日志。

在上传历史健康数据和上传在线数据的过程中,首先根据风电机组SCADA 系统的故障列表,对系统记录的故障数据进行过滤。随后,采取零均值数据标准化的数据预处理方法,滤除了两倍标准差以外的离群数据,以及那些在故障潜在阶段可能不会触发警报的数据。这样的处理保证训练数据真实地反映了风电机组的正常状态。

在测试阶段,选用的第10 个月的测试数据由4 000 个正常数据样本和200 个故障数据样本组成。故障数据主要包括风电机组的变桨齿轮故障、桨叶叶片故障、发电机转轴故障和变桨轴承故障。

3.2 实验结果与分析

本文的实验部分对4 种风电机组的常见故障类型进行了详细的测试和验证,包括:变桨齿轮故障、变桨轴承故障、桨叶叶片故障以及发电机转轴故障。利用真实的SCADA 系统数据,该部分揭示了所提出的多层级时空图神经网络模型不仅能检测当前的异常状态,还能预测并预警即将出现的潜在问题,特别是那些可能被现有SCADA 系统和巡检人员忽视的初期故障。接下来,将分别深入分析和探讨这4 种故障类型的检测效果。在图3 及附录A 图A3 至图A5 中,上界阈值和下界阈值均由 1.2 节所述的风电机组异常状态自适应阈值生成方法获得。超越这些阈值的数据点可能指示异常或故障状态,而位于上、下界阈值之间的数据则被视作正常运行状态。绿色实线标识的实际故障标签代表了SCADA 系统在实际运行中所记录下的故障事件。当绿线与黑色虚线(代表故障标识)重合时,即表明SCADA 系统曾在该时刻检测到故障。此外,由于在风电机组异常状态自适应阈值生成方法中,处理历史健康数据的一项重要步骤是使用Z-score 模型对数据进行标准化处理,如1.2.1 节所述,故为了保证数据的一致性和可比性,实验效果均以标准化有功功率为基准进行呈现。尽管文中以有功功率为例,但本文所提的多层级时空图神经网络方法适用于风电机组的多种状态参数。选用有功功率是因为它在状态识别中具有代表性,并为验证方法有效性提供了合适的测试场景。

图3 变桨轴承故障检测效果Fig.3 Detection effect of pitch bearing fault

通过1.2 节所述方法识别出有功功率异常变化时,标志着多种潜在故障状态的出现。针对这些异常,将采用2.3 节中由式(19)所得的各功能单元的权重占比,来判断具体的故障部位。所提方法在采用多头注意力机制之前,已经通过子图网络层和GAT 机制网络层深入挖掘了风电机组各功能单元之间的时空关联性变化。这种时空关联性变化的深度挖掘揭示了风电机组各功能单元之间的相互影响和依赖性,为后续故障定位提供了有力理论支撑。因此,通过观察各功能单元权重占比的异常变化,可以更准确、更快速地定位到具体的故障部位。

3.2.1 本文所提故障检测方法的过程演示

为了详细解释本文所提故障检测方法的诊断过程,此处将以变桨轴承故障的检测过程作为演示。变桨轴承故障也是风电机组的常见问题,可能由轴承过载、润滑不足或材料疲劳等因素引发。这种故障可能导致发电效率下降,严重时可能引发风力发电机系统故障,甚至导致设备永久损坏,同时也会增加维护成本和停机时间。因此,对变桨轴承故障及时地检测和预警,对于延长风电机组使用寿命具有关键性意义。

图3 呈现了变桨轴承故障检测效果。图中,绿色实线取值为1 的瞬间对应于SCADA 系统所记录的实际变桨通信故障发生时间。观察时刻165 至186 可以看到,实际输出功率明显超越了下界阈值,表明风电机组在这一时间范围内很可能处于非正常运行状态。值得强调的是,这一异常状态的识别显著早于时刻176 出现的实际故障标签。这一观察结果进一步证实了本文提出的故障预测模型不仅具有识别当前变桨轴承异常状态的准确性,而且还能有效地预警即将出现的潜在问题。这种预警能力适用于那些容易被现有SCADA 系统和巡检人员遗漏的早期故障。

图4 展示了变桨轴承故障中各功能单元影响权重占比的动态变化,深刻反映了风电机组各功能单元在变桨轴承发生故障时,各个功能单元的影响权重是如何随着时间演变的。其中,各功能单元的颜色变化揭示了权重变化的过程,而颜色的深浅则由右侧的热力条清晰展示,直观反映了权重占比的多少。由图4 可知,每个功能单元的影响权重确实会随时间发生变化,这也印证了所提出的GAT 机制网络和子图神经网络能够有效挖掘风电机组各功能单元在故障发生时的时空关联特性。

图4 变桨轴承故障中各功能单元的影响权重占比变化Fig.4 Changes of influence weight ratio for functional units in pitch bearing fault

通过在时刻165 至186 区间内捕捉到的变桨系统关联度的异常变化,即其影响权重占比突然变得极大,实现了对变桨单元故障的精准定位。这一现象实际反映了当变桨轴承出现故障时,由于变桨轴承温度等状态参数的突然上升,变桨单元对整体系统性能的影响变得更加显著。因此,在进行关联分析时,其权重会异常上升。此外,变桨系统是调整叶片角度以适应不同风速的关键组件,这也与图3 所示结果相互验证。当变桨轴承发生故障时,叶片无法准确调整到最佳角度,导致风能无法被完全捕获并转化为电能,风电机组的输出功率会低于正常情况下的故障阈值。因此,本文所提方法不仅深化了对风电机组功能单元的时空关联特性的理解,也为风电机组故障的精准定位提供了强有力的支持。

3.2.2 不同故障场景中的故障检测结果

为了验证本文所提方法的泛化性,将分别列举变桨齿轮故障、桨叶叶片故障以及发电机转轴故障,具体检测结果和分析如下所示。

1)变桨齿轮故障

变桨齿轮故障是风电机组常见的问题之一,可能由齿轮磨损、润滑系统缺陷,或是设计制造中的问题所引发。这种故障可能导致风电机组功率输出降低,严重情况下甚至会引发更大的系统故障,造成风电机组不可修复的损害,同时也会增加维修成本。因此,对风电机组的变桨齿轮进行有效监测,对保障其稳定运行具有关键性意义。

附录A 图A3 所示为变桨齿轮故障检测效果。图中:绿色实线值为1 的特定时刻表示SCADA 系统记录下的变桨通信故障发生的实际时间。观察时刻102 至144,可以注意到实际输出功率超出了下界阈值,这意味着风电机组在这一时段内的运行状态可能已出现异常。值得注意的是,这一异常检测明显早于时刻110 所标记的实际故障发生时间,验证了所提故障预测模型不仅能准确识别当前的变桨齿轮异常状态,而且具备预测及提前预警未来潜在问题的能力,这对于识别那些容易被现有SCADA 系统和巡检人员忽视的早期故障问题具有特别重要的意义。

2)桨叶叶片故障

风电机组桨叶叶片故障通常由材料疲劳、制造缺陷或运营中的不当应用(如超速旋转、碰撞等)引起,这样的故障可能导致整个风力发电系统的效率下降、增加维护成本,甚至可能引发更严重的安全问题,例如,叶片断裂飞出。及时的故障检测不仅可以减少这些风险,还能优化风力发电的整体性能,通过预测性维护减少停机时间,从而提高经济效益和系统的可靠性。

附录A 图A4 所示为桨叶叶片故障检测效果。图中,绿色实线取值为1 的瞬间标示了SCADA 系统记录的桨叶叶片实际故障发生的时刻。在时刻19 至30 范围内,实际输出功率突破了下界阈值,可明确地指示风电机组在这一时段内有可能面临非正常运行状况。这一异常检测早于时刻24 出现的实际故障标签,从而进一步验证了提出的故障预测模型的精准性和前瞻性。具体来说,该模型不仅能准确地识别出当前桨叶叶片的异常状态,而且还具有预测和预警未来可能出现的潜在问题的能力。

3)发电机转轴故障

风电机组发电机转轴故障通常由轴承磨损、材料疲劳或不平衡负荷等因素引起。这种故障可能导致发电效率降低,或在极端情况下造成发电机过热、机械损坏,甚至触发全系统故障。及时的故障检测和监控能够识别出问题的早期迹象,从而允许采取预防性措施,例如,更换轴承或调整负荷,以维护系统的稳定运行和长期可靠性,同时还能显著降低维护成本和系统停机时间。

附录A 图A5 所示为发电机转轴故障检测效果。图中:当绿色实线取值为1 时,标记了SCADA系统所记录的发电机转轴故障的实际发生时刻。值得关注的是,在时刻46 至54 内,实际输出功率超越了下界阈值的参考线,这表明风电机组在这特定时间段处于异常运行状态。这一异常状态的识别明确早于时刻50 的实际故障标签,进一步证实了本文提出的多层级时空图神经网络模型在故障预测方面的准确性和前瞻性。具体而言,该模型不仅能够准确地识别和定位当前发电机转轴的异常表现,而且还具备预测和预警未来潜在问题的能力。

根据图5 的展示,风电机组的实际测量输出功率与预测值之间具有良好的拟合效果。因此,上述结果说明,得益于测量值与预测值之间的优秀拟合性,本文所提模型能够及时且准确地检测到风电机组的变桨齿轮故障、变桨轴承故障、桨叶叶片故障以及发电机转轴故障。

图5 所提模型预测结果Fig.5 Prediction results of proposed model

3.2.3 风电机组故障检测实验结果分析

在本节风电机组故障检测实验结果分析中,旨在验证本文所提风电机组故障检测方法的有效性和优越性。实验选取了8 种基于正常行为预测模型的风电机组故障检测方法进行精度对比,并对其结果进行了深入分析。

1)时空特性对于正常行为故障检测方法的影响

为了论证正常行为预测模型在考虑时空特性时对NBM 模型故障检测精度的影响,将时间序列的预测模型与考虑空间特征的模型相结合,形成了一个整合了时空特性的正常行为预测模型,即GCN+GRU。将其与单独采用时间序列特征的正常行为预测模型GRU,以及单独采用空间特征的正常行为预测模型GCN、Resnet 的检测精度进行对比,结果如附录A 表A1 所示。当预测模型同时考虑训练数据的时空特性时,其故障检测精度显著提高,这主要归因于GCN+GRU 正常行为预测模型比只有GRU、GCN 或Resnet 的模型具有更好的趋势跟随性,如附录A 图A6 所示。因此,当预测模型同时考虑时间和空间特性时,其模型的拟合度大大提高,从而显著提高了正常行为故障检测的准确性。

2)注意力机制对于正常行为故障检测方法的影响

为了深入分析注意力机制在正常行为预测模型上的影响,在已有的时空特性正常行为预测模型GRU+GCN 的基础上引入注意力机制。具体地,构建了一个综合考虑时空特性和注意力机制的先进预测模型,即GRU+GCN+Attention。在这个模型中,采用了两种不同的注意力机制:由Masked 注意力机制构建的GAT 机制和时间序列注意力机制。为了更全面地评估这一新模型的性能,将其与几个基准模型进行了对比。这些基准模型包括:仅侧重于时空特性的GCN+GRU 模型、仅在空间关联性方面运用了注意力机制的GAT 模型,以及仅在时间关联性方面运用了注意力机制的Transformer模型。

根据附录A 表A1 所示故障检测精度对比结果,可以清晰地观察到,由于GRU+GCN+Attention 模型同时考虑时间和空间关联性并运用了注意力机制,在故障检测的准确性方面表现得更胜一筹。具体而言,它优越于仅注重时空特性的GCN+GRU模型、只在空间关联性上运用注意力机制的GAT 模型,以及仅关注时间关联性的Transformer 模型。与仅关注空间关联性的GAT 模型相比,时间序列注意力机制能够有效强化不同时刻间的相关性。例如,该机制能放大对齿轮磨损进程的关注,从而提供更及时和准确的风电机组故障诊断。与此类似,与仅侧重时间关联性的Transformer 模型相比,由Masked 注意力机制构建的GAT 机制则成功地增强了每个传感器节点(例如轴承位置)在空间关联性上的表征,这使得模型能更灵敏地捕捉到例如多个轴承点的局部负载或疲劳等异常变化。进一步地,与GCN+GRU 模型进行对比时可以明显看出,时间序列注意力机制与GAT 机制的结合不仅捕捉到了隐藏在数据中的时间相关特性,还让故障前后的特定特征更加显著。这种综合分析还考虑了传感器特征之间的互相关性,进而有效放大了故障前后状态的联动性,有助于进一步提升故障检测的准确性。

这些分析结果在附录A 图A7 中得到了明确验证,显示出注意力机制能显著增强故障检测模型在时空关联特性上的性能。因此,通过增强故障检测模型的时空关联性,注意力机制能有效提升风电机组的故障诊断灵敏度。

3)多层级对于正常行为故障检测方法的影响

为考虑多层级对于正常行为预测模型的影响,构建了一种紧密依托于风电机组物理结构的多层级图神经网络预测模型,其包含GAT 机制层、子图网络层和多头注意力机制层。在构建模型时,按照风电机组的功能单元进行了划分,使模型与其物理结构紧密相连。

将此模型与之前的GRU+GCN+Attention 模型进行比较。如附录A 表A1 所示,所提多层级图神经网络预测模型在故障检测精度方面显著超越了GRU+GCN+Attention 模型,这一结果表明紧密依托于风电机组物理结构的多层级模型的优势。此模型通过深度整合风电机组各功能单元的关联性和结构特性,弥补了单层图神经网络模型在捕捉风电机组SCADA 系统数据局部信息方面的不足,进而提高了预测模型的精度。附录A 图A8 中的分析结果进一步印证了这一点,揭示出该设计架构通过增进正常行为预测模型的预测精度,有效提升了风电机组故障检测的敏感性。因此,可以得出如下结论:紧密关联物理结构的多层级模型对于提高风电机组故障预测的精确性起到了决定性的作用。

总之,通过对5 种基于NBM 模型的风电机组故障检测方法进行对比实验,揭示了模型的优越性,尤其是在考虑了时空特性和引入了注意力机制之后。最具亮点的是,根据风电机组的物理结构设计了一个多层级图神经网络预测模型,该模型在提升故障检测精度上表现出显著的优势。这种多层级模型充分利用了风电机组物理结构的层次性,巧妙地规避了简单堆砌层次可能带来的冗余,并更为深入地挖掘了风电机组的局部特性,从而实现了更高效和精确的风电机组故障预测。

3.3 讨论

3.3.1 故障阈值的窗口长度对故障检测精度的影响

在故障检测过程中,阈值窗口大小对正常行为状态参数正态分布模型的范围产生影响,从而对风电机组故障检测的灵敏度产生不确定性。通过调整故障阈值的窗口大小,发现当窗口较小时,由于样本数量过少,阈值范围相对较小,易导致误判,增加正样本被预测为负的数量,降低召回率和预测精度。反之,窗口较大时,样本数量过大,阈值范围相对较宽,也易导致误判,增加负样本被预测为正的数量,降低精确率和故障检测灵敏度。如附录A 图A9 所示,尝试不同的阈值时间窗口大小后发现,当时间窗口大小为12 时,故障检测灵敏度最佳。

3.3.2 历史正常数据集的大小对于正常行为预测模型的预测精度的影响

正常行为预测模型的预测精度对风电机组故障检测的灵敏度具有关键影响。由于风电机组的SCADA 系统数据受季节影响大,所选正常历史数据集的大小直接影响预测模型的精度,从而影响故障检测精度。通过训练不同时间跨度的历史健康数据集,发现正常行为预测模型的精度随着数据集时间跨度的增加而提升。然而,如附录A 图A10 所示,当历史数据集达到9 个月时,误差开始稳定,这是由于9 个月的数据基本可以覆盖风电机组一年中的大部分运行状态变化。

4 结语

本文聚焦于风电机组SCADA 系统数据驱动故障诊断的瓶颈问题,提出了一种立足于多层级时空图神经网络的在线故障诊断方法。这一方法的核心创新在于,根据风电机组的物理结构,运用了多层级构图方法,通过划分风电机组功能单元来构建与风电机组物理结构紧密关联的预测模型,从而提高预测模型的精度。在中国上海某风电场SCADA 系统数据的实验测试中,这一策略展现出了显著的实用效果。所提改进预测模型能够深度挖掘风电机组的时间和空间关联信息,从而在风电机组故障状态预测方面取得了突破性进展。特别地,在训练正常行为模型的过程中,运用多头注意力机制和GAT 机制,得出的注意力系数能够为维修团队揭示各功能单元和传感器节点间的相互影响强度,从而协助其准确判断风电机组的故障原因,提升故障处理效率。综合来看,本文所提方法可以降低设备因故障无法及时发现和处理导致的停工频次,进而减少维修或更换设备的经济负担。

结合深度剖析时空关联特征和实施全景机制分析,风电机组故障检测的未来研究将走向更为智能化、精准化以及全面化的发展方向。在深入挖掘时空关联特征的过程中,由于风电机组处于一个复杂而多变的环境中,需要融合多源数据,例如,气象数据、设备状态数据以及操作记录等,从各个角度和层面全方位地分析风电机组的时空特性。未来的研究将进一步探索这些时空关联特性,例如开发一种更符合风电机组物理特性的时空注意力机制,从而更加精确地理解和模拟风电机组的时空演化特性。这种进一步的研究和分析有望为实现风电机组更为精确和及时的故障检测提供强有力的理论支持,并且对风电产业的发展具有重要的推动作用。全景机制分析旨在全方位和多层次地揭示风电机组的运作逻辑和故障机制,这涵盖了对风电机组内部机械、电气、气动等各个方面的机制进行深入研究,以及探究这些机制如何互相影响。为实现这一目标,未来的研究不仅要深入探讨风电机组的物理和工程原理,还需要运用高级的数据驱动方法,如人工智能大模型,来发现这些原理背后的深层次结构和模式。这种结合理论深度和高级数据驱动方法的研究方向将有望揭开风电机组复杂运作机制的神秘面纱,进一步推动风电机组故障检测技术的创新和发展。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢

子图风电注意力
让注意力“飞”回来
临界完全图Ramsey数
海上风电跃进隐忧
分散式风电破“局”
风电:弃风限电明显改善 海上风电如火如荼
“扬眼”APP:让注意力“变现”
A Beautiful Way Of Looking At Things
基于频繁子图挖掘的数据服务Mashup推荐
重齿风电
不含2K1+K2和C4作为导出子图的图的色数