APP下载

基于SCADA数据和单分类简化核极限学习机的风电机组发电机状态监测

2022-09-05金晓航泮恒拓许壮伟刘伟江

计算机集成制造系统 2022年8期
关键词:离群发电机风电

金晓航 ,泮恒拓 ,许壮伟 ,孙 毅 ,刘伟江

(1.浙江工业大学 特种装备制造与先进加工技术教育部重点实验室,浙江 杭州 310023;2.浙江工业大学 机械工程学院,浙江 杭州 310023;3. 浙江运达风电股份有限公司,浙江 杭州 310012)

0 引言

为应对环境污染和能源危机等问题,世界各国正在大力发展风电产业,风电机组累积装机容量不断增长。截止2019年底,全球风电机组装机容量达到了651 GW,数十万台风电机组正在并网运行[1]。风电场通常坐落于偏远山区、草原、戈壁滩、沿海滩涂或近海等区域,风电机组机舱位于近百米塔筒的上端。当机组传动系统的一些部件(如主轴承、齿轮箱、发电机等)出现故障时,通常需要准备专用的吊装机构,在风电场天气情况较好时进行修护作业。因此,风电机组传动系统故障往往会造成较长时间的停机,较大的发电量损失,同时也给风电场业主带来了高昂的维修费用[1-2]。发电机是风电机组中的核心部件,其长时间处于变工况运行状态,频繁受到复杂多变的冲击载荷,是风电机组中故障率较高的部件之一[3]。若能及时发现发电机工作异常并采取相应的防控措施,就能有效降低机组的运行维护成本。

目前,有较多的风电机组状态监测方法,如振动监测、油液监测以及数据采集与监控系统(Supervisory Control and Data Acquisition,SCADA)数据驱动的状态监测等。其中,振动监测或油液监测等状态监测方法需要安装额外的传感器,属于侵入式的状态监测方法;而利用SCADA数据的分析来识别机组的健康状态通常不会带来额外的硬件成本[4]。因此,如何从SCADA数据中挖掘出有用信息,实现机组健康状态监测的研究引起了众多学者和业内人士的关注。SCADA数据分析方法可分为趋势分析、聚类以及正常行为建模等[5]。其中,趋势分析方法难以实现风电机组状态的自动监测;聚类方法需要大量的历史故障数据,但实际工程中与机组故障相关的数据很难被有效收集;而由于机组的正常行为数据容易获取,正常行为建模方法一直是利用SCADA数据进行风电机组状态监测研究的热点。如文献[6]利用多项式回归来分析SCADA特征参数之间的相关性,并通过评估历史健康数据与实时数据回归曲线的差异来诊断风电机组是否故障;文献[7]提出一种基于高斯过程模型的风电机组状态监测方法,通过分析风速功率曲线拟合残差来识别机组的异常状态;文献[8]对风电机组齿轮箱的振动信号进行降噪,利用核主成分分析对多组振动信号进行融合分析并构建相应的评估指标;文献[9]利用历史正常行为的SCADA数据建立风电机组发电机温度监测模型,以同一风场不同机组的数据作参考对发电机的运行状态进行了评估。上述工作都可归类为基于回归分析的正常行为建模方法,在该类方法中,输入与输出变量之间通常要有较强的相关性,若输入变量与输出变量间相关性较低,则在实际的监测分析中这些变量所隐含的信息容易被忽略,以至于与这些变量密切关联的异常状态难以被检测到[10]。为避免上述问题,另一种行之有效的方法是基于单分类(One-Class Classification, OCC)的正常行为建模。

单分类或新奇检测(novelty detection)是判断新样本是否与训练样本属于相同类别的方法,仅需要一类样本用作训练[11-12]。 这样的方法通常可分为3种:密度估计方法、数据重构方法、边界识别方法[13-14],常见的有:自动编码器(Auto-Encoder, AE)、单分类主成分分析(One-Class Principal Component Analysis, OC-PCA)[15]、单分类支持向量机(One-Class Support Vector Machine, OC-SVM)[16]等。目前,仅有少数学者利用单分类模型对风电机组的状态监测进行了研究。如文献[17]采用长短时记忆神经单元与自编码网络构建风电机组性能评估模型,并通过构建自适应阈值来实现机组的异常预警;文献[18]从振动数据中提取特征作为OC-SVM的输入来训练模型,实现了风电机组发电机轴承故障信号的检测和识别。

极限学习机(Extreme Learning Machine, ELM)是前馈神经网络学习中一种全新的训练框架,凭借其学习速度快、人为干预少等优点在各方面得到了广泛的应用[19]。其中,有学者探究了其在单分类问题中的应用,提出了单分类极限学习机(One-Class ELM, OC-ELM)算法[20]。但由于ELM隐层参数通常采取随机赋值的方式,模型的泛化能力和稳定性较差,为此,本文结合核方法在简化核极限学习机(Reduced Kernel ELM, RKELM)[21]基础上设计了一种新的支持向量选取方法,并利用改进的单分类简化核极限学习机(One-Class RKELM, OC-RKELM)算法来实现风电机组发电机的状态监测。首先,对风电机组发电机正常状态下的SCADA数据进行清洗,得到一个高质量的健康数据训练集。其次,利用OC-RKELM学习清洗后数据中隐含的发电机行为规律,构建风电机组发电机的在线健康状态监测模型,并基于该模型对监测的实时行为数据进行分析,在线识别发电机的健康状态。最后,利用所提方法对某台1.5 MW的风电机组发电机进行了健康状态监测研究,通过与其他单分类模型状态监测结果的对比分析以及结合可视化技术,对所提方法的性能进行了验证和评估。

1 风电机组发电机状态监测方法

单分类模型通过训练找到装备正常行为数据的边界,并将其视为决策边界来区分正常和异常的数据。需要指出的是,装备(特别是机电装备)的性能退化是一个连续的过程,装备的正常与异常数据之间有时并没有明确的区分边界,因此,漏报(将异常数据归为正常一类)和误报(将正常数据归为异常一类)是不可避免的。而且,漏报与误报之间呈现出负相关的关系,因此状态监测时对决策边界的确定需要权衡利弊得失。根据风电机组实际的运维需求,当监测倾向于较少的漏报时,应执行严格的监测策略;当监测倾向于较少的误报时,宽松的监测策略则更为合适。

基于单分类模型的风电机组发电机状态监测方法的具体思路如图1所示。首先,从风电机组的SCADA数据库中提取出机组历史正常行为数据,并选取出与发电机健康状态密切相关的特征数据作为训练数据集。其次,为了消除SCADA数据中的噪声信号,使得构建的OC-RKELM模型具有紧密平滑的决策边界,需要对数据进行清洗工作,这部分工作主要有:①参照风电机组发电机的工作特性对SCADA数据进行清洗,即在对发电机的状态进行监测时,发电机工作时的数据更值得被关注,而其他时刻(如机组调试测试、停机)的数据需要被清洗;②清除SCADA数据中的离群数据,由于受风向、风力大小、气温等环境因素和传感器测量误差等的影响,SCADA系统采集的数据中存在一些离群数据,可利用离群点检测算法对SCADA数据中的离群数据进行有效地清洗。经过上述数据清洗工作之后,SCADA数据中与发电机工作状态无关的数据以及离群数据可以被有效清除,获得发电机正常工作时的一类健康数据用于训练构建OC-RKELM模型。随后,以模型预测输出和实际输出之间的残差作为反映发电机健康状态的监测值,在训练数据分析的基础上选取合适的阈值用于在线监测。

在线监测风电机组发电机的健康状态时,针对训练时选定的发电机特征参数,对发电机工作时产生的实时行为数据进行分析,通过已构建好的状态监测模型在线评估发电机的工作状态。当评估得到的监测值没有超出健康阈值时,认为发电机处于正常的工作状态;当监测值大于阈值时,认为发电机的行为数据异常。考虑到风电机组的工况复杂多变,发电机行为数据出现异常的原因较多。其中,由于发电机本身状态异常导致的异常数据往往是连续出现的,而由于其他原因(如环境的变化、传感器的测量误差)导致的异常数据往往是离散的。因此,为了避免出现误报,提高预警结果的可靠性,以连续出现多个异常数据作为异常预警的准则[18],即当方法连续监测到3个异常数据时,认为发电机已处于异常运行状态。

2 算法原理介绍

2.1 极限学习机

极限学习机(ELM)是由HUANG等[22]提出的一个基于前馈神经网络(Feedforward Neuron Network, FNN)构建的机器学习方法。相比于前馈神经网络和支持向量机等算法,ELM具有更高的可扩展性和更低的计算复杂度[23]。ELM通常使用单层前馈神经网络(Single Layer Feedforward Neuron network, SLFN)结构,如图2所示。SLFN的组成具体包括输入层、隐含层和输出层。

(1)

在ELM模型中,隐层的节点参数随机初始化或人为给定,仅需求解输出权重。因此,ELM模型求解的回归问题可描述为:

(2)

通过引入L2正则化来平衡训练误差和输出权重,式(2)可重写为:

(3)

s.t.

h(xi)β=ri-ζi,i=1,…,N。

式中:ξi为训练误差;λ为正则化系数。引入Lagrangian函数对式(3)进行求解:

(4)

根据卡罗需-库恩-塔克(Karush-Kuhn-Tucker, KKT)条件,求得输出权重的解为:

(5)

式中:I为单位矩阵;H为隐层的输出矩阵,

(6)

2.2 单分类极限学习机

极限学习机最初被用于回归问题和两个及多个类别的分类问题,但同样适用于单分类问题[20]。当用作训练的数据样本属于同一个类别时,目标输出向量可以表示为R=[1,…,1],样本到目标类的距离可以定义为:

d(x)=|h(x)β-1|。

(7)

样本到目标类的距离越大,则样本偏离目标类越远。

OC-ELM以设置污染率的方式来剔除训练样本中偏离目标类最远的样本[20]。将训练样本到目标类的距离按降序排列,得到序列d, 则分类的阈值表示为:

thres=dfloor(η·N+1)。

(8)

式中:thres为分类的阈值;0≤η<1为污染率,表示剔除的训练样本数量占总训练样本数量的比例;floor(·)为地板函数,表示向下取整;dfloor(η·N+1)表示序列d中第floor(η·N+1)个值。当η=0时,模型接收所有训练样本,并以距离的最大值作为分类的阈值;当η>0时,模型剔除floor(η·N)个离群的训练样本,以接收样本距离的最大值作为分类的阈值。分类函数可表示为:

(9)

式中Sign(·)为符号函数。当距离小于等于阈值时,认为被测样本属于目标类;当距离大于阈值时,认为被测样本和训练样本属于不同的类别。

2.3 单分类简化核极限学习机与支持向量的选取

ELM隐层的特征映射既可以是显式映射,也可以是隐式映射。隐式映射巧妙地利用了核方法得到特征向量之间的内积,而不需要显式地定义特征空间和映射函数,基于该方法的ELM被称为核极限学习机(Kernel ELM, KELM)。KELM用核映射代替随机映射,能够有效改善隐层神经元随机赋值带来的泛化能力和模型稳定性下降问题[19]。

然而,在处理大样本数据时,KELM存在时间和空间复杂度过高的问题,为避免这一现象,DENG等[21]提出一种快速简化核极限学习机(RKELM),其研究结果表明:随机选择训练样本集的子集作为支持向量,可以在保证计算快速的同时获得足够好的泛化性能。

RKELM输出的形式为:

(10)

(11)

式中KN×L=K(X,XL)为简化的核矩阵。

本文选取径向基函数作为核映射函数,其形式如下:

K(x,xs)=exp(-||x-xs||2/σ)。

(12)

式中:σ为超参数;xs为支持向量。

将RKELM应用到单分类任务中,提出OC-RKELM算法。但由于OC-RKELM中支持向量的选取仍然具有随机性,为进一步提升模型的泛化能力和稳定性,在OC-RKELM的基础上结合系统抽样和分层抽样方法以及对风电机组数据的理解,设计了从风电机组训练数据集中选取合适的样本子集作为支持向量的策略,目标样本子集应尽可能涵盖风电机组不同工况下的样本:

(1) 将训练数据集按时间顺序划分成20份数量相等的子数据集。

(2) 将风电机组输出功率划分成长度相同的10个区间,并将子数据集中的数据按照功率区间分配到不同的子数据集中,得到200个子数据集。

(3) 选取每个子数据集中的第一个样本作为一个新的支持向量。

根据上述策略,共选取到训练样本集中具有代表性的200个样本组成支持向量集合。

2.4 局部异常因子

局部异常因子(Local Outlier Factor,LOF)是由BREUNIG等[24]提出的一种基于密度的离群点检测算法,适用于高维非均匀分布数据的离群点检测。由于LOF算法在计算过程中需要存储大量的数据,具有较高的时间和空间复杂度,不适合在线监测风电机组状态,而适合对SCADA数据进行预清洗的工作。

LOF算法中,有如下一些定义:

(1)k-距离

对于数据集D中某一对象p,定义p的k-距离为p和对象o∈D之间的距离k-dist(p)=d(p,o),对象o满足以下两个条件:①至少有k个对象o′∈D{p},满足d(p,o′)≤d(p,o);②最多有k-1个对象o′∈D{p},满足d(p,o′)

(2)k-距离邻域

对象p的k-距离邻域Nk(p),定义为D中与p的距离不超过p的k-距离的所有对象:

Nk(p)={q∈D{p}|d(p,q)≤k-dist(p)}。

(13)

(3) 可达距离

对象o到对象p可达距离reach-distk(p,o)定义为:

reach-distk(p,o)=max{k-dist(o),d(p,o)},

(14)

即为对象p与对象ok-距离中的较大值。

(4) 局部可达密度

对象p的局部可达密度lrdk(p)定义为:

(15)

表示对象p的k-距离邻域内的对象与对象p可达距离的比值。

(5) 局部异常因子

对象p的局部异常因子定义为:

(16)

表示p的k-距离邻域内的对象的局部可达密度与p的局部可达密度之比的平均数。

局部异常因子可以描述对象p的离群程度,当局部异常因子小于或等于1时,则p位于数据密集区域内;当局部异常因子大于1时,则p可能远离数据密集区域,值越大,p离群的程度越高。

3 风电机组发电机实例分析

某风场一台1.5 MW的双馈式风电机组在2017年2月5日11点20分由SCADA系统发出异常报警后停机。通过风电场运维工作人员的现场检修后发现:此次报警是由于风电机组的发电机轴承温度过高引起的。拆卸发电机后发现其轴承发生了跑圈故障进而导致轴承温度过高。因此,风电场业主和风电机组供应商收集了该台风电机组发电机轴承故障前14个月(2016年1月~2017年2月)的SCADA数据,希望通过对这些SCADA数据的分析能够提早发现风电机组工作异常的情况,进而可以优化制定相应的运维方案、降低故障维修成本和减少风电机组的停机时间。

SCADA系统每隔5 min采集一次风电机组各个子系统或部件(变桨、偏航、传动、塔架等)上的100多个特征参量的状态数据,14个月期间共采集122 400多个样本数据点。提取风电机组2016年1月~2016年3月(该期间机组正常运行)的SCADA数据作为训练数据,构建OC-RKELM模型后用于分析机组在随后时间采集到的SCADA数据,进而判断机组工作是否正常。

3.1 风电机组SCADA数据预处理分析

3.1.1 特征选择

针对发电机这一具体部件,结合风电机组制造商的建议,从SCADA数据中选取的特征数据有:风速、偏航角度、有功功率、发电机转速和温度等,如表1所示。考虑到发电机位于机舱内部,发电机温度特征容易受到机舱温度变化的影响,而机舱温度又与外部环境温度密切相关。因此,为了消除环境温度波动的影响,以温差(如发电机绕组与机舱的温度差等)作为一类特征进行分析[25]。同时,为消除不同量纲的影响,对表1中的特征数据进行归一化处理。

表1 SCADA数据中与发电机健康状态相关的特征参数

3.1.2 数据清洗

(1)基于风电机组工作特性的数据清洗

根据风速的大小,将风电机组的运行状态分为3个阶段:

1)当风速小于切入风速时,机组处于待机阶段,风轮自由旋转,一般不作控制。

2)当风速大于切入风速小于切出风速时,机组处于并网发电阶段,系统会根据风速的大小、电网发电量的指令等信息控制发电机转速恒定或保持最佳叶尖速比;其中,叶尖速比是指风轮叶片尖端线速度与风速之比,是表示风电机组性能的重要参数[26],当前风速下最大风能捕获率相对应的叶尖速比称为最佳叶尖速比。

3)当风速大于切出风速时,风电机组制动停机。

风电机组的工作特性决定了其数据分布的形式。如图3所示为风电机组在2016年1月~3月期间风速与叶尖速比的散点图。图3a中左下方相对无序的数据点是风电机组待机阶段的数据,此时发电机转速小于并网发电的最低转速;图3a中左上方的数据点是发电机转速刚到达并网发电最低转速且输出有功功率为零时的数据;图3a中右下方的数据是发电机转速为零或者趋于零的数据点,是风电机组停机阶段的数据。风电机组处于待机或停机阶段时,受风速影响,数据较多地呈现出一种离散的、相对无序的状态;而机组并网发电时,发电机正常工作,此时的数据呈现出一定的规律性,如图3b所示。从机组状态监测的角度来看,发电机的故障征兆往往出现在其工作期间,具体表现为特征参数间的规律性受到了一定程度的破坏;从模型学习的角度来分析,离散无序的数据不利于模型训练学习出一个紧密的边界。为此,在建模分析时有必要清洗掉风电机组待机和停机阶段的数据,即功率输出为零的数据。参照上述分析对SCADA数据进行了清洗,清洗后的数据如图3b所示,可以发现数据更加集中且呈现出一定的规律,也更容易得到其数据的决策边界。

(2)基于离群点检测的数据清洗

风电机组正常工作时,由于风速、风向等的变化会使机组的SCADA数据存在少量离群的样本数据。图4呈现了风电机组在2016年1月~3月期间风速与功率的散点分布图,其中用虚线的圆圈标注出了离群的样本数据点。离群的数据不利于OC-RKELM模型的训练,因此,对数据进行清洗以得到更高质量的训练数据集,进而避免离群数据对模型构建的影响。

由于风速功率曲线体现了整个机组的输入输出关系,是考核风电机组性能的一个重要指标。因此,可以将风速和功率散点分布作为评判数据清洗效果的标准。利用网格搜索法在k=[20, 30]和C=[0.05%, 0.1%]范围内确定LOF算法中k-距离邻域和训练数据中异常数据的所占的比例C两个参数的具体值(如图5)。研究发现:参数k的设置对极端离群数据的清洗无显著影响,如图5a、5c所示;而参数C的设置对数据的清洗影响较大,当C设为0.1%时离群数据得到了有效的清除,且数据清洗结果基本一致,如图5b、5d所示。因此,通过上述的分析确定邻域距离k和异常数据比例C两个参数的取值分别为20和0.1%。

考虑到风电场地处偏远,误报的运维成本较高,选择了宽松的监测策略,将训练数据监测值的最大值视为健康阈值。如图6所示为离群数据清洗前后红色阈值虚线的变化情况。清洗后的阈值更能反映训练数据监测值的正常波动范围,也意味着模型得到的决策边界更加紧密,更符合实际监测的需求。

3.2 基于OC-RKELM的发电机状态监测

训练数据在高维特征空间中到目标类超平面距离的均值越小,则模型训练得越好。利用这一特点,通过网格搜索法在λ=[1e2,1e6]和σ=[1,9]范围内寻找合适的参数,寻优结果为:λ=1e6、σ=7。 之后建立状态监测模型,再利用构建好的模型分析风电机组在2016年3月之后的SCADA数据,得到的监测结果如图7所示。

本文所提方法在2017年1月27日22点35分时首次出现了3个连续的异常点(22点35分时的数据点及前两个时刻的数据点),满足了异常预警条件。而参照风电机组运维的记录,SCADA系统的报警时间为2017年2月5日11点20分,OC-RKELM模型的预警时间相较于SCADA系统的报警时间提前了8天多的时间。从图7中也可以看到,尽管在监测上已经采取宽松的策略,在发电机正常工作的时段(如2016年5月、12月等),仍然有少量样本点超出阈值。查阅风电机组原始数据后发现:这些异常样本点的出现通常是由于风速或风向突然变化导致的单个或多个特征参数的数值出现异常。

3.3 不同方法在发电机状态预警上的比较分析

在尽量避免误报的前提下,利用不同的单分类模型对SCADA数据进行分析,通过不同模型间性能的对比来评估OC-RKELM模型在发电机状态监测性能上的优劣。考虑到不同的单分类模型采用不同的监测值和阈值,为了方便对比分析,对监测结果进行了如下的标准化处理:

(17)

式中:e为监测值;emax,emin分别为监测的最大值和最小值;thres为监测的阈值;p为标准化后统一的阈值0.2;er为标准化后的监测值。通过上述标准化处理,将基于不同模型的监测值限定在[0,1]的区间内。

图8给出了不同单分类模型的监测结果。从图8a中可以看到,OC-SVM、OC-ELM、AE三个模型都在1月28日前后监测到了发电机的异常状态。从局部放大图8b中可以看出,1月27日22点35分发电机出现了一个的异常征兆,OC-RKELM模型成功捕捉到了这一信号,并进行了异常预警;而其他模型均未发现该异常信号。上述4个模型的监测值都呈现出类似的上升趋势,表明上述模型都能反映出发电机趋于异常的趋势,其中基于核方法的模型OC-RKELM和OC-SVM表现出了更好的性能。OC-ELM和AE模型在1月28日3点20分最晚检测出发电机的异常。因此,将该时刻之后检测出的异常样本定义为有效的异常样本。不同模型具体的预警时间和检测出的异常样本数如表2所示。OC-RKELM模型共检测出了1 053个有效的异常样本,远超过其他模型检测出的有效异常样本的数量,表明该模型具有更好的故障预警性能。

表2 不同方法的监测结果对比

3.4 风电机组数据的可视化验证分析

由于缺乏详实的运维记录以及缺少有效的检测手段,风电机组异常数据的标定是困难的,这就导致基于OC-RKELM模型发电机状态监测结果的验证缺乏有效方法。鉴于与故障相关的异常数据通常具备以下两种特性:①从数据在空间中的分布来看,异常数据应该偏离正常数据的集群,表现出离群的性质;②从时间维度上来看,越接近故障发生的时刻,异常数据越密集。因此,提出利用t-分布随机邻域嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)[27]算法将SCADA数据降至二维可视化空间,结合数据样本的时间属性来验证分析OC-RKELM模型监测结果是否可靠。

可视化分析的具体步骤如下:取SCADA系统故障报警前3个月(2016年11月5日~2017年2月5日)的数据,利用t-SNE算法对风电机组发电机的特征数据降至两维后,进行可视化,如图9所示。为了便于分辨可视化后数据分布与时间的关系,将机组数据以2017年1月27日为界限,1月27日之前的数据用绿色显示,时间越往前的数据颜色越深;1月27日之后的数据用红色显示,时间越往后的数据颜色越深。可视化结果如图9a所示,可以看到,发电机在2017年1月27日发生异常后所对应的数据样本(图中用虚线圈出的红色数据点)和其他数据点区分明显。因此,可以认为虚线圈内的区域是异常区域,发电机正常工作时的数据点(绿色数据点)分布的区域是正常区域。

分别对截止至2017年1月26日、27日和28日的风电机组SCADA数据利用t-SNE算法降维可视化分析发现:在2017年1月26日之前,风电机组大部分的SCADA数据分布在正常区域内,个别数据样本点出现在异常区域,发电机处于正常状态,如图9b所示;1月27日22点25分时开始有少量异常数据点逐渐出现在异常区域内,表明发电机的状态开始出现异常变化的情况,如图9c所示;1月28日,在异常区域内集聚了相当数量的异常数据点,如图9d所示。综上所述,SCADA数据的可视化分析验证了OC-RKELM模型预警时间是可靠的、有效的,所报告的异常情况与发电机的故障有着密切的关联。结合原始SCADA数据进一步分析发现,正常区域内的大部分红色数据点所对应的功率较低,而异常区域内的红色数据点通常有着较高的功率输出,说明故障的征兆容易在发电机较高负荷(即高功率输出阶段)时显现出来。

4 结束语

针对风电机组正常和异常数据不平衡的问题,基于单分类简化核极限学习机提出新的数据分析方法,本文研究如下:

(1)提出了一种由SCADA数据驱动的基于OC-RKELM模型的风电机组发电机状态监测方法,该方法不依赖于风电机组故障时的异常数据,仅需风电机组正常运行状态下的SCADA数据集用于模型的训练。

(2)结合风电机组发电机工作特性和利用LOF算法对SCADA数据中与发电机运行状态无关的数据和离群数据进行了清洗,由此得到发电机正常工作状态下的数据样本。

(3)通过对某风场一台1.5 MW双馈式风电机组14个月的SCADA数据分析表明,所提方法能够对风电机组发电机的状态进行有效监测,且比SCADA系统本身更早发现发电机异常。

(4)利用t-SNE算法对SCADA数据进行了可视化分析,结合数据样本中的时间属性,比较新颖的从数据可视化角度验证了基于OC-RKELM模型在风电机组发电机状态监测结果的有效性。上述工作对风电机组异常数据的标定具有一定的借鉴意义。

通过对风电机组大量正常数据的信息挖掘可掌握机组正常的行为规律与知识,如何将这些信息用于新安装机组的行为分析或标签缺失的机组运行状态的识别是未来值得研究的问题。

猜你喜欢

离群发电机风电
一种基于邻域粒度熵的离群点检测算法
笑声发电机
运行中发电机出口压变异常的分析与处理
一种相似度剪枝的离群点检测算法
海上风电跃进隐忧
分散式风电破“局”
风电:弃风限电明显改善 海上风电如火如荼
从数学的角度初步看离群点检测算法
候鸟
随身携带的小发电机