APP下载

基于Hadoop平台的风机群落故障预警

2018-07-03姚万业姚吉行

电力科学与工程 2018年6期
关键词:风场齿轮箱群落

姚万业, 姚吉行

(华北电力大学 控制与计算机工程学院,河北 保定 071003)

0 引言

近些年来,以可再生能源为主要内容的能源转型是当今世界寻求稳定持续发展的出路,对中国来讲,若要实现绿色低碳等可持续发展就必须顺应世界潮流,向发展可再生能源转变。中国依据自身独特的地理优势拥有着丰富的风资源,风力发电在我国发展迅速。

风电的发展带动风电场的规模日益扩大,由于工作环境十分恶劣且工况复杂多变,风机极易发生故障。当风机发生故障后,故障诊断、维修需要耗费大量的人力、财力,对于重大故障事件会造成整个风机停机,进而影响整个风场的发电量,可谓损失巨大[1]。在风电企业高速发展的同时产生了海量的数据,如何将这些信息转化为资源,提升企业的经济效益,已经成为行业关注的重点。在此背景下,基于海量数据信息的风机故障预警技术便应运而生了。

1 Hadoop平台及数据挖掘算法

1.1 Hadoop平台介绍

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架,以MapReduce为基础发展而来,主要用来处理分布在多个并行节点的PB级和EB级数据集群。集群能从单个服务器扩展到数千个,每个服务器都可以提供本地计算和存储,与依赖硬件提供高可用性相比,Hadoop在应用层检测并处理故障,保障了集群的高可用性。Hadoop处理大数据的体系模块如图1所示。

图1 Hadoop平台处理模块

1.2 数据挖掘算法

1.2.1 显著性差异分析方法

显著性差异分析是统计学中对大量同工况下的数据样本中具有显著性差异的数据个体的分析、评价。在同工况下,这些离群个体可能是由于实验条件处理不同而导致的异常点[2]。生产过程中,在相同工况下对于同一批次的设备,由于其工业设计、制造工艺和材质等条件基本相同,设备在运行期间生成的数据虽有不同,但不应存在太大差异,否则,该数据差异有较大概率为早期故障信号。显著性差异分析方法根据大量实验数据统计故障概率,设置一个合理的静态阈值对异常状态进行有效的预警。

利用显著性差异分析方法对样本数据进行处理分析需满足:

1)待分析数据必须来自于同一工况数据样本总体。

2)样本数据基本符合正态分布,即样本概率密度函数应满足正态分布函数。

参考GB/T4883-2008,在变量分布中,在显著水平之外的离群点为具有显著性差异的异常点。通过对离群点的分析,显著性差异条件为:

u≥u1-α

(1)

在工程应用中,被观测参数多表现为离散特性[3]。设共有n台设备处于同一工况(不包含离群设备),对于某观测状态量X,其平均值为U,标准差为S,离群设备的当前测量值为x,其显著性差异分析有如下几种情况:

1) 当劣化表现为状态量值减少时:x

2) 当劣化表现为状态量值增加时:x>U+kS

3) 当劣化表现为状态量值偏离初值时:x∉{U-kS,U+kS}

其中,k的取值大小与所选取的设备台数n的大小有一定的关系,具体关系根据现场工作人员的经验所得,如表1所示。

表1 k值与n的关系

1.2.2 多元线性回归分析方法

一般来讲,对于给定的p个变量x1,x2,…,xp能确定变量y,并且用某一种函数关系式y=f(x1,x2,…,xp)来表示。但在实际情况中,参数之间往往存在着无法详细描述的非线性关系[4]。本文采用多元线性回归分析方法对样本数据进行建模预测,其一般形式如式(2)所示:

y=β0+β1x1+β2x2+…+βpxp+ε

(2)

(3)

E(ε)=0,Var(ε)=δ2

(4)

2 基于Hadoop的风机群落异常风机识别

2.1 风机预警指标体系

风场中风机的测点参数类型众多,数量较大,故障类型也比较复杂[5]。对历史故障信息数据统计分析,温度类故障在历史故障中发生比例较大,且风机设备温度值变化表现为渐变特性,同工况下的风机温度值表现有一定的正态特性[6]。鉴于箱式图对于温度参数具有独特的处理优势,故选取风机的温度指标作为故障预警的首选参数[7-11]。结合风机工作原理及现场SCADA系统历史记录,选取的风机预警指标体系如图2所示。

图2 风机预警指标

本文所选用的数据来自河北赤沽某大型风场共345台风机中,风机提供厂商也有多家,机型众多,运行工况也错综复杂。对于同型号的风机,不同的并网时间和停机时间对风机各部件的运行状况影响不一样,导致温度类、电气类参数的值也略有差别[12]。以10 s为采集单位对风机发电功率历史数据进行分析,为观察同机型风机的变化情况,对风机10 min的平均功率和功率变化方差进行分析。以75台金风1.5 MW机型的风机为分析对象,对风机群落进行聚类划分,为确保准确性,分别对6 m/s(启动)、12 m/s(稳定运行)、18 m/s(变桨运行)3种不同阶段进行分析[13],聚类结果如图3所示。

图3 不同风速风机群落聚类结果

由图3可以看出:在不同的风速下,风场中75台金风1.5 MW机型的风机依据10 min内的平均功率和功率方差划分成了3个群落。在每个群落中,风机的运行特性相似,各子系统中部件的温度类参数也在一定的范围内变化。对同一个风机群落中的风机采用箱式分布图和显著性差异分析的方法能够提高异常识别率,增加预警准确性。

2.2 风机群落规则分析与设计

为了能够对风场中所有风机同时进行监测,利用Hadoop平台对风机群落进行信息分布式存储和并行式计算,既保证了预警的全面性又增加了实时预警的快速性,其中对每个群落都采用图4所示的预警流程。

图4 风机群落预警流程

以群落1为分析对象,选取风场SCADA系统历史故障前30 min时段的温度体系参数值作为箱式分布对象。据查询2016年4月5日13:34为故障发生时刻,选取30 min之前的数据,采用箱式分布图对变桨系统温度评估模型体系进行分析,结果如图5所示。

图5 变桨系统温度箱式分布图

图中就1#变桨电机温度而言,在群落1中,12#和13#风机表现为离群风机;就变桨电池温度而言,68#风机为离群风机;就变桨变频器温度而言,29#风机为离群风机。对机械传动系统和发电系统同样做箱式分布图,结果分别如图6和图7所示。

图6 机械传动系统温度箱式分布图

图7 发电机系统温度箱式分布图

对于离群风机进行显著性差异分析,首先求出风机群落的温度平均值和方差,再计算预警阈值来分析离群风机的异常与否。如表2所示。

2.3 风机群落异常风机识别案例分析

在Hadoop平台中对河北赤沽地区某风场所有风机的运行温度类参数进行批量式处理。

Hadoop平台共分数据采集层、数据存储层、数据分析层、信息发布层4个层级,每个层级的功能作用如下:

数据采集层:该预警系统主要对整个风场中温度类参数进行故障预警,考虑到温度参数的渐变性和易测量性,采用温度传感器进行测量,以 5 s为采集单位实时采集温度数据。

数据存储层:鉴于风场存储信息的复杂与庞大,数据存储采用HDFS分布式存储,数据存储规则存储在NameNode中固定区域,存储规则为所有风机按照上文中划分的群落来存储。在每个群落中,按照风机子系统来集中存储各温度参数,分别为变桨系统、机械传动系统、发电机系统。采集的实时数据按照NameNode中的存储规则来有序的存储在DataNode中并实时更新NameNode中存储规则。

表2 离群风机异常判断表

数据分析层:按照上文中的箱式分布图分析方法和显著性差异分析法对每一个存储模块下的实时数据进行并行式计算,实时判断每台风机的异常与否。

信息发布层:经过Hadoop平台对风机温度类参数的分布式存储和并行式计算分析,最终可以得出每个群落中的异常风机。

鉴于上述描述预警规则,在Hadoop平台对该风场风机群落实时温度参数进行分析,结果如表3所示。由表3显示结果表明,在Hadoop平台中对整个风场下所有风机的温度类参数进行并行计算分析,在上述时刻下群落1中32#风机的1#变桨电机温度、群落5中84#风机的驱动轴承温度、群落14中314#风机的发电机绕组温度表现异常,可初步判定相应的风机中可能存在故障隐患。

表3 风机群落异常识别结果

3 基于NEST的异常风机故障预警

依据上节Hadoop平台计算结果,对异常风机的具体运行工况进行分析,本节以84#金风3.0 MW异常风机的齿轮箱温度为研究对象。主要对在运期间齿轮箱温度的实测值和预测值之间的偏差程度进行分析,通过在线监测齿轮箱前期温度的变化情况来及时发现隐藏故障。离线部分先对大量与齿轮箱相关参数进行数据分析,建立正常情况下的回归预测模型。在线部分实时观察预测值与实测值之间的残差并依据现场经验设置合理的偏差阈值,当残差超过设定的阈值后即发出报警信号并提示工作人员检修设备。

3.1 NEST预测模型

通过对风电场SCADA系统47个参数的分析、筛选,结合对齿轮箱工作原理的机理分析,确定以下几个与齿轮箱温度变化密切相关的参数作为观测向量:

(1)机组输出功率p:机组的输出功率变化会影响齿轮箱载荷大小,当机组输出功率升高时,齿轮承受的载荷变大,导致齿轮箱温度上升。

(2)风速:作为风机工作的能量来源,风速的大小与整个风机的温度参数变化呈正相关性。

(3)环境温度:风电机组所处环境的温度在短期(昼夜)或长期(周、月)内可能会发生较大变化,如在春季3、4月份某些地区因大风寒潮等原因可能会导致温差达20 ℃左右。在同一输出功率和风速情况下,齿轮箱的温度可能会因环境温度的变化而改变。

(4)齿轮箱上一时刻温度Tg(k-1):为了能够追踪齿轮箱温度的变化趋势,要预测下一采样时刻的温度需考虑当前时刻的齿轮箱温度值。

(5)齿轮油在上3个时刻的温度值(Tgo(k-1)、Tgo(k-2)、Tgo(k-3));

(6)齿轮轴承在上3个时刻的温度值(Tgb(k-1)、Tgb(k-2)、Tgb(k-3));

(7)主轴承在上3个时刻的温度值(Tl(k-1)、Tl(k-2)、Tl(k-3));

根据上节所述建模理论,依据以上观测向量建立齿轮箱温度的回归预测模型,如式(5):

(5)

3.2 基于NEST的异常风机故障预警案例分析

本文所使用的建模数据为该风场SCADA系统中#84风机齿轮箱温度的历史数据,该风机的异常时刻为2016年7月11日9时17分,选择异常时刻之前的正常数据,考虑到风速的多变性以及季节的因素,时间跨度不应过大。选取6~7月的数据,以5 min为采集单位,经过预处理最终选择200组正常数据作为处理对象。为了验证多元线性回归法对风电机组主要部件潜在故障的预测,采用前170组正常数据建立回归预警模型,后30组数据作为验证样本,验证结果分别如图8和图9所示。

图8 正常运行模式下的齿轮箱温度预警曲线

图9 正常运行模式下的齿轮箱温度预测残差

据信息记录查询,在2016年6~7月份期间,#84风电机组持续正常工作,并无故障情况。对图9预警曲线进行观察分析,采用回归分析方法建立#84风机的健康模型,预警曲线能够很好地跟随实际曲线,预测残差波动范围很小,在0.3 ℃以内,上述结果表明,采用线性回归分析的方法能够较好地对齿轮箱温度进行预测。

采用上述所建线性回归预测模型对#84风机异常时刻前后一段时间数据进行预测分析。以 5 min为时间采集单位,据现场经验设定预测残差预警阈值为2 ℃,预测结果分别如图10和图11所示。

图10 异常状态下的齿轮箱温度预警曲线

图11 异常状态下的齿轮箱温度预测残差

由图10温度预警曲线可以得出,在约第17个采集点时刻之前,实际温度曲线能够很好地跟随预测曲线,温度残差浮动较小,浮动范围在0.3 ℃之内。在此之后实际测量温度表现出异常特性,开始偏离预测曲线,这种偏离特性随着时间推移表现得尤为明显。其中,温度预测残差也逐步增大。由图11可知,从大约第22个采集点开始,残差值超过预警阈值,且呈增大趋势,此时触发报警,提醒工作人员该风机可能存在潜在故障,在此之后预警曲线的温度继续上升,故障特征已经很明显。

4 结论

(1)依据箱式分布图的方法确定风机群落中的异常风机。采用Hadoop大数据分析平台对风场中所有群落温度参数指标进行存储、计算、分析,不仅充分利用了该平台高存储量、计算速度快的优势,还兼顾了计算分析的实时性与准确性。

(2)采用横向分析的方法从整个风场层面对所有风机进行分析,确定出异常运行风机,再采用线性回归预测分析的方法对异常风机进行纵向分析。选择合适的参数集作为预测模型的输入变量,结合一定的现场经验,设置合理的预测残差预警阈值,观察预测温度的变化趋势来进行故障预警最终确保了故障预警的准确性。

参考文献:

[1]刘轩,孙建平.风力发电机温升故障预警方法研究[J].电力科学与工程,2016,32(6):38-43.

[2]LIANG J, YANG J, WU Y, et al. Big data application in education: dropout prediction in edx MOOCs[C]// IEEE Second International Conference on Multimedia Big Data. IEEE, 2016:440-443.

[3]LIU W, TANG B, JIANG Y.Status and problems of wind turbine structural health monitoring techniques in China[J].Renewable Energy, 2010,35(7):1414-1418.

[4]孙建平,朱雯,翟永杰,等.基于MSET方法的风电机组齿轮箱预警仿真研究[J].系统仿真学报,2013,25(12):3009-3014.

[5]詹长庚,万书亭,王聪.风机传动齿轮箱故障的Hilbert及倒谱综合分析[J].电力科学与工程,2013,29(5):1-7.

[6]李若昭. 风电机组综合性能评估与运行特性分析[D]. 北京:华北电力大学,2009.

[7]ANDREW K, ZHANG Z J,ANOOP V.Prediction,operations and condition monitoring in wind energy[J].Energy,2013:1-12.

[8]BOUCHIKHI E H E, CHOQUESUE V, BENBOUEID M E H. Non-stationary spectral estimation for wind turbine induction generator faults detection[C]// Industrial Electronics Society, IECON 2013, Conference of the IEEE. IEEE, 2013:7376-7381.

[9]童超,郭鹏.基于特征选择和BP神经网络的风电机组故障分类监测研究[J].动力工程学报,2014,34(4):313-317.

[10]SCHIECHTINGEN M, SANTOS I F, ACHICHE S. Wind turbine condition monitoring based on SCADA data using normal behavior models. Part 1: System description[J]. Applied Soft Computing Journal, 2013, 13(1):259-270.

[11]JING C,HOU J.SVM and PCA based on fault classification approaches for complicated industrial process[J].Neurocomputing,2015:636-642.

[12]赵洪山,胡庆春,李志为.基于统计过程控制的风机齿轮箱故障预测[J].电力系统保护与控制,2012,40(13):67-73.

[13]BUTLER S, RINGWOOD J, O'CONNOR F. Exploiting SCADA system data for wind turbine performance monitoring[C]// Control and Fault-Tolerant Systems. IEEE, 2014:389-394.

猜你喜欢

风场齿轮箱群落
风电齿轮箱轴承用钢100CrMnSi6-4的开发
大学生牙龈炎龈上菌斑的微生物群落
基于FLUENT的下击暴流三维风场建模
合成微生物群落在发酵食品中的应用研究
“最美风场”的赢利法则
提高齿轮箱式换档机构可靠性的改进设计
侧向风场中无人机的飞行研究
杭州前进齿轮箱集团股份有限公司
春季和夏季巢湖浮游生物群落组成及其动态分析
基于遗传退火优化MSVM的齿轮箱故障诊断