APP下载

基于高斯过程回归和双滑动窗口残差处理的风电机组主轴状态监测

2018-06-26王兆光

电力自动化设备 2018年6期
关键词:高斯主轴残差

郭 鹏,王兆光

(华北电力大学 控制与计算机工程学院,北京 102206)

0 引言

风轮主轴是叶轮和齿轮箱的连接部分,其两端分别与轮毂和增速齿轮箱的输入轴相连,并通过滚动轴承安放在主机架上。主轴在风电机组的机械传动链中具有传动能量作用,同时受到风轮弯矩和轴向推力的作用,且风电机组运行环境恶劣,风速、风向的变化随机性强,外部环境温度变化大。这些不确定因素的存在导致主轴故障率很高,对主轴运行状态进行监测具有重要意义[1-2]。

目前已有较多用于风电机组重要子部件的状态监测的方法。通过对风电机组的各部件进行状态监测,可以预测其运行状况、发现其潜在的故障,从而避免和减轻严重的设备损坏。文献[3]系统地分析和阐述了近年来对风电机组不同部分的状态监测方法。文献[4]提出了采用信息熵和组合模型的风电机组异常检测方法,选取正常状态下一段时间内的全部数据采集与监视控制(SCADA)系统数据作为建模样本,其中包含了大量的冗余信息,使得建模过程复杂、耗时较长,且模型的辨识率较差。文献[5]提出了基于经验模态分解(EMD)的滚动轴承故障诊断方法,利用高频的振动传感器获得所需的振动信号,成本较高。另外,EMD的过程中会产生过包络、欠包络、端点效应和模式混叠等问题。GUO等[6]利用非线性状态估计方法[7]对风电机组发电机定子温度建立状态监测模型并进行预测,但在仅依靠机组运行工况选择模型输入变量,并没有具体分析各输入变量对输出变量的影响力。文献[8]通过对SCADA系统原始数据进行预处理建立状态监测模型,计算相应的状态评价标准;文中通过监测风电机组输出功率与温度之间的变化趋势来检测发电机轴承故障,但其仅考虑了监测变量与单一输入变量的相关性,单一变量受随机因素影响较大,其数据存在一定的不确定性,容易造成结果的误判,无法保证模型的准确性和可靠性。文献[9]利用支持向量机建立了风电机组输出功率模型。在相同的输入条件下,当主轴轴承出现故障时,其对应的输出功率将随着故障的逐步加重而逐渐减小;当输出功率的实测值与模型预测值超过正常的阈值时,发出报警信息,能够有效地检测故障。但该状态监测模型的输入变量仅依靠实际经验进行选取,没有分析各输入变量与输出变量的相关性,使得模型的准确性降低。文献[10]基于主轴振动信号分析其时域、频域以及包络谱等特征,采用决策融合方法建立了发电机主轴轴承故障诊断模型。该方法对振动信号精度要求较高,需要安装价格昂贵的高精度振动传感器,增加了状态监测成本。文献[11]基于SCADA系统运行数据,利用神经网络建立了风电机组发电机和齿轮箱轴承温度监测模型,其能较好地识别风机子部件的异常情况。神经网络方法对训练样本的需求量较大,训练时间较长,使得状态监测模型具有一定的局限性。由于以上问题的存在,本文选取SCADA系统记录的主轴温度作为监测变量[12],基于风电机组实际运行数据建立主轴温度监测模型。

风是风力发电的动力,风速会对风电机组产生直接的影响,风电机组运行数据随着风速随机变化。风电机组运行环境恶劣、运行工况复杂,运行环境温度变化大,运行时受风沙和振动等干扰因素的影响,导致较大的测量噪声被引入传感器测得的运行数据中。针对风电机组运行数据强随机性和高噪声的特点,采用高斯过程方法建立主轴温度监测模型并进行预测。如果主轴处于异常工作状态,其模型预测残差序列的统计特性会发生明显的改变,可以及早地发现主轴的潜在故障。

1 风电机组主轴结构及故障形式

主轴轴承由外圈、内圈和滚动体等几部分组成。主轴在工作时,外圈固定于轴承座或者是与机壳相连的位置,内圈连接机械转动轴,随着其一起转动。通常径向载荷和轴向载荷同时作用于主轴,主轴承受冲击的能力较差,容易发生故障。主轴常见的故障主要有疲劳剥落、点蚀、压痕、腐蚀、磨损或擦伤、断裂、冲击载荷作用引起的保持架损坏以及由于润滑不足而导致的接触表面的胶合等,上述这些故障都会导致主轴温度的异常升高。

选取某风电场1.5 MW机组的SCADA系统运行数据作为建模样本,对主轴状态进行监测。该型号风电机组的主要状态参数如下:额定风速为12 m/s,切入风速为3 m/s,切出风速为25 m/s,叶轮的额定转速为20 r/min。SCADA系统记录间隔为10 min,共记录47个参数,包括时间、风速、功率、转矩、齿轮箱和主轴轴承温度等,同时系统地保存了运行日志,每条运行日志包括记录时间、机组故障或状态转换代码、状态说明等。

2 基于高斯过程的风电机组主轴温度建模

风电机组运行数据具有高随机性和强噪声的特点,因此选择的建模方法应适用于风电机组运行数据。

高斯过程建模方法是贝叶斯建模方法的一种,该方法在建模过程中加入了已有对象的先验知识,再联合实际运行数据进行训练得到后验高斯过程模型[13]。

2.1 高斯过程建模

高斯过程建模是一种随机过程建模,其均值m(x)、协方差函数k(x,x′)决定了其统计特性。

f(x)~GP(m(x),k(x,x′))

(1)

其中,GP代表高斯过程。受到噪声因素的干扰,实际上高斯过程的一般模型为:

y=f(x)+ε

(2)

(3)

(4)

其中,δij为Kronecker函数。

协方差函数的矩阵形式如下:

(5)

其中,C(X,X)为N×N阶协方差矩阵;K(X,X)为核矩阵,其维度为N×N,元素为Kij=k(xi,xj);I为单位矩阵,其维度为N×N。x*为满足该高斯分布的1个输入,y*为其对应的未知输出,加入已有的观测样本(X,y),则其先验联合高斯分布为:

(6)

在高斯分布新的输入x*和已有的N个观测样本(X,y)的条件下可得y*的后验概率分布为:

(7)

利用高斯过程方法建立风电机组主轴温度监测模型首先要确定模型的输入变量、输出变量以及模型的超参数。

本文选取的平方指数协方差函数为:

(8)

其矩阵形式如下:

(9)

为计算超参数Θ,采用最大似然估计方法处理式(8)。

(10)

其中,K(Θ)为以超参数Θ为参考变量的平方指数协方差函数。

对式(10)求一阶导数为:

(11)

其中,Θi为超参数向量Θ的第i维分量;tr(·)为求迹运算;K和Λ分别为K(Θ)和Λ(Θ)的简写,对该最大似然估计问题采用共轭梯度法进行求解,即可确定超参数Θ。

2.2 风电机组主轴温度建模

根据风电机组运行工况随风速时变的特点,初步选择与主轴温度较为密切的7个变量,即功率、叶轮转速、风速、齿轮箱转速、转矩、机舱温度、环境温度作为高斯过程模型的输入变量,模型的输出为主轴轴承温度。

选取某机组2015年8月1日—2015年8月30日共计4 000条SCADA系统运行数据,在此期间主轴工作正常。选取运行数据的前3 000条数据作为主轴温度模型的建模数据,后1 000条数据作为模型验证集合。

根据模型的训练样本及共轭梯度法计算高斯过程模型的超参数如表1所示。

表1 风电机组主轴温度模型超参数值Table 1 Hyper parameters of spindle temperature model for wind turbine

由于D中每个分量dl表征了该输入变量与目标输出之间的关联性尺度。依据高斯过程模型的自动关联分析方法,如果dl越大,则表明该输入变量与目标输出之间的关联性越大,对目标输出的影响越大;如果dl越小,则表明该输入变量与目标输出的紧密程度越差、影响越小[14];当dl足够小时,表明该输入变量与目标输出基本不相关,则可以忽略该项输入变量对输出的影响。从表1可以看出,风速、叶轮转速和齿轮箱转速对应的dl值相较于其他输入变量的dl基本接近为0,因此基于自动关联分析原理应剔除这3项。风电机组运行过程中随着风速的增加,机组的叶轮和齿轮箱等旋转部件的转速增加,机组转矩和功率随之增大,风速、叶轮转速及齿轮箱转速对主轴温度的作用可以用转矩和功率来替代。高斯过程建模通过自动关联分析去除冗余建模变量风速、叶轮转速和齿轮箱转速。重新计算高斯过程模型超参数如表2所示。

表2 去除冗余建模变量后的风电机组主轴温度模型超参数值Table 2 Hyper parameters of spindle temperature model for wind turbine without redundant modeling variables

根据表2中高斯过程模型的超参数及模型的验证集合对模型进行验证,结果如图1所示,图中的温度数据已进行归一化处理。

图1 主轴温度正常时的模型验证结果Fig.1 Results of spindle temperature model verification when spindle temperature is normal

由图1可以看出,主轴温度高斯过程模型的预测值和实际值很接近,预测残差较小,大部分数据的预测残差都小于5%,这表明主轴温度高斯过程模型对主轴正常状态具有很高的预测精度。

2.3 模糊核聚类样本选择

风电机组运行数据具有数据总量大、多重相关性、非线性、数据分布随机等特点,这将导致建模过程复杂度较高、所需时间较长,难以达到实时监测的目的。因此对大量的建模样本数据而言,消除数据中冗余信息的影响,提取有效的状态信息,用少量的数据得到高质量的模型辨识率,增强模型的泛化能力,对实现风电机组的实时监测具有重要意义。

模糊核聚类方法(KFCM)是在模糊聚类方法(FCM)中加入了核函数K[15]。在输入空间通过非线性映射函数Φ,将数据映射到高维特征空间。

在输入空间中引入模糊核聚类方法,其目标函数为:

(12)

‖Φ(zk)-Φ(vi)‖2=K(zk,zk)+

K(vi,vi)-2K(zk,vi)

(13)

将式(13)代入式(12)中依据模糊聚类[16]中隶属度函数和聚类中心的计算公式可得模糊核聚类的隶属度函数为:

(14)

聚类中心为:

(15)

其中,m为模糊指数,且m>1。本文模糊核聚类方法中采用的核函数为高斯核函数。

采用模糊核聚类方法对风电机组原始数据进行筛选,步骤如下。

a. 依据风速功率变化情况设定聚类数c=3,模糊指数m=2。

b. 随机初始化各个聚类中心vi。

c. 根据式(14)利用当前的聚类中心更新隶属度,根据式(15)利用当前聚类中心和隶属度更新各个聚类中心。重复运算直至各个样本的隶属度基本保持不变。

通过模糊核聚类方法将3 000个训练样本分为3类,从每类中抽取1/10组成新的建模样本。利用高斯过程建模方法基于新的训练样本建立主轴温度模型。高斯过程模型的超参数如表3所示。

表3 通过模糊核聚类方法选择样本后得到的风电机组主轴温度模型超参数值Table 3 Hyper parameters of spindle temperature model for wind turbine with samples selected by KFCM

根据表3中高斯过程模型超参数及模型验证集合对模型进行验证,验证结果如图2所示。

图2 通过模糊核聚类方法选择样本后的主轴温度模型验证结果Fig.2 Results of spindle temperature model verification with samples selected by KFCM

对比图2与图1可知,模糊核聚类方法的引入对主轴温度高斯模型预测精度的影响很小。通过模糊核聚类方法对建模样本进行筛选,消除了样本中携带的冗余信息,提高了模型辨识率,同时在保证预测精度的条件下,缩短了建模时间,为实现大规模风电机组的在线监测提供了可能。

3 基于莱依特准则的双滑动窗口残差统计分析

利用高斯过程建模方法建立主轴温度模型并进行预测,当主轴工作在正常状态下时,预测残差较小,预测精度较高,当主轴发生故障时,预测残差明显增大,预测精度下降。文献[6]提出了一种单滑动窗口处理预测残差序列的分析方法。计算滑动窗口中包含残差序列的均值和标准差,其能够实时连续地反映残差序列的大小和分布情况。为快速反映残差序列的均值和标准差的变化趋势从而提高主轴状态监测的灵敏性,要求滑动窗口的宽度越小越好。但当窗口内存在孤立较大残差时(如机组启停机时),为抑制孤立异常残差的作用,使用宽度较大的滑动窗口能够更加可靠地对主轴状态进行监测,因此,滑动窗口宽度的选择十分重要。

当滑动窗口选择比较恰当时,其能够快速连续地反映残差统计特性的变化趋势,同时还消除了由随机因素引起的孤立异常残差带来的影响,进而提高了主轴异常预警的灵敏性和可靠性。为此,本文提出了基于莱依特准则的双滑动窗口残差统计分析方法。

3.1 双滑动窗口残差统计方法

主轴温度高斯模型产生的预测残差序列近似服从正态分布,依据统计学中正态分布的特性,残差序列落在3倍标准差[-3σ,3σ]区域的概率大于99.7%,落在此区域之外的概率不足0.3%,即符合莱依特准则。所以当预测残差序列中某一残差落在3倍标准差区域外时,可能是由于传感器测量误差等随机因素引起的。

为对预测残差序列的统计特性进行分析,首先要建立2个宽度不同的滑动窗口,分别为快速检测窗口和备用平均窗口。快速检测窗口的窗口宽度记为Nq,备用平均窗口的窗口宽度记为Nb,Nb=wNq,w>1.5。为保证双滑动窗口的可靠性,备用平均窗口的宽度要显著大于快速检测窗口。

假设在时刻T对应最新的残差序列,此时刻的残差序列为εGT=[ε1ε2…εi…],计算快速检测窗口内残差序列的均值和标准差。

(16)

利用快速检测窗口对主轴温度高斯过程模型的预测残差序列进行统计分析,由于快速检测窗口的宽度较窄,其能够快速反映残差均值和标准差的变化趋势,及早发现残差序列的异常变化;同时快速检测窗口基于莱依特准则检测本窗口内是否存在孤立异常残差。当主轴处于异常工作状态时,主轴温度高斯过程模型的预测残差序列异常变化是持续发生的,其显著区别于孤立异常残差,不会触发备用平均窗口。当快速检测窗口检测出该窗口内存在孤立较大残差时,在该时刻启用备用窗口替代快速检测窗口,计算窗口内残差序列的统计特性。由于备用平均窗口的宽度明显大于快速窗口,其对孤立较大残差具有良好的平均作用,进而提高对主轴状态监测的可靠性。

3.2 基于主轴温度高斯过程模型的双滑动窗口残差统计分析

图3 验证集合快速检测窗口残差统计特性Fig.3 Residual statistics of validation set with quick moving wind

从图3中可以看出,快速检测窗口滑动到残差序列的第295点和第751点时,对应的残差超出3倍标准差阈值范围,说明在这2点的快速检测窗口内存在孤立异常残差,在第295点和751点立即启用备用平均窗口,计算该窗口内的均值和标准差。本文取w=2,则备用平均窗口的窗口宽度Nb=100,其残差统计窗口如图4所示。

图4 验证集合备用平均窗口残差统计特性Fig.4 Residual statistics of validation set with backup moving wind

表4记录了残差序列在第295点和第751点处的残差值及其对应的2种窗口的3倍标准差阈值。

表4 3倍标准差阈值Table 4 Three times standard deviation thresholds

4 基于双滑动窗口的主轴温度异常检测

应用高斯过程方法建立主轴温度模型并预测,产生预测残差序列。利用残差均值和标准差的变化趋势检测主轴故障状态,首先要确定其均值和标准差阈值。具体设置阈值的方法参见文献[4]。

对验证序列利用双滑动窗口对其预测残差进行统计特性分析,设定残差阈值和标准差阈值,所得验证序列残差均值和与标准差变化趋势如图5所示。

图5 基于双滑动窗口的验证序列残差统计分析Fig.5 Statistical analysis of verification sequence residuals based on double moving window

为模拟主轴发生故障导致主轴温度升高的情况,对验证序列中的主轴温度分量手动加入累积偏差,起始点为第501点,步距为0.0004(数据已归一化)。加入了累积偏差的主轴温度预测残差序列如图6所示。

图6 模拟主轴故障时对应的预测残差Fig.6 Prediction residual of corresponding spindle fault simulation

利用双滑动窗口对图6中的残差序列进行统计分析,结果如图7所示。

图7 基于双滑动窗口对偏移后的残差序列统计分析Fig.7 Statistical analysis after migration of residual sequence based on double moving window

从图7中残差均值曲线可以看出在第670个滑动窗口处,其对应的残差均值超过设定的阈值(见图中虚线标识)。此时,距离加入累积偏移的初始点的宽度为670-500+50=220,即在第720点检测出主轴温度出现异常变化,计算该点和起始点之间的温度偏差为:220×(33-21)×0.000 4=1.056(℃)(33℃为主轴温度上限,21℃为主轴温度下限)。上述分析表明,当主轴发生异常状况导致其温度发生偏移时,其高斯过程模型能及时检测出故障,进而发出报警信息。

5 结论

风电机组主轴的运行状态与风电场的运行效率和维护费用直接相关,本文基于风电机组实际运行数据,利用高斯过程回归建模方法建立主轴温度模型,同时采用自动关联分析方法确定模型输入变量。由于实际运行数据中包含大量冗余信息,样本数据量大造成建模过程复杂,建模时间较长,采用模糊核聚类方法对原始数据进行筛选,消除数据中的冗余信息的影响,在保证建模精度的情况下,大幅缩短了建模时间,为大规模风电机组在线监测提供了思路。为进一步分析主轴工作状态,提出了双滑动窗口残差统计分析方法用于处理主轴温度模型的预测残差序列,提高了主轴异常预警的灵敏性和可靠性。通过手动加入累积偏差来模拟主轴故障状态,利用双滑动窗口对故障数据进行分析,其能够及时发现故障并发出报警信息,从而验证了该方法的有效性。

参考文献:

[1] 杭俊,张建忠,程明. 风力发电系统状态监测和故障诊断技术综述[J]. 电工技术学报,2013,28(4):261-271.

HANG Jun,ZHANG Jianzhong,CHENG Ming. An overview of condition monitoring and fault diagnostic for wind energy conversion system[J]. Transactions of China Electrotechnical Society,2013,28(4):261-271.

[2] 李辉,胡姚刚,李洋. 基于温度特征量的风电机组关键部件劣化渐变概率分析[J]. 电力自动化设备,2015,35(11):1-7.

LI Hui,HU Yaogang,LI Yang. Gradual deterioration probability analysis based on temperature characteristic parameters for critical components of wind turbine geneator system[J]. Electric Power Automation Equipment,2015,35(11):1-7.

[3] HAMEED Z,HONG Y S,CHO Y M,et al. Condition monitoring and fault detection of wind turbines and related algorithms:a review[J]. Renewable and Sustainable Energy Reviews,2009,13(1):1-39.

[4] 颜永龙,李剑,李辉. 采用信息熵和组合模型的风电机组异常检测方法[J]. 电网技术,2015,39(3):737-743.

YAN Yonglong,LI Jian,LI Hui. A wind turbine anmaly detection method based on information entropy and combination model[J]. Power System Technology,2015,39(3):737-743.

[5] YANG Yu,YU Dejie,CHENG Junsheng. A roller bearing fault diagnosis method based on EMD energy entropy and ANN[J]. Journal of Sound and Vibration,2006,294(1-2):269-277.

[6] GUO Peng,INFIELD D,YANG Xiyun. Wind turbine generator condition monitoring using temperature trend analysis[J]. IEEE Tran-sactions on Sustainable Energy,2012,3(1):124-133.

[7] CROSS K C,SINGER R M,WEGERICH S W,et al. Application of a model-based fault detection system to nuclear plant signals[C]∥Proceedings of 9th International Conference on Intelligent Systems Application to Power System. Seoul,Korea:Argonne National Laboratory,1997:1-7.

[8] YANG Wenxian,COURT R,JIANG Jiesheng. Wind turbine condi-tion monitoring by the approach of SCADA data analysis[J]. Renewable Energy,2013,53(9):365-376.

[9] 黄元维. 基于支持向量机的风电机组主轴轴承故障诊断[J]. 仪器仪表用户,2016,23(11):88-92.

HUANG Yuanwei. Fault diagnosis of spindle bearing in wind turbine based SVM[J]. Chinese Journal of Scientific Instrument,2016,23(11):88-92.

[10] 安学利,蒋东翔,李少华. 基于决策融合的直驱风电机组轴承故障诊断[J]. 电网技术,2011,35(7):36-41.

AN Xueli,JIANG Dongxiang,LI Shaohua. Fault diagnosis of spherical roller bearing of direct-drive wind turbine based on decision fusion[J]. Power System Technology,2011,35(7):36-41.

[11] KIM S Y,RA I H,KIM S H. Design of wind turbine fault detection system based on performance curve [C]∥SCIS-ISIS. Kobe,Japan:IEEE,2012:2033-2036.

[12] 梁颖,方瑞明. 基于SCADA和支持向量机的风电机组状态在线评估方法 [J]. 电力系统自动化,2013,37(14):7-11.

LIANG Ying,FANG Ruiming. An online wind turbine assessment method based on SCADA and support vector Regression[J]. Automation of Electric Power Systems,2013,37(14):7-11.

[13] 孙斌,姚海涛,刘婷. 基于高斯过程回归的短期风速预测[J]. 中国电机工程学报,2012,32(29):104-109.

SUN Bin,YAO Haitao,LIU Ting. Short-term wind speed forecasting based on Gaussian process regression model[J]. Proceedings of the CSEE,2012,32(29):104-109.

[14] WANG B,CHEN T. Gaussian process regression with multiple reponse variables[J]. Chemometrics and Intelligent Laboratory Systems,2015,142:159-165.

[15] 张莉,周伟达,焦李成. 核聚类算法[J]. 计算机学报,2012,25(6):587-590.

ZHANG Li,ZHOU Weida,JIAO Licheng. Fuzzy kernel clustering[J]. Chinese Journal of Computers,2012,25(6):587-590.

[16] 黄梅,贺仁睦,杨少兵. 模糊聚类在负荷实测建模中的应用[J]. 电网技术,2006,30(14):49-53.

HUANG Mei,HE Renmu,YANG Shaobing. Application of fuzzy clustering in measurement based load modeling[J]. Power System Technology,2006,30(14):49-53.

猜你喜欢

高斯主轴残差
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
数学王子高斯
基于递归残差网络的图像超分辨率重建
天才数学家——高斯
双主轴双排刀复合机床的研制
基于FANUC-31i外部一转信号在三档主轴定向中的应用
应对最大360mm×360mm的加工物研发了双主轴·半自动切割机※1「DAD3660」
平稳自相关过程的残差累积和控制图
虚拟主轴在无轴印罐机中的应用