APP下载

基于LSTNet网络的风电机组发电机主轴承温度预测研究*

2022-10-19杰蒋树旗

传感技术学报 2022年7期
关键词:关联度轴承发电机

刘 杰蒋树旗

(沈阳工业大学机械工程学院,辽宁 沈阳 110870)

发电机主轴承作为发电机设备核心部件,一旦损坏,受限于检修过程和设备本身的复杂结构,导致其检修难度高,同时影响发电效率,增加了风场的运维成本[1]。发电机主轴承长期的高温状态会使轴承内部润滑油的粘性降低,从而增大与工作部件的摩擦力,温度持续升高,最终会导致发电机主轴承出现故障。因此,对风电机组发电机主轴承温度的早期预测研究有利于维护设备和减少费用,提高机组轴承等各部件的使用寿命。

目前,不少学者结合SCADA数据针对风电机组相关预测做了大量研究。在数据预处理上,Zhang等[2]提出了VMD-WT和PCA-BP的数据处理方法将风速信号分解为低频、高频分量,消除随机波动对预测的影响,提高了RBF模型的预测水平。李大中等[3]利用灰色关联度分析的方法解决了变量选择的主观性,降低了模型的复杂度。尹诗等[4]采用高斯混合模型对机组进行工况辨识,采用随机森林算法对主轴温度残差进行建模预测。贾依达尔·热孜别克等[5]针对风电机轴承温度易受随机因素影响和预测准确性低的问题,使用主成分分析和遗传算法对数据进行降维处理。上述对风电机组有关预测多以考虑前期数据预处理为主。在预测模型上,考虑到多元时间序列数据的非线性问题,李江坤等[6]采用Bi-LSTM结构和普通LSTM进行记忆处理和全连接层加权,有效地提高了预测精度。NIU等[7]为解决仿真实验中出现的过拟合问题,提出一种GRUCNN结合的方法模型,在预测精度和运行速度方面相对LSTM模型较好。Huang等[8]对LSTNet、TPALSTM、DA-RNN三种模型预测风电功率的能力进行了比较研究,深入分析了注意力如何从原始输入中捕获时间和空间模式。Zhou[9]提出了一种基于深度学习框架的M-LSTNet网络,即在LSTNet网络框架的基础上加入M-Impute和M-ARIMA两种算法,解决了缺失数据的时间序列预测问题。

本文提出了基于LSTNet网络的发电机主轴承预测模型,选择风电机组SCADA系统中的主轴承历史温度数据为实验数据,基于影响程度不确定性的观测序列,采用灰色关联度分析和BP神经网络来筛选特征变量,建立新的观测序列,利用同时具有线性和非线性特点的LSTNet模型训练和测试,最终实现对风电机组发电机主轴承温度的准确预测。

1 数据预处理

1.1 灰色关联度分析

灰色关联分析(Gray Correlation Analysis,GRA)是一种定量描述两个或多个灰色因子在演化过程中的相对变化趋势的分析方法。其主要在具有复杂关联的因子变量中比较是否一致,从而找出其优缺点影响系统发展的主要和潜在因素[10]。使用灰色关联分析法确定发电机主轴承温度和其他参数指标的关联程度,分析步骤如下。

①确定参考序列为发电机主轴承温度向量X0和系统比较序列为影响主轴承温度的参数向量Xi:

②标准化处理。标准化处理的目的是对所有序列进行量纲归一化,并为参考序列和每个比较序列分配相同的权重。

式中:xi(j)为归一化处理后的数据;(j)为初始数据;m为数据量。

归一化后得到如下矩阵:

③求取关联系数。轴承温度序列X0与其他指标序列Xi的灰色综合关联系数为:

式中:Δi(k)=|x0(k)-xi(k)|,ρ为分辨率,取值范围在[0,1]。其取值越小,表明相关系数之间的差异就越显著。当ρ≤0.546 3时,分辨能力最佳,因此一般取ρ=0.5。

④求关联度。将每组关联系数的平均值看成是关联度,即

一般情况下,当灰色关联度r≥0.6时,可认为相关性较高,进而筛选出具有高度关联的s组比较序列,即

1.2 BP神经网络

BP(Back Propagation)神经网络算法筛选变量是在BP神经网络的基础上,引入平均影响值(Mean Impact Value,MIV)进行筛选[11]。杨斌等人[12]提出用平均影响值来反映神经网络中权重矩阵的变化情况。平均影响值也被认为是在神经网络中评价变量相关性最好的指标之一,这为解决此类问题提供了新的选择[13]。本文选取平均影响值来判断各个参数向量对主轴承温度向量的影响程度,MIV值的正负性表示相关的正负性,绝对值大小表示影响的相对程度。平均影响指标的计算过程如下:

步骤1:根据原始数据建立BP神经网络;

步骤2:对训练样本进行处理,将训练样本中的每个自变量(特征初始值参数)分别进行加减10%,得到两个新样本X1、X2;

步骤3:对X1、X2两样本进行BP神经网络仿真,得到实验结果,计算出A1和A2的差值,记为影响值(IV),表明改变特性对输出结果的影响,公式如下:

式中:Xi表示训练的第i个自变量数据集样本,mean表示平均值。

步骤4:计算IV的平均值并记为MIV。MIV绝对值的大小反映了影响程度大小。因此通过对MIV绝对值可以判断其对应的特征向量与主轴承温度向量的相对重要性,从而实现了变量的筛选。

步骤5:重复步骤2~4计算所有独立的MIV值变量。

2 LSTNet网络预测模型

Lai等学者[14]于2018年提出了长期和短期时间序列网络(Long-and Short-term Time-series Network,LSTNet)。它是一种针对多元时间序列的深度学习框架,模型的结构如图1所示。

图1 LSTNet结构图

该模型通过结合卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、自回归(Auto regression,AR)和特殊设计的Skip-RNN,能够成功捕获数据中的长期模式和短期模式,结合线性和非线性模型,使模型更加稳健。LSTNet是一个深度学习框架,混合长期和短期模式的多元时间序列预测[15]。LSTNet的构建基块主要包括:卷积单元、循环单元、循环跳跃单元、自回归单元。

在LSTNet框架中,首先将多元时间序列数据输入到一维卷积层,该层是一个没有池化的卷积,主要用于从时间序列数据中获取短期模式和变量之间的局部依赖性。其主要由多个宽度为ω、高度为n的滤波器组成(n与变量X的个数相同)。第k个滤波器扫过输入矩阵X并产生hk。

下一步是将卷积层的结果输入到循环组件(Recurrent Component)和循环跳跃组件(Recurrent Skip Component)。使用循环跳跃组件主要是缓解梯度的消失,该模块是RNN模型的变体LSTM单元,如图2所示。

图2 LSTM单元结构图

t时刻循环单元隐藏状态的模型结构可以表示为:

式中:rt为遗忘门;ut为输入门;ct为细胞状态;ot为输出们;ht为输出值,是每个时间步的隐藏状态。W为权重向量,⊗为元素乘积,σ为sigmoid函数,xt为t时刻的输入,同时也是卷积层的输出,b为偏置向量,p是跳过隐藏单元的数量。

最后是全连接层(Dense)连合Recurrent和Recurrent-skip组件的输出。因为卷积层和循环层不具有线性特点,这使得神经网络模型的输出对输入两者的比例不太敏感。而且在实际数据集中,输入信号的尺度是产生连续变化的,这使得网络的预测水平大大降低。为了弥补这个问题,选取传统自回归(AR)模型看成是LSTNet框架结构中的线性分支,其模型的结果为:

式中:为AR模型预测结果,qαr为窗口大小。

将该网络的部分输出结果和AR分量模型的预测结果,结合sigmoid函数获得LSTNet的最后的预测结果:

在“互联网+”的时代下,新媒体有助于帮助大学生树立正确的人生观、价值观、世界观,比如,大学生可以通过新媒体掌握当前的时事政治,强化学生的爱国情怀,明确自身的发展方向,提高学生的综合能力,实现学生全面发展的教学目标。在新媒体环境下,大学生不再是传统意义上的信息接收者,而是新时代下信息与知识的传播者、参与者,新媒体环境下的大学生思想政治教育不仅拓宽了大学生的眼界和视野,提升了学生的核心素养,还能进一步推动我国现代教育事业的快速发展,实现高校教育的顺利开展。

本文根据平均绝对误差(Mean Absolute Error,MAE),均方根误差(Mean Squared Error,MSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、预测精度(R2)来评价模型的预测水平。

式中:n是测试集的数量,yi是测试集的实际值,¯y是测试集的平均值,^yi是测试集的预测值。

3 基于LSTNet预测模型的实例分析

3.1 GRA-BP参数选择

对华东地区某风电场SCADA系统中发电机主轴承监测参数进行提取,随机选择连续20 d,采样频率为10 min,共计2 880组数据,部分样本如表1所示。选取前2 310组数据作为训练集,后570组数据作为测试集。发电机主轴承温度为输出量,与发电机主轴承温度相关的参数当作输入变量,已知共有20种相关参数,如表2表示。

表1 样本数据示例

首先采取灰色关联度分析方法进行关键因素筛选,将发电机主轴承温度作为参考序列,表2的20种影响主轴承温度的参数作为比较序列,根据式(5)、式(6)计算参数关联度。通过比较发电机主轴承温度与相关参数之间的关联度,对上述各个影响主轴承温度的因素进行相关度计算并进行排序,结果如图3所示。

表2 影响主轴承温度的相关参数

结合表2和图3可以看出,风速、U1电流、齿箱轴1温度、功率、U2电流、叶片角度、对风角度对应关联度相对较小,分别为0.924、0.888、0.887、0.887、0.887、0.783、0.772。由于关联度指标都大于0.6,且关联度大于0.95的比较集中,最终从20个影响因素中筛选13个关键因素,分别为U1绕组温度、环境温度、发电量、U1电压、U2电压、U3电压、电网频率、U3电流、齿箱油温、机舱温度、风向、发电机转速、转子转速。

图3 各因素与发电机主轴承温度的关联度

利用BP方法根据式(8)计算出上述筛选的13个影响因素的MIV值,结果如图4所示。

结合表2和图4可以看出,‘15’、‘5’、‘12’、‘8’分别对应的发电量、U1电压、机舱温度、风向的MIV值明显高于其他相关指标的MIV值,分别为15.31、13.78、23.30、17.99。因此选择这四个参数作为输入特征。

图4 各指标MIV值

3.2 预测模型的训练与评估

本实验的基本环境是i5-4590 CPU;RAM 4GB。LSTNet预测模型借助Pycharm平台使用Python3.6中TensorFlow2.1.0和Keras2.3.1等模块进行编程计算。设置LSTNet模型的输入维数为5,输出维数为1,包括2个输入,2个一维去池化的卷积层(Conv1D),1个循环层,1个循环跳跃层,1个全连接层(Dense)。设置一维卷积层的滤波器(filters)为30,卷积核尺寸(kernel_size)为3,步长(strides)为1;取Skip层数为3,highway_window为3,dropout系数为0.2,LSTM的输入尺寸(batch_size)为64,迭代次数(epochs)为300,该预测模型参数结构设计如图5所示。

图5 LSTNet参数结构设计

选择均方误差(Mean Square Error,MSE)作为该模型训练的损失指标(loss_metric),通过其损失曲线判断模型是否收敛。经过迭代,LSTNet模型训练集损失曲线如图6所示。

从图6可以分析出,训练集经过大约250次迭代后在0.001趋于稳定,该模型趋于收敛,进一步说明了该方法的优越性。

图6 LSTNet模型训练集损失曲线

在LSTNet网络模型中,卷积核中的初始化权值和偏置是利用random函数随机初始化,其值范围为(-1,1),在建模过程中对模型权重进行了保存。其中,一维卷积层的偏置为1×30的向量,循环层和循环跳跃层的偏置均为1×256的向量,全连接层dense的输出偏置为-0.16903。LSTNet网络参数输出,如表3所示。

表3 LSTNet网络模型输出参数

由表3可知,一维卷积的输出类型为2×30的特征向量,循环层和循环跳跃层的输出类型是1×64的一维向量。

分别将通过GRA方法筛选的变量和GRA-BP结合筛选的变量代入LSTNet预测模型,并将预测结果与测试集的温度数据进行对比,如图7所示,不同变量筛选方法的预测误差对比,如表4所示。

表4 不同变量筛选方法下的误差对比

从图7和表4可以发现,经过GRA-BP处理后预测精度比单一的使用GRA方法的高,准确率为0.993。

图7 不同变量筛选方法下的预测对比

经过GRA-BP方法筛选变量后,使用不同的模型对主轴承温度进行预测,结果如图8所示,不同模型误差对比如图9所示。

图8 不同预测模型的预测对比

图9 不同预测模型的误差对比

从图8可以发现不同方法下的预测趋势基本和原始数据吻合,但从图9可以分析出LSTM和SVR的样本误差波动较大,LSTM和RNN的MAE、RMSE、MAPE相对偏大,而LSTNet模型无论从样本误差还是其他四种评价指标来看,明显优于其他三种方法。

4 结论

建立了基于LSTNet网络的风电机主轴承温度预测模型,对初始变量进行GRA-BP的数据预处理,克服了变量选择的主观性和消除了维数过多的冗余性,利用LSTNet网络自身线性和非线性结合的优越性进行数据的训练与验证,借助MAE、RMSE、MAPE以及R2等评价指标,可以得出,相对其他方法,该模型对发电机主轴承温度趋势的预测具有较高的准确性,为进一步对发电机轴承故障检测和预警提供了参考依据。

猜你喜欢

关联度轴承发电机
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于熵权TOPSIS法和灰色关联度分析的藤茶药材等级研究
笑声发电机
发电机
接触式密封在大功率半直驱永磁风力发电机应用探讨123
小番茄发电机
斯凯孚展示用于电动汽车的先进轴承产品
中国制造业产业关联度分析
中国制造业产业关联度分析
一种轴承拆卸装置的实用设计