APP下载

风电机组齿轮箱高温故障分析与预测

2020-04-19银磊孙启涛鲁纳纳

风能 2020年12期
关键词:齿轮箱油温风电

银磊 孙启涛 鲁纳纳

近年来国内风电装机容量不断增加,齿轮箱作为风力发电机组的关键部件,虽然制造工艺已成熟,但是风力发电机组工作环境的特殊性和承受载荷的复杂性致使齿轮箱易发生故障和损坏,而且损坏一旦触发,其维修过程相对复杂,造成机组停机时间较长,严重影响风电机组的安全性和经济性,因此对风电机组齿轮箱的故障进行预测及识别变得尤为重要。

齿轮箱高温不仅会导致风电机组限功率运行或超温停机,而且无法保证满负荷运行机组的稳定性。有些厂家为了回避此问题,调高油温报警阈值,但此方法给齿轮箱的润滑造成严重危害,使齿面容易出现胶合现象。另外,现今基于齿轮箱高温故障的研究大多集中于结构设计方面的技术升级,虽然提出的方案有一定的效果,但还不够理想。为了更好地解决此类问题,基于齿轮箱高温故障预测的预防性维修将逐渐发展为有效的手段之一。换言之,风电机组部件的故障预测技术在一定程度上能够有效避免部件因突发失效进而导致故障事故发生。

当前关于风电机组故障分析与预测的研究存在明显不足,如基于长短时记忆神经网络(Long Short -Term Memory,LSTM)对齿轮带故障进行预测,能够有效提高齿轮带断裂故障预测的精度,但是在训练时间成本上并没有显著的优势。基于复数据经验模态分解和随机森林(Random Forest,RF)理论的风电机组多域特征故障诊断研究,验证了随机森林具有很高的准确率,却未考虑齿轮箱高温故障从早期出现微弱特征到彻底失效需要经历一个渐变演化过程等等。故本文提出采用长短时记忆神经网络和随机森林组合模型LSTM-RF进行风电机组齿轮箱高温故障(包括齿轮箱驱动端轴承温度高、齿轮箱非驱动端轴承温度高及齿轮箱油温高三类)预测,该模型考虑了故障特征演变的时变性和周期性。仿真结果验证了混合模型能够有效提高齿轮箱高温预测精度,并且具有较高稳定性,可以实现提前预测未来一周齿轮箱高温故障。

齿轮箱高温预测模型理论分析

一、LSTM的原理

LSTM作为RNN的改进模型,其实质为在RNN基础上引入“门”的概念,由控制“门”的手段来控制新信息对已存信息神经元的扰乱程度,从而能够有效地保留历史信息。如图1为LSTM模型架构,LSTM的关键在于细胞的状态和穿过细胞的水平线。细胞状态类似传送带,直接在整个链上运行,只涉及少部分的线性交互,因此信息在上面流传不易发生改变。LSTM通过忘记门、输入门和输出门这三个“门”来控制细胞状态,“门”结构支持LSTM更新或丢弃信息,及更新细胞状态。

二、RF的原理

随机森林分类模型针对多变量的分类效果较好,不易出现过拟合,但结果与参数选择有关,因此需要进行参数调优。随机森林使用重采样方法从原始样本中抽取多個子样本的数据,为每个子样本建立决策树模型,然后结合多个预测结果,通过投票方式来获得最终的预测分类。

RF是Bagging的扩展版本,套袋仍是它的主要思想,但它基于套袋做了一些独特的改进。首先,RF的基本分类器是CART决策树;其次,在决策树的训练过程中引入随机属性选择,进一步提高模型的泛化能力,原理如图2所示。

三、LSTM-RF的原理

传统的齿轮箱高温故障诊断方法集中于齿轮箱温度异常诊断流程或者温度高原因分析及解决方法,以风电机组齿轮箱润滑系统原理及高温原因分析为切入点,提供合理的处理方案,在一定程度上能有效降低齿轮箱油温,避免齿轮箱高温停机,延长其剩余寿命。或者通过对齿轮箱润滑油冷却系统热交换器传热原理进行分析,通过改变散热器翅片结构,解决齿轮箱油温高问题—— 该方法虽然在齿轮箱故障技改上得到推广使用,但是缺乏预测性的分析,只考虑齿轮箱润滑系统设计层面的研究及导致此现象的可能因素,忽略了时间相关特征为在预测过程中需要考虑的关键因素等等。

风电机组齿轮箱故障由初期出现微弱迹象渐变演化为彻底失效的过程伴随着较强的时间序列性,本文提出的组合模型LSTM-RF考虑了齿轮箱油温高的数据在时间上的特征空间域,提高了齿轮箱高温预测的精度,选取随机森林主要用以特征筛选及参数调优。仿真实验结果表明,该组合模型在故障时间序列预测中具有较高的精度,其基本框架如图3所示。

预测模型建立

通过对采集的数据进行预处理、特征选取以及LSTMRF模型训练,从而实现预测效果。其中,在数据采集阶段,考虑到数据集过于庞大,倘若以秒级数据作为训练样本会导致训练时间成本太高,故对原始数据以1分钟为基准进行等距压缩处理。考虑到实时数据运算等操作的时效性,采用固定间隔采样,以此获取故障样本和正常样本。建模流程如图4所示,其主要包括:

1. 数据压缩、清洗

通过数据抽样方式获取故障样本和正常样本,作为特征提取样本。

2. 多重K-means聚类去除冗余数据

K-means实现数据的聚类,并对每行数据打上类别标签。设某部件的故障种类数为c,则多重K-means聚类的指定聚类K值为从c到2c。在多个K值的聚类时,若某批数据的类别标签始终相同,则这批数据的数据特征相近,将其视为同类型数据,将这批数据的行数记为X—— 若X极小,则认为这些数据在聚类过程中贡献值极小,视为冗余、噪声数据,将其从训练集中剔除,最终生成新的数据集。

(2)计算这批数据中每行数据与中心点的欧式距离;

(3)取距离中心点最近的前80%的数据行数,剩余的剔除;

(4)生成新的訓练集。

3. 随机森林+专家经验筛选特征点位

(1)将训练集输入到多个随机森林,输出每个维度的特征在分类器模型的贡献值,若某个特征的贡献值大于0.05,则判为重要特征;

(2)将筛选出的特征和经验特征结合,使用经验点位和删除点位来更新特征点位,即保证最终选取的结果中包含所有的经验点位,然后采用皮尔逊相关系数的计算,去除关联较大的变量,最终,得到的特征点位如表1所示。

4. 模型训练及预测

利用处理后的数据进行模型训练及预测。

预测结果分析

组合模型LSTM-RF是用LSTM对处理后的数据进行计算,将得到的结果作为随机森林的输入,利用投票法确定LSTM预测的结果中有没有故障。由仿真结果可知,LSTMRF预测模型非常适用于处理与时间序列高度相关的齿轮箱油温高等问题。在故障为齿轮箱驱动端轴承温度高、齿轮箱非驱动端轴承温度高及齿轮箱油温高的情形下,LSTM-RF预测模型的准确率及召回率如表2所示。由表2可知,运用组合模型LSTM-RF进行风电机组齿轮箱高温故障预测具有一定的可行性。

基于随机森林特征选择,对比分析LSTM-RF与XGBoost、AdaBoost、GBDT和RF等机器学习算法在相同测试集上的训练时间成本和准确率,结果如表3所示。由表3易知,LSTM-RF相比其他几种机器学习算法,具有较高的齿轮箱高温故障预测准确率,比其他机器学习预测算法平均提高3.35%;尽管GBDT和RF的时间成本低,但GBDT和RF 均是以决策树为基础的,其预测准确率比LSTM-RF略差。因此,综合来看,LSTM-RF用于齿轮箱高温故障预测较为可行。

结论

为捕捉风电机组齿轮箱高温初期故障,达到高温故障预测的效果,本文构造了LSTM-RF组合模型:与其他预测模型相比,该模型考虑了故障渐变过程,非常适合处理与时间序列高度相关的问题;由案例仿真分析结果可知,LSTMRF可以实现故障分析及预测的目的。除此之外,相比XGBoost、AdaBoost、GBDT和RF机器学习算法,LSTMRF具有较优的预测精度,可进一步研究其在风电机组其他大部件上应用的可行性。

(作者单位:明阳智慧能源集团股份公司)

猜你喜欢

齿轮箱油温风电
CJ-1型齿轮箱箱体强度分析
风力发电机组齿轮箱轴承故障诊断分析
地铁车辆齿轮箱常见故障及处置思路分析
考虑故障相关性的风电机组维修策略
风力发电齿轮箱设计制造技术
一根筷子试出最佳油温
一根筷子试出最佳油温
如何判断油温?
千亿级海上风电市场加速启动
全球海上风电发展状况