基于XGBoost-LSTM的水轮机轴瓦温度预测
2023-10-18郜振亚苗洪雷
谈 群,郜振亚,秦 拯,苗洪雷
(1.湖南大学 信息科学与工程学院,湖南 长沙 410082; 2.华自科技股份有限公司,湖南 长沙 410205)
0 引 言
中国水电行业发展迅速,水电机组装机容量持续提升,设备的维修和保养也越来越重要。在水力发电的机组中,稳定轴瓦温度对水轮机在工作状态下的安全运行起着重要的作用[1-3]。轴瓦温度过高会造成烧瓦事故,迫使机组停机甚至发生重大安全事故。监控轴瓦温度、及时发现轴瓦温度异常、避免进一步的损失是水电站工作人员的重要工作。
国内外学者对水轮机轴瓦温度的研究主要集中于研究水轮机轴瓦温度升高的机理,识别轴瓦温度升高的原因,进而提出相应的日常巡检和维修处理建议;基于理论和数学模型,进行轴瓦温度预测和故障预测与健康管理(Prognostic and Health Management)系统开发。毋生俊等[2]等根据多年运行水电站的经验,对水轮机轴瓦温度升高的原因进行了详细分析,对不同原因提出了相应的预防和维修措施建议。Gunasekara[4]对轴瓦温度的动态变化进行建模和模拟,发现轴瓦温度取决于多个变量,如环境空气温度、冷却水和冷却水流量、初始轴承温度、运行持续时间和电力负荷,很难利用常规的建模方法对这种传热系统进行建模。唐勇等[5]根据温度系统非线性、大滞后、多变量、强耦合等特点,提出了改进的人工神经网络BP算法对水轮机轴瓦温度进行建模和预测,实现了对模拟瓦温变化趋势的准确预测。唐诗等[6]采用支持向量机模型对轴瓦温度进行了预测,结果显示根据仿真分析结果得出的预测值能够较好地跟踪实际值。
总结现有文献,水轮机轴瓦温度升高机理的研究相对充分,但对轴瓦温度进行预测和预警的研究相对较少,且存在以下两点不足:① 在建模时,普遍只选取了影响轴瓦温度的直接因素,忽略了工况数据如有功功率、水头等因素。水轮机在运行时,组件之间的影响十分密切,不同的水轮机机组的运行环境、设备的健康状况不尽相同,轴瓦温度的影响因素也应包括各自的实际条件。② 在预测方法上,虽然考虑了变量之间的非线性因素,但是普遍将历史数据进行统一输入,未充分考虑温度序列随时间的变化趋势。水轮机的测点监测数据是由传感器收集到的按照时间顺序排列的一系列观测数值,各个参数的时间效应明显,如温度是随时间递增或递减而并非离散的,水轮机正常工作时,某一时刻的温度与之前的温度紧密相关。
对此,本文首先对水轮机轴瓦温度的影响因素进行分析,识别出轴瓦温度的直接因素和工况因素,然后采用特征工程算法筛选出对轴瓦温度真正有影响的特征,再利用时间序列分析的方法进行建模,得出更为精确的轴瓦温度预测方法,旨在考虑不同水轮机各自的实际情况,搭建出具有普适性的轴瓦温度预测方法,更准确地预测出轴瓦温度,为温度告警等相关系统提供相应的技术支撑。
1 水轮机轴瓦温度影响因素分析
水轮机工作时,轴瓦表面与轴颈之间由于机械摩擦而产生热量,润滑油起到减少摩擦作用,又可以把少部分热量及时通过润滑油的循环带出,热的润滑油经过冷却水变成冷油供给轴瓦再次使用,如此循环往复构成冷却系统。因此,一般来说,在机组正常工作的情况下,轴瓦温度不会发生太大的变化。基于以上工作机理以及可量化的条件,本文梳理出以下几个轴瓦温度升高的原因。
(1) 机组转速。水轮机机组的转子通过旋转使得轴瓦与轴颈进行摩擦,产生热能。理论上,机组转速越快,短时间内产生的热能也越多。在实际的工作中,工作人员发现当机组转速较低时,油膜未能充分形成,轴瓦温度反而更高甚至造成烧瓦。因此,部分水电站明确禁止水轮机长时间在低转速环境下工作。
(2) 油膜厚度。机组运行时,轴瓦与轴颈之间由于机械运动产生摩擦阻力,进而使轴瓦温度升高。润滑油作为降温和润滑的媒介,与轴瓦、轴颈充分接触并形成一定厚度的油膜,减少轴瓦与轴颈的摩擦阻力,因此,可以通过油膜厚度来反映轴承之间的润滑状况及其瓦面温度的变化。
(3) 冷却水压力。冷却水压力过低时会降低冷却器的过流量,影响冷却器的正常工作,引起轴瓦温度升高。
(4) 环境温度。在水轮机正常工作时,轴瓦与外界环境接触,一方面轴瓦温度会随着环境温度呈现季节性和昼夜温差变化;另一方面,外界环境会与轴瓦、冷却水等设备产生热量交换,对轴瓦温度起到一定的调节作用。
(5) 工况因素。水流流过水轮机时,通过主轴带动发电机旋转将机械能转换成电能。在效率不变的情况下,发电机产生的功率越大,需要的机械能越多,轴瓦做功也越多。水头、流量等也会对轴瓦温度产生相应的影响。
除以上因素外,润滑油的质量、主轴摆度、机组振动、冷却水系统故障等因素也会对轴瓦温度产生影响,查找原因时必须全面考虑,但这些因素难以进行量化,无法在数学模型中准确表述,因此在建模时暂不考虑。
2 特征工程
2.1 特征工程重要性
由众多监测点对水轮机工作数据进行收集,各个信号之间会相互叠加,彼此影响,甚至会存在冗余信息。单个监测点无法真实反映出设备的运行状态和故障信息,需要结合多个监测点的信号数据综合考虑。如何从众多的监测数据中找到有效的特征,对于模型的搭建、预测的准确性和科学性十分重要。
特征工程是机器学习中最重要的一部分,是指把原始数据转变为模型训练数据的过程,目的是获取更好的训练数据特征,使机器学习模型能够逼近数据的上限[7]。特征工程一般可以分为特征构建、特征选择和特征提取。特征构建需要一定的构建经验,通过不断训练累积经验,学习如何构建。特征提取和特征选择较为相似,区别在于特征提取更加强调通过一定的特征转换的方式获取模型数据输入集。特征选择是从特征集合中挑选一组具有明显物理或统计意义的特征子集,如水轮机轴瓦温度预测的过程中也使用特征选择,模型一般挑选环境温度、油膜厚度等特征作为模型训练的数据集。
本文将重点放在特征选择上,目的是通过特征选择从众多的监测点数据中挑选出对水轮机轴瓦温度有影响的因素。现有文献在预测水轮机轴瓦温度的建模中,普遍只选择了环境温度、油膜厚度、机组转速等特征,未考虑其他因素。采用统一的特征进行建模不能适应所有水电站的情况。不同水电站的基础建设不同,尤其是小水电站,部分特征无法收集,如油膜厚度为流体,数据难以测量,小型水电站此类数据普遍缺失。此外,不同的水轮机、同一水轮机的不同工作环境会导致水轮机各个信号之间的影响不同,在实际工作中,工况的相关特征对轴瓦温度的影响程度应当视水轮机的实际情况来判断。因此,对轴瓦温度进行建模时,应当充分考虑水轮机的实际情况,从众多的特征中选择合适的特征子集。
2.2 基于XGBoost的特征选择原理介绍
XGBoost是对梯度提升决策树(GBDT)的改进,能够多线程实现回归树的并行构建,将计算速度和效率发挥到极致[8]。GBDT只利用了一阶导数的信息,XGboost对损失函数做了二阶泰勒展开,计算精度更高,而且XGboost在目标函数中加入了正则项,有效地防止了过拟合,相较于GBDT算法更具优势。一些学者在特征选择的实证分析中,发现XGBoost在众多模型中表现出最优性能[7,9]。XGBoost算法具体可表示为
(1)
(2)
(3)
(4)
XGBoost算法进行特征选择的原理如下:在单个决策树中,利用每个属性分割点改进性能度量的量来计算属性重要性,由节点进行加权和记录次数。一个属性对分割点改进性能度量越大,权值越大,属性越重要。最后将属性在所有提升树中的结果进行加权求和并平均,得到重要性得分Fscore。Fscore可以理解为特征在决策树里出现的次数,一般来说,如果一个特征在所有树中作为划分属性的次数越多,那么该特征就越重要。Fscore计算如下所示,式中M是所求特征分类到节点的集合。
Fscore=|M|
(5)
3 基于LSTM的轴瓦温度时间序列预测
水轮机的轴瓦温度、环境温度等具有明显的随时间变化的趋势,并且监测数据通常按照时间顺序排列。在进行轴瓦温度的预测研究中,有必要对其进行时间序列分析,挖掘出特征的未来发展趋势,得到更加准确的预测结果。
时间序列分析的模型较多,传统的模型如自回归模型、滑动平均模型、自回归滑动平均模型等,都属于线性回归模型。实际的时间序列数据较为复杂,非线性成分较多,以上模型在复杂的时间序列分析中具有很大的局限性。随着深度学习技术的发展,一些深度学习模型逐渐被应用到时序数据的研究中,其中循环神经网络(Recurrent Neural Network,RNN)模型应用最为广泛。RNN将时序的概念引入到网络结构设计中,使其在时序数据分析中表现出更强的适应性。但RNN模型存在以下两个问题:① 由于梯度消失和梯度爆炸的问题,RNN不能处理延迟过长的时间序列;② 训练RNN模型需要预先确定延迟窗口长度,然而实际应用中很难自动地获取这一参数的最优值[10]。长短期记忆(Long Short-Term Memory,LSTM)模型弥补了RNN的梯度消失和梯度爆炸、长期记忆能力不足等问题,使得循环神经网络能够真正有效地利用长距离的时序信息[11]。在不同领域内,LSTM在时间序列的处理上比传统的时间序列分析方法表现出了更优秀的精度[12-13]。LSTM的内部模块如图1所示,σ和tanh分别代表sigmoid和双曲正切激活函数,其前向计算方法可以表示如下。
图1 LSTM模型的内部模块Fig.1 Internal module of the LSTM model
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
(6)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
(7)
ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc)
(8)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
(9)
ht=ottanh(ct)
(10)
式中:i,f,c,o分别为输入门、遗忘门、细胞状态、输出门。W代表对应的权重系数;b为偏置项。通过前向计算每个单元的输出值和最后的输出值,将最后的输出值与标签计算出误差,根据反向梯度计算完成每一层每一个单元的参数更新,从而完成训练。
4 实验验证
本文提出了一种基于XGBoost特征工程和LSTM时间序列分析(XGBoost-LSTM)来预测水轮机轴瓦温度的方法,主要流程如图2所示,本节结合实际数据对此方法展开实验验证。
图2 模型预测流程Fig.2 Model prediction flow chart
4.1 数据预处理和参数确定
本文实验数据来源于海南某水电站2022年11月至2023年1月的历史数据,运行数据真实可靠,来源具有合法性。该电站装有3台2.5 MW混流式机组。虽然影响轴瓦温度的特征众多,但不同的水电站信息化、智能化建设水平不同,特别是小水电站不能收集到所有的特征。根据该电站的实际情况,收集到的变量包括轴瓦温度、环境温度、有功功率、机组转速、励磁电压与冷却水压力。
本文对该水电站的运行数据按照5 min为一次间隔进行收集,并对停机数据、异常数据、缺失值采用直接删除的方法。数据清洗后,共有2 834条原始数据。为了加快模型的收敛速度,本文采用Min-Max 标准化方法对数据进行标准化,见公式(11)。
(11)
式中:x*为标准化后的温度数值;x为当前温度;xmax与xmin分别为模型测练温度值中的最大值与最小值。
划分数据集时,将预处理后的数据按照8∶2的比例划分训练集与测试集。根据现场的实际情况和模型的调优结果,本文将LSTM模型的跳跃步长设置为12,并进行单步预测,即用前12条记录预测下一时刻的轴瓦温度,依次递进;学习率设置为0.001,并加入早停法(Early Stopping)来防止模型的过拟合。
4.2 评估指标
为评价模型对轴瓦温度的预测结果,本文选取了以下3个评估指标:
(1) 均方误差为
(12)
(2) 平均绝对误差为
(13)
(3) 最大绝对误差为
MAXE=max{|y′i-yi|,i∈[1,n]}
(14)
式中:n为选取的样本数量,y′i为预测值,yi为实际值。
4.3 结果与分析
特征过多时会增加算法复杂度,增加模型训练和预测时间,因此在模型训练之前,有必要进行特征选择。本文选取XGBoost进行特征选择,使用Python 3.7环境下的XGBoost工具包进行特征评分。XGBoost有两种评分方式:① 在模型训练完成之后,调用feature_importances_参数查看每一个特征对模型的重要程度,即哪些特征变量在模型中发挥的作用更大。数值越大,重要性也越高;② 调用get_score()方法获得特征重要性得分,一般使用total_gain参数,表示在所有树中该特征在每次分裂节点时带来的总增益。
图3~4是使用XGBoost计算得到各个特征的重要性和重要性得分,可以看出,变量中对轴瓦温度影响程度最大的分别是冷却水压力、环境温度和有功功率,表明该水轮机的冷却系统和实际工况对轴瓦温度起着重要作用。机组转速的影响程度最小。这是因为,水电站的机组为额定频率,水轮机工作时,机组通过调速器等设备使得机组转速维持在恒定值,以保障机组的安全性能。对于数学模型来说,机组转速接近为一个常量,对模型的影响较小。因此,虽然理论上机组转速对轴瓦温度有着重要影响,但结合水电站正常工作的工况,机组转速并不能作为预测轴瓦温度的特征,这也验证了选取特征时考虑水轮机实际情况的重要性。结合以上分析,进行特征选择后筛选出的变量为冷却水压力、环境温度和有功功率,这些特征的重要性累计和为0.87。
图3 特征重要性Fig.3 Feature importance results
为检测对轴瓦温度进行时间序列分析的重要性,本文选择支持向量回归(Support Vector Regression,SVR)[14]模型与LSTM进行对比验证,并将未进行特征选择的原始特征和进行特征选择后的特征依次在模型中进行训练,比较模型在测试集上的效果,结果如表1所示。从表1可以看出,在选用XGBoost模型进行特征提取之后,SVR模型的均方根误差RMSE减小了6.6%,平均绝对误差MAE减小了21.7%,最大绝对误差MAXE没有减小;LSTM模型的均方根误差RMSE减小了13.8%,平均绝对误差MAE减小了16.4%,最大绝对误差MAXE减少了32.8%,说明利用XGBoost进行特征提取的方法适合SVR和LSTM模型,进行特征选择后,减少了冗余变量,模型的精度得到了一定程度的提升。同时,LSTM模型的RMSE,MAE,MAXE明显比SVR模型小,LSTM预测值与真实值的误差在1 ℃以内,表明LSTM在轴瓦温度的预测上具有更好的性能。
图5~8分别为SVR模型和LSTM在测试集上的预测值与真实值的曲线图像,温度值按时间顺序排列。可以看出,实际的轴瓦温度随时间表现出一定的周期性趋势,这与工作环境和工作状态有关。图5显示,在未进行特征选择时,SVR模型不能跟踪到轴瓦温度的时间趋势。进行特征选择后,如图6所示,预测值曲线相对平滑,但拟合效果较差,表明特征选择具有优势,但SVR模型不能精确地处理时间序列数据。图7展示了未进行特征选择的LSTM模型回归结果,表明LSTM模型基本上跟踪到了轴瓦温度的时间变化趋势,且与真实值的误差较小。进行特征选择后,如图8所示,模型的精度进一步提升,预测值的变化趋势与实际值的趋势基本一致,误差在1 ℃以内,展示出XGBoost-LSTM模型的优异性能。
图5 未进行特征选择的SVR模型的拟合结果Fig.5 Fitting results of SVR model without feature selection
图6 特征选择后SVR模型的拟合结果Fig.6 Fitting results of SVR model after feature selection
图7 未进行特征选择的LSTM模型的拟合结果Fig.7 Fitting results of LSTM model without feature selection
图8 特征选择后LSTM模型的拟合结果Fig.8 Fitting results of LSTM model after feature selection
5 结 论
本文提出了基于XGBoost-LSTM模型来预测水轮机轴瓦温度的方法,从理论上分析了进行特征选择和时间序列分析的重要性,并结合实际数据进行验证,结果发现在预测轴瓦温度时,使用XGBoost模型选择合适的特征后进行预测可以减少冗余变量,提高模型的精度。LSTM模型的均方误差、平均绝对误差和最大绝对误差都优于SVR模型,LSTM模型能更好地跟踪数据的非线性动态变化,模型的精度有较大幅度的提升,预测值与实际值的误差在1 ℃以内,进一步验了LSTM模型更适合时间序列的轴瓦温度预测,研究成果可以为水轮机故障预测与健康管理系统的开发提供参考。