基于Lasso-RF模型的燃气轮机启动过程建模分析
2023-05-08鲍克勤杨蒙姣
鲍克勤 杨蒙姣
(上海电力大学自动化工程学院 上海 200090)
0 引 言
在燃气轮机发电机组启动操作过程中,以往的凭经验以及操作票内容和步骤繁多,很容易导致各种人为故障的发生,也会带来巨大的经济损失。基于电厂历史运行数据建立燃气轮机的启动过程模型可以对启动过程中关键属性的历史数据进行集中管理,并实时监测其变化情况,甚至可以对燃气轮机的状态趋势进行有效预测,指导运行人员进行优化操作,帮助运行人员全面并及时地掌握机组最新的启动情况并不断优化。建立燃气轮机启动过程的模型有利于综合研究各因素对启动性能的影响,优化启动时间,对提高发电机组的运行可靠性以及经济性具有重要意义。关于燃气轮机的启动过程模型的建立,国内外众多学者已经进行了大量的研究工作。文献[1]基于燃气轮机的结构机理进行模块化建模,进而通过对燃气轮机稳态及动态数学模型的研究来对机组运行进行优化。文献[2-3]从热力学理论出发,并结合运行数据的方法建立燃气-蒸汽联合循环发电机组的模型。文献[4]围绕F级燃气-蒸汽联合循环机组的APS设计与实现对机组的启停过程进行优化。文献[5]从机器学习算法的角度出发建立燃气轮机的启动过程模型,采用支持向量机以及某型燃气轮机的启动数据为基础,避免了复杂的热力学推导过程,但模型预测过程中容易出现过拟合现象,并且运行速度较慢。
由以上可知,国内外现有研究很少涉及对多因素长时间的燃气轮机启动过程数据变化的量化分析,基本停留在基于热力学理论的机理建模的研究上。针对以上不足,结合燃气轮机实际的启动过程将其看作一个典型的非线性时序模型[5],将擅长处理高维变量的回归算法Lasso与能有效处理过度拟合的机器学习模型RF相结合建立Lasso-RF预测模型[6]。运用Lasso进行特征选择来研究影响燃气轮机启动的因素。在Lasso特征选择的基础上,采用RF模型,使用某热电公司燃气轮机的历史运行数据对燃气轮机启动过程中的重要参数进行预测。结果表明,与Lasso-SVM预测模型相比,Lasso-RF预测模型的准确性、实时性更高,并且有效地避免了过拟合的问题,在降低模型复杂度的同时也提高了模型的泛化能力,更有利于处理海量的工业数据,为燃气轮机启动过程的优化提供了一定的依据。
1 燃气轮机启动过程分析
燃气轮机的启动过程是指转子从静止零转速状态加速至全速空载的过程。主要包括启动机启动、带动燃机转子转动、燃机点火、转子加速直至达到额定转速几个阶段。在燃机启动之前,辅助设备需提前启动[7],此时燃机处于低速盘车状态,转速为3 r/min,一般规定盘车系统必须至少连续运行1 h。之后启动机启动,即静态频率转换器(static frequency converter,SFC),SFC装置主要由谐波滤波器、隔离变、整流器、电抗器、逆变器、位置传感器以及控制系统等组成。SFC控制的具体开关过程为:选择SFC后,发电机中性点闸刀、励磁变低压侧开关自动分闸,SFC隔离变6 kV开关、启动励磁变6 kV开关及其低压开关、SFC切换开关盘开关、发电机SFC闸刀自动合闸,SFC谐波滤波器6 kV开关延时10 s自动合闸投入运行,各谐波滤波器柜冷风机自动投入运行,SFC系统整流柜、逆变柜及直流电抗器风扇自动投入运行。SFC电源取自6 kV厂用电,经过隔离变、整流器、逆变器变为频率可变的交流电,输入到发电机定子绕组中,同时在发电机转子中加入直流励磁,将发电机转换为同步电动机方式转动,发电机转速随SFC输出的频率上升而上升,带动燃气轮机加速到清吹转速,之后开始清吹过程。吹扫结束后,燃机惰走至约580 r/min时进行点火,随后进行暖机、加速。转速达到2 000 r/min时,燃气透平所产生的机械功足以抵消压气机的耗功,SFC启动装置退出,并向汽轮机通入一定量的辅助蒸汽对低压缸进行冷却。机组继续升速,直至达到燃机的额定转速,其转速略高于电网频率。
由上述分析可知,在燃气轮机启动过程中,需要将燃机的主轴转速提高至额定转速,所以燃机主轴转速的变化趋势是要实时监测的重要参数,透平排气温度是评估燃烧室健康状态的重要参数。因此在本文中主要通过对透平排气温度以及燃机主轴转速的预测,建立燃气轮机的启动过程模型。由于透平排气温度与燃机主轴转速是随时间变化的数据序列,因此燃气轮机的启动过程是一个典型的非线性时序模型。为了能够较为准确地描述燃气轮机的启动模型,在选取输入输出参数时要能够尽可能包含启动过程的全部物理量,并且各物理量之间的相关性要尽可能小[5],同时为了简化模型,提高模型的预测准确度,减少机器学习的运行时间,本文选择环境温度T0、大气湿度H0、大气压力P0、燃机的燃料流量F0、压气机的进口可调导叶开度IGV以及启动电机电流I0等作为模型的输入参数,选择透平排气温度T1、燃机主轴转速R1作为模型输出参数,f、g为非线性函数,则燃气轮机的输入输出模型可简化为如图1所示。
图1 燃气轮机输入输出简化模型
基于以上模型,再加上时间因素的影响,燃气轮机启动模型的离散形式可描述为:
R1(t+1)=f(t,T0(t),H0(t),P0(t),…,
F0(t),IGV(t),I0(t))
(1)
T1(t+1)=g(t,T0(t),H0(t),P0(t),…,
F0(t),IGV(t),I0(t))
(2)
2 理论描述
2.1 Lasso回归算法
Lasso是由1996年Robert Tibshirani首次提出,属于正则化方法的一种,是压缩估计。它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零,保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。Lasso参数估计定义如下:
(3)
Lasso回归算法可以弥补最小二乘法和逐步回归局部最优估计的不足,可以有效地对存在多重共线性的特征进行筛选,即对数据进行降维处理,用尽可能少的数据解决问题。从理论上说,Lasso对数据类型没有太多的限制,可以接收任何类型的数据,而且不需要对特征进行标准化处理。因此选用Lasso回归算法进行数据处理是恰当的。
2.2 RF模型
RF是一种灵活且易于使用的机器学习模型,以CART决策树为基学习器,所构建的“森林”是决策树的集成,利用多个弱学习器集合成一个强学习器以获得更准确和稳定的预测。采用的集成方法是Bagging,基本原理是随机有放回的选择数据进行训练得到多个决策树,最后采取投票机制决定最优的预测结果[10],RF的结构如图2所示。
随机森林通过构造不同的训练集来增加基模型间的差异,从而提高组合模型的预测能力,通过k轮训练得到k个分类器{h1(x),h2(x),…,hk(x)},再用其构造一个采用投票法决定的预测模型系统,其决策函数为:
(4)
式中:hi(x)为决策树模型;Y为目标变量;I为示性函数。
随机森林构建预测模型的基本步骤是:
(1) 假设一个原始训练数据集D,由M个特征变量和一个目标变量Y组成,而且D里面有n个不同的实例[8]。
(2) 获取多个训练数据集,使用Bagging对原始训练数据集D进行K次有放回的随机抽样,得到K个新的训练子集{D1,D2,…,DK}[9],这K个训练子集每一个都包含有n个实例。
(3) 从M个特征变量中随机选取m(m (4) 把所有生成的决策树组合到一起生成一个RF模型,将测试样本带入模型,采用众数投票法,输出得到最优的预测结果。 为提高预测的准确性及精准化分析相关因素,将建模过程分为2个阶段:第1阶段采用Lasso回归算法对燃气轮机的启动数据进行特征选择,有效地选取出与透平排气温度以及燃机主轴转速相关的自变量;第2阶段将筛选出的变量作为RF的训练样本建立燃气轮机启动过程的预测模型。本文采用Python语言进行全部实验,Lasso-RF建模流程如图3所示。 图3 Lasso-RF建模流程 为了得到泛化性能较好的模型,数据样本的选取至关重要。本文的数据来自国内某市热电公司三菱M701F4型燃气轮机2019年的实际运行数据,规模庞大,覆盖了全年不同温度、不同湿度以及机组200个测点的参数,数据冗余、重复杂乱的问题显著。在数据预处理过程中,需要丢弃缺失值过多的特征和奇异数据,初步筛选出30个特征变量,分别为环境温度,大气压力,…,压气机进口温度,并依次定义为x1,x2,…,x30,定义透平排气温度为y1,燃机主轴转速为y2。 特征选择对预测模型的建立起着关键作用。在燃机启动过程中众多特征之间存在严重的多重共线性,若将30个特征全部用于预测模型的自变量,不仅运行时间长,而且存在不相关或相关性较小的变量,同时由于不同特征值相差很大,量纲不同,会对预测结果产生干扰。因此,对初步筛选的30个特征变量进行归一化处理,剔除冗余特征,这样不仅可以简化模型,提高模型的预测准确度,还可以减少机器学习的运行时间。本文使用Lasso回归算法分别对透平排气温度、燃机主轴转速进行特征选择,得到与y1相关性系数较高的8个属性,依次为压气机出口温度x13、压气机的进口可调导叶开度x3、燃料流量x10、燃料压力x11、燃料温度x16、天然气成分x14、环境温度x1、大气湿度x19。与y2相关性系数较高的6个属性,依次为启动电机电流x28、启动电机功率x4、燃料压力x11、压气机出口温度x13、天然气成分x14、燃机负荷x23。通过绘制相关性条形图以更加直观地展现出各属性的影响程度,结果如图5所示。 图4 透平排气温度相关性条形图 图5 燃机主轴转速相关性条形图 将x13,x3,…,x19作为预测y1的特征变量,将x28,x4,…,x23作为预测y2的特征变量。我国燃机发电主要用于两班制运行调峰,早启晚停,启停次数多,因此本文选取某周前六天燃气轮机的启动过程数据作为随机森林的训练集,建立一个燃气轮机的启动过程模型,将最后一天的启动过程数据作为测试集代入训练好的模型中对透平排气温度以及燃机主轴转速进行预测,并与实际启动过程数据进行对比。为展示Lasso-RF预测模型的优越性,将采用同样回归算法预处理的数据代入SVM模型中进行预测,并将预测结果进行比较。透平排气温度预测结果对比如图6所示,其中图6(a)为整个启动过程的预测结果,图6(b)为部分预测结果。燃机主轴转速预测结果对比如图7所示,其中图7(a)为整个启动过程的预测结果,图7(b)为选取的点火过程的预测结果。 (a) 整个启动过程的预测结果 (b) 部分预测结果图6 透平排气温度预测结果对比 (a) 整个启动过程的预测结果 (b) 选取的点火过程的预测结果图7 燃机主轴转速预测结果对比 由图6和图7可知,Lasso-RF模型和Lasso-SVM模型都能对燃气轮机启动过程中透平排气温度和燃机主轴转速进行有效预测,但SVM误差较大,预测结果有一定的滞后性。以燃机点火过程的预测结果为例,Lasso-RF模型的准确性、实时性更高,为运行人员调整和优化启动过程提供参考。从算法理论上分析,这是因为在创建随机森林的时候使用的是无偏估计,决策树之间是相互独立的,对于不平衡的数据集来说,它可以平衡误差,因此随机森林模型有较高的准确度。而SVM理论上主要是针对低维数的数据样本将其从原始空间映射到一个更高维的空间,使得样本在这个空间中线性可分,并借助核函数解决问题,因此在处理多变量高维度的模型预测问题中误差较大,实时性较差。无论是对透平排气温度还是燃机主轴转速的预测,RF的预测效果都明显优于SVM,说明RF具有良好的泛化能力,可以应用于不同的数据集。由于数据来自热电公司的实际运行数据,不免含有噪声成分以及信号采集误差,预测结果说明Lasso-RF模型具有更强的抗干扰性。 为更加直观地比较Lasso-RF、Lasso-SVM预测模型的准确率以及两种模型的运行时间,选用平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)作为评价指标。RMSE代表了预测值的离散程度,也叫标准误差,最佳拟合情况为RMSE等于0。模型误差指标如表1和表2所示。 表1 透平排气温度误差指标 表2 燃机主轴转速误差指标 由表1和表2可知,Lasso-RF模型即使对不同类型的输出参数其评价指标误差都小于Lasso-SVM模型。更重要的是,Lasso-RF模型对透平排气温度的预测时间比Lasso-SVM模型减少了21.24%,对燃机主轴转速的预测时间比Lasso-SVM模型减少了14.29%,因此为缩短启动过程的时间提供了可能。以上共同证明了Lasso-RF构建的燃气轮机启动过程的预测模型具有更好的准确性与优越性。 本文以燃气轮机实际启动过程数据为依据,将回归算法Lasso与机器学习模型RF相结合建立燃气轮机启动过程的Lasso-RF预测模型并对比了Lasso-SVM模型,得出以下结论: (1) 将Lasso算法用于燃气轮机启动过程中的特征选择,能有效解决众多属性之间的多重共线性问题,对数据集起到降维作用,简化模型。 (2) RF在有效的特征选择基础上使得预测模型表现出更好的准确性和泛化能力,其平均绝对误差和均方根误差值都明显小于SVM,对透平排气温度的预测准确度比SVM高43.14%,对燃机主轴转速的预测准确度比SVM高81.21%。 (3) Lasso-RF模型可以用于燃气轮机的启动过程建模分析,为优化启动过程、缩短启动时间提供了一种新的方法,对提高发电机组的经济性具有重要意义。3 预测模型建立
3.1 数据预处理及特征选择
3.2 模型预测结果
4 结果分析与验证
5 结 语