基于随机森林的变工况下重型燃气轮机压气机特性分析研究
2019-04-08武怡帆芮晓明田润禾邱利雄闫计栋
武怡帆,武 鑫,芮晓明,田润禾, 邱利雄, 闫计栋
(1. 华北电力大学 能源动力与机械工程学院,北京 102206;2. 神华国华(北京)燃气热电有限公司,北京 100024)
燃气轮机作为高效清洁的动力系统,在发电领域得到了广泛的应用。轴流式压气机(以下简称压气机)是燃气轮机的重要部件之一。在燃气轮机发电机组的实际运行过程中,压气机不可能只是在特定的设计工况下工作,它经常会偏离设计工况而在变工况下运行,从而可能引发以旋转失速和喘振为代表的内部流动失稳。因此需要建立高精度的压气机特性计算模型,分析不同工况下的压气机性能,确保压气机稳定、高效运行。
为了实现这一目标,国内外研究人员已开展了大量的工作。例如,文献[1]提出通过修正系数对雷诺相似准则进行修正,以压气机质量守恒方程为基础直接得出相似工况下压气机特性的关系式。文献[2]使用遗传算法,从实验和厂商所提供的数据中推算出相似系数,从而重新构造出压气机在非设计工况下的特性,使得运行数据得到有效运用、计算精度大幅提高,其压比、效率的最大相对误差分别为5.4%、6.7%。文献[3]使用系统辨识方法进行类似运算,最大相对误差分别为7.3%、7.1%,两者大体相当。在国内,文献[4]应用基元叶栅法使得理论计算建模的误差极大减小,压比、效率的最大相对误差达到4.7%、4.4%。文献[5-6]使用支持向量机(SVM)计算得到压气机特征级特性,从而建立压气机特性模型,其压比、效率的最大相对误差为3.1%、4.7%。综上所述,已有方法所得的压气机总压比和多变效率的模型误差最小分别为3.1%、4.4%,仍有进一步减小的空间。
本文以某F级重型燃气轮机压气机运行数据为基础,结合基元叶栅法理论计算,采用随机森林方法,建立压气机高精度特性计算模型,从而分析不同工况下的压气机性能,其流程图如图1所示。通过所建立模型获得的总压比和多变效率的相对误差明显小于此前的各种方法。
1 随机森林基本原理
随机森林(Random Forest,简称RF)是一种基于分类树的算法,该算法需要拟合和迭代,是一种比较新的机器学习方法。
2001年Breiman和Cutler参考随机决策森林方法,把大量的分类树进行组合形成随机森林,即通过随机地抽取变量(列)和样本数据(行),生成分类树,再通过汇总分类树得到结果,这一方法即为随机森林算法[7]。与神经网络(NN)、支持向量机(SVM)、决策树(DT)和Adaboost等方法相比,随机森林方法的运算量没有显著提高,但预测精度有明显提高,高效且准确;而且由于其对多元共线性不敏感,当出现非平衡数据或数据缺失时其仍能进行准确的预测,建模结果比较稳健,可以很好地预测数千个解释变量的作用,被誉为当前最好的算法之一,在各行各业都得到了越来越多的应用。
1.1 决策树的构建
构建决策树是随机森林建模的重要步骤。决策树是一种基本的分类器,一般是将特征分为两类。构建好的决策树呈树形结构,可以认为是if-then规则的集合,其分类速度快,且所建模型具有可读性,优点明确。
构建一棵决策树的条件ABCD是这棵决策树的四个特征。如果构建过程中特征的顺序不同,同一组数据集构建出的决策树也可能不同。
1.2 随机森林的构建
随机森林的基本建模思想是用随机的方法构建拥有很多决策树的森林,包括数据和待选特征的随机选取,且其构建的决策树之间相互没有关联。在得到森林之后,当有一个新的输入样本进入时,森林中的所有决策树分别对其进行判断,再利用平均法或投票法组合不同决策树的预测结果来决定整体的预测结果,进行输出,其工作原理如图2所示。
随机森林方法分为回归(Random Forest for Regression,简称 RFR)和分类Random Forest for Classification,简称 RFC)两种,其中 FRC 应用于离散型因变量建模,而RFR则应用于连续型因变量建模。本文主要采用随机森林回归进行建模[9-10]。
随机森林回归(RFR)是通过与随机向量θ有关的决策树的生长进行的,其因变量为连续型变量,我们假定训练集是从随机向量Y和X的分布中独立选取出来的。假设单一决策树的回归模型计算结果为hi(x),那么对k棵决策树的回归结果{h(X,θi),i=1,2,…,k}取平均值可以得到随机森林回归的预测结果,即:
(1)
其中:H(x)表示组合回归模型的结果,即输出结果。
2 算例与结果分析
在某燃气热电有限公司采集某F级重型燃气轮机压气机2 000个运行数据点,由于热电公司所采集数据分布较为集中,运用基元叶栅法推导得出折合质量流量位于区间(1,1.05)时的数据点40个。结合两组数据,共计2 040个数据点,采用随机森林方法进行建模。热电公司实测数据点的分布如图3所示,该压气机设计工况点的参数如表1所示。
压气机级数压气机压比大气温度/℃1718.015大气压力/MPa大气湿度/%空气质量流量/ (kg·s-1)0.10160703
(1) 计算过程中,将燃机转速、进口导叶(IGV)开度、进口空气质量流量、进口温度、进口压力和进口湿度作为六维输入,出口温度和出口压力作为二维输出,建立了压气机特性计算模型[11-13]。其中,燃机转速、进口导叶(IGV)开度、进口温度、进口压力、进口湿度以及出口温度、出口压力直接由该热电公司采集得到;然后通过烟囱出口烟气体积流量计算燃气出口质量流量,并结合燃料体积流量计算获得进口空气质量流量。
从2 040个数据点中随机选取80%的数据点作为训练数组,剩余20%的数据点作为验证数组。结果表明:与实测数据相比,此模型的温比相对误差在0.59%以内,压比相对误差在0.75%以内,如图4~图5所示。
(2) 应用建立的模型,计算不同工况下压气机总压比及多变效率,多变效率可由式(2)计算:
(2)
式中:π*、σ*分别表示总压比和总温比,k表示绝热指数。
(3) 绘制关于总压比、多变效率的压气机特性曲线。
在绘制特性曲线时,先对空气流量进行折合,定义如下:
(3)
将折合参数归一化处理,可得:
(4)
式中:下标0表示设计工况下的参数。
基于表1和运行数据,设定设计工况条件为:进口温度15 ℃,进口压力0.101 MPa,转速50 Hz,进口湿度60%RH,IGV开度78.68°[15-16]。通过改变进口质量流量,可得到一系列流量与压比、多变效率的数据,从而绘制压气机特性曲线。
由于此F级重型燃气轮机压气机主要在其效率较高的范围内工作,应用随机森林法建立的拟合模型,难以确保该模型在各种工况范围内适用。因此,使用基元叶栅法,理论计算得到折合质量流量处于(1,1.05)时的压气机压比及效率点,再将这些理论计算点与运行数据点相结合,应用随机森林法,得到压气机在不同工况下折合质量流量与总压比、多变效率之间的特性计算模型,所得压气机特性曲线如图6、图7所示。结果表明,该模型与实际运行数据点之间的总压比和多变效率的平均相对误差分别为-0.13%和0.04%,最大相对误差分别为2.11%和1.90%。
3 结论
1) 本文利用采集的某F级重型燃气轮机压气机运行数据,结合基元叶栅法理论计算,应用随机森林法,建立了不同工况下的压气机特性计算模型。该模型将压气机的总压比、多变效率最大相对误差分别从现有文献的3.1%、4.4%减小为2.11%、1.90%,仅为其68.06%、43.18%。
2) 本文采用的方法可以充分利用已有运行数据和理论计算数据,构建高精度的压气机特性计算模型,绘制不同工况下压比、效率关于折合质量流量的特性曲线。
3) 本文所构建模型能对不同工况下的压气机性能进行计算,从而为实现压气机稳定、高效运行提供理论基础和技术支持。