APP下载

基于变量筛选的烟气流量软测量研究

2016-07-04佟纯涛金秀章郝兆平

电力科学与工程 2016年5期

佟纯涛,金秀章,郝兆平

(华北电力大学 控制与计算机工程学院,河北保定071003)



基于变量筛选的烟气流量软测量研究

佟纯涛,金秀章,郝兆平

(华北电力大学 控制与计算机工程学院,河北保定071003)

摘要:为了解决烟气流量主要依靠硬件传感器测量,高温腐蚀使得传感器损坏,烟气湍流、紊流现象的存在,使得测量不准确等问题,提出一种基于投影重要性分析和前向搜索筛选辅助变量,使用支持向量机建模的软测量方法,测量SCR反应器入口烟气流量。以电厂阵列式传感器测量出的烟气流量作标准,使用最小二乘支持向量机方法建立模型预测输出,对比投影重要性分析筛选辅助变量和不筛选变量结果表明,投影重要性分析和前向搜索筛选辅助变量的方法对建模有较好优势,能够减小系统结构,增加软测量建模的泛化能力。

关键词:烟气流量;最小二乘支持向量机;软测量;变量投影重要性分析;前向搜索

0引言

烟气流量是电厂运行中重要的一个参数。烟气流量测量对于烟气脱硫脱硝剂的计算、锅炉燃烧系统的热平衡计算、燃烧效率的评价以及燃烧机理的研究等很多方面都有着重要的意义[1-3]。目前,随着电厂装机容量的增大,烟道直道缩短,造成烟道内气体流场分布不均匀,紊流旋流现象存在,使得各类流速流量仪表测量的有效性降低。针对这种问题,应用软测量方法测量烟气流量有着很大的研究意义。

软测量技术发展与应用已经逐渐成熟,在很多方面都有着研究与应用。然而,烟气流量软测量目前还停留在选择传感器安装位置方面,测量技术有待改进和更新。烟气流量软测量建模辅助变量的选择,也有待于深入研究。论文着重使用变量投影重要性分析方法分析影响烟气流量的因素,选择影响较大的因素作为辅助变量,对数据处理后,利用前向搜索继续选择辅助变量,使用支持向量机,优化参数,完成模型的训练与测试。

1变量投影重要性分析

辅助变量,特别是辅助变量之间存在较强的相关性时,对建模存在较大的影响。偏最小二乘法对解决这类问题,有着很大的优势。变量投影重要性分析是偏最小二乘的一种辅助性数据分析方法[4]。通过偏最小二乘法提取主成份,消除变量之间的相关性,使用主成份与得分权重,通过式(1)计算变量的投影重要性指标。主成份描述了自变量对因变量的解释能力,变量投影重要性通过分析各个变量对主成份的解释能力进而选择自变量。

假设因变量为y,自变量x1,x2,…,xm,对于第i个自变量,变量投影重要性指标V计算公式为:

(1)

式中:m为自变量个数;th为自变量提取的主成份;r(y,th)为因变量与主成份的相关系数,表示主成份对y的解释能力;whi是自变量在主成份上的权重。

通过变量投影重要性指标的计算可知,xi对y的解释能力是由主成份ti体现的。V的大小体现了对模型的影响程度,其值越大,影响越大;其值越小,影响越小,较小时可以忽略。

2前向搜索算法

前向搜索算法也称之为特征集合增加法,是一种从低维特征到高维特征的搜索方法。利用分析得到的辅助变量作为一个集合,建模初始时把特征集初始为一个空集,每次搜索增加一个特征,选择建模方法建立此次特征搜索的模型,计算评价函数。待搜索结束后,根据每次特征搜索之后建立模型的评价函数结果选择最终建模特征集。其过程思想是:通过增加特征,对上次的特征集加以补充,使得特征选择最大化,但特征增加并不能保证模型更佳,评价函数的作用就是特征选择的标准,依据评价函数模型性能最好时的特征集,即认为是最佳模型特征集。前向搜索筛选辅助变量流程图如图1。

图1 前向搜索流程图

3支持向量机算法

支持向量机是以统计学理论为数学基础建立的一种学习方法。传统软测量方法是基于经验风险的结构风险最小化准则,只强调了样本的经验风险最小误差,如神经网络等,支持向量机,不仅如此,使用的实际结构风险包括经验风险和置信范围如式(2),以训练误差作为优化问题的约束条件,以置信范围最小化作为优化目标,是基于经验风险和置信范围的双重最优,这是优于传统其他方法的地方

(2)

式中:R(w)为结构风险;Remp(w)为经验风险;φ为置信区间。

对于回归问题,支持向量机通过样本T={(x1,y1),…(xk,yk)}∈(Rn×R),其中xi∈Rn为自变量样本,yi∈R为因变量样本,i=1,2,…,k,寻求决策函数(3)式,通过使用决策函数,求解任一x对应值y

(3)

对于非线性回归的情况,支持向量机的解决思路是选择某种映射,把低维空间的非线性映射到高维线性空间,在这个高维空间构造回归函数解决。由此可知,非线性回归的关键是利用非线性映射φ(·)将训练数据映射到高维特征空间,即(xi·xj)→(φ(xi)·φ(xj)),使得在输入空间的非线性函数估计问题转化为高维空间中的线性函数估计问题。定义这种映射为核函数K(xi,xj),是任意满足Mercer条件的对称函数。

常用的核函数有:(1)多项式核函数;(2)高斯函数;(3)sigmoid核函数。建模使用式(4):

(4)

最小二乘支持向量机是支持向量机的一种改进[5-7]。不同之处在于最小二乘支持向量机将误差的平方作为损失函数而不是使用ε不敏感函数作为损失函数。这样就巧妙地把不等式约束转换为等式约束从而可以使用线性运算求解。这样就转化为求解下式的问题:

(5)

引入拉格朗日函数:

(6)

使用拉格朗日法求解(6)式:

(7)

得到:

定义核函数K(x,xi)=φT(x)φ(xi),则上式的求解就转化为求解下面的线性方程:

(8)

求解得到最小二乘支持向量机的估计函数为

(9)

4烟气流量建模

软测量理论是基于最优准则,选择与被估变量相关的一组辅助变量,建立辅助变量为输入,待估变量为输出的最优估计数学模型。论文建模是通过机理分析影响烟气流量的因素,从DCS中获取与被估变量相关的可测变量、输入变量、可测输出变量,经过预处理后,利用偏最小二乘投影重要性分析计算变量投影重要性指标V,选出V较大的辅助变量作为变量筛选集,使用前向搜索算法继续筛选辅助变量,以可测输出为导师信号,筛选完毕后,使用最小二乘支持向量机建立软测量模型,模型结构图如图2。

图2 VIP LSSVM软测量结构图

4.1影响烟气流量的因素

根据燃烧理论[8-11],对于燃煤机组,煤和空气在锅炉内燃烧生成各种混合气体经过烟道,脱硫脱硝后排放到空气中。煤燃烧生成气体的多少对烟气流量影响很大。在锅炉设计时,燃煤计算和锅炉空气量计算是必不可少的,而烟气流量的形成与二者有着很大的关系,不仅如此,影响燃烧的各种因素也将影响烟气量的产生。不同的负荷下,所需的煤和空气量也是不同的。

表1 辅助变量

其中SCR入口温度3个(简写为入口温度1、入口温度2、入口温度3)、炉膛二次风门开度7个(简写为AB层开度、BC层开度、CD层开度、DE层开度、EF层开度、FF层开度、OFA层开度)、燃尽风开度5个(简写为SOFA1层开度、SOFA2层开度、SOFA3层开度、SOFA4层开度、SOFA5层开度),对于这些变量对烟气流量的影响程度是不一样的。为了分析其影响程度,使用偏最小二乘变量投影重要性分析,计算每个变量的投影重要性指标,选出主要影响因素。

4.2选择辅助变量

由上节机理分析选出的影响烟气流量的辅助变量很多,且经分析变量之间存在较大相关性,辅助变量之间的相关性对支持向量机建模的结构有着很大影响。辅助变量之间的相关性见表2。

表2 部分变量相关性分析

相关研究表明[14],使用主元分析进行特征提取时虽然能降低辅助变量之间的相关性,但并未考虑自变量与因变量之间的相关性,且主元分析对辅助变量选择会给建模过程引入较大的噪声。偏最小二乘法,对多元数据相关性分析,有一定的优势,其综合考虑自变量之间、自变量与因变量之间的相关性。基于以上考虑,文章使用偏最小二乘变量投影重要性分析法,计算变量投影重要性指标,根据指标大小,选出影响较大的因素,作为主要特征,使用前向搜索(介绍见文献[13])结合支持向量机建模方法建立软测量模型,继续筛选辅助变量。使用偏最小二乘法进行主元提取,并使用变量投影重要性分析计算变量的投影重要性指标V值。排序后,使用前向搜索法建立搜索模型并计算均方根误差。变量的投影重要性指标V值见表3。

表3 辅助变量投影重要性指标

投影重要性分析具体步骤如下:

(1)对原始样本做标准化处理消除量纲的影响,即把原始数据压缩到[0,1]。

(2)对数据进行处理消除坏点值对建模的影响。

(3)使用偏最小二乘方法,使用交叉验证进行主成份提取,计算主成份与辅助变量的相关系数,利用(1)式计算投影重要性指标V。

(4)对V进行排序,排序后使用前向搜索特征结合LSSVM建模方法,建立模型进行预测,计算预测值与实际值的均方误差。

(5)选择均方误差最小时的辅助变量集作为辅助变量,建立预测模型。

V排序后,使用前向搜索算法,以V值的顺序逐次增加变量个数,使用最小二乘支持向量机算法,采用10交叉验证、网格优化、训练,建立每次搜索辅助变量后的模型,并计算每次搜索辅助变量后的均方误差。前向搜索每增加一个变量模型不一定最优,但根据均方误差作为条件,选择均方误差最小时的辅助变量作为建模最终辅助变量。前向搜索建模均方误差如图3。

图3 前向搜索建模均方误差

4.3建模仿真与结果分析

经变量投影分析和前向搜索,选择前10个辅助变量作为支持向量机的输入,建立软测量模型。对于最小二乘支持向量机建模,选定核函数的形式、核参数和误差惩罚系数,是建模的关键。核函数及核函数参数选择[15]对支持向量机的性能有很大影响,误差惩罚系数对于模型的泛化能力至关重要。选择高斯核函数形式(4式)。其中σ为核宽度。鉴于最小二乘支持向量机有较快的求解速度,采用网格优化算法和交叉验证,即选定参数集,从参数集中进行组合,进行支持向量机训练,使用测试集进行检验,选出最佳的参数组合确定最终的模型参数。

为了分析变量投影分析特征选择的优势,建立未使用特征选择的模型,建模预测结果和未使用特征选择预测结果分别如图4、图5。

图4 VIP+LSSVM建模预测

图5 LSSVM建模预测

选取平均误差、均方根误差、相对均方根误差来评价预测效果,根据不同模型的测量指标对比可知,建立变量筛选最小二乘支持向量机模型较最小二乘支持向量机的预测结果较好,建模预测效果较优。使用变量投影重要性分析,选择影响较大特征,消除对建模结构影响,改善了建模效果,使得预测效果更佳。不同建模评价指标结果如表4。

表4 不同建模评价指标

均方根误差:

(10)

相对均方根误差:

(11)

平均误差:

(12)

分析原因可知,不进行特征选择时,虽然经理论分析辅助变量与待估变量有相关性,但是却不能消除变量之间相关性对建模影响。模型输入的增多使得模型复杂度增加,且引入不相关噪声,进而影响模型的泛化能力。

5结论

辅助变量的选择一直是软测量建模的关键,理论分析与数据驱动是选择辅助变量的两种方法。辅助变量选择对建模至关重要,使用热工测量领域用法较少的变量投影分析法筛选特征,计算变量的投影重要性指标,初步筛选影响较大的辅助变量,并使用前向搜索继续筛选辅助变量,最终以最小二乘支持向量机建模方法建立烟气流量测量模型,实现对烟气流量的测量。通过分析均方根误差、相对均方根误差、评价误差,对比了其他方法,结果表明模型能较准确地预测烟气流量。此方法筛选辅助变量有助于简化建模结构,增强模型的泛化能力。

采用变量投影重要性分析筛选变量,建立的烟气流量软测量模型,为研究使用软仪表及时有效测量出烟气流量提供理论依据,为烟气流量测量提供了一种新方法。烟气流量的准确测量对脱硫脱硝还原剂准确计算也有着重要的意义。

参考文献:

[1]付智明, 邓云耀, 张红燕,等.SCR烟气脱硝还原剂耗量计算方法的探讨[J]. 热力发电, 2012, 41(4):40-41.

[2]李靖安. 锅炉排烟烟气量对排烟热损失的影响分析[J]. 中氮肥, 2004(3):20-22.

[3]叶勇健, 袁果, 蔡冠萍,等. 火电厂脱硝系统还原剂耗量的计算方法[J]. 电力勘测设计, 2009(2):56-60.

[4]宋宛净, 姚建刚, 张彦,等. 基于PLS分析的高压绝缘子污秽等级判定[J]. 计算机工程与应用, 2014,50(15):223-227.

[5]孙薇, 刘默涵. 基于改进最小二乘支持向量机的短期负荷预测[J]. 电力科学与工程, 2015, 31(12):16-21.

[6]阎威武, 朱宏栋, 邵惠鹤. 基于最小二乘支持向量机的软测量建模[J]. 系统仿真学报, 2003, 15(10):1494-1496.

[7]陈荣超. 燃煤电厂脱硝NOx的软测量技术和自动控制优化[J]. 电力科学与工程, 2015, 31(1):15-19.

[8]王雅彬, 李晓敏, 边泽楠,等. 基于支持向量机的电站锅炉NOx排放软测量模型[J]. 电力科学与工程, 2012, 28(4):55-59.

[9]林益明, 贾宏禄, 金李强. 基于优化燃烧调整降低锅炉氮氧化物的试验分析[J]. 电力科学与工程, 2011, 27(10):69-73.

[10]王超, 祝云飞.W火焰锅炉低氮燃烧器改造问题与解决方案[J]. 电力科学与工程, 2015,31(11):54-58.[11]陆小荣. 燃料燃烧计算的程序设计与应用(Ⅱ)空气量、烟气量与燃烧温度的计算[J]. 陶瓷科学与艺术, 2005, 39(1):16-21.

[12]李忠鹏, 闫宝瑞, 信春玲,等. 基于微孔限流孔板的超临界流体流量计量方法研究[J]. 仪表技术与传感器, 2015(11):105-107.

[13]毛勇, 周晓波, 夏铮,等. 特征选择算法研究综述[J]. 模式识别与人工智能, 2007, 20(2) :211-218.

[14]王建, 杨耀权, 马高伟. 软测量辅助变量选择方法研究[J]. 电力科学与工程, 2011, 27(7):37-40.

[15]张倩, 杨耀权. 基于支持向量机核函数的研究[J]. 电力科学与工程, 2012, 28(5):42-45.

Research on Soft Measurement of Flue Gas Flow Based on Variable Selection

TONGChuntao,JINXiuzhang,HAOZhaoping

(SchoolofControlandComputerEngineering,NorthChinaElectricPowerUniversity,Baoding071003,China)

Abstract:To solve the problems of the dependence of flue gas flows on hardware sensor damage made by high temperature corrosion flue gas turbulence and inaccurate measurement, this paper proposed a method based on the analysis of projection importance and the auxiliary forward searching screening variables. By using support vector machine modeling of soft measuring method, the SCR reactor inlet gas flow is measured. Based on an array of sensors for measuring gas flow standard in current power plant, by applying the least squares support vector machine (SVM) method and the comparison method, the detailed analysis is conducted. Results show that projection analysis of the importance and the auxiliary forward searching screening variables are superior in measuring methods, and this method expands the new way of flue gas flow measurement.

Keywords:flue gas flow;L S SVM;soft measurement;variable importance for projection;forward search

收稿日期:2016-04-08。

作者简介:佟纯涛(1989-),男,硕士研究生,研究方向为燃煤机组节能环保、脱硫脱硝优化,Email:tct_ncepu@sina.com。

中图分类号:TP181

文献标识码:A

DOI:10.3969/j.issn.1672-0792.2016.05.009