APP下载

基于多元线性回归与滚动窗的NOx排放量软测量①

2017-11-01薛美盛冀若阳

化工自动化及仪表 2017年8期
关键词:步数方根线性

薛美盛 冀若阳 王 旭

(中国科学技术大学信息科学技术学院)

基于多元线性回归与滚动窗的NOx排放量软测量①

薛美盛 冀若阳 王 旭

(中国科学技术大学信息科学技术学院)

提出一种基于多元线性回归与滚动窗的NOx动态软测量建模方法,并研究模型更新周期和不同变量选择方法对软测量模型预测结果的影响。仿真结果表明:基于BIC向后剔除多元回归和滚动窗方法的软测量模型在运行较长时间后,仍然能够较好地预测NOx的排放量。

NOx排放量 循环流化床锅炉 动态软测量 多元线性回归 滚动窗

过程工业中常存在一些对系统控制品质有重要影响但又难以直接测量的变量[1],如组分、沸点、闪点及粘度等,软测量技术是获取这些变量的重要手段。此外,尽管有些变量可以直接用硬件仪表测量,但时间成本或经济成本很高,而且有维护耗时、需要标定、老化、测量噪声大及精度不够等问题[2]。软测量技术既可以作为备件与现有的测量装置并列运行,减少测量滞后和噪声影响,也可以替代昂贵的仪表,降低测量成本[3]。

软测量建模方法有机理建模、数据驱动建模和混合建模3种[4]。目前,大部分软测量研究针对的是静态软测量模型。为了进一步提高软测量模型的精度和鲁棒性,动态软测量模型成为今后的研究方向之一[5]。回归分析是一种经典的软测量建模方法,有学者将多元线性回归方法用于循环流化床锅炉NOx软测量建模,取得了较好的预测效果[6]。但静态模型不考虑对象的动态特性,在系统工作点迁移时,估计结果不够准确。滚动窗方法通过不断更新建模区间内的数据,使模型能够始终反映系统的当前状况,可以提高软测量模型的准确程度[7]。

笔者基于多元回归方法和滚动窗方法,提出一种动态软测量建模方法,将它运用到循环流化床锅炉脱硝系统NOx排放量的软测量中,并研究模型更新周期与不同变量选择方法对NOx排放量软测量模型预测性能的影响。

1 回归变量的选择

在多元回归分析中,回归变量的选择对回归方程的质量有重要影响。若遗漏了重要的回归变量,回归模型的效果不会好;若引入过多的回归变量,则可能出现过拟合,影响模型的稳定性。

回归变量的选择方法主要有4种:最优子集法、向前选择法、向后剔除法和逐步回归法。最优子集法考虑输入变量集合的所有子集,找出其中的最优子集作为模型输入。对于含有p个候选输入变量的模型,其输入变量子集有2p个。随着p的增大,逐个尝试找出最优子集模型的计算代价指数上升。向后剔除方法从含有全部回归变量的模型开始,逐步从模型中剔除回归变量来计算最优子集。向前选择法从不含回归变量的模型开始,通过逐步向模型中加入回归变量来求解最优子集。逐步回归法结合了向前选择和向后剔除,在逐步加入回归变量的过程中进行各种检验,若没有通过检验则采用向后剔除法,两种方法交替进行直到找到所有的显著变量,并且选择的所有变量都是显著的。

评估子集回归模型的信息准则主要有F检验、均方误差(MSE)、MallowsCP、调整R2、赤池信息准则(AIC)及贝叶斯信息准则(BIC)等[8]。其中,AIC和BIC是两种最具代表性的信息准则[9]。

2 循环流化床锅炉NOx排放量软测量

2.1 模型输入量集合

化石燃料燃烧生成的NOx分为3种:热力型、燃料型和快速型。其中,热力型NOx的生成对温度有很大依赖;燃料型NOx是煤燃烧产生的NOx的主要来源;快速型NOx比其他两种NOx要少得多[10]。

对应于电站锅炉运行环境,NOx的生成与燃烧温度、氧量、煤种氮元素含量、燃料比、过量空气系数和烟气停留时间有较大关系[6]。选择性非催化还原(SNCR)系统的脱硝效率与反应温度、停留时间和NH3/NOx物质的量之比有关[11,12]。

考虑到循环流化床锅炉的测点,将氨水流量、一次风量、二次风量、给煤量、石灰石量、床温、一次风风煤比、二次风风煤比、一/二次风比及Ca/S(石灰石量/给煤量)等加入软测量模型输入量集合。

2.2 输入滞后步数

相关系数可以用于计算滞后时间[13]。以氨水流量为例,图1为由2015-07-16一天数据计算的氨水流量-NOx相关系数与滞后步数的关系曲线。在滞后步数为31时,相关系数达到最小值,即此段数据的氨水流量滞后步数为31步。图2为2015-06-28~08-13中47天的氨水流量滞后步数直方图,多数日期的滞后步数在25~35步之间,这里取30步。其他变量滞后步数的计算与此类似,不再赘述。

图1 相关系数与滞后步数关系曲线

图2 氨水流量滞后步数直方图

2.3 基于滚动窗的多元回归

实际系统工作时只与工作点附近的数据有较大相关性,而与远离工作点附近的数据相关性不大[7]。工业过程由于进料、温度及工艺等的变化,工作点往往会发生迁移。因此,采用固定数据得到的模型难以保证模型的准确性。滚动窗方法建立随时间滚动的建模数据区间,在每个新的数据到来时都会更新模型,从而保证模型始终反映系统的当前状况。但对于流程工业来说,过于频繁地更新模型会给控制系统带来较大的计算负担。因此,在滚动窗方法中引入模型更新周期,模型只有在达到更新周期时才进行更新,这样既能保证模型的准确性,又能降低控制系统的计算量。

记Ts为系统的采样周期,Tu为模型更新周期,L为滚动窗窗口长度,并假定系统当前的建模信息可以从当前到过去L组数据中获得。随着系统运行,当达到模型更新周期时,最早的Tu/Ts条数据从建模区间滚动出去,新的数据加入建模区间,模型随之更新。

基于滚动窗的多元回归建模步骤如下:

a. 设置窗口长度L和模型更新周期Tu;

b. 数据预处理(缺失值处理、滤波和z-score标准化);

c. 基于多元线性回归方法建模;

d. 有新的测量数据时,利用新的测量数据进行预测;

e. 判断是否达到模型更新周期,若没有达到则返回步骤d,若达到则更新窗口样本数据并返回步骤b。

2.4 模型预测结果

模型更新周期对预测性能有较大影响。考虑到NOx过程的慢时变特性和模型更新的计算量,较合理的模型更新周期为5~30min。选择2015-07-31一天的数据,对模型更新周期对预测性能的影响进行研究。系统采样时间为10s,滚动窗窗口长度为4 320,最大误差和均方根误差均为z-score标准化后的无量纲值。

图3、4分别为基于AIC多元回归预测的最大误差、均方根误差与模型更新周期的关系。向后剔除法的最大误差和均方根误差几乎在所有的模型更新周期中都优于其他方法,向前选择法和逐步回归法的性能基本相当。

图3 AIC预测结果最大误差

图4 AIC预测结果均方根误差

图5、6分别为基于BIC多元回归预测的最大误差、均方根误差与模型更新周期的关系。从最大误差看,向后剔除法优于逐步回归法,逐步回归法优于向前选择法。从均方根误差看,没有哪种方法表现出绝对的优势。

将图3与图5,图4与图6进行对比后可以发现,随着模型更新周期的增大,BIC回归模型的最大误差和均方根误差的波动幅度要远小于AIC回归模型。

图5 BIC预测结果最大误差

图6 BIC预测结果均方根误差

图7给出了基于BIC向后剔除多元线性回归模型的预测值与实际测量值曲线,模型更新周期5min。为了便于与测量值比较,将预测值逆标准化。其中,88.16%的预测值与实际测量值的偏差不超过2.50mg/m3,98.27%的预测值与实际测量值的偏差不超过5.00mg/m3,99.98%的预测值与实际测量值的偏差不超过10.00mg/m3,最大偏差11.78mg/m3。可见,即使在工况发生较大变化的情况下,软测量模型依然有较好的预测效果。

图7 BIC向后剔除线性回归模型预测结果

表1比较了静态线性模型与更新周期为5min的滚动窗线性模型的预测结果。

表1 静态线性模型与滚动窗线性模型预测结果

3 结束语

通过分析循环流化床锅炉NOx生成和SNCR系统脱硝原理,建立合适的模型输入量集合,利用多元线性回归建立软测量模型,并结合滚动窗使模型能够跟踪系统工况变化。在对比AIC、BIC两种信息准则,向后剔除、向前选择、逐步回归法3种回归量选择方法后,建立基于BIC向后剔除法的NOx软测量模型。该模型可以较好地适应工况变化,具有良好的鲁棒性和预测性能。

[1] 马勇,黄德先,金以慧.动态软测量建模方法初探[J].化工学报,2005,56(8):1516~1519.

[2] Kano M,Fujiwara K.Virtual Sensing Technology in Process Industries:Trends and Challenges Revealed by Recent Industrial Applications[J].Journal of Chemical Engineering of Japan,2013,46(1):1~17.

[3] Liukkonen M,Hälikkä E,Hiltunen T,et al.Dynamic Soft Sensors for NOxEmissions in a Circulating Fluidized Bed Boiler[J].Applied Energy,2012,97:483~490.

[4] 曹鹏飞,罗雄麟.化工过程软测量建模方法研究进展[J].化工学报,2013,64(3):788~800.

[5] 俞金寿.软测量技术及其应用[J].自动化仪表,2008,29(1):1~7.

[6] 白卫东,严建华,王飞,等.统计回归方法在电站锅炉氮氧化物排放量监测中的应用[J].动力工程,2004,24(3):431~435.

[7] 阎威武,常俊林,邵惠鹤.基于滚动时间窗的最小二乘支持向量机回归估计方法及仿真[J].上海交通大学学报,2004,38(4):524~526.

[8] An H,Gu L.On the Selection of Regression Variables[J].Acta Mathematicae Applicatae Sinica,1985,2(1):27~36.

[9] Yang Y.Can the Strengths of AIC and BIC Be Shared[J].Biometrika,2005,92(4):937~950.

[10] 姜鹏志.循环流化床锅炉低NOx排放特性及利用SNCR脱氮技术[J].中国电力,2010,19(6):6~10.

[11] 杨梅,张忠孝,于娟,等.循环流化床烟气SNCR脱硝机理与实验[J].燃烧科学与技术,2014,20(2):101~105.

[12] 何伟,鲁明,李国强,等.SNCR脱硝系统的广义预测控制[J].石油化工自动化,2016,52(1):38~41.

[13] 刘瑞兰.软测量技术若干问题的研究及工业应用[D].杭州:浙江大学,2004.

SoftSensorforNOxEmissionsBasedonMultipleLinearRegressionandSlidingWindow

XUE Mei-sheng, JI Ruo-yang, WANG Xu

(CollegeofInformationScienceTechnology,UniversityofScienceandTechnologyofChina)

A dynamic soft-sensing modeling method based on the multiple linear regression and the sliding window was proposed in this paper and the influence of model’s update period and different variable selection methods on the prediction results of the soft sensor model was studied. The results show that, the soft sensor model based on the sliding window and multiple linear regression which using backward elimination BIC selection method has good NOxemissions prediction performance even after running for a quite long time.

NOxemissions, circulating fluidized bed boiler,dynamic soft sensor, multiple linear regression, sliding window

TH83

A

1000-3932(2017)08-0721-04

2017-01-22,

2017-05-09)

薛美盛(1969-),副教授,从事工业自动控制的研究。

联系人冀若阳(1992-),硕士研究生,从事先进控制与优化的研究,ryji@mail.ustc.edu.cn。

猜你喜欢

步数方根线性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
楚国的探索之旅
线性回归方程的求解与应用
我们爱把马鲛鱼叫鰆鯃
微信运动步数识人指南
二阶线性微分方程的解法
国人运动偏爱健走
均方根嵌入式容积粒子PHD 多目标跟踪方法
数学魔术——神奇的速算
基于线性正则变换的 LMS 自适应滤波