一种非线性烟气含氧量深度学习模型
2020-11-30唐振浩李艳艳曹生现
唐振浩 李艳艳 曹生现
摘 要:针对烟气含氧量测量成本高、测量不稳定等问题,依据深度学习理论,采用非线性组合深度置信网络(nonlinear combined deep belief network, NCDBN)方法建立烟气含氧量模型。在该方法中,将输入变量分为控制变量和状态变量。对原始数据进行归一化预处理之后,采用lasso算法选取相关性强的变量作为预测模型输入参数。然后,采用DBN算法分别建立控制变量预测模型和状态变量预测模型。最后,将两个预测模型进行非线性组合,获得烟气含氧量的最终预测模型。根据实际生产数据进行实验,结果表明4种对比算法的平均绝对误差分别为1.319%,2.5103%,1.9586%,5.4634%,2.5350%,而NCDBN方法的平均绝对误差为1.2428%,说明NCDBN方法能够准确地预测烟气含氧量。
关键词:深度置信网络;组合模型;特征选取;Lasso;烟气含氧量
DOI:10.15938/j.jhust.2020.05.018
中图分类号: TP18;TM621
文献标志码: A
文章编号: 1007-2683(2020)05-0127-09
Abstract:To solve the problem of high cost and instability of the oxygen content measurement,the nonlinear combined deep belief networkNCDBN) method was used to establish the oxygen content of flue gas model based on the deep learning theory. In this method, input variables are divided into control variables and state variables. The original data were normalized, The variables which have significant correlation with the oxygen content of flue gas were selected as inputs of the prediction model by a lasso algorithm. Then,the deep belief network(DBN) was addressed to established predicted models using control variables and state variables separately. Finally,two models were nonlinearly combined into the final predicted model. The practical data obtained from actual production were utilized in the experiments. The experimental results illustrate that the mean absolute percent error of four common-used algorithms were 1.319%,2.5103%,1.9586%,5.4634%,2.5350%, while the mean absolute percent error of NCDBN method was 1.2428%. The result show that NCDBN method can accurately predict oxygen content of flue gas.
Keywords:deep belief network;combinedmodel;feature selection;Lasso;oxygen content of flue gas
0 引 言
煙气含氧量是燃煤锅炉燃烧状态的重要指标,与锅炉燃烧效率、NOX排放[1-4]等有密切关系。确定对烟气含氧量的主要影响因素并准确建立烟气含氧量预测模型是实现燃煤锅炉高效燃烧、降低燃煤排放的重要基础。烟气含氧量测量[5-7]方法主要有直接测量法和软测量法。直接测量法使用氧气传感器进行烟气含氧量测量,主要包括热磁式氧气传感器和ZrO2氧气传感器。氧气传感器结构简单,便于制造,但是存在测量误差大,寿命短的问题。软测量技术通过建立烟气含氧量模型进行预测,具有易于使用、精度高等优点。Chen S H等[8]利用高斯过程回归(gaussian process regression,GPR)软测量方法预测烟气含氧量;LV Y等[9]采用最小二乘支持向量机(lest square support vector machine,LSSVM)算法建立预测模型。这些模型都取得了较好的实验效果,说明软测量方法的可行性。但是由于传统数据驱动算法网络结构的限制,无法提取数据中深层次的信息。深度置信网络[10](deep belief network,DBN)是由Geoffrey Hinton在2006年提出,能够实现无监督状态下的网络自学习,获取输入数据中包含的深层特征信息,具有收敛速度快,预测精度高等优点[11-12]。因此,研究采用DBN对烟气含氧量进行建模。
模型输入维数对建模算法的运行效率和效果有着显著的影响[13-14]。为了降低模型的复杂度,目前已有的文献中采取决策树(CART)[15],核主成分分析(KPCA)[16]以及lasso[17-18]等输入特征选取的方法。CART和KPCA参数的选取需要大量实验和先验知识,影响算法的易用性。Lasso需要设置的参数少,能够精确地选取出与目标变量强相关的变量,降低输入变量的维数,因此,研究采用lasso算法进行特征选取。
生产过程参数可以分为控制变量和过程变量,分别建立控制变量模型和过程变量模型便于先进控制算法的应用。但是,受到输入特征不全的影响,单独一个预测模型的预测精度不理想。因此,在分别建立控制变量模型和状态变量模型的基础上,将两个模型进行非线性组合进一步提高模型精度。
综上所述,提出了一种非线性组合DBN电厂烟气含氧量建模方法。在这种方法中,将影响烟气含氧量的变量分为控制变量和状态变量,并对状态变量进行特征选取,采用lasso方法选取最相关的状态变量作为输入变量。然后将经过lasso处理的状态变量和未经过处理的控制变量分别作为输入进行建模,将建立到的两种模型进行非线性组合,得到NCDBN模型。所建立模型能够准确预测烟气含氧量的变化,为先进控制算法的应用提供基础。
1 烟气含氧量特性分析
锅炉运行过程具有强扰动性、强时延性、强非线性等特点,其生产过程如图1所示。锅炉生产过程主要分为输送燃料,燃烧,排放废气3个过程。输送燃料主要是将原煤从煤斗(1)经给煤机(2)送入磨煤机(3),将干燥后的煤粉经给煤机送入燃烧器(5)在炉膛内燃烧。所产生热能用来加热过热器(6)和再热器(7)中的蒸汽,以及省煤器(8)中的循环水。冷空气由送风机送入空气预热器(10)吸收热量成为热空气,将热空气分为一次风和二次风分别进入磨煤机和炉膛,提供煤粉燃烧所需的氧气。煤粉在炉膛内高温燃烧,将化学能转化为热能。燃烧过程产生的烟气最终通过烟囱(11)排出。当烟气含氧量过高时,氧气会与C、CO、S等结合产生污染物;当氧气过低时,会导致燃料燃烧不充分。因此,烟气含氧量是判断锅炉燃烧状态的重要指标。将测量烟气含氧量的氧量计安装在省煤器上侧。根据锅炉生产过程分析,可得出与烟气含氧量相关的主要因素有机组负荷、再热器压力、燃料量、排烟温度、送风机电流、引风机电流、送风量、炉膛负压、炉膛温度等19个变量。
1-煤斗 2-给煤机 3-磨煤机 4-汽包 5-燃烧器 6-过热器 7-再热器 8-省煤器 9-氧量计 10-空气预热器 11-烟囱
2 烟气含氧量建模
2.1 NCDBN烟气含氧量建模整体结构
针对烟气含氧量难以稳定、准确获取的问题,提出基于NCDBN的建模算法。算法整体流程如图2所示。算法主要包含以下4个主要步骤。
2.2 数据预处理
由于锅炉运行参数取值范围差距大,最多相差3个量级,量级差异会导致量级小的数据对模型的影响降低,不能准确反映变量之间的真实关系。为了消除目标参数之间的量纲影响,使目标参数处于同一量级,对原始数据进行标准化处理。采用Z-score方法进行数据预处理,计算方法如式(1)所示:
2.3 输入特征选取
数据维数过高会导致建模过程计算效率下降,因此需要去除相关性较弱的变量提高建模效率,降低模型复杂度。采用lasso算法可以实现降维和提高建模效率的目的。它的基本思想是在保证回归系数小于或等于某阈值的约束条件下,使残差平方和最小化,从而使回归系数被压缩为零,剔除相关度较低的变量。最小化残差平方和问题的数学表达式如式(2)所示:
其中:xij为自变量,yi为因变量;βj为第j个变量的回归系数;阈值t是对回归系数βj的一范式惩罚,t的取值范围为[0,+∞]。当t取值较小,某些相关性较弱的变量的系数会被压缩为0,从而得到更为精简的模型。Lasso与其他特征选取方法相比较,可以准确地选取出相关度较大的变量。
为了便于在后续控制系统中应用,将影响烟气含氧量的变量分为控制变量和状态变量,由于控制变量个数较少,只对状态变量采用lasso方法进行特征选取,由式(2)可求解出与烟气含氧量相关性强的变量,剔除相关性较弱的变量,选取出7个输入变量,即炉膛负压,再热蒸汽温度,炉膛温度,主蒸汽流量,主蒸汽温度,机组负荷,排烟温度,相关变量信息如表1所示。控制变量主要有燃料量,送风机电流,引风机电流,送风量,引风机挡板开度,送风挡板开度,给水流量,给水流量,再热器减温水量,用来作为控制预测模型的输入变量。
2.4 基于DBN的建模过程
深度置信网络是一种基于大脑神经元推理而设计的神经网络,它由多层受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)叠加和一层BP神经网络组成,数据通过DBN最底层输入,经过RBM输入到隐含层,低层RBM的输出作为高层RBM的输入。深度置信网络的训练方法先采用自下而上的无监督学习方法逐层对整个DBN 模型的参数进行初始化,然后再采用自上而下的有監督学习方法对网络参数进行微调。DBN算法建模的具体步骤如下:
步骤1:将处理好的数据分为训练集和测试集,把训练集输入DBN最底层;
步骤2:开始进行无监督预训练,随机初始化RBM网络的参数ε=(ω,a,b),权值ω,可视层偏置b与隐含层偏置a,设置DBN网络的层节点数,最大层数m;
步骤3:利用公式(3)和(4)可以求出隐层和显层中的神经元被激活的概率;
其中:Δωij是第i个可视层单元到第j个隐含层单元的权值,Δai为隐含层的偏置,Δbj为可视层的偏置,n代表第n次迭代,λ是动量因子,η为学习因子,vi与hj表示第i个可视层单元和第j个隐含层单元的状态,
步骤5:依次充分训练每个RBM并且堆叠达到DBN的最大层数,再利用最顶层的BP进行反向的参数寻优,最终建立预测模型。
2.5 非线性组合预测模型
在锅炉的运行过程中,可以通过调整燃料量,风门挡板开度,送风量,以及给水量等控制变量来影响烟气含氧量,对于上述控制变量采用DBN算法建立控制预测模型。而排烟温度,炉膛温度等状态变量同样也会影响或者反映烟气含氧量值。将控制预测模型和状态预测模型进行非线性组合得到组合模型,能够反映不同参数对烟气含氧量的影响,得到更精确的预测模型。
本文采用BP神经网络对控制预测模型和状态预测模型进行非线性组合,确定最终的NCDBN预测模型。
首先,将原始数据集划分为训练数据集、验证数据集和测试数据集。对训练集数据分别训练控制预测模型和状态预测模型;
然后,根据得到的控制预测模型和状态预测模型获得验证数据集和测试数据集预测值,假设对第g个样本得到的预测结果分别为fcg和fsg,将两个模型验证集和测试集的预测结果重新划分新的数据集;
最后,采用BP神经网络构建非线性组合预测模型,验证非线性深度学习模型的预测精度,并存储模型参数。
锅炉燃烧中的控制变量vcg和状态变量vsg在2.3节已详细列举,利用公式(8)和(9)分别获取控制变量预测模型fcg和状态变量预测模型fsg,最后利用公式(10)以非线性组合的方式获取最终的非线性组合预测模型fng。
其中:fng表示非线性组合深度学习模型的预测值;fcg表示基于DBN的控制预测模型预测值;fsg表示基于DBN的状态预测模型预测值;vcg、vsg分别表示控制变量和状态变量;w1表示控制预测模型网络权重值;b1表示控制预测模型偏移量;w2表示状态预测模型网络权重值;b2表示状态预测模型偏移量;w表示非线性组合深度学习模型网络权重值;b表示非线
性组合深度学习模型偏移量。权重w1、w2、w和偏置b1、b2、b的计算需要进行初始化,然后根据2.4节的式(5)~(7)对权值和偏置进行更新。
3 实验结果与分析
本研究所使用数据均来自国内某发电公司330MW亚临界一次中间再热自然循环、双缸双排抽汽式电站1号机组DCS数据采集系统,该机组主要性能参数如下:主蒸汽温度和再热蒸汽温度均为538℃,给水温度为276℃,主蒸汽流量为1045t/h,过热器出口蒸汽流量为1100t/h,主蒸汽压力为16.67MPa,低压缸排汽压力为4.9~11.8kPa。数据采样间隔为1min,共采集烟气含氧量相关参数变量运行数据3组。数据详细信息如表2所示。为方便后续描述,将这3组数据分别用D1,D2,D3来表示。为了验证该模型的有效性,将NCDBN与LSSVM[19],RBFNN[20],LSTM[21],BPNN[22]建模方法进行对比。所有实验均在使用i5(2.60GHz)处理器、4.0G内存和Windows7 64位操作系统的计算机上进行。
3.1 评价指标
为了验证并分析各种算法的预测性能,通过3种评价指标比较与验证建模结果。采用均方误差(MSE)、平均相对误差(MRE)、平均绝对误差(MAE)3个评价指标,具体计算公式分别如(11~13)所示。
3.2 特征选取策略对预测结果影响分析
本节对lasso特征选取算法对预测模型精度和计算效率的影响进行分析。表3是不同算法采用lasso特征选取前后建模结果的评价指标对比。
从表3中可以得出,经过lasso特征选取后NCDBN模型的MAE降低23%,MAPE降低27%,MSE降低了33%。特征选取后NCDBN的模型训练时间比未经lasso特征提取的训练时间缩短了5.4s左右,建模时间节约45%。出现这一结果的原因是lasso特征选取可以降低变量的维数,消除部分具有耦合相关的变量,从而在提高建模精度的同时降低了建模所需时间,最终,提高了建模的计算效率。
3.3 NCDBN与其他几种算法的对比分析
为了验证NCDBN模型的适用性和有效性,将NCDBN模型与DBN,LSSVM,BPNN,RBFNN,LSTM模型进行预测结果对比。图3是不同算法的测量值与预测值之间的对比曲线图。图3(a)(b)(c)分别为3组数据集的预测结果,图3中的实验结果说明NCDBN能够跟随实际測量值的变化。图3中LSTM算法的实验结果最差,预测值不能反映实际变化趋势,这一现象出现的原因可能是LSTM算法不适用于非时间序列问题的求解。为了更好地显示出各种算法预测精度的差别,从图3(a)(b)(c)中分别截取出部分曲线放大观察。从截图中可以清晰看出,NCDBN模型的测量值与预测值的曲线拟合最优,说明NCDBN可以有效地预测烟气含氧量。
为了进一步验证NCDBN的预测性能,将几种模型的测量值与预测值之间的绝对误差进行对比。图4为不同模型的测量值与预测值之间的绝对误差对比情况。从图4中可以看出不同数据集的NCDBN模型的绝对误差均分布在最小区间[0,0.05]内,其频率随着绝对误差的增加逐渐降低,图4(a)、(b)、(c)均可以体现这一分布规律,其中数据集D2,D3较为明显。DBN,BP,LSTM,RBF,LSSVM模型的绝对误差频率分布趋势与NCDBN相似,呈递减趋势,但NCDBN模型的绝对误差频率下降趋势最快,且在绝对误差高的区间内无分布。因此,NCDBN模型的预测误差最小,NCDBN模型与其他几个模型相比较具有更好的预测精度。表4是五种模型的预测结果对比。从表4中可以看出不同数据集的NCDBN模型的评价指标均优于单一的DBN模型,以数据集D2为例,NCDBN的MAE减少14%,MAPE减少14%,MSE减少19%。数据集D1和D3的NCDBN各项评价指标也有所下降。并且在三组数据集中,NCDBN算法的各项评价指标均低于LSSVM,RBF,LSTM,BP算法。经实验结果证明,NCDBN模型与其他几个模型相比较具有更好的预测能力。
3.4 非线性组合前后模型的对比分析
图5表示的是非线性组合前后烟气含氧量的测量值与预测值的对比图。图5中的(a)、(b)、(c)的黑色圆点代表模型测量值与预测的分布,蓝色线代表理想曲线分布。R2越大表示测量值与预测值的拟合程度越好,模型的预测精度更高。从图5(a)、(b)、(c)中可以看出,组合预测模型中集中在理想曲线旁边的黑色圆点最密集,只有极少数的点(b)、(c)中可以看出,组合预测模型中集中在理想曲离理想曲线较远,并且组合预测模型的R2高于控制预测模型与状态预测模型。因此,实验结果说明控制预测模型和状态预测模型经过非线性组合后预测性能提高,组合预测模型的预测精度更高。图5(d)是3个模型预测值与测量值的绝对误差箱形图,红线代表模型的误差中位数,从图中可以清楚地看出组合预测模型的绝对误差中位数最小,且绝对误差较其他两个模型更接近于零点。因此,组合预测模型较其他两个模型具有更好的预测精度,体现出非线性组合提高了烟气含氧量的模型精度。
表5给出了非线性组合策略对建模预测结果误差统计分析结果。从表5中可以看出,对于不同数据集D1,D2,D3,组合预测模型测试集的评价指标均小于控制预测模型和状态预测模型,以D1为例,组合预测模型与控制预测模型相比MSE,MAE,MRE分别减少了50%,50%,70%。与状态预测模型相比MSE,MAE,MRE分别减少了24%,23%,31%。这体现出非线性组合模型有助于降低预测模型的误差,从而提高模型的预测精度。
4 结 论
锅炉燃烧过程复杂多变,生产环境恶劣,这些因素导致直接测量烟气含氧量的设备损耗高、测量精度难以维持高水平。针对这一问题,提出了一种NCDBN建模算法对烟气含氧量建立预测模型,整个算法中主要从数据预处理、特征选取和数据分析建模3个部分进行分析和改进。基于实际生产数据的实验表明,NCDBN算法能够建立高精度烟气含氧量预测模型,所提出的特征选取策略、模型组合策略都有正面效果。该算法的另一个特点是将过程变量分为状态变量和控制变量,便于先进控制算法的应用,下一步的研究将从算法在预测控制中的应用展开。
参 考 文 献:
[1] 张晓宇, 王天伟, 李燕, 等. 火电机组燃烧系统智能综合优化控制研究[J].中国电机工程学报, 2019, 39(9): 2544.
ZHANG Xiaoyu, WANG Tianwei, LI Yan. Study of Intelligent Integrated Optimization Control of Thermal Power Unit Combustion System[J]. Proceedings of the CSEE, 2019, 39(9): 2544.
[2] WANG Chunlin, LIU Yang, ZHENG Song, et al. Optimizing Combustion of Coal Fired Boilers for Reducing NOx Emission Using Gaussian Process[J]. Energy, 2018, 153: 149.
[3] LI Xia, NIU Peifeng, LIU Jianping. Combustion Optimization of a Boiler Based on the Chaos and Lévy Flight Vortex Search Algorithm[J]. Applied Mathematical Modelling, 2018, 58: 3.
[4] 唐振浩,张海洋,曹生现.变负荷工况下NOx排放量预测控制[J].化工进展,2018,37(1):343.
TANG Zhenhao, ZHANG Haiyang,CAOShengxian. Model Predictive Control of NOx Emission Under Variable Load Condition[J]. Chemical Industry and Engineering Progress, 2018,37(1):343.
[5] 李建强,赵凯,牛成林,等.基于GA-SVM的电站锅炉烟气含氧量软测量模型[J].热力发电,2017,46(4):63.
LI Jianqiang, ZHAO Kai, NIU Chenglin. GA-SVM-based Soft-sensor Model for Oxygen Content in Flue Gas of Utility Boilers[J]. Thermal Power Generation, 2017, 46(4): 63.
[6] LUO Jia, WU Le, WAN Wenjun. Optimization of the Exhaust Gas Oxygen Content for Coal-fired Power Plant Boiler[J]. Energy Procedia, 2017,105: 3263.
[7] 李建強, 张莹莹, 牛成林. 基于PSO-LSSVM模型的火电厂烟气含氧量预测[J]. 热能动力工程, 2018(7): 51.
LI Jianqiang, ZHANG Yingying, NIU Chenglin.Prediction of the Oxygen Content in Flue Gas of Powerplant Based on PSO-LSSVM Model[J]. Journal of Engineering for Thermal Energy and Power, 2018(7):51.
[8] CHEN Shihe, XI Zhang. Soft Sensor Modeling for Oxygen-content in Flue Gasses in 1 000 MW Ultra-superficial Units. International Conference on Industrial Informatics Computing Technology, Intelligent Technology, Industrial Information Integration[C]// Wuhan: Institute of Electrical and Electronics Engineers, 2015: 165.
[9] LV You, LIU Jizhen, Yang Tingting, et al. A Novel Least Squares Support Vector Machine Ensemble Model for NOx Emission Prediction of a Coal-fired Boiler[J]. Energy, 2013(22): 322.
[10]HINTON G, OSINDERO S, TEH Y. A Fast Learning Algorithm for Deep Belief Nets[J]. Neural Computation, 2006, 18(7): 1527.
[11]LI Fei, ZHANG Jie, SHANG Chao, et al. Modeling of a Post-combustion CO2 Capture Process Using Deep Belief Network[J]. Applied Thermal Engineering, 2018, 130: 999.
[12]朱乔木, 党杰, 陈金富, 等. 基于深度置信网络的电力系统暂态稳定评估方法[J]. 中国电机工程学报, 2018, 38(3): 736.
ZHU Qiaomu, DANG Jie, CHEN Jinfu, et al. A Method for Power System Transient Stability Assessment Based on Deep Belief Networks[J]. Proceedings of the CSEE, 2018, 38(3): 736.
[13]SALCEDO-SANZAS,CORNEJO-BUENOAL, PRIETOB L, et al. Feature Selection in Machine Learning Prediction Systems for Renewable Energy Applications[J]. Renewable and Sustainable Energy Reviews, 2018, 90: 729.
[14]汪可, 张书琦, 李金忠, 等.基于灰度图像分解的局部放电特征提取与优化[J]. 电机与控制学报, 2018, 22(5): 25.
WANG Ke, ZHANG Shuqi, LI Jinzhong. Partial Discharge Feature Extraction and Optimization Based on Gray Image Decomposition[J]. Journal of Harbin University of Science and Technology, 2018, 22(5): 25.
[15]黄南天, 彭华, 蔡国伟, 等. 电能质量复合扰动特征选择与最优决策树构建[J]. 中国电机工程学报, 2017, 37(3): 776.
HUANG Nantian, PENG Hua, CAI Guowei, et al. Feature Selection and Optimal Decision tree Construction of Complex Power Quality Disturbances[J]. Proceedings of the CSEE, 2017, 37(3): 776.
[16]荣盘祥,曾凡永,黄金杰.数据挖掘中特征选择算法研究[J].哈尔滨理工大学学报,2016,21(1):107.
RONG Panxiang, ZENG Fanyong, HUANG Jinjie. Research on Feature Selection Algorithm in Data Mining[J]. Journal of Harbin University of Science and Technology,2016,21(1):107.
[17]TIBSHIRANI R. Regression Shrinkage and Selection Via the Lasso[J]. Journal of the Royal Statistical Society Series B-Methodological, 1996, 58(1): 267.
[18]KIM Y, HAO J, MALLAVARAPU T, et al. Hi-LASSO: High-dimensional LASSO[J]. IEEE Access, 2019(7): 44562.
[19]崔超,杨婷婷,刘吉臻,等.基于BP网络变量选择与LSSVM结合的锅炉脱硝经济性建模[J].中国电机工程学报,2015,35(24):644.
CUI Chao, YANG Tingting, LIU Jizhen, et al. Denitration Cost Modeling for Boilers Based on BP Variable Selection and LSSVM[J]. Proceedings of the CSEE,2015,35(24):644.
[20]宋清昆,李源松.RBF神经网络锅炉燃烧系统建模[J].哈尔滨理工大学学报,2016,21(1): 90.
SONG Qingkun, LI Yuansong.Modeling of the Boiler Combustion System by RBF Neural Networks[J]. Journal of Harbin University of Science and Technology,2016,21(1): 90.
[21]杨国田,张涛,王英男,等.基于长短期记忆神经网络的火电NOX排放预测模型[J].热力发电,2018,47(10):14.
YANG Guotian, ZHANG Tao, WANG Yingnan,et al.Prediction Model for NOx Emissions from Thermal Power Plants Based on Long-short-term Memory Neural Network[J]. Thermal Power Generation,2018,47(10):14.
[22]李鹏辉,刘冉,余廷芳.基于支持向量机和BP神经网络的燃煤锅炉NOx排放预测[J].热能动力工程,2016,31(10):105.
LI Penghui, LIU Ran, YU Tingfang. Modeling of Nox Emission from Coal Fired Boiler Based on Intelligent Algorithm[J]. Journal of Engineering for Thermal Energy and Power,2016,31(10):105.
(編辑:王 萍)