APP下载

基于DHP方法的锅炉燃烧系统优化控制研究

2011-01-06史长城吴晓莉

湖北大学学报(自然科学版) 2011年4期
关键词:炉膛负压蒸汽

史长城,吴晓莉

(郧阳师范高等专科学校物理与电子工程系,湖北 丹江口442700)

基于DHP方法的锅炉燃烧系统优化控制研究

史长城,吴晓莉

(郧阳师范高等专科学校物理与电子工程系,湖北 丹江口442700)

电厂锅炉燃烧过程是一个典型的强非线性、多输入、多输出、强耦合过程,以这一直接影响机组安全经济运行的复杂过程控制为研究对象,研究火电厂锅炉燃烧系统的优化控制.首先,采用径向基函数神经网络(radial basis function neural network,RBFNN)对电厂锅炉燃烧系统进行了建模和模型测试.然后,用RBFNN设计了基于双启发式动态规划(dual heuristic programming,DHP)的电厂锅炉燃烧控制器,并在MATLAB环境下对所设计的DHP控制器进行了仿真试验,仿真结果表明利用这种算法设计的控制器实现了锅炉的稳定燃烧控制,且具有强鲁棒性.所给出的控制方法同样可以应用于其他复杂工业过程.

径向基函数神经网络(RBFNN);锅炉燃烧;双启发式动态规划(DHP)

0 引言

传统的火电厂锅炉控制方法是通过现场燃烧优化调整试验,采用正交试验或单因素轮回试验获得优化的燃烧工况.这种方法由于受煤种、锅炉设备状态变化等影响,原有的优化试验结果可能会偏离最优值甚至无效,如果仍以此试验结果运行锅炉,一定会造成偏差,导致锅炉的热效率下降.现代的锅炉燃烧优化运行系统必须建立在锅炉的实时运行工况的基础之上,先建立锅炉燃烧系统的模型,再通过采用先进的控制技术,找出不同负荷、不同煤种下的最佳燃烧方式,在线指导锅炉燃烧优化调整,实现锅炉燃烧系统的安全、经济运行[1].

自适应动态规划(adaptive dynamic programming,ADP)是 Werbos和Prokhorov[2-4]等人为解决动态规划容易出现“维数灾”问题而提出的,该理论的实现方法称为自适应评价设计(adaptive critic designs,ACD),该方法结合了动态规划、强化学习、人工神经网络、最优控制等领域的思想和方法.它适用于处理那些非线性、多变量、强耦合、大延迟,难以建立精确数学模型的系统的长期优化控制问题.

火电厂锅炉燃烧过程是一个典型的强非线性、多输入、多输出、强耦合过程.本文中以这一直接影响机组安全经济运行的复杂过程控制为研究对象,利用RBFNN建立了电厂锅炉燃烧过程模型,避免了用BP神经网络建模训练时容易陷入局部极小点的问题,并且用RBFNN设计了一种基于DHP方法的控制器,研究火电厂锅炉燃烧系统的优化控制.取得了良好的仿真效果,为下一步工程应用奠定了基础.

1 双启发式动态规划(DHP)原理

ACD的实现一般需要评价(critic)、模型(model)和动作(action)3个网络.它们分别完成评价、预测和决策功能,如图1所示.动作网络用来产生控制信号;模型网络用来模拟被控对象的特性并且预测它的新的状态值;评价网络用来估计Bellman方程给定的代价函数J,以便指导动作网络做出最优的决策.为了获得最优的控制策略,需要调整评价网络和动作网络的权值,这样在设计控制器时需要训练评价网络和动作网络.

图1 自适应评价设计的3个模块

DHP中评价网络更新的结构如图2所示.DHP中的评价网络的更新是通过学习最小化下面的误差实现:

这里的导数路径和评价网络的更新路径用点和破折线表示的,误差信号ec(t)用于训练更新评价网络的权值.式(2)中的第二项的jth部分可以由评价网络在时间步t+1的输出产生,^λt(t+1)=∂^J[Δ^Y(t表示,如下所示:

图2 DHP评价网络更新

图2画出了同一个评价网络在连续时间步t和t+1的情况.折扣因子γ=0.5.反向传播路径由点和点划线标出.评价网络的输出^λ(t+1)通过从模型网络的输出到输入的反向传播,得到式(2)中的第一项和∂J(t+1)/∂A(t).后者通过从动作网络的输出到输入的反向传播得到了式(2)中的第二项.向量∂U(t)/∂A(t)通过动作网络的反向传播得到向量相应部分的计算,如同式(4)中最后一项.所有这些信号的总和产生的误差向量ec(t)用于进一步训练评价网络.

利用式(2),式(3)中向量ec(t)的第j个部分的每个分量由下式决定:

图3 DHP动作网络的更新

图2中的动作网络的更新如图3所示,^λ(t+1)通过从模型网络到动作网络的反向传播.这种更新的目标如式(5)所示,动作网络的权值更新如式(6)所示.

其中ηA是正的学习率,WA包含DHP动作网络的权值.

图3中,反向传播路径由点划线标出.评价网络在t+1时刻的输出^λ(t+1)通过从模型网络从输出到输入(动作网络的输出)的反向传播,并且产生的向量乘以折扣因子γ=0.5并加到∂U(t)/∂A(t)上.然后,动作网络的增量更新按照式(5)和式(6)执行.

2 DHP控制器的设计

2.1 锅炉燃烧控制的神经网络建模电厂锅炉燃烧控制系统是一个非线性、大滞后、大扰动、强耦合的多变量系统,难以建立其精确的数学模型,而RBFNN具有很好的函数逼近能力,它可以将过程看作一个黑箱,通过测量系统输入、输出特性,然后利用测量的输入、输出数据训练一个神经网络,使其输出对输入的响应特性具有与被辨识的过程相同的外部特性.这样采用RBFNN建立电厂锅炉燃烧系统模型就避开了建立数学模型的复杂计算[7-8].

图4 燃烧系统RBFNN模型

图5 采用梯度下降法的RBF神经网络泛化能力测试图

表1 广西某电厂锅炉燃烧部分实测数据

建立锅炉燃烧系统的RBFNN模型如图4所示,3个输入量:燃料量B,送风量V,引风量G,3个输出量:主蒸汽压力PT,烟气氧含量O2,炉膛负压Plt.采用k-means聚类算法确定隐藏层节点的径向基函数的数据中心,在确定数据中心之前先要确定隐节点的个数,经反复试验确定隐节点个数为M=100最为合适.为了建立电厂锅炉燃烧过程神经网络模型,需要足够多的样本数据才能反映实际过程的内在特性,因此本文作者从广西某电厂现场采集了1 000组实测数据,部分数据如表1所示.经过数据预处理后剔除一部分异常数据后得到800组有效数据,用其中的600组作为训练样本集,另外200组作为测试样本集.训练样本和测试样本都进行了数据归一化处理,防止因净输入的绝对值过大而使神经元输出饱和,避免权值调整进入误差曲面的平坦区.模型网络建好以后,对模型网络进行泛化能力测试,如图5所示.

2.2 基于RBF网络的DHP控制器的设计基于RBFNN的DHP锅炉燃烧控制结构如图6所示,动作网络以状态向量x(t),即主蒸汽压力PT、烟气氧含量O2、炉膛负压Plt为输入量,产生控制向量u(t),即燃料量B、送风量V、引风量G;模型网络以状态向量x(t)和控制向量u(t)为输入量,输出则是t+1时刻的状态向量x(t+1),最后,把模型网络的输出x(t+1)作为评价网络的输入,输出为代价函数J(t+1)对状态向量x(t+1)的导数∂J(t+1)/∂x(t+1).3个网络均以3层RBF神经网络实现,网络初始权值取[-1,1]之间的随机数.评价网络和动作网络与模型网络一样都采用RBFNN,其中评价网络与动作网络都采用3-100-3结构.两个网络的初始数据中心采用[-1,1]之间的随机数,隐藏层与输出层之间的初始权值也采用[-1,1]之间的随机数.两个网络的训练都采用与训练模型网络一样的梯度下降法.

在DHP训练过程中,效用函数的选择对于训练过程是至关重要的,效用函数选择不当,将导致训练达不到目标.根据从工业现场取得的样本和实际控制的要求,如果被控系统的3个状态量:主蒸汽压力在|X1(t)-4.86|<0.3MPa,烟气氧含量在|X2(t)-8.02|<3%,炉膛负压|X3(t)+47.22|<15Pa,这3个量在上述范围内被认为是允许的.因此本文中选取的效用函数为:

图6 锅炉燃烧控制DHP结构图

其中,X1(t),X2(t),X3(t)为被控系统的3个状态主蒸汽压力,烟气氧含量,炉膛负压.

DHP方法的训练策略有基本二阶段法、修正二阶段法、基于停止criticNN#2调整的单阶段更新方法等.每种训练策略有相应的训练算法,研究表明基于停止criticNN#2调整的单个阶段更新方法相比之下收敛最快[9],本文中选用这种方法训练DHP控制器.其中训练周期epoch=100.

3 仿真及结果

DHP控制器的控制目标为:

主蒸汽压力PT:控制在额定值4.85MPa附近,上下浮动范围不超过0.2MPa;

烟气氧含量O2:控制在5%~9%的范围之内;

炉膛负压Plt:控制在-50Pa~-40Pa的安全范围之间.

在训练过程中,评价网络和动作网络隐藏层初始数据中心取[-1,1]之间的随机数,扩展常数根据公式(2)计算;评价网络和动作网络的隐藏层和输出层之间的初始网络权值取-0.1~0.1的随机值;评价网络和动作网络的学习率取0.1;评价网络训练的期望误差为0.002,最大训练次数为300次;动作网络训练的期望误差为0.000 6,最大训练次数为800次.

图7~8是DHP控制器的3个状态量的初始状态为:主蒸汽压力PT=4.75,烟气氧含量O2=5.165 8,炉膛负压Plt=-59.483 6时的仿真结果.其中图7是3个状态量的控制曲线,在经过4个时间步的训练过程后,3个状态量都稳定控制在控制目标范围内:主蒸汽压力PT=4.86MPa,烟气氧含量O2=8%,炉膛负压Plt=-47Pa.与此同时,我们得到3个控制量的控制轨迹,如图8所示.3个控制量:燃料量B=6.15t/h,送风量V=23.5%,引风量G=48.5%.

图7 主蒸汽压力、烟气氧含量、炉膛负压的DHP控制曲线

图8 燃料量、送风量、引风量的DHP控制轨迹

当机组负荷随电网的需求变化时,会使主蒸汽压力发生变化,当主蒸汽压力增加或下降时,系统能否通过自动调整3个控制量使主蒸汽压力回到原来的稳定状态.为此需要验证DHP控制器的抗干扰能力,当运行至30步时,对主蒸汽压力PT加入干扰信号,如图9所示,不难看出,当干扰出现后,3个控制量都出现了相应的变化,目标是使3个状态量回到原来的稳定状态.如图10所示.此时燃料量B减少,送风量V增加,引风量G减少,由前面的分析可知,主蒸汽压力PT主要取决于燃料量B和送风量V.当燃料量B减少,主蒸汽压力PT下降.这3个控制量的变化,同时引起了另两个状态量:烟气氧含量O2和炉膛负压Plt的变化.最终通过3个控制量的变化,使状态量回到原来的稳定状态.

图9 主蒸汽压力加入干扰时的主蒸汽压力、烟气氧含量、炉膛负压的DHP控制曲线

图10 主蒸汽压力加入干扰时的燃料量、送风量、引风量的DHP控制轨迹

4 结论

提高电厂锅炉运行的稳定性和经济性一直是电厂决策及运行人员十分关心的问题,本文中以某蒸汽流量为75t/h的电厂锅炉为对象,采用RBFNN建立了电厂锅炉燃烧系统的模型,并在此基础上应用RBFNN设计了系统的DHP控制器,仿真结果表明,这种方法对于非线性、大滞后、多变量、强耦合的控制对象具有较好的控制效果和强鲁棒性.这为我们今后将其用于工业现场控制奠定了良好的基础.

[1]Robert Swankam P.Boiler and combustion system monitoring zeroes in real-world targets[J].Power,1995(5):15-22.

[2]Paul J Werbos.Optimization methods for brain-like intelligent control[C]//Proc of the 34thConference on Decision& Control.New Orleans,1995:579-584.

[3]Werbos P J.Approximate dynamic programming for real-time control and neural modeling.in handbook of Intelligent control[C]//White D A,Sofge D A.Neural,Fuzzy,and Adaptive Approaches.NewYork:Van Nostrand Reinhold,1992:13.

[4]Prokhorov D V,Wunsch D C.Adaptive critic designs[J].IEEE Trans Neural Netw,1997,8(5):997-1007.

[5]Werbos P J.Advanced forecasting methods for global crisis warning and models of intelligence[J].General Systems Yearbook,1977,22:25-38.

[6]Broomhead D,Lowe D.Radial basis functions,multivariable interpolation and adaptive networks[J].Royal Signals Radar Est Malvern,1988,18(1):212-215.

[7]韩力群.人工神经网络理论、设计及应用[M].2版.北京:化学工业出版社,2007:164-192.

[8]Jung-Wook Park,Harley R G,Venayagamoorthy G K.Comparison of MLP and RBF nneural networks usingdeviation signals for indirect adaptive control of a synchronous generator[C]//Hawaii:The International Joint Conference on Neural Network,2002:919-924.

[9]Lendaris G,Paintz C.Training strategies for critic and action neural nets in dual heuristic programming method[J].PROC of ICN″97,Houston,IEEE,1997,6:712-717.

Research on optimal control in boiler combustion system based on DHP

SHI Changcheng,WU Xiaoli
(Department of Physics and Electronic Engineering,Yunyang Teachers′College,Danjiangkou 442000,China)

Boiler combustion process for thermal power plant,which displays the features of strong non-linearity,multi-input,multi-output and close coupling control,is a typical researching object.Since the complex process control directly affects the security and economical operation of the units,this paper choosed the process as a researching object through probing into optimization control of boiler combustion system of thermal power plant.First,modeling to boiler combustion system based on RBFNN,and tested the model.Secondly,tried to achieve algorithmic derivation and program realization for applying RBFNN to design boiler combustion controller which was also under the direction of dual heuristic programming(DHP)optimization theory.Finally,the simulation experiments by MATLAB were made to indicate that the controller based on the algorithm was effective and the controller could achieve optimum ideal of combustion in the boiler with high efficiency and strong robustness.Eventually,the suggested system and used algorithm in the paper were also suitful to offer assistance for others complex industrial process.

radial basis function neural network(RBFNN);boiler combustion;dual heuristic programming(DHP)

TG146.2+1

A

1000-2375(2011)04-0460-07

2011-04-26

湖北省教育厅科研项目(Q20105001)资助

史长城(1979-),男,硕士生,讲师

(责任编辑 肖铿)

猜你喜欢

炉膛负压蒸汽
核电厂蒸汽发生器一次侧管嘴堵板研发和应用
试论无负压供水在建筑给排水中的应用
二维炉膛气液两相对冲流动数值模拟
层燃型垃圾焚烧锅炉的炉膛与炉膛温度简析
船用燃油辅锅炉炉膛爆燃分析
一种新型蒸汽发生器结构设计
早早孕负压吸引人工流产术的临床探讨
第一艘蒸汽轮船
蒸汽闪爆
一种手术负压管路脚踏负压控制开关的研制