基于BA-RBFNN控制图模式识别的气化过程参数失稳监控模型

2021-06-18张自川张进春

河南理工大学学报(自然科学版) 2021年4期

张自川，张进春

(河南理工大学能源科学与工程学院，河南焦作 454000)

0 引言

气化过程是煤、生物质、焦炭乃至生活垃圾等固体燃料在气化炉中进行气化反应，转化为气体产物，以用于化工生产、联合循环发电、燃料电池发电等[1-2]热加工转化过程。气化炉的性能受多种因素影响，如仪表精度、燃料特性(组分、粒径、水分、灰分和能量含量)、燃料进给量、空气流量、气化炉结构设计、反应时间、温度和压力分布等[3]，因此在正常生产过程中，气化炉很难保持理想的稳定状态，气化过程参数往往呈波动状态，这些过程参数波动呈现的一些异常模式极有可能导致超限停车及其他事故发生，严重影响气化生产的稳定性。因此，对气化过程参数(温度、压强以及转化气中H2，CO2，CO，O2等体积分数)的动态变化，尤其是对可能出现的某种模式进行有效监控和识别十分必要。

当前，研究者通过建立数学模型对气化过程开展了大量研究。总体而言，已有数学模型可分为热力学平衡模型和动力学模型[4]。热力学平衡模型基于热量守恒和质量守恒等定律考察气化过程特性[5-8]，从而预测输出气体的组成成分。热力学平衡模型主要探讨宏观反应过程，因此，它适合对无法实现实时动态特性考察的过程进行研究。动力学模型主要基于动力学方程考察气化过程的动态变化，可以预测气化炉内气体成分和温度的分布情况等[9-12]。动力学模型依然属于基于机理的理论性研究，达不到实际生产过程的参数实时动态性监控和识别精度。现有气化炉模型的研究促进了对气化炉内反应过程的认识，但对于气化炉过程参数动态变化的实时监控与特殊模式识别显然是不够的。

近些年来，支持向量机(support vector machine,SVM)、模糊系统(fuzzy systems)和人工神经网络(artificial neural networks,ANNs)等机器学习算法被用来实现高效的控制图模式识别。然而，支持向量机的准确性取决于核函数和参数的选择，而且运算成本很高。模糊系统有一个强大的推理引擎，可以识别出专家看不到的隐藏关系，但出错率高，而且需要大量数据进行训练。神经网络具有处理测量数据噪声的能力，无需对监测数据进行分布假设，许多学者对神经网络模型进行了优化研究。神经网络模型优化途径可以分为两种：一种是对神经网络输入数据进行优化；一种是对神经网络分类器进行优化。对分类器优化的研究有：R.S.Guh等[13]使用反向传播神经网络(back-propagation neural network)对控制图模式进行识别；R.S.Guh[14]提出一种基于learning-based model的神经网络和决策树模型，检测和识别控制图模式；YANG J等[15]采用统计相关系数法，确定了6种常见的控制图模式；WANG C H等[16]提出一种结合小波滤波和自适应共振理论(adaptive resonance theory，ART)的混合系统，识别控制图模式；S.K.Gauri等[17]提出一种基于分类与回归树(classification and regression trees，CART)以及人工神经网络技术的控制图模式识别方案；G.S.M.T.Fatemi等[18]提出两种神经网络混合模型，用于检测和识别单一模式和并发模式的控制图模式，确定主要的对应参数，估计异常模式的起始点。对数据预处理的方法增快了识别模型的速度，但对识别模型的识别精度也会造成一定影响。对输入数据进行预处理，以优化控制图模式识别模型的研究有：WANG C H等[19]结合独立成分分析(independent component analysis，ICA)和决策树(decision tree，DT)来识别控制图模式；LU C等[20]提出一种集成ICA、工程过程控制(engineering process control，EPC)和反向传播神经网络的混合方案，用于识别相关过程中的移动和趋势模式；LU C[21]提出一种基于ICA的扰动分离方案(ICA-based disturbance separation scheme)，用于诊断相关过程中不同移动幅度的移动模式；D.T.Pham等[22]提出9维的形状特征，作为输入数据的ANN-MLP识别模型；A.Hassan等[23]提出6维统计特征，作为输入数据的ANN-MLP识别模型；Y.AI-Assaf[24]提出32维的频率特征，作为输入数据的ANN-MLP识别模型；V.Ranaee等[25]提出6维欧氏距离，作为输入数据的ANN-RBF识别模型。对模型进行优化的方法无形中增加了模型的复杂度，虽然提高了模型的精度，但一定程度上影响了训练的速度。

然而，当前围绕气化过程参数动态变化的模式识别研究较少，而基于ANN模式识别的控制图模式识别，则是实现过程参数动态变化监控的有效工具。神经网络的性能在很大程度上取决于构成网络隐含层的基函数数目和位置，且随着输入维度增加，隐含层基函数增加，训练速度变慢。本文针对该问题，构建基于蜜蜂算法的径向基函数神经网络(BA-RBFNN)模型，对模型进行训练，减少输入参数的维度和隐含层基函数的数量，以期提高训练速度和识别模型性能。

1 气化过程参数失稳监控模型的构建

气化过程参数失稳监控模型主要包括数据输入、特征提取、分类器识别、结果输出。下文从气化过程存在的失稳模式类别、描述数据的特征类别、特征提取方法、分类器结构和分类器训练方法等方面进行详细说明。

1.1 气化过程参数失稳模式类别

气化炉的运行模式分为正常模式(NOR)和3种异常模式。异常模式包括趋势模式、偏移模式和循环模式。异常模式具体描述如下。

(1)趋势模式：趋势可定义为正向或负向的连续运动，据此，趋势模式又可细分为递增趋势模式(UT)和递降趋势模式(DT)。造成气化过程参数出现趋势模式的原因可能有气化设备磨损、操作人员疲劳和设备老化。用公式表示为

y(t)=μ+d×t+V，

(1)

式中：y(t)为t时刻的样本值；μ为监控变量的平均值；V为过程参数的白噪声；d为倾斜度。

当d取正值时为递增趋势模式，如图1(b)所示；当d取负值时为递降趋势模式，如图1(c)所示。d取值为0.1δ≤|d|≤0.3δ，δ为数据的标准差。

(2)偏移模式：偏移模式又可细分为向上偏移模式(US)和向下偏移模式(DS)。造成气化过程参数出现偏移模式的原因可能有进给料的更换或新工人的引进。用公式表示为

y(t)=μ+b×s+V，

(2)

式中，b决定偏移位置，b=0时不发生偏移，b=1时向上发生偏移，如图1(d)所示，b=-1时向下发生偏移，如图1(e)所示，其他字母含义同式(1)。

(3)循环模式：循环模式(CYC)表现为气化过程参数呈现周期性波动，如图1(f)所示，造成这种异常模式的原因一般是操作人员的周期性轮换或环境周期性变化。用公式表示为

y(t)=μ+a×sin(2πt/T)+V,

(3)

式中：a为振幅；T为变化周期，模拟结果如图1(f)所示；t为气化时间。其他字母含义同式(1)。

图1 气化炉运行模式类别

1.2 参数特征描述

气化过程参数失稳模式不同，其参数特征也不同。模式识别过程本质上是区分参数的特征。在模式识别领域，好的特征集不仅可以提高分类器的识别精度，而且还可以降低分类器的复杂度，提高训练效率。近年来，人们提出了不同特征对数据进行描述，如形状特征、统计特征、频率特征和欧式距离等。该文运用形状特征和统计特征对数据进行描述。

1.2.1 形状特征

参数的形状识别是模式识别的重要研究方向，形状特征描述有助于气化过程的模式识别。气化炉过程参数的形状特征主要从表1中的几种类型进行描述[26]。

表1 气化过程参数形状特征类型

1.2.2 统计特征

统计特征主要从数据存在的属性特征和数量特征对数据进行描述。研究表明，参数均值(mean)、标准差(standard deviation)、偏度(skewness)、峰度(kurtosis statistical)等统计特征能有效提高识别精度。

正常模式和循环模式参数的平均值波动很小，可近似看作常数，其余模式参数的平均值存在

图2 气化过程参数形状特征图(1)

NOR为正常模式；STR为分层模式；SYS为系统模式；CYC为循环模式；UT为递增趋势模式；DT为下降趋势模式；US为向上偏移模式；DS为向下偏移模式

较大波动。因此，这一特征可将正常模式、循环模式和其他模式区分开。偏度反映了数据不对称程度的信息，而峰度反映了数据分布的平缓程度。这些特征对应训练数据的值如图4所示。

图4 气化过程参数统计特征图

1.2.3 特征的选择方法

特征集的复杂度直接影响神经网络训练的效果和识别精度。特征选择实质上是计算每个特征的重要性，挑选出最具有鉴别作用的特征子集。

Apriori是一种关联规则挖掘算法。这种算法可以从数据集中找到出现频率最高的项集，删除出现频率最低的项集，从而减少不必要的搜索。度量特征集优劣的两个参数是置信度(Confidence)和支持度(Support)：

Support(A→B)=P(A∩B)，

(4)

图3 气化过程参数形状特征图(2)

(5)

1.3 分类器

该文提出的识别模型运用的分类器方法是径向基函数神经网络模型，分类器的训练方法选用蜜蜂算法。

1.3.1 径向基函数神经网络模型

径向基函数神经网络(RBFNN)是一种广泛应用于模式识别、非线性函数逼近等领域的神经网络模型。它是一个具有单隐含层的前馈式神经网络。RBF在其中心点时，输出值最大，当输入偏离中心点时输出值减小，并以高斯函数作为激活函数。RBFNN由3层构成，即输入层、隐含层和输出层，如图5所示。

图5 RBFNN结构

设Hj为第j个RBF。各RBF的输出为

(6)

式中：x=(x1,x2,…,xd)T，为输出向量；cj=(c1j,c2j,…,cdj)T,为第j个中心向量;σj为宽度参数。

RBFNN的y输出为RBF的线性和，即

(7)

式中：wi=[wi1,wi2,…,wim]T,i=1,2,…,o,为第i个输出神经元的网络权重向量；y为RBFNN的输出；H=[H1,H2,…,Hm]T,为基函数向量；o为神经网络输出层的神经元个数。

1.3.2 分类器的训练方法——蜜蜂算法(BA)

BA是一种基于群智能的全局优化算法，受蜜蜂采蜜行为启发，根据蜜蜂不同分工情况，实现蜜蜂群信息共享，从而更快找到问题最优解。结合BEE对模型进行训练，缩小训练范围，缩短训练时间。该算法首先将n只侦察蜂随机放入搜索空间，侦察蜂在各搜索区域对搜索站点进行适合度评估。站点招募的蜜蜂越多，代表这个方案越有可能成为最优方案。搜索区域大小的初始值a={a1,a2,…,ak}会被设置一个较大的值，k为变量数量。用公式表示为

ai(t)=ngh(t)×(maxi-mini)，

(8)

ngh(0)=1.0，

式中，t为BEE主循环的迭代次数。当搜索过程不再出现更合适的点时，搜索区域a的大小将缩小。更新搜索区域大小的公式为

ngh(t+1)=0.8×ngh(t)。

(9)

根据以上算法，对搜索范围进行搜索，随着算法循环进行，搜索区域缩小，区域选择也趋向最优。区域中适合度高的蜜蜂将被留下，形成下一批蜜蜂种群，其余的蜜蜂将被随机分配到搜索空间，用来寻找具有潜力的解决方案。重复以上迭代过程，直到满足停止搜索条件为止。

利用蜜蜂算法，可以快速找到RBF神经网络中参数的最优值，提高RBFNN的训练速度。

1.4 基于BA-RBFNN的气化过程失稳识别模型

气化过程参数模式识别问题涉及处理复杂的高维数据集。而神经网络识别模型通常在低维度空间中表现更好，因此，将模型转换成低维度空间非常重要。

对输入数据进行形状特征和统计特征提取，可以减少输入维度。使用Apriori算法(AR)对特征集进行优化选取，降低了问题的复杂性。

利用上文介绍的BA训练RBFNN，RBFNN的训练周期将会缩短。图6给出了气化炉模式识别模型的主要结构。图6中，Inputi(i=1,2,…,60)为第i个输入数据；Fei(i=1,2,…,12)为提取的第i个特征；Fsi(i=1,2,…,M)为选中的第i个特征；Pi(i=1,2,…,6)为第i个模式。

图6 气化炉模式识别结构

2 数值模拟试验

为检验基于BA-RBFNN的气化过程参数失稳监控方法的正确性，开展了数值模拟试验研究。

2.1 控制图模式

数值模拟试验设置不同的模式，这些模式均由60个数据点组成。首先根据式(10)将t处的点进行归一化处理，使其落在[0,1]内。

(10)

2.2 训练和测试

运用式(1)～(3)，通过仿真共生成1 500组模式数据，6个模式各250组数据。其中，μ=80，a=15，d=0.5，s=20，t取(0，59)，T=12。

仿真生成的1 500组模式数据中，用1 002组模式数据(每类167组数据)训练分类器，剩余的498组模式数据(每类83组)测试训练的分类器性能。

2.3 RBFNN参数设置

RBFNN配置包括3层，即输入层、隐含层和输出层。输入层有6个神经元，每个神经元代表一个特征(通过关联规则算法筛选出的6个形状特征和统计特征)。隐含层由35个神经元组成。输出层由6个神经元组成，每个神经元分别对应6个模式，如表2所示。

表2 输出模式类别

2.4 蜜蜂算法参数

表3是蜜蜂算法的参数设置。

表3 蜜蜂算法参数设置

2.5 试验结果

表4给出了10次BEE的训练结果。

表4 蜜蜂算法训练结果

图7为训练过程中模式识别精度变化曲线。

图7 训练过程中模式识别精度变化曲线

表5给出了通过MATLAB软件分别对传统RBFNN和基于BEE的RBFNN进行训练的结果。当传统RBFNN要达到相对比较理想的识别效果时，隐含层神经元需要498个。当传统RBFNN与BA-RBFNN具有相同隐含层神经元个数35时，传统RBFNN的识别效果远远差于BA-RBFNN的。若要与BA-RBFNN达到相同的识别效果，传统神经网络方法需要隐含层神经元个数为175个。此时传统神经元个数是BEE-RBF神经网络方法的5倍。

表5 RBFNN训练精度对比

3 现场数据模式识别

针对现场数据，运用BA-RBFNN识别模型对生物质气化合成气数据进行模式识别。

3.1 数据来源

数据来源于德国Schwarze Pumpe地区的气化炉(Combi-gasifier)[27]，气化炉示意图如图8所示[33]。刚启动气化炉时容易出现参数不稳定现象，对合成气H2在3种不同启动情况下体积分数的波动分别进行模式识别。第1组是气化炉从加热工况启动时合成气H2体积分数，第2组是气化炉从预热工况启动时合成气H2体积分数，第3组是气化炉从非预热工况启动时合成气H2体积分数，如图9所示。

图8 德国黑泵电厂的组合氧化炉(左)和德国皮尔纳的并流固定床氧化炉(右)

图9 不同工况下合成气中H2的体积分数

3.2 模型参数设置

BA-RBFNN识别模型参数如下。BEE：蜜蜂集群数n=200，选定区域数m=10，选取最优区域数e=2，初始区域ngh=0.1，最佳站点招募的蜜蜂数nep=80，其他区域蜜蜂数nsp=20；RBFNN：输入层神经元X个数为6，隐含层神经元P个数为35，输出层神经元Y个数为6。使用1 002组模式数据(每类167组数据)训练分类器，498组模式数据(每类83组)测试训练的分类器性能。测试结果：训练精度为99.6%。

3.3 试验结果

分别运用不同模型对气化炉数据模式进行识别监控，识别结果如表6所示。

表6 不同模型对气化炉数据模式识别结果

综合比较可知，尽管模型分类器类别、输入数据类别和输入数据维度与模型性能没有直接线性关系，但提出的BA-RBFNN模型却对气化炉合成气的模式识别表现出较高的识别率。

4 结论

在模拟试验中，当传统RBFNN要达到相对比较理想的识别效果时，隐含层神经元需要498个。当传统RBFNN与BA-RBFNN具有相同隐含层神经元个数35时，传统RBFNN的识别效果远远差于BA-RBFNN的。若要与BA-RBFNN达到相同的识别效果，传统RBFNN需要隐含层神经元175个。此时传统神经元个数是BA-RBFNN的5倍。试验结果表明构建的基于BEE算法的分类器训练方法，相较于传统训练方法速度更快，效果更好。

在对气化炉模式识别试验中，通过运用不同模式识别模型对气化炉参数进行识别，不同的模式类别数、输入数据类型、分类器类型、如输入数据维度，对气化炉参数的模式识别效果不同，而该文方法表现出较好的识别效果。

综合比较，提出的气化炉运行模式识别方法具有结构简单、训练速度快、识别率高等优势。