APP下载

基于集合经验模态分解和长短期记忆网络的催化裂化装置氮氧化物排放预测

2022-04-12闫珠赵继轩何为梁华庆

计算机应用 2022年3期
关键词:分量耦合神经网络

陈 冲,闫珠,赵继轩,何为,2,梁华庆

(1.中国石油大学(北京)信息科学与工程学院,北京 102249;2.中国石油集团安全环保技术研究院有限公司HSE检测中心,北京 102206)

0 引言

氮氧化物(Nitrogen Oxide,NOx)是一种常规大气污染物质,依据GB31570—2015《石油炼制工业污染物排放标准》中要求,现有企业自2017 年7 月1 日起执行其标准排放限值,NOx 的排放浓度限值应小于或等于100 mg/m3[1],这使得很多炼化企业在NOx 减排问题上面临着巨大的挑战;然而,由于催化裂化(Fluid Catalytic Cracking,FCC)工艺过程的复杂性,其建模分析一直是领域研究的热点和难点[2]。FCC 过程建模方法可以分为机理建模法[3]和统计建模法[4]。FCC 是一个高度非线性和相互强关联的系统,原料油性质、反应再生催化剂性质以及反应操作工况条件等因素都会影响到反应过程和产物收率,建立基于机理的反应动力学模型十分困难[5]。

针对工业生产活动中污染物排放数据的非线性和异质性,基于数据驱动的统计建模方法可以捕捉机理建模的复杂性,并表现出良好的性能[4]。随着第三拨人工智能热潮的开始,以深度学习为代表的神经网络方法在实际生产活动领域的应用越来越广泛,如文献[6]中提出了一种基于改进的动态主成分分析(Dynamic Principal Component Analysis,DPCA)和多层神经网络(Multilayer Neural Network,MNN)的神经估计模型,研究了FCC 装置生产质量控制中碳3(C3)浓度参数的预测,从实际过程变量中推断C3浓度。研究结果表明,该方法预测具有较好的可靠性和准确性。

长短期记忆(Long Short-Term Memory,LSTM)网络能够更好地刻画时间序列所蕴含的数据关系,广泛应用于文本分析[7]、金融时间序列预测[8-9]以及图像识别领域(如步态识别等)[10],在时间序列数据上获得了良好效果。在多维度时空数据处理上,将其他方法与LSTM 结合分别从空间、时间上提取数据特征,成为一种研究趋势。比如文献[11]中提出了一种混合模型,引入了3D 卷积神经网络和2D 卷积神经网络以更好地了解台风形成特征的空间关系。实验结果表明,混合模型CNN-LSTM(Convolutional Neural Network-Long Short-Term Memory)的效果优于数值预测模型。

虽然FCC 装置的NOx 排放浓度是单一维度的时间序列数据,但其具有非平稳、强非线性等特征,直接采用LSTM 方法进行预测难以达到令人满意的结果,需先对信号进行分解预处理,再应用LSTM 方法。集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)[12]是一种噪声辅助数据分析方法,其分解原理是将增加的白噪声与不同尺度的组成成分均匀地填充整个时频空间;文献[13]中提出了自回归综合移动平均(Autoregressive Integrated Moving Average,ARIMA)模型结合EEMD 深入提取数据特征,来预测年径流时间序列,实验表明EEMD-ARIMA 融合模型性能优于ARIMA;文献[14]中利用EEMD 原始振动信号,结合小波包变换(Wavelet Packet Transform,WPT),有效提取了故障早期敏感特征,验证了模型在故障诊断问题上的有效性;文献[15]中基于EEMD 和LSTM 提出了一种电力负荷序列预测方法,以避免数据的高非线性与非平稳性对预测精度的影响,但对于不同阶次的IMF 分量均输入到同等深度的LSTM 网络中,容易造成低阶IMF 序列对应模型训练过程中出现过拟合的问题。

为了挖掘NOx 排放序列内部蕴含的数据规律,提高预测精度,本文提出了基于EEMD和LSTM的耦合模型。首先采用EEMD 对信号进行分解预处理,将信号分解为若干固有模态函数(Intrinsic Mode Function,IMF),将原始数据的非平稳性与非线性特征分解到子序列中;接着采用相关性分析子序列,将子序列分成高频与低频两个类别,分别输入结构不同的LSTM 网络中,最后重构各分量的预测结果。实验结果表明,本文模型能为非平稳、非线性数据预测方法提供有益参考。

1 预测模型

1.1 集合经验模态分解

希尔伯特-黄变换(Hilbert-Huang Transform,HHT)方法[16]是一种分析非线性和非平稳信号的有力工具,其包含经验模态分解(Empirical Mode Decomposition,EMD)和希尔伯特变换(Hilbert Transform,HT)两部分。EMD 可以将原始信号分解成为一系列IMF 分量,从高频到低频依次排列,将复杂的原信号视为这一系列IMF 叠加之和,IMF 子序列之间互相独立,可以是线性或非线性序列。EMD 不同于傅里叶变换,不需要基函数,而是基于信号本身进行分解,因此适用于任何数据信号,摆脱了傅里叶变化的局限性;但是EMD 得到的IMF 分量往往存在模态混叠现象。Wu 等[12]在进行实验时,利用白噪声频谱均匀分布的特性,在待分析信号中加入白噪声,使不同时间尺度的信号自动分离到与其相适应的参考尺度上。

EEMD 的分解原理基于零均值噪声的特性,认为噪声经过多次平均计算后会相互抵消,集成均值可以直接视作最终结果。分解步骤主要分为四点:

1)在目标数据s(t) 中添加白噪声序列noise(t),x(t)=s(t) +noise(t)。

2)将添加白噪声的数据x(t)进行EMD 为IMF 分量。

3)重复步骤1)和步骤2),每次分解之前都添加不同的白噪声序列。

4)将每次得到的IMF 分量做集成平均处理后作为最终结果。

步骤2)中x(t)进行EMD 表示如下:

其中:rn(t)是分解提取n个IMF 后的信号残余分量,通常是信号的直流分量;imfi(t)是EMD 得到的第i个固有模态函数。得到的子序列若要成为IMF 分量需要满足下面两个条件。

1)该子序列中极值点的个数Nz和过零点的个数Ne需要满足以下关系:

2)在任意时间点,该序列f(t)由局部极大值和局部极小值确定的上、下包络线的均值为0,即:

由于上述两个条件的严苛,在实际分解过程中,判断成为IMF 的条件往往根据标准差Sd来决定:

EMD 的具体分解步骤如下:

1)寻找x(t)全部的极值点,分为局部极大值和局部极小值组。

2)通过三次样条插值法,分别获得光滑的波峰、波谷拟合曲线,即为x(t)的上包络线和下包络线。

3)取两条极值拟合曲线均值得到平均包络线m(t)。

4)将原始信号减去均值包络线,得到疑似IMF 分量h(t)=x(t)-m(t)。

5)判断h(t)是否符合IMF 条件:如果符合将作为第一个IMF 分量;否则作为新的原始信号,返回步骤1),再次筛选分析,直到满足条件得到IMF 分量。

6)将步骤5)中IMF 分量从原信号中分离出去,得到ri(t)=x(t)-imfi(t),检查是否满足分解停止条件,即是否存在两个以上的极值点:如果是则加入新的正态分布白噪声序列,返回步骤1)继续分解,进而得到所有的IMF 分量;否则,EMD 结束。

1.2 长短期记忆网络

循环神经网络(Recurrent Neural Network,RNN)由于其特殊的网络模型结构解决了信息保存的问题,在处理时间序列时具有独特的优势。然而,RNN 在实际训练过程中存在较多问题[17]。在使用反向传播算法学习模型参数的时候,RNN 需要展开成参数共享的多层前馈神经网络,历史信息的长度就反映了展开的层数。过多的层数不仅使得训练速度变得极慢,还会出现梯度消失和梯度爆炸问题,这样一来,RNN 也就失去了提取长序列历史信息的能力。为了解决上述问题,文献[18]中提出了LSTM,隐藏层节点结构采用门控机制,通过遗忘门、输入门、输出门的组合,达到控制每个节点信息通过量的作用,结构如图1 所示。

图1 LSTM结构Fig.1 Structure of LSTM

遗忘门决定上一个时刻的单元状态ct-1有多少保留到当前时刻ct。

其中:Wf是遗忘门的权重矩阵;[ht-1,xt]表示矩阵拼接;bf是遗忘门的偏置项,σ是sigmoid 激活函数。

输入门决定当前时刻网络的输入有多少保存到单元状态ct。

其中:Wi是遗忘门的权重矩阵;bi是输入门的偏置;计算当前输入的单元状态,根据上一次的输出和本次输入计算。

当前时刻的单元状态ct由上一次的单元状态ct-1按元素乘以遗忘门ft,再以当前输入的单元状态按元素乘以输入门it,将两个积加和产生:

当前的记忆和长期的记忆ct-1组合在一起,形成了新的单元状态ct,由于遗忘门的控制,LSTM 可以保存很久之前的信息,由于输入门的控制,它又可以避免当前无关紧要的内容进入记忆,输出门用来控制单元状态ct有多少输出到LSTM 的当前输出值ht,即控制长期记忆对当前输出的影响。

LSTM 的最终输出由输出门和单元状态共同决定。

1.3 EEMD-LSTM耦合模型

FCC 装置中NOx 的排放数据受外界原料量等干扰,是典型的非线性、非平稳信号。本文提出基于EEMD 与LSTM 的耦合模型,将NOx 的排放浓度序列通过EEMD 为一系列IMF分量,有选择地将强相关的子序列根据频率高低分别送入不同深度LSTM 神经网络,最后将子序列预测结果重构得到最终预测结果,模型结构如图2 所示。

图2 EEMD-LSTM模型结构Fig.2 Structure of EEMD-LSTM model

根据图2,EEMD-LSTM 耦合模型主要分为以下3 个模块:

1)EEMD。

原信号x(t)经过EEMD 之后,等于n个IMF 分量之和,如式(11)所示,其中IMF 分量与原序列等长。

2)IMF 分量提取。

计算每个imfi(t)(i=1,2,…,n)与x(t)的Pearson 相关系数,记为P={p1,p2,…,pn}。

pi定义为两个连续变量(X,Y)的Pearson 相关性系数,等于它们之间的协方差除以它们各自标准差的乘积。

pi取值总是在-1~1,接近0 的变量被成为无相关性,接近1 或者-1 被称为具有强相关性。根据p0筛选出相关性较大的IMF 分量集,其他分量将被舍弃。

3)LSTM 网络预测。

针对每一个符合筛选条件的imf(t) ∈IMFpi≥p0,经过处理为对应网络的监督数据集,样本xi输入到LSTM 单元中。假设预测未来第s步的数据信息,则通过隐藏层LSTM 单元的计算,各个时期输出hi如式(14)所示,对应的长期记忆ci如式(15)所示:

第s步隐藏层单元输出为Hi+s,送入到一层全连接网络,激活函数采用ReLU,最后输出s步的预测结果。

将模型预测输出与理论预测结果基于均方根误差(Root Mean Squared Error,RMSE)进行损失计算,利用适应性动量估计(Adaptive momentum estimation,Adam)算法基于训练样本数据迭代更新神经网络权重,减小Loss值,优化模型。

2 实证分析

2.1 数据处理

实验所采用数据集来源于我国某炼厂2016 年3 月至2017 年3 月FCC 装置NOx 的排放数据,每相邻两条记录时间间隔为40 min,共获得10 000 条数据记录。对于原始数据首先进行异常值的剔除,本文将用数据均值代替明显的异常值,经统计可知,异常数据个数小于数据长度的0.5%。经过去除异常值后的信号序列如图3 所示,对上述信号进行EEMD,获得12 个IMF 分量,如图4 所示。

图3 预处理之后的数据Fig.3 Preprocessed data

图4 IMF分量数据集Fig.4 Dataset of IMF subsequences

根据式(13)计算12 个IMF 分量与原信号的相关系数,结果如表1 所示。根据式(12),设置相关系数阈值p0=0.106 5,因此剔除IMF 分量1、2。

表1 IMF分量相关系数Tab.1 Pearson correlation coefficients of IMF subsequences

2.2 实验验证

结合FCC 生产活动中的实际意义,本文选定预测步长为未来24 h 的数据信息,对应在实际数据中,为未来36 组的数据。为了评估本文EEMD-LSTM 耦合模型的性能,实验选用LSTM 作为对照组,通过多次实验给出两种模型的最优实验结果。

实验中,两层隐藏层分别设计为32、64 个神经元,单层隐藏层设计20 个神经元,分别作为EEMD-LSTM 耦合模型中不同深度的LSTM 网络结构。为减小建模误差,在进行网络训练之前进行数据归一化处理;采用48 组连续NOx 排放数据作为LSTM 的输入数据,对应得到36 组预测结果,反归一化之后得到预测的真实值,便得到一个数据样本的训练结果。为了不减少样本量,生成样本时滑动窗口每次前进一个数据记录,因此整个测试集得到的预测结果在中间时间点上是重复的,最后统一取均值作为该时间点的预测值。

本文按6∶2∶2 的比例划分测试集、验证集、测试集,经过300 次迭代,LSTM 模型以及EEMD-LSTM 耦合模型中的各个分量的网络训练均能达到收敛。为了更好地观察模型的对比结果,采用RMSE、平均绝对误差(Mean Absolute Error,MAE)以及决定系数(R2)三个指标进行评估模型性能,计算公式分别如下:

2.3 模型评估

图5 展示了EEMD-LSTM、LSTM 模型测试集预测结果与真实值的对比,其中EEMD-LSTM 耦合模型的预测值是由EEMD 的关键IMF 分量的子预测结果叠加得到的。整体来看,相较于LSTM,EEMD-LSTM 模型的预测结果与真实值大致吻合,从图中局部放大区域(1)、(2)能够更清晰看到这一点。LSTM 预测输出相对平滑,缺少局部波动细节,与真实值对比上下波动幅度略小;而EEMD-LSTM 模型的预测结果与真实值曲线有较多重叠,体现了更多的局部波动细节。这说明EEMD-LSTM 对于数据特征的学习更精细,在局部极值点上表现了较好的预测能力。

图5 模型预测值与真实值对比Fig.5 Comparison of predicted value and observed value of models

为了量化两种模型的预测能力,从RMSE、MAE、R2三个评价指标上评估模型性能,结果如表2 所示。由表2 看出,实验结果符合理论预期,EEMD-LSTM 耦合模型在RMSE、MAE指标上的误差值均小于LSTM,前者相对于后者在这两项上分别减小了46.7%、45.9%;在决定系数R2上,EEMD-LSTM耦合模型比LSTM 模型增大了43%。

表2 模型性能对比Tab.2 Comparison of model performance

LSTM 凭借其独特的遗忘门、输入门、输出门设计,可以学习时间序列以往序列特征,保留当下时刻之前较长时期的记忆,在时间序列预测上比其他神经网络有着不可比拟的优势。但针对像FCC 装置的污染排放数据而言,实际生产中受多项生产要素含量的影响,很难挖掘的深层数据特征,因此针对这样的数据,LSTM 表现良好但仍有可优化的空间。而EEMD-LSTM 耦合模型将单一的原始序列分解为一系列固有模态函数,并且有选择地保留IMF 分量,将包含高频随机噪声多的分量舍弃,多角度、多层次地提取原始数据特征,能更好地学习数据的深层规律,进一步提升预测精度。

3 结语

FCC 装置中NOx 的排放数据受生产过程中的温度、原料量、通风量等各项要素影响,传统机理建模方法很难刻画数据特征。本文提出一种基于EEMD 算法和LSTM 神经网络的耦合模型EEMD-LSTM,将信号分解为不同特征尺度的平稳序列,经过皮尔逊相关性分析舍弃弱相关分量,有效减少高频随机噪声的引入,将提取出的相关分量分别输入LSTM 模型,重构模型输出得到最终预测结果。经过实验证明,EEMD-LSTM 与LSTM 模型均表现了良好的性能,但EEMDLSTM 耦合模型比LSTM 具有更高的预测精度,对原数据的拟合程度也更高。

猜你喜欢

分量耦合神经网络
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
仓储稻谷热湿耦合传递及黄变的数值模拟
MIV-PSO-BP神经网络用户热负荷预测
车门焊接工艺的热-结构耦合有限元分析
某型航发结冰试验器传动支撑的热固耦合分析
复杂线束在双BCI耦合下的终端响应机理
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤