基于PCA-RBF层叠泛化网络的硝酸生产工艺历史数据建模
2018-05-28李爱民杨福胜侯建民何瑞明
李爱民, 代 敏, 杨福胜*, 侯建民, 何瑞明
(1.山西省岩矿测试应用研究所,山西 太原 030001;2.西安交通大学化工学院,陕西 西安 710049;3.西安森威自控工程有限公司,陕西 西安 710075)
硝酸作为一种重要的化工原料在国民经济、国防工业和航天事业中发挥越来越重要的作用[1]。成品酸流量是体现硝酸生产工艺运行状态一个主要指标,若能建立准确预测成品酸流量变化的模型,对提升硝酸操作的稳定性和产品质量、降低生产成本都具有重要的现实意义[2]。由于硝酸生产工艺流程复杂、工段较多,由蒸发器、吸收塔、换热器等具有高维度、非线性的“单元”组成,各单元参数之间又表现出极强的亲和与制约关系,导致基于硝酸生产工艺机理的过程建模难度较大[3]。因此,基于数据的智能建模得到了广泛关注,张丹将神经网络与复合形法和粒子群优化算法有效的结合起来,提出了基于ANN-PSO的硝酸参数建模优化方法[4];宋云东采用多维插值方法建立了硝酸厂参数的离散优化模型[5]。但上述研究仍然存在模型预测精度不高、泛化能力较弱等不足。层叠泛化方法是一种基于异态集成的组合预测训练方法,通过对一组学习算法的交叉训练使预测结果相对完备,从而提高模型的泛化能力[6]。主成分分析(principal components analysis,PCA)[7]能有效分析多个非线性输入变量的相关性,并在得到其对输出变量的作用程度的同时排除噪声。由此,本文以某硝酸生产厂2016年4月~5月的连续运行监测数据为基础,以输出变量y(出口成品酸流量)和9个输入过程变量xi(表1)为对象进行数据挖掘,建立了基于双加压法硝酸生产工艺历史数据的PCA-RBF层叠泛化模型,并研究其关键过程变量的影响。结果表明,此方法增强了模型泛化能力,提高了预测精度,可为硝酸生产过程重要工艺参数的检测和过程变量的优化控制提供指导。
1 PCA-RBF层叠泛化模型
1.1 主成分分析(PCA)
主成分分析(principal component analysis,PCA)是一种研究多变量间相关性的多元统计方法,其实质是选择几个互不相关的有代表性的主元,保留和解释原数据中大部分的信息与变化[7]。
1.2 径向基函数(RBF)
径向基函数(RBF)神经网络由输入层、隐含层和输出层构成。其可在确定的基函数作用下对输入信号在局部产生响应,并实现隐含层的非线性映射和输出层的线性映射[8]。
1.3 PCA-RBF层叠泛化模型
层叠泛化是一种将多个学习算法组合训练的集成学习方法,它通常由两级学习网络构成,第1级包含M个不同的映射,即f1={f1m,m=1,2,…,M},每个映射均进行交互验证式训练,使其保留预测结果多样性,同时,将样本预测值组成新的样本空间;第2级由1个映射f2构成,将第1级得到的新样本空间作为输入得到最终输出结果。本文使用RBF构建构建各级映射,基于PCA-RBF层叠泛化模型的建立过程如下:
1) 采用PCA分析原始样本D,即
D={(xij,yij),i=1,2,…n;j=1,2,…,m},从m个输入变量中提取d个主元,并将变换后的样本D′随机分为K份等量且不重叠的子样本集合,即,{Dk,k=1,2,…,k}。
5) 基于建模样本D″,构建第二级RBF网络L2。
6) 再用全部训练样本重新训练第1级网络的M个RBF网络,得到用于预测的第1级网络L1,与第2级网络L2,构成层叠泛化网络模型。建模流程如图1所示。
图1 PCA-RBF层叠泛化流程
2 基于PCA-RBF的硝酸生产过程建模
2.1 数据前处理与机理分析
本文从硝酸工厂中共采集2578组样本数据。先用拉依达准则去除样本随机误差[9]后得到2 178组数据,对其标准化,得到KMO值为0.64>0.60,适合主成分分析[10],然后,采用PCA算法对其分析,结果如第73页表1所示。
从表1可以看出,前5个主成分的累积贡献率为90.31%>85%,综合了影响出口成品酸流量的大部分信息[10],故选取前5个主成分作为第一级RBF神经网络的输入变量。同时,在第一个主成分PC1中,氧化氮压缩机进、出气口压力(x1、x3)、二次空气至漂白塔流量(x9)、吸收塔压降(x5)和漂白塔液位(x7)对成品酸流量的影响较大,且为正向。其主要反映了吸收漂白工段中主要设备的操作压力对出口成品酸流量的影响,其值越大,说明操作压力越有利于成品酸流量生产,产率越高。对于本文采用的双加压法生产硝酸的工艺流程而言,吸收塔的操作压力由“四合一”机组提供,进入吸收塔的工艺气通过氮氧化物压缩机将压力升至操作压力。水吸收二氧化氮生成硝酸的反应是一个体积缩小的反应,故加压可使平衡向生成硝酸的方向移动,并有利于提高成品酸的浓度。此外,操作压力对硝酸生产的速度也有很大的影响,这是因为,一氧化氮在气相中所需氧化空间几乎与压力的三次方成反比,所以,加压可大大减少吸收容积[11]。同时,在加压的条件下,增大通入漂白塔的二次空气流量,可以把游离的NOx吹出,使反应更充分,从而增大出口成品酸流量。可见,PC1的数据分析结果与工艺物理特征一致。第二主成分PC2主要综合了NOx压缩机进、出口温度(x2、x4)的信息,且呈负向分布。其反映了在第一主成分值大体固定的情况下,吸收漂白工段受反应温度的影响,随着温度项权值的降低,成品酸流量增加。从物理角度出发,二氧化氮用水吸收的反应是放热反应,降低温度,平衡向有利于生成硝酸的方向移动;而在一定范围内,低温还可促进一氧化氮的氧化反应速率,使得出口成品酸流量增加[12]。后面几个主成分PC3-PC5分别在脱盐水入吸收塔流量(x8)、漂白塔液位调节(x6)、漂白塔液位阀 (x7)上的因子载荷较大。其中,漂白塔中进行的过程是解吸过程,在一定工况条件下,控制好漂白塔液位,有利于提高NO2的浓度,更好实现产品分离,提高成品酸质量[13];而适当增大脱盐水用量既可以提高硝酸溶于水的推动力,还可以降低吸收塔内温度,从而提高出口成品酸流量[11]。由此可见,PCA分析结果与实际工艺特征是定性一致的,也表示可以通过提高压力、适当范围内降低温度、增大吸收水流量来提高产率。
2.2 PCA-RBF层叠泛化模型训练预测
将预处理后的样本随机选取2000组作为建模样本在Matlab环境中使用本文方法建模,余下的178组样本作为新输入数据测试模型的预测精度和泛化能力。本文构建的第一级网络由3个RBF网络组成,分别记为RBF11、RBF12、RBF13,采用交叉验证算法优化结构,最终3个网络的拓扑分别为5-30-1、5-27-1、5-27-1,第二级网络由1个RBF网络组成,记为RBF2,拓扑结构为3-30-1。为测试所建网络的预测效果与泛化能力,将其与层叠泛化策略的第一级3个RBF网络进行对比;同时,为验证PCA的降维效果,将未经过PCA处理的数据与PCA处理之后的数据分别作为本文建模方法的输入进行对比,5个模型的预测效果如图2、图3所示。
表1 主成分分析结果
图2 模型的预测效果
由上述结果可以看出,使用基于层叠泛化策略的预测模型有效地结合了各模型优势,较好地跟踪了单个RBF模型的预测趋势,样本均方误差和平均绝对、相对误差均优于单个RBF预测模型。其中,未经PCA处理的RBF层叠泛化模型预测效果绝大部分优于单个RBF预测模型,而经过PCA降维精简数据后,PCA-RBF层叠泛化模型的预测效果均明显优于单个RBF模型结果,最大、最小误差(0.053、0.007 6)远小于单个RBF模型;同时,其在绝大部分情况下还优于或等于未经PCA处理的RBF层叠泛化模型结果。综合来看,基于硝酸生产过程的PCA-RBF的层叠泛化策略建模提高了预测精度和模型泛化能力[14]。
图3 各模型预测效果
3 结论
本文从硝酸工艺流程特点出发,结合PCA方法与层叠泛化算法的优点,建立了基于硝酸生产历史数据的PCA-RBF层叠泛化网络模型。结果表明,PCA-RBF层叠泛化网络模型可以较好地完成目标变量的预测,平均相对误差为2.01%,相较于常规的RBF模型,其误差小、泛化能力较强,能为硝酸工艺的优化和控制提供较好指导,同时,其为流程复杂的化工过程的建模提供了一个有效方法。
参考文献:
[1] 唐文骞,张友森.我国硝酸工业生产现状分析及发展建议[J].化肥工业,2013(1):31-35,42.
[2] 张夕专.硝酸生产工艺研究[J].科技视界,2013(19):203-204.
[3] 靳小桂.我国硝酸、硝酸铵行业现状及发展趋势——在2011年硝酸硝铵行业工作会上的讲话[J].化肥工业,2011(4):1-3,8.
[4] 陈超.智能建模中冗余问题的分析与处理及其应用[D].上海:华东理工大学,2015.
[5] 张丹.硝酸生产过程操作参数优化的研究[D].沈阳:沈阳工业大学,2005.
[6] 朱玉华.硝酸生产过程操作参数的智能优化[D].沈阳:沈阳工业大学,2003.
[7] 黄帅栋,卫志农,丁恰,等.基于层叠泛化策略的母线负荷预测模型[J].电力系统及其自动化学报,2013,(3):8-12,55.
[8] Guo Hongwei,Su Buxin,Zhang Jianliang,et al.Extracting the core indicators of pulverized coal for blast furnace injection based on principal component analysis[J].International Journal of Minerals Metallurgy and Materials,2013(3):246-252.
[9] 苏兴.基于神经网络的化工建模预测方法研究[D].大连:大连理工大学,2011.
[10] 乔弘.火电厂热工参数软测量关键技术和方法研究[D].北京:华北电力大学,2009.
[11] Cerny B A,Kaiser H F.A Study Of A Measure Of Sampling Adequacy For Factor-Analytic Correlation Matrices[J].Multivariate Behav Res,1977,12(1):43-47.
[12] 董忠哲.双加压法硝酸生产工艺流程的模拟与优化[D].天津:河北工业大学,2013.
[13] 江纪海.硝酸装置中一氧化氮氧化反应速度的计算[J].山西化工,1983(4):3-9,19.
[14] 刘萍.发烟硝酸漂白塔的技改[J].中氮肥,2010(4):52-53.