基于投影寻踪回归的铜闪速熔炼过程关键工艺指标预测
2012-12-14刘建华桂卫华谢永芳王雅琳蒋朝辉
刘建华,桂卫华,谢永芳,王雅琳,蒋朝辉
(中南大学 信息科学与工程学院,长沙 410083)
闪速熔炼是现代火法炼铜的主要方法。在铜闪速熔炼过程中,冰铜温度、冰铜品位及渣中铁硅质量比是衡量熔炼过程质量优劣的3个关键工艺指标,也是指导操作参数优化调整的重要依据,只有稳定这3个参数,才可以实现后续生产的稳定。然而,由于对该参数检测的滞后性及人为因素的影响,测得的指标难以及时起到修正操作参数的作用[1]。 为此,研究铜闪速熔炼过程3个关键工艺指标参数软测量技术,对于优化操作参数调整,提高铜闪速熔炼过程的熔炼效率具有重要意义。
为实现铜闪速熔炼过程3个关键工艺指标参数的有效预测,从熔炼机理及实际生产数据出发,国内外学者开展了大量的研究工作[2-5],成果的工业应用对稳定生产、提高产品产量与质量发挥了重要作用。然而,由于铜精矿贫化、产量日益增加和炉体改造等工况条件的不断变化,需对已建立的模型参数进行实时更新[6]。铜闪速熔炼生产数据库中储存了海量的生产数据,通过筛选后,其数据量仍然非常庞大[7],从如此庞大的数据中选择用于更新模型参数的训练样本非常困难; 直接利用该庞大的数据进行模型参数修正,势必造成训练时间较长、并使学习时阈值的选择很难在减少噪音和保留过程信息之间取得恰当平衡[8]。铜闪速熔炼过程生产数据中包含了大量的反映生产运行规律与工艺参数之间关系的潜在信息[9],与当前工况最相似的样本数据最能反映当前工况相似的运行规律,如果只利用与当前工况的相似样本集,建立铜闪速熔炼过程3个关键工艺指标预测模型,显然比传统的建模方法更接近现实意义。投影寻踪回归技术通过直接审视数据,将高维数据映射到低维子空间,并在低维子空间进行统计回归分析,以达到预测的目的[10]。
为此,本文作者在铜闪速熔炼过程控制机理分析的基础上,结合模式识别与统计分析方法,提出基于投影寻踪回归的铜闪速熔炼过程关键工艺指标预测方法。 该法首先通过设定数据样本之间的相似性度量准则,从大量生产数据中检索出与当前工况相似的样本集;然后利用投影寻踪回归原理,建立铜闪速熔炼过程关键工艺指标参数的预测模型,并采用基于实数编码的加速遗传优化算法进行模型参数的实时更新,实现铜闪速熔炼过程关键工艺指标的有效预测;最后结合某冶炼厂实际生产数据,给出仿真结果分析和讨论。
1 铜闪速熔炼控制过程分析及建模策略
1.1 铜闪速熔炼控制过程
铜闪速熔炼是将深度脱水的精矿粉末在闪速炉喷嘴处与空气和氧气混合,以较高速率从反应塔顶部喷入反应塔内,在2~3 s内基本上完成硫化物的分解、氧化和熔化等过程,形成熔融硫化物与氧化物的混合熔体,并下降到反应塔底部,在沉淀池中汇集并沉淀分离,最终形成冰铜、炉渣和烟气。实际熔炼过程的操作控制,主要在精矿混合物加入速率一定的基础上,通过分析冰铜温度、冰铜品位及渣中铁硅质量比3个关键工艺指标,优化调整反应塔工艺风量、氧量及造渣剂加入量3个易控参数,实现熔炼过程的稳定运行。某冶炼厂采用奥托昆普闪速炉的系统控制流程如图1所示。
图1 闪速炉控制系统流程图Fig.1 Control framework for copper flash smelting process
冰铜温度、冰铜品位及渣中铁硅质量比3个工艺指标参数是衡量铜闪速熔炼过程质量优劣的重要依据,也是指导铜闪速熔炼过程操作参数调整的重要指标,而影响该工艺指标参数的影响因素主要包括铜精矿流量、精矿的组成成分(Cu、Fe、S、SiO2的质量分数)及加入反应塔的工艺风量、氧量及造渣剂加入量8个主要影响因素。为此,将工艺指标作为铜闪速熔炼过程的期望输出量,将影响该输出量的8个主要影响因素作为输入量,通过建立铜闪速熔炼过程输入与输出间的关系模型,实现工艺指标的预测。
1.2 铜闪速熔炼过程建模策略
基于投影寻踪回归的铜闪速熔炼过程关键工艺指标预测的基本思想是通过归纳与综合当前工况的相似样本集,实现关键工艺指标参数的有效预测。结合实际生产数据,首先借助PCA技术设定各分量的属性权重,并将考虑特征属性权重的欧几里德距离作为样本之间的相似性度量准则,进行相似样本集的检索。然后,借助投影寻踪回归思想,通过充分利用检索到的相似样本集,在低维子空间构建相似样本集投影值与目标值之间的关系模型,并采用基于实数编码的加速遗传算法进行模型参数的实时更新, 达到有效预测铜闪速熔炼过程关键工艺指标的目的。而由于投影寻踪回归主要是针对多输入单输出的情况,因此,针对铜闪速熔炼过程的 3个关键工艺指标参数,本文作者采用同样的建模方法,分别建立3个工艺指标的预测模型。
2 相似样本集的选取
由熔炼机理分析可知,铜闪速熔炼过程各参数对工艺指标参数的影响程度不同,鼓入闪速炉的风量、氧量,及加入闪速炉的铜精量的影响较大。为保证相似样本选择的可靠性, 样本之间的相似性度量应能较好地反映不同属性对工艺指标参数的不同影响。 综合考虑相似样本检索方法[11-12]及属性权重确定方法[13-15]的优缺点,选用 PCA技术确定各影响因素的属性权重,采用最近邻法进行相似样本集的检索。
首先以影响铜闪速熔炼过程工艺指标参数的8个主要影响因素作为匹配对象。设生产数据集中的第i组样本的输入向量为n),其中:n表示样本数据集中样本容量;2, …, 8)表示第i组样本对应的精矿流量,精矿中Cu、Fe、S和SiO2含量,加入反应塔的工艺风量,氧量及造渣剂加入量。将工艺指标参数表示为(i=1, 2, …,n),其中:表示第i组样本的冰铜温度、冰铜品位及渣中铁硅质量比。
为消除各影响因素参数量纲不同带来的影响,使建模具有一般性,需首先对生产数据集进行归一化处理。为方便起见,设经数据标准化处理后的样本仍然记为Xi与Yi,并设经标准化处理后的当前工况输入向量为是由组成的矩阵,即
定义X的协方差矩阵为
对式(2)进行正交分解,得
式中:D=diag(λ1,λ2, …,λ8)为协方差矩阵的特征根矩阵,且λ1≥λ2≥…≥λ8;P=[p1,p2, …,p8]为特征向量,称为载荷矩阵。
铜闪速熔炼相似样本集的检索主要涉及8个主要影响因素,为保证匹配精度,选择所有分量作为新变量,并定义新变量的第i(i=1, 2, …, 8)个分量的权系数(贡献率)为
考虑到特征属性对工艺指标的影响程度不同,样本之间的相似性度量应在由新变量组成的特征空间中进行。因此,首先应将生产数据集中相应的输入矩阵X通过载荷矩阵P投影到由新变量组成的空间中,以构造新工况的检索对象库,即
3 投影寻踪回归及其实现
投影寻踪是用来处理非线性、非正态高维数据的新型统计方法[10],它用若干个一维岭函数的“加权和”去拟合回归函数,其思想是将高维自变量进行投影,获得一个低维的投影变量后,再确定该投影变量与因变量之间的相互关系。投影寻踪回归主要是解决多输入单输出的建模问题,而铜闪速熔炼过程具有3个关键工艺指标,因此,可以分别建立该3个工艺关键指标参数的投影寻踪回归模型。以冰铜温度预测模型建立为例,其建模过程如下:
1)将检索到的相似样本集所对应的输入向量通过投影方向向量投影到一维空间,得其投影值即
2)以投影值zi为自变量,以第i组相似样本对应的冰铜温度为因变量,对散布点进行曲线拟合。
式中:fi(zi)为拟合岭函数;ci为岭函数系数;k为岭函数的个数。式(9)可以通过增大k的方法来减少模型误差。由于采用逐段线性函数在各方向上不断对数据平滑逼近,因此该模型能更客观地反映数据本身的内在结构,增强模型预测结果的稳定性[16]。为避免使用庞大的函数表,且保证逼近的精度,采用可变阶的正交Hermite多项式拟合其中的岭函数,故式(9)可表示为
式中:r为多项式的阶数;cij为多项式的系数;h表示正交Hermite多项式,由式(11)计算:
式中:φ为标准高斯函数,且Hr(z)为 Hermite多项式,采用递推形式:H0(z)=1;H1(z)=2z;Hr(z)=2(zHr-1(z)-(r-1)Hr-2(z))。
3)建立投影指标函数
4)采用基于实数编码的加速遗传算法[17]进行最优参数的寻优,并计算最优值下的拟合误差如果满足要求则输出模型参数,否则进入下一步。
5)用ε取代,转到步骤2),通过增加一个岭函数的方式,继续进行拟合,直到满足要求为止。
冰铜品位与渣中铁硅质量比的投影寻踪回归预测模型参照上述步骤建立。
4 实例应用及结果分析
结合某冶炼厂铜闪速熔炼过程 2007年 8月至2010年7月之间的实际生产数据,以影响铜闪速熔炼过程关键工艺指标的8个主要影响因素作为输入,以3个关键工艺指标作为输出,分别建立基于投影寻踪回归的铜闪速熔炼过程的3个工艺指标预测模型。首先基于数据预处理技术[18],形成完备的数据样本共684 430组,庞大的数据量加大了模型参数更新时人工选择样本的难度,且训练速度较慢,很难满足熔炼生产过程实时性需求。
结合本文作者提出的建模策略,针对一个新的工况条件,基于相似性度量准则,借助相似样本的快速检索方法[19],从生产数据集中选择与该工况最相似的m组样本,建立基于投影寻踪回归的铜闪速熔炼过程关键工艺指标预测模型。为确定模型参数结构,通过适当选择岭函数个数与岭函数阶数可以得到较好的预测结果,经过多次试验比较分析,在预测冰铜温度时,选取48组相似样本,采用2个岭函数的形式,每个岭函数阶数为4; 在预测冰铜品位时,选取48组相似样本,采用2个岭函数,每个岭函数阶数为3; 在预测渣中铁硅质量比时,选取30组相似样本,采用1个岭函数,岭函数阶数为 3。另外,为了验证本研究所提出的实时模型建立方法的有效性,特与采用 BP网络建模(BPNN)预测结果[20]进行比较。首先从样本集中随机选择200组样本作为训练样本,形成8-15-3的BPNN模型。为了使测试样本集尽可能反映整个样本空间,从预处理的样本集中均匀选取 50组样本用作测试样本,进行冰铜温度、冰铜品位及渣中铁硅质量比预测。该策略、BP神经网络模型预测与实际值比较结果如图2~4所示。
从图2~4可知,与采用BPNN相比,冰铜温度、冰铜品位及渣中铁硅质量比最大相对误差分别由BPNN预测的9.37%、3.82%和10.98%减小到6.08%、3.82%和10.90%。平均相对误差分别由采用BPNN预测的 2.15%、2.01%与4.28%减小到 1.83%、1.49%和4.21%。与BPNN模型相比,当工况波动较大时,本策略具有更高的预测精度。尽管本文作者所提建模方法对每一新的工况都需进行模型参数的优化更新,但模型参数更新采用具有优化速度较快的加速遗传算法进行寻优,且训练样本只在相似样本集中进行。另外,相似样本集的快速检索策略[19]进一步保证了模型参数的更新效率。在采用数据集进行相似样本集的检索过程中,检索时间一般少于4.8 s,模型参数的更新时间不超过6 s,满足实际生产对预测精度及实时性的要求。结果表明,通过充分利用当前工况的相似样本集,结合模式识别及投影寻踪回归思想,建立铜闪速熔炼过程的关键工艺指标预测模型,能有效减小工况波动时的预测误差,其预测精度满足生产过程对工艺指标预测精度的要求。
图2 冰铜温度预测值与实际值的对比Fig.2 Comparson results of predicted and actual values for matte temperature
图3 冰铜品位预测值与实际值的对比图Fig.3 Comparison results of predicted and actual values for matte grade
图4 渣中铁硅质量比预测值与实际值的对比Fig.4 Comparison results of predicted and actual values for mass ratio on Fe to SiO2 in slag
5 结论
1)为适应工况条件的复杂变化,避免因数据量庞大引起模型参数更新时样本选择困难及训练速度慢的缺陷,在铜闪速熔炼控制流程分析的基础上,借助模式识别及统计分析思想,提出基于投影寻踪回归的铜闪速熔炼过程 3个关键工艺指标预测模型的建立方法。 首先利用模式识别思想,从大量生产数据中检索出与当前工况相似的相似样本集,并基于该相似样本集,借助投影寻踪回归原理,分别建立铜闪速熔炼过程影响因素与3个关键工艺指标之间的关系模型。
2)所建模型的优越性主要表现在,采用机器选择的方式进行训练样本的筛选,可以有效避免人工选择的盲目性与主观性缺陷;在模型参数训练时,引入基于实数编码的加速遗传算法进行模型参数寻优,且训练数据只在相似样本集中进行,可有效提高模型参数训练速度。
3)某冶炼厂铜闪速熔炼过程实际生产数据验证结果证明了所建模型的有效性、可行性,其预测精度满足铜闪速熔炼过程实际生产的需求,可指导铜闪速熔炼过程操作参数的优化调整,实现铜闪速熔炼过程的稳定优化控制。
[1]GUI Wei-hua, WANG Ling-yun, YANG Chun-hua, XIE Yong-fang, PENG Xiao-bo.Intelligent prediction model of matte grade in copper flash smelting process[J].Transactions of Nonferrous Metals Society of China, 2007, 17(15): 1075-1081.
[2]SANCHEZ-CORRALES V M, VALERA-GONZALEZ J A,FLORES-PEREZ P, PEREZ-TELLO M.Mass balance calculations in copper flash smelting by means of genetic algorithms[J].Journal of the Minerals, Metals and Materials Society, 2004, 56(12): 29-32.
[3]FAGERLUND K O, JALKANEN H.Microscale simulation of settler processes in copper matte smelting[J].Metallurgical and Materials Transactions B, 2000, 31(3): 439-451.
[4]LI Xin-feng, MEI Chi, XIAO Tian-yuan.Numerical simulation analysis of Guixi copper flash smelting furnace[J].Rare Metals,2002, 21(4): 260-265.
[5]CHEN Hong-rong, MEI Chi, XIE Kai, LI Xin-feng, ZHOU Jun,WANG Xian-hua, GE Ze-lin.Operation optimization of concentrate burner in copper flash smelting furnace[J].Transactions of Nonferrous Metals Society of China, 2004, 14(3):631-636.
[6]汪金良, 卢 宏, 曾青云, 张传福.基于遗传算法的铜闪速熔炼过程控制优化[J].中国有色金属学报, 2007, 17(1): 156-160.WANG Jin-liang, LU Hong, ZENG Qin-yun, ZHANG Chuan-fu.Control optimization of copper flash smelting process based on genetic algorithms[J].The Chinese Journal of Nonferrous Metals,2007, 17(1): 156-160.
[7]赵恒平, 俞金寿.化工数据预处理及其在建模中的应用[J].华东理工大学学报: 自然科学版, 2005, 31(2): 223-226.ZHAO Heng-ping, YU Jin-shou.Chemical data pretreatment and its application in modeling[J].Journal of East China University of Science and Technology: Natural Science Edition, 2005, 31(2):223-226.
[8]张学莲, 胡立生, 曹广益.基于过程数据的动态 PLS建模[J].系统仿真学报, 2008, 20(10): 2686-2692.ZHANG Xue-lian, HU Li-sheng, CAO Guang-yi.Dynamic PLS modeling based on process data[J].Journal of System Simulation,2008, 20(10): 2686-2692.
[9]柴天佑.生产制造全流程优化控制对控制与优化理论方法的挑战[J].自动化学报, 2009, 35(6): 641-649.CHAI Tian-you.Challenges of optimal control for plant-wide production processes in terms of control and optimization theories[J].Acta Automatica Sinica, 2009, 35(6): 641-649.
[10]QI Xiao-ni, LIU Zhen-yan, LI Dan-dan.Prediction of the performance of a shower cooling tower based on projection pursuit regression[J].Applied Thermal Engineering, 2008,28(8/9): 1031-1038.
[11]CHEN Yun-jen, CHEN Yun-min, WANG Chin-bin, CHU Hui-chuan, TSAI Tsung-nan.Developing a multi-layer reference design retrieval technology for knowledge management in engineering design[J].Expert Systems with Applications, 2005,29(4): 839-866.
[12]LI Y, SHIU S C K, PALS K.Combining feature reduction and case selection in building CBR classifiers[J].IEEE Transactions on Knowledge and Data Engineering, 2006, 18(3): 415-429.
[13]罗来鹏, 刘二根.一种新的属性重要性度量及其规则获取[J].计算机工程与应用, 2007, 43(22): 170-172.LUO Lai-peng, LIU Er-gen.New measure of significance of attributes and its rule acquiring[J].Computer Engineering and Applications, 2007, 43(22): 170-172.
[14]WAN S, LEI T C, CHOU T Y.A novel data mining technique of analysis and classification for landslide problems[J].Natural Hazards, 2010, 52(1): 211-230.
[15]WANG W, ZHANG X L, GOMBAULT S.Constructing attribute weights from computer audit data for effective intrusion detection[J].The Journal of Systems and Software, 2009, 82(12):1974-1981.
[16]HWANG J N, LAY S R, MAECHLER M.Regression modeling in back-propagation and projection pursuit learning[J].IEEE Transaction on Neural Networks, 1994, 5(3): 342-353.
[17]金菊良, 杨晓华, 丁 晶.基于实数编码的加速遗传算法[J].四川大学学报: 工程科学版, 2000, 32(4): 20-24.JIN Ju-liang, YANG Xiao-hua, DING Jing.Real coding based acceleration genetic algorithm[J].Journal of Sichuan University:Engineering Science Edition, 2000, 32(4): 20-24.
[18]杨春梅, 万柏坤, 丁北生.数据预处理和初始化方法对k-均值聚类的影响[J].仪器仪表学报, 2003, 24(s1): 189-192.YANG Chun-mei, WAN Bai-kun, DING Bei-sheng.Effects of data processing and initialization on k-means clustering[J].Chinese Journal of Scientific Instrument, 2003, 24(s1): 189-192.
[19]廖洪富, 李敬敏, 姚 进, 欧方平.基于多层动态索引的相似炉型检索方法研究[J].四川大学学报: 工程科学版, 2010,42(4): 225-229.LIAO Hong-fu, LI Jing-min, YAO Jin, OU Fang-ping.Research on the retrieval method of similar blast furnace profile based on multilayer dynamic index[J].Journal of Sichuan University:Engineering Science Edition, 2010, 42(4): 225-229.
[20]喻寿益, 王吉林, 彭晓波.基于神经网络的铜闪速熔炼过程工艺参数预测模型[J].中南大学学报: 自然科学版, 2007,38(3): 523-527.YU Shou-yi, WANG Ji-lin, PENG Xiao-bo.Prediction model of craft parameters based on neural network during the process of copper flash smelting[J].Journal of Central South University:Science and Technology, 2007, 38(3): 523-527.