基于神经网络的LF炉钢液温度的预测模型
2022-03-29张家磊魏志君汪亚伟
张家磊,魏志君,汪亚伟
(江苏永钢集团有限公司,江苏 苏州 215628)
引 言
随着炉外精炼技术的发展,初炼炉、精炼炉、连铸的炼钢[1-4]工艺流程已经非常成熟。精炼炉在整个炼钢过程中衔接着上下道工序,更是对钢质量有着至关重要的影响。目前,在我国优钢特钢企业中,LF炉[5-8]的主要功能包括白渣精炼、成分微调、埋弧加热、还原气体杂质等作用,而在这其中温度控制更是尤为重要,其中LF炉钢液的终点温度更是影响到后续连铸工序的进行,与钢的质量关系尤为密切。目前,永钢集团特钢公司为了控制精炼炉终点温度,采用人工多次测温,以达到控制精炼炉终点温度的效果,但是采用人工经验控制存在控制不精准及随机性等问题。随着目前计算机技术的飞速发展,有大量的预测模型能够对精炼炉终点温度进行预测,相较于传统的人工测温,使用先进的模型算法能够省去相应的人工成本,且测量精度较高,利于高质量钢的生产。
本文结合实际工艺和目前研究的实际条件决定采用神经网络模型对LF炉终点温度进行预测。基本思想是在对以往的生产数据进行分析并结合炼钢的实际工艺,确定模型的各种参数,从而确定LF炉终点温度预测模型。
1 神经网络
神经网络[9-12]能学习和存贮大量的输入—输出模式映射关系,而无需事前知道这种映射关系的数学方程,通过训练多个神经网络并将其结论进行合成,可以显著地提高学习系统的泛化能力。它不仅有助于学者对机器学习和神经计算进行深入的研究,还能帮助工程技术人员利用神经网络这项先进的技术来分析现实世界中的各种问题,加速问题的解决。
神经元是神经网络的基本单元,神经元先获得输入再进行某些数学运算后,再产生一个输出,如图1所示的2个输入神经元的例子。
在这个神经元中输入一共经过了三步数学运算,首先输入变量x1和x2乘以各自的权重w1和w2,然后加上偏置变量b,最后经过激活函数σ处理得到输出:y=σ[(x1·w1)+(x2·w2)+b]。
图2所示的为一个最简单的三层的前馈神经网络,拓扑结构包括输入层、隐含层和输出层,样本的输入送至网络输入层的各个神经元,各个输入乘以各自的权重经过激活函数处理后得到了隐藏层的输出,隐含层的输出作为下一层的输入,然后再乘以相应的权重后再经过隐藏层与输出层的激活函数处理后,输出层各个神经元输出对应的预测值y。
2 模型准备阶段
2.1 数据采集
结合精炼的工艺和与现场技术人员的沟通,在LF精炼过程中影响钢液温度的主要因素有:钢包上线温度、钢液进站温度、钢液出站温度、冶炼时间、耗电量、耗氩量和钢液重量,且这些因素对不同钢种的LF炉钢液终点温度影响程度不同,现采用生产量较大的42CrMo4钢种作为研究对象。了解到2021年度LF炉在精炼过程中的操作规范和较往年有较大提升,遂采用2021年1月1日至2021年8月17日的LF生产数据作为数据集,总计收集到了1473组包含LF炉进站钢水温度、总用电量、氩气总耗量、处理周期、白渣保持时间、钢包上线温度、最终钢水重量、初始钢水重量、LF炉终点温度这九类变量关于42CrMo4的数据。
2.2 数据的预处理
在数据挖掘中,海量的原始数据存在着大量不完整、不一致、有异常的数据,严重影响到了数据挖掘建模的执行效率,甚至可能影响到数据挖掘的偏差,所以为了提高数据的质量,必须对数据的异常值进行处理,本文采用3σ法对异常值进行查找与剔除,若样本数据X={x1,x2,···,xn}的偏差大于 3σ,即认为这组数据异常,将其剔除。其中:
利用3σ法则对收集到的1473组42CrMo4数据集进行异常数据的剔除,剔除后数据集还剩1079组。
2.3 相关性分析
相关性分析[12]主要判断两个或多个变量之间的统计学关联,如果存在关联则进一步分析关联强度和方向。为了度量变量之间的相关性,本文利用皮尔逊系数对关联程度进行评价,计算公式如下所示:
皮尔逊系数的绝对值介于0~1之间,它的绝对值越大,表示两者的相关性越强。
对影响精炼炉终点温度的几个因素利用皮尔逊系数做了相关性分析,分析结果表1所示,从表中可以看出最终钢水重量、初始钢水重量与精炼炉终点温度的相关系数的绝对值过小,所以把这个两个因素剔除,以处理开始时钢水温度、总用电量、氩气总耗量、处理周期、白渣保持时间、钢包上线温度这6个因素作为神经网络的输入。其中处理开始时钢水温度、总用电量、处理周期、白渣保持时间、钢包上线温度与精炼炉终点温度呈正相关关系,而氩气总耗量与精炼炉终点温度呈负相关关系。
表1 相关性分析
3 网络结构设计
3.1 输入输出层的设计
该模型由处理开始时钢水温度、总用电量、氩气总耗量、处理周期、白渣保持时间、钢包上线温度作为输入量,LF炉终点温度作为输出,所以输入层的节点数为6,输出层的节点数为1。
3.2 隐层设计
有关研究表明,包含一个隐含层的神经网络只要隐节点足够多的情况下,就可以很好的逼近一个非线性函数。因此,本文采用含有一个隐层、三层多输入单输出的前馈神经网络来预测LF炉终点温度。在网络设计过程中,隐层神经元数的确定十分重要。隐层节点数过少时,学习的容量有限,不足以存储训练样本中蕴涵的所有规律;隐层节点过多不仅会增加网络训练时间,而且会将样本中非规律性的内容如干扰和噪声存储进去,反而降低泛化能力。目前,对于隐层中神经元数目的确定并没有明确的公式,只有一些经验公式,神经元个数的最终确定还是需要根据经验和多次实验来确定。本文在选取隐层神经元个数的问题上参照了如下经验公式:式中n为输入层神经元个数,m为输出层神经元个数,a为[1,10]之间的常数。根据式(3)
可以计算出神经元个数为3~12个之间,在本次实验中选择隐层神经元个数为10。
4 实验结果分析
本文在数据预处理后,将其中70%作为训练集,15%作为验证集,15%作为测试集。本实验在Matlab中完成,实验环境为Windows 10操作系统,内存空间8 GB,其处理器为英特尔 Core i7-7700 HQ。神经网络的相关参数设置如图3所示。
模型预估值与生成实际值的误差直方图如图4所示,可以看出大多数的数据的预测值与实际值的误差在±8oC之内,误差波动较小,且误差在±5oC的命中率在80%以上,误差在±2oC大概在50%左右,模型预测效果良好。在后续跟踪的500炉生产数据显示,温度命中误差如表2所示。
表2 500炉温度误差炉数统计
5 结束语
针对江苏永钢集团特钢公司在LF炉终点温度控制方面提出了一种基于神经网络的LF炉终点温度预测模型,利用处理开始时钢水温度、总用电量、氩气总耗量、处理周期、白渣保持时间、钢包上线温度作为输入量,预测LF炉终点温度。与实际生产数据相对比,预测值与实际值的误差波动较小,误差在±5oC的命中率达到了80%以上,神经网络模型能很好的预测LF炉终点温度。