基于BP神经网络的镀锡板合金层厚度预测及应用
2021-04-22张栓杨凡
张 栓 杨 凡
(武钢日铁(武汉)镀锡板有限公司 湖北武汉 430083)
镀锡板是两面镀有商业纯锡的冷轧低碳薄钢板或钢带[1]。它具有良好的耐蚀性、焊接性,广泛应用于食品饮料包装、电子零部件制造、化工器皿制造等。镀锡板是将退火后的带钢经碱洗、酸洗、电镀、软熔、后处理等工序后而得到的钢铁产品。镀锡板的合金层形成于软熔工序:金属锡在电镀工序中被电镀到钢板表面,随后在软熔工序中被加热至其熔点232℃以上,并与钢板中的铁形成一种金属间化合物,即锡铁合金。这个锡铁合金通常被称为合金层。相关研究表明,镀锡板合金层直接影响着镀锡板的耐蚀性[2-4]、抗划伤性[5]、焊接性[6]等关键性能。因此,合金层对镀锡板有着举足轻重的作用,研究和预测镀锡板合金层厚度具有重要的意义。
人工神经网络是处理复杂非线性问题的一种有效方法,能够建立输入和未被发现的过程条件下输出数据之间的关系[7-9]。人工神经网络可具有泛化能力,即神经网络对已知的信息进行学习后掌握其中规律,从而对新的信息做出正确的预测。BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的人工神经网络[10]。本文采用BP人工神经网络对合金层厚度进行了预测,并编写了预测软件用于指导实际生产。
一、神经网络
(一)构建神经网络
构建神经网络的主要内容为选用神经网络模型层数、各层(输入层、隐藏层、输出层)的节点数及选定激活函数等。
笔者结合合金熔体热力学理论及对大量基础数据进行相关性分析后,确定了镀锡量、感应线圈高度、软熔温度、工艺速度4个主要因素对镀锡板合金层厚度有重要影响。故输入层节点数为4,输出层节点数为1(即合金层厚度)。
理论上已经证明,3层BP神经网络可以以任意精度逼近任意连续函数,当学习不连续函数(如锯齿形的)时则需4层神经网络[11]。而面对复杂问题时,3层网络的隐含层节点数过多后,会影响计算效率和精度,此时需要增加层数以减少各层节点数。一般来说,BP神经网络的预测精度会随层数的增加而有所提高,但层数增加后会导致其结构复杂化,并且会影响神经网络训练效率、降低泛化(预测)能力。故本文将选择3层、4层神经网络模型分别进行试算,相应的模型分别为4-20-1、4-50-1、4-12-6-1、4-16-7-1,分别使用Tanh、Sigmoid作为激活函数,均方误差作为损失函数,最大训练轮次Epoch=1000。
(二)训练神经网络
为了获得的准确的数据、并提供精确的预测值来指导生产,笔者直接从某镀锡板厂现场生产工艺参数监控系统中收集了670组工艺参数,并收集了对应的合金层厚度检验结果。这些数据将用于构建神经网络。神经网络性能的好坏主要看其是否具有很好的泛化能力,对泛化能力的测试不能用训练集的数据进行,而要用训练集以外的数据来进行检验。因此,在670组数据中,本文随机选取了30%的数据作为测试集来验证训练模型的性能的好坏,剩下70%作为训练集参与模型训练。
一般而言,同一网络模型随着训练的进行,训练集的均方误差会呈现越来越小的趋势,但测试集均方误差的趋势会先下降后上升,即泛化能力先变好后变差,也就是通常所说的欠拟合和过拟合。为了获得较好的泛化能力,训练时将训练与测试交替进行。即:每轮次用训练集训练并更新网络权重后,记录训练均方误差,随后保持网络权重不变用测试集运行网络,记录测试均方误差。当测试均方误差开始上升或已训练轮次达到最大训练轮次后,停止训练,保存当前网络权重。
(三)神经网络训练结果
经过上述训练,各模型训练结果见表1:
表1 各模型训练结果
由表1可见:
Tanh激活函数较Sigmoid收敛快,仅需24轮次左右即可,这与一般经验相一致。但快速收敛带来的不利影响是其对应的测试均方误差和训练均方误差均较大。
Tanh激活函数在不同模型结构下的测试均方误差之间、训练均方误差之间差别均稍大。而Sigmoid激活函数在不同模型结构下测试均方误差之间和训练均方误差之间相差不大。
模型7(激活函数为Sigmoid、模型结构为4-12-6-1)的测试均方误差最小,为0.04638。该镀锡板厂合金层厚度控制范围为目标值±0.3,因此理论上该模型是可以指导实际生产的,是有效的。
为了检测该神经网络的泛化能力、独立数据的预测能力,笔者将测试集里模型7的预测值与实际值之间的关系作图如图1。由图1可见,模型7的预测值与实际值吻合度很高。这也再次证明该模型能很好地预测结果,泛化能力很强,模型有效。
图1 预测值与实际值对比
二、编写合金层厚度预测软件
随后,笔者使用模型7(激活函数为Sigmoid、模型结构为4-12-6-1)和该模型训练后的网络权重编写了合金层厚度预测软件,并将该软件用于指导现场生产人员控制合金层厚度。软件截图见图2。
据统计,使用该软件前合金层厚度不合格量为23.3卷/月,使用5个月期间为3.2卷/月,且因该软件预测不准导致的不合格量为0。由此可见,该神经网络模型确实是有效的,该软件有很高的实际应用价值。
图2 合金层厚度预测软件截图
三、结论
(一)本文收集了670组实验数据,将镀锡量、感应线圈高度、软熔温度、工艺速度作为输入参数,将合金层厚度作为输出参数,构建了由2种激活函数×4种模型结构组成的8个人工神经网络。
(二)本文随机选取了30%的数据作为测试集,其余的作为训练集参与模型训练。训练结果表明,Tanh激活函数较Sigmoid收敛快但均方误差较大。
(三)激活函数为Sigmoid、模型结构为4-12-6-1的神经网络测试均方误差最小,为0.04638,远低于控制精度要求0.3。该模型可以指导实际生产。另外,该模型预测值与实际值的吻合度很高,泛化能力较强,模型有效。
(四)根据神经网络的结构和训练结果,笔者编写了合金层厚度预测软件用来指导生产,经过5个月的实践检验,证明了该神经网络模型是有效的。该软件有很高的实际应用价值。