双脉冲激光诱导光谱结合多变量GA-BP-ANN检测合金钢中C元素
2022-01-12于凤萍林京君林晓梅
于凤萍,林京君*,林晓梅,3*,李 磊,2*
1.长春工业大学电气与电子工程学院,吉林 长春 130012 2.长春工业大学材料科学高等研究院,吉林 长春 130012 3.吉林建筑科技学院电气信息工程学院,吉林 长春 130012
引 言
碳元素(C)的含量决定了合金钢的韧性、塑性、强度等力学性能,在冶炼中点和终点及时获取钢材中C元素含量值可提高生产合金钢的质量及冶炼效率,同时可降低整个冶炼过程中生产耗能。激光诱导击穿光谱(LIBS)技术检测方法具有检测速度快、能够同时检测多种元素等优点,在冶金领域已被证实存在十分广阔的应用前景[1-3]。
基于双脉冲激光诱导击穿光谱(DP-LIBS)技术从技术层面上提升了LIBS在合金钢检测过程中等离子体羽大小、目标元素谱线强度及检测灵敏度等方面的性能,加速了LIBS技术在冶金分析领域推广应用[4]。为能在算法层面上进一步提高LIBS定量分析精度,降低基体效应影响,目前研究人员将多种方法引入无标法、内标法等分析方法中。目前常见的方法有支持向量机法[5]、偏最小二乘法[6]和随机森林法[7]等。与传统分析方法相比,这些数据处理算法能够在一定程度上改进分析结果的精度,但因合金钢成分组成复杂,基体效应影响等因素的存在[8],简单的数据处理算法很难满足冶金领域的实际需求。人工神经网络(ANN)作为具有强鲁棒性和容错性,强自学能力和联想存储功能的学习算法,在LIBS分析中广受关注,Tang[9]等使用LIBS结合无监督自组织神经网络对工业聚合物进行分类;Moncayo[10]等采用LIBS结合BP神经网络对牛奶中的元素进行定性及定量分析,进而判别掺假的牛奶,上述研究中,神经网络均表现出较好的效果。在LIBS用于定量分析合金材料成分方面,神经网络也表现出独特的优势,潘立剑[11]等通过主成分对LIBS光谱数据降维处理后输入径向基神经网络中,对铝合金中5种元素建立了多元定标模型,证明主成分结合神经网络可减小参数波动,提高定量分析精度。Li[12]等使用遗传算法(GA)结合人工神经网络,定量分析钢铁中的Cu和V元素,与传统内标法相比预测样本的均方根误差减小78.9%和80.6%,相对标准偏差减小39.2%和36.9%;马翠红[13]等在钢水LIBS采集分析系统中加入径向基人工神经网络,用来提高钢液的测量精确度,优化定量分析模型。基于ANN的LIBS检测合金钢成分可改进定量分析结果的精确性和准确性,增强结果的稳定性,加快推进其在实际生产中的应用。然而,目前将DP-LIBS与ANN结合定量分析合金钢中非金属元素,尤其是C元素的研究还相对较少。
合金钢的LIBS光谱复杂,C元素定量分析不仅取决于自身光谱强度,还受其他相应的元素影响,为能进一步提高DP-LIBS对合金钢中C元素定量分析的精确性,本文采用DP-LIBS结合反向传播人工神经网络(BP-ANN)以样品内含量丰富的Fe元素作为内标元素,通过GA优化选择C,Cr,Mn和Si四种元素与内标元素的光谱强度比作为BP-ANN网络的输入影响变量,以提供更多的光谱信息,建立多变量GA-BP-ANN定标法,定量分析合金钢中的非金属C元素。
1 实验部分
1.1 装置
实验装置如图1所示,本次采用了双脉冲的Nd∶YAG激光器来(Beamtech,Vlite-200,China)作为发射光源,其脉冲的频率为10 Hz,脉冲的宽度为8 ns,输出的波长为1 064nm,先后发射A与B两束激光脉冲,脉冲经过反射镜反射后,由350 mm焦距的聚焦透镜聚焦,聚焦后的光束垂直作用在待检测样品的表面,经烧蚀后形成等离子体。合金钢样品产生的等离子体发射光谱用光纤探头收集,通过光纤传输到配备ICCD探测器的光纤光谱仪(Avantes,Avaspec-2048-USB2-PURGE,Holland)进行采集并传输到电脑端进行分析处理。本次光谱仪所采集波长的范围是186~310 nm,其最小的积分时间是1.05 ms,固有的延迟时间是1.28 μs,分辨率是0.1 nm。图中BNC575是数字延迟脉冲发生器,其被用来控制激光脉冲A与B之间的间隔,以及光谱仪采集信息的延迟时间,设置激光脉冲A和B之间的时间间隔为1 250 ns,光谱仪的采集延迟时间设置为500 ns,实验过程中样品均处于纯氩气环境中。
图1 实验装置示意图Fig.1 Schematic diagram of the experimental setup
1.2 样品
实验样品由十个合金钢标样组成,其中C元素参考含量信息如表1所示,本文将其值称作真实含量值。避免因样品的非均匀和脉冲的波动对光谱收集产生影响,每个样品分别取30个位置进行LIBS采集,每个位置激发30个激光脉冲,前10个脉冲用于清理样品表面氧化层,后20个激光脉冲平均为一个光谱数据。
表1 样品中C元素和Fe元素参考含量(%)Table 1 Reference concentration (%)of element C and Fe in the samples
2 结果与讨论
本次采用留一法来比较不同定标方法预测C元素含量的值,每次留取一个样品作为未知样品进行预测,其余样品作为定标样品使用。
2.1 定标曲线法
在使用LIBS检测合金钢中C元素时可用于分析的光谱数量有限,C Ⅰ 193.09 nm和C Ⅰ 247.86 nm处的谱线常作为C元素的分析谱线。为定量分析C元素含量,选择特征分析谱线的强度应能反映其含量变化,因此本次仅选取C Ⅰ 193.09 nm作为目标分析谱线。在合金钢中C元素属于微量非金属元素,易受干扰,导致C元素的含量与其光谱强度之间线性关系较弱,如图2(a)所示,其R2=0.893 4。由于Fe元素是合金钢中含量最丰富的元素,其含量变化相对较小,通常将其作为内标元素。选择内标谱线需综合考虑,如干扰小、不重叠,跃迁概率和跃迁能级与分析谱线相近,拟合优度较高等因素,本次选择Fe 200.04 nm处的离子谱线作为C 193.09 nm的内标参考谱线。用C 193.09 nm/Fe 200.04 nm的谱线强度比作为C元素的相对光谱强度,C元素的相对光谱强度与其含量值的线性关系明显提高,如图2(b)所示其R2=0.982 3。
从图2可知,与相对强度法相比内标法能够一定程度上改进定量分析结果,表2为内标法预测未知样品C元素含量值的相对误差(RE)。合金钢中C元素受基体效应影响严重,使用内标曲线法分析时仍存在较大相对误差。
表2 内标法预测C元素含量的相对误差(RE%)Table 2 The relative error (RE%)of internal calibration in predicted content of element C
图2 (a)C元素含量(%)与其光谱强度拟合曲线图;(b)C元素含量(%)与C/Fe光谱强度比拟合曲线图Fig.2 (a)The fitting curve of C content (%)with its spectral line intensity (b)the fitting curve of C content (%)with C / Fe spectral lines intensity ratios
2.2 单变量BP-ANN定标法
为提高定量分析结果,将C 193.09 nm/Fe 200.04 nm的谱线强度比作为BP-ANN的输入变量,C元素的含量值作为输出变量,建立单变量BP-ANN定标法,定量分析合金钢样品中C元素的含量值。此时输入变量个数为1,设置隐含层个数为1,神经元个数为3,经对比本次选择“traingdx”函数作为训练函数,隐含层和输出层的传递函数分别选用“logsig”和“purelin”函数。由于神经网络模型的建立依赖于输入数据,训练样本有限,且LIBS检测方法本身重复性差,收集光谱易受外界干扰,导致BP-ANN获取LIBS有效的光谱信息受限,预测C元素含量的RE值如表3,此时定量分析的精度有待于提高。
表3 单变量BP-ANN定标法预测C元素含量的相对误差(RE%)Table 3 The relative error (RE%)of univariate BP-ANN calibration in predicted content of element C
2.3 多变量GA-BP-ANN定标法
合金钢中成分较为复杂,定量分析时不仅与自身光谱强度有关,还受实验条件及样品的组成成分的影响,多元素多谱线分析方法可提供更多的光谱信息,减小基体效应影响[14-16]。在LIBS检测合金钢中的C元素时受样品中共存元素,如基体Fe元素和共存的微量Mn和Cr等元素的影响,为提高C元素定量分析的准确性,利用神经网络的多元非线性拟合能力,将多元素的特征谱线信息作为BP-ANN输入变量,进行多元素修正,所选元素在样品中的含量均高于或与C元素含量相当。使用谱线强度比作为输入,可以减小谱线波动对定量分析产生的影响[17],且使用Fe元素对C元素进行内标时,C元素的含量与C/Fe的相对强度值之间具有更好的相关关系,因此Fe元素作为内标元素引入,即C/Fe,Cr/Fe,Mn/Fe和Si/Fe的谱线强度比值作为GA-BP-ANN的输入变量,目标C元素的含量值作为输出变量,建立多变量GA-BP-ANN定标方法。
选取特征分析谱线是LIBS进行定量分析的关键步骤,本次输入变量用GA中染色体上的基因表示,以BP-ANN定量分析结果为依据,通过进化调整基因组合,筛选出无关或作用较小的输入特征谱线,还可以为所选择的C,Cr,Mn和Si元素的特征谱线找到适合BP-ANN定标的内标Fe元素谱线,进而选择BP-ANN的最终输入变量,剔除无关或冗余光谱信息。参照NIST数据库选择特征谱线,本次最终使用的分析谱线在合金钢的LIBS光谱中分布如图3所示,元素C,Cr,Mn和Si共选取9条特征谱线,内标Fe元素选取了6条特征谱线。LIBS采集时,每保留一幅光谱可获得9×6共54个谱线比值,将光谱数据划分为训练集和测试集,构建训练集输入为9×30×54共14 580个光谱数据,测试集输入为1×30×54,共1 620个光谱数据,输出为对应的C元素含量值。
图3 合金钢DP-LIBS光谱图及选择的特征分析谱线Fig.3 The DP-LIBS spectrum of alloy steel and selected characteristic analysis spectrum lines
本次最大的遗传代数为120代,经试验对比,交叉、选择和变异概率的大小分别设置为0.6,0.9和0.1。将最后一代中适应度最高的个体所对应的谱线强度比作为BP-ANN输入,输出为C元素含量值。仍使用单个隐含层网络,网络的训练函数选用trainbr函数,此时隐含层的神经元个数设置为23,隐含层与输出层的传递函数与单变量BP-ANN定标法相同,仍然采用“logsig”和“purelin”函数。
多变量GA-BP-ANN定标法预测C元素含量的RE值如表4所示,与定标曲线法和单变量BP-ANN定标法相比预测结果的相对误差明显下降。图4为三种定标方法预测C元素含量值与真实含量值之间的关系图,从图中可以看出,样品1的预测效果较差,推测可能是因为合金钢中C元素含量较低,定量分析C元素时除了受样品内的其他元素影响外,还受仪器参数及外界条件等因素的干扰,且该样品在合金钢标样中C含量值最小,处于BP-ANN建模的边界,导致多变量GA-BP-ANN的方法不能有效的减小其基体效应影响,因此本次在比较预测结果时,没有考虑样品1。图4中数据点分布越接近于直线Y=X,决定系数R2值越接近于1,代表预测结果越理想。从图中可以看出,多变量GA-BP-ANN定标法与内标曲线法和单变量BP-ANN定标法相比,数据点分布更接近于直线Y=X,其R2值为0.989 3相比于0.967 4和0.974 4更接近于1。表5为内标法、单变量BP-ANN定标法和多变量GA-BP-ANN定标法预测C含量的平均相对误差(ARE)和平均相对标准偏差(ARSD),ARE分别对应为14.78%,14.75%和8.29%,ARSD分别对应12.385%,11.123%和8.818%,可以说明多变量GA-BP-ANN定标方法预测C元素含量值更接近于真实值,预测结果的精密度更高。
表4 多变量GA-BP-ANN定标法预测C元素含量的相对误差(RE%)Table 4 The relative error (RE%)of multivariable GA-BP-ANN calibration in predicted content of element C
图4 内标法、单变量BP-ANN定标法与多变量GA-BP-ANN定标法三种定标方法预测C元素含量值与标定C元素含量值之间的关系曲线Fig.4 The correlation curve between predicted content and certified content of element C by internal calibration,multivariable GA-BP-ANN of and univariate BP-ANN
表5 内标法、单变量BP-ANN定标和多变量GA-BP-ANN定标三种定标方法预测C元素含量结果的平均相对误差(ARE%)和平均相对标准偏差(ARDS%)Table 5 The average of relative error (ARE%)and relative standard deviation (ARSD%)by internal calibration,multivariable GA-BP-ANN of and univariate BP-ANN predicted content of element C
合金钢LIBS光谱谱线丰富,如果将所获得的谱线强度比全部作为自变量输入,增加了分析模型复杂程度,GA对谱线的强度比值集进行优化与降维,剔除不利于C元素定标分析的谱线信息,可提高训练效率,改进分析精度。但由于神经网络的建立依赖于输入数据,预测结果的精确度仍然取决于LIBS采集的光谱数据以及训练样本数量。总体分析,多变量GA-BP-ANN定标法,能够提高谱线选择效率,改善定量分析结果的准确性。
3 结 论
使用多变量GA-BP-ANN定标法用于定量分析合金钢中的非金属C元素,通过GA筛选引入合金钢中的多种共存元素,对C元素的定量分析进行多元素多谱线修正。与传统定标曲线法和单变量BP-ANN分析方法相比,预测结果的ARE由14.78%和14.75%减小到8.29%,决定系数R2由0.967 4和0.974 4提升到0.989 3。结果表明,多变量GA-BP-ANN定标法能够定量分析合金钢中的C元素,并且可以减小基体效应的影响,提高目标元素定量分析的精确性,推进DP-LIBS分析C含量在实际生产中的应用。