APP下载

激光诱导击穿光谱定量化标定谱线自动选择方法

2016-07-12孔海洋孙兰香胡静涛

光谱学与光谱分析 2016年5期
关键词:低合金钢谱线内标

孔海洋,孙兰香,胡静涛,张 鹏

1.中国科学院沈阳自动化研究所,辽宁 沈阳 110016 2.中国科学院大学,北京 100049 3.中国科学院网络化控制系统重点实验室,辽宁 沈阳 110016

激光诱导击穿光谱定量化标定谱线自动选择方法

孔海洋1, 2, 3,孙兰香1, 3*,胡静涛1, 3,张 鹏1, 2, 3

1.中国科学院沈阳自动化研究所,辽宁 沈阳 110016 2.中国科学院大学,北京 100049 3.中国科学院网络化控制系统重点实验室,辽宁 沈阳 110016

选择合适的特征谱线是以内标法对激光诱导击穿光谱进行定量化分析的前提,需要科研工作者精心分析和比较,往往耗费大量精力和时间,而且还不能保证结果最优。基于遗传算法为内标法提出了一种从原始光谱中自动选择分析线和参考线的方法,使用该方法从低合金钢样的LIBS光谱中为锰(Mn)、镍(Ni)、铬(Cr)、硅(Si)和铁(Fe)元素分别选择了用于内标法定量分析的分析线和参考线。优选得到的最优谱线为,Mn的分析线和相应的参考元素Fe的参考线分别是403.306 8和368.745 7 nm,Si的分析线和相应的参考元素Fe的参考线分别是288.157 7和427.176 1 nm,Cr的分析线和相应的参考元素Fe的参考线分别是286.510 0和272.753 9 nm,Ni的分析线和相应的参考元素Fe的参考线分别是352.453 6和358.698 5 nm。最后基于优选得到的谱线以内标法对这些元素分别进行了定量分析,结果证明,使用这种谱线选择方法能够自动从原始光谱中找到最优特征谱线,使内标法定量分析得到最好的结果。

激光诱导击穿光谱; 遗传算法; 谱线选择; 定量分析; 内标法; 合金钢

引 言

作为一种能够对物质进行实时、在线以及无损检测分析的原子发射光谱分析技术,激光诱导击穿光谱(laser-induced breakdown spectroscopy,LIBS)受到了广泛的关注。尤其是进入21世纪以来,激光诱导击穿光谱的分析研究逐渐从对适用领域进行探索的粗放型研究转移到了开发高精度和高准确度的定性定量分析方法的集约型研究上来。越来越多的化学计量学方法被引入到激光诱导击穿光谱的研究中,这些方法包括适用于定性分析的聚类分析[1-2]、人工神经网络[3-5]和支持向量机[6-7]方法,以及适用于定量分析的定标分析[8]、内标分析[9-10]、无标分析[11-12]和人工神经网络[13-15]、偏最小二乘法[16]等等。各国科研人员先后开发出了许多用于提升激光诱导击穿光谱分析精确度和准确度的专用方法,并取得了不错的结果,为激光诱导击穿光谱的广泛应用提供了可能。

无论是定性还是定量分析,选择合适的特征谱线是确保获得最优分析结果的前提。然而如何从数目庞杂的光谱数据中遴选出最适合分析的特征谱线,往往需要研究者具备丰富的先验知识,即使经过大量比较和尝试,也难以保证能选择出最优谱线。

国内外科研工作者针对这一问题进行了研究。Aydin等[18]提出了一种基于玻尔兹曼图(Boltzmann plot)从原始光谱中选择谱线的方法,首先预选一些未被干扰或没有交叉重叠的特征谱线,然后籍此绘制玻尔兹曼图,接着将玻尔兹曼图上与回归线具有最大偏差的特征谱线舍弃,如此迭代循环直到达到预设的决定系数的阈值,最终选出恰当的谱线。Choi等[19]测量了玻璃基体中的铀的同位素的比率,结果发现,综合考虑谱线强度、谱线宽度和谱线偏移而选择合适的特征谱线,同时对其他时间分辨参数进行优化,可以获得更好的结果。杜振辉等定义了相对强度比和波长偏差两个参数,设置了合理的阈值,剔除了自吸和干扰严重的谱线,籍此对特征谱线进行筛选,选出了高合金钢样品中主要元素铁、铬、镍、锰、铜的分析线。胡志裕等于2012年在本刊报道了基于LabVIEW开发了一款能够对LIBS谱线进行自动识别的软件,在一定程度上实现了寻找特征谱线的目的。

然而,这些方法即使无需从原始光谱中对特征谱线逐一遴选,但它们依旧需要科研工作者的先验知识,比如设置阈值、谱线预选等等。

为了从根本上解决从光谱中自动选择特征谱线的问题,基于非线性优化领域中相对成熟并已在其他光谱选择领域获得应用的遗传算法(genetic algorithm, GA),提出了一种全自动的光谱谱线选择方法,用来为内标分析法选择最优的分析谱线和参考谱线。

1 优化原理

1.1 谱线选择

谱线选择是指在对激光诱导击穿光谱进行分析之前,从光谱数据中选出用于分析的对应元素的特征谱线,通常被选出的谱线要跟其他元素的特征谱线不相邻、不重叠,尽量不受其他谱线的干扰,尽量避免谱线自吸收,具有较大的信噪比等。

由此,谱线选择需要综合考虑到特征谱线的谱线强度、干扰、以及背景信号强度,还要综合考虑每一条特征谱线所对应的跃迁概率、跃迁能级等等。一种元素在一定波长范围内的特征谱线通常很多,要想从中选择出合适的特征谱线,不仅耗费大量时间和精力,还提高了激光诱导击穿光谱的应用门槛。

1.2 遗传算法

模仿生物遗传进化过程而来的遗传算法作为一种随机优化方法,因其相比传统优化方法具有不易陷入局部极小值而通常能够得到全局最优值的良好特性,在随机优化中获得了广泛应用,被广大科研工作者用来优化各种参数。而其在光谱分析领域中,也获得了一定程度的应用,被光谱工作者用来优化实验设备的参数[20],优化选择波长和谱段[21-22]等,获得了不错的结果。

遗传算法的优化执行过程在MATLAB中使用英国Sheffield大学开发的GA工具箱(The Genetic Algorithm Toolbox for MATLAB)[23]完成。

为了使遗传算法优化过程中的种群达到解空间中最大程度上的遍历性[24],本研究中使用的遗传算法的各参数设置如下:

(1)每代100个个体(个体长度为N,由选出谱线的条数和每条谱线的可选范围决定);

(2)最大遗传代数为200代(具体执行中,为了节约时间,如果最优个体连续20代没有任何提升,则终止优化过程);

(3)编码使用Gray码(相比二进制编码更为可靠);

(4)交叉概率0.7,变异概率0.1,代沟为0.9。

众所周知,遗传算法在使用中的最大困难在于确定一个合适的适应度函数,如果适应度函数选择不当,所得结果将不能达到预期,遗传算法的优化就失去了意义。

我们构建一个适应度函数,该适应度函数将综合考虑激光诱导击穿光谱定量分析中的三个评价指标:

(1) 检测限

检测限(limit of detection,LOD)是衡量分析方法能够从样品中检测出的最低元素浓度的一个指标。通常用谱线附近背景信号的三倍标准差所等价对应的元素浓度值来表示。

(2) 决定系数

决定系数(coefficient of determination,R2)也叫拟合优度,是描述自变量对因变量的解释程度的一个指数。也可以用来反映观察点在回归线附近的密布程度。因此可以作为一个指标来评价内标法定量分析结果的好坏。

(3) 相对标准偏差

相对标准偏差(relative standard deviation,RSD)是指计算结果的标准偏差与算术平均值之间的比值,其在此处主要用来评价定量分析测试结果的精密度。

综合考虑以上三个指标,构建如式(1)所示的适应度函数,并将该适应度函数的最小值作为优化目标。

(1)

1.3 整体过程

基于以上分析,使用遗传算法从原始光谱中优化选择特征谱线并使用内标法建立定量分析模型的整体过程如下:

使用由遗传算法随机或优化得到的每个个体对应的谱线位置来从原始光谱中得到两个谱线强度值,分别是分析谱线和参考谱线的强度值。随后以这两个谱线强度值和对应的分析元素、参考元素的浓度建立内标法模型,求出该模型的决定系数R2、检测限LOD和相对标准偏差RSD,以此计算遗传算法的适应度函数来对其进行迭代优化,直到满足遗传算法设置的最大遗传进化代数或者连续20代迭代不再有任何进化。并以此时的最优个体所代表的谱线位置作为由遗传算法选出的最优谱线。

算法流程图如图1所示。

2 实验部分

2.1 样品

用以分析验证算法的样品是10块低合金钢钢样,虽然低合金钢中的元素种类很多,但我们主要分析研究其中Mn,Si,Ni,Cr元素的浓度,Fe元素用作参考元素,低合金钢样品各元素的浓度如表1所示。

图1 优化算法流程图

表1 实验中所用低合金钢样品元素浓度

为了客观真实地评价由算法自动选择的特征谱线的优劣,将10块钢样分成两类,如表1,其中1~4,6,7和9,10号共8块样品用来选择特征谱线训练模型,而5,8号2块样品则用来对使用选出的特征谱线构建的内标法定量分析模型进行验证。

2.2 仪器及参数

激光器使用美国BigSky公司的Nd∶YAG激光器,其最大能量为200 mJ,最大激发频率为10 Hz,实验采用的输出波长为1 064 nm,激光能量为55 mJ,激发频率为1 Hz。由激光器发出的脉冲激光通过焦距为75 mm的透镜聚焦到样品表面下1 mm深处激发产生等离子体。等离子体发出的光谱使用德国LLA公司的高分辨率中阶梯光栅光谱仪进行采集,光谱仪的门延时为3 μs,积分时间为5 μs,采集光谱范围为200~780 nm,其分辨率为0.02 nm(FWHM)。

样品置于三维手动可调的样品台上,通过手动控制调节选择不同样本点进行激发采样。从10块钢样中的每一块钢样的同一表面上选取6个点进行激发采样,每个点进行15次激发,前5次激发用来清除样品表面的杂质而予以舍弃,后10次激发所得到的光谱数据保存为10个对应的光谱文件用来进行后续处理。因此,10块钢样可以采集得到10×6×10共600个光谱数据。

2.3 数据集

为了使用遗传算法从原始光谱中优化选择合适的谱线并训练内标法定量分析模型,我们构建两个光谱数据集。

首先是训练集中1~4,6,7和9,10号共8块样品的10×6×8共480个光谱数据,用以通过遗传算法优化选择光谱谱线,并基于选择得到的谱线建立内标法定量分析模型。

其次是验证集中5,8号2块样品的10×6×2共120个光谱数据,用以对定量分析模型进行验证。

3 结果与讨论

图2是低合金钢样品的一个典型光谱。这个原始光谱数据包含57 144个光谱强度值,使用遗传算法的优化过程就是从这些强度值中选出两个分别对应于分析元素和参考元素的强度值。因此,这个包含所有可能个体的优化空间57 144n(其中n是待选择的变量个数)将非常巨大,从中选择最优个体不仅降低了遗传算法的效率,而且不利于优化选择出全局最优值[25]。所以,我们考虑缩小上面的优化空间,提高遗传算法优化效率。

图2 低合金钢钢样典型LIBS光谱

众所周知,从原始光谱数据中选择谱线就是选择对应元素的特征谱线。比如对于分析元素Mn,选择其特征谱线,就可以从美国国家标准技术研究院(National Institute of Standards and Technology,NIST)的原子光谱数据库(atomic spectra database,ASD)[17]的强线(strong lines)中选择对应于Mn元素的谱线; 同样地,选择其他元素的特征谱线,也就是从原子光谱数据库中选择对应于该元素的谱线。因为每一种元素在我们的光谱数据范围内(200~780 nm)的特征谱线的强线只有几十、上百条,所以我们将最初的优化空间大幅减小,提高了遗传算法的优化效率,也提高了优化结果的稳定性。

基于以上分析,使用Gray码对分析谱线和参考谱线两个参数进行编码,编码范围和编码长度都由对应元素在ADS强线中的特征谱线的条数来确定。比如选择分析元素Mn和参考元素Fe,ADS的强线中Mn,Fe各有126条和324条谱线,所以遗传算法个体分别包含有Mn和Fe的7位和9位Gray码,其长度N为16,是一个16位的Gray码。

使用此前描述的遗传算法的参数,以训练集进行迭代从原始光谱中寻优选择最佳分析谱线和参考谱线,最终选择得到的最优谱线如表2所示。

表2 由遗传算法优化得到的各元素最优特征谱线

使用这些由遗传算法自动选择得到的特征谱线,以内标法对10块低合金钢中的Mn,Si,Cr和Ni四种元素进行定量分析。所得分析结果如图3所示,并将结果列于表3。其中RMSE是低合金钢10块样品的定量分析结果的均方根误差(root mean square error),可以用来衡量分析结果的准确性。其计算公式如式(2)所示。

(2)

表3 由遗传算法优化得到的特征谱线定量分析钢样中Mn,Si,Cr和Ni的结果

Table 3 Quantitative results of steels using characteristic lines optimized by GA

由图表可以看到,使用这些由自动选择谱线方法选出的特征谱线对低合金钢中的四种典型成分进行定量分析,都能得到十分满意的结果:决定系数基本能达到0.99左右甚至更高,Si元素分析结果的决定系数最差,也在0.97以上; Si元素的检测限最差但仍在500 ppm左右; 相对标准偏差RSD普遍能在10%以内。所有这些对内标法而言已经是相当不错的结果,由此证明,使用自动方法选择出的分析线和参考线进行定量分析结果很好,而基于遗传算法的自动选择谱线方法十分有效。

图3 使用遗传算法优化得到的特征谱线定量分析低合金钢中的(a) Mn,(b) Si, (c) Cr 和 (d) Ni的结果

四种元素中Si元素的分析结果最差,从表2所列出的由遗传算法优选得到的Si元素的分析线和参考线可以看到,这两条谱线相距甚远,使得参考线在一定程度上失去了参考意义,所以得到了相对稍差的结果。

此外,为了更好地评价这种自动选择谱线的方法和由此选出的特征谱线,我们以Ni元素为例从文献中找到一些研究者手动遴选的特征谱线来对比分析结果。表4是一些研究者在研究中选择的Ni元素的特征谱线。

表4 一些研究者手动选择的Ni元素的特征谱线

其中,Gupta等仔细筛选的谱线与本文自动选出的谱线相同,结果类似。而Zaytsev等和孙兰香等手动选择的谱线则与我们的结果不同,我们对比了基于这些谱线的分析结果,结果如图4所示,详细的对比结果列于表5中。

表5 分别使用孙兰香、Zaytsev手动选择和本方法自动选择的Ni元素谱线定量分析结果对比

Table 5 Comparative results of quantitative analysis using characteristic lines selected by Sun, Zaytsev and our automatic method

SourcesR2LOD/ppmRSD/%RMSE/%Sunetal.0.980575.63310.230.219Zaytsevetal.0.9711943.03916.790.231Ourmethod0.989434.9096.950.177

对比结果可以看到,使用基于遗传算法自动选择的Ni元素的特征谱线得到的定量分析结果在各方面都优于Zaytsev等和孙兰香等手动选择的谱线所得到的结果。这再一次证明了本方法在自动选择特征谱线上的有效性和实用性。

图4 分别使用(a) 孙兰香、(b) Zaytsev和(c) 本方法自动选择的Ni元素特征谱线定量分析时结果对比

以上是以自动选出的RSD最小的Ni元素的谱线与其他研究者手动选择的谱线进行对比所得结果,此外,我们还使用R2和RSD都较差的Si元素的谱线与研究者手动选择的谱线进行了对比,结果证明,使用自动选择的谱线进行定量分析仍能获得最好的结果。

本文在优化过程中所使用的如式(1)所示的适应度函数综合考虑了R2、LOD和RSD三个指标,而在实际应用中,可以根据不同应用的具体要求,对适应度函数进行灵活修改。如果某些定量分析对检测限LOD不作要求,则可以将式(1)中的LOD项去掉; 如果某些定量分析对定量结果的RMSE还有要求,则可以在式(1)中再加上一项RMSE,等等。

4 结 论

基于遗传算法给出了一种从激光诱导击穿光谱的原始光谱中自动选择光谱特征谱线用于内标法定量分析的方法。以10块低合金钢样品为例对方法进行了验证,使用该方法自动选择了低合金钢中Mn,Si,Cr,Ni等分析元素和参考元素Fe的特征谱线,将其用于内标法定量分析获得了很好的结果。此外,我们还将本文自动选择的Ni元素的谱线与一些研究者手动选择的谱线进行了对比,说明可以获得比他们精心选择的谱线更好的结果。

[1] Lasheras R J, Bello-Galvez C, Rodriguez-Celis E M, et al.Journal of Hazardous Materials, 2011, 192(2): 704.

[2] Multari R A, Cremers D A, Scott T, et al.Journal of Agricultural and Food Chemistry, 2013, 61(10): 2348.

[3] Sirven J B, Bousquet B, Canioni L, et al.Analytical and Bioanalytical Chemistry, 2006, 385(2): 256.

[4] Vitkova G, Novotny K, Prokes L, et al.Spectrochimica Acta Part B-Atomic Spectroscopy, 2012, 73: 1.

[5] Wang Q Q, Liu K, Zhao H.Chinese Physics Letters, 2012, 29(4): 044206.

[6] Cisewski J, Snyder E, Hannig J, et al.Journal of Chemometrics, 2012, 26(5): 143.

[7] Liang L, Zhang T, Wang K, et al.Applied Optics, 2014, 53(4): 544.

[8] CHEN Kai, LU Ji-dong(陈 凯,陆继东).High Power Laser and Particle Beams(强激光与粒子束), 2011, 2: 005.

[9] Martelli M R, Brygo F, Sadoudi A, et al.Journal of Agricultural and Food Chemistry, 2010, 58(12): 7126.

[10] Stipe C B, Hensley B D, Boersema J L, et al.Applied Spectroscopy, 2010, 64(2): 154.

[11] Sun L, Yu H.Talanta, 2009, 79(2): 388.

[12] Tognoni E, Cristoforetti G, Legnaioli S, et al.Spectrochimica Acta Part B: Atomic Spectroscopy, 2010, 65(1): 1.

[13] SUN Lan-xiang, YU Hai-bin, CONG Zhi-bo, et al(孙兰香,于海斌,丛智博,等).Acta Optica Sinica(光学学报), 2010, 30(9): 2757.

[14] D’Andrea E, Pagnotta S, Grifoni E, et al.Spectrochimica Acta Part B: Atomic Spectroscopy, 2014, 99: 52.

[15] ZHANG Dong-bo, HUANG Kun-xin(张东波,黄坤鑫).Information and Control(信息与控制), 2013, 42(5): 583.

[16] Yuan T B, Wang Z, Lui S L, et al.Journal of Analytical Atomic Spectrometry, 2013, 28(7): 1045.

[17] Ralchenko Y, Kramida A, and Reader J.National Institute of Standards and Technology, Gaithersburg, MD, 2010,

[18] Aydin , Roth P, Gehlen C D, et al.Spectrochimica Acta Part B: Atomic Spectroscopy, 2008, 63(10): 1060.

[19] Choi I, Chan G C Y, Mao X, et al.Applied Spectroscopy, 2013, 67(11): 1275.

[20] Nunes L C, da Silva G A, Trevizan L C, et al.Spectrochimica Acta Part B: Atomic Spectroscopy, 2009, 64(6): 565.

[21] Leardi R.Journal of Chemometrics, 2001, 15(7): 559.

[22] Niazi A, Leardi R.Journal of Chemometrics, 2012, 26(6): 345.

[23] Chipperfield A, Fleming P, Pohlheim H, et al.The Genetic Algorithm Toolbox.Dept of Control and Systems Engineering of the University of Sheffield, UK, 1994.

[24] Leardi R.Nature-Inspired Methods in Chemometrics.Elsevier Science, 2003.172.

[25] Zhang Y A, Ma Q L, Sakamoto M, et al.Artificial Life and Robotics, 2010, 15(2): 239.

[26] SUN Lan, YU Hai-bin, XIN Yong, et al(孙兰香,于海斌,辛 勇,等).Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2010, 30(12): 3186.

[27] Zaytsev S M, Popov A M, Chernykh E V, et al.Journal of Analytical Atomic Spectrometry, 2014, 29(8): 1417.

[28] Gupta G P, Suri B M, Verma A, et al.Journal of Alloys and Compounds, 2011, 509(9): 3740.

Automatic Method for Selecting Characteristic Lines Based on Genetic

(Received Jan.17, 2015; accepted Apr.27, 2015)

*Corresponding author

Algorithm to Quantify Laser-Induced Breakdown Spectroscopy

KONG Hai-yang1, 2, 3,SUN Lan-xiang1, 3*,HU Jing-tao1, 3,ZHANG Peng1, 2, 3

1.Shenyang Institute of Automation, Chinese Academy of Sciences, Shenyang 110016, 2.University of Chinese Academy of Sciences, Beijing 100049, 3.Key Laboratory of Networked Control System, Chinese Academy of Sciences, Shenyang 110016, China

Selecting proper characteristic lines from enormous spectral intensities is crucially important to implement quantitative analysis of Laser-Induced Breakdown Spectroscopy using internal standard method.Manual selecting of characteristic lines by researchers is time consuming and energy consuming, which cannot guarantee the best result.An automatic method to select analytical and reference lines for internal standard method from the original spectra based on Genetic Algorithm was proposed in this paper.This method was utilized to select analytical and reference lines for internal standard methods from LIBS of Mn, Ni, Cr, Si and Fe of low alloy steels.The optimal characteristic lines optimized by this method were the analytical line 403.306 8 nm of Mn and the corresponding reference line 368.745 7 nm of Fe, the analytical line 288.157 7 nm of Si and the corresponding reference line 427.176 1 nm of Fe, the analytical line 286.510 0 nm of Cr and the corresponding reference line 272.753 9 nm of Fe and the analytical line 352.453 6 nm of Ni and the corresponding reference line 358.698 5 nm of Fe, respectively.Then these elements were quantified by the internal standard method using these selected lines.The results showed that this proposed method for selecting characteristic lines can automatically select the optimal analytical and reference lines and could guarantee the best quantitative result obtained by internal standard method.

LIBS; Genetic algorithm; Wavelength selection; Quantitative analysis; Internal standard method; Alloy steels

2015-01-17,

2015-04-27

国家(863计划)项目(2012AA040608),国家自然科学基金项目(61473279),中国科学院科研装备研制项目(YZ201247)资助

孔海洋,1983年生,中国科学院沈阳自动化研究所博士研究生 e-mail: kongsea@gmail.com *通讯联系人 e-mail:sunlanxiang@sia.cn

O433.4

A

10.3964/j.issn.1000-0593(2016)05-1451-07

猜你喜欢

低合金钢谱线内标
含Si低合金钢高温加热锈层的变形剥离机理
不同浓度的缓蚀剂对水轮机常用低合金钢的腐蚀防护研究
依据不同波段光谱诊断闪电回击通道温度*
气相色谱内标法测洗涤剂中的甲醇
GC内标法同时测定青刺果油中4种脂肪酸
铁基合金中锰元素的快速分析研究
锶原子光钟钟跃迁谱线探测中的程序控制
核磁共振磷谱内标法测定磷脂酰胆碱的含量
P265GH低合金钢在模拟污染大气环境中的腐蚀行为
基于康普顿散射本底扣除的航空γ能谱测量谱线比大气氡校正方法