基于激光诱导击穿光谱和拉曼光谱对四唑类化合物的快速识别和分类实验研究
2019-09-02王宪双徐向君李昂泽何雅格刘瑞斌张纬经张同来
王宪双,郭 帅,徐向君,李昂泽,何雅格,郭 伟,刘瑞斌*,张纬经,张同来
(1.北京理工大学 物理学院,北京 100081;2.北京理工大学 爆炸科学与技术国家重点实验室,北京 100081)
1 引 言
四唑是能够稳定存在的一种重要的五元芳杂环,具有多氮富电子的平面结构特征,是高氮含能材料领域的天之骄子。四唑类化合物因其高密度、高生成焓、高气体生成量、分解产物多为环境友好型气体N2等优越的性质,在药物合成、炸药、推进剂等方面具有广泛的用途[1]。四唑类非金属含能离子化合物是近年来逐渐发展起来的一类新型不敏感含能材料,包括氨基四唑、偶氮四唑等。关于四唑类化合物的合成及应用[2-4]的研究工作比较活跃,但鲜有与其光谱表征和分类识别相关的研究。
光谱技术由于其检测速度快、非接触等优势在含能材料检测方面起着不可代替的作用。太赫兹(THz)光谱由于具有穿透性高和安全性高等优越的光电性质,常被用于探测隐藏炸药。THz波可以穿透塑料、纺织物等,可对含能材料进行分类和识别[5-6]。激光诱导击穿光谱(Laser-induced Breakdown Spectrum,LIBS)是一种原子发射光谱,凭借其检测速度快,基本无需样品处理,对样品损伤小等优点,已经逐步走向工业现场[7-14]。美国陆军实验室(ARL)利用LIBS技术,结合偏最小二乘法判别分析(PLS-DA)对爆炸物和非爆炸物加以区分[15]。拉曼光谱作为一种分子振动光谱,广泛应用于含能材料的无损鉴别。Jin等人利用自制的远程拉曼系统成功鉴别出三硝基甲苯(TNT)、黑索金(RDX)等炸药[16]。离子迁移谱(IMS) 被认为是爆炸物痕量检测的最佳技术之一,广泛应用于机场的爆炸物检测[17-18]。由于每项技术都有一定的局限性,近年来,几种探测技术联合使用的应用越来越多。韩国中南大学将离子迁移谱和质谱 (IMS-MS) 联用,用于奥克托金(HMX)、RDX的检测[19]。将LIBS和Raman这两种高度互补的光谱技术联用,就能从原子和分子结构层次实现对复杂物质的快速无损的识别和分类。已见报道的用于炸药探测的只有西班牙Malaga大学开发的远程LIBS-Raman联合探测系统[20]。
上述研究表明,光谱技术对于含能材料的痕量探测、识别和分类具有一定的可行性。但是识别和分类集中于对爆炸物和非爆炸物的研究。采用四唑类化合物的光谱表征对结构相似的含能材料进行分类与识别鲜有涉及。本文搭建了激发光为1 064 nm的LIBS-Raman集成测试系统,通过采集和分析4种四唑类化合物的Raman光谱和LIBS光谱,为结构相似的四唑类化合物以及其他含能材料的识别和分类提供了一种快速而准确的方法。
2 实验部分
2.1 实验装置
图1 LIBS-Raman集成测试系统 Fig.1 Schematic diagram of integrated LIBS-Ramansystem
LIBS-Raman集成测试系统如图1所示,样品放置在三维电动样品台上。Raman测试采用1 064 nm单纵模连续激光器,最大输出功率为500 mW。激光通过反射棱镜打到样品表面,散射光通过两个银镜和一个焦距为150 mm的透镜耦合进光栅光谱仪(iHR 550,光栅刻痕为1 200线/mm),1 064 nm陷波滤光片位于两个反射镜之间,滤掉激发光。LIBS测试光源为主动调Q的Nd∶YAG(Quantel Ultra,French)固体激光器,波长为1 064 nm,脉宽为7 ns,重复频率1~20 Hz可调,最大输出能量为100 mJ,输出能量波动小于3%。光谱仪为三通道光纤光谱仪(Avantes,Netherlands),CCD 分辨率为2 048 pixel×2 048 pixel,探测波长为180~720 nm,光学分辨率为0.1 nm。激光经过反射棱镜打到样品表面,用焦距分别为35 mm和75 mm透镜组收集的等离子体的辐射并耦合至光纤光谱仪。采用光谱仪触发激光器模式,激光能量为30 mJ,延迟时间为193.5 μs,积分时间为1.05 ms。每个样品采集250个光谱作为待处理数据。
2.2 样品制备
本实验选取了4种单环粉末状的四唑类化合物:四氮唑、5-氨基四氮唑、1,5-二氨基四氮唑和1-甲基-5-氨基四氮唑,分别记为1号、2号、3号、4号样品,其主要信息如表1所示。为了减小LIBS光谱的不稳定性,首先将4种样品分别用粉碎机粉碎15 s,使样品颗粒直径均在200 μm左右。然后用压饼机在15 MPa恒压下制成厚度约为2 mm,直径为10 mm的表面平整的圆饼备用。
表1 四唑类化合物的主要信息Tab.1 Main information of tetrazole compounds
3 结果与讨论
3.1 基于Raman光谱的四唑类化合物快速识别
分别选择532、785、1 064 nm为激发波长,对饼状四唑类化合物进行Raman光谱测试,结果如图2(a)所示。实验表明,采用波长为532 nm的连续激光激发时,样品的波峰信息被荧光背景掩盖,测试结果较差。采用785 nm和1 064 nm激发时,Raman峰较丰富且强度较强。尤其是当激发波长为1 064 nm时,几乎没有荧光背景,不需要光谱预处理。为了得到更好的测试结果,本实验中选择1 064 nm为激发波长。在激光器功率450 mW,曝光时间为5 s,光谱扫描范围为200~1 800 cm-1的测试条件下,对每个样品进行10次测量,取平均值,并将归一化处理结果作为其拉曼光谱,测试结果如图2(b)所示。1 000~1 300 cm-1波段的峰位来源于四唑环的振动,其中1 050 cm-1左右的峰位源自环上N-H键的摇摆振动,1 057 cm-1和1 099 cm-1附近的峰位源自环的伸缩振动,1 293 cm-1附近的峰位源自环的呼吸振动[21-22]。4个样品均在这个波段有明显的拉曼峰,此波段可以用于识别四唑类化合物和其它无四唑环的化合物。3号和4号样品该波段拉曼峰强度相对较弱,原因在于随着环上连接的官能团的增加,四唑环自身的振动受到一定的抑制。由此可以将环上3号和4号样品与1号和2号样品区分开来。783 cm-1附近的拉曼峰为环上碳垂直于四唑环平面的振动,仅在2号、3号和4号样品观测到该峰位,说明当环上的C原子连接官能团之后,加剧了其垂直于四唑环平面的振动,由此可以识别1号样品。4号样品较3号样品分子结构复杂,因此测到的拉曼峰较丰富,由此可以把3号和4号样品区分开来。因此,基于Raman光谱,不仅可以区分四唑类化合物和其他化合物,还可以将结构稍有差异的不同种类的四唑类化合物快速识别出来。
图2 四唑类化合物的Raman光谱图 Fig.2 Raman spectra of tetrazole compounds
3.2 LIBS光谱数据预处理
在采集LIBS过程中由于激光能量波动以及样品表面起伏等原因,会引入不可避免的光谱误差,以及大量的干扰信息,利用数据预处理方法可以减少基体效应、自吸收效应、激光器能量波动或仪器与测量误差对光谱的影响,是光谱定量分析的重要预处理环节。本实验首先采用窗口平移平滑去背景方法来消除光谱中不必要的背景辐射[23]。由于基体效应和仪器误差的存在,同一样品在不同测试点得到的光谱会出现一个像素点的峰位漂移现象,对应波长漂移量为光谱分辨率,即0.1 nm。为处理方便,先将背景消除的光谱数据进行寻峰处理,找出每组光谱中的特征峰的峰值强度和对应波长,并记录,然后用峰位漂移函数对漂移峰修正[24]。然后采用统计学上的“跳跃度”判别法[25]进行数据筛选。取出每个样品250次测量中H(656.3 nm)元素谱线强度,以0.96作为判别异常数据的临界值。经过筛选后每个样品约剩余210个光谱。最后从每个样品中随机抽取200个光谱数据,每4个数据求平均,作为一组光谱,进一步提升光谱的稳定性。最终每个样品可获得50组相对稳定的光谱数据,做强度归一化处理后,每组光谱数据除以该组最大值作为相对强度。
3.3 基于LIBS光谱的四唑类化合物快速分类
依据美国国家标准与技术研究院(NIST)的原子光谱数据库(Atomic Spectra Database,ASD)指认谱线位置对应元素。通过测量谱线波长与数据库波长比对的方法最终确定分析谱线的元素归属,如图3(a)所示。其中C(247.9 nm,588.9 nm),N(279.9 nm),Ca(393.3 nm,396.8 nm,422.7 nm),H(655.8 nm);另外,分子峰CN(388.3 nm,421.6 nm)和C2(516.06 nm)被观测到[26]。4种样品的LIBS光谱如图3(b)所示,4种样品的元素组成相同,因此其峰位基本一致但是由于元素含量不同,特征谱线相对强度存在明显差异。最终选取了上述10条谱线的峰值作为分类依据。
图3 四唑类化合物的LIBS光谱图 Fig.3 LIBS spectra of tetrazole compounds
图4 前3个主成分对原始数据的解释率及累计解释率 Fig.4 Individual interpretation rate(left, bar graph) and cumulative interpretation rates(right, line) of the first three principal components to the original data
本实验中,一组光谱由6 144个数据点组成,如此庞大的变量数会大大增加问题的复杂性。即便是选取了特定谱线的强度作为变量,在一般情况下,各个变量之间仍然有一定的相关性,它们所提供的信息也会有一定程度的重叠。本文取出特征变量进行主成分分析[27],基本计算步骤如下:(1)、提取10条特征谱线的峰值作为特征变量,构造出一个200×10的原始光谱数据矩阵X;(2)、对矩阵X做标准化处理,缩放后的值位于(0,1)之间;(3)、求解X的协方差矩阵,获得特征值和特征向量;(4)、将特征值和特征向量按照由大到小的顺序排列,前3个主成分的方差贡献率分别为80.6%、12.7%和4.9%,累计解释率大于95%,如图4所示。因此选用前3个主成分进行研究;(5)计算出每组光谱的主成分得分,在前3个主成分构成的三维特征空间内,每种样品都集中在特定区域,并且与其他类别的样品有明显的间隔,如图5所示。图5显示出较好的聚类效果。
图5 前3个主成分的三维得分图 Fig.5 Scoreplot of the tetrazole compounds samples′ LIBS spectra with respect to the first three principal components
支持向量机(SVM)是监督学习中最有影响力的方法之一,在解决小样本、非线性及高维模式识别中具有很强的分类学习能力[28],非常适合本文中判别模型的建立。在每个样品的50组光谱数据中,随机选取35组作为训练集,剩余的15组作为测试集。模型建立及预测步骤如下:(1)以PCA降维后获得的训练集光谱数据的主成分得分作为SVM模型的输入变量,以样品的类别标签值为输出变量;(2)选取应用最广泛,且其对非线性问题有较好处理能力的径向基函数(Radial Basis Function,RBF)作为核函数;(3)通过网格搜索法优化惩罚因子c和核参数g,从而确定最优的分类超平面,c和g分别为1.3和5.2,建立分类模型;(4)将测试集光谱数据输入模型验证,最终模型分类准确率为100%,如表2所示。此外,本文还将全谱6 144个变量直接进行主成分分析,然后提取前64个主成分,其累计解释率为98.3%,基于SVM算法进行分类研究,结果显示这种方法不仅计算量大,而且最终平均分类准确率仅为88.3%,如表3所示。通过两种方法的对比发现,对于本文中4种四唑类化合物的分类模型的建立和预测,选取差异较为明显的特征谱线为变量,并结合PCA-SVM算法可以得到较好的分类结果。
表2 基于特征变量降维的四唑类化合物分类结果Tab.2 Classification results of tetrazole compounds based on dimension reduction of characteristic variables
表3 基于全谱降维的四唑类化合物分类结果Tab.3 Classification results of tetrazole compounds based on dimension reduction of full spectrum
4 结 论
通过光谱采集和合理的数据处理分析了4种四唑类化合物在波长为1 064 nm的激光作用下的Raman光谱和LIBS光谱,实现了四唑类化合物的快速识别和分类。通过Raman测试,得到了四唑类化合物的特征振动(四唑环的振动),并根据振动峰位的差异将各个样品识别出来。通过对LIBS光谱数据进行窗口平移平滑去背景、峰位漂移修正、跳跃度判别法筛选、取均值重组、归一化等有效的数据预处理手段,采用PCA与SVM相结合的分类算法,得到了准确度为100%的分类模型。实验结果表明,利用LIBS-Raman集成系统对含能材料的检测在公共安全领域有着广泛的应用价值。为了充分发掘该方法的识别和分类潜力,在本文基础上,未来将进一步扩充样品种类和数量,实现对更多含能材料和爆炸物的准确鉴别。