APP下载

基于拉曼光谱的危险液体快速识别研究

2021-06-10南迪娜董力强傅文翔刘卫卫孔景临

光谱学与光谱分析 2021年6期
关键词:毒剂模式识别曼光谱

南迪娜, 董力强, 傅文翔, 刘卫卫, 孔景临

国民核生化灾害防护国家重点实验室, 北京 102205

引 言

快速准确地识别化学毒剂、 有毒工业化学品等危险物质在重大活动安保、 交通运输、 海关物流、 司法物证、 反化学恐怖等公共安全领域需求明显。 这些化学危险品如可挥发、 强致死的神经性毒剂沙林、 梭曼等均为无色透明液体, 外观与水、 乙醇等常见液体无异, 具有被人员夹带、 谎报、 隐蔽投放到公共场所的风险。 要快速排查及准确识别此类液体样品, 一般都要开瓶采样进行现场检测或送实验室分析, 这种方式增加了执行任务人员的暴露风险且检测操作耗时。 拉曼光谱(Raman spectroscopy)技术凭借其快速、 灵敏、 非接触式操作、 仪器可便携化等优势成为现场快速检测领域的研究热点。 目前, 美国Wiley的Bio-Rad以及国内同方威视[1]等研究出版机构和拉曼光谱仪供应商等都建立了拉曼光谱数据库, 包含多种环境污染物、 易燃易爆及强腐蚀性化学危险品; 针对危险品识别的需求, 有研究通过实测谱图与数据库中正反向特征峰匹配分析危险液体[2], 或开发一些拉曼光谱识别方法[3]和软件[4]; 还有研究通过硬件改进, 互补式使用双波长激光器手持式拉曼系统实现危险品检测[5]。 上述拉曼光谱数据库均不包含化学毒剂等的光谱信息, 利用市售的数据库很难实现公共安全领域中危险液体的有效识别。 本研究较为系统地研究了多种化学毒剂及其前体或降解产物、 有毒工业化学品等危险液体的拉曼光谱检测方法, 获得了41种危险液体的高信噪比拉曼光谱数据并将其录入数据库, 再利用多种模式识别算法开展危险液体的识别研究, 通过线性判别分析(linear discriminant analysis, LDA)方法, 提出的谱图识别模型可对上述危险液体进行准确识别归类, 并能将其与水等无害物质快速区分。

1 实验部分

1.1 仪器与试剂

innoRam便携式拉曼光谱仪(美国BWTEK公司), 配备有785 nm激光器。

检测物包括沙林、 梭曼、 塔崩、 维埃克斯、 芥子气等化学毒剂; 磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯、 甲基膦酸二甲酯、 甲基膦酸二异丙酯等化学毒剂模拟剂; 亚磷酸二甲酯、 亚磷酸三甲酯、 亚磷酸三乙酯、 甲基膦酰氯乙酯、 甲基膦酰二氯、 甲基膦酰二氟、 氯沙林、 二乙胺基磷酰氯、 2-二乙胺基乙硫醇、 硫二甘醇、 异丙醇、 频呐基醇、 甲基膦酸、 甲基膦酸异丙酯、 甲基膦酸频呐基酯等化学毒剂前体、 中间产物、 水解产物; 邻二甲苯、 间二甲苯、 苯甲醚、 氯代苯、 乙酸乙酯、 乙酸乙烯酯、 乙酸苄酯、 甲醇、 乙醇、 乙腈、 丙酮、 1,1,1-三氯乙烷、 正己烷、 正丁醇、 四氯化碳等有毒工业化学品以及汽油和水。 其中磷酸三甲酯为分析纯, 购自中国医药集团上海化学试剂公司; 磷酸三乙酯、 乙酸乙酯为分析纯, 购自天津市福晨化学试剂厂; 磷酸三丁酯为分析纯, 购自天津市化学试剂; 甲基膦酸二甲酯为分析纯, 购自麦克林; 邻二甲苯、 间二甲苯、 苯甲醚、 氯代苯、 乙酸乙烯酯、 正丁醇纯度大于99.0%, 购自天津市光复精细化工研究所; 乙酸苄酯纯度大于99%, 购自北京百灵威科技有限公司; 甲醇、 乙腈为高效液相色谱纯度, 购自Sigma。 乙醇、 丙酮、 四氯化碳纯度大于99.5%, 购自北京化工厂; 1,1,1-三氯乙烷纯度大于96%, 购自阿拉丁; 正己烷纯度大于95.0%, 购自北京世纪红星化工有限公司; 水为市售娃哈哈纯净水。

1.2 方法

1.2.1 建立拉曼光谱检测方法

拉曼光谱仪开机后, 扫描空白光谱作为扣除的背景, 以消除仪器带来的噪声。 采集硅片的拉曼光谱并确认出峰波数为512 cm-1。 取适量样品至洁净透明玻璃瓶并放到样品池中, 设置激光功率为满值150 mW的10%~100%、 积分时间500~7 000 ms、 累积1~5次, 采集各条件下拉曼光谱并保存数据。

1.2.2 光谱数据分析

使用Matlab R2019a完成光谱数据分析。 将采集到的619个拉曼谱图截取200~3 000 cm-1范围的主要波段, 以1 cm-1间隔等距线性插值采样得到1×2 801维样本数据, 将光谱进行离差标准化处理, 完成光谱样本预处理。 采用主成分分析方法对光谱数据进行降维压缩, 选择前7个主成分作为数据集样本, 以覆盖原始数据80%以上信息。 各样品随机分配70%谱图为训练集数据, 其余归入测试集。 利用训练集数据训练线性判别分析、 二次判别分析(quadratic discriminant analysis, QDA)、 k近邻(k-nearest neighbor, kNN)、 朴素贝叶斯(naive Bayesian, NB)模型、 分类决策树(classification tree, CT)、 支持向量机(support vector machine, SVM)6种模式识别算法的模型, 再用训练好的模型对测试集数据进行识别归类。

1.2.3 盲样测试

重新随机选取10个样品采集光谱, 用训练好的线性判别分析模型识别新测得的谱图, 以验证本研究检测及识别方法的可靠性。

2 结果与讨论

2.1 谱图分析

由图1可见拉曼光谱反映了化合物的化学键构成, 是一种可用于化合物鉴别的指纹谱。 但由于分子振动的复杂性, 不是所有谱峰都易于归属, 仅靠拉曼光谱提供的信息难以准确判定化合物结构, 而利用化学计量学, 将模式识别方法与拉曼光谱结合是提高鉴别准确性的有效手段。

图1 化学危险品和水的拉曼光谱

2.2 谱图识别

各样品的前3个主成分分布如图2所示。 由图可见, 拉曼光谱作为分子指纹谱, 具有丰富的化学键及其所处环境的信息, 可将不同类型的样品加以区分。 为比较模型的识别准确率, 使用线性判别分析、 二次判别分析、 k近邻、 朴素贝叶斯模型、 分类决策树、 支持向量机6种模式识别算法对180个测试集数据进行识别归类后, 识别结果列于表1。

图2 各样品的前3个主成分分布

由表1可见, 支持向量机、 线性判别分析模型具有100%的最高识别准确率。 支持向量机是以各类样本间隔最大为原则, 其分类判别界面取决于类别边界的“支持向量”。 线性判别分析则是以原始样本投影得到向量的类间距离最大、 类内方差最小为原则, 通过Fisher判别式对样本进行分类的模型, 其判别界面更取决于“类心”。 当各样品多个训练集谱图中有个别因仪器影响或外界环境改变出现一定偏差的谱图时, 支持向量机模型在对未知样品识别时, 会因此对结果产生较大影响。 因数据库中该样品“类心”无大偏差, 同样情况下线性判别分析模型的识别结果波动较小具有稳健性, 故本研究选取线性判别分析模型进行未知危险化学品的识别。 利用线性判别分析模型重复10次识别归类后, 其识别结果稳定于100%的准确率不变, 可见该模型具有高识别准确率及稳定性。 对重新采集的10个盲样谱图, 线性判别分析模型可以全部准确识别。 不同化合物即使元素组成相同, 基团或其所处环境的差异会使其具有不同的拉曼光谱特征。 拉曼光谱的分子指纹谱特点防止了线性判别分析模型可能过度拟合数据而导致分类识别结果准确率降低。

表1 6种模式识别方式对测试集拉曼数据的识别准确率(%)

3 结 论

以多种化学毒剂及其前体、 中间体、 水解产物、 模拟剂和有毒工业化学品等为研究对象, 建立了化学毒害物质拉曼光谱数据库。 在此基础上, 以不同模式识别方法对上述毒害物质以及常见液体如水、 乙醇、 汽油等进行了快速筛查研究。 结果表明, 外观均为无色透明液体的各类化合物散射光谱特征差异显著, 反映出拉曼光谱的指纹谱特征; 模式识别方法与拉曼光谱结合可有效鉴别危险液体, 其中线性判别分析模型的识别结果波动较小更具稳健性; 全部测试过程在较短时间内即可完成且不损耗样品, 保证了测试通量和遂行任务人员安全, 该研究可为与不明化学品筛查相关的公共安全问题提供技术支撑。

猜你喜欢

毒剂模式识别曼光谱
维埃克斯毒剂的来龙去脉
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
第3届亚洲模式识别会议
电气设备的故障诊断与模式识别
BMSCs分化为NCs的拉曼光谱研究
便携式薄层色谱-拉曼光谱联用仪重大专项获批
苯的激光拉曼光谱研究
新型4H-3,1-苯并噁嗪类化合物的合成及拉曼光谱研究
在战争中使用毒剂渊远流长