拉曼光谱结合化学计量学在不同品位磷矿快速分类中的应用
2019-05-07姚曦煜梁欢陈凯候华毅陈相柏
姚曦煜,梁欢,陈凯,候华毅,陈相柏
(1.武汉工程大学 光电信息与能源工程学院,湖北 武汉 430205;2.武汉工程大学 兴发矿业学院,湖北 武汉 430205)
磷矿是多种精细磷化工的物质基础[1],也是我国重要的战略资源。矿石中P2O5的含量决定磷矿品位[2],我国的磷矿大多为中低品位[3]。当前测定磷矿石品位的方法主要有常规化学分析法、红外光谱法、核磁共振法、X射线、等离子体质谱法等[4]。但大部分方法不能对大量样品进行快速检测和满足矿下检测的需要。寻找一种快速有效的磷矿品位鉴别和分类方法,提高选矿效率,对我国工业和农业可持续发展具有重要意义。
拉曼光谱作为一种分子指纹分析技术可获得样品的物理化学信息,具有快速、准确、无损、无需对样品进行复杂前处理等优点,已广泛应用于物理、化学、材料等领域[5-7]。
1 实验部分
1.1 材料与仪器
磷矿高品位样品A(P2O531.25%)、B(P2O529.06%),中品位样品C(P2O522.08%)和低品位样品D(P2O53.29%)。实验前对样品进行过滤和压片处理,并采用60目的筛网对磷矿粉末进行过滤,称取250 mg采用压片机进行压片。
Nanobase XperRam200共聚焦显微拉曼光谱系统,激光器波长为532 nm,功率为100 mW,光谱扫描范围为200~1 950 cm-1,扫描时间为30 s。
1.2 拉曼光谱的采集
在保证测量面平整的前提下,对每面由内圈到外圈均匀选取50个点进行光谱检测收集,每种样品测得100个点的拉曼光谱,并使用硅片对所测光谱进行校准,共测得400组磷矿光谱。
1.3 数据处理
1.3.1 基线校正 为降低拉曼光谱的背景噪声干扰,对拉曼光谱进行平滑和基线校正处理。本研究选择Savitzky-Golay(SG)卷积法对拉曼光谱进行多项式为2阶的8点平滑处理。平滑后采用自适应迭代惩罚最小二乘法[8](airPLS)算法进行基线校正,与其他校正方法相比,airPLS 具有一定的优势,包括不需要预知干扰信息,其通过迭代改变拟合基线和原始信号之间的误差平方和的权重,适应性地利用预先拟合的基线和原始信号间的差异,获得基线估计量。Savitzky-Golay(SG)卷积法平滑采用Origin 2017进行,airPLS基线校正的程序采用MATLAB 2016b实现。
1.3.2 分类模型 对平滑和基线校正后的拉曼光谱数据进行PCA和HCA分析,建立判别模型。主成分分析(PCA)属于无监督模式,在保留原始主要信息变量的前提下,PCA将多指标的问题转化为少数几个综合性指标的问题[9],降维不但能简化模型,还可以有效剔除与所测化学成分不相关或相关性小变量,使模型更加准确和稳定,并反映样本的聚类情况。
系统聚类法(HCA)是以分类依据的条件作为指标或变量,根据待分析的样品所表现的变量特征,按样本之间的距离相似系数进行度量,距离近的相似度高的聚为一类,反之不聚为一类。最后把聚类结果形象系统地用树状图表示出来。运用HCA的离差平方和法(ward’s linage rule)[10]根据分割距离欧式距离(m维空间两点之间的真实距离)的平方把磷矿样品分成不同数量的集群。
PCA和HCA分析使用SIMCA 14.1软件进行。
2 结果与讨论
2.1 磷矿拉曼光谱分析
3种预处理方式下的4种磷矿的拉曼光谱见图1。
3.4 护士在静脉输液过程中职业防护的执行现状表2显示,29名护士不会正确处理化疗药物药液溢出;137名护士不会正确处理化疗药液溅到皮肤或眼内的情况;188名护士在进行高危操作时不戴手套;152名护士在被污染锐器刺破是不会向上级汇报;还有102名护士在操作中双手回套针帽;72名护士不会正确使用锐器盒分离针头,而89.5%护士在操作中遇到锐器盒针头满溢的情况。这些情况说明护士在化疗药物防护、预防针刺伤、职业暴露后的处理等操作环节上自我防护行为不足。
图1 3种预处理方式下的4种磷矿的拉曼光谱图Fig.1 Raman spectra of four kinds of phosphoriteunder three kinds of spectral pretreatmentsa.SG平滑+airPLS基线校正后;b.SG平滑+airPLS基线校正+一阶导数;c.SG平滑+airPLS基线校正+二阶导数
图1(b)和1(c)分别是在图(a)中的5组光谱平均后的一阶导数和二阶导数两种预处理后的光谱。从图中看出,经过导数处理的光谱,部分特征峰消失,但4种磷矿样品在960 cm-1左右仍然呈现一个较强峰。所以在磷矿的研究中,V1(PO4)对称伸缩振动的拉曼信号往往用来区分不同种类或者品位的磷矿石[2]。除此之外,在图(b)中,样品A(P2O531.25%)的一阶导数光谱中还存在无序碳的特征峰(1 333,1 572 cm-1),但在二阶导数光谱中,该特征峰消失。样品B(P2O529.06%)的白云石的特征峰在一阶导数和二阶导数光谱中都存在,是该样品与其它3种样品的重要区别之一。
4种不同品位磷矿之中,磷矿品位越高,含有其它杂质越少,光谱峰位更清晰。磷矿品位降低,所含杂质增加,光谱峰位、宽度和强度随着杂质的比例不同也会发生改变,因此不同种类磷矿样本仅从光谱上直接区分存在难度,而通过把拉曼光谱和化学计量学相结合,能够寻找检测变量之间的隐藏关系[14],达到对不同品位磷矿聚类的目的。
2.2 磷矿样品分类鉴别
2.2.1 4种品位磷矿进行PCA分析 如图1所示,由于存在一定背景噪声和内部成分复杂的特点同一磷矿样品的5个不同测量点之间光谱也存在差异,直接使用磷矿原始光谱数据矩阵建立PCA模型会影响聚类效果,因此,先将单种品位的磷矿样品100组原始光谱数据中按照测量点位的顺序,每5组光谱取平均,获得平均光谱20组,用来表征该类样品,4种品位磷矿共80组平均光谱构成新的样本矩阵,并经过3种不同预处理方式消除背景噪声,进行主成分分析,得到主成分得分图,如图2所示。前3个主成分的方差贡献度见表1。
图2 3种预处理方式后PCA分析得分图Fig.2 PCA analysis score plot after three pretreatmentsa.SG平滑+airPLS基线校正PC1 VS PC2得分图;b.SG平滑+airPLS基线校正+一阶求导后PC1 VS PC2得分图;c.SG平滑+airPLS基线校正+二阶求导后PC1 VS PC2得分图
2.2.1.1 SG平滑+airPLS基线校正 由表1和图2(a)可知,经过SG平滑+airPLS基线校正,前3个主成分累计贡献度达到83.8%,4种磷矿存在明显分开的趋势,且各自聚集,但聚集程度略有差异,样品D(P2O53.29%)样本点较为分散,其它3种样品相对较好。另外,样本之间也有一些交叉的情况,样本A(P2O531.25%)和样本B(P2O529.06%)部分交叉和重叠,分析原因,是由于二者品位值差异较小,光谱相近造成。除此之外,可以看到在第1主成分(PC1)上4种品位的磷矿样品按照P2O5的浓度从低到高从左到右依次排列。
表1 不同预处理方式下PCA分析前3个主成分方差贡献Table 1 The variance contribution of the first threePCs in PCA analysis principal component underdifferent pretreatment methods
2.2.1.2 SG平滑+airPLS基线校正+一阶导数 由表1可知,使用去SG平滑+airPLS基线校正+一阶导数后的光谱数据的PCA模型中,前三个主成分所反映的原始光谱信息由83.8%下降到42.6%,与图1(b)现象一致,求导后存在部分信息丢失和缺损[15]。图2(b)显示,在SG平滑和airPLS基线校正的基础上,经一阶导数处理后,采用PC1和PC2两个主成分时,4类磷矿样品分布在各自的区域内,且不同磷矿样品在分布的区域范围内点的离散程度较小。与图2(a)相同,在第1主成分(PC1)上,4种磷矿仍然是按照品位值的从低到高从左到右依次排列。
2.2.1.3 SG平滑+airPLS基线校正+二阶导数 在SG平滑和airPLS基线校正的基础上,二阶导数后模型对光谱数据的解释度相比一阶导数损失更大,前3个主成分所保留的原始光谱信息仅为25.1%,信息损失了将近3/4。虽然分类效果较好,如图2(c)所示,但此预处理方法不合适。
2.2.2 4种磷矿进行HCA分析 对光谱数据进行降维后,既能反映大部分原始光谱的信息,同时模型中各样本点之间欧式距离的大小能够反映每个样本点的差异程度[16-17]。使用降维后的光谱数据能有效压缩参加计算欧氏距离的变量数[18]。因此,通过对3种光谱预处理方法处理后的PCA模型取其主成分得分数据进行HCA分析尝试后,我们发现对原始光谱进行SG平滑+airPLS基线校正+一阶导数处理后,既能在降维后保留较多的原始信息同时又有较好的聚类效果,选取该模型中对原光谱信息累计解释度为58.8%的前9个主成分的得分数据矩阵,选择离差平方和法(Ward’s linage rule)进行相似度聚类生成树状图,如图3所示。其中编号1~20对应样品A(P2O531.25%),20~40对应样品B(P2O529.06%),40~60对应样品C(P2O522.08%),60~80对应样品D(P2O53.29%)。
表2 磷矿样本系统聚类分组情况Table 2 Hierarchy clustering groups of phosphorite samples
由图3和表2可知,80组磷矿样品被分成 5组,除一个3.29%的样品被单独分到一类外,其余79组数据均以100%的准确度得到了分类。通过离差平方和法,使用磷矿SG平滑+airPLS基线校正+一阶导数处理后PCA模型中前9个主成分得分矩阵建立的HCA树状图,分类效果准确率达到了98.75%,成功实现了对4种磷矿的分类。
3 结论
研究了3类品位磷矿样品的拉曼光谱特性,并提出了一种将测得的4种磷矿样品的光谱信息进行平滑和基线校正后,结合化学计量学磷矿进行快速鉴别和分类的新方法。结果表明,尽管同种磷矿样本不同点位之间的光谱存在差异,但是在采用5点的平均原始光谱SG平滑+基线校正、原始光谱SG平滑+基线校正+一阶导数两种预处理的PCA模型中,既保持了较高的原始信息,各磷矿样本点也有着较好的聚类效果,且品位信息在第1主成分上呈现规律分布。采用SG平滑+基线校正+一阶导数光谱预处理方法后,进行主成分分析,得到的前9个主成分得分数据矩阵利用ward法进行HCA分析,在事先不知道样品分组的情况下,成功将4种磷矿样本分开,准确率为98.75%。拉曼光谱技术具有样品前处理简单,无损、快速及准确的鉴别,其结合化学计量学为磷矿品位鉴定和分类提供了一种新方法。使用便携式拉曼光谱仪,具有现场快速检测应用的前景。然而,由于磷矿种类繁多,且成矿机理和性质不同,在本次研究中的采集的样本数量有限,后续将加大样品采集数量建立数据库,并采取其他更高级的分类算法,为磷矿品位鉴定和分类提供更多的信息。