APP下载

基于惩罚最小二乘算法的土壤重金属检测光谱基线校正

2021-08-27江晓宇李福生王清亚徐木强

农业机械学报 2021年8期
关键词:基线X射线光谱

江晓宇 李福生 王清亚 郝 军 徐木强 罗 杰

(1.东华理工大学核资源与环境国家重点实验室, 南昌 330013;2.东华理工大学核技术应用教育部工程研究中心, 南昌 330013;3.长江大学资源与环境学院, 武汉 430100)

0 引言

能量色散X射线荧光(Energy dispersive X-ray fluorescence, EDXRF)光谱仪是一种间接定量分析仪器,可对多种重金属元素进行快速同步分析[1],除了能无损检测外,EDXRF因其体积小、质量轻、分析速度快及准确度高而广泛应用于野外现场分析中[2-3]。近几年,EDXRF已经成为地质、钢铁、石油、环境和医学等领域的首选仪器[4]。在获取X射线荧光光谱的过程中,仪器本身(如SSD探测器和采集板)产生的统计涨落所带来的噪声干扰以及X射线管出射谱中连续轫致辐射造成的背景干扰噪声是高频信号,基线变化是低频信号。基线问题是一个相对复杂的问题,理论上很难研究出一种完美的方法来处理基线问题。通常直线用于连接信号峰的两端,以直线为基线,在此基础上进一步计算峰面积或峰高。如果直线不符合实际基线,则计算就会产生误差。

近年来,研究人员提出了各种基线校正方法,例如小波变换[5-7]、多项式拟合[8-9]、傅里叶变换[10-13]、形态学[14]和惩罚最小二乘[15]。其中,惩罚最小二乘算法因其在光谱背景扣除中的高效率和简便性而被广泛采用。1922年,惩罚最小二乘由WHITTAKER[16]首次提出,并用作数据平滑,随后研究人员在惩罚最小二乘算法的基础上进行了很多改进[17-21]。虽然改进的基于惩罚最小二乘算法的基线校正方法在近红外光谱领域取得了一些良好的实验效果,但在X射线光谱分析领域的具体应用效果还有待进一步研究和探讨。

本文选择5种惩罚最小二乘(或其改进)算法,结合PLS技术分别对土壤样品中的铅、砷元素建立X射线荧光光谱定量分析模型,并对比分析模型的相关指标,选取最适合X射线荧光光谱基线校正的算法,然后采用选好的PLS模型分别与神经网络(BP)[22-24]和支持向量机(SVR)[25-27]所建立的模型进行对比分析,以选择较优的土壤中X射线荧光光谱定量分析模型,以期为土壤污染调查分析提供技术支持,也为惩罚最小二乘算法在X射线光谱领域的研究应用提供理论基础。

1 材料与方法

1.1 实验仪器

主要仪器:TS-XH4000型便携式X射线荧光光谱仪,浙江泰克松德能源科技有限公司;SDD探测器,能量分辨率为125 eV,美国Amptek公司;球磨仪,江苏宜兴丁蜀浩强机械设备有限公司;样品杯(聚乙烯),尺寸为Φ3 cm×1 cm,单开口,带固定麦拉膜的颈圈;麦拉膜,厚3.6 μm,宽7.6 cm,美国Chemplex公司。

1.2 土壤样品制备与光谱采集

本实验中,共计样品89个,其中野外采集土壤样品30个(江西省鄱阳湖地区),另外59个为国家土壤标准样品,其中20个水系沉积物标准物质(GSD)和39个土壤标准物质(GSS系列),样品来源多样,且基本覆盖了全国大部分土壤质地。样品采集和制备方法严格按照土壤环境质量标准(GB 15618—2018)中的技术规范执行。将采集的土壤样品自然风干,除去土壤样品中沙石、草屑、动物碎片等明显的异物,使用四分法取2份,1份用于实验分析,1份备用。将国家标准认证样品和实验分析的土壤样品均匀填入玛瑙钵体中,在球磨仪上研磨5 min后,取出粉末过200目筛子。将处理后的土壤样品使用便携式XRF分析仪在管压35 keV、电流40 μA和时间90 s下,采集土壤X射线荧光光谱数据,测量时每个样本测量3次,3次移动不同位置,取平均值作为光谱数据,共获取样品在0~45 keV范围内共2 048个通道的光谱信息。

Kennard-Stone(K-S)算法[28]作为样本划分方法将光谱原始数据的69个样品作为训练集,20个样品作为预测集。

1.3 光谱数据处理方法

1.3.1惩罚最小二乘算法

假设y为原始光谱信号,长度为N。用z表示拟合基线的向量,长度也为N。则惩罚最小二乘方法中z对y的保真度F为

(1)

式中yi——y在通道i时的信号强度

zi——z在通道i时的信号强度

ωi——权重

ωi可以表示为对角线矩阵W

(2)

拟合的基线z的粗糙度R表示为

(3)

对于原始数据保真度和拟合基线数据粗糙度之间的平衡,采用保真度权重和平滑参数来调节,可以描述为

Q=F+λR=W‖y-z‖2+λ‖Dz‖2

(4)

式中D——2阶差分矩阵

λ——平滑参数

Q——综合变量,表示原始基线与拟合基线保真度与粗糙度间的平衡

z=(W+λDTD)-1Wy

(5)

因此,式(2)、(5)是惩罚最小二乘算法的基本形式。该算法的核心思想是如何选择合适的平滑参数λ和权重向量W。其中,加权方案一直受到大家的关注和重视。一般来说,非峰值区域的权重应接近于1,峰值区域的权重应接近于零。

1.3.2算法实现

根据实验,所有基于惩罚最小二乘(或者改进)算法的程序都在计算机上使用Matlab 2016b编写。惩罚最小二乘(或者改进)算法的基本实现步骤为:

(1)输入原始X射线荧光光谱数据y。

(2)加载最优参数:最大迭代次数Itermax、平滑参数λ和初始化权重ω。

(3)迭代次数从t=1开始,对权重ω进行初始化ω1=[1,1,…,1],则权重矩阵W为对角矩阵,Wt=1=diag(1,1,…,1)。

(4)将初始权重ω1代入式(5),通过惩罚最小二乘拟合基线数据zt。

(5)计算X射线荧光光谱与拟合基线之间的残差信号d=y-z,标准差σ和估计权重ω。

(6)判断是否满足迭代终止条件或者达到最大迭代次数,若不满足转步骤(5),否则转至步骤(7)。

(7)迭代终止,输出最优基线z并计算校正后的光谱y。

2 结果与讨论

2.1 光谱预处理

采集到的土壤原始X射线荧光光谱数据包含仪器操作、土壤背景和散射效应等引起的噪声和无关信息,因此在对光谱数据进行操作之前,需要对光谱进行平滑去噪处理,有助于消除干扰因素。以国家土壤标准物质GSS-7为例,采用信噪比(SNR)作为去噪效果评价指标,去噪处理采用以下方法:样品颗粒分布不均匀及颗粒粒径产生的散射影响,使用多元散射校正法(MSC)消除。光谱平滑去噪采用小波变换进行处理,小波基函数选取sym4,计算不同分解层数下的SNR,结果见表1。可以看出,光谱信号在分解层数为7层时,去噪效果最好,效果见图1,其信噪比为19.712 7 dB。

表1 sym4小波函数在不同分解层数时的去噪结果

2.2 惩罚最小二乘算法基线校正

以国家土壤标准物质GSS-7为例,5种基线校正方法拟合得到基线如图2所示。从图2中可以看出,DRPLS算法对基线有较好的拟合效果,所得的估计基线能够更好地拟合本底,估计基线与X射线荧光光谱的真实基线最为接近,可以精确拟合土壤实际光谱目标元素特征峰附近的基线,且基线校正后的本底扣除最为明显。而ASLS、ARPLS和LRSPLS算法所得估计基线存在着不同程度的位置偏低现象,从而低估了土壤样品实际光谱的基线,而这一现象也间接证明了ASLS、ARPLS和LRSPLS的加权方案总是受到实际光谱噪声的影响。另外,AIRPLS算法的估计基线沿着底部信号中间穿过,而不是沿着X射线荧光光谱真实基线的底部,这将造成校正后光谱向下凹起,进而导致谱强度偏小,小峰无法识别,从而影响对X射线荧光光谱的后续分析,特别是定量分析结果的准确性。

为了更具体地比较不同方法对实测光谱信号拟合的效果,删去校正后光谱特征峰区域的数据,然后求取信号方差。方差越小,说明校正后信号的基线越平缓,拟合效果越好,去除特征峰后信号的方差如表2所示。

由表2可以看出,与其他4种方法相比,DRPLS算法在土壤样品实测数据中得到的方差最小,为1.52×10-3,说明DRPLS算法在样品非特征峰区的基线不会太高或太低,校正后的基线最平缓,波动最小,拟合效果最好。综上所述,该方法可以有效地去除XRF谱的基线,为后续定量分析模型的精度提高提供了保障。

表2 去除特征峰后信号的方差

利用原始数据和使用5种处理方法对土壤样品X射线荧光光谱进行基线校正处理后的光谱数据绘制校准曲线,分别基于PLS建模,进行铅和砷元素的定量分析,结果见图2和表3。由表3可以看出:不同算法基线校正处理对PLS模型精度的影响差异明显,6种光谱基线校正方法中,铅的预测集R2最大为0.982,最小为0.912;RMSECV和RMSEP最大分别为0.233 mg/kg和0. 239 mg/kg,最小分别为0.113 mg/kg和0.056 mg/kg。图2表示2种元素的5种基线校正方法的校正效果,从图2和表2中均可看出,AIRPLS的效果最差,经基线扣除后的RMSECV和RMSEP 最大,且低于无基线处理的PLS模型。图2b的DRPLS基线校正的结果表明,经基线校正处理后,原始光谱的基线有较明显改善。根据表2和表3可以看出,DRPLS基线校正后的模型训练集和预测集R2、RMSECV和RMSEP均有提高,且主成分数也减少,改善了模型的精度。结合表2、3和图2并从多个指标综合考虑,相比较其他几种基线校正方法,可以得出DRPLS基线校正处理方法对PLS模型精度改善最好,但也可以看出不是所有的惩罚最小二乘基线校正算法均对PLS模型精度有改善,有可能对模型产生负影响。

表3 基线校正后的结果

2.3 不同模型建模对比分析

为了验证该最优算法在不同模型中对定量分析的影响,将铅和砷元素作为定量分析对象,用本实验所用便携式X射线荧光光谱仪对土壤样品(共89个)进行检测,每个样品测量3次,对应的计数率取平均值,与其相应的标准值(CRMs)进行PLS、BP和SVR建模,以模型决定系数(R2)和预测均方根误差(RMSEP)作为评价标准,对不同模型建模的预测结果进行评价。

评估最佳PLS、BP和SVR模型的实际预测能力是利用预测集中的20个未知样本进行的。采用DRPLS对土壤重金属铅和砷的光谱基线校正后进行PLS、BP和SVR建模,20个预测集预测值与实测值的拟合结果见图3~5。铅和砷的预测值和实测值的R2和RMSEP见表4,通过对比分析R2和 RMSEP,可以得出DRPLS-SVR具有最佳回归效果,铅和砷的R2分别为0.998和0.993,RMSEP分别为0.015 mg/kg和0.596 mg/kg,相比较于无任何基线校正处理,SVR不仅在精度方面有较大的提升,比DRPLS-BP在时间性能方面也有所提高,且与DRPLS-PLS相比具有更好的泛化性能和预测效果。

表4 2种重金属的预测值和实测值的拟合结果

综上所述, SVR比PLS模型和BP模型更适用于土壤重金属浓度的测定,因为SVR模型具有较高的准确性。

经DRPLS基线校正处理后结合SVR建模的预测值与实测值(均值,n=3)的结果如表5所示,从表5可以看出,DRPLS基线校正后铅和砷的预测值和实测值的相对标准偏差(RSD)范围分别为0.56%~4.35%、0.61%~4.85%,未经处理相对标准偏差范围为0.67%~15.1%、1.16%~13.5%,基线校正后的元素相对标准偏差均小于10%,相对误差(RE)基本小于5%。可见采用DRPLS基线校正预处理后,建立的SVR模型对2种重金属元素具有良好的预测效果。优化后方法实测值与标准值也更接近,符合土壤环境监测技术规范里的要求,所以,采用算法处理后的仪器拥有更好的精密度和准确性,仪器检测水平得到极大提升。

表5 DRPLS背景扣除前后SVR建模的预测结果与实际值

此外,DRPLS基线校正算法能在去除基线漂移的同时保留光谱的有效信息,从而提升了光谱定量分析的准确性,进一步验证了该算法可以有效应用于实际X射线荧光光谱处理,并取得了较好的效果。

3 结论

(1)研究选取了89个土壤样本,采用手持式XRF仪获取土壤重金属原始光谱,并对原始光谱采用sym4小波基进行小波变换平滑去噪处理。结果表明,在分解层数为7层时,去噪效果最好,信噪比最高,达到了19.712 7 dB。

(2)对比了土壤重金属光谱的无基线校正处理以及ASLS、LRSPLS、ARPLS、AIRPLS、DRPLS等基线校正方法的处理效果。结果表明,与其他5种方法相比,DRPLS算法在土壤光谱中的方差最小,为0.001 52,说明DRPLS算法校正后的基线波动最小,拟合效果最好。

(3)采用DRPLS算法基线校正后的光谱分别采用 PLS、BP和SVR进行定量建模分析,结果显示SVR回归得到的建模效果最好,铅和砷预测值和实测值的R2分别达到0.998和0.993。

猜你喜欢

基线X射线光谱
基于三维Saab变换的高光谱图像压缩方法
高度角对GNSS多系统组合短基线RTK影响
基于3D-CNN的高光谱遥感图像分类算法
GNSS 静态相对定位精度分析与比较
X射线
天鹅座X-1——最容易看到的黑洞迹象
新版GAMIT10.70解算GPS/BDS基线精度对比分析
基于虚拟基线的相位干涉仪阵列优化设计
浅析X射线计算机断层成像的基本原理
准单色X射线机替代241Am放射源的测厚应用研究