APP下载

基于高光谱的尾矿重金属含量反演研究

2023-01-16张义璇

科技风 2023年1期
关键词:全量峰度微分

张义璇

华北理工大学矿业工程学院 河北唐山 063210

1 概述

矿产资源开发促进了社会经济的发展,但也给矿区周边生态环境造成了不同程度的污染[1]。尾矿库一般是由筑堤截断谷口或周围地形成的,主要用作对堆存金属材料或非金属材料采矿,通过矿物选别后排出尾矿或其余工业废弃物的场地。研究尾矿库的重金属含量以及钝化尾矿库中的重金属对保护矿区及周边尾矿环境有重要意义。

土壤中重金属元素含量很低,在土地光谱反射率的各个波段吸收特性并不明显,且由于土壤组成成分复杂,各种组成对反映光谱信号的直接影响往往是非线性地混合,从而造成了土壤的反射系统复杂化。常用方式主要是多元线性回归分析和偏最小二乘回归分析。郑光辉等利用偏最小二乘回归分析建立光谱反射率与土壤重金属As含量的模型,检验预测模型精度,证明可以通过偏最小二乘回归分析对土壤中As含量进行预测[2]。虽然偏最小二乘回归分析模型一般都适用于土壤重金属元素含量反演,但随着科学技术的发展,一些非线性模型逐渐被用于土壤反演领域中。如BP神经网络分析(BP)、支持向量机(SVM)、随机森林(RF)等,这些非线性的数学分析方法在一定程度上提高了预测模型的精度。王金凤等通过对Zn光谱的7种变换分析,并采用3种建模方法,研究得出基于二阶微分变换的随机森林算法准确度最高[3]。成功等基于多元线性回归、偏最小二乘回归、BP神经网络回归模型,分别建立土壤重金属(Cr、Zn、Ni)含量的反演模型,结果表明BP模型的Cr反演效果最好[4]。本文以承德某矿区的钒钛磁铁尾矿库为研究区,通过矿区尾矿样品采集并进行室内测试,再进行光谱与重金属元素检测,建立尾矿重金属含量反演最佳模型。

2 数据采集与处理

2.1 样品采集及测定

对河北省承德市某矿区尾矿库进行尾矿样本采集,取样深度为20cm,重量约为1000g。根据需要可以分层采集尾矿样品,共采集尾矿样品81个,采集的尾矿样品取样深度以及采集量基本保持一致。采集的尾矿样品用密封袋保存并且用手持GPS定位,同时对尾矿样点的情况进行记录。

影响光谱数据的有很多因素,所以需要对尾矿进行室内处理,通过对尾矿样品进行室内自然风干来降低水分影响,用橡胶锤敲砸、研具研磨来减小尾矿粒径影响,将处理后的尾矿过20目筛子,将过筛后的每个尾矿样品分为3份,其中一份用来测尾矿光谱,另一份密封保存备用,最后一份用来测理化性质再过100目筛子用来测重金属含量,采用四分法处理尾矿进行含量测定。参考《土壤农化分析》尾矿理化性质测定方法,使用酸溶消解法提取重金属元素,重金属提取态使用火焰法以及石墨炉法(岛津AA-6880)进行重金属含量测定[5]。

2.2 光谱数据采集以及预处理

本研究采用的是ASD Field spec4地物光谱仪进行光谱数据采样,光检测范围为30~2500nm,使用前先进行白板校正,待仪器稳定后再进行实验,实验过程中每检测5个样本,需要重新优化一次。每份样本采样间隔为1nm,共采集10次,并对10条光谱曲线计算平均值,作为该样点光谱标准曲线。对原始光谱(R)进行SG滤波变换(SG)、一阶微分变换(FD)以及二阶微分变换(SD)的数学处理。

2.3 重金属含量统计分析

实验检测了研究区尾矿样品重金属含量,并分析了其统计特征值(表1),在土壤学研究中,通常使用偏度系数、峰度系数来描述土壤测定数据分布情况、偏离对称性程度,变异系数来描述土壤性质的异常程度。本文利用统计分析可知,研究区尾矿重金属元素的均值、标准差、偏度系数、峰度系数及变异系数[6]。

根据重金属含量统计结果可知,该矿区尾矿库尾矿样本全量Cu平均含量为200.44mg/kg,含量范围为144.02~251.68mg/kg。标准差为22.82,偏度系数与峰度系数分别为-0.1、-0.3,变异系数为11.38%。全量Zn平均含量为168.78g/kg,含量范围为155.16~180.69mg/kg,标准差为5.48,偏度系数与峰度系数分别为-0.27、-0.43,变异系数为3.25%。全量Cr平均含量为454.52mg/kg,含量范围为141.16~739.71mg/kg,标准差为139.29,偏度系数与峰度系数分别为-0.41、-0.67,变异系数为30.65%。全量Pb平均含量为1.81mg/kg,含量范围为0.89~3.05mg/kg,标准差为0.69,偏度系数与峰度系数分别为0.13、-1.64,变异系数为38.24%。全量Cd平均含量为0.09μg/kg,含量范围为0.07~0.12mg/kg,标准差为0.01,偏度系数与峰度系数分别为0.15、1.96,变异系数为12.45%。土壤标准值参照GB15618-2018《土壤环境质量农用地土壤污染风险管控标准(试行)》pH>7.5。

根据偏度系数的程度可知:假如偏度系数在-0.5~0.5之间,那么数据是较为对称的;假如偏度系数在0.5~1之间(正偏度)或者-1~-0.5之间(负偏度),那么数据偏斜;假如偏度系数大于1(正偏度)或小于-1(负偏度),那么数据高度偏斜。如果峰度系数为0,则表示该总体数据分布与正态分布的陡缓程度相同;如果峰度系数大于0,则表示该总体数据分布与正态分布相比较为陡峭;如果峰度系数小于0则表示该总体数据分布与正态分布相比较为平坦,峰度系数的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。根据变异的程度可将变异系数进行等级划分,变异系数在0~15%之间分为小变异,变异系数在16%~35%之间为中等变异,变异系数在高于36%为高度变异。

从尾矿5个重金属的偏度系数来看,全量Cu、全量Zn、全量Cr、全量Pb偏度系数在在0.5~1之间或者-1~-0.5之间,是轻度偏斜,全量Cd是高度偏斜,偏度系数大于1。由峰度系数可知全量Cu、全量Zn、全量Cr峰度系数小于0,这几种重金属含量分布呈平顶峰趋势,由峰度系数可知全量Pb、全量Cd峰度系数大于0,这几种重金属含量分布呈尖顶峰趋势。根据全量Cu、全量Zn、全量Cd变异系数可知这3种重金属属于小变异,表明尾矿重金属含量在尾矿中的分布比较均匀,全量Cr变异系数为30.65%属于中等变异,全量Pb变异系数为38.24%属于高度变异,表明这两种重金属含量分布差异性较大。

3 结果与分析

将尾矿现场采样样品使用KS选择法2∶1分为建模集和验证集,并对研究区尾矿的原始光谱(R)进行以下3种数学预处理,光谱平滑去噪(SG)、光谱一阶微分(FD)、二阶微分(SD),并选取与重金属含量相关性最高的8个波段作为特征波段作为多元逐步回归(MLSR)的自变量,尾矿的重金属元素Cu、Zn、Cr、Cd、Pb分别作为因变量,分别建立多种光谱变换的尾矿重金属含量预测模型。并将验证集数据代入多元逐步回归模型中,并对模型的精度和稳定性进行综合评价(表1)。

多元逐步回归模型(MLSR)属于线性模型,该模型容易出现建模集过度拟合情况,导致建模集精度过高,验证集精度较低。从多元逐步回归尾矿各个重金属含量反演最优模型评价结果可知,在建模样本中,Cu最优模型R2小于0.6,模型拟合精度较低;Zn最优模型R2小于0.6,模型拟合精度较低;Cr最优模型R2小于0.6,模型拟合精度较低;Cd最优模型R2均小于0.6,模型拟合精度较低。Pb三种模型R2小于0.6,模型拟合精度较低。在验证集中Cu的R2低于0.6;Zn的R2低于0.6,综合来说二阶特征变换精度相对较高,但不具备样本重金属含量预测能力(RPD<1.4);Cr的模型不具备预测能力;Cd二阶微分特征变换预测模型精度R2小于0.6,RPD也均小于1.4,不具备模型预测能力,Pb二阶微分特征变换预测模型精度R2小于0.6,RPD也均小于1.4,不具备模型预测能力。综合来说,在多元逐步回归尾矿各种反演模型中,反演精度较高的是Zn,其他模型较低。光谱的微分变换能高建模样本和验证样本的精度,提高模型的预测能力。

从偏最小二乘尾矿各个重金属含量最优反演模型评价结果可知,在建模样本中,Cu一阶微分变换R2大于0.6,一阶微分特征变换具有较高的模型拟合效果,Zn一阶微分变换模型精度较高,Cr二阶微分变换具有较高的模型拟合效果,Cd最优模型R2均小于0.6,不具有较高的拟合效果,Pb最优反演模型R2均小于0.6,不具有较高的拟合效果。在验证集中Cu的模型R2小于0.6,不具有一定的样本预测能力(RPD<1.4);Zn一阶特征变换模型R2大于0.6,具有粗略的样本重金属含量预测能力;Cr最优模型R2小于0.6;Cd最优模型R2低于0.6,不具有的样本预测能力,Pb最优模型R2低于0.6,不具有的样本预测能力(RPD<1.4)。

从BP神经网络尾矿各个重金属含量最优反演模型评价结果可知(表2),在建模样本中,Cu二阶微分变换模型R2小于0.6,Zn一阶微分变换模型精度较高,Cr二阶微分变换具有较高的模型拟合效果,Cd二阶微分特征变换R2小于0.6,不具有较高的拟合效果,Pb一阶微分特征变换R2均小于0.6,不具有较高的拟合效果。在验证集中Cu的模型R2低于0.6,不具有样本预测能力(RPD<1.4);Zn二阶微分特征变换模型R2接近0.5,样本重金属含量预测能力较差(RPD<1.4);Cr一阶微分特征变换模型R2均小于0.6,PRD指数小于1.4,不具备样本重金属含量预测能力;Cd二阶微分特征变换模型R2低于0.6,不具有的样本预测能力(RPD<1.4),Pb一阶微分特征变换模型R2低于0.6,不具有的样本预测能力(RPD<1.4)。

表2 不同重金属对应的最优反演模型

4 结论

本章详细介绍了尾矿光谱建模方法以及模型精度评定方法,采用多元逐步回归模型(MLR)、偏最小二乘模型(PLS)、BP神经网络模型分别建立研究区尾矿重金属含量预测模型,并通过交叉验证法对建立的特征波段模型进行精度验证,并按照精度评定指标对模型进行精度评定,以选择各重金属元素的最佳特征波段反演模型。

(1)尾矿光谱经微分变换后,其与各重金属元素含量的相关性大多数变高,基于Cu、Zn、Cr、Cd、Pb建立的重金属含量反演模型,光谱经过微分特征变换后,几乎所有的模型建模集以及验证集精度都能显著提高。

(2)MLR模型精度普遍较低,基于多元逐步回归筛选剔除剩下的显著波段,构建ASD光谱信息PLS模型,能够有效地提高模型的预测精度。可以通过BP神经网络进行大量的模型训练,筛选出最优模型。

(3)模型精度整体偏低,PLS-FD反演Cu以及BP-FD反演Zn含量模型能够粗略预测尾矿重金属含量。

猜你喜欢

全量峰度微分
酰胺质子转移成像和扩散峰度成像评估子宫内膜癌微卫星不稳定状态
成都市温江区全力推进医保全量数据采集试点工作
扩散峰度成像技术检测急性期癫痫大鼠模型的成像改变
Ap(φ)权,拟微分算子及其交换子
拟微分算子在Hp(ω)上的有界性
多复变整函数与其关于全导数的微分多项式
上下解反向的脉冲微分包含解的存在性
大数据还是小数据?
随吟
基于自动反相校正和峰度值比较的探地雷达回波信号去噪方法