玉米叶片铜污染的EEMD-MA-FD 光谱诊断模型
2019-04-22杨可明
程 凤,杨可明*,王 敏,2,李 燕,高 鹏,张 超
(1.中国矿业大学(北京)煤炭资源与安全开采国家重点实验室,北京 100083;2.华北理工大学,河北唐山 063210)
重金属的空间分布及其对生态系统结构功能的影响一直备受关注,其监测与治理已成为国内外科研工作的热点[1-3]。根据2014年发布的“全国土壤污染状况调查报告”[4],我国重金属污染问题严峻,全国污染物的总超标率约为16%,其中铜污染物点位超标率达2.1%。重金属污染具有累积性、隐蔽性、不可逆转性等特点,其在土壤、水体中的富集会对生物有机体产生严重影响。部分重金属离子(如Cu2+)是植物新陈代谢的必要元素,但过量的重金属会对植物细胞产生毒害[1]。并且还会阻碍植物的光合作用,抑制光合产物的输配,影响农作物产量[5-6]。一定浓度的重金属会在植物的根、茎、叶、籽粒部位产生不同程度的累积,进而通过食物链进入人体,危害人类健康。近60年,学者已对植物重金属的吸收和迁移做了大量研究,并提出了土壤-植物系统中元素解吸、迁移、吸收的联合数学模型[7]。重金属污染的监测与治理方面相继发展出物理、化学、生物等方法。传统的植物重金属污染监测方法需使用专业仪器设备、定期观测采样来实现,成本高、过程繁琐、费时费力。而高光谱遥感技术具有较高的光谱分辨率、生化成分反演能力强、便捷、可操作性高和视野宽等优点,为实现大范围实时动态监测提供了可能[8]。因此运用高光谱遥感监测农作物重金属污染是一项具有一定优势的遥感前沿技术。
近年来,有很多学者采用光谱数据的多阶微分、微分光谱角正切、小波变换、经验模态分解(Empirical mode decomposition,EMD)等方法[8-11]对植物叶片原始光谱进行变换以提取反映重金属污染的异常信息,探究不同浓度重金属胁迫下植物的生长状况。就光谱变换与分解方法而言,小波变换缺乏自适应性,必须根据光谱信号的特征选择合适的小波基进行分析,而EMD能以信号本身的局部时间尺度来进行分解,具有良好的自适应性,但分解过程存在模态混叠现象[12]。集成经验模态分解(Ensemble EMD,EEMD)方法克服了模态混叠这一缺点,已经广泛应用于心电信号处理[12]、电力系统故障信号检测[13]、混合信号分离识别[14]等不同领域,同时在土壤剖面反射光谱消噪方面也取得了一定进展[15]。Mallat算法是基于小波分析改进的信号分解和重构方法,已用于数字图像处理[16]、雷达回波去噪[17]、图像增强变换[18]、空气质量指数预测[19]等方面。本文利用EEMD克服模态混叠这一优势,结合MA算法和光谱的分形维数(Fractal dimension,FD)方法,构建不同浓度Cu2+胁迫下玉米叶片污染信息的EEMD-MA-FD光谱诊断模型,用于探测玉米叶片在不同Cu2+污染程度下的光谱弱差信息,为农作物重金属污染监测提供一种新的高光谱遥感应用思路或方法。
1 材料与方法
1.1 胁迫实验与数据采集
1.1.1 植株培养
实验选取“密糯8号”玉米作为研究对象,采用有底漏花盆培育玉米种子。对栽培所用颗粒土壤进行碾碎、去除石子及草根杂质、过筛等处理,以逐层喷洒、翻土混合的方式将不同浓度CuSO4·5H2O与土壤充分搅拌均匀并标注相应胁迫浓度。根据《土壤环境质量标准》(GB 15618—1995)中土壤污染标准设置Cu2+胁迫浓度分别为 0、200、400、600、800 μg·g-1,记为CK、Cu(200)、Cu(400)、Cu(600)、Cu(800),同一浓度设置3组平行样,共15盆。其中CK组为空白对照组,土壤中本身含有Cu2+,3组平行样Cu2+含量均值为19.6 μg·g-1。2017年5月10日对玉米种子进行催芽处理,5月12日栽培植株,且于生长期定期浇灌并添加适量NH4NO3、KNO3、KH2PO4营养液,培育期间保持各盆栽生长环境一致且通风良好。
1.1.2 光谱数据获取
2017年7月19日,玉米穗期,在暗室内进行光谱数据采集。采用350~2500 nm波谱范围的SVC HR-1024I高性能地物光谱仪进行测定,测量过程使用50 W的卤素灯作为光源和25°视场角的探头,探头垂直于叶片表面5 cm。为了防止其他物体对玉米叶片光谱的影响,将玉米叶片裁剪后,在遮盖黑布的实验台上进行测定。使用专用白板标准化光谱反射系数。实验选取位于植株上、中、下部位具备代表性的新、中、老叶片的叶中位置进行光谱数据测量,各叶片每次测取3条光谱,取平均值作为最终结果。不同胁迫浓度下玉米叶片均值光谱数据如图1所示。
1.1.3 玉米叶片Cu元素含量测定
各项实验完成后,采集各胁迫浓度的玉米叶片,进行冲洗、烘干、粉碎等处理,对各个样品封装保存并进行标注、编号。在相同规范条件下,经微波处理后,采用电感耦合等离子发射光谱仪(ICP-OES)对已进行光谱数据采集的老、中、新叶片分别进行Cu元素含量测定,取均值作为每组胁迫浓度叶片Cu2+含量,所测结果如表1。
1.2 研究方法
1.2.1 集成经验模态分解(EEMD)
图1 不同Cu2+胁迫浓度下玉米叶片光谱曲线Figure 1 Maize leaf spectra curves stressed by different Cu2+concentrations
表1 玉米叶片中Cu2+含量(μg·g-1)Table 1 Cu2+content in maize leaves(μg·g-1)
EEMD由Wu等[20]提出,主要用于解决EMD存在的虚假分量和模态混叠问题[21]。EEMD的核心是通过多次在原始信号中加入等长度的正态分布白噪声序列,以保证不同尺度信号区域自动映射到与背景白噪声相关的尺度上。将信号和噪声重新组合为一个整体,视为待分解信号,对其进行多次EMD分解,对每次分解的本征模态函数(Intrinsic mode function,IMF)取均值,作为最终结果。需要注意的是,由于每次EMD分解时人为添加的白噪声不同,且噪声之间不具备相关性,因而每次分解所得的IMF分量均会存在微弱差异,当使用足够测试的全体均值时,人为添加的噪声就会被抵消,信号本身是稳固持久的[20]。设一条原始的光谱信号为x(t),则其EEMD处理步骤如下:
Ⅰ为原始光谱信号数据添加一个正态分布的白噪声序列xm(t),即
式中:k为加入背景白噪声的幅值系数;nm(t)为第m次加入的白噪声。
Ⅱ将带有白噪声的光谱信号数据分解成一组IMF分量。
Ⅲ重复执行步骤Ⅰ和步骤Ⅱ,但每次加入不同的白噪声序列。
Ⅳ将每次获得的IMF分量各自取均值作为最终结果。
式中:ci,m为第m次EMD分解得到的第i个分量;N为EMD分解的次数。
1.2.2 Mallat算法(MA)
Mallat算法(记为MA)是由Mallat受塔式算法启发于1988年提出的正交小波构造方法,是一种建立在多分辨率基础上进行的分解和重构算法[22]。MA主要是把信号分解为离散平滑分量和离散细节分量,若一光谱信号f(t),Aj为f(t)在第j层低频部分(近似部分)的小波系数,Dj为f(t)在第j层高频部分(细节部分)的小波系数,则MA分解光谱信号的具体算法为[23]:
式中:t为波长;j为层数,j=1,2,…,log2N;k为离散平移位置,k=1,2,…,N;H、G为滤波器系数。可见,Aj是通过第2j-1尺度的小波系数Aj-1与分解滤波器H卷积获得,Dj是通过第2j-1尺度的小波系数Aj-1与分解滤波器G卷积获得[23]。
1.2.3 分形维数(FD)
分形理论是一种非线性科学理论,可根据某物质的自相似性描述复杂无序、标度不变的系统,探究混沌事物内部结构[24]。FD是刻画分形体复杂结构的重要工具,反映了复杂形体占有空间的有效性。计算FD的方法有很多,例如量规法、盒维数法、结构函数法等[25-26]。本文采用盒维数法计算光谱曲线的FD,记为D,则[27]:
式中,设A是非空集合,在欧式距离下,用边长为1/Tn的小盒子紧邻地包含A,其中Nn(A)表示包含A所需要的最小盒子数,D为集合A的盒维数。
2 模型应用过程
结合EEMD、MA和FD理论与方法,用于不同胁迫浓度下玉米叶片光谱的Cu污染诊断分析,称为玉米叶片Cu2+污染信息的EEMD-MA-FD光谱诊断模型。
2.1 光谱数据的IMF分量提取
玉米叶片光谱信号可视为非线性非稳态信号,对不同胁迫浓度的光谱进行EEMD处理,为保证分解有效性,加入的白噪声幅值通常设置在0.01~0.5之间,EMD分解次数设置在100~300之间[20]。本次添加白噪声幅值系数k=0.01,执行EMD总次数为300次。分解后获得各阶IMF(CK时光谱分解的各阶IMF如图2所示),光谱信号可分解为10阶IMF分量和1阶残余项r。EEMD分解的每一阶IMF分量的振幅与频率均不同,每阶IMF分量在各自特征尺度上具有不同的变化特性。选择可见光及近红外部分波段波长范围在410~780 nm进行探究,对原始光谱反射率与各阶IMF分量之间进行相关性分析,相关系数如表2所示。根据表2,比较各IMF分量与原始光谱反射率的相关性,IMF4分量和IMF7分量与原始光谱反射率的相关系数较高,分别为0.755、0.811。并且原始光谱具有在0.54 μm附近形成反射峰,在0.76 μm附近反射率急剧上升的特征,IMF4分量较IMF7分量具有与原始光谱相似的特点,很大程度上保留了原始光谱的特征信息,因此选择IMF4分量对监测重金属Cu2+污染程度具有一定意义。
图2 玉米叶片光谱曲线及各IMF分量Figure 2 Maize leaf spectra curves and various components of IMF
表2 各阶IMF分量与原始光谱相关系数Table 2 Correlation coefficient between IMF components and original spectra
2.2 IMF4分量信号滤波
对不同Cu2+胁迫浓度的IMF4进行MA变换处理,IMF4分量被分解为逼近信号(sig1)和细节信号(sig2),分解结果如图3所示。分析图3发现,不同胁迫梯度sig1与sig2信号在不同波长所对应的振幅与频率均不相同。信号高频部分一般包含突变特征和细节信息等,不同胁迫梯度IMF4分量经过MA低通滤波处理后,分解所得的低频部分(sig1)中细节信息消失,噪声成分被有效去除;经MA高通滤波处理后,IMF4分量中低频部分数据被零替代,高频部分(sig2)保留。
2.3 sig1、sig2信号的污染信息诊断
基于IMF4分量分解的sig1信号和sig2信号计算曲线的分形维数,将结果与相应胁迫浓度玉米叶片Cu2+含量进行相关性分析。sig2分量曲线分形维数与玉米叶片Cu2+含量之间相关性较弱,而sig1信号具有一定的稳定性,其曲线分形维数与对应胁迫浓度玉米叶片Cu2+含量相关性较强,可用指标值刻画其变化情况。将sig1信号分形维数结果记为EEMF,EEMF随玉米叶片Cu2+含量增加而降低,如图4所示,相关系数为-0.942 2。
图3 不同胁迫浓度IMF4分量Mallat变换分解结果Figure 3 The results of Mallat transform decomposition of IMF4 components with different stress gradients
3 模型验证
3.1 EEMD-MA-FD模型优越性验证
EEMD-MA-FD模型的EEMF随着玉米叶片Cu2+含量增加而降低,为了验证模型的优越性,将模型运用结果分别与传统的监测参数蓝边最大值、红边最大值、红肩最大值进行对比,传统参数的具体定义如表3所示,分析结果见图5。蓝边最大值与叶片中的Cu2+含量呈正相关,相关系数为0.907 5,红肩最大值与叶片中Cu2+含量呈负相关,相关系数为-0.801 8,而红边最大值与叶片中Cu2+含量无明显相关性。将经EMD分解、MA变换处理后的分形维数结果记为EMF,分析发现EMF与玉米叶片Cu2+含量无明显相关性,如图5d所示。由此可证明EEMD-MA-FD模型对监测重金属污染程度具有优越性。
3.2 EEMD-MA-FD模型稳定性验证
图4 叶片Cu2+含量与EEMF拟合结果Figure 4 Fitting results on the EEMF and the Cu2+contents of leaves
表3 玉米叶片的光谱特征参数名称及定义Table 3 The name and definition of spectral characteristic parameters of maize leaves′
为了验证EEMD-MA-FD光谱诊断模型的稳定性,利用2016年培育的“中糯1号”玉米光谱数据进行对比验证。随机选择Cu2+胁迫浓度为0、400、800 μg·g-1的玉米叶片原始光谱数据作为研究对象,计算各胁迫浓度光谱在EEMD-MA-FD模型的EEMF值,并选择红肩最大值与其作对比,结果如图6所示。EEMF随土壤重金属胁迫浓度的增加呈下降趋势,且与玉米叶片Cu2+含量呈负相关,相关系数为-0.993 7。红肩最大值与叶片中的Cu2+含量无明显相关性。由此可证明EEMD-MA-FD模型稳定性较强,对各品种玉米光谱均可进行良好监测。
4 结论
图5 叶片Cu2+含量与各监测方法计算值的拟合结果Figure 5 Fitting results on the computing values of the monitoring methods and the Cu2+contents of maize leaves
图6 叶片Cu2+含量与EEMF和红肩最大值的拟合结果Figure 6 Fitting results on the EEMF and the maximun of red shoulder and the Cu2+contents of maize leaves
本研究探索性地将EEMD应用于玉米叶片高光谱微弱信息提取中。结果表明,经EEMD分解后IMF4分量与原始光谱相关性较高,并有效抑制噪声。同时结合Mallat算法及盒维数法分形维数构建EEMD-MA-FD光谱诊断模型,并与蓝边最大值、红边最大值等传统监测方法及经EMD分解、MA变换后的分形维数结果分析比较。EEMD-MA-FD模型的EEMF值与玉米叶片Cu2+含量相关性较强,能有效甄别不同Cu2+胁迫浓度的光谱差异,而传统监测方法及EMF值与叶片Cu2+含量均未达到此效果,验证了EEMD-MA-FD模型的优越性。利用另一实验数据对EEMD-MA-FD模型进行的普适性分析,表明EEMDMA-FD模型能够在微弱的光谱差异中识别污染光谱信息,可作为玉米Cu2+污染监测的一种新方法。