基于冠层高光谱数据与马氏距离的马铃薯品种识别
2018-09-10王卓卓何英彬罗善军段丁丁张远涛朱娅秋于金宽张胜利徐飞孙静
王卓卓 何英彬 罗善军 段丁丁 张远涛 朱娅秋 于金宽 张胜利 徐飞 孙静
摘要:为丰富高光谱数据在精细农业中的应用,本研究基于冠层光谱数据进行不同马铃薯品种区分研究。利用田间实测的6-8月的马铃薯原始光谱数据以及经过一阶微分、对数一阶微分、包络线去除处理后的光谱,采用马氏距离法选择3种马铃薯光谱差异显著波段,再利用逐步判别法检验波段识别精度。结果表明,7月份经过对数一阶微分变换选取的特征波段识别精度最高,达87.7%。不同生育期内,多种预处理方法下的光谱识别能力有差异。6月份包络线去除法的识别精度最高,7月份对数一阶微分处理下的识别精度最高,而8月份原始光谱的识别精度最高。提取的特征波段多位于红光及近红外波段。研究结果表明基于高光谱数据,借助马氏距离与逐步判别法可以区分马铃薯品种。
关键字:高光谱;马氏距离;马铃薯;品种识别
中图分类号:TP79
文献标识码:A
文章编号: 1000-4440(2018) 05-1036-06
高光谱遥感具有波段连续、光谱分辨率高的特点,在分析植被的反射光谱差异性方面有较大的潜力,能够更加准确地探测到植被的精细光谱信息,从而能更准确地识别作物,为作物的科学管理和高产高效提供技术保障。目前,高光谱数据相关研究主要是通过构建植被指数与提取光谱特征参数(包括光谱反射率、吸收谷、红边参数、面积参数等),借助BP神经网络、判别分析法、欧氏距离等方法对具有较强相似性的草地种、树种以及农作物种类进行精细分类。如王岽等基于光谱数据变换以及高光谱特征参数构建BP神经网络模型对8种常见农作物进行分类,张丰等的研究深入到作物品种层面,基于高光谱成像光谱仪获取的数据,采用混合决策树分类算法(分类节点上综合了最大似然法、光谱角匹配、马氏距离分类以及二值编码等方法)成功对6种水稻进行识别分类。
马铃薯是中国继玉米、水稻、小麦之后的第四大粮食作物,对于保障国家粮食安全意义重大。目前,有关马铃薯高光谱研究多集中于成熟收获后块茎的品质鉴别与品种分类,而关于马铃薯早期植株生长方面的研究较少。利用冠层高光谱进行马铃薯品种识别的研究鲜有报道。同种作物不同品种之间的光谱特征极为相似,它们之间的细微差别很难通过分辨率较低的常规遥感手段探测,本研究基于3种马铃薯关键生育期内的高光譜数据,通过微分及包络线去除等预处理,借助马氏距离选取特征波段,利用逐步判别分析法分析不同预处理方法下的马铃薯品种识别精度。研究区分不同品种健康的马铃薯植株在其关键生育期内的光谱变化特征,可以丰富作物精细分类的相关研究,为马铃薯精准田间管理提供科学依据。
1 材料与方法
1.1 试验设计
试验于2017年6-8月在吉林省长春市农业科技示范园区(124°99'E,43°66'N)进行。选取吉林地区广泛种植的早熟品种费乌瑞它以及中晚熟品种延薯4号、吉薯l号作为研究对象,为了研究方便分别记为:FW、JS、YS。3种马铃薯均在5月12日播种,每个品种种植2组,每组8垄,垄宽75~80cm,株距30—35cm,小区面积1.2mx6.5m。其他管理措施同大田。
1.2 数据采集
反射率光谱测量采用USB2000+便携式光谱仪测得。光谱范围为350—1050nm,光谱分辨率1.7~2.1nm,采样间隔0.44nm,信噪比250∶l。选取晴朗,无风无云的天气进行数据采集。光谱采集时间10∶00-14∶00(减小太阳高度角的影响),采集时传感器探头使用25。视场角,探头垂直向下。为了保证数据准确性,测量前采取标准白板进行校正。处理时,剔除每组中的异常光谱,取平均值作为每种作物的光谱。共计得到有效数据251条。
1.3 光谱数据预处理
由于受光谱仪自身以及温度、杂散光等外界因素的影响,所测光谱数据存在各种噪声。为了得到真实的结果,消除基线漂移等影响,需要对实测光谱数据进行预处理。预处理包括数据平滑与数据变换。
数据平滑方法选取S-G滤波法,它是一种在时域内基于局域多项式最小二乘法拟合的滤波方法。这种滤波器最大的特点在于滤除噪声的同时可以确保信号的形状、宽度不变。S-G滤波采用Origin8.0实现。
采用包络线去除与微分进行数据变换。包络线去除法可以有效突出光谱曲线的吸收和反射特征,并将反射率归一化为0~1.0,将光谱的吸收特征归一化到一致的光谱背景上,有利于与其他光谱曲线进行特征数值的比较,从而提取特征波段以供分类识别。包络线变化公式如下:
上式中,λ是波长j;RCj是波长j去除包络线后的值;Rj是波长i的原始光谱反射率;Rend与Rstart是在吸收曲线里的起始点和末端点的原始光谱反射率;λend与λstart是在吸收曲线里的起始点波长和末端点波长;K是在吸收曲线里起始点波段与末端点波段之间的斜率。
光谱反射值经对数变换后,不仅趋向于增强可见光区的光谱差异,而且趋向于减少因光照条件变换引起的乘性因素的影响。为了取得更好的效果,光谱数据经过对数变换后进行微分处理得到对数一阶微分数据。公式如下:
式中,(lgRAλi)为波长i与波长i+1之间的对数一阶微分光谱;lgRλi与lgRλ(i+1)分别为波长i与波长i+1求对数后的光谱反射率,△λ为波长i+1与波长i之间的波长差值。
1.4 逐步判别分析法
采用SPSS软件进行逐步判别分析,判别函数的系数选Fisher判别方程的系数,采用Mahalanobis距离方法(即马氏距离)逐步选择变量。计算公式如下:
式中,MDk为不同光谱曲线波段的马氏距离;X为不同光谱曲线在k波段的差值矩阵;k为均值向量:∑-1为协方差矩阵。
选取差异显著波段时,为剔除差异不显著的波段,规定马氏距离值要高于各波段的平均值。同时,为便于地物光谱仪实测光谱数据与高光谱遥感数据相结合,规定马氏距离值高的波段必须连续出现10nm以上方可入选。
2 结果与分析
2.1 光谱数据处理分析
本研究以2017年7月光谱数据为例进行具体的描述分析。原始光譜数据(图la)中,晚熟品种延薯4号7月份光谱与其他2种马铃薯的光谱差异较大。延薯4号的反射率光谱曲线总体上高于其他2种马铃薯,在750~850 nm附近,费乌瑞它反射率稍高于吉薯l号。一阶微分处理(图lb)对于区分3种马铃薯曲线作用不大。总体上,相对于费乌瑞它与吉薯1号,延薯4号的红边位置更加靠近蓝色波段。对数一阶微分处理(图lc)后3种马铃薯光谱曲线差异比较明显。400~500 nm处,延薯4号光谱曲线明显低于其他2种马铃薯,而在550~670nm.光谱曲线较高。3种马铃薯光谱曲线均在700nm左右达到峰值,此处3种马铃薯的光谱曲线差异明显。由图ld可知,包络线去除能够进一步增加400~700nm内延薯4号与其他2种马铃薯之间的光谱差异。
2.2 利用马氏距离法选取特征波段
特征变量的选择是农作物遥感分类的重要步骤,有效地使用多种特征变量是提高农作物遥感分类精度的关键。本研究借助马氏距离得到初步的光谱数据差异波段。马氏距离越大,说明3种马铃薯在此波段的差异性越大,越容易区分。4种光谱数据处理方法下的马氏距离由SPSS计算得到,以2017年7月数据为例进行分析,结果如图2所示。原始光谱数据中,大于平均值的波段范围大致在715—738nm、760~840 nm以及873nm之后。一阶微分处理后大于均值的波段范围在696~ 770nm.770 nm后的数据存在噪声,波动较大,因此不考虑在内。对数一阶微分处理后的光谱,在425~447nm波动较大,但存在连续大于平均值的波段,520nm处超过平均值的波段范围小于10 nm,忽略不计。其他波段马氏距离大于均值的波段范围处于660—678 nm以及687—736 nm。包络线去除后,400~446nm马氏距离大于均值,大于均值的2个波段分别位于655~695 nm以及731—748 nm。
2.3 判别结果及精度分析
采用逐步判别法对所选取的波段进行进一步选择,得到能够成功区分3种马铃薯光谱的特征波段,具体如表l所示。逐步判别分析法选取的有效特征波段范围多集中于红光波段与近红外波段。同时,6月份数据经过对数一阶微分及包络线去除处理后,也得到了一些位于绿光波段550 nm左右的特征波段,这与其他领域已有的研究结果一致。选取的特征波段的判别精度如表2所示。3种马铃薯光谱之间的差异程度随生育期不断变化。6月份,4种预处理方法下的判别精度较低。包络线去除法处理后的数据判别精度最高,为75.9%,而一阶微分变换后的数据判别精度仅为46.2%;7月份,3种马铃薯的光谱数据差异开始扩大,多种方法下的判别精度均升高,其中对数一阶微分处理后的识别精度达87.7%,原始光谱识别精度次之,为76.3%,一阶微分及包络线去除后的识别精度约68.0%;8月份原始光谱处理下的识别精度为81.8%,一阶微分及对数一阶微分等其他3种方法的识别精度为60.0%左右。
总体上,不同预处理方法表现最佳时所对应的时间不同。包络线去除识别精度最高出现在6月份,一阶微分与对数一阶微分处理结果最佳识别时间为7月份,而8月份时原始光谱识别精度最高。通过计算得到4种预处理方法对应的平均识别精度,对数一阶微分处理与原始光谱的平均识别精度最高,分别为71.73%和71.67%,其次是包络线去除法,其平均识别精度为70.07%,一阶微分的判别精度最低仅为59.33%。微分处理能够降低土壤等背景的影响,同时也会进一步放大光谱噪声。导致所选取特征波段不准确,判别精度降低。
3 讨论
马铃薯属于茄科作物,受块茎生长影响,在生长前期地下养分向上供应促进茎叶生长为马铃薯块茎形成做准备,而中后期(开花期后)主要转入供给地下茎促进果实膨大,因此不能将现有的水稻、玉米等禾本科作物的相关研究成果简单地套用在马铃薯上。本研究通过研究3种马铃薯关键生育期内的高光谱数据,得到以下结论:(1)经过微分、包络线去除等处理后的光谱数据选取的特征波段能够提高马铃薯品种间的识别精度;(2)选取的3种马铃薯光谱差异显著,波段大多位于红光及近红外波段,也存在少数波段位于绿峰附近,这些可作为作物识别的重点波段;(3)3种马铃薯光谱之间的差异程度随生育期不断变化。6月份,4种预处理方法下的判别精度较低。7月份光谱数据差异开始扩大,多种方法下的判别精度均升高;(4)不同预处理方法表现最佳时所对应的时间不同。包络线去除识别精度最高出现在6月份,一阶微分与对数一阶微分处理结果最佳识别时间为7月份,而8月份时原始光谱识别精度最高。研究结果表明,借助高光谱数据中的特征波段可以识别不同品种的马铃薯,将作物识别研究深入到同种作物不同品种之间,进一步丰富高光谱数据在作物识别的研究成果。
农作物遥感识别特征具有时间效应,不同作物的遥感识别特征随时间呈现动态变化的规律。根据作物之间的物候差异进行特征提取,是农业遥感中常用的方法。本研究通过分析比较多时期连续的光谱数据,找到目标作物之间差异最大的时期,对于确定最佳分类时相的遥感数据以及选择合适的数据更有实际指导意义。
不同光谱变换方法在一定程度上能消除外界扰动因素的影响,能够提高植物光谱分类识别精度。林海军等将经过微分、包络线去除处理后的4种树种的高光谱数据用于树种识别,发现光谱变换处理可有效提高树种的识别精度。其中光谱二阶微分处理后的识别精度最高,达95.5%;刘秀英等研究发现,对数变换后取一阶微分的光谱及植被指数对杉木和马尾松的识别精度最高。本研究借鉴已有研究成果,选取表现最优的数据变换方法,即对数一阶微分与包络线去除法进行研究,得到的结果较为理想。
提取差异显著的特征波段的算法多种多样,况润元等基于数据误差范围和植被光谱均值差提取湖泊湿地植被光谱差异波段;陈永刚等基于均值置信区间带选择区分不同树种的特征波段,并通过VBA宏和C#开发程序筛选出最佳区分波段;胡远宁等用光谱特征参量法、光谱指数法和光谱重排法提取光谱特征;王志辉等利用光谱微分、相关性分析、主成分分析提取光谱特征参数。由于马氏距离在树种识别及草地分类等领域的广泛运用,同时,逐步判别分析法能够筛选出对不同作物识别能力最大的波段,并显示识别精度。因此本研究采用马氏距离法进行提取,并用逐步分析法检验识别精度。马氏距离法属于基于类间可分性选取最优区分波段的方法,这是高光谱最佳波段选择的一个方向。
张富华等对草地种类进行识别,分类精度达80%;刘秀英等针对不同树种之间的识别精度均大于81%;张丰等对6种水稻进行识别分类,识别精度达80%以上。这主要是由于所研究的对象本身的光谱差异以及采用的数据变换方法、差异波段提取算法以及分类算法不同所引起的。
由于马铃薯的品种繁多,种植区域广泛以及地区之间气候条件的差异,不同地区种植的品种不同。因此,今后的研究可以扩展到南方冬作区、中原二作区等区域。对于分类算法,相关研究结果表明,在训练样本小的情况下,神经网络法算法(NN)优于判别分析法(DA)。后续的研究也可以对比分析神经网络法算法与判别分析法波段的识别精度的差异。