APP下载

基于无人机遥感与卷积神经网络的草原物种分类方法

2019-04-29杨红艳杜健民张燕斌张锡鹏康拥朝

农业机械学报 2019年4期
关键词:波段光谱物种

杨红艳 杜健民 王 圆 张燕斌 张锡鹏 康拥朝

(1.内蒙古农业大学机电工程学院, 呼和浩特 010018; 2.内蒙古工业大学机械工程学院, 呼和浩特 010051)

0 引言

草原是重要的地球生态系统,在全球气候变化和全球生态平衡中起着关键作用[1]。草原退化导致土地退化、沙化,沙尘暴等自然灾害频发,严重影响环境质量和生态平衡[2]。草原退化的一个显著特征是优势物种的改变,即在群落中可食、多年生的物种比例减少,不可食、一年生的物种比例增加[3]。研究表明,某些物种对草原退化具有重要的指示意义。例如,中国内蒙古东部典型草原的主要类型为针茅草原、克氏针茅草原和羊草草原,在过度放牧下出现不同程度的退化,最终趋向于以冷蒿为主的草原。中国内蒙古西部荒漠草原的主要类型为针茅草原和短花针茅草原,在过度放牧和干旱的共同作用下,冷蒿和无芒隐子成为群落中的优势物种。在退化程度更高的地区,猪毛菜和栉叶蒿等一年生物种逐渐在群落中占据优势[3-5]。虽然经过几十年的生态治理,草原生态环境已得到一定改善,但草原生态恢复仍任重道远。在草原退化程度加剧之前通过指示物种的监测发出预警,为草原生态环境管理提供动态和定量的监测数据具有重要意义。

遥感方法适用于大面积动态监测。多光谱遥感技术已实现草原植被群落水平的分类[6],然而,群落水平的分类只能反映草原退化的现状,不能反映与退化程度密切相关的物种构成,因而难以对草原生态的进一步恶化发出预警。高光谱遥感的光谱分辨率达1~10 nm,许多在多光谱遥感中无法探测的物质,在高光谱遥感中能被探测到,并能对相似地物利用连续的光谱数据寻找光谱差异进行区分。利用高光谱遥感技术进行农作物病虫害监测和生化参数估算已取得一定研究成果[7-9],但由于卫星遥感空间分辨率的限制和草原物种结构低矮、细小和混杂生长的特性,使卫星高光谱遥感在草原监测方面难以实现物种水平的分类。

无人机遥感技术具有时间、空间分辨率高的优点,与高光谱遥感技术结合,克服了卫星高光谱遥感的缺点,在精细农业监测和生态环境研究等领域发挥着越来越重要的作用[10-15]。如CAO等[16]采用多旋翼无人机搭载高光谱成像传感器获取遥感图像,鉴别了红树林物种。在草原监测方面,SCHMIDT等[17]实现了利用无人机高光谱遥感技术监测草原矮化灌木的分布。LU等[18]使用多旋翼无人机搭载数码相机,获得加拿大安大略南部科夫勒科学保护区的厘米级空间分辨率的遥感图像,识别出影响北美帝王蝶数量的乳草属植物。然而,对于草原优势物种、建群物种等物种水平的遥感监测,还未见报道。

高光谱成像的复杂过程导致数据非线性,使高光谱遥感图像分类仍较困难。深度学习中的卷积神经网络具有自主学习能力,善于处理复杂的多维非线性问题,能够自动分层次地提取特征,在图像分类中表现出更高有效性和更强鲁棒性。在遥感图像分类领域,卷积神经网络也显示出巨大潜力[19-20]。KUSSUL等[21]利用Landsat-8和Sentinel-1A卫星遥感图像对异质环境中的农作物(小麦、玉米、向日葵、大豆和甜菜)进行分类,通过对比卷积神经网络、全连接的多层感知器和随机森林分类方法,发现卷积神经网络的分类精度最高,作物的分类精度均超过85%。CHEN等[22]利用卷积神经网络实现了在不同高光谱数据集(Indian Pines data set、University of Pavia data set和KSC data set)的地物分类,证实卷积神经网络在高光谱图像领域的普遍适用性。

根据荒漠草原物种水平分类的需求,本文运用无人机高光谱遥感技术,采集荒漠草原植被高光谱图像,建立一种基于卷积神经网络的荒漠草原物种水平遥感分类的计算方法,以期实现荒漠草原重要生态物种分类,确定各物种的最佳识别物候期,为荒漠草原的退化监测提供基础数据。

1 材料和方法

1.1 研究区概况

试验在内蒙古农牧科学院四子王旗基地(41°46′43.6″N,111°53′41.7″E)开展,如图1所示。基地位于内蒙古自治区乌兰察布市四子王旗中南部的格根塔拉草原,该地区属于典型的中温带大陆性气候,年平均降水量280 mm,其中5—9月(植被生长季)的降水量约占年总降水量的80%以上。年平均温度3.4℃,其中6—8月平均气温最高[23]。格根塔拉草原属于荒漠草原,植被低矮、稀疏,平均高度为8 cm,覆盖率仅为12%~25%,主要由20多种植物组成。建群种为短花针茅,优势种为冷蒿和无芒隐子草,伴生种包括猪毛菜、栉叶蒿、银灰旋花、阿尔泰狗娃花、羊草等[24]。

图1 研究区卫星图像Fig.1 Google satellite image of study site

1.2 无人机高光谱遥感图像采集系统

使用深圳大疆技术有限公司的Matrice 600Pro型六旋翼无人机。该机的最大有效载荷为6 kg,满载时的飞行持续时间为16 min。采用专业级A3Pro飞行控制系统,配有3套惯性测量单元和全球导航卫星系统模块,用于精确定位和飞行姿态调整。使用成都四川双利合谱技术有限公司的GaiaSky-mini型高光谱成像仪,其光谱波长范围为400~1 000 nm,有256个光谱通道,光谱分辨率为3.5 nm。镜头焦距为17 mm,横向视场角为29.6°,空间维图像为696像素×700像素。光谱仪质量1.3 kg,用于控制飞行中图像采集和存储的采集控制器质量0.65 kg。无人机和高光谱成像仪如图2所示。

图2 无人机和高光谱遥感图像采集系统Fig.2 UAV and hyperspectral imaging system

1.3 无人机遥感系统数据采集及野外调查

短花针茅是中国荒漠草原的主要牧草,在蒙古和俄罗斯也有少量分布。冷蒿是一种耐牧、抗旱的牧草,具有北温带草原种的特性,在中国典型草原和荒漠草原均有分布,在退化的荒漠草原上成为优势物种[25]。短花针茅和冷蒿在群落中数量的增减对于判断荒漠草原退化程度具有重要意义。由于过度放牧和干旱的作用,近几年猪毛菜的数量在格根塔拉荒漠草原有明显增多的趋势,对荒漠草原退化进程的判断具有一定的指导意义。因此,本研究选择格根塔拉荒漠草原的建群种短花针茅、优势种冷蒿和伴生种猪毛菜作为研究对象。研究区(图1中黑色框区域)占地面积4.61 hm2,从2002年开始禁牧。在研究区内,设置150个样方,按10 m间隔等距分布,共15行10列。单个样方面积1 m×1 m。选择短花针茅样方45个,冷蒿样方45个,猪毛菜样方45个作为数据采集对象。样方的类别由样方内大于草总量90%的草的类别来确定,样方内其余10%的草为混杂生长的其他牧草。

无人机高光谱数据采集于研究对象的开花期(2017年6月17—24日)、结实期(2017年7月17—24日)和黄枯期(2017年9月17—24日),2017年8月,由于当地空域限制,无法进行采集。无人机高光谱成像系统采用无人机悬停、光谱仪内置推扫采集图像的工作方式。无人机飞行高度30 m,图像空间分辨率约2.3 cm。选择无风或风力小于2级,晴朗无云或云量小于2的气象条件,在10:00—14:00之间飞行采集数据。无人机每个架次飞行前后均进行标准参考白板校正。

野外地面调查包括样方植被组成、植被覆盖度和植被冠层图像采集。试验的前一年(2016年)降水充足,主要集中在6月和7月,6月的日最大降水量达到38 mm。整个植被生长季的累积降水量达到332.9 mm,高于多年平均降水量(280 mm),属于丰水年,植被生长状况非常好,特别是6月的降水使得猪毛菜的生长非常旺盛。试验年(2017年)降水量较少,主要集中在8月和9月,日最大降水量为13.6 mm。整个植被生长季累积降水量仅为153 mm,低于多年平均降水量(280 mm),属于干旱年[23]。野外调查和无人机高光谱数据采集同时开展,野外调查样方类别作为无人机采集图像物种分类结果验证的真值。

1.4 无人机采集图像数据预处理

首先通过人工目视检查图像质量,去除因阵风引起的变形图像;其次使用SpecView软件进行图像辐射校正,消除数据获取和传输过程产生的辐射失真或畸变,得到地物真实的反射率数据;最后采用线性平滑高斯滤波法进行图像降噪。

2 基于卷积神经网络的荒漠草原物种分类

2.1 荒漠草原物种特征波段选择

高光谱数据有上百个波段,波段间距窄,提供了丰富的地物光谱信息。但波段越多,波段间的相关性就越大,数据的冗余度也越大,同时也带来了海量数据存储和处理的技术难题[26]。特征波段选择用于从原始波段中提取能够有效代表地物特征、信息量大、相关性小且地物可分离性大的波段子集,本文通过分步法来寻找满足上述要求的波段组合。

因高光谱相邻波段间相关性大,距离远的波段间相关性小,但距离远的波段组合,其信息量可能并不大。为避免此类情况,首先将所有波段按其相关性分为6个相关性较弱的子集,在各子集内寻找特征波段(如反射率光谱曲线的极值点、拐点等)即信息量大的波段作为子集的代表波段。在选出的6个代表波段中,以任意3个波段为1组,计算20组波段组合的最佳指数因子(Optimal index factor, OIF)。将20组波段组合分别合成假彩色图像,用Jeffreys Matusita(JM)距离计算各类地物(短花针茅、冷蒿、猪毛菜、裸土、样方框)的可分性,最后选择OIF值最大且JM值大于等于1.8、相关系数小于等于0.3的一组波段作为最佳特征波段组合。

最佳指数因子的原理是:波段间相关性越小,波段的标准差越大,波段组合的信息量就越大。OIF计算公式为[27-28]

(1)

式中O——最佳指数因子

Si——第i个波段的标准差

Rij——第i波段和第j波段的相关系数

n——在所有波段中要选取的波段数

OIF值越大,所选择波段的结果越优。JM距离是基于条件概率理论的光谱可分性指标,其计算公式为[29]

(2)

式中J——JM距离X——像元

ωi、ωj——类别号

p(X/ωi)、p(X/ωj)——类条件概率密度,即第i、j个像元属于第ωi、ωj个类别的几率

JM值在0~2之间,其值越大代表像元的可分性越大[30]。

分步法特征波段选择的流程如图3所示。

图3 分步法特征波段选择流程图Fig.3 Flow chart of feature bands selection by step-by-step method

2.2 卷积神经网络分类

基于无人机平台的低空高光谱图像采集方法,使得到的高光谱图像的空间分辨率增高,细小地物构成的组合图案的纹理结构增强。经特征波段合成的假彩色图像的色彩差别增强。纹理结构和色彩差别的增强使得从航空影像上对荒漠草原物种分类成为可能。

卷积神经网络通过模仿人类视觉逐层认知物体的方式,很适合图像分类。卷积神经网络由卷积层、池化层和全连接层组成。卷积层与池化层配合,组成多个卷积组,逐层提取图像特征。网络底层识别图像边缘,上层识别特定形状,再高层识别特征[31]。卷积神经网络通过卷积的权值共享及池化降低网络参数的数量,使需要训练的参数数量大大减少,在缺乏大量训练数据的高光谱图像领域中具有极大优势[22]。

随机生成卷积神经网络模型的初始参数,使用梯度下降法使损失函数(交叉熵代价函数)最小化来逐层反向调节所有参数,通过多次迭代不断提高模型的精度,网络学习到的特征结合Softmax回归分类器实现图像分类。输入图像为特征波段选择后的3波段100像素×100像素的像元邻域,经过4层卷积和4层池化后,输入图像变为128维的矢量输入全连接层,经2层全连接层后输出,输出为样本的类别标签。训练过程中,使用小批量反向传播方法,每一批样本数为10,学习速率设为0.001,迭代次数为30,网络结构的具体参数如表1所示,表中C表示卷积层,P表示池化层,F表示全连接层。

表1 卷积神经网络结构Tab.1 CNN structure

由于多层卷积和池化能够提取对多种变形具有高度不变性的非线性特征,故可以通过对原始图像的拉伸、旋转来增加样本数量。本文100像素×100像素×3原始假彩色图像405个,其中测试集180个,其余图像通过拉伸、旋转增加至864个作为训练集和验证集,训练集、验证集样本数之比为4∶1。

3 分类结果与讨论

3.1 分类结果

采用分步法得到的特征波段如表2所示。

基于无人机高光谱遥感技术与卷积神经网络的

表2 荒漠草原物种光谱特征波段选择结果Tab.2 Bands selection results for desert grassland species

荒漠草原物种分类结果如表3所示。将野外调查样方的实测类别作为分类真实值,对采用上述特征波段选择与卷积神经网络方法分类结果进行精度评价,不同物候期的整体分类准确率平均值为94%,Kappa系数平均值为0.91。

表3 基于特征波段与卷积神经网络分类的混淆矩阵Tab.3 Confusion matrix based on feature bands and CNN classification

草原不同植物物种有着各自不同的生、繁、衰、枯的物候节律,在其光谱和图像上也有体现,结合光谱和物候特征,可提高相似物种的分类精度[32]。从物候角度来看,影响分类结果的因素如下:

(1)开花期指短花针茅处于开花期,此时冷蒿处于营养期,猪毛菜处于萌芽期。短花针茅圆锥花序狭窄,卷积神经网络从遥感图像上很难捕捉到此特征,可能是这一时期冷蒿和短花针茅图像相近的原因。一年生物种猪毛菜受降雨影响大,此时猪毛菜以枯枝(2016年生长的猪毛菜植株枯萎后的枯枝)为主,其反射率光谱、图像纹理和色彩与短花针茅、冷蒿区别大,容易区分。图4为不同物候期物种的特征波段合成的假彩色图像,图中开花期的红色代表绿色植被,白色代表猪毛菜枯枝。

(2)结实期指短花针茅处于结实期,此时冷蒿、猪毛菜处于营养期。随着气温升高及几次降雨,各牧草生长迅速,覆盖度增大。猪毛菜对水分供应高度敏感且对水资源利用效率高而生长最迅速,植株高度和地面覆盖度都超过了短花针茅和冷蒿。在纹理上形成大片丛生密集的形态结构;在色彩上和短花针茅、冷蒿有了明显区别。此时,冷蒿和猪毛菜相比,植株小且呈半匍匐状形态,从图4中可以看到,冷蒿的纹理为均匀分布的小颗粒状。图4中结实期的红色代表绿色植被,绿色代表裸土。

(3)黄枯期指短花针茅处于黄枯期,此时冷蒿处于结实期,猪毛菜处于黄枯期。此时猪毛菜茎秆的紫红色条纹愈加显著,与其它两种植被有明显的差异;短花针茅叶片逐渐开始枯黄;冷蒿的衰退最晚,从图像上看与上一时期相差不大。图4中黄枯期的紫色代表绿色植被。

图4 特征波段合成的假彩色图像Fig.4 False color images synthesized by feature bands

本研究中,猪毛菜在开花期、结实期的分类精度均较高,结实期的猪毛菜生长旺盛,是分类的最好时期;冷蒿在结实期的分类精度较高,此时冷蒿释放的强烈挥发性气味导致家畜不喜采食[33-34],因而是获得冷蒿分布的最佳时期;短花针茅在黄枯期的分类精度较高,此时适于遥感监测其分布。

3.2 讨论

图5 短花针茅、冷蒿、猪毛菜在4层卷积、池化后的权重可视化Fig.5 Visualization of weights after four convolution and pooling layers

由表3分类结果可知,本文提出的基于特征波段的卷积神经网络方法的分类精度较高。卷积神经网络分类精度高的原因有以下几方面。

对于高光谱数据的非线性,通过在每个卷积层后连接非线性激活函数ReLU来增加网络的非线性能力,从而较好地拟合非线性过程。此外,ReLU函数在一定程度上能够防止梯度消失,函数的单侧抑制性使得卷积神经网络中的神经元具有了稀疏激活性[35]。

由于高光谱图像难以获得大量训练样本,常常在训练样本上能得到很好的分类结果,但在测试样本上的分类结果却不好,也即出现了过拟合。本研究通过在网络最后几层全连接层的损失函数后增加L2正则化项,使权重衰减来避免过拟合。此外,Dropout策略也被用来防止过拟合,即在模型训练过程中设置一定比例的隐藏层节点,使其暂时不参与训练[36]。

高光谱图像数据特征的提取与卷积神经网络的权重密切相关,通过可视化可以观察权重在特征提取中如何起作用,图5为开花期荒漠草原物种的遥感图像经过4层卷积、池化的一个特征图权重的变化。图中颜色越浅,表明该点权重利用率越高。初始权重看起来杂乱无序,学习后的权重开始出现连续性和相关性。经过卷积后的图像对原图像有特征增强和降低噪声的效果;池化层利用图像的局部相关性,在保留有用信息的同时,使原图像的长和宽减半,减小数据量。

为进一步探索本文提出方法的适用性,比较了3种分类方法:基于主成分分析的卷积神经网络(PCA_CNN)、基于径向基核函数的支持向量机(SVM)、本文提出的基于特征波段选择的卷积神经网络(BS_CNN)。在PCA_CNN中提取前3个主成分,合成3波段假彩色图像作为卷积神经网络的输入。在SVM中,参数C和γ采用网格搜索在C为1×103、5×103、1×104、5×104、1×105和γ为0.000 1、0.000 5、0.001、0.005、0.01、0.1的范围内进行参数优选。3种方法的分类精度对比如图6所示。

图6 3种分类方法的分类精度比较Fig.6 Classification accuracy comparison of three classification methods

由图6可知,基于特征波段选择的卷积神经网络分类在总体分类精度、平均分类精度和Kappa系数3种评价方式下均得到最好结果。以开花期为例,BS_CNN比SVM的总体分类精度、平均分类精度和Kappa系数分别提高了9.73、9.48、14.55个百分点,比PCA_CNN的总体分类精度、平均分类精度和Kappa系数分别提高了10、10、15个百分点。

分析3种分类方法,SVM处理小规模样本效果较好,在处理如高光谱图像的大规模高维数据时,效果稍差。对非线性问题,核函数的选择更困难。使用CNN的两种方法中,PCA_CNN通过多维正交线性变换,将主要信息集中在前几个波段上。虽然保留了数据的主要信息,但保留的不一定是利于物体分类的特征。BS_CNN是根据分类对象的可分离性和波段的相关性选择的波段,因而保证了所选波段信息量大且利于物体分类,使其分类精度较高。

本文提出的基于特征波段选择的卷积神经网络分类方法,适用于大样本、高维、非线性数据的特征提取,应用于无人机高光谱低空遥感获得的高空间分辨率和高光谱分辨率的数据,能够对草原优势物种、伴生种(具有一定的聚集数量)进行分类识别,结合植物物种的物候,将有效提高其分类精度。草原物种分类的实现,为草原物种覆盖度的估算提供了必要的基础。在草原生态进一步恶化前,根据毒杂草,一、两年生适口性差的牧草的增加量及适口性好的优良牧草的减少量,对退化程度做出正确判断,及时采取有效措施,调整草原畜牧经营模式,并为草原生态恢复提供基础数据。

4 结论

(1)使用无人机搭载高光谱成像仪低空飞行采集图像的手段,获得了光谱、空间、时间分辨率均较高的遥感图像,利用高光谱特征提取和深度学习技术,实现了对内蒙古自治区格根塔拉荒漠草原退化指示物种的分类。

(2)充分利用植被的物候信息,有助于提高物种分类精度,尤其对于易混淆物种的区分。

(3)对比了BS_CNN、PCA_CNN和SVM 3种分类方法,其中BS_CNN分类精度最高。使用BS_CNN分类法,短花针茅在黄枯期分类精度最高,生产者精度95%,用户精度100%;冷蒿在结实期分类精度最高,生产者精度100%,用户精度95%;猪毛菜在结实期分类精度最高,生产者精度95%,用户精度100%。

(4)高光谱特征波段选取了3个波段。波段选择并不唯一,是在限定条件下的最优化。当采用更多波段作为特征时,可能会提高精度。但波段增加,波段间的相关性和运算复杂性将增大,最适宜的波段个数需要在进一步的研究中分析确定。

猜你喜欢

波段光谱物种
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
基于3D-CNN的高光谱遥感图像分类算法
高光谱遥感成像技术的发展与展望
回首2018,这些新物种值得关注
电咖再造新物种
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
世界上的15个最不可思议的新物种