基于GF-2卫星数据的孕穗期小麦叶面积指数反演
——以河北省廊坊市为例
2018-03-06孟庆岩孙云晓孙震辉张琳琳
陆 坤,孟庆岩,孙云晓,3,孙震辉,3,张琳琳,3
(1.山东科技大学测绘科学与工程学院,青岛 266590; 2.中国科学院遥感与数字地球研究所,北京 100101; 3.中国科学院大学,北京 100049)
0 引言
叶面积指数(leaf area index,LAI)是评价植物群体生长状况的一个重要指标,当前遥感界对其有多种定义。本文定义为“LAI表示单位地表面积上所有叶片面积总和的一半”。LAI反映了地表植被的生物物理过程,如植被冠层的光线截获、植被的光合作用、呼吸作用及碳循环等[1]。目前,利用遥感手段反演LAI的方法主要有基于植被指数的统计模型法和基于辐射传输模型的物理模型法。2种方法区别较大,但又具有互补性[2]。针对不同模型,已有很多学者从不同角度、用不同方法研究了LAI的遥感反演问题,基于植被指数的统计模型可及时、无损地监测作物长势,但机理性较弱[3]。部分学者通过建立不同植被指数与LAI的关系,利用回归分析反演LAI,例如Yang等[4]分析了采用多种植被指数估算玉米LAI的精度,发现增强型植被指数(enhanced vegetation index,EVI)反演的精度要优于归一化植被指数(normalized difference vegetation index,NDVI); 任哲等[5]利用高光谱数据,基于交叉验证的方法优选了LAI反演模型,证明了该方法具有较高的精度; Meng等[6]针对国产HJ-1A CCD数据,引入“热暗点”因子,提出了环境植被指数(huanjing vegetation index,HJVI),在LAI反演过程中缓解了植被过早饱和现象,并取得了较高的反演精度; 张瀛等[7]则利用PROSAIL模型模拟的冠层反射率构建EVI反演模型,并利用交叉检验证明了EVI模型的普适性; 赵娟[8]利用多年地面实测多角度数据,将常规植被指数与角度指数相结合,构建针对小麦的LAI反演模型,并证实了该组合指数可以反演不同株型的小麦LAI。但大量研究表明,植被的生物物理、化学参数与光谱反射率之间的关系比较复杂[9]。神经网络对非线性拟合有较大优势,部分学者将其引入LAI反演中,取得了较好的拟合效果[10],例如陈健等[11]基于TM数据,利用神经网络对芦苇LAI进行反演,发现神经网络可以消除背景影响,提高反演精度; 包刚等[12]利用主成分分析(principal components analysis,PCA),在对高光谱数据降维的基础上,利用前9个主成分分量作为径向基函数(radial basis function,RBF)神经网络的输入矢量,构建LAI反演模型,并与传统回归模型进行了比较研究,发现神经网络反演LAI的精度明显优于传统回归模型。
目前,国产高空间分辨率卫星数据的精度已达亚m级,GF-2卫星影像具有高空间分辨率、高清晰度、信息量丰富及数据时效性强等优点,可以提供更多地物细节信息。因此,针对国产高分卫星数据的LAI反演模型优选和真实性检验亟待进一步研究。本文针对河北省廊坊市万庄镇的孕穗期小麦,选取GF-2卫星影像,采用多种回归模型对小麦的LAI进行拟合; 同时探讨采用PROSAIL模型结合神经网络进行LAI反演,并对反演结果进行精度验证; 分析不同模型反演LAI的精度和可行性,以期对利用GF-2数据反演LAI的应用潜力进行评估,并为高空间分辨率卫星影像的LAI反演提供参考。
1 研究区概况和数据源
1.1 研究区概况
研究区位于河北省廊坊市万庄镇国际农业产业园内,西部和北部与北京大兴区接壤,中心经纬度为116°35′E,39°35′N; 属温带大陆性季风气候,四季分明,光热资源充足,雨、热同季,有利于农作物生长。园区占地2 000亩*1亩= 0.066 7 hm2。,拥有各种实验设施和农作物样地; 园区外为农业用地,种植大面积小麦,可满足研究的要求。
实测数据是与遥感卫星影像同步获取的地面观测数据,包括37组远离道路和树木的2 m×2 m小麦样方,每个样方内均匀选择3个样点进行LAI和叶绿素含量测量。为避免因同一样方内小麦生长不均匀而导致测量结果存在较大的差异性,在保证样方内选点均匀的基础上,确保每次测量值之间的差异小于0.5,否则作为异常点去除,并重新选点。使用的测量仪器为美国LI-COR LAI-2200C植物冠层分析仪。样方采集日期为2016年4月21—23日,基本与GF-2卫星过境时间一致; 采集时间在7: 30—9: 00 am,采用180°遮盖帽遮挡镜头,以避免因太阳直射带来的测量误差。由于仪器的视角范围和小麦冠层高度均会对测量结果有一定影响,均将仪器高度设定为距离地面5 cm处,并在每一个样点测量1次天空光和4次LAI的平均值,作为该样点的有效LAI值。叶绿素含量的采集借助叶绿素仪SPAD502进行测量,对应LAI的采集方式,在相同样点测量叶绿素含量的相对值; 在采集过程中,对每一个样点采集2次,并把3个样点叶绿素含量的平均值作为该样方的实测叶绿素含量值。
1.2 GF-2影像数据及其预处理
采用GF-2卫星多光谱数据,获取时间为2016年4月22日,其波段设置见表1。
表1 GF-2卫星波段设置Tab.1 Band setting of GF-2
对GF-2卫星数据进行辐射定标、大气校正和几何纠正等预处理。通过大气校正消除太阳入射角、天空光散射及传感器观测角等干扰因素,将遥感影像原始DN值转换为地表反射率; 几何纠正则用于剔除地形等影响。FLAASH大气校正基于太阳波谱范围内(不包含热辐射)地表非均匀、朗伯面的模型[13],是目前精度非常高的大气校正模型。该模型是基于像元级的校正,可校正因漫反射所引起的连带效应(包括卷云和不透明云层),可调整因人为抑止而导致的波谱平滑。目前,使用FLAASH对多光谱、高光谱及航空影像进行大气校正分析,均取得了较好效果,也是目前使用最普遍的校正模型[14]。本文借助ENVI5.2软件,将下载的GF-2波谱响应函数制作成ENVI波谱数据库,利用FLAASH大气校正模型对GF-2影像数据进行大气校正,并利用影像自带的RPC文件进行无控制点几何纠正(图1)。
图1 FLAASH大气校正后植被反射率光谱曲线Fig.1 Spectral curves of vegetation reflectivity after FLAASH atmospheric correction
从图1可以看出,经过FLAASH大气校正,基本去除了空气中水汽等的影响; 在0.5~0.9 μm区间内,植被光谱反射曲线与实际植被光谱反射曲线基本吻合。
2 研究方法
针对GF-2卫星数据,结合小麦的地面实测数据,采用回归模型和神经网络模型分别进行LAI反演,对比回归模型与神经网络模型输出结果,分析不同模型的反演精度。
2.1 植被指数模型选取
利用植被指数反演LAI是指根据地面测定的植被冠层光谱数据或遥感观测数据进行相关性分析,建立遥感观测光谱数据或其变换形式(植被指数)与地面实测LAI之间的关系[15]。本文选取4种常用的植被指数类型(表2),并分别以线性、指数、对数和二项式4种形式与LAI建立回归模型,评价其拟合精度。
表2 本文使用的植被指数Tab.2 Vegetation indexes used in this paper
①式中:ρnir为GF-2卫星影像近红外波段反射率;ρred为红光波段反射率;L为土壤调节因子,本文取L=0.5;EVI2表示2波段增强型植被指数。
2.2 神经网络设计
2.2.1 PROSAIL模型拟合数据
PROSAIL模型是PROSPECT模型和SAIL模型的耦合[20]。PROSAIL模型将PROSPECT模型的输出参数——叶片透射率和反射率作为SAIL模型的输入参数,模拟植被的冠层反射特性[21],完成从地表植被理化、几何参数和光谱特性获取植被冠层光谱反射率的过程。大气校正后的卫星影像同样可以获得植被冠层反射率,从而将遥感影像与LAI通过物理过程联系起来[22]。
依据前人对PROSAIL模型输入参量做的敏感性测试,对模型影响最大的是LAI和叶绿素含量[23],故本文采用实测叶绿素含量参数作为PROSPECT模型的唯一调节参量,模拟出叶片反射率; 并将叶片反射率和LAI作为SAIL模型的输入,用以拟合植被冠层反射率。为了获取足够多的训练样本,本文利用SAIL模型拟合400组冠层反射率数据; 基于光谱响应函数将拟合的反射率数据重采样为对应卫星影像中心波长的形式,将该数据集和部分实测数据集作为BP神经网络的样本数据,并对3层BP神经网络进行训练及测试,实现LAI反演,并验证该方法的精度。
2.2.2 神经网络模型
反向传播人工神经网络(back-propagation artificial neural network,BP-ANN)具有自适应、自组织性和容错性能,适合模拟错综复杂的关系[11]。网络层数通常为3层,分为输入层、隐含层和输出层,通过一定量的样本学习和训练,确定网络有关参数。BP-ANN的结构如图2所示。
图2 BP-ANN结构示意图Fig.2 Sketch map for structure of BP-ANN
采用的BP-ANN是在MATLAB的基础上,建立植被冠层反射率和LAI的映射关系。本文输入层包含4个神经元,输出层为1个神经元,隐含层通过训练测试确定其神经元个数。通过优化样本输入,以冠层反射率数据作为BP-ANN训练的输入样本,将400组拟合冠层反射率数据结合光谱响应函数采样到中心波长处; 并将26组对应卫星影像反射率数据的实测LAI数据同样作为训练样本,实测数据的加入可更好地提高反演精度。
3 基于GF-2数据LAI反演模型构建
3.1 植被指数回归模型构建
以孕穗期小麦为例,利用实测冠层LAI数据与卫星影像中对应像元的植被指数,建立VI-LAI的回归模型,模型拟合如图3所示,拟合方程见表3,并采用决定系数(R2)和均方根误差(root mean square error,RMSE)2个参数进行精度评价。
(a) NDVI-LAI (b) RVI-LAI (c) SAVI-LAI (d) EVI2-LAI
图3VI-LAI回归拟合
Fig.3VI-LAIregressionfitting
表3 回归模型构建Tab.3 Regression models establishment
由表3可以看出,利用NDVI与LAI回归模型拟合的效果均高于其他模型拟合效果,其中以二项式拟合的精度最高,R2达到了0.718 5; 而利用其他植被指数构建的模型中,最高拟合精度都没有超过0.7。由此可见,针对小麦孕穗期利用NDVI构建回归模型的效果最好。
3.2 神经网络模型构建
根据研究需要,将BP-ANN设计为3层结构,具有1个输入层,共4个节点,分别表示对应卫星影像模拟的4个波段数据; 1个隐含层,由11个节点组成; 1个输出层,由1个节点组成(图4)。将400组拟合的反射率数据及26组实测数据作为BP-ANN训练数据,把另外11组实测数据作为测试数据(表4)。隐藏层没有固定的确定方法,本文根据2n+1(n代表输入层和输出层节点的总个数)确定隐含层节点的个数,故设置其节点数为11。由于神经网络拟合时具有一定的不确定性,故本文进行了5次拟合,分析预测LAI值与实测LAI值之间的误差大小,并将所有对应点的误差和作为评价拟合稳定性的参考因子。
图4 BP-ANN模型流程Fig.4 Flow chart of BP-ANN model
表4 神经网络模型测试结果Tab.4 Results of neural network test
神经网络5次预测LAI值与实测LAI值之间的误差和依次为2.867 200,2.566 900,2.416 012,2.647 072和2.798 720。可见,利用PROSAIL拟合数据和神经网络反演LAI具有较高的稳定性。
4 结果与分析
4.1 反演结果
根据上文分析,选择2016年4月22日获取的GF-2卫星数据,经过辐射定标和大气校正等影像预处理,选择经验回归模型中拟合效果最好的NDVI二项式反演模型和PROSAIL模型结合BP-ANN反演模型,反演河北省廊坊市万庄镇的小麦LAI,计算结果如图5所示。
(a) NDVI二项式回归模型 (b) 神经网络模型
图5LAI反演结果对比
Fig.5ComparisonofLAIinversionresults
由图5可以看出,万庄镇小麦主要分布在中部、西北部和西南部部分区域(研究区南部和东北部混合的大棚与果园等不作考虑),利用回归模型反演的小麦LAI值主要分布在2.0~3.0之间,部分区域的小麦LAI出现了异常值,西南部分区域反演结果比小麦孕穗期正常值大; 利用神经网络反演的小麦LAI值大部分在2.5~3.5之间,且反演结果分布比较均匀,LAI值超过4的情况较少,基本符合小麦LAI在孕穗期的生长状况。
利用训练好的BP-ANN显著提高了反演速度,并具有良好的稳定性。以往反演LAI大多基于中低空间分辨率卫星影像,为保证输入样本具有较大的差异性,很多研究者使用了较多输入样本进行网络训练,虽提高了反演精度,但增加了数据冗余。由于GF-2卫星数据具有高空间分辨率,可更详细地反映地物的光谱信息,故本文优化了输入样本,仅以多光谱波段冠层反射率作为BP-ANN的输入,以LAI作为输出,采用3层网络结构,并与优选的回归模型进行对比。实验结果表明,针对研究区小麦孕穗期,以拟合效果最好的NDVI二项式回归模型反演LAI的值整体偏低,且存在异常点的情况; 而利用BP-ANN模型的反演结果要比回归模型更接近现实小麦孕穗期生长状况。
4.2 验证与分析
本文实测数据与卫星影像具有较好的时间一致性,与所选验证点对应的GF-2影像清晰、无云,各波段数据质量良好。选择11组实测LAI对反演结果进行评价,反演LAI与实测LAI具有越高的R2和越低RMSE,表示反演结果越好。为保证卫星影像反演值与实测值在像元尺度上的匹配,采用样方内3个点的平均值与模型反演结果进行对比。由于回归拟合方法较多,本文优选了NDVI二项式回归模型进行实测数据验证,并与BP-ANN验证结果进行对比(图6)。
图6 LAI反演结果验证Fig.6 Verification of LAI inversion results
如图6所示,图中纵坐标为实测LAI,横坐标为反演LAI值,验证回归模型的R2和RMSE分别为0.719 3和0.393 6,神经网络模型的R2和RMSE分别为0.900 8和0.273 2。
综上所述,植被指数回归模型反演LAI结果整体偏低,且存在奇异点的现象; 而BP-ANN算法中实测点与模型估算结果均匀分布在回归直线的两侧,表明BP-ANN模型的LAI反演结果比回归模型反演结果更接近于实测LAI。由于GF-2卫星数据拥有高空间分辨率的特点,相比其他卫星数据更好地避免了混合像元带来的反演误差; 虽然高空间分辨率也受到了幅宽的限制,但针对特定区域的LAI反演仍具有较强的可用性。ANN算法近几年逐步应用到地表参数的遥感反演中。在前人研究中,应用到中低空间分辨率卫星影像时都已获得较好的反演结果,本文则证实ANN算法应用于GF-2卫星影像中同样取得了不错的效果,且针对载荷特点优化了网络样本输入,可为高分遥感数据的LAI反演实用化提供参考。
5 结论
针对国产GF-2卫星影像高空间分辨率等特点,以河北省廊坊市万庄镇为研究区,选择了不同的植被指数回归模型和PROSAIL模型结合神经网络进行LAI反演,得到如下结论:
1)在小麦孕穗期,不同植被指数对小麦冠层的响应不同,利用实测数据与不同植被指数拟合LAI的精度差距较大,其中,拟合精度最高的是利用NDVI建立的二项式估算模型,R2和RMSE分别达到0.719 3和0.393 6。
2)针对GF-2卫星载荷特点,重点探讨了综合PROSAIL模型和BP-ANN算法反演LAI的可行性及其反演精度,得到了稳定性高且精度良好的反演结果,经实测LAI数据进行精度验证,R2和RMSE分别达到0.900 8和0.273 2。
3)采用神经网络模型,优化了BP-ANN的训练样本输入,省去了部分准备工作,提高了反演效率,并取得了良好仿真效果; 与传统植被指数回归模型相比,利用神经网络反演LAI的精度远高于回归模型的反演结果,基于BP-ANN模型进行LAI反演的结果更加均匀、真实。
综上所述,通过与其他传统方法对比,证实了针对高空间分辨率卫星影像利用BP-ANN及地面实测数据进行LAI反演的可行性。经验证表明,针对河北省廊坊市小麦孕穗期得到的LAI反演效果较好; 在实际操作中,BP-ANN基于MATLAB工具箱进行修改获得,算法简便、高效,辅以较少样本的输入,具有一定的实用性。但本次研究仅在河北省廊坊市部分地区针对小麦孕穗期进行了一次地面实测验证,重点探讨针对高空间分辨率卫星不同反演方法的可行性,缺少不同区域、不同生育期的验证数据,有待今后进一步做更加全面、深入的研究。
[1] Chen J M,Cihlar J.Retrieving leaf area index of boreal conifer forests using Landsat TM images[J].Remote Sensing of Environment,1996,55(2):153-162.
[2] Pinty B,Lavergne T,Widlowski J L,et al.On the need to observe vegetation canopies in the near-infrared to estimate visible light absorption[J].Remote Sensing of Environment,2009,113(1):10-23.
[3] 李鑫川,徐新刚,鲍艳松,等.基于分段方式选择敏感植被指数的冬小麦叶面积指数遥感反演[J].中国农业科学,2012,45(17):3486-3496.
Li X C,Xu X G,Bao Y S,et al.Retrieving LAI of winter wheat based on sensitive vegetation index by the segmentation method[J].Scientia Agricultura Sinica,2012,45(17):3486-3496.
[4] Yang F,Sun J L,Fang H L,et al.Comparison of different methods for corn LAI estimation over northeastern China[J].International Journal of Applied Earth Observation and Geoinformation,2012,18:462-471.
[5] 任 哲,陈怀亮,王连喜,等.利用交叉验证的小麦LAI反演模型研究[J].国土资源遥感,2015,27(4):34-40.doi:10.6046/gtzyyg.2015.04.06.
Ren Z,Chen H L,Wang L X,et al.Research on inversion model of wheat LAI using cross-validation[J].Remote Sensing for Land and Resources,2015,27(4):34-40.doi:10.6046/gtzyyg.2015.04.06.
[6] Meng Q Y,Wang C M,Gu X F,et al.Hot dark spot index method based on multi-angular remote sensing for leaf area index retrieval[J].Environmental Earth Sciences,2016,75:732.
[7] 张 瀛,孟庆岩,武佳丽,等.基于环境星CCD数据的环境植被指数及叶面积指数反演研究[J].光谱学与光谱分析,2011,31(10):2789-2793.
Zhang Y,Meng Q Y,Wu J L,et al.Study of environmental vegetation index based on environment satellite CCD data and LAI inversion[J].Spectroscopy and Spectral Analysis,2011,31(10):2789-2793.
[8] 赵 娟.基于多时相多角度遥感数据的植被叶面积指数反演[D].南京:南京信息工程大学,2014.
Zhao J.Study of Leaf Area Index Inversion Based on Multi-Temporal and Multi-angular Remote Sensing Data[D].Nanjing:Nanjing University of Science and Technology,2014.
[9] Kokaly R F,Clark R N.Spectroscopic determination of leaf biochemistry using band-depth analysis of absorption features and stepwise multiple linear regression[J].Remote Sensing of Environment,1999,67(3):267-287.
[10] 宋开山,张 伯,王宗明,等.基于人工神经网络的大豆叶面积高光谱反演研究[J].中国农业科学,2006,39(6):1138-1145.
Song K S,Zhang B,Wang Z M,et al.Soybean LAI estimation with in-situ collected hyperspectral data based on BP-neural networks[J].Scientia Agricultura Sinica,2006,39(6):1138-1145.
[11] 陈 健,倪绍祥,李云梅.基于神经网络方法的芦苇叶面积指数遥感反演[J].国土资源遥感,2008,20(2):62-67.doi:10.6046/gtzyyg.2008.02.15.
Chen J,Ni S X,Li Y M.LAI retrieval of reed canopy using the neural network method[J].Remote Sensing for Land and Resources,2008,20(2):62-67.doi:10.6046/gtzyyg.2008.02.15.
[12] 包 刚,覃志豪,周 义,等.基于高光谱数据和RBF神经网络方法的草地叶面积指数反演[J].国土资源遥感,2012,24(2):7-11.doi:10.6046/gtzyyg.2012.02.02.
Bao G,Qin Z H,Zhou Y,et al.The application of hyper-spectral data and RBF neural network method to retrieval of leaf area index of grassland[J].Remote Sensing for Land and Resources,2012,24(2):7-11.doi:10.6046/gtzyyg.2012.02.02.
[13] Adler-Golden S M,Matthew M W,Bernstein L S,et al.Atmospheric correction for shortwave spectral imagery based on MODTRAN4[C]//Proceeding of the SPIE 3753,Imaging Spectrometry V.Denver,CO,United States:SPIE,1999,3753:61-69.
[14] 郝建亭,杨武年,李玉霞,等.基于FLAASH的多光谱影像大气校正应用研究[J].遥感信息,2008(1):78-81.
Hao J T,Yang W N,Li Y X,et al.Atmospheric correction of multi-spectral imagery ASTER[J].Remote Sensing Information,2008(1):78-81.
[15] Gonsamo A,Pellikka P.The sensitivity based estimation of leaf area index from spectral vegetation indices[J].ISPRS Journal of Photogrammetry and Remote Sensing,2012,70:15-25.
[16] Deering D W.Rangeland Reflectance Characteristics Measured by Aircraft and Spacecraft Sensors[D].College Station,Texas:Texas A and M University,1978:338.
[17] Chen J M,Pavlic G,Brown L,et al.Derivation and validation of Canada-wide coarse-resolution leaf area index maps using high-resolution satellite imagery and ground measurements[J].Remote Sensing of Environment,2002,80(1):165-184.
[18] Huete A R.A soil-adjusted vegetation index(SAVI)[J].Remote Sensing of Environment,1988,25(3):295-309.
[19] Jiang Z Y,Huete A R,Didan K,et al.Development of a two-band enhanced vegetation index without a blue band[J].Remote Sensing of Environment,2008,112(10):3833-3845.
[20] Baret F,Jacquemoud S,Guyot G,et al.Modeled analysis of the biophysical nature of spectral shifts and comparison with information content of broad bands[J].Remote Sensing of Environment,1992,41(2/3):133-142.
[21] 谷成燕,杜华强,周国模,等.基于PROSAIL辐射传输模型的毛竹林叶面积指数遥感反演[J].应用生态学报,2013,24(8):2248-2256.
Gu C Y,Du H Q,Zhou G M,et al.Retrieval of leaf area index of Moso bamboo forest with Landsat Thematic Mapper image based on PROSAIL canopy radiative transfer model[J].Chinese Journal of Applied Ecology,2013,24(8):2248-2256.
[22] 蔡博峰,绍 霞.基于PROSPECT+SAIL模型的遥感叶面积指数反演[J].国土资源遥感,2007,19(2):39-43.doi:10.6046/gtzyyg.2007.02.10.
Cai B F,Shao X.Leaf area index petrieval based on remotely sensed data and PROSPECT+SAIL model[J].Remote Sensing for Land and Resources,2007,19(2):39-43.doi:10.6046/gtzyyg.2007.02.10.
[23] 余金林.基于PROSAIL模型的青海湖流域草地叶面积指数反演[D].西宁:青海师范大学,2014.
Yu J L.Leaf Area Index Inversion of Grass in Qinghai Lake Basin Based PROSAIL Model[D].Xining:Qinghai Normal University,2014.