APP下载

样本量对叶面积指数遥感经验建模精度影响研究

2014-06-12,,,

土壤与作物 2014年4期
关键词:样本量叶面积经验

,,,

(1.中国科学院 东北地理与农业生态研究所,吉林 长春 130102;2.中国科学院大学,北京 100049)

0 引 言

叶面积指数(LAI,Leaf Area Index)是指单位面积上植物叶片的垂直投影面积的总和,它不仅是进行生物量估算的一个重要参数,也是定量分析地球生态系统能量交换特性的重要参数,还是对农作物产量估算的一个重要参数[1]。获取准确的LAI对于生态系统的生物物理过程的监测和分析十分重要[2]。

随着遥感成为生态学研究的一种重要工具,人们越来越重视通过卫星遥感来测量或估算LAI。目前LAI遥感反演方法主要有两种,分别是经验统计方法和物理模型方法[3]。相比物理模型方法,经验统计方法理论基础不够完备,模型的有效性受到遥感和地面观测条件的限制,一种经验模型只对建立该模型的地区和时间适用。但是物理模型反演方法的理论机制较为复杂,参数输入较多,需要大量的计算时间,且模型的逆向推算并不总是收敛[4]。因此,在物理模型失效的情况下,经验统计方法因其简便、适用性强,依旧盛行。

遥感经验模型通过直接建立地面采样数据与遥感变量数据之间的统计关系对地表参量空间分布进行预测[5-6],地表参数采样数据是该类模型构建的主要数据源,其数量多少直接影响着遥感经验模型的构建精度[7]。LAI随着植被的生长呈现动态的变化,因此,LAI经验建模对地面样本采集数量的要求会更高[8]。一般来说,样本容量越大,样本的代表性就越好,建模的精度也就越高,但耗费的人力、物力也就越多,甚至难以完成。相反,如果样本量太小,其建模精度不能够满足需求。因此,综合建模精度以及采样效率寻求合适的样本数量对于LAI遥感经验建模至关重要。

目前研究人员在LAI遥感经验建模的采样方案设计中,通常按地表覆盖类型对研究区加以分层[2,5,9-10],再依据经验来设定每层样本量的大小,对于样本量对建模精度的影响研究较少。有鉴于此,文章对单一地表覆盖类型的研究区采用不同样本量的采样数据构建经验模型来反演LAI,以此来探究样本量对于建模精度的影响。

2 研究区与数据

2.1 研究区概况

文章选择中国黑龙江省北安市内的红星农场玉米地块作为研究区,见图1。红星农场(48°02′ N~ 48°17′N,126°47′ E~ 127°15′E)位于小兴安岭南麓,轱辘滚河畔,区域面积为3.92万hm2,其中耕地2.73万hm2。该区域属寒温带大陆性季风气候,四季分明,全年平均降水555.3 mm,年均温大于10℃,活动积温为2 250.1℃。耕地属黑土类型,土质肥沃,宜于耕作,有利于农作物生长。主要作物有玉米、大豆、白菜等,均为大面积种植,2013年玉米种植面积达0.60万hm2。由于耕地多为丘陵漫岗,岗大坡长,因此耕地地形起伏较大。农场以旱作为主,随地形变化玉米生长状况存在着较大的空间差异。

图1 研究区位置Fig.1 Location of the study area

2.2 数据与遥感模型

2.2.1遥感数据获取与处理。文章使用的是Landsat8 TM遥感影像数据,获取时间为2013年7月12日。首先使用ENVI5.0进行TM遥感影像数据的辐射定标与FLAASH大气辐射校正,然后用红星农场的边界图层对区外影像进行遮盖,得到研究区的遥感影像数据。

LAI遥感经验模型是通过空间采样而建立遥感植被指数与叶面积指数之间统计关系的,它可被用来获取整个研究区的LAI空间分布信息。根据前人研究成果,文章选择NDVI作为遥感经验模型的自变量,同时它也成为LAI分层抽样设计的辅助变量。NDVI的计算公式如下:

NDVI=(RNIR-RR)/(RNIR+RR)

(1)

式中:RNIR—近红外波段的光谱反射率数据;RR—红光波段的光谱反射率数据,将该公式应用于研究区遥感影像数据,得到遥感变量NDVI影像数据。

七月中旬玉米正处于抽雄吐丝期,大豆处于早期生长阶段,而白菜等经济作物尚未种植,相对于其他作物而言,玉米正处于生长最为旺盛时期,其NDVI值与其它作物之间有着明显差异。本文根据玉米地块纹理与实地调查资料,通过对研究区NDVI数据进行图像分割,得到玉米地块空间分布数据。为了检验玉米地块的目视解译精度,从获取的玉米地块分布图上随机选择30个验证样点,通过实地调查资料与人工判读结果之间的对比,建立目视解译的误差矩阵,计算得到玉米地块解译的总体精度为93.3%。图2展示的是研究区玉米地块植被指数NDVI的空间变化状况。

图2 红星农场玉米地块NDVI分布图Fig.2 NDVI distribution of corn in Hongxing farm

2.2.2遥感经验模型。在实地LAI样本测量中,由于采样点数目有限,难以获取覆盖整个研究区LAI空间分布测量数据。为了全面探讨在不同数量样本数据下建立的LAI经验模型精度的差异,地表参量LAI的地面测量数据不是采用实际测量方法,而是采取基于遥感经验模型的LAI空间分布模拟生成方式。假定整个研究区地表参量LAI空间分布数据与遥感变量数据之间存在完美函数关系,即:

LAI= f(NDVI)

(2)

式中:LAI—研究区任意位置处的叶面积指数,它是以遥感植被指数NDVI为自变量的确定性函数。许多致力于LAI遥感反演问题研究的学者通过建立遥感变量数据NDVI与地面实测LAI数据之间的统计关系来构建LAI遥感经验模型[11-15]。Liu J等[15]根据植被指数与LAI构建的回归模型估计加拿大渥太华地区作物的LAI,结果表明NDVI与LAI构建的回归模型对于玉米LAI的估算具有较高的精度,其决定系数达0.94。同时,渥太华地区的纬度与本研究区域的纬度基本一致,玉米生长状况也较为相似。因此,本文将该回归模型设定为适合研究区的理想化LAI遥感预测经验模型,

LAI=-1.5456*ln(1.081*(1-1.017*NDVI))[15]

(3)

然而,由于存在LAI实地测量与NDVI影像数据之间时空匹配不精确、NDVI对LAI的解释能力不足、LAI实地测量误差、以及遥感数据辐射纠正与几何校正误差等一系列问题,使得地表参量LAI与遥感变量NDVI之间关系不是完美的确定性关系,而是一种随机统计相关关系。为此,需要对模型(3)加入正态分布形式的随机噪声,以模拟上述干扰因素导致的随机统计相关关系,相应的数学模型表示为:

LAI=-1.5456*ln(1.081*(1-1.017*NDVI))+ε

(4)

式中:ε—LAI预测的随机误差。

上述模型本质上为调查区域的总体遥感经验模型,而调查区域LAI总体的测量数据模拟主要包括两个步骤:首先,将研究区遥感变量NDVI数据代入到公式(3),得到整个研究区LAI总体空间分布的完美模拟数据;Liu J等[15]指出模型(4)对于玉米样本的均方根误差为0.65,据此产生均值为0而变动标准差为0.65的高斯噪声,并将其加入到LAI完美模拟数据之上,最终得到覆盖整个研究区的LAI总体空间分布模拟数据。图3是通过遥感经验模型生成并加上随机噪声的研究区LAI总体空间分布模拟图像。

图3 LAI地表模拟数据Fig.3 Simulated data of LAI

2.3 数据处理

采用不同的样本量对研究区进行随机抽样以构建LAI经验统计模型。通过编写计算机程序建立抽样框,而研究区栅格斑块的网格为抽样的基本单元,其具体做法如下:对研究区的LAI栅格数据进行从左向右与自上至下逐个网格的二维扫描并进行顺序编号,以此作为各分层地面样本采集的抽样框,使用简单随机抽样,分别选择样本量为10、15、25、30、35、40、45、60、65、70的采样样点。根据LAI采样点在影像上的位置获取对应的NDVI值,并将其与LAI采样数据进行回归分析。对于给定的样本总量,由于在研究区内随机空间布设样本,致使每次抽样都会获得不同的LAI样本数据,由此建立的遥感经验模型也会有所差异。为了全面评估高效空间抽样策略的性能优劣,本项研究对不同样本量的随机空间抽样方案分别抽取样本60次,然后对每次抽样得到的LAI样本数据分别进行拟合建模,并采用建模精度对不同样本量的采样结果进行评定。

3 结果与分析

传统空间采样目的是通过采集一定数量地面样本数据来反映调查区域地表参数总体的统计特征,譬如统计平均值等,其精度评估一般采用抽样方差指标。本文研究样本量对LAI遥感经验模型建模精度的影响,其目的是得到由LAI样本数据建立的样本遥感经验模型能更好地吻合调查区域LAI的总体遥感经验模型的最优样本量。因此,本文使用样本数据构建的样本遥感经验模型与调查区域总体遥感经验模型之间的定量差异来评估遥感经验模型构建精度,这里采用上述两类模型因变量LAI之间的均方根误差作为面向遥感模型采样的精度评估指标RMAI(Remote Sensing Model Accuracy Index),其公式为:

(5)

式中:i=1、2、……、n—定义域范围内遥感变量NDVI离散化的序数;LAIi—总体遥感经验模型第i个NDVI值对应的叶面积指数LAI计算值;LAIi—样本遥感经验模型第i个NDVI值对应的叶面积指数LAI预测值。当LAI样本总数确定时,精度评估指标RMAI值越小,由采集样本而建立的遥感经验模型精度越高,设计的LAI空间抽样方案也就越合理。

研究区域遥感变量NDVI的变化值域为0.748-0.928,本文以0.01为间距,等间隔地选择19个NDVI离散数值,通过公式(5)计算不同空间抽样策略的RMAI。分别对不同样本量的60次随机空间抽样的经验建模的RMAI取均值,对比各采样方案的精度。图4给出了RMAI平均值及标准差随样本量的变化趋势,并对该趋势加以拟合。

图4 RMAI平均值及标准差随样本量的变化趋势图Fig.4 The mean and standard deviation of RMAI amended with different sample sizes

RMAI平均值随样本量的变化趋势表明,随着样本量的增加,RMAI呈幂函数形式逐渐减小,见图4a。在样本量小于30时,随着样本量的增加,RAMI呈急剧下降趋势,而当样本量大于45时,RMAI虽然有所波动,但基本达到稳定状态。这表明RMAI在样本数量较少时更加敏感,建模精度较差,但并不会随着样本量的增加而不断的减小,当样本量达到一定的数值时,其精度会达到稳定状态。随着样本量的增加,RMAI的变动标准差也呈现同样的下降趋势,当样本量大于35时,标准差下降趋势较为平缓,见图4b。这表明样本量越大的采样方案构建的遥感经验模型更加稳定。上述的精度差异是因为样本量越大,采集的样本覆盖整个LAI值域的可能性越大,其构建的经验模型也更加逼近调查区域总体遥感经验模型。综合RMAI平均值及标准差的变化趋势,当样本量达到40时采样数据即可构建精度较高且稳定的LAI经验统计模型。

4 结 语

对研究区采用不同样本量的采样数据构建经验模型反演LAI,以此来探究样本量对于建模精度的影响。结果表明:① 不同样本量RMAI的均值及标准差随样本量呈幂函数形式逐渐减小;② 在样本数量小于25时RMAI较为敏感,建模精度较差,当样本量达到45左右时,其精度达到稳定状态;③ 样本量越大的采样方案构建的遥感经验模型越稳定;④ 综合RMAI平均值及标准差的变化趋势,当样本量达到40时采样数据即可构建精度较高且稳定的LAI经验统计模型。

需要指出的是,本文的研究结论主要是建立在基于单一地表覆盖的研究区上多次随机采样结果分析的基础上的,如何从内部统计规律出发,定量推导和阐述不同抽样方式对LAI遥感经验建模精度的影响,进而更好地提供样本量的选择依据,将是面向遥感经验建模的采样方案样本量优化需要进一步关注的问题。

参考文献:

[1] 李凤秀,张 柏,宋开山,等.玉米叶面积指数与高光谱植被指数关系研究[J].遥感技术与应用,2007,22(5): 586-592.

[2] Fan L,Gao Y,Brück H,et al.Investigating the relationship between NDVI and LAI in semi-arid grassland in Inner Mongolia using in-situ measurements[J].Theoretical and Applied Climatology,2009,95(1-2): 151-156.

[3] Darvishzadeh R,Skidmore A,Schlerf M,et al.Inversion of a radiative transfer model for estimating vegetation LAI and chlorophyll in a heterogeneous grassland[J].Remote Sensing of Environment,2008,112(5): 2592-2604.

[4] 蒙继华,吴炳方,李强子.全国农作物叶面积指数遥感估算方法[J].农业工程学报,2007,23(2): 160-167.

[5] Colombo R,Bellingeri D,Fasolini D,et al.Retrieval of leaf area index in different vegetation types using high resolution satellite data[J].Remote Sensing of Environment,2003,86(1): 120-131.

[6] Chen D Y,Huang J F,Jackson T J.Vegetation water content estimation for corn and soybeans using spectral indices derived from MODIS near-and short-wave infrared bands[J].Remote Sensing of Environment,2005,98(2-3): 225-236.

[7] Gobron N,Pinty B,Verstraete M M,et al.A semidiscrete model for the scattering of light by vegetation[J].Journal of Geophysical Research: Atmospheres ,1997,102(D8): 9431-9446.

[9] Chen J M,Pavlic G,Brown L,et al.Derivation and validation of Canada-wide coarse-resolution leaf area index maps using high-resolution satellite imagery and ground measurements[J].Remote Sensing of Environment,2002,80(1): 165-184.

[10] Green E P,Mumby P J,Edwards A J,et al.Estimating leaf area index of mangroves from satellite data[J].Aquatic Botany,1997,58(1): 11-19.

[11] Wang Q,Adiku S,Tenhunen J,et al.On the relationship of NDVI with leaf area index in a deciduous forest site[J].Remote Sensing of Environment,2005,94(2): 244-255.

[12] Turner D P,Cohen W B,Kennedy R E,et al.Relationships between leaf area index andLandsat TM spectral vegetation indices across three temperate zone sites[J].Remote Sensing of Environment,1999,70(1): 52-68.

[13] 靳安华,刘殿伟,王宗明,等.三江平原湿地植被叶面积指数遥感估算模型[J].生态学杂志,2008,27(5): 803-808.

[14] Weiss M,Baret F,Smith G J,et al.Review of methods for in situ leaf area index (LAI) determination: Part II.Estimation of LAI,errors and sampling[J].Agricultural and Forest Meteorology,2004,121(1): 37-53.

[15] Liu J G,Pattey E,Jégo G.Assessment of vegetation indices for regional crop green LAI estimation from Landsat images over multiple growing seasons[J].Remote Sensing of Environment,2012,123: 347-358.

猜你喜欢

样本量叶面积经验
医学研究中样本量的选择
2021年第20期“最值得推广的经验”评选
作物叶面积测量的研究进展
马奶子葡萄叶面积评估模型的建立
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十)
经验
2018年第20期“最值得推广的经验”评选
苎麻叶面积测定方法比较研究
当你遇见了“零经验”的他