抽样法估算影像植被覆盖度
2018-06-13梁博毅刘素红
梁博毅,刘素红
(1.北京大学 城市与环境学院,北京 100871; 2.北京师范大学 地理科学学部,北京 100875)
植被是地表覆盖植物群落的总称,植被一方面可以截留降水,削弱雨水侵蚀,另一方面可以保持水土,降低水土流失。植被覆盖度(Fractional of Vegetation Cover,简称FVC)通常定义为植被(包括叶、茎、枝)在地面的垂直投影面积占统计区域总面积的百分比[1-3],它是反映地表植物群落覆盖程度的重要参数[4]。
通常采用地面测量和遥感数据估算两种方法来测量植被覆盖度。地面测量中使用最多的方法是照相法,即用数码相机垂直向下拍照,然后通过对数码相片进行后期处理计算植被覆盖度,此方面相关研究已取得很大进展[4-6]。利用遥感手段估算植被覆盖度又可分为经验模型法和物理模型法。经验模型法就是采用简单的统计模型或者回归关系计算植被覆盖度,例如建立归一化植被指数(NDVI)和植被覆盖度的回归模型来估算植被覆盖度[7-11]。物理模型法例如冠层辐射传输模型,在计算时考虑了叶片层的反射去吸收等过程。近些年,神经网络、支持向量机和决策树等一些较为先进的机器学习方法也逐渐被应用于遥感估算植被覆盖度的研究中[12-18]。
无论是照相法还是利用卫星遥感图像提取植被覆盖度,传统的方式都是通过依次计算每个像元来获取整张图像的覆盖度。这种方式在处理大尺度遥感图像或者像元数量较多的遥感图像时,会耗费较多的时间。本研究提出一种利用抽样法来估算遥感图像植被覆盖度的新方法,在满足精度要求的条件下,节省了较多的计算时间,明显提高了工作效率。
1 方法理论
设已知常规逐像元法估算的植被覆盖度结果为f,若不考虑混合像元,则随机选取一个像元计算,其结果为植被的概率为f,非植被的概率为1-f。当抽样的像元足够多时,观测到的植被像元应服从二项分布[19]。若进行N次独立试验(选择N个抽样像元),则结果中有n个植被像元的概率为
(1)
最终的植被覆盖度fn可以表示为
fn=n/N
(2)
测量覆盖度的误差为εn,为逐像元法和抽样法估算结果差值的绝对值,即
εn=│fn-f│
(3)
由于公式(2)将植被覆盖度测量值fn定义为n与N的比值,因此当N为常量时,f的误差只与抽样中计算为植被像元的个数n有关。又因为f为常量,由公式(3)得,且测量误差εn的取值数目大小和n一致,也是一个随机变量,其计算误差分布概率和计算为植被像元的个数n分布相同,即计算为植被像元的个数为n,那么计算出的植被覆盖度可能有n+1种结果(0,1/n,2/n,…,n/n),误差值也存在n+1种结果,覆盖度误差概率值等于二项分布中n出现的概率值。我们可以利用二项分布原理计算出不同逐像元法的植被覆盖度、不同抽样像元数条件下进行测量的结果误差范围[20]。例如选择n/N和真实覆盖度之间的差异绝对值为0.1,覆盖度测量精度为90%,我们将误差小于0.1的概率进行累加,结果即为覆盖度精度为90%的概率。当我们设定一个测量的精度要求,然后计算出抽样法和逐像元法之间的差异,将误差小于该精度的概率累加,得到一定逐像元法测量出的覆盖度条件下,不同抽样像元数(以0~100个为例)所达到要求精度的概率。当我们把观测精度定义为90%时,不同植被覆盖度和不同抽样像元数条件下达到所要求精度的概率如图1所示。
图1 理论误差概率分布
2 试验结果与讨论
2.1 绿色植被覆盖度估算
为了验证方法的有效性,我们首先选择数码相片进行试验。利用计算机自动分类得到绿色植被和土壤背景两类像元,计算植被类型像元和非植被类型像元,求出植被覆盖度,视为真实值[21],然后利用本研究提出的抽样法再次计算植被覆盖度,随机选取其中的某些像元,计算结果视为整张影像的植被覆盖度,通过比较两者的计算结果,测试方法的有效性。
图2(a)是对生长玉米的样方进行垂直向下成像获得的彩色图像。对于绿色植被,选择绿色波段亮度大于红色波段和蓝色波段的像元作为植被,其余为非植被,利用该分类算法处理后结果如图2(b)所示,其中白色是植被像元、黑色是非植被像元。利用分类结果得到的植被像元和图像总的像元数目之比为植被覆盖度。通过上述过程,得到图2的植被覆盖度为0.672。当抽样像元为384个时,其中被判定为植被的样本数平均为260个,植被覆盖度为0.677,和照相法自动判别相比,差值为0.005,结果很接近。
图2 绿色植被提取
为了研究覆盖度变化对选样点数的影响,我们从图2中随机选取3种不同覆盖度的图像,如图3所示,其覆盖度依次为0.25、0.51、0.80。
每张图像循环200次进行试验表明,选择点数不同,利用抽样法获得的覆盖度不同,误差也不同。由于绿色植被可以利用计算机进行自动判读,所以利用不同的点数进行自动判读的误差测试结果见图4、5。
图4 不同抽样点数下的植被覆盖度
图5 不同抽样点数下的误差绝对值
从结果图中可以看出,抽样法的结果围绕真实值上下波动,当采样点数逐渐增加时,计算的结果与真实值越来越接近,误差也越来越小。
2.2 遥感影像植被覆盖度
将抽样法运用到遥感影像上,采用TM数据作为试验遥感数据。TM数据具有30 m空间分辨率,是目前遥感领域使用最为广泛的遥感数据之一。本研究利用像元二分模型估算遥感影像的植被覆盖度[22-28],并在此基础上引入抽样法,对比两种方法的实用性。
2.2.1 试验过程
试验选取了抽样点数和处理图像数两组变量,其中抽样点数设置为10、20、50、100、200、300个一共6种取值,处理图像数为10、20、40、70、100张一共5种取值。处理图像为前文所介绍的一景TM影像,通过编程循环处理单景影像来模拟处理多景数据的情况。
在综合评定常规逐像元法和抽样法时,选取均方根误差(RMSE)、运行时间效率和误差百分比3种参数进行评价。其中误差百分比是指在指定抽样点数、处理图像数的条件下,以常规逐像元法处理结果作为真实值,考察抽样法结果中绝对误差小于某个阈值的图像数占所有处理图像数的百分比。这里阈值选取0.01、0.03、0.05和0.10。
2.2.2 均方根误差
均方根误差(RMSE)这个参数主要反映的是采用抽样法进行植被覆盖度估算的准确性。以常规逐像元法为真实值,RMSE越大表示抽样法与真实值差距越远,相反则表示抽样法的精度较高。表1中所显示的是在不同试验条件下,选取不同的样点数和图像数,计算使用抽样法所得到的植被覆盖度与常规逐像元法结果的均方根误差。从表1中可以看出,当处理图像数固定时,随着样点数逐步增大,RMSE的值随之变小,当抽样点数达到300个时,均方根误差全部保持在0.21及以下的水平,结果较为理想。另外当抽样点数一定时,均方根误差与处理图像数量并没有明显的相关关系。为了进一步考察RMSE与样点数的相关关系,取图像数为100张,评价RMSE与样点数的相关性。从图6中可以看出,当样点数小于50个时RMSE随样点数的增加下降较为明显,样点数达到100个以上时RMSE变化相对较小,两者呈现较好的幂函数关系,相关系数达到0.990。当固定样点数时,计算图像数与RMSE的相关关系,结果显示不论采用何种相关方式,二者的相关系数均比较小,无明显的相关关系。
表1 抽样法与逐像元法的均方根误差分布
图6 均方根误差与样点数相关关系
2.2.3 时间效率
时间效率的评定主要针对的是抽样法在计算植被覆盖度时相比常规逐像元算法在耗时上的优势,也是选取抽样法计算遥感图像植被覆盖度的主要目的。表2中所显示的是在不同试验条件下,选取不同的样点数和图像数,使用抽样法计算植被覆盖度与常规逐像元法计算覆盖度的时间。不难看出,当样点数在300个以下时,抽样法耗时比较稳定,这主要是由于样点数量较少,在计算植被覆盖度的时候时间主要消耗在二分法及读取图像本身上。抽样法相比于常规逐像元法在耗时方面具有明显的优势,例如当处理图像数为100张时,逐像元法耗时为424.652 s,大概7 min,而抽样法仅耗时3.221 s。图7中反映的是逐像元法下程序处理耗时随处理图像数的变化关系,从图中可以看出,二者的线性相关较为明显,R2达到0.997,反映出逐像元法耗时随图像数的增长基本处于等比例增加的趋势。
表2 抽样法与常规逐像元法耗时
图7 逐像元法耗时随处理图像数的变化
2.2.4 精度评定
精度评定主要反映的是所处理图像数达到要求的数量占总处理图像的比例。这里的要求指的是满足与常规逐像元法结果差值绝对值分别在0.01、0.03、0.05、0.10以内的4种情况。表3、4、5、6分别表示了这4种情况下满足要求的图像数的比例。表3中,固定处理图像数量,满足要求的图像比例随着抽样点数的增加有明显增加的趋势,其中当图像数为10张时,没有显示出这种规律,其主要原因是图像数较少,导致结果趋于不稳定;当图像数量逐渐增大时,这种规律更加明显。由于表3中要求的是误差绝对值控制在0.01之内,因此满足条件的图像数比较少,即使当抽样点数达到300个时,其置信度也仅为40%~45%。表4和表5的误差绝对值分别在0.03和0.05以内,是一般应用中可以接受的误差范围,从两个表中可以看出,当抽样点数达到300个以上时,其置信区间均达到84%以上,若误差允许值为0.05,则置信区间更是高达97%以上。表6计算了误差绝对值在0.1以内的图像个数所占比例,这个评定方式主要适用于精度要求较低但处理图像数较为庞大的情况。如表6所示,在此条件下,抽样点数在50个以上时,就可以得到99%的置信度。
表3 误差绝对值小于0.01的图像比例 %
表4 误差绝对值小于0.03的图像比例 %
表5 误差绝对值小于0.05的图像比例 %
表6 误差绝对值小于0.1的图像比例 (%)
3 结 论
本研究提出一种通过采样法来获取影像植被覆盖度的方法,即在目标图像上随机选取一定数量的像元,仅计算所选像元的植被覆盖度情况,以此结果表示原图像的植被覆盖度。经过试验验证,该方法在处理大量遥感图像的工作中时,可以在满足精度的条件下,明显缩短计算时间,提高工作效率。本研究通过地面照相法和遥感影像二分法两种方式进行了抽样法的验证。对于照相法而言,当采样数超过384个时,误差基本稳定在0.005以内,相比逐像元法计算的误差可以忽略;对于遥感影像二分法,当处理的遥感影像为100张、采样点数为300个时,均方根误差基本稳定在0.02以内,同时耗时不到逐像元法的1%。试验表明,采样法在处理海量遥感数据或者单幅大尺度的图像时,可以在满足精度的条件下,有效地提高工作效率。
[参考文献]
[1] WITTICH K P,HANSING O.Area-averaged vegetative cover fraction estimated from satellite data[J].International Journal of Biometeorology,1995,38(4):209-215.
[2] GITELSON A A,KAUFMAN Y J,STARK R,et al.Novel algorithms for remote estimation of vegetation fraction[J].Remote Sensing of Environment,2002,80(1):76-87.
[3] PUREVDORJ T,TATEISHI R,ISHIYAMA T,et al.Relationships between percent vegetation cover and vegetation indices[J].International Journal of Remote Sensing,1998,19(18):3519-3535.
[4] QIN Wei,ZHU Qingke,ZHANG Xuexia,et al.Review of vegetation covering and its measuring and calculating method[J].Journal of Northwest Sci-Tech University of Agriculture and Forestry,2006,34(9):30.
[5] CLELAND E E,CHUINE I,MENZEL A,et al.Shifting plant phenology in response to global change[J].Trends in Ecology & Evolution,2007,22(7):357-365.
[6] ZHOU Q,ROBSON M.Automated rangeland vegetation cover and density estimation using ground digital images and a spectral-contextual classifier[J].International Journal of Remote Sensing,2001,22(17):3457-3470.
[7] HURCOM S J,HARRISON A R.The NDVI and spectral decomposition for semi-arid vegetation abundance estimation[J].International Journal of Remote Sensing,1998,19(16):3109-3125.
[8] CARLSON T N,RIPLEY D A.On the relation between NDVI,fractional vegetation cover, and leaf area index[J].Remote Sensing of Environment,1997,62(3):241-252.
[9] CARLSON T N,GILLIES R R,PERRY E M.A method to make use of thermal infrared temperature and NDVI measurements to infer surface soil water content and fractional vegetation cover[J].Remote Sensing Reviews,1994,9(1-2):161-173.
[10] GILLIES R R,KUSTAS W P,HUMES K S.A verification of the'triangle'method for obtaining surface soil water content and energy fluxes from remote measurements of the Normalized Difference Vegetation Index (NDVI) and surface e[J].International Journal of Remote Sensing,1997,18(15):3145-3166.
[11] LU H,RAUPACH M R,MCVICAR T R,et al.Decomposition of vegetation cover into woody and herbaceous components using AVHRR NDVI time series[J].Remote Sensing of Environment,2003,86(1):1-18.
[12] PARUELO J M,TOMASEL F.Prediction of functional characteristics of ecosystems: a comparison of artificial neural networks and regression models[J].Ecological Modelling,1997,98(2):173-186.
[13] BACOUR C,BARET F,BÉAL D,et al.Neural network estimation ofLAI,fAPAR,fCoverandLAI×Cab, from top of canopy MERIS reflectance data:Principles and validation[J].Remote Sensing of Environment,2006,105(4):313-325.
[14] CARPENTER G A,GOPAL S,MACOMBER S,et al.A neural network method for mixture estimation for vegetation mapping[J].Remote Sensing of Environment,1999,70(2):138-152.
[15] GITELSON A A.Remote estimation of crop fractional vegetation cover: the use of noise equivalent as an indicator of performance of vegetation indices[J].International Journal of Remote Sensing,2013,34(17):6054-6066.
[16] FOODY G M.Mapping land cover from remotely sensed data with a softened feed forward neural network classification[J].Journal of Intelligent & Robotic Systems,2000,29(4): 433-449.
[17] JIA K,LIANG S,LIU S,et al.Global land surface fractional vegetation cover estimation using general regression neural networks from MODIS surface reflectance[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(9):4787-4796.
[18] CARPENTER G A,GOPSL S,MACOMBER S,et al.A neural network method for efficient vegetation mapping[J].Remote Sensing of Environment,1999,70(3):326-338.
[19] BLISS C I,FISHER R A.Fitting the negative binomial distribution to biological data[J].Biometrics,1953,9(2):176-200.
[20] KREBS C J.Ecological methodology[M].Menlo Park,California:Benjamin/Cummings,1999:227-340.
[21] PUREVDORJ T S,TATEISHI R,ISHIYAMA T,et al.Relationships between percent vegetation cover and vegetation indices[J].International Journal of Remote Sensing,1998,19(18):3519-3535.
[22] KAUFMAN Y,TANRE D.Atmospherically resistant vegetation index (ARVI) for EOS-MODIS[J].IEEE Transactions on Geoscience and Remote Sensing,1992,30(2):261-270.
[23] QI J,CHENBOUNI A,HUETE A R,et al.A modified soil adjusted vegetation index[J].Remote Sensing of Environment,1994,48(2):119-126.
[24] TOBY N C,DAVID A R.On the relation between NDVI,fractional vegetation cover,and leaf area index[J].Remote Sensing of Environment,1997,62(3):241-252.
[25] LEPRIEUR C,KERR Y H,MASTORCHIO S,et al.Monitoring vegetation cover across semi-arid regions:comparison of remote observations from various scales[J].International Journal of Remote Sensing,2000,21(2):281-300.
[26] QI J,MARSETT R C,MORAN M S,et al.Spatial and temporal dynamics of vegetation in the San Pedro River basin area[J].Agricultural and Forest Meteorology,2000,105(1-3):55-68.
[27] 李苗苗,吴炳方,颜长珍,等.密云水库上游植被覆盖度的遥感估算[J].资源科学,2004,26(4):153-159.
[28] 乔晨,占车生,徐宗学,等.渭河流域关中段近30年植被动态变化分析[J].北京师范大学学报(自然科学版),2011,47(4):432-436.
[作者简介] 梁博毅(1989—),男,山东冠县人,博士研究生,主要从事遥感图像处理、算法研究和植被动态研究;通信作者刘素红(1967—),女,河北保定市人,教授,博士,主要从事植被遥感和图像算法研究。
[收稿日期] 2018-02-15