基于3种估计量的冬小麦播种面积总体外推效率比较*
2013-12-14陈仲新周清波
王 迪,陈仲新,周清波,刘 佳
(1.农业部农业信息技术重点实验室,北京 100081;2.中国农业科学院农业资源与农业区划研究所,北京 100081)
农作物播种面积信息是国家制定粮食政策和经济计划的重要依据[1-2]。及时准确地估计农作物播种面积对于加强农作物生产管理,确保我国粮食安全具有重要意义[3-4]。以往国内外大区域尺度的农作物播种面积抽样统计调查大多通过构建简单或回归估计量进行总体相关指标 (如总体总值、方差等)的推断与估计[5-12]。简单估计量具有构建简便、线性无偏等优点,因此在早期的农作物播种面积抽样统计调查中得以广为应用[13],但由于其在抽样外推总体过程中仅局限于利用调查变量的样本指标进行总体估计,而无法利用辅助变量信息进一步改善总体外推精度,因此表现为有效性偏差。随着遥感 (RS)、地理信息系统(GIS)等空间信息技术的迅速发展,通过遥感数据获取辅助变量信息构建的回归估计量和比率估计量在农作物播种面积空间抽样调查中逐渐为人们所应用。如美国国家农业统计署 (NASS)以“六月面积大调查 (June Area Survey)”数据作为抽样样本地面调查数据 (即调查变量),以通过对遥感影像 (主要为IRS-AWIFS和LandSat5-TM)进行监督分类得到的农作物空间分布信息作为辅助变量,构建回归估计量进行了全美农作物播种面积估计。实践表明,利用该回归估计量外推全美主要农作物 (小麦、玉米和棉花)播种面积总体精度均在95%以上[14]。欧盟的农业遥感监测计划 (MARS)中也利用遥感数据 (Landsat-TM或SPOT-XS)提取欧盟地区农作物空间分布信息作为辅助变量,通过联合抽中切块 (Segments)内的农作物播种面积地面调查数据进行回归估计量构建,对欧盟地区17种农作物的播种面积进行了估计,结果表明,利用回归估计量进行主要农作物播种面积估计时的相对效率 (即全部使用样本地面调查数据产生的总体估计方差与回归估计量产生的估计方差比值)均高于2[15]。Gonzalez[16]等利用与抽样样本地面调查数据同年和上一年的遥感数据 (Landsat-TM)提取农作物空间分布信息作为辅助变量,通过联合样本地面调查数据和辅助变量信息构建回归估计量,对西班牙东北部的大麦播种面积进行了估计,结果表明,当研究区年际间土地利用状况不发生较大变化时,利用上年遥感影像作为辅助变量进行大麦播种面积估计时,同样可以得到较高的估计精度。张锦水等[17]利用Landsat-TM影像获取辅助变量信息,通过构建比率估计量对冬小麦播种面积分层抽样效率的影响因子进行了分析。
综上所述,以往国内外在利用统计估计量进行农作物播种面积抽样外推总体研究方面,主要集中于利用单一种类的估计量 (如简单估计量或回归估计量)进行区域农作物播种面积估计,缺乏对多种估计量进行农作物播种面积外推总体效率高低的定量比较,更未进行估计量的优化选择,从而限制了农作物播种面积抽样调查效率的进一步改善。针对于此,该研究以安徽省蒙城县为研究区,选取冬小麦播种面积为研究对象,通过联合研究区冬小麦播种面积遥感影像数据和抽样样本地面调查数据,构建多种统计估计量,以抽样外推总体相对误差及稳定性为评价指标,定量比较多种估计量总体外推效率的高低,实现对统计估计量的优选,从而为进一步改进现有农作物播种面积抽样调查效率提供解决途径。
1 研究方法
1.1 研究区基本情况
蒙城县位于安徽省西北部,地处淮北平原中部,行政区域介于北纬32°55'29″~32°29'64″、东经116°15'43″~116°49'25″之间,县境整体略呈长方形,东西宽40km,南北长60km,国土面积约2 091km2,其中耕地面积为15.3万hm2。蒙城县属暖温带半湿润季风气候,典型的平原地区。全县多年平均气温14.7℃,平均日照2 320小时,平均无霜期216天,多年平均降水量822mm。蒙城县自然条件优越、土地肥沃,盛产优质小麦、水稻、玉米等粮食作物,其中冬小麦是蒙城县最重要的粮食种植作物,其种植面积约占耕地面积的70%。
图1 蒙城县冬小麦及地面调查样本的空间分布
图2 地面样本内自然地块组成情况
1.2 基础数据
主要包括3部分:(1)基础地理信息数据。蒙城县行政边界数据 (比例尺为1:25万,矢量格式);(2)冬小麦面积空间分布数据。蒙城县2009年冬小麦播种面积空间分布矢量数据 (基于ALOS AVNIR-2影像提取,影像轨道号:162652930,获取日期:2009年2月12日,空间分辨率10m);(3)冬小麦播种面积地面调查样本数据 (矢量格式)。蒙城县冬小麦播种面积地面调查样本数据中包含12个样本,为保证能够基于样本观测值进行总体外推与误差估计,本研究中的冬小麦面积地面调查样本是采用简单随机抽样方法抽选。为确保样本地面调查的可操作性实施,采用自然地块边界作为样本边界,以500m×500m为抽样基础单元尺寸的设计标准,对研究区进行以自然地块边界为样本单元边界的抽样基础单元划分。需要说明的是,在按自然边界进行抽样基础单元划分时,如样本单元面积超出设计标准较大时 (研究设计为20%),利用该样本单元进行冬小麦面积总体外推需要进行面积加权处理。采用手持式差分GPS(测量精度1.0~5.0m)人工测量每个样本内的冬小麦面积,测量日期为2009年5月10日。为减小测量误差,对每个样本的冬小麦面积均分别进行3次测量,取平均值作为样本内的冬小麦面积测量值。需要说明的是,在样本地块内进行冬小麦面积测量时,所测面积为冬小麦纯播种面积,不包括地块中的田埂面积。图1给出了蒙城县冬小麦和地面调查样本的空间分布。图2给出了地面调查样本 (以编号为5的地面调查样本为例)内自然地块组成情况。
1.3 估计量构建
1.3.1 简单估计量
由于研究采用简单随机抽样方法进行样本抽选,对于简单随机抽样,可利用样本均值作为总体均值的估计,即总体均值的简单估计量为
总体总值的简单估计量见式 (2)。总体总值简单估计量方差的无偏估计按式 (3)计算[18]。
1.3.2 比率估计量
为构建比率估计量,该研究以通过地面调查得到的研究区冬小麦面积总体为目标变量Y,以基于遥感调查得到的研究区冬小麦面积总体为辅助变量X,研究区冬小麦面积总体均值和总值的比率估计量分别见公式 (4)和 (5)[19]。
总体总值比率估计量方差按式 (6)~(10)计算。
1.3.3 回归估计量
参考比率估计量的构建,同样以通过地面调查得到的研究区冬小麦面积总体为目标变量Y,以基于遥感调查得到的研究区冬小麦面积总体为辅助变量X,构建回归估计量。对于简单随机抽样而言,研究区冬小麦面积总体均值和总体总值回归估计量分别见式(11)和(12)[19]。
总体总值回归估计量方差按式 (14)计算[19]。
1.3.4 相对误差和变异系数计算
为定量评价基于3种估计量的冬小麦播种面积抽样外推总体误差和稳定性,该研究选取相对误差 (r)和总体总值估计量的变异系数 (CV)2个指标,其中CV用于评价总体推断的稳定性,外推总体相对误差(r)按公式 (16)计算,CV按公式 (17)计算。
1.4 样本观测值获取
为构建多种估计量,该研究中采取2种方式进行样本观测值获取:一种是地面调查方式。采用差分GPS人工测量样本地块内冬小麦播种面积得到;另一种是遥感调查方式。通过将研究区2009年冬小麦空间分布数据 (遥感影像解译得到)与样本地面调查数据 (矢量格式)相叠加,采用GIS软件统计样本单元内冬小麦播种面积完成对样本观测值的获取。
2 结果与分析
2.1 地面与遥感调查方式下的样本观测值准确性分析
样本观测值的准确与否直接关系到外推总体的精度。为检查基于地面和遥感两种调查方式下的样本观测值的真实性和准确性,表1中列出了研究区冬小麦播种面积抽样样本的地面调查和遥感调查结果。从表中可以看出,样本的遥感调查精度为±10m2(受ALOS AVNIR-2影像的空间分辨率制约),而地面调查精度可达到±1m2,这说明相对于遥感调查,样本的地面调查精度更高。另外,除个别样本外,样本的地面调查面积普遍高于遥感调查面积。相对于遥感调查面积,样本的地面调查面积更接近图测面积,这一点可以从遥感与地面调查分别占图测面积的比例中看出。由于在最初的抽样框构建时,抽样基础单元的设计就选择在冬小麦种植区域内进行,因此样本单元内除冬小麦以外的其他地物面积比例一般会较低,从这一角度也说明了样本的地面调查真实性和准确性要高于遥感调查。对样本的遥感调查地面调查结果进行差异显著性检验,t(11)=-1.969 <t0.05(11)=1.795 9,说明两者之间的差异性不显著。
2.2 样本的地面与遥感调查结果相关分析
为定量分析研究区冬小麦播种面积地面调查与遥感调查结果间的相关关系,进而为抽样外推总体的统计估计量的构建提供参考依据,图3绘制了研究区冬小麦播种面积抽样样本地面调查与遥感调查结果间的散点图,从图中可以看出,两者呈线性相关关系,对回归方程进行显著性检验,F(1,10)=15.207 >F0.01(1,10)=10.04,说明研究区冬小麦播种面积地面调查与遥感调查结果间极显著相关。另外,从两者间的回归方程y=1.106 2x(R2=0.777)可以看出,抽样样本的地面调查与遥感调查结果间的相关关系为正比例关系。
2.3 多种估计量外推冬小麦面积总体的效率比较
为比较3种估计量外推总体的效率高低,从而为实现农作物面积抽样外推总体的统计估计量优选提供参考依据,表2中给出了利用3种估计量外推研究区冬小麦播种面积总体与误差估计结果。从表中可以看出,相对于简单估计量 (外推总体相对误差和变异系数(CV)值分别为34.91%和9.61%)而言,利用比率估计量和回归估计量外推总体的相对误差更小 (分别为11.01%和13.11%),同时稳定性也表现为更高 (CV值分别为6.20%和8.04%),这说明相对于单纯利用地面调查样本进行总体外推结果,利用遥感影像作为辅助变量构造的比率估计量和回归估计量外推总体的效率更高。此外,对比率估计量和回归估计量外推总体结果可以看出,在研究的试验条件下,利用比率估计量外推总体的精度更高,稳定性更好。需要说明的是,尽管利用3种估计量外推研究区冬小麦面积总体的相对误差仍偏高 (大于10%),但分析其原因主要是因为研究设计选取的样本容量偏低所致。研究中的抽样比仅为0.21%,其中总体容量为5783,通过研究区总土地面积除以地面调查样本面积均值并取整得到。
图3 地面调查与遥感调查样本冬小麦面积散点
表1 冬小麦播种面积空间抽样样本地面与遥感调查结果
表2 基于3种估计量的冬小麦播种面积外推总体与误差估计结果
3 结论
为定量评价多种估计量外推总体的效率高低,从而为实现农作物播种面积抽样外推总体的统计估计量优选提供参考依据,研究以安徽省蒙城县为研究区,选取冬小麦播种面积为研究对象,通过联合研究区冬小麦播种面积抽样样本地面与遥感调查数据,分别构建3种估计量 (简单估计量、比率估计量和回归估计量)进行了研究区冬小麦播种面积总体外推与误差估计试验研究,结果表明:
(1)样本内的冬小麦播种面积地面调查精度高于遥感调查,但两种调查方式下的样本观测值间差异不显著。
(2)样本的地面调查与遥感调查结果间存在极显著的正比例关系。
(3)以相对误差和变异系数CV为抽样外推总体效率评价指标,在研究设计的3种估计量中,比率估计量外推总体的效率最高 (相对误差和CV值最小);其次是回归估计量;简单估计量外推总体的效率最低。因此,比率估计量外推法对于提高冬小麦面积遥感估计精度可能有一定的作用。
[1]陈水森,柳钦火,陈良富,等.粮食作物播种面积遥感监测研究进展.农业工程学报,2005,6(21):166~170
[2]钱永兰,杨邦杰,焦险峰.基于遥感抽样的国家尺度农作物面积统计方法评估.农业工程学报,2007,23(11):180~187
[3]杨邦杰,裴志远.国家级农情遥感监测系统的研究开发与运行.农业工程学报,2003,19:11~14
[4]周清波.国内外农情遥感现状与发展趋势.中国农业资源与区划,2004,25(5):9~14
[5]Chhikara R S,Lundgren J C,Houston A G.Crop acreage estimation using a Landsat-Based estimator as an auxiliary variable.IEEE Transactions on Geoscience and Remote Sensing,1986,24(1):157 ~167
[6]González F,Cuevas M.Remote sensing and agricultural statistics:crop area estimation through regression estimators and confusion matrices.International Journal of Remote Sensing,1993,14(6):1215~1219
[7]Gallego F J.Remote sensing and land cover area estimation.International Journal of Remote Sensing.2004,25(15):3019 ~3047
[8]陈仲新,刘海启,周清波等.全国冬小麦面积变化遥感监测抽样外推方法的研究.农业工程学报,2000,16(5):126~129
[9]焦险峰,杨邦杰.全国棉花种植面积遥感检测抽样方法设计,农业工程学报,2002,18(4):168~171
[10]焦险峰,杨邦杰,裴志远.基于分层抽样的中国水稻种植面积遥感调查方法研究.农业工程学报,2006,22(5):105~110
[11]王迪,周清波,刘佳.作物面积空间抽样框架及抽样基础要素优化设计研究.中国农业资源与区划,2008,29(4):9~15
[12]王迪,周清波,陈仲新,等.空间抽样方法估算冬小麦播种面积.农业工程学报,2012,28(10):177~184
[13]FAO.Multiple frame agricultural surveys.Volume I:Current surveys based on area and list sampling methods,Rome,1996
[14]Boryan C,Yang Z W,Mueller R,et al.Monitoring US agriculture:the US Department of Agriculture,National Agricultural Statistics Service,Cropland Data Layer Program.Geocarto International,2011,26(5):341~358
[15]Gallego F J.Crop area estimation in the MARS project.MARS Conference:10 years of demand-driven technical support(Brussels:Office for publications of the EC),1996,April 22~23
[16]González F,Cuevas M J,Arbiol R,et al.Remote sensing and agricultural statistics:crop area estimation in north-eastern Spain through diachronic Landsat TM and ground sample data.International Journal of Remote Sensing.1997,18(2):467~470
[17]张锦水,潘耀忠,胡潭高,等.冬小麦种植面积空间抽样效率影响因子分析.农业工程学报,2009,25(8):169~173
[18]金勇进,蒋妍,李序颖.抽样技术.北京:中国人民大学出版社,北京,2002,168~177
[19]李金昌.应用抽样技术.北京:科学出版社,2006,66~82