空间分辨率对作物识别及种植面积估算的影响研究
2014-08-03张焕雪李强子
张焕雪,李强子
(中国科学院遥感与数字地球研究所,北京 100101)
1 引 言
随着遥感技术的快速发展,目前已经能够提供从局部、区域到全球范围的连续地表采样,并可以提供从0.61m到数十公里空间分辨率的遥感数据,实现多个空间尺度对地遥感观测[1]。尺度变异和敏感性在使用遥感数据的分析中逐渐起到重要的作用[2]。近年来,多尺度的遥感数据广泛用于区域乃至全球尺度的土地覆被制图,人们越来越重视遥感数据分类精度尺度效应方面的研究[3]。随着空间分辨率的提高,遥感往往具有更高的地面目标识别和面积估算精度[4-5]。Moody和 Woodcock研究了将高分辨率的土地覆盖数据聚合到低分辨率过程中土地覆盖类型面积随分辨率的变化,结果表明当分辨率大于90m时,面积估计误差显著增大。
利用遥感数据识别不同农作物并估算其种植面积,是农作物产量估测的基础[6]。在农作物遥感识别过程中,作物种植面积测量精度除了受到影像空间分辨率的影响,还与分类器类型、研究区的作物种植结构、聚集程度等因素密切相关[7-8]。何浩等发现随着分辨率的降低,平均区域精度降低,并且在一定的区域精度保证下,农作物百分比对低分辨率数据替代高分辨率数据有很重要的影响[7]。针对具体的研究区,要满足一定的分类精度需要多少分辨率的数据;不同的分类器对同一分辨率有何不同响应;不同分辨率下同种分类器的精度有何变化;不同分辨率下作物种植成数、聚集度等因素对精度结果的影响如何等,都需要开展深入的分析和探讨。
本文以河南省封丘县冬小麦-夏玉米产区为研究区,开展了尺度变化对农作物识别和种植面积估算精度的影响研究,目的在于探讨不同空间分辨率的遥感数据对作物分类和面积估算精度的影响规律,并分析了作物种植成数和聚集度在不同尺度水平下对作物面积估算精度的影响,为不同作物种植结构区遥感数据和分类方法的选择提供理论依据和实验基础。
2 研究区概况
研究区位于河南省新乡市封丘县,中心地理坐标114°30′E和35°03′N,大小15km×10km。该地区属于暖温带大陆性季风气候区,多年平均气温13.9℃,降雨量615.1mm,雨热同期,光热水资源丰富,土壤肥沃,属典型的一年两熟制,秋粮作物主要为冬小麦,夏粮作物主要包括夏玉米、大豆、花生等,此外该地区还广泛种植了经济作物棉花及一种特有的药材金银花,作物种植结构相对复杂,对华北地区的农作物种植制度具有典型代表性。研究区夏玉米和大豆一般6月中旬种植,9月份收获;棉花4月中旬种植,10月初收获;金银花属多年生作物,一般在6月、7月、8月、9月四个月份分别采摘第1、2、3、4茬花。
3 数据与预处理
3.1 遥感数据获取和预处理
本研究订购了实验区内中巴地球资源卫星02B(CBERS-02B)CCD影像1景,接收时间为2008年8月22日,影像清晰度好,虽然有少量的云,但基本都分布在居民区上方,不影响研究中作物的识别。影像空间分辨率20m,幅宽113km,包括5个波段,前4个波段在谱段设置上与Landsat7TM相当,波谱范围分别是0.45um~0.52um,0.52um~0.59um,0.63um~0.69um,0.77um~0.89um,第5波段是全色波段,波谱范围是0.51um~0.73um[9]。
影像获取后对其进行了辐射定标和几何纠正处理。辐射定标[10]是将影像的DN值转化为大气顶归一化光谱反射率,大气纠正采用FLAASH模型[11]。几何纠正以实验区的历史SPOT5影像数据作为参考影像,采用二次多项式方法对数据进行几何精纠正,采用40个控制点,纠正误差控制在0.5个像元内。
3.2 地面调查数据
为了获得实验区内实际的农作物分布特征信息,本研究借助SPOT5全色影像(成像时间为2008年4月16日,空间分辨率2.5m),选择了1个具有代表性的5km×5km样区,进行实际作物分布调查,获得了样区内准确的2008年秋季作物分布图(图1)。具体调查方法如下:首先根据耕作信息,参考SPOT影像勾绘出每个种植地块的边界,并进行唯一性编号;借助地理信息系统工具整理形成实验样区内作物田块矢量数据集;在2008年8月19日,开展野外实地调查,实地确认地块边界的正确性,并逐地块填写作物类型;最后在室内编辑整理,得到实验样区的作物分布数据集。
图1 样区作物分布图
4 研究方法
本文首先以CBERS-02B20m分辨率数据为基准,对其进行尺度扩展,模拟生成多分辨率影像序列(40m,60m,80m,100m)。同时,利用地面调查数据,确定作物分类的训练样本与检验样本。在此基础上,利用最大似然(MLC)、支持向量机(SVM)和人工神经网络(ANN)3种分类器开展农作物分类实验,估算不同作物的种植面积,并分别从像元尺度和区域尺度进行分类精度和种植面积估算精度评价。在分析空间分辨率对面积估算精度影响的同时,还进行了作物种植成数和聚集度的影响分析。总体技术路线见图2。
图2 技术路线图
4.1 多分辨率影像序列获取
在遥感中常用的尺度扩展方法主要有简单平均法、中心像元法,最近邻法,双线性内插,立方卷积等[12-13]。简单平均法是将遥感影像n×n窗口内的像元平均值作为转换后对应的低分辨率的遥感影像的像元值。中心像元法是取n×n窗口内中心像元值作为转换后对应的低分辨率的遥感影像的像元值,该方法常用于水文学中[14]。最近邻法,双线性内插和立方卷积是图像处理软件中的常用方法,Hay等[15]发现,这3种方法在尺度转换因子大于5时,不适合将遥感图像从高分辨率转换到低分辨率。本文采用了简单平均法进行影像的尺度扩展。
4.2 样本数据集确定及分类方法
根据实验区地物物候及分布特征,将玉米、棉花、金银花、大豆、林地和非耕地作为最终分类类别,其中林地包括树木和苗圃,非耕地包括城镇居民区、道路和水渠等。根据SPOT5数据的野外地面调查得到的作物分布图,并结合目视判图经验解译方式,基于20m分辨率的CBERS-02B影像,选取非耕地样本1518个像元,林地样本860个像元,玉米样本1520个像元,棉花样本789个像元,金银花样本851个像元,大豆样本749个像元,从所选取的样本中随机抽取一半作为训练样本,另一半为用于精度评价的检验样本,训练样本和检验样本没有重合。
本文采用的分类算法包括最大似然(MLC)、支持向量机(SVM)和人工神经网络(ANN)3种。MLC是通过统计方法计算各个像元属于每个类的概率,将该像元归属于概率最大的类[10];SVM选择了径向基函数(RBF)为核函数,核参数γ设置为0.25,惩罚因子 C设置为100[16];ANN 选用了3层神经网络反向传播算法,遥感数据的5个波段对应于网络的5个输入节点,隐含层设置8个节点,6个分类类别对应输出层的6个输出节点,激发函数选用Logistic函数,最大迭代次数设为1000,结束迭代的误差阈值设为0.1[17]。
为了使分类结果具有可比性,对不同分辨率的影像和不同分类方法都采用了相同的训练样本和检验样本,对不同数据采用了相同的分类器参数设置。
4.3 精度评价指标
为全面分析空间分辨率对作物识别和面积估算的影响,本研究分别从像元尺度和区域尺度对不同空间分辨率、不同分类方法的结果进行了比较和分析。
(1)像元尺度上,主要是基于上述随机选取的检验样本,得到分类混淆矩阵,计算出总体像元精度和Kappa系数作为检验分类效果的指标。
(2)区域尺度上,文中采用了用来比较相对精度的区域精度。
以地面填图数据得到的各类别的面积总量(A0)为基准值,将由尺度扩展得到的较低分辨率(i)下提取的各类别的面积总量Ai与A0进行对比,获取区域内各类别的总体面积估算精度Ki,计算公式:
4.4 种植成数和聚集度的计算
对于不同的研究区,各作物所占的面积百分比和聚集程度是不同的,这些都会对区域精度产生影响。因此,本研究在分析空间分辨率对面积估算精度影响的同时,还进行了作物种植成数和聚集度的影响分析。
种植成数(F)[18]即某一种作物种植面积(fraction)占总种植面积(A0)的百分比,即:
聚集度[19]即同一种作物空间分布的集中程度,聚集度值越高,作物分布越零散,相反,聚集度值越低,作物分布越集中。计算方法如下:
(1)设定研究区内各作物类型像元个数的50%作为计算作物聚集度的标准。
(2)把15km×10km的研究区均分成100个1.5km×1km的小区域,统计各小区域内各个作物类型的像元个数,并将像元个数由大到小排列。
(3)把小区域内各作物类型的像元个数由大到小相加,直到达到总像元个数的50%。
(4)计算参与相加的小区域个数占总小区域数的百分比,这个值即为该作物的聚集度。
5 结果与分析
5.1 空间分辨率对分类精度的影响分析
本文利用地面验证样本,计算不同分辨率影像和不同分类方法得到的混淆矩阵,进而得到总体分类精度(图3)。
图3 总体精度和Kappa系数随不同分辨率的变化图
(1)随着空间分辨率的降低,分类精度呈下降趋势,这与 Toll等[3-5,7]的结论一致。在分辨率优于60m的情况下,分类精度受到空间分辨率的影响较小,分类精度基本达到90%以上,当分辨率低于80m以后,分类精度急剧下降(100m分辨率时分类精度不到50%),已经明显不能满足监测需要。
(2)从3种分类方法对像元精度影响的角度分析,总体来说SVM得到的结果最为理想,而ANN精度最差,这与该方法网络类型的选择、隐含层数目和隐含层结点数难以确定有关。
5.2 空间分辨率对面积估算精度的影响分析
根据不同分辨率下的不同分类结果估算各种作物的种植面积,得到不同作物的区域精度随分辨率的变化图(图4)。同时以地面调查获得的作物种植地块分布图为基础,计算了不同作物的种植成数和聚集度值(表1)。
(1)在空间聚集水平接近的情况下,如玉米和金银花,玉米的区域精度随分辨率的降低下降速率较慢,金银花的区域精度下降较快。随着分辨率由20m下降到100m,玉米精度下降平均不超过20个百分点,而金银花则下降超过50个百分点,这是因为玉米的种植成数超过了38%,而金银花的种植成数较小(均不足10%)。说明种植成数越高,区域精度随分辨率的降低下降速率越慢。
表1 不同作物的种植成数和聚集度值
图4 不同作物的区域精度随分辨率的变化图
(2)在种植成数接近的情况下,如棉花和金银花,棉花的区域精度随分辨率的降低下降速率较慢,金银花的区域精度下降较快。随着分辨率由20m下降到100m,棉花精度下降平均不超过40个百分点,而金银花精度则下降超过50个百分点,这是因为棉花的聚集度值较小,分布较密集。表明作物分布越密集,区域精度随分辨率的降低下降速率越慢。
(3)大豆的聚集度值为0.18,分布最为密集,虽然其种植成数很低(仅为2.57%),当分辨率优于80m时,面积估算精度随分辨率的降低仍然比较稳定,精度基本在80%以上,但当分辨率降低到100m时,精度迅速下降。说明对于分布十分密集的作物,当分辨率较高时,聚集度对其精度结果起主导作用。
(4)从3种分类方法对区域精度影响的角度分析,对于玉米这种种植成数较高的作物,3种分类方法均能达到较高的精度。对于大豆、棉花和金银花,总的来说,SVM和MLC算法能够保证在分辨率相对较高的情况下(<80m)获得较高的区域精度,ANN算法则在空间分辨率下降时面积估算精度急剧下降。
5.3 数据源及分类方法选择问题
随着遥感技术的发展,大量携带不同传感器的卫星陆续升空,可获取多个不同空间分辨率的遥感数据,诸 如 Landsat MSS(80m)、Landsat TM(30m)、SPOT(20m)、CBERS(20m)、IKONOS(1m)、QuickBird(0.61m)等。在多种数据源中选择合适的数据成了一个新的难题[20]。目前,国际上关于分辨率的一个广泛关注的问题,就是针对某一特定研究如何选择合适的数据源,以及要满足一定的精度要求选用何种分类方法。
本研究的结果还可以用于指导针对不同种植结构地区满足不同精度要求的数据源和分类方法的选择。例如对于种植较密集且一种作物占优势的地区(如作物聚集度小于0.4且种植成数大于40%的情况下),要使区域精度达到90%以上,选用较低分辨率的MERIS数据即可满足要求,并且ANN算法可以得到很高的精度;对于作物种植面积较小但分布又比较密集的地区(如种植成数不足5%但聚集度低于0.2的情况下),用中等分辨率的IRS-P6数据即可使区域精度达到90%以上,并且SVM和MLC算法均可得到较高的精度;对于作物分布比较零散的地区,空间分辨率对区域精度的影响较大,要想得到90%以上的精度最好选用TM或CBERS-02B数据,并且具体分类方法的选择需要根据研究区内具体的作物而定(比如对于种植相对较密集的作物,支持向量机方法优于MLC和ANN方法)。
6 结束语
本文通过模拟多种不同分辨率影像,研究了空间分辨率对作物识别和面积估算精度的影响,同时也分析了种植成数和聚集度对作物种植面积估算精度的影响,得出如下结论:
(1)从空间分辨率对作物分类识别精度的影响分析,随分辨率的降低,分类精度呈下降趋势,当分辨率高于80m时,精度能维持在85%以上。
(2)从空间分辨率对作物种植面积估算精度的影响分析,随着空间分辨率的降低,作物种植成数越高,作物种植越密集,种植面积估算精度下降的速率越慢。对于分布十分密集的作物,当分辨率高于80m时,聚集度对其精度结果起主导作用。
(3)本文研究结果可以用于针对特定遥感应用中遥感数据和分类方法的选择。对于种植较密集且一种作物占优势的地区,选用MERIS数据和ANN算法可使区域精度达到90%以上;对于作物种植面积较小但分布又比较密集的地区,可选用IRS-P6数据和SVM或MLC算法;对于作物分布比较零散的地区,最好选用TM或CBERS-02B数据,具体分类方法的选择需要根据研究区内具体的作物而定。
在以后的研究中还需在如下方面做进一步的讨论和改进:直接采用不同分辨率影像进行分类精度评价;先对高分辨率数据进行作物分类,然后对分类结果进行尺度转化得到较低分辨率的作物识别结果;在其他不同地貌类型和种植结构的典型作物区进行试验,测试本文中结论的适用性。
[1]徐俊锋.IKONOS信息提取的尺度效应研究[D].浙江:浙江大学,2006.
[2]CHEN D,STOW D A,GONG P.Examining the effect of spatial resolution and texture window size on classification accuracy:An urban environment case[J].International Journal of Remote Sensing,2004,25(11):2177-2192.
[3]MOODY A,WALSH S J,ALLEN T R,et al.Scaling properties of NDVI and their relationship to land-cover spatial variability[C].Proceedings of the 1995International Geoscience and Remote Sensing Symposium,Firenze,Italy,1995.
[4]MOODY A,WOODCOCK C E.Scale-dependent errors in the estimation of land-cover proportions:Implications for global land-cover datasets[J].Photogrammetric Engineering and Remote Sensing,1994,60(5):585-594.
[5]TOLL D L.Effect of Landsat Thematic Mapper Sensor parameters on land cover classification[J].Remote Sensing of Environment,1985,17(2):129-140.
[6]吴炳方.全国农情监测与估产的运行化遥感方法[J].地理学报,2000,55(1):23-35.
[7]何浩,朱秀芳,潘耀忠,等.尺度变化对冬小麦种植面积遥感测量区域精度影响的研究[J].遥感学报,2008,12(1):167-175.
[8]朱秀芳,潘耀忠,张锦水,等.训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅰ):训练样本与分类方法间分类精度响应关系研究[J].遥感学报,2007,11(6):826-837.
[9]LI Q,WU B,JIA K,et al.Maize acreage estimation using ENVISAT MERIS and CBERS-02BCCD data in the North China Plain[J].Computers and Electronics in Agriculture,2011,78(2):208-214.
[10]贾坤,李强子,田亦陈,等.微波后向散射数据改进农作物光谱分类精度研究[J].光谱学与光谱分析,2011,31(2):483-487.
[11]VERMOTE E F,TANRE D,DEUZE J L,et al.Second simulation of the satellite signal in the solar spectrum,6S:An overview[J].IEEE Transactions on Geoscience and Remote Sensing,1997,35(3):675-686.
[12]COLLINS J B,WOODCOCK C E.Geostatistical estimation of resolution-dependent variance in remotely sensed images[J].Photogrammetric Engineering and Remote Sensing,1999,65(1):41-50.
[13]KAVZOGLU T.Simulating Landsat ETM+imagery using DAIS 7915hyperspectral scanner data[J].International Journal of Remote Sensing,2004,25(22):5049-5067.
[14]WOODCOCK C,HARWARD V J.Nested-hierarchical scene models and image segmentation[J].International Journal of Remote Sensing,1992,13(16):3167-3187.
[15]HAY G J,NIEMANN K O,GOODENOUGH D G.Spatial thresholds,image-objects,and upscaling:A multiscale evaluation[J].Remote Sensing of Environment,1997,62(1):1-19.
[16]WOODCOCK C E,STRAHLER A H.Factor of scale in Remote Sensing[J].Remote Sensing of Environment,1987,21(3):311-332.
[17]MARCEAU D J,GRATTON D J,FOURNIER R A,et al.Remote sensing and the measurement of geographical entities in a forested environment.2.The optimal spatial resolution[J].Remote Sensing of Environment,1994,49(2):105-117.
[18]谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123-128.
[19]贾坤,李强子,田亦陈,等.遥感影像分类方法研究进展[J].光谱学与光谱分析,2011,31(10):2618-2623.
[20]李强子,吴炳方.作物种植成数的遥感监测精度评价[J].遥感学报,2004,8(6):581-587.
[21]刘灿然,陈灵芝.北京地区植被景观中斑块形状的指数分析[J].生态学报,2000,20(4):559-567.
[22]明冬萍,王群,杨建宇.遥感影像空间尺度特性与最佳空间分辨率选择[J].遥感学报,2008,12(4):529-537.