国产卫星数据在土地利用现状宏观监测中的应用评价
2013-09-26闫冬梅尤淑撑
闫 敏,张 丽,燕 琴,闫冬梅,尤淑撑
(1.山东科技大学测绘科学与工程学院,青岛 266590;2.中国科学院对地观测与数字地球科学中心,北京 100094;3.中国测绘科学研究院,北京 100830;4.中国土地勘测规划院,北京 100037)
0 引言
土地利用宏观监测目标是在全国范围内实现每2-3年1次的土地利用遥感监测。为了保证在全国各地区都能获取有效数据,必须综合考虑多种中分辨率卫星数据的合理使用。目前常用的中分辨率遥感数据主要为Landsat TM/ETM,我国自主产权的中分辨率遥感数据有中巴资源卫星(CBERS)、资源三号卫星、环境减灾卫星一号(HJ-1)、北京一号卫星(BJ-1)等数据。宏观监测具有很强的时效性,监测范围广,单靠某一两种卫星数据不能完全满足规定时间内全国范围有效全覆盖的需求,为此需将国产卫星数据进行优化组合,综合使用。
目前已有部分研究采用国产卫星数据进行土地利用现状监测。中巴资源卫星02B星(CBERS-02B)CCD数据19.5 m的空间分辨率能很好地显示地物的纹理特征,满足宏观监测精度要求,采用传统的分类方法分类精度基本可达80%以上[1-3];尤淑撑[1]和申克建[2]等认为面向对象的分类方法更适合于CBERS-02B数据。王茜等[4]针对 BJ-1数据用最大似然和马氏距离2种分类方法对研究区域进行土地利用分类,分类总体精度也可达80%以上,说明BJ-1数据也同样能够满足土地利用现状研究需求。用HJ-1数据进行土地利用现状调查还不多见。目前已有的基于国产卫星数据的土地利用现状研究仅局限于某一种数据源的应用或只针对某个研究区,不能为宏观监测的总目标提供综合评价依据。
本文基于CBERS-02B,HJ-1和BJ-1国产中分辨率多光谱数据,针对分布在全国的6个地形各异的实验区,分析了几种分类方法的分类结果精度及其影响因素,系统评价了3种国产中分辨率遥感数据在土地利用现状宏观监测中的应用性能,为实现每2-3年1次覆盖全国的土地利用现状遥感监测提供科学参考依据。
1 研究区及数据源概况
由于土地利用现状宏观监测的目标是在全国范围内实现土地利用宏观监测,本实验研究区特别选取了分布在全国范围的6个区县。研究区由北至南分别是黑龙江省哈尔滨市、北京市昌平区、甘肃省金昌市、浙江省富阳市、重庆市长寿县和湖南省望城县。这6个地区地形地貌与地表覆盖类型较全面,特征鲜明,包括丘陵(湖南省望城县)、山区(重庆市长寿县、浙江省富阳市)、平原(黑龙江省哈尔滨市)、高原(甘肃省金昌市)、山区和平原交接地区(北京市昌平区),各地区特征见表1。
表1 实验区特征描述Tab.1 Characteristics of study area
对所采用的CBERS-02B CCD(空间分辨率为19.5 m)、HJ-1(空间分辨率为 30 m)和BJ-1(空间分辨率为32 m)多光谱数据进行了辐射校正和几何粗纠正,在此基础上又进行了几何精纠正,几何纠正精度在0.5个像元之内。各地区数据的成像时间如表2所示。
表2 各地区图像成像时间Tab.2 Acquisition time of the satellite images
2 土地利用现状信息提取
全国第二次土地调查分类系统将地表覆盖类型分为耕地、园地、林地、草地、建设用地、水域和其他用地等7大类,本次实验参考该分类系统并结合具体情况进行土地利用现状信息提取。
2.1 训练样本选取
为避免特征维数的增加对分类性能的影响,在遥感图像分类中,假设某个地物类别服从正态分布,要选择训练样本对该类别进行表示,需要的样本数量计算公式为
式中:n为采样个数;p为准确度期望值(百分数);z为按照一定概率水平在标准正态分布双侧分位数表中查到的值;e为期望值的允许偏差(百分数)。在具体的实验中不是利用公式确定样本数量,而是采用人们长期总结出来的简单方法,即选择10~30倍于图像波段数目的训练样本,或者在此基础上越多越好,样本量的增加可以减少单次分类引起的随机误差,使分类结果趋于稳定[5-6]。
2.2 分类方法
目前被广泛使用的基于像元的分类方法主要有最大似然分类法(MLC)、支持向量机法(SVM)、决策树法(DC)和神经网络法(NN)。由于国产卫星波段数较少,集中在可见光和近红外波段,通常在SVM,DC和NN方法分类时可利用归一化植被指数(NDVI)、高程(DEM)、主成分变换(PCA)分量等数据加以辅助。
同基于像元的方法相比,面向对象分类方法(OO)不仅可以利用地物的光谱信息,还可以利用图像的空间位置、形状特征等[10]。本实验中经过多次精度试验,采用了NDVI、形状因子、纹理等特征进行面向对象的分类方法。
3 实验结果分析
通过对分类的结果进行精度评价实现对各关键技术的评价。精度评价过程中验证样本的选取与训练样本基本没有重叠区,即使是相同地物的多个样本也相隔一定距离选取。
3.1 训练样本数对分类结果精度的影响
通过依次增加训练样本的数量,得出了各种分类方法达到稳定精度所需要的最佳样本数,样本数量基数为波段数的10倍,在此基础上以公差为10的等差数列递增,直到精度达到稳定。以CBERS-02B数据为例,训练样本数对分类结果精度的影响如图1所示。
图1 训练样本数量对分类算法的精度影响(以CBERS-02B数据为例)Fig.1 Influence of training samples to classification accuracy(take CBERS-02B data for example)
综合实验结果可以看出:
1)同一地区采用不同的卫星数据,由于传感器性能、成像条件等影响,分类精度和所需最少样本数也会有差异。从实验区整体来看,CBERS-02B数据自动分类精度较高,大部分地区Kappa系数能达到0.8,且在大部分情况下样本数量达50时精度就较为稳定。而对于HJ-1和BJ-1数据,由于分辨率略低于CBERS-02B数据,大部分地区Kappa系数能达到0.7以上,且样本数量达60时精度也能趋于稳定。
2)相比其他分类方法,MLC可满足3种数据源的分类精度要求,用最少的样本数就可达到较高的精度,样本数达50时精度就趋于稳定,是4种监督分类方法中最稳定的方法,可用于3种数据源的宏观监测。
3)由于各地区地形存在差异,同一种卫星数据在各地区达到稳定精度所需的样本数量也不同。以BJ-1数据为例,若采用最稳定的MLC方法,在平原的黑龙江哈尔滨地区,采样样本数达50时分类精度就能趋于稳定,精度为0.82;而在高山区的甘肃金昌,样本数量达60时分类精度才可趋于稳定,精度也仅为 0.7。
3.2 特征数据对分类精度的影响
由于所用中等分辨率数据波段数较少,针对各分类方法的最佳样本数依次增加特征数据的维数测试其对分类结果的影响,加入的特征数据有NDVI、DEM和PCA的前3个分量,验证其对SVM,DC和NN的分类精度的影响。以CBERS-02B数据为例,分类精度随特征数据的增加而变化的情况如图2所示,图中单、N,D,P分别代表单波段、NDVI,DEM和PCA前3个分量。
图2 特征数据对分类算法的精度影响(以CBERS-02B数据为例)Fig.2 Influence of feature data to classification accuracy evaluation(take CBERS-02B data for example)
实验结果表明:
1)随着特征数据的增加,SVM和DC的分类精度总体呈上升的趋势;而NN分类方法不稳定,伴随着NDVI,DEM,PCA前3个分量的加入精度会有所下降,尤其是加入PCA分量之后下降幅度较大。分析其原因主要是主成分变换进行了波段信息综合,在实现数据压缩的同时,也使各类间图像波谱差异受到了抑制和压缩[11]。
2)对HJ-1和BJ-1数据而言,若采用SVM,DC和NN方法,加入DEM后精度上升较大,部分地区Kappa系数由0.7提高到0.8,而加入 NDVI和PCA分量后精度呈下降趋势。
3.3 分类方法对分类精度的影响比较
由前述实验可知,样本的选取、特征数据选择等对基于像元的分类结果产生一定影响。若采用面向对象方法中基于隶属度函数的模糊分类,分类过程中不需要考虑样本的问题,由隶属度函数返回一个0~1之间的隶属度值,由此作为对象隶属某一类的依据。
面向对象分类方法可以在不同尺度对地物进行分割,以保证地类信息提取的精确,同时充分利用了地物的光谱特征、纹理特征、形状特征等。表3为实验区基于像元和面向对象分类方法的Kappa系数。
表3 基于像元和面向对象分类方法的Kappa系数Tab.3 Comparison of pixel- based classification and object-oriented classification
续表
由表3可看出,在6个实验区,若采用面向对象的分类,Kappa系数基本都在0.8以上,耕地、建设用地的生产者精度和用户精度也能达到要求的85%以上。而采用基于像元的分类,只有CBERS-02B的大部分数据Kappa系数达到了0.8以上,耕地、建设用地的生产者精度和用户精度也仅有部分地区达到85%以上。另外从分类结果图来看,面向对象的分类结果比较完整,破碎性较小。
图3 重庆长寿县分类结果比较(HJ-1数据)Fig.3 Classification maps of Changshou county,Chongqing(take HJ-1 data for example)
以重庆市长寿县HJ-1数据为例(图3),该地区地表覆盖大部分为植被,耕地多为山地梯田,水域有线状、面状和碎斑状,因此利用了耕地的纹理特征将其从植被中提取出来,碎斑状的水域在较小的尺度下进行分割,同时利用了形状特征进一步分类,保证了分类结果的精度和完整性。
3.4 误差来源分析
分类误差来源的分析既是对分类过程的检验,也是对分类结果进行改进的重要前提工作。任何图像分类过程中都会有误差,其原因是多样的。
1)样本质量。本次实验中由于数据质量、地形复杂给解译造成一定困难,使得训练样本的可分离性并不高,对分类结果造成了一定影响。如图4中重庆市长寿县的样本n维可视化散点图显示,林地、草地和耕地的可分离性较差,尤其是耕地和草地,重叠部分较多(如图中红框部分)。
图4 重庆长寿县训练样本n维可视化散点图Fig.4 n-D visualizer of training samples
2)区域差异。实验区的地形、地貌地物特征差异较大,是实验结果精度不稳定的原因之一。例如在高山地貌区的甘肃省金昌市存在大面积的裸地,其光谱特征和建设用地极易混分,HJ-1数据分类结果Kappa系数在0.7左右,BJ-1数据分类结果Kappa系数在0.6~0.7之间;位于平原的黑龙江省哈尔滨市耕地间夹杂多片零碎的建设用地,耕地光谱特性和建设用地也极为相似,导致3种数据的分类结果Kappa系数均在0.8以下。
3)数据质量。就传感器因素而言,3种中等分辨率的国产卫星数据相比Landsat卫星数据波段数较少,仅有3~4个波段,波段宽度较窄,光谱分辨率较低,对地物分辨的针对性不够强。建议在分类时,可增加特征数据(如NDVI、DEM等)作辅助,提高分类精度。
4 结论
在全国范围内选择地形各异的6个地区,基于3种国产数据,进行土地利用现状信息提取,运用4种基于像元的分类方法和面向对象的方法对6个地区进行了现状信息提取。根据分类结果精度的比较与分析,认为3种国产卫星数据均可满足土地利用的需求。在多种数据优化组合情况下可以大范围地推广使用。
1)采用基于像元的分类方法,要使结果达到较高精度,采样样本必须满足数量和质量上的要求,但也并不是数量越多越好。本实验发现分辨率较高的CBERS-02B数据样本数量达50时,分类精度就能趋于稳定,Kappa系数基本都可达到0.8以上;而HJ-1和BJ-1数据样本数量达60时才可达到稳定精度,大部分地区Kappa系数为0.8左右。
2)从本质上讲,没有一种分类方法是最优的,重点监测地类的特性、研究区域的特性、遥感数据的分布等因素将决定选用哪种分类方法更为合适,可得到有用的结果。本次实验发现,最大似然法对样本可分离性要求不高,各试验区的分类结果Kappa系数基本都在0.8以上,较为适用于大规模的土地利用宏观监测。
3)面向对象的分类方法能有效提高分类精度,本次实验85%的实验区分类Kappa系数都能达到0.8以上,并有部分地区达到0.9以上,尤其保证了分类结果中各地类的完整性。但在达到同样精度的前提下较最大似然法更为复杂,故不宜在大范围内推广使用,建议在宏观监测的重点监测地区可采用此方法。
4)同一地区不同的国产卫星数据,由于传感器性能、成像条件等因素的影响分类精度会有差异,但基本都能满足大范围宏观监测的精度要求。而采用多数据优化组合模式可更好地进行土地利用现状信息提取。在我国多云雨的南方地区,光学图像受云覆盖几率较大,因此在宏观监测中可综合考虑选用多种卫星数据,使用最佳的无云或少云图像进行监测。CBERS-02B数据基于像元的和面向对象的分类精度相差不大,在仅获取到CBERS-02B数据的地区,采用简单易行的MLC方法即可满足宏观监测的需要;而在部分地区,HJ-1和BJ-1数据的基于像元和面向对象分类精度相差较大,建议当只能获取到HJ-1或BJ-1数据时,可以采用面向对象的方法进行土地现状分类。
[1]尤淑撑,刘顺喜,周连芳,等.基于CBERS-02B星数据的土地利用/覆被类型监测应用研究[J].国土资源遥感,2009,21(1):83-85.You S C,Liu S X,Zhou L F,et al.Application method for land use macro monitoring based on CBERS-02B CCD data[J].Remote Sensing for Land and Resources,2009,21(1):83-85.
[2]申克建.CBERS CCD数据土地利用/覆被分类研究[D].北京:中国地质大学,2009.Shen K J.Research of land-use and land cover classification methods based on CBERS CCD satellite data[D].Beijing:China University of Geosciences,2009.
[3]陈 江,郭增长.中巴资源卫星02B星土地覆盖分类[J].太原科技,2008(10):52-54.Chen J,Guo Z C.Research of land-use and land cover classification[J].Taiyuan Science and Technology,2008(10):52-54.
[4]王 茜,张增祥,牟风云,等.“北京一号”小卫星影像质量及土地利用分类精度研究[J].中国矿业大学学报,2007,36(3):386-389.Wang Q,Zhang Z X,Mou F Y,et al.Research on“Beijing 1”micro-satellite image quality and land use classification precision[J].Journal of China University of Mining and Technology,2007,36(3):386-389.
[5]朱秀芳,潘耀忠,王 双,等.训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅱ)——样本质量对小麦测量精度的影响分析[J].测绘科学,2009,161(5):132-135.Zhu X F,Pan Y Z,Wang S,et al.The effects of training samples on the wheat planting area surveying accuracy in TM scale(II):The accuracy response of different classifiers to samples quality[J].Science of Surveying and Mapping,2009,161(5):132-135.
[6]薄树奎,丁 琳.训练样本数目选择对面向对象影像分类方法精度的影响[J].中国图象图形学报,2010,15(7):1106-1111.Bo S K,Ding L.The effect of the size of training sample on classification accuracy in object-oriented image analysis[J].Journal of Image and Graphics,2010,15(7):1106-1111.
[7]郭 健,张继贤,张永红,等.多时相MODIS影像土地覆盖分类比较研究[J].测绘学报,2009,38(1):88-92.Guo J,Zhang J X,Zhang Y H,et al.Study of the comparison of land cover classification for multitemporal MODIS images[J].Acta Geodaeticaet Cartographica Sinica,2009,38(1):88-92.
[8]Nemmour H,Chibani Y.Multiple support vector machins for land cover change detection:An application for mapping urban extensions[J].ISPRS Journal of Photogrammentry and Remote Sensing,2006,61(2):125-133.
[9]骆剑承,周成虎,梁 怡,等.支撑向量机及其遥感影像空间特征提取和分类的应用研究[J].遥感学报,2002,6(1):50-55.Luo J C,Zhou C H,Liang Y,et al.Support vector machine for spatial feature extraction and classification of remotely sensed imagery[J].Journal of Remote Sensing,2002,6(1):50-55.
[10]Sun Z P,Shen W M,Wen B.Object-oriented land cover classification using HJ-1 remote sensing imagery[J].Science China:Earth Sciences,2010,53(S1):34-44.
[11]施拥军.森林遥感分类技术研究——以浙西北山区为例[D].杭州:浙江大学,2003.Shi Y J.Research on Technologies of forest classification by remote sensing-a case of northwest mountainous area in Zhejiang[D],Hangzhou:Zhejiang University,2003.