基于GF-2卫星数据的国情普查地表覆盖解译研究
2018-04-27冯启翔
冯启翔
(1.广州市房地产测绘院(广州市测绘产品质量检验中心),广东 广州 510030)
地理国情监测内容包括两部分:①自然地理要素的基本情况,包括地形地貌、植被覆盖、水域、荒漠与裸露地等的类别、位置、范围、面积等;②人文地理要素的基本情况,包括与人类活动密切相关的交通网络、居民地与设施、地理单元等的类别、位置、范围等。地表覆盖信息获取是地理国情监测的首要任务。以广东省某地遥感地理国情地表覆盖解译为例,详细介绍了eCognition(易康)软件的工程化解译的过程、效果,通过ArcGIS软件随机抽取多个样本点进行精度评定,分析该方法的优势及其局限性[1-7]。
1 研究区域概况
研究区域位于广东某地区,面积325 km2。本研究区域地表覆盖数据繁杂,地类地物种类繁多。具体收集了如下资料:
1)影像数据:使用的数据为高分二号(GF-2)卫星影像数据(3.2 m分辨率)的全色及多光谱影像,相关参数如表1所示。
2)矢量数据:为1∶10 000或者1∶50 000的农用地、房屋建筑群落等矢量数据。
3)其他相关资料:与研究区域相关的行政区域划分、农林牧等方面的参考资料。
表1 研究区遥感数据类型
2 研究区域的数据处理
数据处理主要涵盖两个方面:①在后台对基础遥感影像进行预处理;②对影像进行地表覆盖解译。
2.1 遥感影像预处理
影像数据预处理的目的主要是寻找并利用可以使用的基础数据,减少地表覆盖信息自动解译的难度,提升提取信息的准确性,为下一步的数据处理争取更多的时间。
1)数据收集整理。地理国情监测普查项目主要有两个方面的工作内容:①地理国情基本要素采集;②地表覆盖遥感解译。这两个工作是独立进行的,同时地理国情基本要素的采集也可以辅助进行地表覆盖分类解译。
地理国情普查项目可以利用的数据源主要包括以下几个方面:①高分辨率航空、航天影像数据(如GF-2数据);②已有线划DLG数据(1∶10 000/1∶50 000);③高精度数字高程模型数据(DEM、DSM等);④其他专题参考资料等。
在进行地理国情地表覆盖解译前,需要将相关的资料搜集并整理出所要用到的数据,如地理国情基本要素中的农用地矢量数据、房屋建筑群落数据等,可以结合这些数据作为参考,从遥感影像中提取出对应的地类,降低自动分类的难度,提高分类的准确性。
2)影像正射校正。地理国情项目遥感解译及正确信息统计都是基于正射遥感影像进行的,所以在做地类信息提取前,需要对遥感影像做正射校正,ERDAS、PCI、ENVI等遥感基本处理软件都可以进行相关的校正。
3)矢量与影像数据配准。参考矢量数据与要处理的影像数据由于时间及其他特殊原因,可能会出现投影及坐标不一致的现象,需要将不同投影坐标系的图像统一到同一投影坐标系下,保证同名地点的坐标的一致性。数据的配准也是在数据处理之前通过第三方软件如ERDAS、PCI、ENVI等作基本处理。
2.2 遥感影像解译知识库开发
根据《地理国情普查内容与指标》(编号:GDPJ01-2013)相关规定,对GF-2遥感影像的一级类(12类)进行数据提取,包括耕地(0100)、园地(0200)、林地(0300)、草地(0400)、房屋建筑(区)(0500)、道路(0600)、构筑物(0700)、人工堆掘地(0800)、荒漠与裸露地表(0900)、水域(1000)、地理单元(1100)、地形(1200)[8]。基于一级类数据,再结合自动划分及人工提取,进行二级(58类)及三级(133类)地类数据提取。
分类中最难自动提取的是道路及房屋建筑(区)信息,道路信息主要问题是人工后期提取量大,而房屋建筑(区)信息主要是房屋建筑(区)边缘信息自动提取较难,特别是房屋建筑(区)群落中,需要将大于一间房屋的房屋与其他地物区分开来,所以建议结合1∶10 000或1∶50 000DLG数据提取。其他地物中植被信息在一些特殊地区单纯通过一景影像数据难以划分,需要结合其他相关资料或者人工目测判断解译。采用计算机自动分类提取和人工判读结合的方式[9],利用eCogintion(易康)软件,主要解译流程如图1所示。
图1 主要解译技术流程
1) 道路提取。道路在遥感影像上一般以带状分布呈现,提取时可使用形状特征,如边界指数Boundary index、密度Density等,也可使用长宽比Length-Width Ratio特征,同时可结合使用亮度值Brightness Value、各波段均值Band Mean Value等进行分类。在本次广东研究区域内,主要是采用道路的矢量数据参与分割,然后根据矢量专题层对道路归类。
2) 植被信息提取。对植被进行分类时常用的特征是植被指数NDVI。各植被类别之间区分的常用特征有绿波段比率、近红外波段标准差、纹理特征等。
研究区域主要根据植被指数NDVI特征以及结合SVM监督分类方法提取植被信息,之后对初次分类提取的植被信息进行进一步细分。
单纯依靠一期影像很难区分耕地、园地、林地及草地信息,如果是山区,建议用DEM区分出林地,其他可参考近红外标准差及绿波段比率区分以及结合监督分类的方法提取。
3)水域提取。水域在近红水域提取外波段反射率较低,在影像上常表现为暗色调,因此分类水体时常采用与近红外波段有关的特征,如近红外波段均值、植被指数NDVI、水体指数NDWI等。研究区域主要利用水体指数NDWI进行水域提取,对自动分类结果进行后期人工判读编辑。阴影及一些含水地类易被误作为水域,需要后期人工判读编辑剔除或采用另外的方法对其剔除。
4)房屋建筑(区)物提取。房屋建筑(区)物各波段反射率较高,在遥感影像上一般呈现为亮色调,建筑群体表面较为粗糙,各波段标准差比较大,分类时可参照利用亮度值、各波段均值及各波段标准差。
根据地理国情监测的要求,两栋房屋之间距离大于独栋房屋时,要单独提取出来,这对于零散房屋来说较为容易,只需分割尺度合适即可。对于城市里的密集房屋,要单独将房屋与硬化地面、道路及其他人造地物区分开来比较难。建议使用房屋矢量数据参与分割,或者利用红波段均值结合监督分类方法,将其统一化为房屋建筑群,后期再结合高分辨率遥感影像及边缘特征等信息作进一步的提取。
5) 荒漠与裸露地表、构筑物和人工堆掘地提取。荒漠与裸露地表、构筑物、人工堆掘地由于没有地物覆盖,反射率较高,在遥感影像上一般表现为亮色调,提取时一般采用亮度值、各波段均值。
2.3 地表覆盖解译数据成果分析
按照前文创建的不同地物解译规则集知识库,开始地物分类。利用规则集知识库,调用控件作为工程化、自动化生产的方案,即Architect生产作业流程;工作人员只需要按照作业的要求,调整创建的控件参数信息,从中提取地表数据,并将大量数据整体移交至服务器Server,由其作出自动化批量化的数据处理,其间可以编辑利用人工判读解译及基于样本的监督分类方法,有效地提高地类提取的准确性。Architect生产作业流程以及最终分类结果如图2所示。
图2 Architect生产作业流程(左)及最终分类结果(右)
2.4 地表覆盖解译数据精度评定分析
混淆矩阵是用来表示精度评价的一种标准格式。该矩阵的列为参考影像信息,行为被评价影像分类结果信息,行与列相交的部分概括了分类到与参考类别有关的某一特定类别中的样本数目,样本数可以为像元数目、或者分割对象数目,具体表达形式如表2所示。
表2 混淆矩阵表达形式
设xij是分类数据中第i类和参考数据类型第j类的分类样本数为分类所得到的第i类的总和;为参考数据的第j类的总和;N为评价样本总数。则用户精度为(User Accuracy):图精度为(Producer Accuracy)总体精度为
为了对解译成果进行精度评定,采用ArcGIS软件在研究区域内随机抽取51个精度评定点,套合高清遥感影像,利用人工对所选精度评定点作出判断分析,并将之与eCognition(易康)软件的处理成果作出比较,得出各地物大概的分类精度,如表3所示。
表3 混淆矩阵精度评定分析结果
由表3混淆矩阵精度评定分析结果可见,经过eCognition(易康)软件对研究区域地表覆盖解译之后,地物提取的总体精度达到98%,完全符合生产任务的精度要求。
2.5 生产效率分析
eCognition(易康)软件工程化解译方法应用于多丘陵区域的影像数据(如图3 所示)处理,由于本区域内林地分布特点导致人工判读绘制耗时较长,一幅1∶10 000图幅数据人工判读时间大约在6~7(11~12 h工作/d)d左右。利用eCognition(易康)软件工程化解译的方法,自动处理一幅1∶10 000影像数据需要0.5~1 h左右,人工判读地物修改需要4~5 d,工程化解译方法能够至少节约1~2 d时间。
图3 丘陵区域地类分析
4 结 语
地理国情普查地表覆盖信息量大、涵盖面广、数据融合多,采用人工解译耗时较长,且个体对解译方式的理解均有不同,导致地表覆盖解译的数据存在差异性,不利于数据的统计及后期的分析应用。本文以广东省某区域高分二号(GF-2)卫星影像的地表覆盖解译为例,提出了一套基于eCognition(易康)软件对地表覆盖解译自动化处理的技术流程,并对解译成果进行精度评定。其中还存在一些不足,需要减少人工判断数据进行解译辅助,实现自动化快速解译,推动后续的地理国情普查地表覆盖解译工作减少人工干预,获取更高精度分类结果。
[1] 刘若梅. 对地理国情监测的再认识[J].地理信息世界,2013(1):27-30
[2] 张勤, 樊文锋. 测绘与地理国情监测[J].测绘通报,2012(11):78-80
[3] 陈镭, 丛越君. 浅析第一次全国地理国情普查[J].西部资源,2013(6):135-136
[4] 唐秀娟. 抓好地理国情普查 促进新型城市化建设[J].产业与科技论坛,2014,13(10):216-217
[5] 程滔, 周旭, 刘若梅. 面向地理国情监测的地表覆盖信息提取方法[J].测绘通报,2013(8):84-86
[6] 陈军, 陈晋, 宫鹏,等. 全球地表覆盖高分辨率遥感制图[J].地理信息世界,2011,9(2):12-14
[7] 李晓兵, 陈云浩, 喻锋. 基于遥感数据的全球及区域土地覆盖制图——现状、战略和趋势[J] .地球科学进展,2004,19(1):71-80
[8] 国务院第一次全国地理国情普查领导小组办公室.地理国情普查内容与指标[Z].2013-08
[9] 任立欣,岳昊,刘春红.地理国情普查地表覆盖数据分类方法研究[J].测绘与空间地理信息,2014(6):72-74