东北黑土区耕地分布解译的遥感数据源对比
2016-08-02张延玲何小雷
高 燕,张延玲,何小雷
(1.水利部 松辽水利委员会,吉林 长春 130021;2.北京师范大学 地理学与遥感科学学院,北京 100875)
东北黑土区耕地分布解译的遥感数据源对比
高燕1,张延玲1,何小雷2
(1.水利部 松辽水利委员会,吉林 长春 130021;2.北京师范大学 地理学与遥感科学学院,北京 100875)
[摘要]为了解国家基础地理信息中心的全球地表覆盖遥感制图数据(Globalland30-2010)和中国科学院全国1∶10 万比例尺土地利用数据库2010年度更新数据(LUCC-2010)在东北黑土区耕地范围界定研究中的适用性,选择位于东北典型黑土区的北安市、克东县、龙江县和梅河口市为研究区,利用高空间分辨率的地方土地利用数据建立耕地漏分和误增两个指标,对两种数据进行对比分析。研究结果表明:在耕地连续均匀分布的地区,两种数据的耕地精度都比较高;在林地和耕地混合分布区域,Globalland30-2010高估了耕地面积;在耕地和草地、水域混合区域,LUCC-2010低估了耕地面积。Globalland30-2010的总体精度略高于LUCC-2010,但是LUCC-2010耕地一类的精度高于Globalland30-2010。
东北黑土区是我国重要的粮食生产区,保护其耕地资源对保障我国粮食安全具有重要意义。近年来针对严重的土壤侵蚀状况,在东北黑土区开展了大量水土保持工作,而掌握耕地分布状况是进行水土保持规划的基础。目前,大范围的耕地分布数据主要是依靠不同尺度的遥感影像分类解译获得的。1 km2分辨率的遥感产品能够实现全区域的高频次覆盖,但是分类结果的精度很低;米级空间分辨率的土地利用产品具有很高的分类精度,但是只有局部的数据产品。目前国内常用的数据产品主要来自30 m分辨率的陆地资源卫星数据,其中最新发布的权威性数据有国家基础地理信息中心的全球地表覆盖遥感制图数据(Globalland30-2010)和中国科学院全国1∶ 10万比例尺土地利用数据库2010年度更新数据(LUCC-2010)。为了解这两种数据在东北黑土区耕地范围界定研究中的适用性,选择位于东北典型黑土区的北安市、克东县、龙江县和梅河口市为研究区,利用高空间分辨率的土地利用数据建立耕地漏分和误增两个指标,对两种产品进行了对比分析。
1遥感数据介绍
Globalland30-2010是由国家基础地理信息中心牵头,联合多家科研院所共同完成的以2010年为基准年的全球地表覆盖遥感制图数据。该数据覆盖了南北纬80°的陆地范围,包括耕地、森林、草地、灌木林地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪等10种地表覆盖类型,采用栅格格式,投影方式为通用横轴麦卡托(UTM),WGS-84坐标参数,空间分辨率为30 m,为了表述方便,本文简称G30。
中国科学院地理科学和资源研究所刘纪远等从20世纪80年代以来一直研究地学信息与遥感信息融合的方法,形成了多期LUCC数据,建立了中国1∶ 10万比例尺土地利用数据库(LUCC)[1-2]。2010年度更新数据(LUCC-2010)采用矢量格式,投影方式为Albers,Krasovsky-1940坐标参数,空间分辨率为30 m,本文简称LU。
选择和G30、LU数据同时期的高精度土地利用数据,该数据由法国SPOT卫星遥感影像经过精细分类获得,其野外验证精度很高。该产品采用矢量格式,投影方式为高斯克吕格(TM),坐标系参数采用CGCS-2000,分辨率为2.5 m,本文简称CC。
2研究方法
选择位于东北典型黑土区的黑龙江省北安市、克东县、龙江县和吉林省梅河口市为研究区,选用区内具有较高空间分辨率的CC数据为参考数据,对G30和LU数据进行地类分类结果的比较和精度验证。考虑到3种数据所采用的土地分类方法不同,为了方便对比分析,首先进行地类的重新归并,将原地类合并为耕地、林地、草地、水域和其他用地共5个新的综合类别(表1);其次以CC数据为基准,分别进行CC与G30、CC与LU数据之间的配准,在配准数据的基础上再进行G30 和LU数据的精度评价。精度评价采用的评价因子包括总体分类精度(OA)和Kappa系数(K)、用户精度(UA)[3-5]。
(1)总体分类精度(OA),样本所分类的结果与地面所对应的实际类型相一致的概率,计算公式为
表述的是对每一个随机
(1)
式中:n为分类类别数量;Pii为混淆矩阵中第i类的斜对角上的像元数目;Ptot为分类图中像元总数。
(2) Kappa系数(K),是用来评价两幅图之间的吻合度或精度的一种指标。相比于总体分类精度,它考虑了对角线上和不在对角线上的各种漏分和错分误差,计算公式为
(2)
式中:Pi+为第i行上所有类别(分类图像的第i类)的像元数;P+i为混淆矩阵中第i列上所有类别(参考图像的第i类)的像元数。
(3)用户精度(UA),对于第i类,表示从分类结果中(如分类产生的类型图)中任取一个随机样本,其所具有的类型与地面实际类型相同的条件概率,计算公式为
(3)
为了评价G30、LU两种数据对耕地面积的误判,分别采用耕地漏分和耕地误增两个指标进行评价,其中:耕地漏分表示验证数据CC中类别为耕地,但是在待比较土地利用分类数据中类别为非耕地的面积;耕地误增表示验证数据CC中类别为非耕地,但是在待比较土地利用分类数据中类别为耕地的面积。
3结果与分析
3.14县(市)土地类型构成情况
对重归类后的CC、G30、LU三种数据的4县(市)土地利用面积和比例进行了统计,见表2。从表2可以看出,北安县、克东县、龙江县和梅河口市的土地利用类型均以耕地为主,其次是林地,草地、水域和其他地类所占比例较小。以CC数据为例,耕地分别占北安市、克东县、龙江县和梅河口市土地总面积的49.1%、75.0%、67.8%、56.9%;林地所占比例分别为34.3%、12.8%、11.4%、31.3%;草地、水域和其他地类合计所占比例分别为16.6%、12.2%、20.8%、11.8%。数据结果表明,与CC数据的土地利用数据相比,G30数据高估了耕地和草地的面积,低估了林地和水域面积,LU数据高估了水域面积,低估了林地面积。
表2 4县(市)不同土地利用数据归并后的地类面积与比例
CC数据地类归并后的4县(市)土地利用类型分布情况见图1。北安市的耕地主要分布在西部地区,而林地集中在东部,相比于耕地和林地,草地、水域和其他3种地类的分布面积较小,空间分布也较零散;克东县耕地分布广泛,林地主要分布在东南角和西北角,草地、水域和其他3种地类的分布较杂乱;龙江县耕地分布广泛,林地主要集中在西北角和南部两个地区,水域在南部、东南部和东北部有较大面积分布,草地和其他2种地类分布零散;梅河口市耕地和林地大致呈东北-西南走向的长条状分布,水域主要分布在西南角(呈块状分布)和中部地区(呈线状分布),草地和其他2类分布少而零散。
图1 CC数据土地利用类型归并结果
3.2分类的总体精度验证
G30数据与LU数据的精度验证结果如表3所示。其中,4县(市)的总体精度值在65%~82%之间,G30数据的精度值高于LU数据,说明G30数据的总体分类精度要优于LU数据;K值在0.40~0.54之间,其中北安市和克东县G30数据的K值大于LU数据,龙江县和梅河口市G30数据的K值小于LU数据,而北安市和克东县各地类的分布情况相对简单(主要为耕地和林地),龙江县和梅河口市各地类分布相对复杂(以耕地、林地和水域为主),说明G30数据对地类组成简单的目标分类效果较好,而LU数据对地类混杂分布的目标分类效果可能更佳。耕地用户精度值均高于74%,尤其克东县和龙江县两县的精度值在87%左右,除龙江县G30数据的精度值略高于LU数据,其他3县(市)LU数据的精度值均高于G30数据,说明LU数据对耕地一类的分类精度优于G30数据。
表3 G30与LU数据的总体精度验证
3.3耕地与其他土地利用类型混淆对比
3.3.1耕地与林地比较
选择林地较多的北安市、梅河口市和龙江县进行耕地和林地的混淆情况分析,得到耕地和草地两类之间的误增和漏分误差分布,见图2。由图2和表2可知,北安市的耕地和林地面积所占比例较大且分布相对集中,CC数据耕地面积为3 433 km2,G30为3 933 km2,LU为2 972 km2,其中:G30数据耕地面积比CC数据高估14.6%,林地面积比CC数据低估27.3%;LU数据耕地低估13.4%,林地低估3.9%。梅河口市林地面积少于北安县,林区和耕地分布混合度高、 交叉性强、 界限不清,CC数据中耕地面积为1 206 km2,G30为1 523 km2,LU为1 166 km2,其中:G30 耕地高估26.3%,林地低估49.4%;LU耕地低估3.3%,林地高估3.3%。龙江县的林地面积比例较小,呈零星分布,CC数据中耕地面积为3 884 km2,G30为4 153 km2,LU为3 966 km2,其中:G30 耕地高估6.9%,林地低估71.9%;LU耕地高估2.1%,林地低估48.9%。在林地和耕地混合区域内,G30中林地错分为耕地的面积大于LU,林地和耕地的结合度越大,耕地面积误差越大。
图2 CC-G30和CC-LU耕地与林地的分布及变异对比
3.3.2耕地与草地比较
选择草地分布相对较多的北安市和克东县分析草地和耕地的混淆情况,得到耕地和草地之间的误增和漏分结果,见表2和图3。在北安县西部的耕地集中分布地区G30数据中耕地被漏分(耕地被划分为草地),而在东部的林地集中分布区耕地误增(草地被划分为耕地)现象较多,相比于CC数据,G30数据中草地高估25.6%;LU数据与CC数据的比较中,北安县存在少量的耕地漏分现象,低估约13.4%。克东县G30数据的草地比例也被高估,高估比例约为30.0%。从北安市和克东县2县(市)的草地和耕地的总体误判情况来看,LU漏分现象超过G30,G30误增超过LU。
图3 CC-G30、CC-LU耕地与草地的分布及变异对比
3.3.3耕地与水域对比
分析龙江县、梅河口市水域和耕地的混淆情况,得到耕地和水体之间的误增和漏分结果,见表2和图4。在G30数据中,龙江县水域面积比CC数据水域面积低估73.8%,梅河口市低估51.3%。从分布情况看,耕地和水域的混淆主要集中在河道和水库周边,呈条带状分布。LU数据中,龙江县水域面积比CC数据水域面积高估51.3%,梅河口市水域面积低估31.3%。在水域与耕地的误判分析中,LU数据的误增情况超过G30,而G30数据的漏分情况超过LU。
图4 CC-G30、CC-LU耕地与水域的分布及变异对比
4结论
本研究利用较高空间分辨率的遥感解译数据(CC)和两种较低空间分辨率的地表覆盖数据(G30、LU)进行了基于地类的叠加对比,对比结果表明:在地类的总体分类精度上,G30数据优于LU数据;在耕地一类的用户精度评价中,LU数据的表现优于G30数据。在耕地的漏分和误增的分析和对比中发现:在耕地连续均匀分布的区域,G30和LU两种数据都对耕地具有较高的分类精度,耕地面积估算比较准确;在林地和耕地混合分布的区域,两种数据都高估了耕地的面积;在耕地和草地、水域混合分布的区域,两种数据中耕地面积往往被低估。
鉴于G30数据对耕地一类的验证精度较高,其他地类的精度较低的特点,在东北地区以耕地为主且集中分布的地域进行耕地面积调查时可以使用G30数据,或者使用如G30数据研制单位采用的自动分类方法进行耕地的提取;在耕地、林地混杂分布地区,LU数据比G30数据的耕地分类精度更高,其耕地面积比G30更为可靠,在此类地区采用类似LU数据的人工参与分类的方法能提高分类的精度。
[参考文献]
[1] 刘纪远,邓祥征.LUCC时空过程研究的方法进展[J].科学通报,2009,54(21):3251-3258.
[2] 刘纪远,庄大方,张增祥,等.中国土地利用时空数据平台建设及其支持下的相关研究[J].地球信息科学,2002,4(3):3-7.
[3] Russell G Congalton,Kass Green.Assessing the Accuracy of Remotely Sensed Data:Principles and Practices[M]. 2nd ed.Boca Raton:CRC Press,Taylor & Francis Group,2009,11(4):448-449.
[4] Rosenfield G H,Fitzpatrick-Lins K,Ling H S,et al. Sampling for thematic map accuracy testing[J].Photogrammetric Engineering & Remote Sensing,1982,48(1):131-137.
[5] Pontius R,Millones M.Death to Kappa:birth of quantity disagreement and allocation disagreement for accuracy assessment[J].International Journal of Remote Sensing,2011,32(15):4407-4429.
(责任编辑李杨杨)
[中图分类号]S157;TP79
[文献标识码]A
[文章编号]1000-0941(2016)07-0061-05
[基金项目]水利部公益性行业科研专项经费项目(201501012)
[作者简介]高燕(1972—),女,山东诸城市人,高级工程师,硕士,主要从事水土保持监测、规划和科研方面的工作。
[收稿日期]2016-04-01
[关键词]Globalland30-2010;LUCC-2010;高分辨率数据;耕地分布;漏分;误增;东北黑土区