全球地理信息数据建设优先区分析
2020-08-03林尚纬张宏伟陈利军欧阳斯达张俊辉
林尚纬,张宏伟,杜 晓,陈利军,彭 舒,欧阳斯达,张俊辉,郑 义,周 琦
(1.国家基础地理信息中心,北京 100830;2.自然资源部国土卫星遥感应用中心,北京 100048)
我国以往建设完成的测绘地理信息数据成果范围主要集中在国内,其为国民经济、社会发展及为国家各个部门、专业机构和普通用户提供了便捷丰富的基础地理信息。但伴随着我国实施“一带一路”倡议、提出“人类命运共同体”这一全球价值观以来,国家不断加强对全球地理信息资源数据获取、地理信息综合服务等方面的重视。同时,伴随着我国自主研发的资源三号、高分系列等高分辨率遥感卫星的不断发射,广大地理信息用户对全球基础地理信息的使用提出了许多更新、更高的要求[1-5],国民经济建设、社会发展、国家安全和国防等方面都迫切需要我国拥有自主的覆盖全球范围的多类型基础地理信息数据[6-7]。
建设覆盖全球范围的地理信息资源数据是一项耗时耗力的重大工程,不仅需要全球覆盖齐全的影像数据资源,还需要对影响建设各类地理信息数据资源的限制因素进行充分分析,掌握了解建设各类地理信息数据资源的优先顺序。因此,本文以全球1∶25万分幅格网为评价单元,并选取多种影响地理信息数据资源建设的限制因素,采用因素组合法、层次分析法[8](analytic hierarchy process,AHP)、多因素综合指数法等,对测绘生产领域常用的5类地理信息数据产品——数字正射影像(DOM)、数字表面模型(DSM)、数字高程模型(DEM)、核心矢量要素(DLG)、地表覆盖(LC)的建设优先顺序进行分析研究,以期能为面向全球范围的测绘地理信息相关项目的任务划分、经费定额和编制、工程实施和数据生产等提供借鉴和参考依据。
1 研究区与数据
1.1 研究区选择
本文的研究区覆盖南北纬90°以内的全球233个国家和地区,陆地总面积约1.49亿km2。以格网为评价单元,具有打破行政单元约束、易于空间定位、提高信息检索与更新效率、相对更加准确、指标获取和衡量相对容易等优点[9],同时考虑研究区为全球覆盖,为便于直观显示和分析对比,本文选取全球1∶25万分幅格网为评价单元,其中南极圈附近大陆表面无任何明显地表覆盖类别,因此本文将南极圈附近共计4466个格网单元不参与分析结果评价,最终将全球划分为17 536个格网评价单元。
1.2 数据来源
本文的数据源主要包括:覆盖地球南北纬84°以内的我国首颗民用高分辨率光学传输型立体测图卫星——ZY3(资源三号测绘卫星)影像数据,全球1∶25万分幅地表覆盖数据,SRTM(shuttle radar topography mission)、ALOS(advanced land observing satellite)等开源高程数据,以及ISCCP(international satellite cloud climatology project)国际卫星云气候学计划年平均云量图、《资源三号卫星全球数据获取分区规划》等参考资料。
2 研究思路
2.1 研究思路
本文在充分研究5类地理信息数据的生产技术流程和数据特点,综合考虑影响各类数据的自然、地理、人为及数据获取难度的基础上,结合已开展项目的实际生产经验,对限制数据生产的其他客观因素进行了不同程度的定性、定量分析。首先选取并计算全球范围内每个格网评价单元内的耕地比例、林地比例、人造地比例和水体比例4个基础因子。其次选取分析卫星影像获取难度、地形类别、云覆盖百分比、景观破碎度4个限制因素。然后根据各类地理信息数据自身的产品特色,通过因素组合的方法,选取适宜其自身的评价指标,构建地理信息数据建设难度评价体系,利用定性和定量相结合的AHP法对各指标因子赋权重。最后利用多因素综合指数法计算各类数据建设难度综合得分,并在参考《测绘生产成本费用定额》(财建[2009]17号)中“测绘生产困难类别细则”的基础上,采用自然间断点法对各类数据建设难度得分进行等级划分,按照由易到难的次序将DOM、DSM、DEM、DLG、LC 5类数据建设优先区分别划分为优先建设区、适宜建设区和困难建设区[10]。技术流程如图1所示。
图1 技术流程
2.2 构建评价体系
地理信息数据建设难度评价体系(见表1)是在充分咨询相关领域专家、生产技术人员及整理总结各产品的生产技术流程和数据特点的前提下,通过选取与之密切相关的自然禀赋因子或限制因素构建对应的评价体系。DSM主要选取卫星影像获取难度、水体比例、地形地貌3个指标;DEM主要选取林地比例、人造地比例、水体比例3个指标;DOM主要选取地形地貌、云覆盖、卫星影像获取难度3个指标;DLG主要选取耕地比例、人造地比例、水体比例3个指标;LC主要选取景观破碎度这一指标。并通过AHP法对所有评价指标构造判断矩阵,进而求得相应的指标权重。
表1 地理信息数据建设难度评价指标及权重
2.3 数据预处理
本文数据统一采用GCS_WGS_1984坐标系,为使选取的所有评价因素能够以格网为单元进行计算,需要对其进行逐一的数据预处理工作。其中耕地比例G、林地比例F、人造地比例M、水体比例W共4个限制因素,分别通过计算每个格网单元内对应地表覆盖类别所占格网单元面积的多少求得,公式为
Pij=wij/Sii=1,2,…,n
(1)
式中,Pij为第i个格网评价单元第j类地表覆盖类别所占比例;wij为第i个格网评价单元中第j类地表覆盖类别的面积;Si为第i个格网评价单元的面积;j为地表覆盖类别,本文中共包括耕地、林地、人造地、水体4类;n为格网评价单元的个数。
2.3.1 卫星影像获取难度
卫星影像的有无直接或间接影响了数据产品建设的效率和质量精度,无法获取卫星影像的漏洞区将会为后续的产品补漏工作带来极大的工作量。本文根据卫星中心提供的ZY-3影像,获取难易度等级和影像获取难度分布对应关系(如图2、表2所示),通过ArcGIS中的关联计算等工具,分别对每一格网评价单元所对应的难度等级逐一赋值,以此为后续难度计算提供测算依据。
表2 资源三号卫星影像获取难易度
图2 ZY3卫星影像获取难度等级
2.3.2 地形类别
地形是指地表各种各样的形态,具体指地表以上分布的固定物体所共同呈现出的高低起伏的各种状态,地形类别的差异与本文研究对象DSM和DEM的建设难度息息相关。通常情况下平地和丘陵地的DSM和DEM建设难度较低,精度要求也更高,山地和高山地因其坡度陡峭、高差较大,对DSM和DEM的建设难度要求也较高,精度要求也相对放宽[11-13]。本文参考SRTM、ALOS等数据,并与相关数据产品的生产技术规程、专业技术设计书等紧密结合,将全球地形类别根据表3划分为平地、丘陵地、山地、高山地4种。
表3 地形类别对照
2.3.3 云覆盖比
此限制因素主要指卫星影像含云量的多少,云量达到一定比例势必会影响后续的产品生产难度和进度,生产过程中一般认定含云量超过20%的图幅影像即被视为不可用影像数据。本文参考ISCCP的全球年平均云量图等资料,将全球陆地范围年平均含云量按照云量由低到高的顺序,得到1∶25万分幅格网含云量比例分布图,如图3所示,以此反映全球陆地范围内卫星影像云量覆盖比例。
图3 ISCCP全球年平均云量
2.3.4 景观复杂度
随着深度学习等技术的不断发展,基于遥感影像的不同地类地物的自动提取已成为可能,且其分类精度不断提升,正逐步应用于重大工程项目的生产过程当中,地表覆盖数据要求对地理信息要素进行精准划分,往往类别越多的地区其生产难度相应也越高。因此本文通过统计每一格网单元内包含10类地表覆盖类别(耕地、林地、草地、灌木、湿地、水体、苔原、人造地、裸地、冰川)[14-16]的多少作为景观复杂度这一限制因素的计算依据,以此反映本文研究中地表覆盖数据的建设难度。
3 结果与分析
为对影响各类地理信息数据建设难度的不同因子进行综合评价计算,需要对各地表覆盖类别及限制因素进行统一的规范化处理,使其具有可比的量纲和数量级。本文结合专家先验知识,采用百分制打分的方法,并按照“由易到难”赋分的原则对各评价因素进行打分。具体见表4。
表4 评价因素分值
3.1 建设难度得分
按照表1中构建的评价体系及对应指标权重,采用多因素综合指数法计算每个格网评价单元内5类地理信息数据的建设难度分值。计算公式为
(2)
式中,Ri为第i个格网评价单元的每一类生产难度分值;bij为第i个格网单元第j项限制因素分值;wj为第j项限制因素对应的权重;m为对应数据的限制因素个数;n为格网评价单元的个数。
3.2 优先区划分结果
在得到建设难度得分的基础上,通过自然间断点分级法将各类地理信息数据建设优先区划分为优先建设区、适宜建设区和困难建设区3类,具体如图4所示。
图4 建设优先区划分结果
由图4可知,DOM优先建设区主要分布在欧洲、非洲北部、南美洲及澳大利亚等地,困难建设区主要分布在北美洲西海岸、格陵兰岛大部、加勒比海和南美洲西北部、非洲东南部、中国中西部、俄罗斯中部和东部地区;DSM困难建设区分布较为集中,主要位于加拿大东部及亚洲北部地区;DEM困难建设区主要分布在俄罗斯中部及欧洲东北部、中国东南部及东南亚少数地区、非洲中部和南美洲北部、加拿大和美国东部部分地区;DLG建设困难区主要分布在人口密度稠密区,此类地区经济发达、基础设施完善、道路交通及水系发达,主要以中国东部、印度、欧洲美国东部和南美洲东南地区为主;地表覆盖数据建设困难区主要分布在亚洲中部、欧洲西部及北美洲等地,该地区地表覆盖类别个数均大于6类,将显著增加数据建设过程中的自动提取技术要求和人工判读工作量。
4 结 语
本文以分幅格网为单元对全球范围内的地表覆盖类别、地形类别、云覆盖情况、影像获取难度等限制因素进行了全方位的科学合理分析,并通过采用定性、定量相结合的评价方法,从影响每一类地理信息数据的自然要素和限制因素两方面考虑,针对特定数据选取了适合其建设难度评价的不同因素。进而构建了各自的评价体系,在评价过程中充分借鉴了已往生产建设经验,评价结果能为相关地理信息数据资源的建设难度测算提供一定的对比和借鉴经验,同时本文提出的基于分幅格网的建设难度评价体系,还为相关项目生产任务的科学合理划分、预算编制等提供了参考。