自然资源和空间地理基础信息大数据更新机制构建研究
2019-05-16白易袁欣欣龙泽萍
白易 袁欣欣 龙泽萍
摘 要:针对大数据建设中的数据质量问题和现势性需求,分析了自然资源大数据、空间地理基础信息大数据的内涵,构建了自然资源和空间地理基础信息大数据更新架构。从“人本-逻辑-物理”的视角,以建立良性运行机制和发挥最佳效益为目标,研究了数据更新的责任机构,规定了数据更新的精度和周期,探讨了自然资源和空间地理基础信息大数据更新的流程。
关键词:自然资源 空间地理基础信息 大数 数据更新
中图分类号:P968文献标识码:A文章编号:1003-9082(2019)05-000-02
引言
“大数据”最早在上世纪80年代由Toffler,A在《第三次浪潮》一书中提出[1]。2012年奧巴马宣布启动“大数据发展和研究计划”(Big Data Research and Development Initiative),让全世界认识了大数据。2012年起,我国大数据研究进入了发轫期[2]。近年来我国正大力推动大数据的发展和应用。各类大数据的基本内涵和基础建设,都离不开自然资源和空间地理基础信息。国发(2015)50号《关于印发促进大数据发展行动纲要的通知》明确提出,发展大数据的主要任务之一是“统筹规划大数据基础设施建设”,即加快完善自然资源和空间地理基础信息库等三类基础信息资源[3]。然而,大数据建设中的问题也不容忽视:如何提高数据开放程度?怎样解决整体量庞大而有效数据量较少的矛盾?数据质量问题如何保障?从自然资源和空间地理基础信息大数据应用共享的实际需要出发,探讨数据更新问题,研究和建立行之有效的自然资源和空间地理基础信息大数据更新机制,具有较为重要的实际意义。
一、自然资源和空间地理基础信息大数据更新内涵的界定
自然资源和空间地理基础信息大数据属于我国三类基础信息资源之一。具备大数据Volume(大量)、Velocity(高速)、Variety(多样)的基本特征[4],其内容庞杂,因此首先需要根据我国自然资源和空间地理基础信息大数据的特点建立数据更新内涵,即确定需更新的自然资源和空间地理基础信息要素。
1.自然资源大数据
自然资源指在特定的区域地质、地理和人类活动综合环境条件下,自然形成的人类可以利用的物质及能量[5],通常分为土地、水、矿、气候和生物。这些数据具备人文特征,也具备空间地理性质。
在实际大数据开放共享与更新的需求中,自然资源大数据以与空间地理相关的数据为主,覆盖我国陆地部分、所属海域,部分数据覆盖范围为全球。数据格式:包括矢量数据格式、栅格格式、遥感影像、表格式属性数据、文本数据等,以适应不同需求环境下对数据格式的要求。
2.空间地理基础信息大数据
国家战略层面所称的空间地理基础信息,在行业通常地理空间基础信息或基础性地理空间信息。从应用共享的角度来看,基础性地理空间信息即各行业均需要的与地理空间息息相关的控制性、框架性数据。包括数字高程模型DEM、数字地形图DLG、数字正射影像DOM,基础地理数据库核心要素,不同时空分辨率、光谱分辨率的航天、航空对地观测信息和定位信息等数据格式:包括矢量数据格式、栅格格式、遥感影像等,以适应不同需求环境下对数据格式的要求。
3.更新架构的建立
根据以上界定的大数据内涵以及应用共享的角度,建立自然资源与空间地理基础信息大数据更新架构如下:
3.1大数据模块
3.1.1空间地理基础信息,能在同类产品中派生使用,有DEM、DLG、DOM,基础地理数据库核心要素,遥感影像等。
3.1.2自然资源。在本研究的基础大数据库中主要指自然资源中与空间数据息息相关的内容。包括土地利用基础信息,矿产资源基础信息,水资源基础信息,森林资源基础信息。
3.2辅助模块。主要用于连接基本模块,对基本模块起辅助作用,包括大数据更新应用需求的服务接口内标准,如网络地图服务WMS、网络要素服务WFS、网络覆盖服务WCS、定位服务LS、网络处理服务WPS、面向过程的客户端接口、面向对象的客户端接口等。
3.3附加模块。包括资源目录、元数据等附加于以上数据的模块。
二、更新机制的构建
1.研究视角
在机制建设过程中,层次结构和过程式结构是两种最常用的结构形式。针对自然资源和空间地理基础信息大数据更新这一特定研究对象,结合层次和过程式两种结构的优点,分别从“人本-逻辑-物理”的角度,对应着数据、技术和管理三个维度,三个维度彼此紧密联系,共同形成支撑自然资源和空间地理基础信息大数据更新的软环境。研究视角图示如下:
从研究对象的具体内涵着手,包含土地、水利、矿产等在内的自然资源数据,以及包含DLG、DOM、DEM等在内的空间地理基础数据,考虑其数据更新建设的逻辑一致性。由于各类大数据的管理独立性,如空间地理基础信息大数据、土地利用基础信息大数据,矿产资源基础信息大数据,水资源利用基础信息大数据更新的责任机构不尽相同,应由各类数据的业务部门进行更新。
2.更新精度与周期
空间地理基础信息大数据根据区域数据范围,包括1:100万、1:50万、1:10万1:50万、1:25万、1:10万、1:5万、1:5000、1:2000、1:500等不同比例尺。遥感影像包括低分辨率1千米-100米;中分辨率30米-10米;高分辨率≤10米。按照国家、行业标准和规定定期更新。数据更新频率为最慢1年,并根据实际需求如执法、救灾等可实时进行更新。
土地利用基础信息大数据包括土地利用、地籍管理等。矿产资源基础信息大数据包括矿产资源储量、地质灾害监测、地质环境监测、重要矿产地开发和分布等。水资源基础信息大数据包括全国水资源、灌溉面积、水质、水文、暴雨洪水观测、动态监测和重大水利设施、重大工程等。森林资源基础信息大数据包括森林资源综合统计、营林和生产、生态环境整合工程、森林资源连续清查、卫星林火监测、林业生态区域遥感监测基础和动态信息。这类数据既有空间属性信息,也有区域单元统计数据,因此数据更新在空间地理基础信息大数据的基础上,重要地区的数据精度更高,信息的更新周期为1年到每月,或根据实际情况确定。
3.更新流程
在界定了数据更新内涵、更新责任机构、更新周期和精度的基础上,建立数据更新流程,包括采集获取变化信息、数据质量检查、数据更新入库、数据发布几个方面,具体如下:
3.1采集获取变化信息
通过多种数据来源,如影像、基础地形图、各自然资源业务归口部门统计数据等,将最新的空间地理基础信息,土地利用基础信息,礦产资源基础信息,水资源基础信息,森林资源基础信息导入数据更新维护系统;使用便携式PDA进行外业数据采集,将最新的各类数据采集后导入数据更新维护系统。通过勾绘、拾取等获得这些数据的变化信息,对其进行提取,并与现势库中的现状数据进行叠加分析。
3.2数据质量检查
对提取出的现状数据和变化信息进行拓扑检查、几何检查、属性检查。包括检查数据中要素的坐标是否正确等;检查数据必填属性字段是否完整、正确等;根据数据几何信息、属性信息之间的逻辑关系,对数据的几何信息与属性信息进行检查,包括几何信息与属性信息是否对应、有几何信息无属性信息、有属性信息无几何信息等;检查数据结点是否匹配、多边形是否闭合等。
3.3数据更新入库
将检查合格后的数据导入生产库,使用版本发布工具进行版本控制、备份。
3.4数据发布
通过数据发布工具,生成*.mxd、*.shp、*.txt、*.dmp、*.mdb等格式的版本数据。分别根据密级规定进行保存,或者提供给专业用户和社会公众。
三、结论与展望
自然资源和空间地理基础信息大数据是我国重点建设的基础信息资源,该类数据空间属性显著。数据的现势性和长效更新能力代表了数据库和系统的“生命”,本研究从研究对象的具体内涵着手,包含土地、水利、矿产等在内的自然资源数据,以及包含DLG、DOM、DEM等在内的空间地理基础信息数据,考虑其开放共享建设的逻辑一致性、更新现势性等问题;从物理架构的视角,研究数据应用服务及其接口标准;以建立良性运行机制和发挥最佳效益为目标,提出更新内涵架构与更新流程,对更新工作具有一定指导意义。为实现大数据的良好开放与共享,接下来可在数据跨部门合作、高效运转的运行维护机制以及大数据安全与隐私保护中做进一步研究。
参考文献
[1]阿尔文·托夫勒.第三次浪潮[M].黄明坚译.北京:中信出版社,1980.
[2]党明辉,杜駿飞.中国大数据研究学术进展分析[J].中国网络传播研究,2013,7:248-264.
[3]国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2015-09-05].ttp://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm
[4]United Nations Global Pulse.Big Data for Development: Challenges & Opportunities [R/OL].[2012 - 05-10].http://www.unglobalpulse.org/projects/Bigdataofor development
[5]国家地理空间信息协调委员会办公室.自然资源和地理空间信息整合与共享研究[M].北京:科学技术出版社,2007.
作者简介:白易(1986.09-),女,汉族,贵州开阳人,贵州师范学院,副教授,管理学博士,研究方向:地理信息标准化,大数据。