基于时空化的基础地理实体建库研究
2020-07-03刘勇
摘 要 基础地理实体是时空数据库的重要内容之一,也是时空信息云平台进行数据分析和挖掘的基础。本文探索了时空化基础地理实体数据设计和生产的流程,从时空数据集级和时空数据对象级两个方面来设计基础实体的时空化数据结构,并从数据分析、预处理、实体分层、整合编辑、规范化处理、质量检查几个环节来描述时空化实体数据的生产过程,对市县级开展时空信息云平台建库工作的实施具有现实的参考价值。
关键词 时空信息云平台;时空化;实体数据;数据整合编辑
引言
随着地理空间框架和时空信息云平台项目的开展,实体数据被广泛应用于地理空间数据建模。其中,基础地理实体在时空数据库中起到基础性、规范性的作用,也是与社会经济、自然资源等专题实体进行关联的基础,基础地理的规范性、完整性和准确性也是时空数据库建库的关键内容。本文探讨基础地理实体数据的时空化设计以及生产建库的基本流程,以规范化、流程化的生产来确保数据的质量,也为后期专题实体的挂接和时空信息平台数据分析和挖掘提供基础。
1基础地理实体时空化表达
地理实体主要由空间特征、时态特征和属性特征所构成,其特征主要有两种表现形式:一是呈现把不同的空间维度;二是相同的空间连续性呈现不同形态[1]。因此,时空数据库在框架数据库的基础上,是由标示实体的外观形态的几何形态信息,标示实体各种语义特征的属性描述信息[2]。本文基础地理实体建库研究,主要是从数据集和数据对象两个维度,增加时间描述字段,空间数据存储数据生产时间、入库时间、更新时间,对应数据元数据的有效期开始时间和有效期结束时间,记录每个数据对象的生命周期。
时空数据集级。历史记录存储方式以有效期开始时间和有效期结束时间记录数据集在时间轴上的更新变化情况,更新过程以版本号记录,数据类别区分数据集状态,是历史还是现状,每一个历史版本都关联现状数据集的唯一标识码数据集ID,形成数据集从现状到历史的回溯。
时空数据对象级。历史记录存储以有效期开始时间和有效期结束时间记录对象在时间轴上的更新变化情况,对象的每一次更新记录一个版本号,以对象编码作为唯一标识,通过当前状态判断该对象是否有效,当前使用的对象有效结束时间为最大值,当有效结束时间停止,则该对象消亡,生成新的对象,重新编码,保证编码唯一。记录数据的来源、采集、入库预更新时间进行时空化处理。
2基础地理实体建库方法
地理实体数据是对基础地理信息数据进行内容提取与分层细化、模型对象重构、统计分析等处理而形成的[3]。基础地理实体的建库主要从数据分析、数据预处理、实体提取分层、整合编辑、规范化处理以及质量检查来构建生产流程(见图1时空化基础地理实体建库流程图)。
2.1 数据分析
数据分析是在收集的数据基础上,对数据进行定性与定量分析,确定基础数据和参考数据,即通过分析理清获取的不同来源原始数据的数学基础、时效性、比例尺、数据范围、数据内容、数据分层、图层结构、属性结构、要素对象及属性信息等。形成数据融合与处理初步计划,包括图层融合主要依据图层、参考图层、字段融合原则,数据来源记录方式等。
2.2 数据预处理
根据数据分析结果和确定的数学基础、要素内容、字段结构和属性内容、数据来源等,对原始数据进行初步的预处理加工,形成细化的数据加工方案。
(1)统一数据格式与数学基础
不同格式的数据应通过格式转换使得数据统一格式,不同数学基础的数据应进行坐标转换处理统一数学基础。
(2)图层与属性的整合编辑
对于不同来源的实体数据进行图层层面整合编辑,使得整合编辑后的数据在现势性、准确性、完整性等方面達到最优,实体数据可直接使用的空间位置、图形内容、字段结构和属性内容直接从原数据转换提取。基础地理信息数据的空间位置与图形信息比较准确丰富,实体数据的空间位置与图形信息就可通过基础地理信息成果数据直接提取利用。
(3)规范化处理入库
根据实体数据命名规范、分层规范、字段结构规范、属性内容要求进行规整处理,在整合编辑处理之后数据在属性结构与内容上都有重复或是不规范的填写,此时应按照相应规范进行处理,相关的操作有字段的重命名、别名汉化、字段类型修改、属性更新等,之后进行质量检查,对于不合格的数据重新处理,直至数据质检合格后再进行数据入库。
2.3 实体提取分层
基于基础地理信息数据提取实体数据的原则是结合现实世界可抽象可表达的地物要素选取,剔除制图辅助要素和属性信息。分层原则同理基础地理信息数据分层分类,依据《基础地理信息要素数据字典 第1部分:1:500 1:1000 1:2000基础地理信息要素数据字典》(GB/T 20258.1-2007)与《基础地理信息要素分类与代码》(GB/T 13923-2006),基于融合后的基础地理信息成果数据提取水系、道路、建筑物、行政区划、绿地数据。
2.4 数据整合编辑
实体数据的整合编辑即形成空间位置准确、图层结构规范、属性信息完整、实体关系准确的基础实体过程。基础实体数据整合编辑主要是对不同来源的基础数据进行融合处理,具体基础实体整合编辑规则及说明可在实体数据生产过程中结合数据资料据和建库工具进行不断完善和补充,使其与数据生产过程相一致,提高数据成果的准确性和生产效率。
在实体整合编辑的过程中,具体系列规则和说明主要是:确定基础地形图要素空间位置为主要提取依据;基于影像和国情监测数据对基础实体进行补充,对于不完整的建筑、道路、水系、绿地等图形要素,可通过影像和地理国情要素补充完整,同时在属性字段中标明补充修改的图形的数据来源;结合道路面/线图层生成道路中心线图层。
2.5 规范化处理
在规范化处理方面,主要是依据标准进行属性的填写,关键是图元标识唯一码的确定。基础地理实体与其构成图元通过图元标识码建立关联,其逻辑结构变现为图元表、实体图元关系表及两者之间的关系[4]。
2.6 质量检查
对实体化处理后的实体成果数据的质量进行检查,检查内容同矢量成果数据大体一致,主要检查项为:数学基础是否符合要求;数据是否完整,包括图形与属性的完整,属性信息完整性按照各类实体属性表结构中规定的内容进行检查,尤其是必填字段的完整性,例如实体对象唯一标识码UUID。属性表的字段名、长度正确性与属性内容是否填写规范;数据逻辑是否一致;数据拓扑是否正确,各图层是否有不合理压盖;数据接边是否正确等内容。
2.7 实体数据库
处理后的数据,即可进行入库,依托GIS桌面软件及空间数据库引擎,将空间数据存储于数据库管理系统中。
3结束语
基础地理实体是时空信息云平台建设的关键内容,对基础地理实体数据的时空化设计和规范化、流程化的生产,是实体数据完整性、准确性以及高质量的保障。其关键是实体时空化的数据库设计,对数据进行唯一编码和时间、空间的属性字段设计。在生产环节中应注重对数据的分析和分类,提取相应的要素并进行规范化处理、编码、挂接,确保地理实体的唯一性、准确性和要素之间的关联性。
参考文献
[1] 季晓林.地理实体的多态特征研究[J].测绘通报,2014(3):310-314.
[2] 周成虎,裴韬.地理信息系统空间分析原理[M].北京:科学出版社,2011:1-3.
[3] 王磊,李长辉,邢汉发.地理实体化数据处理关键技术研究[J].测绘通报,2012(增刊): 550-552.
[4] 蒋捷,黄蔚,卢卫华,等.地理信息公共服务平台地理实体数据建模研究[J].城市空间信息共享,2009(4):11-18.
作者简介
刘勇(1983-),男,广西柳州人;学历:硕士研究生,职称:工程师;现就职单位:柳州市地理信息中心,研究方向:地理信息与智慧城市。