APP下载

分布式空间数据存储对象分析

2019-10-17李宝双

无线互联科技 2019年13期
关键词:空间数据

李宝双

摘   要:文章针对目前各行业的大量数据存在的地域化以及日漸凸显的数据快速增长的特点,重点提出了分布式空间数据的储存对象概念,同时,介绍了基于分布式空间数据储存对象的一种高性能、可伸缩性的信息共享管理体制,为分布式数据储存工作提供出了全新的工作形式。

关键词:空间数据;分布式存储;基于对象的存储

大数据时代,数据的存储已经在各行各业中得到了广泛的应用,特别是地球空间信息技术,针对一些层次更高的分辨率传感器技术,在发展过程当中使地理信息系统所受到的影响和挑战不断加剧。地理信息系统(Geographic Information System,GIS)是获取、处理、管理和分析地理空间数据的重要工具,在GIS系统的运用过程当中会出现数据的大量上涨以及对数据的合理应用等相关问题,通过空间数据储存的标准和需求,现阶段,空间数据的储存量从吉字节(Gigabyte,GB)级别上升到了太字节(Terabyte,TB)级别,甚至达到了拍字节(Petabyte,PB)级别。在储存大量空间数据过程当中,已经无法延续传统形式,即向GIS的集中储存模式,在数据的储存空间上有着明显的限制,通过海量数据地域分布,保证整个数据空间的运用更加合理,在一些网络信息环境下的信息分布和分层储存更加适用。

1    分布式空间数据存储对象

现有的数据储存模式基本都是在数据结构层面上操作,分析数据构成类型的不同,没有考虑数据在储存过程当中的数量特性以及数据使用性能方面的需求。常见的空间数据拓扑关系如图1所示。

图1  空间数据的拓扑关系

在数据空间分布形式上,相关工作人员只单纯分析了数据,收集工作中存在的地域性差别,需要人为将空间数据依照相关的排列规则进行分层和分级,然后进行数据划分储存。在此过程当中并没有充分考虑到整个网络和计算内部的工作特性,因此,也无法充分满足整个GIS分布系统的实际功能需求。对很多不同的观测数据来讲,比如,在卫星遥感数据和监测数据系统当中,数据必须要具备在线分布和储存的工作能力。如何有效运用信息资源,不能完全依靠人为工作的预先规划,所以,需要将整个空间数据的储存工作由被动式的服务模式转化成为主动分布工作模式,以一种自适应的工作服务状态,在整个空间数据储存过程当中解决数据大量上涨的问题[1]。

2    海量空间数据分布式存储机制

以分布式空间数据作为储存对象建立起空间数据系统结构,在大量的数据空间当中依照数据本身所具有的不同特性,在数据的使用需求、储存特性以及一系列的用户定义空间当中,对数据的储存对象进行科学地划分,在分布式储存器当中安装了对象存储装置(Object Storage Device,OSD)处理器、内存以及网络接口,在整个系统的构成类型上,通过分布式储存结构作为主要的核心点,在工作过程当中具有信息本地处理功能,用于数据的缓存和数据快速处理,实现了信息传输过程中的网络衔接。在空间数据储存对象当中,分布式结构可以储存在多个OSD系统当中,多个空间数据对象也可以使用同一个OSD模型结构,OSD当中所包含的设备类型分为数据信息单元,以一种自主管理的模式在整个空间数据结构中进行分布和处理。比如,信息处理速率和对象处理长度等方面都需要加以考虑,在OSD系统内部承担了系统储存器中的数据维护工作和单元数据管理工作,有效消除了系统服务器内部存在的瓶颈问题。以GIS服务器通过系统分布式空间储存对象,为客户端提供出准确有效的OSD空间逻辑信息,同时,依照客户在操作过程当中的组织管理需求,对数据储存管理对象进行识别。GIS服务器另外一个作用是通过用户授权工作管理,OSD授权信息提供相应的安全工作验证,在信息完成验证工作之后,数据方面不通过服务器结构直接进行转发,在客户端和储存器内部实现了第三方通信信息的连接。

3    分布式空间数据存储基本实现方法

利用数据共享,设备共享,通信灵活地实现分布式空间数据的存储,基于多地点多设备的实现,如图2所示。

图2  分布式存储示意

4     分布式空间数据存储对象优势

基于分布式空间数据在系统的工作过程中,针对不同类型的储存对象,所设定的数据储存空间具有以下几个方面的优势。

4.1  高性能优势

基于分布式空间的诉讼储存过程当中,在数据对象的空间储存方面,数据的客户端和储存器之间,可以进行信息的高速传输,服务器当中的输入/输出(Input/Output,I/O)端口,存在的信息传输速率较慢问题得以有效的解决,同时,还可以有效防止信息传输过程当中产生的信息失真以及信息传输阻塞等不良问题。当储存系统内部需要对信息储存量和储存空间进行扩展过程中,对信息储存技术需要提供一个更加均衡的空间模型,这样才可以充分保证整个信息系统在处理信息的能力上得到同步提高,进而在信息的响应速度和信息的传输速率上得到明显的提高,保证整个系统可以更加适用GIS环境下多个用户共同发出信息请求,整个数据传输规模和传输效率具有更高效果。

4.2  异构共享、透明访问

在海量空间数据的分布储存过程当中,经常会面对多重异构的储存工作环境,通过这种储存环境可以充分实现空间数据储存资源的有效共享。首先,在系统储存工作当中,在操作平台上经常会产生矛盾问题,分布式空间数据储存对象可以将系统设备当中的数据模块从设备层当中进行分离,同时将储存系统内部的信息逻辑结构和储存层的映射关系之间进行对应,通过这种方式,很容易实现跨平台数据结构的组成。从用户角度上来进行分析,通过对空间数据储存对象的设定存在很明显的差别,用户在使用过程中不需要关心大量数据该如何进行划分和储存,只需要通过使用对象接口,实现对海量数据的透明化访问,这在很大程度上提高了数据访问工作人员的工作效率。

4.3  灵活高效的安全機制

在分布式的GIS用户的协同工作模式当中,经常会涉及一些针对空间数据的操作和储存部分,在整合空间数据的储存工作当中具有操作时间较长以及信息准确度不足等问题[2]。对此,在进行GIS空间数据的储存工作当中,相关工作人员需要针对不同的空间数据对象的一致性和信息的安全性加以有效的保障。在分布式空间的数据储存和管理工作当中,需要对其进行不同属性以及不同的访问方式来进行设定。相比于传统的基础文件或者是模块数据的管理工作来讲,在分布式的空间数据储存工作当中,在整个数据的储存安全性方面有着重要的保障,因此,这种数据处理方式更加有利于建立起GIS网络环境条件,实现了对多用户相互之间的灵活信息提取、储存以及应用等。

5    结语

在数字城市和数字社会的发展过程当中,需要在空间数据的储存功能上达到PB级以上的级别。随着当前信息化技术的发展速度不断加快,信息的收集量以及收集的详细程度都在不断深化。在海量空间的数据储存过程当中,不但需要充分满足数据储存量的标准要求,同时还需要充分满足GIS分布式数据工作服务的标准。

[参考文献]

[1]王晓龙.基于Spark的地理空间大数据查询处理技术研究[D].西安:西安电子科技大学,2017.

[2]涂振发.云计算环境下海量空间数据高效存储关键技术研究[D].武汉:武汉大学,2012.

Analysis on the storage object of the distributed spatial data

Li Baoshuang

(China No.8 Shipbuilding Heavy Industry, Yangzhou 225001, China)

Abstract:Aiming at the regionalization of a large number of data in various industries and the characteristics of the rapid growth of data, the paper puts forward the concept of storage object of distributed spatial data, and introduces a kind of high-performance data storage object based on the distributed spatial data. The scalable information-sharing management system provides a brand-new form of work for distributed data storage.

Key words:spatial data; distributed storage; object-based storage

猜你喜欢

空间数据
GI S空间数据处理技术在地图制图中的应用
GIS空间数据与地图制图融合技术
云GIS环境下分布式空间数据集成技术研究
元数据驱动的多中心空间数据同步方法研究
基于文件系统的分布式海量空间数据高效存储与组织研究
嵌入式环境下地理空间数据组织技术研究
客户端空间数据缓存策略
多源空间数据同名实体几何匹配方法研究
网格化存储的几项关键技术分析