APP下载

云存储环境下的测绘成果资料管理系统设计与实现

2021-12-06潘磊郭晓虎薛峥章亮

科技信息·学术版 2021年29期
关键词:检索节点测绘

潘磊 郭晓虎 薛峥 章亮

摘要:在测绘生产中,由于成果数据的不断积累,数据量已经由过去的TB级发展至PB级,使得测绘成果数据面临着更高的管理要求,因此在云存储环境下搭建一套测绘资料在线管理系统,充分利用云存储的技术优势确保数据存储的安全性、高可扩展性和高可靠性,实现测绘成果资料在线化管理,提升测绘资料管理的质量和效率,是当前测绘生产发展的必然趋势。本文介绍了云存储环境下的测绘资料在线管理系统的框架设计和主要功能,通过高效的文件快速查询检索,满足测绘成果资料在线管理需求。

关键词:云存储 测绘成果资料管理

1、引言

随着测绘事业的不断发展,测绘地理信息成果资料的数据量呈逐年快速增长趋势,测绘成果资料大多以光盘、磁带、硬盘为主要存储载体进行备份,导致存放数据的硬盘不断增多,其中有些硬盘存储量达到数百万个小文件,传统方式管理起来日渐乏力,过去的成果资料管理很大程度依靠人工,采用文档方式记录,查询检索效率低,很难快速找到对应的资料数据,给日常管理与数据检索传输造成很大困扰,不利于测绘成果资料的管理,这也是目前测绘资料管理普遍存在的问题。[1]

云存储(Cloud Storage)是在云计算(Cloud Computing)基础上延伸和发展而来,通过集群应用、网格技术或分布式文件系统等技术,将服务器后端存储资源虚拟化,将数据分布式存储在众多的服务器主机上,通过网络共享方式提供给用户使用。和传统存储相比,云存储具有高性价比、高可靠性、高可扩展性的特点,同时支持高并发、高带宽、自动均衡负载。相同数据在不同存储节点存有两个或多个副本,任意节点发生故障,系统将自动复制数据块到新的存储节点,具有高可靠性,可大规模横向扩展,足以满足地理信息数据与日俱增的数据存储需求。

本文主要探讨云存储环境下,设计开发一套测绘资料管理系统,模拟日常测绘成果资料管理流程,将每个磁盘存储信息与云存储空间一一对应,将测绘成果数据上传到云存储的同时,建立相关元数据库,实现海量数据快速实时检索。

2、系统框架设计

测绘成果资料管理系统符合OAIS开放档案系统(Open Archival Information System)标准[2],采用B/S架构实现服务的交互,系统基于底层云存储服务,搭建文件检索和事务管理数据库,通过系统平台以WEB页面形式将信息提供给用户,系统包括资料预处理模块、管理模块、存储管理模块、数据库管理模块、文件检索模块等功能模块。

2.1资料预处理模块

首先对生产部门提交的测绘成果资料,以硬盘为单位进行硬盘登记和硬盘健康状况检验,对不满足健康状况的硬盘,及时进行硬盘数据备份。提取硬盘中相关元数据入数据库,调用数据上传功能将测绘资料数据上传到底層云存储中。

2.2管理模块

管理模块包括任务功能调度、平台及存储运行状态监测、系统日志记录以及用户权限管理等功能。任务功能调度具有分布式功能调用、动态均衡、存储资源监控等功能。存储资源监控包括获取集群状态、存储使用率、性能等信息。用户权限管理将不同类型的用户分配对应的权限。

2.3存储管理模块

存储管理模块包括云存储空间管理和文件共享服务等功能。云存储空间管理功能可动态分配和回收存储空间,并实时查看云存储剩余空间。文件共享服务功能采用SMB协议(全称是Server Message Block)搭建基于linux系统的文件共享服务,建立linux服务器的数据与客户端之间的数据共享。文件共享服务将云存储数据以硬盘挂载的形式提供服务,挂载后和操作本地磁盘没有区别,数据的访问无需进行下载,可在线实时操作。当使用部门申请数据获准后,可以从云存储内部将数据直接传输进该部门空间。底层云存储系统的文件存储由众多X86架构的存储节点组成,利用存储软件将网络中的存储节点资源进行整合组织,并提供一套维护管理云存储空间的标准接口,通过接口调用动态分配云存储资源、存储资源回收以及状态监控等功能。

2.4数据库管理模块

数据库管理模块建立起系统平台与数据库之间的关联,管理包括元数据库,事务管理数据库。元数据存储在ElasticSearch文件检索数据库中,事务管理数据存储在关系型数据库MySQL中,支持分布式部署,存储资料管理系统中的业务数据。

2.5文件检索功能模块

文件检索功能模块采用ElasticSearch搭建文件检索功能,支持分布式部署的全文搜索引擎。无论是基于时间检索还是基于空间检索,ElasticSearch在大数据查询方面都表现出比基于数据库查询更高的检索效率[3],文件检索供用户按照文件和文件目录检索,对数据查询时,可根据文件名、文件后缀、时间段进行文件检索,对于检索到的文件可手动选择加载对应云存储空间到本地工作站访问。

3、存储管理技术介绍

底层云存储采用分布式架构,可大规模横向扩展,系统由众多冗余组件组成,不存在单点故障,且支持对象存储、块存储、文件系统三种存储方式。

3.1系统组成

3.1.1管理监控模块

该模块负责整个存储集群的配置管理以及状态监控,当系统出现异常时,通过指定方式及时告警。通过基于web的访问方式进行管理和维护操作,支持智能化管理和配置。

3.1.2 元数据服务模块

该模块用来管理和维护文件系统中文件的元数据信息。当客户端使用文件系统访问存储时,首先与元数据服务进程通信,获得被访问文件的元数据信息,根据元数据信息来访问数据。

3.1.3存储服务模块

该模块负责数据存储,处理从客户端发过来的数据请求。同时每个存储服务进程会与其相关的存储服务进程相关联,保持关联磁盘之间的一致性,当发现相关磁盘异常时,存储服务进程会将其汇报给管理节点,管理节点随后做出应对,保证系统的正常运行及数据的恢复等。

3.1.4对象存储网关

通过该模块,云存储系统可以对外提供支持RESTful的对象存储访问方式,目前兼容亚马逊S3和Swift等传统对象存储接口。该模块支持集群化部署,以提供高并发访问服务能力。

3.1.5客户端模块

为满足不同的应用需求,系统提供丰富的存储访问接口,支持通过iSCSI客户端程序将云存储映射成本地磁盘使用,也提供私有的文件系统客户端访问方式,同时支持私有接口访问。

3.2 关键技术

3.2.1 数据分布算法

为满足系统高可扩展性和高并发性的设计要求,该云存储系统采用无中心节点架构设计,通过分布式Hash算法计算的方式来寻址。保证了数据的均匀分布,系统发生变更时尽可能少的数据在设备之间的迁移,以及快速定位数据。

3.2.2 分层缓存技术

为提高存储系统的读写性能,存储系统在系统层面采用cache策略和分级存储策略,将SSD磁盘配置成SATA磁盘cache层,cache模块负责在cache层和存储层之间进行数据自动迁移,对于客户端而言,数据的存储和访问完全是透明的。

3.2.3 高速并发访问技术

采用无中心节点架构设计,避免了由于中心节点服务能力的限制造成系统并发能力的降低;客户端与存储节点之间通信,不经过任何代理节点或转发节点,系统的整体吞吐率和并发能力会随着存储节点的数量的增加而线性扩展;存储系统的容错由存储节点之间自动进行,可以在高并发情况下,提高客户端的带宽利用率。

3.2.4其他技术

为了帮助用户更好的保护数据,云存储系统还支持快照、克隆、远程复制等功能。

4、文件检索模块设计

4.1 文件检索数据库

测绘成果资料数据量巨大,要从海量数据中检索出某一文件,这对检索模块的设计提出了较高要求。本管理系统采用ElasticSearch搭建文件检索模块,它的倒排索引技术实现比关系型数据库更快的过滤,能支持上百亿条、PB级数据的搜索。

4.2 ElasticSearch集群

为保证E lasticSearch的高可用性,在本管理系统中,使用三台主机构建了一个ElasticSearch集群。Elasticsearch采用分片技术,将索引存储时分成两个分片,每个分片又有两个副本分片,数据保存在分片内,分片被分配到集群内的各个节点里。当集群规模扩大或者缩小时,Elasticsearch会自动的在各节点中迁移分片,使得数据均匀分布在集群里。集群结构如图3所示,P开头的代表Primary分片,即主分片,R开头的代表Replica分片,即副本分片。

根据节点的职责不同,划分为主节点、数据节点、负载均衡节点。主节点即Master节点,其管理控制整套集群,如创建索引、删除索引、资源分配、节点修改等;数据节点,对文档进行增删改查操作等;负载均衡节点,负责处理路由请求、搜索、分发索引操作等。

5、总结

在云存储环境下,搭建一套测绘成果资料管理系统,实现测绘成果资料管理的在线化、服务网絡化,整合更多依赖分布式存储和数据库的资源,提高测绘成果资料文件检索和数据共享效率,进一步提升测绘成果资料管理的质量和能力。

参考文献:

[1]黄递全,向娟,吴蕾.测绘成果资料目录管理系统设计与实现[J].地理空间信息,2017,15( 10) :112-114.

[2]秦高雅.测绘资料档案一站式管理平台设计与实现[D].北京:北京建筑大学,2019.

[3]李峰,宋宴,魏广泽,王永安.基于 ElasticSearch 的海量遥感数据检索技术研究 [J].计算机与网络,2021,47(05):57-61.

猜你喜欢

检索节点测绘
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
基于移动汇聚节点和分簇的改进节能路由算法
城市地籍测绘与不动产测绘中的问题探讨
瑞典专利数据库的检索技巧
CAE软件操作小百科(48)
基于点权的混合K-shell关键节点识别方法
浅析影响地质测绘质量的因素及提高措施
英国知识产权局商标数据库信息检索
我国房地产测绘发展现状的浅谈