新疆地学基础数据中心建设可行性研究
2022-03-23彭仲秋向诗强陈建明黄显义李永华张鹏
彭仲秋,向诗强,陈建明,黄显义,李永华,张鹏
(1.新疆维吾尔自治区地质矿产勘查开发局地球物理地球化学探矿大队,新疆 昌吉 831100;2.新疆维吾尔自治区地质矿产勘查开发局信息中心,新疆 乌鲁木齐 830000)
随着大数据、云计算、地理信息技术的飞速发展,信息技术在地学数据管理与服务领域得到广泛应用。中国地质调查局于2016 年启动“地质云”建设,开展数据资源整合集成,拟解决海量空间数据的分布式存储、处理、查询、互操作和虚拟化等问题。2017 年11 月“地质云1.0”正式上线运行,2018 年10月“地质云2.0”正式上线运行,实现了中国地调局“地质云”主数据中心与29 个中国地调局直属分中心的互联互通,建立健全“地质云”数据共享技术体系与运行机制,为地质行业信息系统整合与数据资源共享提供了平台。
1 地学数据特征分析
地学数据具专业性、多元异构性、时空性、海量性等特点[1]。①地学数据来源于地质调查、地球物理、地球化学、遥感、测绘等方面,涉及多个学科,具很强的专业性;②地学数据种类繁多、形式多样、内容丰富,涵盖了地学专业各个领域。如:空间数据、属性数据、成果文档等。形式包括文本、文档、图件(矢量、栅格)、表格、数据库、图片、音频、视频等结构化、半结构化和非结构化数据,这些数据具不同存储格式。如MapGIS(wt wl wp)、Shapefile(shp)、GeoJson、GeoTiff、grid、AutoCAD(dxf dwg)、gml、xml、txt、csv、mdb、xlsxlsx、tiff、jpeg、docdocx、pdf 等,具多元异构性;③地学数据描述对象是地球,空间属性为固有属性,脱离空间位置的地学数据无意义。任何观测数据均在某一时间点获取,地学数据具明显时空特性[1];④地学数据体量巨大。包括野外调查、勘探、遥感、文献数据等。随着时间推移及数据采集技术的发展,地学数据将呈爆发式海量增长[2]。
2 现状分析
2.1 以往工作程度
新疆地矿局具有较规范和全面的基础地理、遥感影像、基础地质、灾害地质、水文地质、工程地质、地球化学、地球物理、矿产地、探矿权、采矿权、工作程度、成矿区带、自然保护区、整装勘查区、潜力评价、地热资源等地学数据资源。通过2007—2013 年实施的矿产资源潜力评价项目,基本摸清了新疆矿产资源现状,为矿产资源保障能力和勘查部署提供了依据,形成海量地质信息成果。
2.2 存在问题
(1)数据资源分散,缺乏统一管理和共享机制,数据长期处于孤岛状态,利用率低[3]。
(2)数据间联系较弱,不同专业间数据尚未整合,不利于综合展示、分析和利用。
(3)纸质、光盘等存储数据资料,使用过程中常出现原件磨损、丢失、损毁等问题。
(4)电子数据资料多采用文件方式进行存储和管理,易出现数据冗余、版本多、混乱、泄密等问题。
(5)数据查询检索、统计分析效率低下。
3 建设目标
(1)整合与集成多元、海量地学数据,在数据间建立相互关联,消除信息孤岛,达到综合成果展示、综合统计分析、综合利用的目的。
(2)实现地学数据统一管理、维护、发布,保证数据一致性,消除数据冗余。
(3)实现海量地学数据的高效检索查询。
(4)建立有效访问控制机制,安全存储机制保障数据安全可靠。
(5)建立地学数据共享协作机制,提高地学数据利用率,盘活数据财富。
4 可行性分析
4.1 政策可行性
中共中央和国务院高度重视大数据的重要意义和作用,《促进大数据发展行动纲要》、《国土资源信息化“十三五”规划》、《新疆维吾尔自治区矿产资源总体规划(2016—2020 年)》、《新疆维吾尔自治区矿产资源勘查开发“十三五”规划》等政策法规均将大数据作为支撑、引领各行业领域发展水平提升的重要抓手,“新疆地学基础数据中心”建设完全符合政策要求。
4.2 数据可行性
新疆是我国矿产资源大省,新疆地质矿产勘查开发局在长期地质工作中积累了多专业、海量基础地理、遥感影像、基础地质、灾害地质、水文地质、工程地质、地球化学、地球物理、矿产地、探矿权、采矿权、工作程度、成矿区带、自然保护区、整装勘查区、潜力评价、地热资源等地学数据资源。随着工作的不断推进,将持续产生大量新的地学数据,且数据较规范和全面,具有地学基础数据中心建设的数据基础。
4.3 技术可行性
4.3.1 数据整合技术可行性
首先,以中国地质调查局编制的《地质信息产品发布技术要求(试行)》和全国地质资料馆《地质资料核心元数据内容结构和填写说明》为基础,从数据内容、数据分级、空间坐标系、数据模型、工作流程、质量监控、数据存储等方面着手,编制《新疆地学基础数据中心建设技术要求》,数据整合过程严格按技术要求规定执行;其次,利用地学领域专业软件(Arc-GIS、MapGIS、GeoIPAS、GeoElec、Suffer、QGIS、uDig等)对数据进行标准化处理,联合关系型数据库(PostgreSQL)、空间数据库(PostGIS)、文档型数据库(MongoDB)、分布式文件系统(Handoop)、全文检索数据库(ElasticSearch)等类型数据库建立地学数据资源池;最后,建立形式上统一的数据集成及数据访问接口体系。
4.3.2 平台建设技术可行性
大数据、云计算、地理信息技术已深入发展到各个领域。利用云计算技术将互联网的计算、存储、数据、应用等资源进行有效整合,实现多层次虚拟化与抽象,建立地学数据中心运行所需的基础设施环境。基于PostgreSQL、MongoDB、Handoop 等分布式数据库、文件系统建立地学大数据资源池,采用ElasticSearch 全文检索技术建立关键字索引、全文分词索引、空间索引数据库,联合PostGIS、GeoServer、IGServer、OpenLayers等地理信息技术开发遵循OGC标准的地学数据空间信息服务功能,基于JAVA、Spring Cloud 开发微服务架构的分布式地学基础数据中心平台。
5 结论
新疆地学基础数据中心建设完全符合国家政策要求,顺应地质信息化发展趋势,能对海量多专业地学数据进行集成和综合,实现地学数据的科学存储管理、统一更新维护、高效查询统计、快速成果展示、专业分析应用、专业评价及地学数据多元统计分析等。在推动公共数据资源开放、提高地学成果服务水平、扩大服务范围、转变服务方式等方面起到积极作用。