中国典型矿床实物地质资料波谱数据库及其服务系统建设建议
2020-02-06史维鑫高鹏鑫回广骥张海兰高卿楠孙东洵
史维鑫,高鹏鑫,回广骥,张 弘,张海兰,高卿楠,孙东洵
(自然资源实物地质资料中心,河北 三河 065201)
0 引 言
钻孔岩芯、标本实物地质资料是取自于地质体的第一手地质资料,广泛应用于地球科学研究、矿产资源勘查开发等方面。利用目前先进的技术手段,如红外光谱、X射线荧光光谱、磁化率等,可以连续、快速地提取实物蕴含的各类信息,将实体岩芯、标本等“数字化”。研发类型、结构合理的数据库,利用“地质云”平台将数据上网发布,消除数据鸿沟,实现最大范围的数据共享。
近年来,国家和各省级实物地质资料馆积累了海量的、系统的实物地质资料,但其资料服务仍局限于传统的到馆观察、取样等。一方面服务成本较高,给资料利用者造成较大不便;另一方面对实物损坏较大,不利于长期保管。此外单一的服务模式已经明显不符合新时期地质工作对资料全面、高速、便捷的利用需求。在现代信息技术发展日新月异的背景下,如何深度挖掘实物地质资料多元数据,做好海量、异构数据的规范化组织,安全存储与快速发布,如何提供数据的有效应用是实物地质资料管理工作者要全面解决的问题。为了有效解决以上问题,本文从实物地质资料信息化服务需求出发,总结国内外波谱数据库建设情况,立足国内具体情况及存在的问题,提出建设实物地质资料波谱数据库的方案及相关建议。
1 波谱数据库及其服务系统的定义及意义
中国典型矿床实物地质资料波谱数据库及其服务系统主要是基于国家、省级和基层地勘单位三级保管的岩芯、标本等实物地质资料,开展以图像、红外光谱扫描为主的数字化工作,提取实物的图像、光谱反射率、矿物组分等信息并建立数据库,实现多源、多元、异构的数据统一组织管理,并基于“地质云”统一发布。该数据库主要包括三个子数据库,即岩芯波谱数据库、典型标本波谱数据库和其他实物波谱数据库。数据管理系统主要实现数据处理、编辑、存储、统计、录入、导出等功能。数据服务系统主要实现数据的发布、查询、浏览、下载等功能(图1)。
建设中国典型矿床实物地质资料波谱数据库具有重要的意义,从国际视野来看,世界各国建立起实物地质资料波谱数据库,地质科学家们将更容易通过波谱数据库的在线共享,提升对全球地质演化的综合研究水平。从国内情况来看,建设该数据库,一方面,可以提高我国实物地质资料的数字化、信息化服务水平,有效改变传统到馆服务模式单一、效率低下的弊端;另一方面,技术应用成熟后,可推广到广大地勘单位、工矿企业,大量岩芯在图像、光谱扫描后可进行缩减埋藏等处置工作,既能够降低保管成本,又能最大限度地降低因处置造成的信息损失。
图1 中国典型矿床波谱数据库及其服务系统的定义性框架图
2 国外波谱数据库及其服务系统建设进展
世界各矿业大国基于光谱蚀变矿物填图、高光谱岩芯编录系统、“玻璃地球”计划等工作[1-4]开展了岩芯、矿物相关的波谱数据库建设工作。但建设最先进、数据量最大、服务效果最显著的岩芯波谱数据库是在澳大利亚和瑞典,两国均建立了岩芯波谱数据库及其服务系统并实现在线数据发布与共享。
2.1 澳大利亚波谱数据库建设进展
澳大利亚通过将本国18个岩芯保管机构的所有钻孔岩芯进行光谱扫描工作,建立了奥斯库普国家虚拟岩芯库(National Virtual Core Library),实现了数据上的统一汇聚、管理与发布,极大提升了数据的交流与共享。该项工作以逐步建立澳洲大陆地壳上部1~2 km范围的地球物质的新型高清影像,为世界级地学研究提供服务为目标[5]。该岩芯库除了提供岩芯图像、波谱数据之外,还提供元素浓度等其他各类标量数据,且数据库及其服务系统可拓展性极强,只要带有深度属性的数据,均可以加载到数据库及其服务系统中进行统一管理与发布,目前数据可直接通过AuScope的数据基础设施和发现门户网站、澳大利亚地球科学门户网站进行查询或线下订购[6]。
2.2 瑞典波谱数据库建设进展
截至2016年,瑞典地质调查局永久岩芯库内存放着来自瑞典各地18 000余个钻孔的3 000 km钻孔岩芯。为了提升岩芯的数字化程度,瑞典地质调查局启动了钻孔岩芯扫描工作,主要计划对国家钻孔岩芯库内存放的岩芯开展高分辨率光学图像扫描和红外光谱扫描并建立光学和光谱的数据库,将成为国家永久岩芯库所藏钻孔岩芯相关资料的有力补充[7]。该数据结果也实现了共享,在瑞典地质调查局网站的地图查看器中的“钻孔岩芯”选项卡内可进行查看利用。
3 国内波谱数据库及其服务系统建设现状分析
3.1 建设现状
我国由于起步较晚,目前岩芯数字化程度较低,无论固体矿产还是油气系统,基本上停留在光学图像扫描数字化阶段,在线服务也仅停留在目录、图像的程度,与澳大利亚、瑞典等发达国家相比,无论数据种类还是数据量等均存在“代差”。
3.1.1 国家馆岩芯波谱数据采集与保存情况
为了丰富数据种类,2015年,国家实物地质资料馆进行了馆藏固体矿产、油气等多门类岩芯共20多个矿床上万米岩芯的红外光谱扫描工作。截至2018年年底,国家实物地质资料馆已经积累了300余处典型矿床的近50万m岩芯,已完成约30万m岩芯的图像扫描工作,并基于“地质云”和“中国实物地质资料信息网”进行在线图像发布服务。基于该项工作,积累了既能够满足资料利用者数据精度的要求,又适合于馆藏机构快速、大批量、低成本开展馆藏岩芯红外光谱扫描的技术方法。此外,针对波谱数据库的数据特点,进行数据库建设预研究。以上工作为全面性地开展中国典型矿床实物地质资料波谱数据库建设工作积累了一定的工作经验。
3.1.2 省级馆岩芯波谱数据建设及相关工作开展现状
截至2017年年底,全国各省级馆已经积累了约82万m岩芯等实物地质资料。省级实物地质资料管理工作近几年在库房设施建设、资料采集收集等领域取得了进展,但目前仅安徽、黑龙江、西藏等少数几个省份开展了岩芯图像扫描工作,且尚未实现上网服务。
3.1.3 基层单位岩芯波谱数据建设及相关工作开展现状
2009年全国实物地质资料及其管理情况摸底调查结果显示:全国482个主要保管单位总计保存岩矿心已达1 006.04万m。据2016年《中国矿产资源报告》[8],“十二五”期间,仅固体矿产领域,每年新增的岩芯仍将达到上千万米,数量十分庞大。但全国绝大多数基层地勘单位、工矿企业实物地质资料保管情况堪忧,数字化工作更无从谈起。
国内一些企事业单位、科研机构等联合地勘单位或矿业公司基于某一矿区进行岩芯光谱扫描并建立了小型的岩芯波谱数据库,促进了相关研究工作[9-13],但同样数据库缺乏数据共享机制,数据在权属上属于私人企业或某个单位,数据共享程度低,使用效率低下。
3.2 我国波谱数据库建设的差距
与国外发达国家相比,我国实物地质资料数字化程度偏低,以国家馆和各省级馆为例,数字化手段仍以图像扫描为主,仅国家馆开展了部分定量、半定量多参数扫描数字化试验,相关技术尚未进行推广应用。虽然部分科研单位、工矿企业针对某些特定矿区进行了岩芯光谱扫描建库,但数据量小且缺乏全国层面的统筹管理,难以对数据进行汇聚、整合,数据零星分散,无法形成“大数据”的效应。因此,总体上讲,我国实物地质资料波谱数据库建设尚处于起步阶段。分析与国外波谱数据库建设的差距,主要原因包括红外光谱技术推广应用较晚;国内投资项目不足;波谱数据的采集、解译、数据组织等方面无统一的标准;波谱数据库建设缺乏全国层面的统一管理措施等,今后应在国家层面予以重视和加强。
4 波谱数据库及其服务系统建设方案
4.1 构建“国家-省级-基层单位”三级数据汇聚、管理与统一发布机制
中国典型矿床实物地质资料波谱数据库建设既不是个别单位参与的,也不是“一次性”的任务。波谱数据需要持续不断地更新、丰富、充实,该项工作是全国各个实物保管单位广泛参与并形成常态化的数据汇聚、更新机制的庞大工程,其建设既是一个涉及地质、遥感、计算机技术等多学科交叉的技术问题,也是涉及数据汇聚、共享利用的管理体制机制问题。首先,需搭建国家-省级-基层单位的三级网络体系,国家馆为国家级数据中心,省级馆为省级数据分中心,基层单位为数据采集终端的基本构成单元(图2)。国家馆和省级中心既是数据汇聚中心,同时也是数据采集终端。最终,所有数据汇聚到国家级数据中心,并通过“地质云”统一发布服务。
图2 国家-省级-基层单位三级网络体系
图3 “树根状”数据库组织体系
4.2 搭建矿种-成因类型-矿床-钻孔-波谱数据五级数据组织体系
根据典型矿床波谱数据库的数据特点,按照由宏观到具体的思路,建立“五级”数据组织体系,即“总数据库-矿种-成因类型-典型矿床-钻孔-数据”,形成“树根状”的数据组织体系(图3)。
4.3 搭建波谱数据库及服务系统总体架构
中国典型矿床实物地质资料波谱数据库及其服务系统在总体架构上为“2-3-4-5”模式,即:2条主线,3层分布式模型,4层数据体系,5个主体功能,具体如下所述。
1) 2条主线。一条为理论与技术方法与管理制度研究,技术方法包括岩芯光谱扫描、数据处理、数据解译、数据库建设等技术方法,管理制度包括数据汇聚、共享、发布等制度;另一条是以数据采集、数据处理、数据解译、多元数据集成、专题成果发布等业务工作为核心的业务主线。
2) 3层数据库分布式模型。该数据库的系统架构为一个逻辑上3层的分布式模型,包括应用表示层、数据操作层和数据存储层。应用表示层包括两个层面,一是数据展示层,为用户提供系统操作和可视化交互展示界面,主要包括捕捉用户输入信息、展示查询结果,实现不同的数据应用模式;二是后台业务应用层,主要是后台的系统管理、安全服务等功能。数据操作层主要包括信息服务、信息编辑和管理维护等功能,信息服务包括查询、分析、显示等功能;信息编辑包括数据输入、数据挖掘、格式转换、数据同步、数据输出等功能;管理维护包括用户管理和权限管理。数据存储层主要负责将标准化的钻孔岩芯数据、典型标本数据及标准矿物光谱数据进行存放管理(图4)。
3) 4层数据体系。该数据库的基本单元为单个钻孔岩芯的数据,单个钻孔岩芯的数据可划分为4个层次数据,依次为光谱曲线数据、光谱参数数据、矿物解译数据和地质解释数据;其中光谱曲线数据是基础,基于光谱曲线图像和反射率数据,获取光谱参数数据;基于光谱参数数据,利用解译软件并结合人工干预,形成矿物解译数据;基于地质知识,将矿物解译数据转化为地质解释语言;针对4个层次数据多元、异构的特点,数据库存储架构的选择,要满足海量存储、兼容性、安全性、管理效率、可扩展性等性能需求。
4) 5个主体功能。数据库管理及其服务系统要能够提供数据的综合管理、查询、浏览、下载、借阅5项主体功能;数据管理与服务系统的建设充分结合数据类型、结构、未来的发展趋势等特点打造智能、快速运行、高效管理的数据平台,利用大数据和云计算等技术,基于“地质云”服务平台,实现钻孔岩芯数据的存储、组织、管理、快速检索与挖掘应用。
图4 数据库系统架构图
5 技术支撑体系
5.1 岩芯标本扫描解译技术规范
建立岩芯、标本的光谱扫描技术规范,对岩芯扫描前准备(包括清洁、整理、处理等)、岩芯扫描(包括扫描间隔、单点时间控制、仪器定标等)、数据解译(包括解译方法、解译精度控制等)、地质解释和数据质量控制进行全流程的规范和约束,形成全流程的光谱扫描数字化技术规范。
5.2 核心数据库建设标准
核心数据库建设标准是中国典型矿床实物地质资料波谱数据库建设的基础,需研究实物地质资料波谱核心数据库标准规范,研究多元异构数据的规范化组织与管理;根据波谱数据的特点,开展数据库顶层架构设计,并对各类数据的类型、格式、命名、组织方法等进行规范。
5.3 数据管理及发布制度
除了各类技术要求外,还需要配套制定一系列的数据管理与发布制度,对参与建设中国典型矿床实物地质资料波谱数据库的各个责任主体的权利、义务等进行详细约束,为波谱数据库建设的常态化运行提供制度保障。
5.4 基于“地质云”的数据服务平台
采用“地质云”作为服务平台是技术支撑体系的重要一环,需研究搭建数据库与“地质云”之间的数据接口,实现数据上云服务。该波谱数据库服务系统应属于“数据共享”子系统,在“地学数据”下设独立数据库服务系统,如图1所示。实物地质资料具有很强的位置属性,因此在传统目录检索的基础之上,实现强大的地理检索是服务系统建设的关键所在。
6 结 论
1) 中国典型矿床实物地质资料波谱数据库建设采用成熟的信息提取技术方法,将岩芯、标本等实体资料数字化,以“地质云”为资源共享平台,消除数据鸿沟,提升实物地质资料服务能力和水平。
2) 中国典型矿床实物地质资料波谱数据库及其服务系统主要工作是开展以图像、光谱扫描等为主的数字化工作,提取实物的图像、反射率、组份等信息并建立数据库,实现数据统一组织管理与发布。
3) 中国典型矿床实物地质资料波谱数据库在管理体制机制方面需要搭建“国家-省级-基层单位”的三级网络体系,国家馆为国家级数据中心,省级馆为省级数据分中心,基层单位为数据采集终端的基本构成单元;在数据组织体系方面需要搭建“矿种-成因类型-矿床-钻孔-波谱数据”五级数据组织体系。
4) 中国典型矿床波谱数据库及其服务系统采用“2-3-4-5”结构模式。即2条主线:一条为技术方法与管理制度研究,另一条业务工作流程主线;3层数据库分布式模型:数据存储层、数据操作层和应用展示层;4层单钻孔数据体系:光谱反射率数据、光谱参数数据、矿物解译数据和地质解释数据;5个主体功能:数据的管理、查询、浏览、下载和借阅。
5) 中国典型矿床实物地质资料波谱数据库的建设是一项长期且持续的工作,需要在体制机制及制度保障方面开展研究,国家牵头、省级配合、全国参与,最终形成数据有效汇聚、常态更新、即时发布的“动态”数据库及其服务系统。