APP下载

地质矿产测试元数据标准分析

2018-10-16杨婧关鑫

农家科技下旬刊 2018年8期
关键词:元数据分析测试数据库

杨婧 关鑫

摘 要:元数据是说明数据内容、质量、条件、查询和其他有关特征的背景数据,在信息共享中有重要作用。本文重点介绍了地质矿产分析测试元数据标准和元数据库管理系统的研究。

关键词::元数据;数据库;分析测试

实验室信息管理系统(LIMS)、区域地球化学数据管理系统(PGD )和全国岩石数据库的逐步建立和应用,使我国海量区域地球化学数据实现计算机化管理和信息共享,并能灵活、高效、方便地进行数据查询和数据检索处理及成果图示成为现实。然而,由于分析测试领域宽大,数据项目繁多,国内外尚未制定出相应的元数据标准,各系统和部门的实验室,大都依据本系统的传统方法建立 LIMS 系统,或开发只局限于本部门的数据库系统,本应从全局方位客观地分析实验室数据的需求关系,未能从全社会共享的思维设计开发分析测试实验室的数据库,由此阻碍了基础数据库的进一步应用和数据共享,使许多珍贵的数据资源难以有效地用于解决地质、矿产、环境及农业等方面问题。

因此,开展地质矿产实验室分析测试元数据标准研究,建立分析测试数据元数据库,它能为立足国内,加强地质勘查,解决矿产资源和能源供应以及相关领域的科学研究,提供分析数据的互操作和信息共享。本项工作为中国地质调查局研究项目的子课题之一,其研究目标是:为了指导和规范地矿实验室数据库建设工作,根据现行国土资源信息的有关法律、法规、技术标准,在制定的地质矿产分析测试元数据标准的基础上,研究地质矿产分析测试元数据库管理系统,为地质调查实验室数据的组织维护、数据检索和数据交换提供技术基础。

一、 地质矿产分析测试元数据

元数据是使数据充分发挥作用的重要条件之一,可用于数据文档的建立、数据发布、数据浏览、数据转换等,对于促进数据的管理、使用和共享有重要的作用。如果没有元数据,就不能有效地管理和使用原始数据。

新一轮地质大调查,对实验测试工作提出了更新、更高、更快的要求。地质大调查不仅承担区域化探、地质矿产预查与普查、大中比例尺区域地质及厚覆盖区多目标地球化学调查任务,还要承担海洋地质、环境地质、水资源环境的调查任务。因此,地质大调查与原来的地质工作相比较,已经从单纯的找矿向多元化方向发展,测试技术领域亦从单一的元素分析扩大到多目标的无机、有机、形态分析,其数据之繁多、类型之复杂,前所未有。有机地球化学研究和海洋地质、生态环境地质、农业地质、灾害地质等都对分析测试数据管理提出了新要求。特别是开展全球地球化学填图,要完成70 多种元素分析,需要进行大批量样品中的元素分析,并保证实验测试质量。因此,地质矿产实验室的分析测试元数据标准要适应多种数据集的要求,同时力求简洁,便于操作和实施,主要数据元素被认为是那些重要的、值得长期记录和保存在可存储大量数据库的计算机系统中的元素。为此,我们在详细分析地质矿产实验室分析数据的基础上,参考国内已经制定的《国家基础地理信息系统元数据标准》和《国土资源信息核心元数据标准》,研究制定地质矿产分析测试元数据标准。

本标准提供有关实验测试数据标识、覆盖范围以及数据集的内容、质量、状况和其他特性信息。它可用于分析数据采集、交换、处理和数据库设计,以及数据集编目、数据交换网络服务,并满足新一轮地质大调查实验数据管理和数据共享要求。根据地矿实验室样品的分析数据特征和需求进行分类、组合,既要考虑标准的通用性,又要考虑不同实验室的专业化要求,在建立通用的一级元数据的基础上,结合地质行业数据类型多、数据量大和用户类型多的特点,建立二级元数据标准,以管理好这个数据库群, 让用户更多、更快、更好、更容易地了解、掌握和使用这个数据库,并和中国地质科学数据网站点WDC的栏目相结合,便于今后进行数据库的运行维护。一级元数据的内容由6个不重复使用的主要子集和2个可重复使用的次要子集内容组成。

标识信息:用于唯一标识一个数据集,包括数据集名称、版本、语种、出版日期、覆盖范围、采集资料等信息。

数据质量信息:关于数据集质量的评价。提供有关数据采集项目名称、数据志说明、质量控制等方面信息。

描述信息:数据集的内容描述。提供数据集摘要、开发目的、进展情况、关键词和参考文献等信息。

发行信息:数据集的获取信息。包括数据集发行单位、发行格式、网上发行地址等信息。

元数据参考信息:元数据的当前信息和负责部门信息。包括元数据负责单位、作者、地址、编写日期、最后修改日期等信息。

二、 地质矿产分析测试元数据库管理系统

元数据管理的主要目标是提高存取元数据和它所描述的数据集的能力。为了保证元数据的准确性、完备性,由数据集的生产者来担负元数据的建立工作。在元数据信息管理系统的体系结构中,元数据的采集工作是由数据集生产者通过元数据管理系统子系统完成。当有新的数据集产生后,数据集生产者可以依据元数据标准,将数据集的各项特征信息逐个从数据集中总结提炼出来,输入元数据管理系统。所有特征元素内容填写完毕后,并且通过管理系统的逻辑检查之后,就可以将该数据利用元数据库管理系统添加入库。元数据库是为保存和处理元数据而设计和建立的数据库。元数据库的运行方式和正常数据库相同。

1.运行环境。本系统的运行环境要求在网络环境下运行,通过WEB 方式将数据集生产者手中的元数据集中到元数据库管理系统进行管理,并且通过元数据发布系统为使用者提供查询服务。使用者可以借助元数据深入的了解数据集的各项特征,最终通过元数据提供的获取途径取得该数据集。

2.系统结构。元数据管理系统用于编辑生成元数据信息,另外,元数据库是元数据共享的信息源,元数据的管理工作还必须对元数据库进行日常维护,以保证元数据库成为数据集共享的有效信息源,所以必须包括数据提交、数据浏览、数据查询 、数据维护等内容。

3.功能模块

(1)数据提交。包括元数据\ 数据集\ 项目的提交。项目v的提交提供了批量数据导入数据库的功能。

(2)数据浏览。包括分类浏览、数据查询。查询方式简便,组合查询形式灵活,可以按相同项目的结果值大小排序查询,用户只须输入分析项目名称和选择排序方式,就可查询库中数据集中该分析项目的分析结果,并按用户要求的排序方式显示信息。

(3)数据维护。包括用户管理、新闻管理、访问日志、项目管理。项目管理建立静态数据库,如,针对各种分析测试类型,编辑常用的分析项目入库,以此建立了不同分析类型与分析项目的关系数据库,在进行数据提交时,只需选择分析测试类型,相关的分析项目就可调出,能大大提高分析项目数据提交的效率。另外一种方式是数据代码表,它用于描述一个数据项中可能取值的长列表,它是一个灵活的枚举类。使用代码表不要求表中的元素都是已知的,可以有其他可能的取值,如,使用数据代码表描述分析测试类型,用户只需选择列表项,即可录入参数。

三、 结 语

随着网络技术的发展,元数据已成为信息服务和信息资源管理不可缺少的组成部分,是信息共享的前提和基础。地矿实验室的网络基础设施建设已初具规模,利用地质矿产分析测试元数据标准和关系数据库管理系统建立地质矿产分析测试元数据库,同时,开发地质矿产分析测试元数据操作工具管理和利用元数据,在地矿行业推广实施,搭建地矿分析测试数据共享平台。

作者簡介:杨婧(1990-),女,助理工程师,现在辽宁省核工业地质局241大队工作。

猜你喜欢

元数据分析测试数据库
《分析测试技术与仪器》简介
铁路通信网络安全的分析测试与可信防御研究
关于分析测试中心在高校实验教学中的思考
数据库
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
数据库
数据库
数据库