地质资料目录现状与发展趋势研究:以全国地质资料馆为例
2019-06-21高学正齐钒宇贾丽琼孔昭煜
高学正,齐钒宇,贾丽琼,孔昭煜
(1.中国地质调查局发展研究中心,北京 100037;2.全国地质资料馆,北京 100037)
地质资料是地质工作的真实记录与成果的结晶,切实关系到地质工作的长远发展,对我国能源资源安全十分重要。同时,地质资料也是我国社会经济发展以及基础设施建设的重要参考[1-2]。地质资料目录工作是地质资料馆藏机构的基础性、核心性工作之一[3],是对地质资料数据描述、组织和管理的核心手段[4]。
《地质资料管理条例》(国务院令第349号)以及《地质资料管理条例实施办法》(原国国土资源部令第16号)的颁布为地质资料目录公开与服务提供了法律依据,文件明确提出:地质资料馆藏机构应当利用现代信息处理技术,提高地质资料的处理、保管水平,建立地质资料信息服务网络系统,公布地质资料目录,开展对地质资料的综合研究工作,为政府决策提供依据,为社会提供公益性服务。
1 全国地质资料馆数据目录现状
地质资料目录与地质资料元数据是开展地质资料科学化管理与社会化服务的基础。近些年,全国地质资料馆十分重视地质资料目录及元数据建设,不断加大人员和资金力度,建立起了以地质资料数据目录为抓手,案卷级地质资料元数据及文件级地质资料元数据为主线的地质资料目录体系,为成果地质资料的科学化、精细化管理以及高效的社会化服务提供支撑。
1.1 馆藏地质资料目录
截至2019年4月末,全国地质资料馆已对外提供服务的资质资料目录达14.9万条,其中地质调查类资料目录11 550条,非地质调查类资料目录137 596条。平均每年增加目录近5 000条,为申请服务、网络服务和人工个性化定制等多种服务提供了保障。
1.2 专业类型目录
馆藏目录中各专业目录的占比情况为:区域调查资料10 913档,占比7.32%;矿产勘查资料91 154档,占比61.12 %;水工环勘查资料13 062档,占比8.76%;物化遥勘查资料13 504档,占比9.05%;地质科学研究资料18 014档,占比12.08%;海洋地质调查资料336档,占比0.22%;技术方法研究资料1 831档,占比1.23%;其他资料332档,占比0.22%。
1.3 多类型地质调查成果资料及目录进馆并提供服务
近些年,全国地质资料馆新进多种类型的地质资料及目录,包括①片区总结资料及目录。主要为东北、华东、华北及西北地区的基础地质综合调查与片区总结成果报告。除此以外,还包括河北、江苏、陕西、广西、贵州、山西、宁夏等省(区)的区域性片区总结报告。报告中汇总分析研究了各地区以往基础地质成果资料,对提高各区域基础地质调查研究程度、深化基础地质背景认识、满足国家和区域社会经济发展需求、解决制约资源与环境地质调查评价的地质问题等具有重要意义(表1)。②关键地区区域地质调查资料成果及目录。此项工作由中国地质调查局下达并开展,已陆续汇交到全国地质资料馆,目前共接收到相关报告及目录17份,包括秦岭、南岭、武夷山、大兴安岭南段、长江中下游等地区,范围广泛。成果资料中的系列图件与建立的基础地质数据库,提高了各主要成矿带的地质矿产调查评价研究水平,对区域内成矿地质背景、古生代构造格局、区内地球动力学机制研究取得了一系列新的认识。③地质志类资料及目录。全国地质资料馆分别接收了《北京市区域地质志上中下卷》和《湖北省区域地质志上中下册》资料和目录。除此以外,馆藏中还有14档有关地质志的资料,这些资料反映了我国16个省(区)的基础性地质调查研究成果,对城市地质调查、地矿勘查规划、矿山恢复、重大工程选址等工作具有重要意义。同时,可作为国民经济建设、国土资源规划及管理、矿产勘查部署决策的依据。④国情调查类资料及目录。“全国矿产资源潜力评价”项目成果资料和“全国矿业权实地核查”项目成果资料已经全面提供社会化服务。“全国矿产资源利用现状调查”项目部分成果资料已可提供资料服务,其余资料正在开展汇交及履行馆内手续等工作。至此,我国三大国情地质调查项目成果资料均已对外提供社会化服务。
表1 馆藏片区总结报告清单Table 1 Areas summary report list of collection
续表1
档号资料名称编写单位120965河南省1∶5万区调片区总结报告:小秦岭-卢氏片、西峡-鲁山片河南省地质调查院91082河南省小秦岭-卢氏片、西峡-鲁山片1∶5万区调片区总结报告河南省地质调查院120795湖北省大别山地区1∶5万区调片区总结湖北省地质调查院121064宁夏香山地区1∶5万区调片区总结报告:1∶25万宁夏地质调查院121544河北省太行山中-北段1∶5万区调片区总结说明书:1∶25万河北省地质矿产勘查开发局1208811∶5万区域地质调查云开片区总结上册、下册广西地质调查研究院106185贵州安龙地区1∶5万区调片区总结报告:安龙幅G48C003003 1∶25万地质图说明书贵州省地质调查院104327山西省五台山-恒山1∶5万区调片区总结报告山西省地质调查院121394江苏省东北部地区1∶5万区调片区总结报告江苏省地质调查研究院
1.4 建立并提供多种数据库目录服务
除以上基于成果地质资料汇交整理完成的地质资料目录以外,全国地质资料馆还根据社会需求和进馆项目成果资料情况,对重要的地质图空间数据库、地球化学数据库、地质灾害调查、全国矿产地等数据库开展了数据的集成与处理工作,向社会提供一系列的数据库目录服务(表2)。
表2 全国地质资料馆提供服务的数据库列表Table 2 List of databases provided by National Geological Archives
2 全国地质资料馆资料元数据建设
元数据是数据共享交换的核心与基本形式之一[5],资料元数据的工作能力也是当代各大图书馆、档案馆和数据中心的核心业务能力之一。元数据是数据管理的必要手段,同时也是建立数据之间关联关系的必要手段。通过元数据,可以有效建立本地数据集之间、数据库与文本间的关联,也可以建立网络间数据集与资料文本间的关联。
2.1 馆藏元数据目录
地质资料元数据编目工作是在统一的标准规范指导下,通过获取汇交资料的元数据信息,并进行完善和丰富,建立全国范围内的地质数据清单,形成国家地质资料元数据数据库,使得各类用户可以在一个计算机窗口之下,找到其所需的数据,对于提高地质资料社会化服务能力意义重大。
地质资料元数据库的建设是全国地质资料馆取得的重大成果之一,地质资料数字资源是一种复杂数字对象,具有多源、异构的特征[6],地质资料元数据库的建设很好的解决了这一问题,对地质资料的管理、到馆服务及网络服务产生了巨大的促进作用。目前,全国地质资料馆元数据采集信息到地质资料文件级,案卷集加文件级元数据项共138项,可提供对外服务的地质资料总件数4 503 039件,其中包含有正文报告、附图、附表、附件、多媒体、数据库、审批等多种文件类别(表3)。
表3 地质资料数据形态分类Table 3 Morphological classification of geological data
2.2 元数据模型研究
地质资料数据的元数据不止一种,而是随着地质资料数据生命周期的发展,在共享一个核心元数据的基础上,不同生命周期阶段有不同的扩展(图1)。因此,全国地质资料馆根据地质资料元数据的特点,针对地质资料的管理、利用、数据内容与结构、以及各自的业务需求,编研形成了包括地质资料核心元数据模型、产品元数据模型、在线数据服务元数据模型、数字资源目录元数据模型等在内的多种数据模型,以满足多元化需求[7]。
图1 地质资料数据的元数据应用模型Fig.1 Metadata application model of geological data
2.3 元数据的支撑作用
随着计算机技术的发展,地质资料网络服务已经逐渐成为了地质资料社会化服务的主要服务模式。全国地质资料馆通过对资料数据进行包装、组织、数据编排与模型重组,形成地质资料网络服务产品,向阅览用户提供服务。产品主要包括查询类产品(图2)、空间数据服务产品、专题服务类产品、信息类产品以及互联互查服务5大类。
图2 地质资料查询类服务产品示意图Fig.2 Sketch map of geological data query service products
支撑这5大类服务产品的数据基础正是全国地质资料馆馆藏的14万档、400万件地质资料元数据,通过将其进行网络发布,形成了包括国家地质图数据库、国家矿产资源数据库在内的地质图库数据服务产品;发布形成了全国城镇化地质资料专题、公开版城市环境地质报告专题、全国主要城市环境地质调查资料专题、地质关键词大数据等专题服务产品;集成并发布了7个地质调查资料数据分布产品,内容包括全国1∶10万县市地灾、全国1∶20万区域调查、全国1∶25万航磁调查资料等,实现了多专题大数据集的互联网发布[8]。这些产品的发布提高了地质资料社会化服务水平,形成了在线地质图服务(WMS服务、WFS服务)与地质资料文档数据浏览的混合服务模式,同时与过去只能依靠传统地质资料目录题名进行检索相比,现在用户可以进行更为精准的地质资料检索,可以通过报告名称、地图的图幅名称、图幅号、数据表名称等文件级题名进行搜索,地质资料元数据的为社会公众提供了更加精准的地质资料服务。因此,可以说元数据已经从简单的描述发展成为用于管理数据、发现数据、使用数据的一种重要的工具[9]。
3 地质资料目录发展趋势
3.1 地质资料总索引库
地质资料共建共享是大数据时代地质资料工作发展的必由之路,也是落实《自然资源部关于进一步加强地质资料社会化服务的指导意见》(自然资发〔2018〕179号)文件的必然选择,地质资料总索引库的建设是实现各级地质资料馆藏机构互联互通的前提。对比研究国际、国内的地质资料界、档案界、图书界元数据标准的基础上,在保持语义一致的前提下,对已有数据模型针对实际情况进行继承性扩展与完善,确定形成国家地质资料总索引库标准,提供网络环境下可解析的、持久的、可语义互操作的标识机制。进而开展全国馆-省馆的地质资料元数据交换机制研究,实现彼此间资料目录互通有无,共享元数据建设成果,扩大可服务的目录和数据范围,促进彼此间地质资料元数据编目、交换、查询等工作的开展,提高地质资料馆藏机构的管理和服务水平。
3.2 知识服务和标引
当前,全国地质资料馆的元数据编目到了文件级,提高了用户的使用体验,服务水平和效率得到很大提升。但地质资料文件结构及其中的关系错综复杂,面对数以亿计的地质资料数据,文件中的很多内容以及项目之间的结构和关系还不能被有效地揭示,为资料的获取和利用带来的障碍[10-11]。因此,对地质资料的知识服务及标引开展研究十分必要,通过对知识服务和标引的研究[12],将用户所检索的内容深入报告文档的内部,通过机构知识库、地质地名库等相关知识库进行语义扩展,加强对资料内部的知识资源进行揭示,增强知识的语义表达,帮助用户快速、精准定位所需内容,节省查询时间,提高信息资源的查全率,使用户在面对海量资源时实现对相关知识的精确查询。
3.3 数据检索系统
信息系统是实现地质资料快速检索,提高服务水平,发挥地质资料巨大作用的重要工具。在未来数据检索系统的建设中应着重考虑灵活的逻辑结构。实现可持续发展,能够实现与其他系统的借口对接;加快查询检索速度,实行分布式的数据快速索引机制;提高系统适应性,实现跨平台的数据访问。
4 结 语
地质资料目录以及资料元数据对于描述地质资料具有十分重要的作用,是开展数字化时代下地质资料科学管理与高效服务的核心内容。在未来,更好地利用计算机和网络技术,加快地质资料元数据的获取速度。打破信息壁垒,建立地质资料目录共享与数据交换机制,实现目录数据的互联互通,有效提升地质资料的管理和服务水平,更好地发挥对社会经济建设的巨大作用。