发达国家地质大数据管理现状分析与启示:以美、英、澳、加为例
2022-05-02刘炜
刘 炜
1. 中国地质图书馆,北京 100083;
2. 自然资源综合调查指挥中心, 北京 100055
1 引言
科学数据是国家重要战略资源,数据共享是这种资源有效开发利用的手段之一,也是当今科学研究范式向数据密集型转变的重要基础。现代化的勘查方法、勘探装备和信息技术的融合发展使得勘查研究和生产过程中产生的数据表现出新的特点,即多结构、大规模与高速性,特别是多结构数据的大量产生使得地质调查勘探从“海量数据(Massive Data)”时代急速推向“大数据(Big Data)”时代,以大数据、物联网、云计算等前沿技术为依托,已发展形成“信息找矿”新理论的雏形,“地质大数据”在成矿规律、成矿系列、矿产预测等方面研究工作中的应用已逐渐显现优势(王登红等,2015)。
以美国为首的世界上各主要发达国家,较早认识到了这个问题,大多采用政府承担或为首的形式,在多种公共领域内推行大数据规划及管理,同时也鼓励企业的加入。如美国在2012年3月推出《大数据研究和发展计划(Big Data Research and Development Initiative)》(http://www. whitehouse.gov,2020),涉及美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、美国地质调查局(United States Geological Survey,USGS)六大部门,形成包含数学、统计基础和计算机算法的专门学科。在该计划发布以后,美国多部门启动了82个大数据相关项目,涵盖国防、国家安全等多个方面,包括USGS开展的能源、地质勘查等地质科学领域的大数据项目。USGS公布的大多数研究项目重视数据工程应用而不是数据科学方法的研究,主要重视大数据分析算法和系统效率的提高方面。USGS随后在6月发布《美国地质调查局核心科学体系科学战略(Science Strategy for Core Science Systems in the U.S. Geological Survey)2013-2023》(https://pubs.er. usgs.gov, 2012),作为十年内核心科学研究的纲领。
欧盟在大数据方面的活动主要涉及四个方面的内容:研究数据价值链战略因素、资助“大数据”和“开放数据”领域的研究和创新活动、实施开放数据政策、促进公共资助科研试验成果和数据的使用及再利用。2014年起欧盟执行了一项最大的科研资助计划《地平线2020(Horizon 2020)》(https:// ec.europa.eu,2020),连续七年支持开放数据战略的实施。欧盟同时在数据基础设施发展战略方面也做了大量工作,欧盟空间信息基础建设(Infrastructure for Spatial Information in the European Community)(http://www.eugris. info, 2019)就是欧洲地学信息基础设施建设和服务的一个代表。
2013年10月底,英国发布《把握数据带来的机遇:英国数据能力战略》(https:// www.gov.uk,2013),重在体现对高校、研究机构的资金扶持和合作平台搭建。同时英国从《Horizon 2020》中获得最大的受益,并于2017年开放交通运输、天气和健康方面的核心公共数据库,在接下来的五年内建立开放数据研究所。英国研究理事会将建立一个公众可以通过网络检索查询的科研门户网站。2019年6月,英国政府发布最新年度计划——《交付计划(the Delivery Plan)2019》,强调研发是成功实现英国《产业战略》目标的关键,该战略旨在使英国在应对全球共同面临的人工智能和大数据等四大挑战时,保持未来产业的领先发展。英国政府将研发定位于产业战略的核心,承诺到2021年—2022年再增加70亿欧元,到2027年将研发总投资增加到GDP的2.4%(https://tech.sina.com.cn, 2019)。
2012年,法国发布《数字化路线图(the Digital Road Map)》,表示将大力支持大数据在内的战略性高新技术,法国政府以培养新兴企业、软件开发、信息系统设计等为目标,开展一系列投资计划,促进大数据领域的发展。2012年10月,澳大利亚政府发布《澳大利亚公共服务信息与通信技术战略(Australian Public Service In formation and Communication Technology Strategy)2012-2015》(https://trove. nla.gov.au, 2012),强调应增强政府机构的数据分析能力,从而促进更好的服务传递和更科学的政策制定,并将制定一份大数据战略确定为战略执行计划之一。2013年2月,澳大利亚政府信息管理办公室(the Australian Government Information Mana-gement Office,AGIMO)成立了跨部门工作组——“大数据工作组”,启动了《公共服务大数据战略(the Australian Public Service Big Data Strategy)》(https:// docplayer.net,2020)制定工作,并于2013年8月正式对外发布。澳大利亚地质调查局( Australian Geological Survey Organi-zation,AGSO)数据战略计划(2018~2021)目标为:数据潜力最大化,提供开放数据,提供可获取、可检索、可重用、可控、可信的数据。此计划可分为三个主要战略重点领域:信息和通信技术、数据保管以及数据管理。AGSO已经开始着手实施数据战略计划中数据管理领域的一些重要构建模块的实现。
日本启动“创建最尖端IT国家计划”,2013~2020以开放公共数据和大数据为核心,应对抗灾救灾和核电站事故等社会性问题。加拿大自然资源地质科学部(Natural Resources Canada,NRCan)开展并实施了“能源和矿产资源填图计划(Geomapping for Energy and Minerals,GEM)”(http://publiccations.gc.ca, 2020)。
资源建设和开放准入是世界各国政府大数据建设和管理的核心原则,各国的国家级架构有:国际数据共享计划——如美国地球科学信息网络(The United States Geological Information Net,USGIN);欧洲联盟(欧盟)环境信息空间数据基础设施;澳大利亚合作项目——如澳大利亚国家数据服务、国家计划,等等。
随着这一系列的大数据规划及管理计划的推行颁布,各国在地质科学数据驱动地质科学研究上有着长足的发展,产生的大数据在其各自地调机构发布或牵头的项目所属的数据库中有着规范的组织和存储。如美国地质调查局(USGS)的矿产资源在线空间数据平台(Mineral Resources Online Spatial Data,MRData)和美国国家物候网(USA National Phenology Network,NPN)是USGS当前重要的大数据应用平台之一,前者是矿产资源数据管理工具,后者在全美物候观测研究中起着重要的作用。英国地质调查局(British Geological Survey,BGS)的开放地学(OpenGeoscience)计划是数据库类服务平台,提出了一个全球性的地学数据仓库概念,通过此平台达到地质信息共享的目的。澳大利亚地质调查局(AGSO)在大数据管理方面出台了一些国家层面上的政策,如数据战略计划、2020数字连续性政策等,澳大利亚海洋空间信息系统、澳大利亚地层单位数据库等是其具体应用。加拿大自然资源地质科学部(NRCan)的国家能源利用数据库、NRCan地质图像扫描数据库等是在加拿大政府开放数据项目(Government of Canada-Open Data)下的数据库。
美国、英国、澳大利亚、加拿大等发达国家的地质调查机构,一向重视提升地质调查在促进经济发展和社会变革、解决重大地球科学问题等方面的重要作用(唐金荣等,2011),当前更是把大数据应用能力提升作为新的发展机遇,积极推动地质调查实现更高水平的创新和发展(郑人瑞等,2019)。近年来,世界各主要发达国家的地质大数据管理有了新的进展,其主要表现集中于以下几个方面:(1)数据管理范围的扩大,如USGS职责范围增加了核心科学体系作为第七个也是最重要的一个方面;(2)数据管理计划等纷纷出台,如BGS的开放数据计划—开放地学计划致力于更大范围内提升地质信息共享,USGS的科学数据目录定义标准化数据,可在多应用领域内实现数据解析和分析;(3)地学领域数据管理工具和数据库在各国都得到了极大的发展,等等。围绕这几个方面,本文对美、英、澳、加四国地调机构在大数据管理方面的现状进行了介绍与分析,以期对中国地调机构在大数据管理工作方面的发展提供借鉴与启示。
2 美、英、澳、加四国地调局大数据管理现状
2.1 美国地质大数据管理现状
USGS于1879年通过美国国会法案创建,在随后的140年中将人才、知识与科学技术进步相结合,不断发展。USGS是美国内政部的唯一科学机构,提供专业的自然科学知识和广泛的地球生物数据资源,主要职责包括地下水、生态系统、环境资源、自然灾害、气候和土地利用变化、核心科学体系等七个方面,包括两个交叉的学科方向:数据集成和新技术的发展,涌现很多研究成果。
2.1.1 USGS数据管理范围
USGS对其支持和产生的所有科研及计划项目的数据拥有主权并行使管理权,这些科研范围包括生物学与生态系统、国土资源、海岸、能源、环境、地质、测绘等多个方面(表1),基于数据开放战略,它们的进展以出版物、地图、软件、新闻、图像、视频、多媒体等形式提供公开检索。
表1 USGS数据管理范围表Table 1 USGS data management scope
2.1.2 USGS科学数据目录
USGS采用标准化数据,这些数据可以直接导入相应的软件进行应用及分析,用于需要进行大数据收集处理的科学、工程或商业环境中。USGS收集的数据和使用的技术应符合或参考国家和国际标准及协议。对于给定类型的数据集,如果存在国家或国际元数据标准,则使用元数据对数据进行索引,以便于访问和集成。
USGS采用的SDC(Science Data Catalog)工具,由SAS(STATISTICAL ANALYSIS SYSTEM私营公司)和ORNL(Oak Ridge National Laboratory,橡树岭国家实验室)合作开发,对公众开放(表2),通过基于文本、关键字、任务区域、数据源和科学家方面的搜索以及基于GIS的搜索机制发现公共USGS数据集。
表2 SDC所含部分开放数据Table 2 Some open data contained in SDC
2.1.3 数据管理工具
数据管理工具:良好的数据管理能够使数据的定位、共享和重用变得容易,并能减少数据冗余,有效减少了时间和经济方面的成本,还可以帮助满足开放式数据需求,使数据更易于访问和发现。近两年发布的工具如表3所示。
表3 USGS发布数据管理工具(部分)Table 3 USGS release data management tool (part)
2.1.4 USGS数据库
USGS资助建立的数据库有多个,范围涵盖广泛,部分数据库如表4所示。
表4 USGS数据库(部分)Table 4 USGS database (part)
2.2 英国地质大数据管理现状
BGS前身是成立于1835年的地质军械调查所,侧重于政府的公益科学,进行地球和环境过程的研究,它是英国首屈一指的权威地球科学数据、信息和知识的提供者,范围包括管理自然资源的合理开发和利用、管理环境变化以及抵御环境危害。拥有国家地球科学数据中心、国家地质资源库(NGR)、地球科学设施(NERC),为国家及公众提供多种数据服务。
2.2.1 BGS数据管理范围
BGS的研究范畴包括地球自然灾害、能源、工程地质、地球分析建模、地质学和区域地球物理学、地下水、海洋地球科学、矿物和废弃物处理等,这些都属于BGS的数据管理范围(表5),产生的各种数据产品通常是在全国范围内开发的,并且广泛应用于学术界、行业内及购房者和决策者在内的最终用户,越来越多的数据可以查看下载。
表5 BGS数据管理范围表Table 5 The BGS Data Management Scope
2.2.2 开放数据计划—开放地学计划
(OpenGeoscience)(http://www.bgs.ac. uk,2020)
BGS对数据管理十分看重,OpenGeoscience是数据库类服务平台,它是传统的数据供给模型,与各种具有地学数据的组织建立合作伙伴关系,该计划提出了一个全球性的地学数据仓库概念,通过该平台达到地质信息共享的目的,可以免费查看地图、应用程序,下载数据、扫描、照片和其他信息。OpenGeoscience可用的主要服务包括:通过英国地质地图窗口和网络地图服务(Web Map Services,WMS)查看地表地质数据、3D地质模型、钻孔扫描、地震时间表的浏览查看,能够全方位地从地图上查看数据,最大比例尺为1:625 000;从GeoScenic地质照片档案库中搜索和下载照片;查看BGS从1832年至2014年出版的纸质地图和1835年至今的部分出版物。OpenGeoscience免费提供的主要信息内容如表6所示。
2.3 澳大利亚地质大数据管理现状
AGSO的历史可追溯到1946年,工作范畴包括几个关键的战略领域:矿产和能源资源、自然灾害防御、水资源、海洋陆地(延伸至澳大利亚管辖的海洋范围)、环境可持续利用、基本地理信息、地球科学知识及能力等(孙海雪等,2018)。其职权范围已超出了澳大利亚对资源开发的历史重点,涵盖了诸如海啸和地震等自然灾害,包括气候变化影响在内的环境问题,地下水研究,海洋和沿海研究,碳捕集与封存、植被等各种问题,地质信息覆盖面广,各类信息所产生的海量数据结合大数据采集与获取、存储与管理、处理、信息提取、知识挖掘等技术最终以不同的产品服务于公众。
2.3.1 AGSO数据管理范围
AGSO的数据管理范围包括能源、天文等多个方面(表7),相关的部分研究进展及基于开放战略的数据等可以在AGSO的官方网站上获得。
表7 AGSO数据管理范围表Table 7 Scope of the AGSO Data Management
2.3.2 数据计划
AGSO在大数据管理方面出台了一些国家层面上的政策。
AGSO数据战略计划AGSO制定了2018~2021年数据战略计划,目标是使数据潜力最大化,提供开放的、可获取、可检索、可重用、可控、可信的数据。这里的数据定义为由AGSO获取、创建及维护的结构化/非结构化数据,包括离散数据、流式数据和实时数据。澳大利亚政府开放数据地址为data.gov.au。
2020数字连续性政策(Digital Continuity 2020 Policy)2020数字连续性政策在支持澳大利亚政府的数字化转型计划和推动电子政务方面发挥着关键作用,将信息治理原则和实践整合到机构的工作及治理安排中,以优化政府计划和服务的交付,使信息重用于经济和社会利益,保护本国的权益。该政策使得澳大利亚政府内部以及各个机构内部对信息管理采取一致的方法,适用于政府信息、数据、记录、系统、服务和过程,由澳大利亚国家档案馆牵头实施。
2.3.3 数据和出版物检索(Data and Publi-cations Search)
数据与出版物查询系统是AGSO研发的综合性查询系统,包括AGSO发布的数据、出版物、在线工具、地图和多媒体等的目录,近期新发布的产品可以在新品发布服务系统中查询。
数据库/地图集AGSO有多种数据,包括澳大利亚矿业地图集、澳大利亚地层单位数据库、实时地磁数据、卫星图像、地震活动等,部分数据库如表8所示。
表8 AGSO数据库(部分)Table 8 AGSO Database (Part)
数据工具AGSO所使用的部分数据工具如表9所示。
表9 AGSO数据工具(部分)Table 9 AGSO Data Tools (Part)
2.4 加拿大地质大数据管理现状
NRCan的历史可追溯到1842年,随着加拿大的发展,它的职权在许多政府机构中被分割,直到1995年由现已解散的加拿大能源、矿产资源和林业部门合并而来,是加拿大政府负责自然资源、能源、矿产和金属、森林、地球科学、测绘和遥感的部门。
2.4.1 NRCan数据管理范围
加拿大自然资源地质科学部(NRCan)的科研活动包括能源、矿产、森林、地球科学、灾害、气候变化等范围,产生的数据构成了NRCan的主要数据管理范围(表10)。
表10 NRCan数据管理范围表Table 10 NRCan Data Management Scope
2.4.2 加拿大政府开放数据项目
加拿大政府开放数据项目(Government of Canada—Open Data)包括经济、健康、教育等各方面的政府公开数据。用户可以搜索与加拿大相关的超过80000个开放的数据和信息资产,了解如何使用数据集、浏览信息摘要并使用ATIP在线工具发出数据请求、查看加拿大全国范围内对开放数据所做的工作。可以通过开放数据门户网站(open.canada.ca)检索,也可以按主题浏览,涵盖加拿大政府多个部门,包括NRCan。加拿大政府制定的《2018~2020 国家行动计划》涵盖了提高开放数据获取门户上的可用开放数据质量的目标:(1)到2019年6月,制定并发布数据质量标准;(2)到2020年6月,开发完成新的数据质量评估系统来补充当前的“评估数据集”功能,并且该系统可在open.canada.ca上线;(3)到2020年6月,审查完成200个常用数据集的数据质量,提供标准化、完整的元数据;(4)到2020年6月,使用NRCan的联邦地理空间平台(FGP)数据质量评估标准审查500多个地理空间数据集。
2.4.3 数据库
NRCan的部分数据库如表11所示。
表11 NRCan数据库(部分)Table 11 NRCan Databases (part)
3 美、英、澳、加四国地调局地质数据管理现状分析
3.1 数据管理范围分析
美、英、澳、加四国地调局的大数据管理的范围(表12)就是他们各自的科研方向及政策、项目资助的倾斜方向。四国机构虽然同属地调机构,大部分涵盖的管理范围相同,但是也有着各自的特点,如加拿大靠近北极,对地磁、极光、太空气候等展开研究,对新能源/再生能源非常重视,并且因为境内有着广大的森林,对森林的研究和数据管理也比较重视;英国作为岛国对近海陆架等很关注,美、英、澳作为长海岸线国家都对海洋的研究尤为关注,都作为地调局工作范围的一部分;英国境内多古堡,专门有石料数据管理,能精确地知道每一座古堡的石料数据;美国的研究范围最全面,等等。共性是四国的地调机构的研究和数据管理范围都不局限于传统的地质领域,而是向交叉领域扩展。USGS将任务领域划分为七个部分:核心科学体系、生态系统、能源矿产、环境卫生、土地资源、自然灾害及水资源,比较完整地涵盖了整个自能系统。
表12 四国地调数据管理大致范围Table 12 General Scope of Data Management among the Four Countries’ Geological Surveys
3.2 数据管理及科学共享政策分析
在推进数据管理及科学共享相关建设方面,欧美发达国家都有着较完善的科学数据共享法律体系和政策基础。全局性、长远性布局科学数据的共享已经成为各国的共识,各国地调局在根据本国实际制定相关政策后,在实践过程中不断修订完善,趋于成熟,在科学数据类型与标准、数据汇交、科学数据保存、数据共享利用、数据安全以及数据产权等方面提出了不同的规定和要求,同时,在包括信息自由法、版权和知识产权、隐私法,以及规定信息服务的对象、内容、定价、信息发布、客户关系及服务质量等方面也或多或少制定了相应的政策。这些政策的大致关注点可以划分为以下几类(表13)。
表13 四国地调数据管理政策大致关注点Table 13 General Concerns of Data Management Policies of the Four Countries’ Geological Survey
数据已经成为各国发展与创新科技的重点,对数据的整合、管理、共享具有重要的意义,各国地调机构对数据的管理和应用均提出了国家层面上的政策,如USGS的《USGS核心科学体系科学战略(2013~2023)》,关键要素就是通过信息学和计算机技术实现数据信息的管理和存档,促进交叉学科的发展,以解决复杂的科学和社会问题。BGS 的开放数据计划(OpenGeoscience)提出一个全球性的地学数据仓库概念,与世界上其他国家地学机构联合,达到地质信息共享的目的。AGSO的地球科学数据管理构建的三个主要战略重点领域包含了数据保存和数据管理。纵观这些国家的数据战略,既有相同点又有相异点(表14)。
表14 各国地调数据管理政策异同点比较Table 14 Comparison of the Similarities and Differences of Data Management Policies in Different Countries
3.3 数据库及数据管理工具开放共享分析
从美、英、澳、加四国地调局数据管理的范围可以看出其内容非常丰富,涉及的领域众多,这也决定了数据库的种类众多、不同数据库差异较大、且所应用的数据管理工具多种多样。同时各国地理位置及自然情况不同,侧重及关注点也是有所差别,但是差异中又存在一些共性,这些共性构成了各国地调局覆盖关注点范围,代表着国际上相关领域的研究方向。
3.3.1 政府开放基础类数据库面向公众,促进数据信息共享
本文搜集了四国地调局的部分数据库,其中关于地图类、地球物理/地球化学、能源类等的数据库是所有国家共有的且都提供查看服务,比如美国国家地质地图数据库;BGS提供地质类、灾害类、地下水类、地球化学类、地球物理类、能源类等多种细分地图供查看和下载;澳大利亚的国家地图、矿业地图集、地形图索引、交互地图、地球物理地图、飞行线图库等;加拿大的地图系列包含湖河冰川水文图、加拿大行政边界图、大陆高程图、地名数据库、地形数据图、人为建筑地图、自然景观地图、矿石、能源、通讯网络地图等。数据库可以在各国地调局网站或其链接上进行查看,部分提供下载,BGS的OpenGeoscience提供全面的检索服务,NRCan可链接到加拿大政府开放数据项目,这里不仅提供NRCan的数据库,还提供经济、健康、教育等各方面的政府公开数据。
3.3.2 政府资助多种科研项目,开放数据管理类工具
各国政府资助的多种科研项目产生丰富的成果,并提供一些数据管理类工具供下载使用。如USGS整合了全美地区的最新研究成果,不定期发布阶段性成果,包括一些数据管理类的工具,2018年可检索到RSQA等8个,2019年截至9月份检索到5个。BGS的Groundhog Desktop用于显示地质和地理空间信息,澳大利亚的AUSPOS是在线GPS数据处理工具,EarthSci数字地球仪能够可视化3D地球科学数据,查看大多数标准的GIS栅格和矢量格式等。这些工具的开放不仅能使公众了解到相关领域最新进展,还能下载和使用部分工具,上传自己的数据,从而丰富相关数据库、减少重复工作、促进研究进展。
4 中国地质数据管理现状与启示
中国大数据管理虽然起步较晚,但是近年来国家给予了足够的重视,作为国家战略,从政策层面出台了一系列的规划。2015年十八届五中全会公报提出要实施“国家大数据战略”。2017年出台的《十三五国家科技创新基地专项规划》上,提出要结合国家大数据战略的实施,加强科学数据库建设,强化科学数据的汇集、更新和深度挖掘,形成一批有国际影响力的国家科学数据中心,为国家重大战略需求提供科学数据支撑服务。当年,工信部还出台了《促进大数据产业发展规划(2016~2020年)》。2020年十九届五中全会指出要加快数字化发展。
在这样的背景下,为了消除数字鸿沟,整合共享地学数据资源,中国地质调查局建设了“地质云”平台,以实现地质调查信息高效共享和精准服务,实现地质调查主流程信息化和智能化工作模式,实现地质调查管理业务一体化和协同化,支撑国内外地学科研信息交流与多方协同。目前,地质云2.0已经上线并经历了稳定运行,2020年围绕调查(科研)、管理、共享、服务不同类型的用户需求,以地质大数据中心建设为核心,以地质调查“在线化”、“智能化”为目标,三位一体推进地质云、大数据与智能化建设,目前地质云3.0正在抓紧建设中。
地质云2.0已建成覆盖局属29家单位、9个行业地勘单位和院校的分布式节点体系,包括 20个物理节点,19个虚拟节点,其信息技术框架实现了用户权限、云上数据、应用、软件的集成、统一调度、统一服务等内容。业务范围分为地质调查、自然资源调查、业务管理和战略研究几大类,包括基础地质与区域地质数据库、矿产地质数据库、能源地质调查数据库、地球化学数据库、遥感地质数据库等12大类数据库(表15),已完成其中22个,基本完成23个,建设中25个,规划中14个。地质调查方面已经几乎覆盖了所有能上云的数据,自然资源调查方面也取得了可喜的进展。
表15 地质云数据库(部分)Table 15 GeoCloud Database(Part)
本文对美、英、澳、加四国地质调查局的数据管理工作做了调查,从数据管理范围、数据政策、战略计划、部分数据库及数据工具等方面进行了介绍并作了分析,同时对中国地质调查局的数据管理工作的最新进展做了介绍,从中得出一些启示。首先,各国均认识到大数据的核心价值,开发程度较高,以美国为最高、英国次之,澳、加紧随其后,中国尚逊一筹。其次,各国出台的数据管理政策深浅不一,有的颁布了针对地调领域的政策,有的没有,中国在这方面还需完善。第三,数据开放融合是未来趋势,中国在这方面的开放程度有待进一步提高。第四,数据综合服务开放平台的建设尚处于起步阶段,和发达国家相比还具有较大的差距。最后,发达国家由于起步早、数据基础深厚,在数据管理规则的制定上具有领先优势,欧盟、非盟等以组织的形式也提出了符合各自利益的主张,中国需要采取措施进一步提高国际话语权。综合以上分析与启示,对中国地质调查行业数据管理工作方面提出几点建议。
4.1 数据管理政策采用自顶向下设计,自底向上实施
纵览四国数据管理工作方面,可以发现都是由政府部门制定发布相关政策的,且具有国家牵头、多部委联动制定、政策时间跨度大、深入程度深等特点。USGS更是建立核心科学体系,把七大任务都包括了进来,形成完整深刻的整个研究体系。这种建设方法要求必须采用顶层设计、向下逐层实施,再由底层向上执行和反馈的方式,从而提供完善的科学数据共享法律体系和政策基础,便于全局性、长远性布局科学数据。
4.2 数据开放共享、融合交流是世界地调机构的发展趋势
四国都建立了各自的数据开放平台,BGS更是走在了世界前列,提出了全球性的地学数据仓库概念,希望通过OpenGeo-science平台达到地质信息共享的目的。我国从2017年地质云1.0版上线到2018年2.0版升级,已经在数据开放共享方面做出了可喜的进步,但是仍然和发达国家的开放共享程度有着一定差距。哪些数据可以开放、哪些数据需要逐步开放等需要制定一个行之有效的计划,以推进相关方面工作的进展。
4.3 大力推进地质云建设,三位一体实现大数据治理
地质云的建设任重而道远,目前在服务窗口上存在着服务针对性不强、易用性不足的弱点;在内容支撑上,应将目前以人工组织为主的形式向数据规范化管理、产品高效自动发布的方向转变;基础设施建设上高性能计算能力还需进一步提高;局部技术上,在内容服务水平、数据技术、网络安全技术等方面还有较大的提升空间;数据量上,应该采取深挖细挖地质调查大数据,加速加深自然资源数据的获取,并在未来将数据积累为主转型为深挖关联,结合人工智能和云计算技术,三位一体实现真正的大数据治理。
4.4 促进数据共享基础设施建设,提升国际话语权
中国在“云计算”、“物联网”、“大数据”等新兴技术方面的研究已经取得快速发展,大数据应用领域正在走向世界前列。这些成果可以应用在地质调查行业数据基础设施的建设中,开发数据处理工具,拓展数据平台的计算、分析、可视化处理和数据挖掘能力,加入国际数据治理、共享的平台,积极参与国际数据标准、技术规范的制定,通过参与国际治理争取拿到更多的话语权。
5 结束语
本文对美、英、澳、加四国地质调查局的数据管理工作方面做了调查,从数据管理范围、数据政策、战略计划、重要数据库及主要数据工具等方面的现状进行了介绍与分析,并结合中国地质调查数据管理工作的进展,得出一些启示与建议。虽然中国在大数据管理上起步较晚、上升空间尚大,但是在规划明确、配套政策支持下,具有很大的发展潜力。