地球科学大数据的管理与共享:以英国地质调查局为例
2021-03-05史宇坤杨孙容侯旭东樊隽轩
文 蝶,黄 浩,史宇坤*,杨孙容,杨 娇,王 媛,侯旭东,樊隽轩,3
1. 南京大学 地球科学与工程学院,南京 210023;2. 中国地质科学院 地质研究所,北京 100037;3. 内生金属矿床成矿机制研究国家重点实验室 南京大学,南京 210023
进入21世纪,随着越来越多的大型科学装置的建设和重大科学实验的开展,科学研究进入到一个前所未有的大数据时代(黎建辉等,2017)。科学大数据驱动科学研究,开始进入数据密集型科学发现范式的全新阶段(郭华东等,2014)。在地球科学领域,研究人员掌握了来自轨道卫星、气象监测仪器、生态观测站、地震观测站等持续监测获得的海量数据(Sellars et al., 2013),也积累了大量从各类科学实验、调查研究中获取的数据。对于这些数据,使用传统的地学资料管理方式,已经越来越难以满足研究人员甚至公众对地学资料的高质量、高精度,以及获取的高效率等多元化需求(赵伟等,2013)。同时,传统模式也大大制约了数据的传递和共享,成为数据高效使用的屏障。建立更加合理高效的地学数据管理模式和共享方式,是在地球科学领域建立数据密集型科学发现范式的迫切需求。基于资料数字化基础之上的数据库管理和基于互联网的信息共享,是已被普遍采用的数据管理和共享方式,如何加深、拓展这一模式,使之可以满足海量数据管理、展示和传输的要求,是地球科学工作者需要深入思考的问题。英国地质调查局在这一领域走在了世界最前列。20世纪九十年代以来,该局成功将其近200年来积累的海量地学数据进行了全方位的数字化,包括地质文本、图件、实体标本、实验测试和地质调查数据等,建立了相对完整的数据管理和共享机制。因此本文将其作为实践地学大数据管理与共享的典范,综合介绍该局的数据资源情况、数据管理模式和数据共享方式,以期为我国地学大数据的未来发展提供可借鉴的经验。
1 英国地质调查局的转型
英国地质调查局(British Geological Survey, 简称BGS)是由英国政府于1835年出资建造,为全球首个国家地质调查局,目前是隶属于英国自然环境研究理事会(Natural Environment Research Council,简称NERC)的一个公益机构。地质调查局总部设在诺丁汉附近的基沃思,并在爱丁堡、瓦林福德、伦敦和卡迪夫设有地区办事处。英国地质调查局一直以来的工作重点紧密围绕国家的战略需求。它目前的战略计划包括三大部分:核心战略科学计划、合作伙伴计划和委托计划(王立伟等,2019)。其中核心战略计划处于首要地位,主要内容是实施基础性、公益性的地质调查任务,获取具有重要战略意义地区的环境数据,进行分析,提供适当的共享(唐金荣等,2016)。
该局前身是伴随着工业革命的进程而成立的英国地形地质调查局(Geological Ordnance Survey)。建设初期,其任务是进行系统的地质填图,寻找足够的矿产资源来支撑当时工农业的发展。之后,地形地质调查局经历了一系列的改革、调整与创新,在1984年更名为英国地质调查局,工作重点从地质填图逐渐转向综合的地球科学信息资源管理和共享,具体内容包括:提供高分辨率的地质图;解释和运用地质数据,协助政府制定相关政策;帮助公众了解如何合理使用自然资源,应对环境的变化并减少对环境的破坏等。他们的科学研究方法,也从单一的地质调查转变为结合各种新技术和手段,通过跨学科的调查、监测和研究来增进对固体地球系统的结构、性质和演化过程的理解。如今英国地调局的主要任务是对英国的大陆及大陆架区域进行系统测量、检验和研究,拓展英国的地学知识储备,为英国政府提供地球科学方面的相关信息,并在地学相关产业和学术问题方面为英国政府、工业界、学术界和公众提供客观的建议。
进入大数据时代,英国地调局迅速将多年积累的丰富地学数据与先进的大数据理念和信息化技术紧密结合,快速实现了转型。通过近年来系统、高效的数字化工作,该局地学数据已经大部分实现了数字化,并且向全球用户免费开放共享。地调局基本实现了从传统地形地质填图机构向更加关注数据管理和应用的应用型现代化地学机构的转型(张明超等,2017),成为了英国地球科学数据、信息和知识的权威提供者。
2 英国地质调查局的在线免费数据资源
英国地调局可以称作是“英国地球科学数据的管理员”,保管着各种重要的、在许多情况下不可替代的实物资产和电子数据资源。针对这些资源,他们总体采取了“分散保管、集中服务”的地质资料管理方式(许百泉等,2013),即实物资产分散存储,电子数据资源统一集成。其中,实物资产包括有各种原始的纸质档案记录、岩芯、岩石和化石样品等,分散存储在7个地点的41个仓库中,合计占据了超过13000 m2的建筑面积和82000 m3的存储空间,总重量超过5000 t。虽然在2010年,英国地调局将爱丁堡吉尔默顿的海洋岩芯转移到了基沃思的英国地质资源库(National Geological Repository, 简称NGR),但许多采集资料仍然高度分散。
该局绝大多数的电子数据资源,则由英国地调局经营的英国地球科学数据中心(National Geoscience Data Centre, 简称NGDC)进行收集和保存,统一集成在地调局的门户网站中。迄今为止,英国地调局内的数据集已经超过400个,涵盖了地球科学的各个方面,包括环境监测数据,各类地质学数据、档案和照片等。这些数据集中的绝大部分可以在“开放地学”(OpenGeoscience, https://www.bgs.ac.uk/opengeoscience/home.html.)中免费检索、浏览和下载。“开放地学”是英国地调局免费的数据共享与信息服务网站,开放于2009年12月,由九大模块构成:网络地图查看器(View maps)、移动端应用(Apps)、地图数据下载(Map data downloads)、地质体影像(Photos and images)、出版物(Publications)、岩芯和地图扫描影像(Scanned records)、数据集(Data collections)、网络服务(Web services)、相关专业软件(Software)。其中,上文提到的实体样品的电子数据资源,包括照片、出版物、相关数据,分别保存在地质体影像、出版物、扫描影像和数据集几个模块中。此外,英国地调局还广泛与国内外地学机构合作,为其他机构建设和管理电子数据,这些数据托管于英国地调局的网站,也是英国地调局的重要数据资源之一。本部分将重点介绍“开放地学”中的自主在线数据库、和合作机构共建的数据库、地图数据资源、地质影像照片库GeoScenic以及实时监测数据。
2.1 “开放地学”的在线数据库
英国地调局的古生物、岩石矿物、地球化学标本的采集历史悠久,仅在英国全境,即已收集了超过一千万份的标本。英国地调局结合专业知识和数据,围绕地质、地球物理、地球化学、水文地质学、古生物学、岩石学、矿物学等方面建立了多个数据库(Lumsden and Haworth, 1986)。由于篇幅限制,本节将介绍岩石、钻孔、古生物三个完善的基础类型数据库,这些数据库可在“开放地学”的数据集模块里查看。
2.1.1 岩石数据库BGS Rock collections
现今的岩石实物资料库里,岩石样品以及相关的纸质记录超过了一百万份,分别保存在基沃思总部和爱丁堡分部。英国地调局中的岩石数据库BGS Rock collections(mineralogy and petrology collection database),用于对岩石样品的基本信息、矿物学和岩石学信息等的存储和管理,如编号、捐赠人、岩石名称、采集层位和产地,以及标本和薄片图像信息等等。
此数据库所包含的条目现已超过20万条,可通过关键词(如编号、岩石或所含矿物名称、采集点等)检索,或在1:5万的地质图上通过位置检索,还可以利用GeoIndex进行检索。GeoIndex是英国地调局开发的基于地图的数据检索工具,后文将详细介绍。其中通过关键词检索的方式最为常见,例如,在数据库中检索编号S1234,可得到其样品相关信息如图1,样品捐赠人是A. Macconachie,样品名称为石英角闪石黑云母玢岩(Quartz hornblende biotite porphyrite),实物资料中除了玢岩之外还附着有黑云母闪长岩(Biotite diorite)的样品碎片,采集地点位于Dalbeattie以西两英里的Barskeogh山,在1:5万的Kirkcudbrihgt图幅中可以查看产地的地质情况。较为特别的是,数据库中提供岩石薄片从平面偏光至正交偏光转换过程中的系列高清照片,模拟显微镜下真实观察薄片的情景,帮助准确判断薄片中的矿物种类、含量等信息。
图1 岩石数据库样品检索结果样例Fig. 1 A sample search from the Rock collections
2.1.2 陆地和海洋岩芯数据库
钻孔数据是地质技术人员在野外钻探现场记录并整理的第一手技术资料,通常包含钻孔名称、编号、位置、类型、矿区名称、孔口高程、终孔深度和终孔日期等基础信息。英国地质调查局内的钻孔数据主要分为陆地(Onshore)和海洋(Offshore)两部分,数据库也相应分为两个。
陆地钻孔资料的实物主要是岩芯和岩屑,岩芯有不连续岩芯、连续岩芯和代表性岩芯样品,岩屑有水洗干燥岩屑和未水洗岩屑,大部分保存在基沃思。陆地钻孔数据库(British onshore borehole collection database)中共有超过15000条记录,主要提供钻孔名称、钻孔类型和终孔深度三类钻孔的基础信息,可提供钻孔名进行简单检索或者使用GeoIndex检索。
海洋钻孔指的是通过英国大陆架(United Kingdom Continental Shelf,简 称UKCS)油 气井采集的钻孔资料,这部分数据由英国能源与气候变化部(Department of Energy and Climate Change, 简称DECC)提供。实物有超过300公里的钻芯和450万份岩屑,目前保存在基沃思。海洋钻孔数据库(UKCS offshore hydrocarbon well collection)数据包括钻孔名称、钻孔编号、钻孔位置、钻芯照片、钻孔类型和终孔深度等,现拥有8000多口海洋油气井记录,13万张高分辨率岩芯照片。岩芯照片分辨率为7216×5412像素,是长1 m宽0.6 m的岩芯托盘全尺寸进行200 dpi像素分辨率拍摄形成。数据库提供井名、钻井公司等关键词检索方式,也支持GeoIndex方式检索。如检索井名110/02-6,可得知该钻井工程由Spirit energy公司执行,获得钻孔位置坐标、钻孔深度、存放地点以及所有的岩芯信息。其中1号岩芯,深度从959.51 m(3148英尺)到942.41 m(3088英尺),分置在11个托盘里,并保存有每个岩芯托盘的高清照片。
2.1.3 古生物标本数据库PalaeoSaurus online collections database
英国地调局收藏的古生物标本超过500万件,包括大量珍贵的模式标本,目前已经有超过15万件的信息被收入了古生物标本数据库PalaeoSaurus。该数据库中包含英国寒武纪至早白垩世绝大多数的重要标本数据,包括标本入库编号、模式标本信息、鉴定名称、产地、所在的地图幅编号、地层和地质时代信息等。该数据库支持输入化石名称、产地等相关信息进行简单检索。
网站上还特别提供了对标本数据的用户建议功能。网站注明,由于库中所保存的标本信息来自一百多年前,且来源多样,鉴定标准陈旧,因此数据可能存在与现有标准不一致的地方。用户对有关内容有任何建议和意见,都可以直接点击链接,反馈信息。这一功能的设计,可有力保障对于化石属种分类、地质时代等信息的动态更新。
2.2 英国地调局合作的化石模式标本数据库
英国地调局还通过与其他大学、研究所、地质调查和工业机构合作,共同管理数据,来强化科学研究。GB3D化石模式标本数据库(GB3D Type Fossils,http://www.3d-fossils.ac.uk/)就是其中的合作典范。
该数据库是由联合信息系统委员会(Joint Information Systems Committee, 简称JISC)资助建立的英国馆藏式化石标本数据库,由英国地调局进行管理,其中涵盖了英国馆藏的以及在英国发现的化石模式标本数据。数据库中的化石数据来自分散保存在22个合作博物馆和机构中的化石标本,其中贡献最多的博物馆和机构有塞奇威克地球科学博物馆、牛津大学自然历史博物馆、威尔士国家博物馆、地质馆员协会(The Geological Curator’s Group)和英国地调局。截止2014年9月22日,该数据库中共存储了精选的16400个化石标本的28000多张图片和1800多个3D扫描图像,包含的化石门类有头足类、双壳类、腕足类、节肢类、刺胞动物、棘皮类、有孔虫、介形虫、植物等。 “模式标本”是用来定义化石物种的一个或一组实物化石标本,保存有此物种的典型形态特征,通常在物种命名时指定。根据命名时的具体情况,模式标本有不同的类型,这在GB3D中也有详细的注明。例如正模(Holotype)是指在命名化石时被明确指定的唯一标本;副模(Paratype)是除正模之外对形态特征可以进行补充的其他标本;新模(Neotype)是原正模化石丢失后新添加的同种标本等等。对无法确定或者未加定义类型的模式标本,GB3D中以不确定型(Undifferentiated Type)、未定义(Not available)注明。
在面向用户方面,GB3D数据库提供的数据信息包括化石的3D数字模型、高分辨率照片、立体照片和化石元数据(位置、年代、分类标识、注册号等)。在数据库中,用户可以通过化石所在的地质年代、岩石单元、分类系统和化石发现国家、位置、研究机构和注册号等关键词进行搜索。用户也可以根据是否包括化石的图像数据(2D、3D或立体照片等)进行筛选,并且可以选择清单、表格或可导出的文字三种不同形式来呈现搜索结果,同时支持图片、3D模型的在线展示及下载功能(包括2000分辨率的JPEG格式图片和obj、ply格式的3D模型)。例如,搜索编号13488(图2)的化石,得到的结果显示化石名称为Procerites twinhoensisArkell,属于动物界,软体动物门,头足纲,菊石目。该化石是副模标本,实物由T.R.Fry在1923年采自英国威洛巴斯的Twinhoe绿色采石场,现保存在布里斯托大学地质收藏库中。标本产自距今166.1~168.3 Ma的侏罗纪巴通阶含铁鲕粒灰岩中(Bathonian: Twinhoe Ironshot Oolite)。
2.3 数字地图数据资源
英国地质调查局的制图能力全球领先,在超过一个半世纪里发布了种类繁多的地图,并建立了不同的数据库,来增强其地图有关的知识管理和交流(Howard et al., 2009)。这些地图以不同的采集形式分类,收入两个独立的数据库中,即纸质扫描地图数据库(BGS maps portal)及可下载的地图数据库(Map data downloads),前者存储2014年之前发表的纸质扫描地图,后者存储数字地图。这两者的数据库架构和数据访问方式均存在差异,将分别予以介绍。如果用户需要绝版纸质地图,还可以到网站的在线商店购买打印件。
图2 GB3D中编号13488的化石Procerites twinhoensis展示页面Fig. 2 The display results of specimen catalogued as 13488, Procerites twinhoensis in GB3D
2.3.1 纸质扫描地图BGS maps portal
BGS地图站点(BGS maps portal)的纸质扫描地图保存在“开放地学”的岩芯和地图扫描影像模块中。站点存储了英国地调局从1832年至2014年出版的超过6000份地图和剖面图的高分辨率扫描件,包括英格兰、威尔士以及苏格兰的全部中小比例尺(1:63360/1:50000)重要地图。所有的图件可以按照地区或者学科主题浏览,学科主题分类包括地质图、地质剖面图、地球物理地图、地球化学地图、水文地质图和其他主题小比例尺地图。在最为常用的地质图类中,有英国以及周围大陆架地区1:25万的地质图、英国地质经典区域的1:2.5万地质图、英格兰和威尔士的1:63360地质图、1:5万地质图、以及各区域的1:253440地质图等等。这些图件可直接下载或购买打印版,进行普通的浏览和使用。
2.3.2 数字地图数据Map data downloads
与纸质地图相比,数字地图功能强大,用户可下载数字地图数据至自己的系统中编辑使用。“开放地学”中的数字地图数据集按照主题分为地质学、地质灾害、地下水、能源、地球化学和地球物理六个板块,数据可以按照ESRI Shapefile、MapInfo和KML等常用的GIS格式被用户下载,亦可根据用户需求提供其他格式。
地质学部分有五个可下载数据集,分别是英国地质图数据集、钻孔数据集、土壤母质模型(Soil parent material model)数据集、英国国家基岩栅状图(National bedrock fence diagram)数据集和英国地表沉积物厚度模型(Superficial deposits thickness model)数据集。其中非常特别的是地质图数据集和基岩栅状图数据集。英国地质图数据集存储了英国数字地质图项目(DiGMapGB)完成的英格兰、威尔士和苏格兰地区的1:62.5万、1:25万、1:5万和1:1万比例地质图的数据集,包含基岩、岩脉、地表沉积物等的性质,以及构造断层等常用信息。其中1:62.5万的可免费使用,1:5万对商业使用收费,其他比例尺的均为有偿使用。栅状图是认识地质结构和构造的一种重要手段,可用于建立三维地质模型(曾闽山等,2006)。英国国家基岩栅状图是在全英国范围内建立的三维栅格状地质截面网络,可以构建起三维的地质图(3D geology for the United Kingdom,UK3D)。这个栅状图分布有超过20000 km的剖面线,覆盖了整个英国的陆地,并向海洋区域延伸出20 km,剖面向下延伸最深处为地面以下6 km。剖面线的数据由一系列的钻孔数据以及其他单剖面数据组成,通过地质建模软件GSI3D构建出栅格状地质截面,形成栅状图。其中的钻孔数据、单剖面数据以及构建完成的栅状地质截面数据均可免费下载,并且单剖面数据格式还与谷歌地球匹配,便于用户使用。通过栅状图构建的英国区域地质三维模型以pdf文档的形式供用户下载,文档中的三维模型可以多角度、多比例自由查看,高程比例可以调节,并且所有的地层单元、地形、地表沉积物、钻孔位置等都可以自由选择显示(图3)。
地质灾害图数据集有四个部分,分别是5 km六角网格形式的描述六种自然灾害可能性的GeoSure、1 km六角网格形式的采矿灾害数据集、放射性元素氡的分布图集以及全球的地震数据集。
数字地图数据部分的其余四个板块包括1:62.5万的水文地质学的数据集、英国陆上煤炭资源的潜力能源数据集、不列颠群岛自然地球化学基线以及重力和磁力数据集。
图3 伦敦及泰晤士地区三维地质图Fig. 33D geological map for London and Thames Valley
2.4 地质影像照片库GeoScenic
GeoScenic是英国地调局建设的一个存储和共享地球科学高质量照片的数据库,目前包含了6万余张照片,均来自于英国地质照片国家档案馆(National Archive of Geological Photographs),可免费用于非商业用途。该数据库中的照片均支持原尺寸观看,并可免费下载。这些照片均以地球科学某学科为主题,地球科学研究对象为主体呈现,涵盖的主题包括岩石学、古生物学、地层学、经济地质学、地质灾害、地表景观等等。GeoScenic保存了照片相关信息,如照片类型、拍摄地点、拍摄时间、像素分辨率以及照片内容的文字描述等(图4)。GeoScenic支持使用主题词检索照片,并且照片同时在GeoIndex中,可通过其在地图上的位置直接找到。
图4 GeoScenic数据库中编号为P006749的展示不整合接触关系的野外露头照片Fig. 4 The outcrop photo catalogued P006749 in GeoScenic database displaying the unconformity contact
2.5 实时监测数据Sensor data
通过气象站等高精度的监测传感器,并配合自动数据采集系统(automated data acquisition system,简称ADAS)进行自动化遥测,可以实时、高效地采集高精度信息,获取实时监测数据(韩子夜和薛星桥,2005)。英国地调局在“开放地学”的数据集模块建设了实时监测(Instrumenting the Earth)功能,收集来自英国各地以及其他国家的传感器数据,以获取诸如地下水温度和水位、大气压力和地热等信息。
英国地调局目前接收的数据主要来自他们的地能观测项目、滑坡监测项目、环境基线监测项目等等。其中支持在线实时访问数据的监测点有四个,即瓦林福德河监测点,兰开夏郡环境基线监测点,卡迪夫地源热泵(Ground Source Heat Pump,简称GSHP)监测点和约克郡环境基线监测点。这些监测点获得的数据被实时传输到地调局的中央数据存储器中,在其中进行清洗和标准化后发布给用户查看和使用。英国地调局对于实时监测数据的获取和管理还在不断地测试中,网站表明后续也将开放更多的实时监测数据。
3 英国地质调查局的数据共享方式
英国地调局的数据共享已有15年之久,近年来,该局致力于实现不同数据集的融合和共享。“开放地学”通过各种在线查看器、应用程序、软件和网络服务,将各种数据集有机链接在一起,使得数据获取和使用快捷、方便。这些共享服务包括有地图查看器View maps;移动应用英国地质iGeology、农业土壤MySoil和火山灾害MyVolcano;虚拟钻孔和剖面创建软件Groundhog和地质制图集成包BGS·SIGMA等。
3.1 在线地图查看器View maps
此模块中包含了可以查看最近十余年制作的各类数字化地图,主要有四类:面向大众的英国地质图(Geology of Britain)、适用于专业人员的地质索引图(GeoIndex,分为陆地和海洋两个独立的入口)、地下水位变化图(Groundwater levels timeline)、英国土壤信息站(UK soil observatory,UKSO)。
3.1.1 英国地质图查看器Geology of Britain viewer
查看器中提供二维和三维两个版本的英国地质图,二维版本中可在线查看1:5万至1:62.5万的数字地质图,有地表地质、3D模型、钻孔和地震年表四个不同的数据模式。其中,地表地质数据展示的是地面以上地质体的基本属性,可以查看2.6 Ma以来的地表沉积物(Superficial)和基岩(Bedrock)的情况,也就是我们通常意义的地质图。网站使用地形图和地质图的叠加显示方式,可以调整地质图图层的透明度,实现地质体图层和地形图层之间的不同叠加效果,对室内外工作提供了极大的便利。
3D模型模式提供英格堡、伊普斯威奇、怀特岛、瑟罗克、约克、海德公园和温莎七个地点部分或全部区域的3D地质模型,可在这些区域内的任意地点形成虚拟钻孔图(virtual borehole)、水平切面地质图(horizontal section)以及任意两点之间的地质剖面图(cross section)。以约克地区为例,网站提供的3D地质模型覆盖了约克以北和东部的50 km2的区域,是英国地调局于2005年根据针对Selby和York地区进行的1:1000综合调查和模型构建计划而建立的。模型综合了区域内可用的钻孔数据,可提供直至地下约50 m深度的地质信息。在该区域内点击任意点都可以形成以该点为孔心的虚拟钻孔剖面(图5),并附上岩性图例。点击图例中的岩石地层单位,可进一步显示地层单元的更多详细信息。
钻孔模式显示英国的陆地钻孔分布,用户可点击任意钻孔,获得在线的钻孔扫描文件。网站加载了超过一百万条的陆地钻孔、井眼、井筒和井的数据。地震年表模式显示英国1956年至今每年的地震信息,包含了震中、震幅和震时,由英国地震监测机构实时提供。
英国地质查看器的三维版本尚处于测试阶段,提供可见地下基岩分布的3D浏览模式、仅见地表覆盖与地上岩石的地球仪浏览模式以及二维浏览模式,每种模式下都可点击了解任意一点的地质信息。同样也提供地质、钻孔分布、地震年表三种数据模式。
3.1.2 地质索引GeoIndex
GeoIndex是基于地图的数据集检索工具,它以地图作为检索基底,用户可自行在上添加开放地学上的各类数据集。GeoIndex按照地理范围分为两个相对独立的部分,陆地(Onshore,图6a)和海洋(Offshore,图6b)两者各自都可引用数十个数据集,包括各类地学信息,如钻孔、地震、滑坡、化石、水文地质、岩石样本、地球化学和地球物理等,其中的数据每月都在更新。在网页界面上,用户可以输入地点后导航到感兴趣的地区,添加需要的数据集,查看地区内的数据集信息,通过调节数据集图层的显示透明度,可将数据集信息进行不同程度的叠加,生成定制化的地学信息图,在“打印”栏形成地学索引报告(GeoIndex report)方式的文档。用户还可以进一步框定感兴趣的区域,查看、下载该区域的数据,或者与之前的信息图一起形成更为详尽的报告。
3.1.3 地下水位变化图Groundwater levels timeline
地下水位变化图可查看从1970年至今英国不同地区每月的地下水水位情况,从极高到极低分成7个等级,分别用不同颜色的圆点标识,还可以点击圆点查看具体的水位数据。图上还重点提供了1976年以来的几次重大干旱与洪水时期的地下水位视图,所显示的观测点数据比其他时间要丰富。此项功能可以在移动端上使用。
3.1.4 英国土壤信息站UK soil observatory
图5 英国地质图查看器二维版及其3D模型数据模式(图a为约克地区内的3D模型数据模式展示区域,红色点为虚拟钻孔孔心;图b为形成的虚拟钻孔)Fig. 5 Geology of Britain viewer under 3D model mode (a) and an example of a virtual borehole in York area (b)
英国土壤信息站是一个独立的数据网站,汇集了九个研究所提供的英国土壤类型信息,整体由英国地调局开发和支持,在“开放地学”上提供的链接是它的地图检索网页(UKSO Map viewer),支持在移动设备上使用。这个数据网站以托管的形式存在于英国地调局网站中。网页也有2D和3D两种版本,提供6种底图,分别是地形图(Topographic)、街道地图(Streets)、开放街道地图(OpenStreetMap)、有标注的卫星图像地图(Imagery with Labels)、有标注的地形图(Terrain with Labels)和空白地图(Light Gray)。在底图上通过加载不同信息的图层,如英国农业信息、英格兰地区作物信息、土壤多样性等等,可以得到各种与土壤信息有关的数据分布,并且还可以按照需求自行添加外部图层。用户还可以对数据进行补充和修改,通过单击“添加土壤数据”,填写相关信息并提供支撑材料,管理人员验证之后,更新的数据就可以在网站上显示。
图6 GeoIndex平台界面Fig. 6 The interface of GeoIndex.
3.2 移动端应用
iGeology是英国地质调查局开发的一款智能手机应用程序,可以在手机上访问英国地质调查局内的地图和寻找其他的地质信息,该程序支持iOS系统, Android系统和Kindle Fire平板。自2010年底推出以来,iGeology已经被来自56个国家的用户下载了6万多次,并在2010年9月成为iTunes上排名第一的免费教育应用。2011年7月,在圣地亚哥举行的ESRI国际会议上,iGeology荣获最受社区欢迎应用奖(Community Favorite Award Best Mobile App)和最佳应用第三名(Third-Place Best Mobile App)。iGeology相当于移动端的英国地质图,它有三种地质图层可进行选择,包括基岩和地表沉积相结合、仅基岩或仅地表沉积的图层。选择了图层后,可叠加钻孔信息层、线性特征层等。钻孔信息层包括超过一百万条的陆地钻孔、井眼、井筒和井的数据;线性特征层包括特殊的地质特征、构造或者边界,例如,断层和褶皱轴。添加相应的图层之后,用户可以输入或点击研究地点以获取数据和信息。此外,iGeology在用户互动方面极具亮点,地学专业人员可以贡献自己的地质观察资料,经过专家勘验后能在地图上对有关信息进行修订。其他业余爱好者也可以向iGeology提交相关照片。在注册账号之后,用户可以保存下载和曾提交的信息。
除iGeology以外,英国地调局还与生态与水文中心、欧盟委员会联合研究中心和英国气象局合作开发了mySoil,为农民、园丁和土地使用规划者提供更好的土壤信息。应用程序mySoil提供整个欧洲的土壤属性图,与英国土壤观测站一样,主要包括温度、PH值和优势作物信息。他们与美国著名的史密森博物馆(Smithsonian Institution)共同开发的MyVolcano,是一个面向公众的应用程序,用户可以上传火山的相关照片和描述,可以用于共同监测全球可能的火山灾害。MyVolcano现有1553个火山点数据和179个相关描述。
3.3 软件Software
英国地调局开发了许多软件工具,通过建立地学方面的模型,来更加深入地理解地球系统的运作。开放地学的软件模块包括四部分,地下水位时间序列模拟模型AquiMod,地下水流量模拟模型GISgroundwater,地质制图集成包BGS·SIGMA和虚拟钻孔和剖面创建软件Groundhog。其中,BGS·SIGMA是一个制作数字化地图的集成工具包,该软件通过使用定制的数据模型和预定义的词典,以标准化格式收集数据。并通过使用定制的数据输入表格,收集各种地质信息、照片、草图和注释,并且可以将所有数据都链接到地图上的相应数据点位。BGS·SIGMA有移动端(Mobile)和桌面端(Desktop)。用户可在野外使用移动端,标定现场点位并链接捕获的数据,回到室内,将数据上传数据库中,用于绘制地图。随着BGS·SIGMA的不断发展,采集的数据不仅可以用于绘制地图,还可以3D可视化软件(例如,GeoVisionary)和Groundhog绘制虚拟钻孔和剖面。虚拟钻孔和剖面创建软件Groundhog主要提供3D地质模型展示,目前暂停服务。
3.4 网络服务技术 Web Service
网络服务技术是基于标准的开放互操作技术,标准是实现跨系统、跨平台互操作的灵魂,其思路是共同制定一系列相关标准。这些标准并不规定各单位如何存储他们的数据(每个单位都可选择最适合自己单位需求的方式),而是规定标准的外部接口(姜作勤,2007)。英国地调局内的网络服务主要由三部分组成,网络目录服务(Catalogue Wervice for the Web,简称CSW),网络地图查看服务(Web Map Service,简称WMS),网络要素下载服务(Web Feature Service,简称WFS)。这几类网络服务技术的标准是由开放地理空间信息联盟(Open Geospatial Consortium, 简称OGC)制定。这些网络服务技术也有助于英国地调局满足欧盟的INSPIRE指令。INSPIRE是加强欧盟各部门之间环境空间数据共享的一项法案。
CSW提供基于标准的界面,以发现、浏览和查询有关英国地调局的数据集和元数据。WMS是从地理信息中动态产生具有地理空间位置数据的地图。WMS产生的地图一般以图像格式提供,如PNG、GIF 或JPEG;或按SVG(Scalable Vector Graphics)或WebCGM(Web Computer Graphics Metafile)格式提供基于矢量的图形元素。WFS为浏览器提供经过地理标记语言(GML)格式封装的地理空间数据,支持对地理要素数据的插人、更新、删除、查询和发现等操作。用户可以利用标准的网络服务技术,将数据通过混搭的方式集成到自己的GIS系统中。
英国地调局内支持链接到WMS的网站上进行使用的地图相关数据集一共有九类,分别是1∶5万的英国陆地地质数字数字地图,1∶62.5万的英国陆上和海上基岩和表面沉积物地质图,1∶25万比例的近海地质图,1∶5万的高分辨率地面稳定性数据样本,土壤特征数据,英格兰和威尔士土壤地球化学图集,康沃尔郡以及德文郡和萨默塞特郡部分地区的地球物理数据,英格兰北部地区的地球物理数据,GeoIndex的数据集,英国土壤数据中污染物浓度数据,放射性元素氡的分布图数据集。用户可以通过WMS的网站将这些数据集加载到自己的制图软件(GIS系统)中,从而可以对来自不同提供商的数据进行空间可视化和比较。
用户可以链接到WFS的网站进行使用的地图相关数据集目前有两个,分别是1∶100万的OneGeology世界范围内动态数字地质地图数据和1∶62.5万的英国陆地基岩数字地图数据(Jackson, 2009)。
4 地球科学大数据的管理与共享
英国地质调查局悠久的数据采集历史为其建设地学大数据奠定了良好的基础,而同时他们在科技和数据管理方面及时接纳新理念才是形成开放地学的根本。数字化工作同时也为他们与国际众多地学机构和大数据研究机构之间创造了广泛的合作机会,也开启了建立全球地球科学数据共享网络的进程。如今人类逐步步入大数据时代,也经历着类似的数字化变革,而英国地调局的数字化工作正是其他地学机构可以取用的他山之石。他们的工作是“深时数字地球”(Deep-time Digital Earth,DDE)国际科学计划的重要参考,是建立一站式全球地球科学数据汇集、服务、应用平台的良好模板(Normile, 2019)。
英国地调局的优质数字化经验可总结如下:
(1)在数据管理方面,线下的地质资料库和线上的地球科学数据中心相辅相成,共同管理实物资料和数据资源。在此基础之上,做到资料库的数据资源均入库管理,并入统一的数据资源平台——开放地学中。
(2)在数据共享方面,所有数据资源汇集到开放地学之后,还通过不同的共享和信息服务方式,例如在线查看器、应用程序、软件和网络服务等等,将所有的数据集有机链接在一起。最为重要的是,网站的所有数据集均可以在地图上展示,并形成定制的地学信息图。三维模型的使用,使得数据得到更高效的扩展,形成数据+模型的体系,提供了全新的地质图展示方式,更加全面、精准地表达了地质体信息。
“深时数字地球”国际计划旨在建立全球地学大数据的集成,有效促进知识共享,开展数据驱动下的新型地球科学研究。此计划将实现在三维地质体信息的基础上,加载高精度时间轴,以更高维度的方式展示深时地球演化历史,为广大地学科研人员深入探索地学奥秘提供新的视角。 英国地调局国际一流的地学大数据管理和共享经验,为我国在国际舞台引领“深时数字地球”国际科学计划提供了可贵的学习案例。
致谢:本文系“深时数字地球”(Deep-time Digital Earth)大科学计划系列成果之一。