浅析表生地球化学数据库及大数据研究进展
2021-01-17吕允奇河北省水文工程地质勘查院
吕允奇 河北省水文工程地质勘查院
对于地球表生化学的研究范围其实是非常广泛的,会涉及气候的演变过程、农业领域、环境科学、地震规律、微生物科学等等。还包括有机物在地球浅部位置的演变以及在形成岩石的早期过程中,各类地表生物的化学动力学、煤油形成的具体原因等等。站在地质地球化学的研究角度来看,相对狭义的表生地球化学研究在学术的研究范围上则会缩小很多,其主要的核心研究目标应该为研究各种各样的元素在地球表层的迁移以及演变过程。下文将对该方面的研究作出相应的分析和归纳。
一、表生地球化学的研究对象
关于地球表生化学的研究可以说是在地球化学研究中,一类研究历史较为久远,同时又比较崭新的一类学科,该学科的主要研究内容为研究在地表景观中各种化学元素的实际迁移过程,以及迁移的具体机制。在表生地球化学的研究中,研究的范围也是十分广泛的,研究的具体对象为地球上的表生带。曾有相关的研究学者认为,地下潜水面以上和下方的一小部分都应该归属于表生作用的具体范围,过去几年,曾有学者认为,表生作用主要可以分为上部和下部两个地带,地下水的潜水面上部分属于原生作用的氧化改造带,而地下水面下方的一小部分,也就是200-300 米的位置之内都应该归属于表生作用的还原改造带。
一般情况下,表生地球化学的研究主要为研究各种元素在地球表生带的详细分布状况,还包括元素的迁移规律和迁移机制等。表生成矿地球化学是表生地球化学的其中一个研究领域。由于表生地球化学环境相较于内生来说,会更加的复杂且烦琐,表生地球化学研究是具备非常多学科的,会涉及地理、化学、微生物学以及气象学等等,重点研究的是表生带常温以及常压情况下,有水参与其中的地球化学,也就是“外生的或者低温的有水参与到其中的地球化学”涵盖了处于地球表面的大气层、生物圈以及海洋等等,以及跟海水进行接触的各种岩石所能够发生的化学反应,其中,尤其以出现在各类界面中的化学反应为主,也被人称之为常温水岩体系地球化学。常温富水环境下针对原生的岩石进行改造是表生地球化学在作用上的基础问题。表生地球化学主要指大气圈和生物圈等等互相作用的情况下的一种地球化学,该学科包括风化的淋滤作用,以及海水沉积等等,这个定义具备一定的普遍适应性,能够包括广义上和狭义上的表生地球化学研究,表生作用体系所身处的化学环境和内生地球的作用体系是完全不一样的。
二、表生地球化学的研究对象方法
关于地球化学的研究,是跟整个地球科学领域一样在时刻发展以及进步的,而针对表生地球化学的研究也正在从传统的静态定性描述逐渐的转变为动态化的综合性系统研究,也就是进入到了模式化的研究阶段。福蒂斯丘曾经提出关于地球化学的环境地球化学整体论方法,和环境地球化学哲学的四类分级组织,也就是空间等级层次和时间等级层次等等,对于全球研究学者在表生地球化学上的研究来说具备非常重要的意义,能够给他们以参考和依据。不管是站在宏观还是微观的角度上,进一步深刻研究关于地质演变过程中的内在动力机制和外在表现模式,同时在研究和发展的过程中不断地提出相应的假设、猜想以及建立模式,在不断的论证以及实践当中去对其进行完善和优化,表生地球化学的相关研究也是不例外的,在传承元素化学科学传统研究方式的基础条件下,需要加强对地理学、生态学等相关学科的借鉴,在研究过程中不断地引入系统论以及信息论等较为复杂和烦琐的研究理论,综合高新技术以及大数据技术等等,更加细化和全面的去展开表生地球化学的研究。现阶段关于地球表生化学的研究方式主要分为以下几类,分别为:勘查地球化学研究法;分析检测以及实验模拟法;土壤、地理学、农业等相关学科的研究方法;高新技术研究方法、非常规研究方法。
三、表生地球化学数据库现状
表生地球化学数据主要是分为两种。首先是结构化数据,这些结构化数据大多数的来源是国际上以及个别国家的研究机构所获得的科学研究成果,这些数据具备较为明显的结构化特点,通常都是由表格的形式来进行体现,同时始终秉承着方便利用、方便索引、方便引用的原则,数据的整体质量比较高,同时会被很多的研究学者进行引用,相对来说,数据整体比较成熟,同时具备一定的权威性以及公信力。另外一种就是长尾数据,长尾数据主要指的是分布在海量研究文献数据库中的半结构化以及非结构化数据,整体的数据独立性是比较高的,虽然个别的数据库已经针对发表完成的文献研究进行了相应的收录以及汇总等等,但是不同类型的文献在数据格式在也存在一定的差异性,需要对其进行进一步的资源整合,确保其标准化,这样才能运用到大数据的分析以信息资源的发掘工作中。另外,表生地球化学的文献数据库比较丰富多元化,根据具体的研究对象能够将其分为海洋地球化学、环境地球化学、考古学以及全球变化科学等,在不同的数据库中,在研究目的上也存在不同,基于这些研究目的的多元化数据,需要对其进行进一步的识别。
(一)地球化学标准物质数据库
地球化学标准物质数据库是马克思·普朗克研究所进行开发的,并由他们自己进行维护,主要是为了储存具备价值和意义的标准物质测试值,例如一些岩石的粉末和矿物质以及生物样品等等。地球化学标准物质数据库截至2020 年的11 月份为止,共计收录了11340 篇研究论文,并在数据库中提交了50410 种物质分析,还包括一些非常具备价值的元数据,举例来说,不确定性、测试实验室等等,还能够给相关的研究学者提供各种物质的信息,以及进行整合的重要参考值,对于表生地球化学指标测试以及分析工作来说,是一个非常重要的数据参考来源途径。
(二)地球科学综合数据库:以PANGAEA 为例
将PANGAEA 作为主要代表的数据库,在其发展的过程中,逐渐地从单一性的专题类数据库进行转变,实现了非常大的进步。其实在很多数据库的发展过程中,通常都是起步较早且实力较为雄厚的数据库其中包含的数据比价丰富多样,在运转模式以及数据标准化建设上也具备更多的经验。
PANGAEA 的信息系统,能够针对个人以及组织进行长久的开放,主要目标为对各种研究地球化学的文献资料进行收录和整合。只需要遵守该数据的要求即可,随后在顺利登陆之后,就能针对其中的文献进行相应的下载。截至2020 年的11 月为止,PANGAEA 已经收录了477 个关于地球化学的研究几哈,399283 个数据集,测试数据超过了170 亿条,包含了地理、生物、古生物、大气等多个学科领域的研究专题,同时PANGAEA 还可以根据用户的需求,针对作者以及测试项目等进行相应的筛选。
(三)海洋地球化学数据库:以GEOTRACES 为例
关于海洋科学的学术研究可以说是目前实现科研全球化的重要体现,GEOTRACES等数据库在长时间的试验以及检测样品的过程中,使得全球针对海洋物质循环上的认知不断刷新。GEOTRACES 是一个专门进行海洋生物地球化学研究的国际性研究计划,其研究的主要目标是为了了解关键痕量元素和同位素在海洋中的分布状况以及循环规律等,其中的重要参考指标包含了Fe、Cu、Cd 等具备营养的化学元素,还包括各种容易受到人类生产经营活动影响的污染物元素等等,使得全球在海洋生物化学指标上的研究数据得到了创新性的突破。共有大概35个国家参与到了该计划的研究中,而该计划的研究目的是为了在未来的十年之内,将关于海洋科学的研究覆盖到全球的所有大洋盆地中,同时在大洋内循环、全球变化指标以及大洋水汽及水岩界面反应及通量这三项研究中,获得全新的进展。
(四)全球变化科学数据库:以PAGES为例
全球变化科学主要是对整个地球的系统性行为展开相应的研究,探索和了解地球这个庞大的系统在过去、现在和未来是如何变化的,以及变化的控制因素,并由此为后续的地球系统管理提供更加真实有效的参考依据,跟全球人类文明的发展来说具备非常重要的现实意义。
PAGES 数据库目前正在逐渐解决全球变化科学研究数据出版系统数据量过大同时大面积引入数据带来的质量失控问题,对于全球变化的研究发挥出了关键性的作用。该数据库的建立是由瑞士的科学院以及我国的中科院共同资助的国际性合作项目,建立PAGES 数据库的主要目的是为了在全球变化的学术研究上能够更加地协调,同时促进研究进展,更加深刻的掌握地球的环境转变过程,以便于对环境和气候温度等进行科学合理的预测,为全球的可持续发展作出更加合理的研究。PAGES 数据库在这些年的发展过程中,获得了非常显著的研究成果,在库中积累了大量的研究数据,数据来源主为发表的文献资料以及会议报告等等,具备非常高的更新频率。还包括一些专题工作研究小组,其主要的工作目的就是为了整合以及构建大型的地球化学研究数据库。包括在地球的不同时期,地球上的气候温度、降水状况、地质载体元素以及同位素组成等等。其中,更有SISAL 工作小组在研究过程中逐渐地实现了洞穴次生碳酸盐数据库的转变,将各类分散性的非结构化数据逐渐的转变为了结构化数据,实现了地球化学研究的全新突破。
四、结语
综上所述,虽然目前全球性的表生地球化学学术研究在数据库上不缺乏,但是由于该学科的研究比较复杂,研究范围也比较广泛,在数据上比较丰富多元化,横跨多个学科领域,需要站在大数据资源的角度上,通过大数据来解决各种学术研究问题,进一步强化数据库的标准化,实现表生地球化学研究的全新进展。