高效利用大数据资源促进生物多样性保护
2019-05-31张文娟中国生态文明研究与促进会
文/张文娟 中国生态文明研究与促进会
我们正处在一个信息爆炸的时代,随着技术的进步和智能监测的发展,同时伴随着越来越多的人正在加入到现代化公民科学行列,人类社会已经在集体生产生态学大数据了。海量的生物多样性数据和生物资源本身一样,是国家重要的资源,我国是生物多样性信息学发展比较好的国家,但信息资源整合度低,信息数据碎片化、共享程度有限,阻碍了信息的深度挖掘和有效利用。整合多元异构数据资源,促进信息的深度挖掘和有效利用,是当前亟需解决的现实问题。
生物多样性研究存在知识空缺
世界自然保护联盟(IUCN)半个多世纪前开始的《濒危物种红色名录》评估工作,有力地推动了各国生物多样性保护的进程,得到了国际认可。基于该机构的评估方法,结合自身国情,我国于20世纪80年代,先后启动了植物和动物红皮书的编写。2004年起出版的《中国物种红色名录》,为我国当时濒危物种的研究、教育和相关保护政策的制定提供了最新、最可靠的依据。
从2007年开始,中科院生物多样性委员会组织院内外分类学专家编研《中国生物物种名录》,并从2008年起以年度名录的形式每年更新和向社会公开发布,为全球使用者提供实时在线的中国动物、植物和微生物等生物类群的分类和分布信息,中国也成为世界上唯一一个连续多年发布年度生物物种名录的国家。
与此同时,为全面掌握我国生物多样性受威胁状况,提高生物多样性保护的科学性和有效性,原环保部于2008年联合中国科学院启动了《中国物种红色名录》升级版—《中国生物多样性红色名录》的编制。历经多年,《中国生物多样性红色名录—高等植物卷》和《中国生物多样性红色名录—脊椎动物卷》在2013年9月和2015年5月分别正式对外发布。2018年5月,生态环境部又和中科院共同发布《中国生物多样性红色名录—真菌卷》。这是我国首次采用IUCN标准对大型真菌的受威胁状况进行的一次全面评估。
法国作为仅次于美国的农业大国,它的农业极度发达,是世界主要农业大国。主产小麦、大麦、玉米和水果蔬菜。
除了《中国生物物种名录》《中国生物多样性红色名录》,近年来,国家动植物种质资源共享平台、国家标本资源共享平台等也陆续完成。
有关生物多样性的这些研究成果为相关主管部门和地方政府制定物种保护相关政策和规划提供了依据,对我国生物多样性保护与管理产生了深远影响。比如,物种名录查明我国已知脊椎动物、高等植物和真菌的种的本底状况、受威胁程度及分布差异,确定了各个大类群的濒危状况和保护等级,分析了濒危物种灭绝的原因,就可针对受威胁物种的地理分布和种群现状,制定和完善自然保护区规划,合理调整原有自然保护区的面积或功能区,根据需要在物种集中分布区或分布点建立新的自然保护区或保护点。对于那些就地保护不足以达到保护目标的物种,可采取迁地保护等辅助措施,或将其移入动植物园进行繁育,或保存在国家种质资源库中。
尽管已积累的生物多样性数据足够丰富,但生态学家们依然对缺乏高质量生物多样性数据感到苦恼。
研究指出,当前全世界在生物多样性方面都存在着知识欠缺,主要包括七个方面:一是新物种的发现,二是已知物种的地理分布,三是种群数量与时空动态,四是物种进化史,五是物种功能形状,六是物种与环境之间的关系,七是物种之间的相互作用。这些空缺导致我们当前的生物多样性研究只能限制在一些特定的区域,特定的生物有机体,特定的环境条件等,基于某一个区域的或类群提出的理论或假说难以在其他区域或类群进行验证,这极大地限制了生物多样性研究,让决策者做出科学的判断。
大数据为弥补知识空缺提供了可能
2019年1月发表在《自然植物》杂志上的一篇文章提出行动号召,敦促人们利用大数据解决长期存在的、有关植物多样性和进化的问题。科学家们认为,利用大数据在全球范围内解决主要的生物多样性问题具有巨大的实际意义,从保护努力到预测和缓冲气候变化都将产生巨大的影响。
的确,我们现在看到的大数据资源之间的联系是不可想象的。几个世纪以来,全球收集了数十亿个标本及其相关数据,其中大部分现在可以在网上找到。远程传感器和无人机等新技术使科学家能够监测植物和动物,并实时传输数据。公众通过记录和报告他们通过数字工具(如iNaturalist)的观察结果来贡献生物数据。这些数据资源为科学家和自然资源保护者提供了关于地球上生命的过去、现在和未来的丰富信息。
荷兰设施农业园区采取精准化的供水控制系统,按照作物的生长周期调整供水量,并且可以在1天时间内按照太阳辐射情况及时调整供水量,既能够保证作物生长的需要,又能够避免过度灌溉造成水资源浪费。
目前,大数据的挖掘及其应用已经成为国际生物多样性研究的前沿内容,全球和区域水平的生物多样性数据库不断建立和完善,例如,全球生物多样性信息网络(GBIF)等全球大型数据库包括10亿多条物种分布信息。若干国家的数据库,如澳大利亚生物多样性信息系统和美国标本数字化平台,也可以提供数千万条物种分布信息。我国自2003年开始建立的国家标本资源共享平台,包含植物、动物、岩矿化石和极地资源在内的标本照片、名录、和文献等信息,目前数字化标本总量也已经超过1200多万份。
基于这些海量的,高异构性的数据,生态学家们已经开展了一些突破性的工作,内容涉及到生物多样性研究的多个方面:
基于数据分析全球无路地区生态价值。德国埃伯斯瓦尔德可持续发展应用技术大学的Pierre Ibisch带领着国际研究团队,利用自由地维客世界地图上超过3600万公里道路的数据,绘制了地球上除了格陵兰岛和南极洲以外所有无路地区的地图。由于污染、噪音、水土流失、人类造访日渐增多,以及害虫和入侵物种的运送,道路的影响远远超出其实际面积,因此研究团队把距离公路至少一公里的地方都算作是道路覆盖区域。他们计算得到的结果是:全球共有1.32亿平方公里的土地,其中约1.05亿没有道路覆盖。研究者完成无路地区域绘制后,根据碎片区的范围、生物多样性和对生态系统的重要性,判定了它们的生态价值。大多数无路地区面积都很小,在60万个碎片区里,有半数不到1平方公里,80%小于5平方公里,只有7%大于100平方公里。四分之一的无路地区人烟稀少,寸草不生,基本上是一片荒芜之地;三分之一是牧场。当然大面积无路地区中也有一些郁郁葱葱、生物种类繁多的地方,比如亚马逊和北美的北方森林。研究者发现,目前只有9.3%的地方得到了国际保护力量的保护。随着关于道路负面影响的科学证据越来越多,他们认为应该优先保护地图上最具生态价值的无路地区。这篇文章2016年12月15日发表在《自然》杂志上。
基于大数据分析森林生产力与物种多样性之间的关系。美国西弗吉尼亚大学的梁晶晶教授等研究者,收集了来自44个国家及地区、横跨13个不同生态区域的77万多个全球森林多样性样地(global forest biodiversity plots)的数据来进行统计分析。这77万多个样地数据涵盖了231个科、1862个属中的8737个树种。对于每一份样地数据,研究者都从中提取出三项关键特征:树的种类丰富度、林分断面积、初级生产力,在此基础上,他们引进气候、土壤状态、降水等一系列其他变量,建立了一个幂函数模型来反映生物多样性与生态系统生产力之间的关系。如果全球性的树木物种减少10%,那么森林的生产力会下降2-3%;而如果在比较极端的情况下,树木只剩下一种了,那么哪怕全球的树木总数维持不变,森林的生产力也还是会下降26%~66%。研究者特地估算了生物多样性在维持森林生产力方面的经济价值—相当于每年1660亿到4900亿美元!他们得出结论:物种多样性的持续缺失会加剧森林的生产力(即生物量的产生速率)衰退,保护物种多样性作为一种防微杜渐的预防手段,是具备极高的经济价值的。这篇文章发表在2016年10月的《科学》杂志上。
近年来,利用大数据研究分析为生物多样性研究做出的判断,正在逐年增多,内容涉及到土地利用和覆盖变化、气候变化、城市化等对生物多样性的影响,物种进化历史,物种灭绝风险评估与预测,生物多样性与生态系统的功能关系等,这些研究案例展示了大数据在生物多样性研究中的巨大潜力,为弥补生物多样性性知识欠缺,驱动更具创新的科学发现提供了各种可能性。
整合多元异构数据资源促进信息深度挖掘和有效利用
生物多样性信息数据是国家的重要战略资源,也是国家生态安全和生态文明建设的重要保障。生物多样性领域多层次、多维度的大数据汇聚与综合分析,正在改变着人类对自然的认知方式和资源利用能力。
作为科学研究的新范式,大数据正在改变着人们的思维方式,促使生物多样性研究不再仅仅满足于数据的采集、处理、保存和共享,必须迈上一个新的维度,研究需要回答一些基本的问题:是否能够基于各类数据的分析,驱动更具创新的发现;是否能够提供可视化、标准化的服务,为政府决策做科技支撑;是否能够提供共享程度更高的数据产品,服务于科普教育和提升公众文化水平。
生命科学领域多层次大数据汇集、深度分析,以及通过科学交叉与生态、地理、遥感、环境等数据的融合,为更具创新的发现提供了种种可能性,面对不断加剧的人类活动和日益严峻的生物多样性保护趋势,是时候行动起来,用大数据的思维方式去推动变革,但是,仍然面对着各种挑战。
最困难障碍之一,是如何使属于不同的组织、机构的数据库能够顺利地相互协作,毕竟,全世界不同国家,不同组织和机构建立的各个生物多样性性系统中的数据,通常以完全不同的方式收集,将这些集成起来,实现无缝连接,是一个重大挑战。
仅以中国科学院系统为例,多年来,中科院积累了大量生物物种(包括古生物)和遗传信息资源,野外台站和大样地监测体系,以及庞大的国际合作网络,并且已经建成全球最大的古生物学与地层学专业数据库,国家标本资源共享平台,世界微生物数据中心,中国生物物种名录,中国生态系统评估和生态安全数据库,中国生态系统研究网络和中国森林生物多样性监测网络等一系列信息不断更新的大数据平台,全面整合这些生物、生态与社会经济和环境信息资源,就是一项重大的工作,目前,中国科学院已经在推动中国生物多样性大数据平台建设,并已经有了基本的架构。
据了解,中国生物多样性大数据平台建设将聚焦服务国家资源的应用场景,形成多层次的栅格化的数据图层,利用分析模型和可视化技术实现对生物多样性数据资源的挖掘和利用,构建开放开源的生物多样性与生态安全大数据处理利用的通用接口,实现生物多样性资源和有效管理,保障国家生态安全,支撑国家公益性科学研究和产业创新,促进生物多样性信息最大限度地整合、分析、评价、保护和利用,为生物多样性科学发展和科普教育,履行《生物多样性》公约,国家生态承载能力评估和生态安全格局构建强有力的支撑和服务。
但是,生物多样性数据的高异构性和动态性仍然是我们面临的巨大的挑战,为了应对这一挑战,需要更高层次的顶层设计和协同创新,促进地理、气象、遥感、环境、国民经济等跨领域的数据融合,驱动大数据时代生物多样性研究的合作与发展,从而促进交叉学科前沿领域科学发现和产业创新,构建我国生物多样性资源保护和生态格局,为保障国家生态安全做出努力。