APP下载

生物物种信息平台建设进展研究

2014-01-31郑明清黄明祥曾剑峰

中国环境管理 2014年6期
关键词:标本物种数据库

郑明清 黄明祥 于 淼 曾剑峰 孙 强

(环境保护部信息中心,北京 100029)

生物物种信息平台建设进展研究

郑明清 黄明祥 于 淼 曾剑峰 孙 强*

(环境保护部信息中心,北京 100029)

信息技术的突飞猛进和互联网的迅速扩张,为生物多样性信息的收集、存储、提交、检索、分析、传播和使用带来了革命性的发展。生物多样性数据和信息服务的内容逐步从单一的名录数据库建设转向为多学科交叉的综合信息服务平台。本文结合国家生物多样性保护专项,在介绍国内外主流生物多样性信息平台建设现状的基础上,分析了我国现有平台存在的问题,并对下一步如何完善和推进平台应用进行探讨。

生物多样性信息,数据库,网络平台,信息化

当前,世界各国信息化快速发展,以宽带、移动互联网、物联网、云计算、大数据和智慧城市为重点的信息化建设,正在对人类社会发展、经济运行、生活提高、治国理政的模式产生根本性、全局性的影响,冲击全球。信息技术的突飞猛进和互联网的迅速扩张,例如,虚拟化存储、分布式数据库技术和开放性数据共享平台,为生物多样性信息的收集、存储、提交、检索、分析、传播和使用带来了革命性的发展(Paton,2009)。

生物多样性信息学指利用信息技术,对生物有机体基础数据的管理和算法的探究、分析和解释,主要关注单个有机体、居群和分类群以及它们的相互关系,尤其是在物种水平上的应用(王利松等,2010)。自1992年环境与发展大会召开以来,各国政府、从事生物多样性保护的科研单位和国际组织普遍提高了对生物多样性信息收集和管理的重视程度,设计开发了大量的联网数据库和网站,尝试建立《生物多样性公约》所要求的资料交换所机制,或者提供生物多样性研究的基础数据,为保护的决策行动提供了科学的支持,为全球范围内的生物多样性保护和履行《生物多样性公约》做出了巨大贡献。生物多样性数据和信息服务的内容逐步从单一的名录数据库建设转向为分类学、系统学、生态学、进化生物学和生物地理学等多学科交叉的,海量多源数据挖掘、分析、建模、存储、集成和发布的综合信息服务平台(许哲平等,2010)。

作为世界上生物多样性最为丰富的12个国家之一,我国在生物多样性网络平台建设和软件平台开发应用方面做了大量工作,为生物物种多样性信息化建设打下了基础。但在系统应用推进过程中也存在一些亟待解决的问题。为优化环保部生物物种资源管理平台建设,环保部信息中心对互联网相关生物多样性信息平台进行了调研,对平台方面遇到的共性问题进行了归纳,并对下一步如何完善和推进平台应用进行了思考。

1.国际生物多样性信息网络数据库现状

目前,生物多样性信息系统的建设越来越呈现出百花齐放的景象。世界各国及国际组织根据自己的特长和特色,建立了形式多样的信息系统。据生物多样性信息学标准(Biodiversity Information Standards)网站统计,截至2014年5月22日,涉及生物多样性信息学研究的项目即有685个(www.tdwg.org/biodivprojects/)。生物多样性信息平台的爆发式增长,使得大量数字化的物种编目、标本馆标本、多媒体影像、研究文献等生物多样性基础信息可以通过互联网检索和利用(王利松等,2010),为我们未来在全球范围内共享生物多样性数据和信息,协同调查与监测野外生物多样性动态变化提供了有力支撑。

国际上对生物多样性数据库非常重视,最早的分类学数据库可以追溯到20世纪70年代美国弗吉尼亚海洋科学研究所开发的Biota of Chesapeake Bay数据库和澳大利亚联邦科学与工业研究组织开发的Description Language for Taxonomy系统。目前国际上比较著名的生物多样性信息平台有:

物种数据库(www.unep-wcmc.org)包括了世界受威胁树木名录、受威胁动物红色名录、世界受威胁植物和北极鸟类书库等数据库。植物部分的工作开始于1995年,截至到1998年共收录了136000个分类单元的记录,内容包括学名、俗名、同物异名、全球受威胁程度、分布国家和地区及受威胁程度、CITES附录等级数据。

国际物种信息系统(www.worldzoo.org)是一个全球范围的关于城市动物园和水族馆饲养动物信息的联合体,共有54个国家的500多个组织参加。它的数据库收集了各动物园和水族馆所饲养的活的动物信息。目前它保存了6000余个物种、250000个个体以及750000个亲体的信息,可以联网查询每一个物种现在的饲养数量、性别、出生数量和地点,为濒危物种迁地保护、野外灭绝物种的保存和野外释放提供了科学数据。

世界资源研究所(www.wri.org)提供了全球生物多样性论坛的信息,同时它还提供了生物多样性基础性知识,如生物多样性的定义和重要性、自然资源与生物多样性、遗传多样性、生态系统和生境、文化多样性、森林资源、海岸和海洋资源、生物群区管理、全球生物多样性策略等。在这个网站上还有生物多样性受威胁信息和保护指南、图片和出版物,以及WRI履行《生物多样性公约》活动的信息。

全球生物多样性信息网络(www.gbif.org)是目前全球最大的,由多国政府支持的生物多样性信息服务机构,其主要任务是通过合作和种子基金等途径促进生物多样性原始数据的共享,将世界上现存的生物多样性数据库、信息系统整合在一起,形成一个面向全世界用户的关于全球生物多样性的综合性信息服务系统。

2.国内生物多样性信息平台建设现状

我国生物多样性研究具有良好的基础,中国科学院、环保部、国家林业局、农业部、教育部、国家海洋局等单位在生物多样性研究及其相关领域都有长期的工作积累,并有一支素质较高、结构合理的研究队伍。20 世纪五六十年代开始开展大规模的生物多样性调查,调查成果为植被志、植物志和动物志等各类志书的编写奠定了基础;90 年代以来又对重点地区、重要类型资源展开调查,研究了濒危等级评价体系,完成了野生动植物物种濒危等级评价,开展了生态系统濒危等级示范评价;在迁地、就地保护方面也取得了重要进展;发布了一系列相关保护规划等文件。上述大量的生物多样性及其相关领域的信息为中国生物多样性信息系统的建立奠定了坚实的基础。

2.1 物种名称索引类信息平台

物种2000中国节点(www.sp2000.cn/joacn/index. php/)是国际物种2000项目的一个地区节点,是由中国科学院生物多样性委员会支持建设,包括动物界,细菌界,色素界,植物界,原生动物界,病毒界六类物种名录信息。其年度名录通过门户网站的集中数据

实现,动态名录通过各个机构支持的分布式数据库实现。在物种2000中国节点的网站上,还提供全球生物物种名录的镜像数据库,通过中英文界面为用户提供全球的物种名录信息。物种2000中国节点自2008年开始,每年编辑并正式发布中国生物物种名录,中国也因此成为目前唯一一个正式发布、定期更新生物物种名录的国家。

中国生物多样数字图书馆(www.bhl-china. org/bhl/)是国际生物多样性历史文献数字图书馆(Biodiversity Heritage Library,BHL)中国节点。BHL于2005年建立,迄今已经在全球建立BHLUSA,BHL-Brazile,BHL-Egypt,BHL-AU,BHLEU,BHL-SA与BHL-China7个节点。旨在通过与BHL合作,联合其他生物学研究(院)所,共同建立BHL-China网络平台,对重要生物多样性(前期重点是植物学)文献进行全面收集、扫描、重要生物学信息提取和系统整理,建立可供查询的我国生物多样性信息咨询和交流的网络平台,同时开发各类API接口,为生物多样性(包括EOL中国节点、CVH等)及其他相关领域研究提供文献数据服务。

中国植物物种信息数据库(www.botanica.cn)由昆明植物研究所、植物所、武汉植物园和华南植物园联合建设,以中国高等植物为核心,采集、集成、整合现有的各相关数据库,共涉及高等植物约300余科3400余属31000余种,其数据内容主要包括:植物物种的标准名称、基本信息、系统分类学信息、生态信息、生理生化性状描述信息、生境与分布信息、文献信息、图谱图片、微结构和染色体等信息。

2.2 图像类信息平台

中国自然标本馆(www.cfh.ac.cn)自2008年2月上线至今不断开发新功能。目前实现了生物多样性名称与分类系统管理、便捷的物种鉴定、野外调查数据的自动化整理整合与编目、个性化的功能聚合与服务等功能体系,在基本的生物多样性信息服务之余,将致力于为以下工作提供信息化平台支持:1)个人生物多样性数据的整理和组织;2)野外生物多样性的调查、编目与变化监测;3)以生物类群、地理区域或项目团队等为组织特征的生物多样性资料及相关事物管理信息化。

中国植物图像库(www.plantphoto.cn)中国科学院植物研究所在植物标本馆设立的专职植物图片管理机构。主要建设目的在于系统收集、整理并长效保存植物照片、底片、幻灯片、数码图片源文件及其他植物学科相关影像的原始文件及拷贝,建立植物图像库。目前已经收录植物原始图片、蕨类植物等野生植物图片1689122幅,18096种3267属411科,在科学研究、科普教育、图书出版、经济社会服务等方面产生了明显的建库效应。

2.3 标本类信息平台

中国数字植物标本馆(www.cvh.org.cn)是在科技部“国家科技基础条件平台”项目资助下建立的,其宗旨是为用户提供一个方便快捷获取中国植物标本及相关植物学信息的电子网络平台。目前CVH网站包含数据库20余个,数据量达3.3TB,15家植物标本馆的331万份标本,其中167万份带照片,180万份含空间信息。

中国科学院植物研究所植物标本馆(http:// pe.ibcas.ac.cn)馆藏植物标本约有260余万号,其中包括18万号蕨类植物标本,20万号苔藓标本。此外还有8万号种子标本和7万号植物化石标本。据统计,馆藏标本含盖了已经完成的80卷126册的巨著《中国植物志》中所记载的全部中国高等植物中约为80%的苔藓类、95%的蕨类和80%的种子植物;此外,本馆还妥善保存着17000余份模式标本,这些模式标本分别涉及到已经发表的6000余个分类群。

3.存在问题分析

尽管我国政府部门和科研机构在逐步加强生物多样性信息平台建设和应用,但是现有平台与发达国家相关平台相比还存在一定的差距,同时在支撑生物多样性保护和科研等实际需求方面也存在较大不足,主要表现如下:

一是国家或行业层面的生物多样性数据标准规范。由于缺乏统一的标准规范,现有生物多样性元数据设计、数据入库等,大都根据某一项目特点和具体需求开展,常常出现同一数据内容的命名和格式不一致,从而导致数据难以共享和应用,进而也造成部分数据重复采集和入库。因此,急需加强生物多样性数据方面标准规范的研究和建设。

二是当前主要的生物多样性信息门户资源整合不够。目前各类生物多样性信息系统都依赖相同的基层数据,但这些系统资源整合度极低。表现在垂直应用系统相互独立,横向上各类基础数据不能共享,导致数据多头采集、重复采集,加重工作负担。现有的各

个信息平台的数据都是因为各自的需求和研究方向不同而进行收集和汇总的,单纯的从别的平台获取物种信息,必然会出现信息不对口,想要的数据项没有或不公开等现象,从而导致各个平台自己收集自己的数据,使得全国物种的数据越来越庞大,但冗余的信息越来越多。长此以往,会出现物种数据的重复使用率降低,数据更新换代频次越来越频繁,导致过往的劳动成果只能用于一时,数据的生命周期过于短暂。

同时,各个平台系统所采用的技术也各不相同,数据库格式也会各式各样,就算可以使用别的平台的物种数据为己所用,也会出现系统之间数据同步、数据更新等一系列的技术问题,大大降低了各个平台之间数据相互复用的机率。

4.下一步工作建议

生物多样性信息化的意义不应该仅仅停留在科研机构,而要从政府出发,充分利用管理职能,利用先进的信息技术,构建权威信息平台,解决现有平台建设中长期存在的信息杂乱、条块分割等问题,有效地衔接政府与科研机构之间的管理和服务。

一是打牢物种信息化基础。建立健全生物物种信息数据库,是下一步全面推进和提升生物多样性工作的基础。

以中科院权威物种编目为基础,加强物种核心数据标准的制定,分析和整理数据类型、特点和信息特征,梳理生物物种数据模型,最大范围地涵盖物种基本信息和应用信息,保持更新和维护数据信息,保证数据的标准性和权威性,从而瓦解数据雪球越滚越大、越滚越杂的局面,为生物多样性信息平台提供一套较为全面的基础数据标准和规范,。

二是建立权威管理信息平台,整合已有资源。加强现有科研类信息平台对政府管理工作、产业发展等的支持,应当借助相对完善的已有信息数据库,通过充分挖掘数据资源,整合已有物种信息资源,为我国的生物技术产业发展和生命科学研究提供所需的资源基础信息和相关内容,促进我国生物技术产业和社会经济的可持续发展,为实现生物多样性的有效保护、合理利用和可持续发展战略奠定基础。

三是在信息服务能力和水平方面,在兼顾数据贡献者和应用者的利益等的基础上,要着力打破在意识和机制上共享壁垒,建设多方共赢的数据共享环境。

最后,大数据如同浪潮一般席卷全世界,不仅在信息技术行业备受瞩目,更成为变革科研、商业、政府运作方式乃至改变人类思维方式的一个热点。借助大数据采集技术,可以将收集到大量关于各项生物多样性指标的信息,通过传输到中心数据库进行数据分析和知识挖掘,将有力支撑生物多样性保护和持续利用的科学决策。

[1] Paton A. 2009, Biodiversity informatics and the plant conservation baseline. Trends in Plant Science, 14, 629–637.

[2] 许哲平,崔金钟,覃海宁,马克平,2010,中国生物多样性e-Science平台建设构想。生物多样性,18(5),480-488。

[3] 王利松,陈彬,纪力强,马克平,2010,生物多样性信息学研究进展。生物多样性,18(5),429-443。

Study on the Current Construction Progress of Species Information Platform

Zheng Mingqing Huang Mingxiang Yu Miao Zeng Jianfeng Sun Qiang
(Information Center, Ministry of Environmental Protection, Beijing 100029)

Due to the rapid growth of Information technology and expanding Internet,the collection, storage, submission, search, analysis, dissemination and usage of biodiversity information are getting a revolutionary development. The biodiversity data and its service content aregradual shifting from single species database construction to interdisciplinary and comprehensive information service platform. This study introduced the current construction progress of major domestic and foreign biodiversity information platform. Then the existing problems of China’s species information platform were summarized. Finally, some suggestions were proposedto further improve future application of biodiversity information in China.

biodiversity information, database, platform, information technology

X21

A

1674-6252(2014)05-0040-04

*通讯作者

猜你喜欢

标本物种数据库
不明原因肝损害的32例肝组织活检标本的29种微量元素测定
巩义丁香花园唐墓出土器物介绍
COVID-19大便标本采集器的设计及应用
回首2018,这些新物种值得关注
电咖再造新物种
数据库
世界上的15个最不可思议的新物种
数据库
数据库
数据库