APP下载

基于中国馆藏标本数据分析全国植物标本采集现状及采集趋势预测

2018-05-20姜承勇余卫星杨婷简进龙左静刘博

数据与计算发展前沿 2018年5期
关键词:命名馆藏标本

姜承勇,余卫星,杨婷,简进龙,左静,刘博*

1.中央民族大学生命与环境科学学院,北京 100081

2.广西防金花茶国家级自然保护区,广西 防城港 538000

引言

植物标本馆是进行生物学研究与教学、科普和文化教育的重要场所,它不仅收藏管理植物标本,更具有植物标本构成和标本标签数据的信息集成数据库的作用。植物标本所包含的信息不仅对于科学研究具有重要意义,也在公众健康等很多领域为政府管理和决策提供重要科学依据[1,2]。馆藏标本的人为和自然毁损难以避免,标本信息数字化使得标本的形态、分布等主要信息得到最大限度地永久保存,极大的方便了标本信息的共享,可以为科学研究人员和社会各界人员提供生物形态、分布和历史变迁等多方面信息[3-5]。随着计算机和互联网技术的发展以及 IT 技术在生命科学领域的广泛应用,标本馆信息化进程得到了极大的推动。标本数据已为全球气候变化、生物入侵、生物保护等方面的研究工作提供了宝贵的数据资源[6]。

中国数字植物标本馆 (Chinese Virtual Herbarium,简称 CVH,网址:www.cvh.ac.cn) 是在科技部“国家科技基础条件平台”项目资助下建立的,其宗旨是为用户提供一个方便快捷获取中国植物标本及相关植物学信息的电子网络平台。截至到 2016年,CVH 网站包含数据库 20 余个,参与建设单位达 75 余家,包括中国科学院和地方科学院及一些大学标本馆,基本上包含了我国主要和重要的标本馆。资源总量达到11.5TB,共完成 680 万份植物标本 (包括 476 万幅照片) 标准化整理与数字化表达,其网上模式标本 58000 份,分别占全国总量的 67% 和 80%[7],已由平台参建单位审核并确认为正式发表的模式标本有 15064 份。该馆汇集的大量全国标本信息具有极大的科研价值[6]。

中国科学院植物研究所标本馆 (Herbarium, Institute of Botany,简称 PE,网址:http://pe.ibcas.ac.cn/) 馆藏植物标本约有 260 余万份,其中包括 18 万号蕨类植物标本,20 万号苔藓标本。此外还有 8 万号种子标本和 7 万号植物化石标本。据统计,馆藏标本含盖了已经完成的 80 卷 126 册的巨著《中国植物志》中所记载的全部中国高等植物中约为 80% 的苔藓类、95% 的蕨类和 80% 的种子植物[8];此外,该馆还保存着 17000 余份模式标本,这些模式标本分别涉及到已经发表的 6000 余个分类群。就馆藏标本数目和整体规模而言,中国科学院植物植物研究所植物标本馆名列亚洲地区植物标本馆之首;就馆藏种子标本的数目而言,中国科学院植物研究所植物标本馆位居世界第三,在国内外植物分类学研究领域中,特别是在东亚植物的研究领域中具有举足轻重的地位[9]。

本文通过对中国数字植物标本馆和中国科学院植物研究所标本馆的植物标本与物种信息系统数据库对标本信息进行统计分析,获得了异名鉴定错误情况、采集强度情况等信息,为更合理地安排今后的标本采集工作提供参考。

1 方法

1.1 标本数据与软件来源

植物标本数据来源于 CVH 中国数字植物标本馆标本资源共享平台 (http://www.cvh.ac.cn/) 和中国科学院植物研究所植物标本馆 (http://www.nhpe.org/) 提供的馆藏标本信息,详细记载了每个植物标本的采集信息,包含采集日期、采集地区 (省、县、小地名)、科、属、命名人、学名、中文名、经纬度、生境等信息,保存为 access 文件;采集植物标本空间分布使用 DIVA-GIS 软件[10,11],该软件和所使用的世界行政区域地图从 DIVA-GIS 网站下载,下载地址为 http://www.diva-gis.org/,样点空间分布地图数据来源于 DIVA-GIS 提供的网站,下载网址为 http://diva-gis.org/gdata。

1.2 标本数据核对

将所得标本数据整合,发送至 Taxonomic Name Resolution Service (TNRS)[12],网上地址为 http://tnrs.iplantcollaborative.org/,其数据源来源于 Tropicos,Global Compositae Checklist,USDA Plants,NCBI Taxonomy,将两大数据库标本科名、学名上传,进行核对[13]。根据其核对结果,根据匹配结果评分,将低匹配程度 (Over score<0.9) 的定为命名拼写或印刷错误,并更根据其提供的 Accepted name,对标本名进行更正,将错误命名的数据更改正确,部分标本科名和学名 Over score=0,视该部分标本不存在,最后进行重新汇总。

将两大数据库中的植物标本进行预处理之后,分别对相关植物的科名和学名进行核对,借助 Microsoft Access 与我国已记载植物科名进行匹配。经统计两个标本馆所有植物标本科名共计 481 个,经过 TNRS 核对,其中 Overrall score=0 的标本有 47 个,表明这部分科名在该系统数据源中无匹配项,Overrall Score<0.90 的标本共计 97 个,该部分中在 TNRS 系统中均有匹配项,但匹配程度不高。经过核查发现大部分匹配程度低的植物科名均由于拼写错误或者印刷错误所致,根据其提供的 Accepted name,我们对这部分科名进行了订正。在以上基础上,将标本库里植物科名与我国已命名植物科名 444 项进行匹配分析,共获得匹配结果 302 项,表明目前我国采集标本已基本覆盖当前大部分已命名植物,但仍然有部分植物缺少相关标本,提示该部分植物的保护工作尚存在不足,有待以后进一步挖掘。

对共计 56188 个标本的学名的核对结果进行分析,其中未成功匹配标本 110 项 (Overrall score=0),匹配程度较低标本 9132 项 (Overrall score<0.9),绝大部分提供有相应的正确命名,并进行了更正,所占比率接近 2.2%。反映馆藏植物标本数据库中植物名录入的准确度较差,存在一定的错误,这也成为了当前数字动植物标本所存在的共性问题。

2 统计分析

CVH 中 1163159 个数据样本和 PE 中 1087822 进行核对后,采用 Microsoft Access 对相同植物名和采集信息进行合并,然后按照各种植物采集年份、采集地理位置以及采集人信息分类进行数据统计,借助 Statistic 17.0 进行统计学分析,使得数字化标本信息转化为直观的统计图。

2.1 植物标本采集进程

为分析我国植物标本的采集规律,以预测潜在性标本采集的可能,我们借助标本库采集日期信息,进行阶段性分析,最早在十四世纪就有 4 个标本采集信息记录,此后陆续有记载 (图 1)。直到 19 世纪才出现大规模的植物标本采集浪潮,到达 30年代达到第一个采集高峰,十年之间采集标本 311986 件,占标本库总标本数的 14.4%。其后的十年由于国家内忧外患,战乱不断,《中国植物志》的编写工作被暂停,植物标本采集的进程也大大延缓。直到上世纪 50年代达到第二个采集高峰,仅仅十年内采集植物标本数高达 824568 件,占总数的 38.2%。在这一时期我国刚刚解放,全国的科学研究逐渐恢复,植物调查采集研究的工作进展较快[14]。这以后植物标本的采集数量平稳回落,直到二十一世纪,新记载的植物标本的采集已经十分罕见,一方面大部分易采集的植物标本采集殆尽,其次《中国植物志》编写于 2004年竣工,全国大范围的植物标本采集工作也宣告结束。

图1 自14世纪以来植物标本采集时间变化趋势Fig.1 The trend of plant specimen collection time since the 14th century

为进一步分析近几十年来我国植物标本的采集情况,以预测可能的采集趋势和采集空缺,在原有基础上,进一步细化了自 2000年之后植物标本的年度采集数量 (图 2)。柱状图较直观反映了近几十年的采集情况,虽然植物标本采集数量逐年回落,但结合我国植物命,仍有相当一大部分植物未登记标本,因此猜测尽管今后的采集难度越来越大,但仍有较大的采集可能,主要集中在上述为未匹配上的 142 个科,当然,由于受到时效性的限制,该分析存在一定的偏差。

2.2 植物标本采集团队

中国是世界植物学史上植物资源被采集时间最早、持续时间最长、采集国来源最广、采集人员最复杂、采集成果最多的国家[15],仅 1640~1898年的近 260年,欧美国家来华采集植物的就有 334 人[16],除国外少数采集人的工作外,我国基本上没有做过有关的具体考证,至今没有比较完整的采集历史记录[17]。据相关记载,我国采集植物标本的第一人为北京大学的钟观光教授,但采集时间已无从考证[18]。

我们对 226 万个馆藏植物标本的命名人信息进行了统计,共统计得到 16132 个相关命名人,其中包括第一命名人和重新修正的第二命名人。表 1 统计了排名前十位了馆藏植物标本命名人,命名植物数量最多的为林奈 (Linn.),命名植物达到 54265 种,而中国学者并不在此之列,由此可见,我国从事植物分类学研究相对较为滞后。

图2 21 世纪植物标本采集量逐年变化Fig.2 Changes of plant specimen collection in the 21st century

3 DIVA-GIS 分析植物标本采集地域状况

植物标本的空间信息记载着该植物的采集地,两大标本库植物标本覆盖全国 5882 个县级区域,隶属于全国 33 个行政省。澳门特别行政区无植物标本采集的记载,香港特别行政区仅记载 8 个植物标本,在其他 32 各省级单位 (包括台湾) 植物标本采集强度均有明显差异 (图 3)。总体来看主要集中在人口地理分布线 (漠河-腾冲线) 以下的区域。而广大的西北地区据国家环保局统计,有 72 种珍稀易危植物,占全国保护植物的 18.5%[19],但标本采集强度并不大,从植物多样性保护的角度看,该地域植物标本急需采集和保存。标本馆每年都有大量的新标本入库,标本信息的录入工作一直在进行[20]。

从统计结果来看,采集植物 384 个科,56188 个种,涵盖了我国已鉴别的 302 个科,其中采集植物标本最多的科为蔷薇科 (150152 种),占植物标本总数的 6.95%,其次为菊科 (130114 种),占总数的6.02%。而采集植物最多的种类为槭树科的青榨槭 (6966 种),其次为樟科的山仓子 (6839 种)。云南省由于部分位于热带,以及其独特的地形地貌,使得大部分植物在历史更迭中得以保留,植物标本的采集量也稳居全国第一,成为我国生态热点地区之一,其次为四川省。根据植物标本在各省的采集情况,我们将统计后的数据传输到 DIVA-GIS 上,根据采集地的经纬度形成点状分布,其分布密度即代表该地区的采集强度 (图 4)。该空间地理图无法反映出各个采集地点采集植物标本物种数和采集频度,仅反映了该地区是否涉足和标本是否有采集记录。为此,我们进一步对各个省级单位植物标本的代表性进行了研究,统计了各省植物标本被广泛采集的五个科 (表 2),并分析了各省代表性植物标本。其中有 14 个省代表性植物为蔷薇科 (Rosaceae),有 12 个省代表植物为菊科 (Compositae),广西省、海南省、台湾省代表植物为大戟科 (Euphorbiaceae) 植物,广东省为茜草科 (Rubiaceae) 植物,香港省代表植物为卫矛科 (Celastraceae) 植物,宁夏回族自治区为禾本科 (Gramineae) 植物,上海市为蓼科 (Polygonaceae) 植物。并列出了其他采集量较多的四个科,植物的生长受到当地气候、土壤以及地形的限制,因此各省的代表植物在一定程度上反应了该地区的气候面貌。但我们发现菊科和蔷薇科植物在各个省份均有广泛分布,表明这两种植物适应性较强,同时其在进化水平上的丰度也高于其他植物。

表1 十大植物命名人及命名植物数Table 1 The number of namer and named plants of top 10 plants

图3 各省植物标本采集强度统计Fig.3 Statistics of plant specimen collection intensity of each province

图4 DIVA-GIS 作图植物标本采集的空间分布Fig.4 Spatial distribution of plant specimen collection by DIVA-GIS

表2 各省植物采集强度较大的科名统计Table 2 Family name statistics with strong plant collection intensity in each province

4 总结

标本数字化可以为植物学研究以及其它研究提供客观、全面和准确的数据,也可避免由于标本的损毁而导致的生境、生态学、地理学等方面的信息的丢失。据记载,目前我国数字标本馆数目高达 318 个,植物标本的数字化管理给植物工作者的研究带来了便利的同时,由于植物信息的录入和鉴别错误也带来了研究上的麻烦,为此进行植物标本馆标本信息的核对和统计分析可以有效避免以上矛盾。

两大植物标本馆的标本共计 216 万余份植物标本,采集时间记录跨越八个世纪,标本数据的遗失以及信息的不完整性是植物标本信息化储存的主要担忧。根据所提供的信息,除了部分标本采集年份缺失,还包括命名人的缺失、生境的缺失以及采集人信息的缺失,并存在严重的标本命名的错误问题,这些问题更加肯定了对数字化标本进行修正和统计的必要性。统计结果同时反映出另一个重要问题,截至到目前,我国仍然存在 142 个科的植物已命名植物无采集信息,而类似于青藏高原、新疆等地区仍有大部分区域没有任何植物标本采集的记录,在这些地区由于地广人稀,存在着大量特有和极危植物,急需引起广大研究者的关注。

随着城市现代化的推进,人类对自然界的干预越来越大,道路、水坝、采矿、开垦等对自然植被的破坏是巨大的,尤其是一些经济植物的大面积种植,极大地破坏了原有的自然植被,标本信息成为研究这些地区植物与生态环境的宝贵数据资源。随着城市化的不断发展,很多地区的野生植被将会消失,植物标本将是今后研究这些地区植物变迁的重要资料。因此,在采集自然保护区中植物标本的同时,加强城镇周围植物标本的采集很有必要。植物标本的采集功在当代,利在千秋,对陆地生态系统研究将起到重大促进作用,对科研和经济建设都有重要的价值。

猜你喜欢

命名馆藏标本
昆虫标本制作——以蝴蝶标本为例
馆藏
巩义丁香花园唐墓出土器物介绍
COVID-19大便标本采集器的设计及应用
命名——助力有机化学的学习
博物馆的生存之道:馆藏能否变卖?
知还印馆藏印选——古印篇
有一种男人以“暖”命名
为一条河命名——在白河源
介绍两件馆藏青铜器