APP下载

中国高等植物数字化标本分析

2022-04-30刘慧圆覃海宁包伯坚陈天翔韩国霞刘全儒

广西植物 2022年13期

刘慧圆 覃海宁 包伯坚 陈天翔 韩国霞 刘全儒

摘 要:  傳统上馆藏标本,主要用于植物分类学、植物资源学的研究。数字标本的出现将标本的使用拓展到从研究生物多样性时间空间分布到生态学和进化学理论、生物多样性保护、农业和人类健康等广泛领域。截至目前,从互联网上获取的采自中国的植物标本数量已有1 200多万份。该文通过整理和分析这些数据以了解中国植物标本的数字化精度、采集时间和采集地区规律以及采集空缺等状况。结果表明:中国标本采集形成了4个高峰,即20世纪30年代、60年代、80年代和21世纪初,中国植物标本采集和研究工作主要在20世纪50年代后由中国学者完成。标本采集地区覆盖度在省级较好,县级标本采集则很不平衡;标本采集类群在科属层面覆盖率高,但近五分之一的物种采集不足;标本的采集量既与植物分布幅度相关,也与采集地区的知名度、所获科研项目及采集者偏好有关。未来中国植物标本数字化方向应该在继续挖掘馆藏标本的同时,一方面开展对现有数字化标本信息再审核及补充,并加强与欧美大馆的信息共享以获取早期历史标本信息;另一方面应用数字化标本信息分析结果,指导境内标本的精准采集,包括采集薄弱/空白地区、采集薄弱/空白属种的采集,以进一步增强实体标本馆能力,提高数字化标本质量,为进一步完善植物标本数字化和精准化采集提供依据,更好地服务科学和社会的发展。

关键词: 植物标本, 标本数字化, 采集空缺, 精准采集, 高等植物

中图分类号:  Q94

文献标识码:  A

文章编号:  1000-3142(2022)增刊1-0029-17

收稿日期:  2022-09-06

基金项目:  国家自然科学基金 (31770213); 国家植物标本资源库 (E0117G1001)。

第一作者: 刘慧圆(1982-),博士,工程师,主要从事植物地理、生物多样性保护和科学数据研究,(E-mail)liuhy@ibcas.ac.cn。

通信作者:  刘全儒,教授,主要从事植物分类学和植物地理学研究,(E-mail)liuquanru@bnu.edu.cn。

Analysis of digitized specimens of higher plants in China

LIU Huiyuan1,2, QIN Haining2, BAO Bojian2, CHEN Tianxiang2,

HAN Guoxia2, LIU Quanru1*

(1. College of Life Sciences, Beijing Normal University, Beijing 100875, China; 2. State Key Laboratory of Systematic

and Evolutionary Botany, Institute of Botany, Chinese Academy of Sciences, Beijing 100093, China )

Abstract:

Traditionally, herbarium specimens are mainly used for plant taxonomy and resource science research. The emergence of digitized specimens has expanded the use of specimens to a wider range of fields, from the study of temporal and spatial distribution of biodiversity to theoretical ecology and evolutionary, biodiversity conservation, agriculture and human health. Up to now, information of more than 12 million plant specimen sheets collected from China has been available on the internet. This paper compiles and analyzes these data to evaluate the digitization accuracy, the temporal and spatial pattern of herbarium collection, and the collection vacancy of Chinese plant specimens, so as to provide a basis for further improving the digitization and accurate collection of plant specimens. The results are as follows:  The collection of specimens in China formed four peaks, namely,  the 1930s, the 1960s, the 1980s and the early 21st century, and the collection and research of Chinese plant specimens have been mainly completed by Chinese scholars since the 1950s. The coverage of specimen collection is rather high on province level while greatly unbalanced on county level. The coverage of specimen collection by plant groups is high on family and genus level, but nearly one fifth of the species have not been collected sufficiently. The number of collected specimens is related to the distribution range of plants, as well as the popularity of the collection area, the scientific research projects, and the preferences of the collectors. To better digitize Chinese plant specimens in the future, we should continue to explore the undigitized herbarium specimens, review and supplement the existing digitized specimen information, and strengthen the information sharing with European and American herbaria to obtain the information of early historical specimens. The results from our analysis can be applied as a guidance for accurate collection of specimens in China, showing the weak or blank areas and genera/species, which can further enhance the capacity of the herbaria and improve the quality of digitized specimens to better serve science and the society.

Key words: plant specimens, specimen digitization, collection vacancy, accurate collection, higher plants

各类标本馆和博物馆中保藏的生物标本包括植物标本,是物种在地球上存在的历史凭证,西方文献常常称其为自然历史标本(natural history collections )。传统上,馆藏标本主要用途是作为分类学、系统学及相关学科如植物资源学等的研究素材(Lane 1996; 王利松等2010; 杨永2012)。但是,随着大量数字化标本的出现和全球范围内生物多样性保护的需求,生物标本数据广泛应用于系统学、生物地理学、生态学、物候学和基因组学等众多学科领域,在农业发展、人类健康、生物多样性保护政策制定等社会应用领域中发挥着重要作用 (Lane 1996; Ponder et al., 2001; OConnell et al., 2004; Johnson et al., 2011; Robbirt et al., 2011; Wen 2015; Page et al., 2015)。标本数字化工作始于20世纪70年代末80年代初欧美,至90年代奠定了基础。直到20世纪初,全球性的生物多样性保护热潮让人们认识到各国各类博物馆、标本馆中保藏的标本是生物多样性监测及保护策略制定所参考的重要且易于获取的材料(Ponder et al., 2001; Suarez & Tsutsui 2004; Pyke & Ehrlich 2010; Page et al., 2015; Nualart et al., 2017; James et al., 2018; Hedrick, 2020)。此后,借助蓬勃发展的计算机技术及网络通信技术,欧美发达国家及南非(https://www.sanbi.ac.za/)、巴西(http://reflora.jbrj.gov.br/reflora/herbarioVirtual/ConsultaPublicoHVUC/Consul

taPublicoHVUC.do)等许多国家纷纷加速推进本国标本数字化进程,并支持建立GBIF (http://www.gbif.org/)和JSTOR (http://plants.jstor.org/)等全球性标本信息共享网站。

依据《国际植物标本馆索引》(Index Herbariorum),全球共有176个国家3 522个标本馆,馆藏标本总量达3.9亿份,其中馆藏量前五位的国家为美国(7 846万)、法国(2 404万)、英国(2 365万)、德国(2 212万)和中国(2 037万)(Thiers, 2021)。中国是唯一馆藏量主要来自本国的国家。早在20世纪80年代初期,我国科技部、中国科学院等部门及生物科学工作者就已了解到国际生物标本馆研究领域的数字化趋势,着手开展与国际最新动向同步的生物物种和标本信息数字化的研究。其中,实施力度最大、影响最远的是科技部国家科技基础条件平台项目——原国家标本资源共享平台。国家标本资源共享平台(缩写为NSII, http://www.nsii.org.cn),由中国科学院植物研究所牵头组建,自2004年启动以来,通过旗下植物子平台(共享网站为“中国数字植物标本馆”,缩写为CVH, http://www.cvh.ac.cn)等相关子平台,共完成全国100多家植物标本馆共1 000万份标本的规范化整理及数字化表达,并全部实现网络共享 (马克平等 2010; 许哲平等 2010)。该项工作(网站)成为国内外用户查询中国植物标本及相关植物学信息的重要门户网站,在世界同行中享有广泛的影响。

至今,已有多篇论文分析中國数字化植物标本所覆盖的植物类群、时空情况等。阳文静(2013)对900万条(包括650万份标本记录和250万条文献记录)物种分布数据进行了去重,得到431万条县级植物分布记录,并借此对中国植物采集的地理格局和成因进行了详细分析。姜承勇等(2018)对216 万份标本记录进行了采集时间进程和省份采集情况分析,并根据当前采集信息,预测新疆、西藏地区植物标本采集空间较大。桂略宁等(2018)对1 053万份标本记录进行了省份采集情况分析,认为不同地区的采集密度呈现非均质性。尹朝露等(2018)和王凯莉等(2018)则分别分析兰科和蔷薇科数字标本信息,揭示相关科的标本采集分布特点。张玉雪等(2018)利用14.9万份杜鹃花科标本信息分析了中国杜鹃花科植物物种丰富度的分布格局及影响其分布的气候因子之间的关系,结果显示杜鹃花科植物标本采集较为完整的县级行政区集中分布于长江以南地区以及西南地区,东北、西北及东部地区相对较少。Qian等(2018)对从GBIF和NSII获取的共1 100万份中国标本信息与物种编目的完整性进行比较,认为标本数据库的完整程度对物种编目的完整性影响非常大。这些工作从多个层面分析和揭示了中国植物数字化标本所蕴藏的信息和规律,但仍然缺乏从标本数据的层面对标本采集的时空和类群进行全面深入分析与研究。

本文基于国内外共享平台获取的中国植物数字标本的海量信息,对这些标本信息在时间、空间、类群等方面积累程度进行分析,以了解中国植物标本在采集时间、空间、类群等方面的特点及采集空缺,为未来数字化方向及开展标本精准化采集提供方向性建议及策略。

1 数字标本来源与分析方法

1.1 数字标本来源

数字标本数据来源于CVH、NSII两个标本共享平台,其中NSII只选取了教学子平台和保护区子平台的数据。同时补充了JSTOR和GBIF标本数据网络共享平台上采自中国的标本,共提取了12 464 469条采自中国境内的高等植物标本信息(表1)。所收集标本采集时间跨度为1700—2020年。

1.2 数据的核准及清理

由于数据来源不一,故在进行分析之前,首先对标本数据进行了核准和整理工作:(1)删除标本重复记录;(2)规范各个字段内容格式;(3)通过TNRS网站(https://tnrs.biendata.org/),更正与核查提取的拉丁学名等。

1.3 标本数据库植物名称及县级采集地名处理

使用《中国生物物种名录(光盘版2017)》(中国科学院生物多样性委员会, 2017)(简称《生物物种名录》)作为标准库对标本数据的植物拉丁学名、属名及科名进行比对,包括接受名和异名的匹配转化和标准化。《生物物种名录》中各类群使用的分类系统如下:被子植物为APG III分类系统(Chase & Reveal, 2009)、裸子植物为克氏系统(Christenhusz et al., 2011)、蕨类植物根据Flora of China(Wu et al., 2013a)的系统及类群处理意见、苔藓植物根据Frey (2009)主编的Syllabus of Plant Families(Part 3 Bryophytes and seedless Vascular Plants)。匹配处理得到的物种名称包括462科3 929属32 815种,以及种下等级5 048种。

对于未符合目前行政区划的旧县级名称,通过搜集获得原中国科学院中国植物编委会编辑的各省区地名参考资料(油印本),《中国地名录》(国家测绘局地名研究所,1983),《云南植物采集史略》(包士英等,1995),《中国行政区划沿革手册》(陈潮,2007)等公开或未公开发表文献,并参考了中华人民共和国民政部(http://www.mca.gov.cn/article/sj/xzqh/)的各年行政區划沿革信息来进行甄别,并对采集地名地标到现用县级单位。共标准化和校正9.8万条县名,涉及省名5.1万笔,植物名称21.76万笔。其中学名归属:属名1.1万笔,科名0.15万笔。最终得到有效标本9 906 121份(占收集标本量84.3%),成为本研究使用的中国植物标本数据库(简称标本数据库)。标本数据库内容包括常规字段,如标本采集人、采集时间、采集号、省份、市县、鉴定名称、接受名、属、科、生境、海拔、经纬度等信息。标本数据库覆盖中国包括港澳台在内的34个省(区、市)以及2 217个县,占全国行政区划2 377个县的93%(国家基础地理信息系统http://nfgis.nsdi.gov.cn/nfgis/chinese/c_xz.htm)。

1.4 物种采集强度为薄弱的界定

本文把标本量少于5份(标本份数≤4)的物种定义为采集薄弱物种。

1.5 县级物种采集完整程度分析

利用物种累积曲线(species accumulation curve,SAC)的弯曲程度来表示不同地理单元的物种采集完整程度,(Gotelli & Colwell, 2001; 阳文静, 2013)。其计算方法为对每个地理单元中的样本进行重复抽样,抽取N个个体,计算这N个个体所包含的平均物种数量。通过计算,抽取标本量达到90%物种的标本比例开始计算随标本数增加的物种累计曲线的平均斜率,即每增加一份标本,平均增加的物种数,来表示该地理单元的取样完整程度。斜率接近0时,表明该地理单元的取样趋于完整;斜率接近1时,表明该地理单元取样很不完整。根据Yang等(2014),对斜率定义阈值为0.05,当平均斜率值大于0.05,认为该地理单元的采集程度较为完整,反之则采集程度不完整。

所有统计分析都在OriginPro 9.0软件中完成,地图制图在ArcGIS 10.4.1软件中完成。

2 结果与分析

2.1 采集时间分析

中国植物标本最早采集始于18世纪(王印政等,2004),据标本数据库在19世纪末出现第一个采集高峰,其中1885年的采集数量最多,达4 510份。19世纪末20世纪初在中国采集的植物标本主要由欧美俄等国牧师和外交官进行,标本主要存放于中国境外。20世纪以后采集的标本主要形成4个高峰,分别是20世纪30年代、60年代、80年代和21世纪初(图1)。第一个采集高峰在20世纪30年代,其中1935年采集量最高,标本量达123 267份,这一采集高峰代表近代中国植物学研究的兴起,是中国植物分类学众多开拓者们艰苦卓绝的标本采集活动的成果,同时还有不少外国采集者的参与和贡献;第二个采集高峰在1958年前后,其中1958年采集量最高,标本量达523 807份;第三个采集高峰在20世纪80年代,其中1983年采集量最高,标本量达181 122份;在2013年前后形成了第四个采集小高峰,其中2013年采集量最高,标本量达87 127份。

新中国成立后,国家为调查国内自然资源本底,组织开展了多次大型综合及单项科考活动,采集大量标本,形成50至90年代的第二个和第三个采集高峰。例如,黄河中游水土保持考察队(1954—1957)采集标本3万余号,全国野生经济植物资源普查(1959—1960)在全国共采集标本约20万号,青藏综合考察队(1973—1976)共采集标本1.5万余号,横断山地区综合科学考察队(1981—1983)共采集标本约4万号等(王印政等,2004)。进入21世纪后,国家中医药管理局从2011年起组织实施了第四次全国中药资源普查,启动10个省205个县的中药资源普查试点(黄璐琦等,2012),再次迎来了这个时期标本采集的小高峰,从而形成了第四个采集高峰。

中国目前有活力的220余家标本馆共计馆藏2 100余万份标本(高等植物、藻类及菌物标本)(覃海宁等,2019),其中大部分为中国学者在20世纪50年代后独立搜集。戴迈凡等(2018)对《中国植物志》学名发表年代统计结果表明,中国植物描述发表出现两个高峰,20世纪初至40年代和80、90年代;后一高峰延续时间短而描述新物种数量多。这说明大部分中国植物分类研究是在20世纪50年代之后由中国学者完成的。

2.2 采集地分析

2.2.1 省级和县级采集情况分析

对标本数据库统计的结果显示,标本采集覆盖了中国包括港澳台在内的34个省(区、市)(图2)。其中,采集量达100万份的只有云南和四川两省,分别为111万和147万(图2,表2)。云南和四川地处中国西南地区,是国内公认的植物物种最为丰富的省份,也是历来吸引最多植物采集人(队)前往调查研究的省份。据最新统计结果,2000—2019年间,云南、广西和四川位列发表新物种和新记录物种数量最多的3个省(区), 仅云南就发表了1 164个植物新物种和230个新记录物种,分别占到同期全国总量的四分之一和三分之一(Du et al., 2020)。

标本采集量在10万份以下的省份中,面积较大的省份有山东、黑龙江、吉林和辽宁。王印政等(2004)研究发现,新中国成立后山东省的标本采集主要存放于山东师范大学生命科学学院植物标本室(SDNU)及山东大学生命科学学院植物标本室(JSPC)。然而,SDNU尚未开展植物标本数字化,JSPC

馆藏量为1.3万份(覃海宁等,2019),已数字化了三分之一。标本数据库中东三省数字化标本共有25.6万份,包括来自中国科学院沈阳应用生态研究所东北生物标本馆(IFP)的18万份。覃海宁等(2019)研究发现,IFP馆藏标本达60万份。显然,由于东三省植物标本数字化率偏低的缘故,因此本库中数据与实际馆藏量存在一定差距。建议东三省标本馆成为今后开展数字化工作的重点地区之一。

通过对标本数据库的2 164个县的统计,得到平均每个县的标本量为2 678份,物种数为482种。标本采集量前20县共来自7个省(区、市),其中9个县位于云南,5个县位于四川(表3)。标本采集量最多的前三个县(市、区)分别是四川省的峨眉山市、重庆市的南川区和四川省的康定市,标本量分别为17.8万份、16.6万份和6.3万份;含物种数最高的前三个县是重庆市的南川区、四川省的峨眉山市和云南省的贡山独龙族怒族自治县,含物种数分别为5 022种、4 460种和3 993种(表3)。标本库中有9%(n=216)的县没有标本记录,如山东的高青县、夏津县等;有22%(n=527)的县标本量不到100份,有31%(n=731)的县物种数不到100种,如吉林图们市的标本量为63份31种、江苏泰州市的标本量为25份23种 (图3)。

由进一步分析可知,这些采集量位列前茅的县,大多为著名的生物多样性高的地区,同时是宗教圣地、旅游名胜所在地,或大专院校长期定点实习采集点, 或某采集人/队长期采集地。如横断山地区综合科学考察队(1981—1983)对云南四川境内的几个县采集了相当数量的标本,此后这些县还分别开展了综考,采集了大量标本; 针对佛教圣地峨眉山和金佛山的采集主要由四川大学完成,如1951—1957年间,在方文培教授(其个人在峨眉山采集标本超过1万份)的主持下派出的金佛山植物资源考察队(1986)以及在康定、二郎山等地采集的川西队(1963)等采集活动。根据标本数据库信息统计,标本采集在500份以上的采集人或采集队,在峨眉山地区采集的有38人(队),金佛山地区有17人(队)。

我们将各个省(区、市)和县级的物种数量和标本数量进行了Pearson相关分析,相关系数分别为0.95和0.75(P<0.001),说明物种的数量和标本的采集量成正相关。

2.2.2 县级物种采集完整性评估

对2 217个县(占全国2 377个县的93%)的物种采集完整性进行评估,Slope平均值为0.225。其中,Slope小于0.05的县仅有4%(n=93),表明这些县的物种采集较为全面,如四川省的峨眉山市(Slope=0.007)、重庆市的南川区(Slope=0.01)等(图4)。Slope小于0.05的县与阳文静(2013)的相比少了100多个,推测是其根据文献补充植物分布记录后带来的结果差别,在一定程度上补充了数字化标本的数据未覆盖的信息。96%的县Slope大于0.05,即96%的县属于采集不完整;斜率较大的县主要集中在河北、山东、安徽北部;有160个县(7%,分布在21个省份)没有标本记录。将采集完整性指数在县级地图上进行可视化(图4),可以明显看出,在县级水平上,各地区的物种采集完整程度极度不平衡。

2.3 采集类群分析

2.3.1 类群覆盖程度 标本数据库中科、属和种的标本覆盖情况见表4。被子植物物种数量是高等植物各类群中的“大户”,其标本数量也是最大的,并且类群覆盖度上,其科、属和种的覆盖度均在90%以上。裸子植物是4个类群中覆盖率最高的类群,科、属和种的覆盖率均在96%以上;蕨类植物的科、属和种的覆盖率均在90%以上;苔藓植物的科和属覆盖率在90%以上,但种仅覆盖了81%。

2.3.2 不同分类水平标本采集情况 对高等植物4个类群的科、属和种的标本量前10名进行统计(表5)。

在科级水平上,平均标本量为21 365份。标本数据库中标本数量超过21 365份的科有98个, 占总科数的21%,标本总量达8 805 603份,占标本数据库总量的89%。标本量在10万份以上的科有24个,标本总量达5 142 754份,占标本库总量的52%,除蕨类植物的水龙骨科(Polypodiaceae)和鳞毛蕨科(Dryopteridaceae)外,其余22科均为被子植物(表5)。被子植物中科的标本数量排名前三的分别是蔷薇科(Rosaceae)、菊科(Asteraceae)和禾本科(Poaceae),标本量均在50万份以上;裸子植物中科的标本数量排名前三的分别是松科(Pinaceae)、 柏科 (Cupressaceae)和紅豆杉科(Taxaceae),标本量均在2万份以上;苔藓植物中科的标本数量排名前三的分别是丛藓科(Pottiaceae)、羽藓科(Thuidiaceae)和青藓科(Brachytheciaceae),标本量均在1万份以上。采集量排名靠前的科同时也是各大类群中的物种数量大的科,如裸子植物的松科和柏科,被子植物的菊科、禾本科、蔷薇科和唇形科(Lamiaceae)。

在属级水平上,平均标本量为2 392份。标本数据库中标本数量超过2 392份的属有840个,标本总量达7 944 795份,占标本库总量的80%。标本采集量在1万份以上的属有211个,占总属数5%,标本总量达5 114 353份,占标本库总量的51%,其中被子植物有190个属,蕨类植物18个属,裸子植物3个属。含5万份标本以上的属有21个,全部为被子植物,多为大属或含较多广布种的属,其中双子叶植物18个属,蔷薇科4属为最多,单子叶植物仅有薹草属(Carex)和菝葜属(Smilax)两个属。排名前五的属分别是杜鹃花科的杜鹃花属(Rhododendron)、蓼科的蓼属(Polygonum)、五福花科的荚蒾属(Viburnum)、蔷薇科的悬钩子属(Rubus)和李属(Prunus),标本采集量均在8万份以上。裸子植物排名前五的属分别是松科松属(Pinus)、柏科刺柏属(Juniperus)、松科云杉属(Picea)、红豆杉科三尖杉属(Cephalotaxus)和红豆杉属(Taxus),标本采集量均在8 000份以上。采集量排名靠前的属同样多为物种数量多的大属(如杜鹃花属)和常见属(如蓼属和松属),以及观赏花卉(如荚蒾属)。

在种级水平上,平均标本数量为241份。标本数大于241份的有7 129种,占总种数的22%,隶属于254科,占总科数的55%,这些物种所涉及的标本份数共为6 468 959份,占整个标本库的84%。种的标本采集量排前10名见表5,其中前三分别是蔷薇科的梅(Prunus mume,26 422份)、禾本科的稻(Oryza sativa,20 506份)、豆科的大豆(Glycine max,15 985份)。标本采集量较多的物种多为观赏植物、栽培植物或同时为广布植物。

2.3.3 类群采集薄弱分析

(1)缺乏标本记录的植物类群

标本采集在科级的覆盖度较好,仅有3个科缺乏标本记录,占全部科的0.6%,包含疑似灭绝植物白玉簪(Corsiopsis chinensis)所在的白玉簪科(Corsiaceae)(覃海宁等,2017)。在属级水平上,无标本采集的属为74个属(表4), 占全部属的1.8%。其中被子植物有34个属无标本采集,无标本属最多的科是兰科,有7个属缺乏标本记录,大都为近些年发表的新属,如Singchia(Liu & Chen, 2009)、Shizhenia和Gennaria(金伟涛等, 2015);十字花科有6个属,有的该属为单种属较难采集,如Atelanthera;菊科有4个属,即Schischkinia、Pseudohandelia、Microcephala和Frolovia,据《中国植物志》(1987)记载,大都分布在新疆,并且植株矮小,较难采集。无标本的属大多集中在采集量在10万份以上的物种数量大的科,说明这些大科仍旧需要在分类学上开展更多的研究,同时各馆仍需加强模式标本的数字化工作。

在种级水平上,无标本采集的种为3 250种,占全部物种的9%,其中被子植物2 445种、裸子植物11种、蕨类植物212种、苔藓植物582种。有623个无标本物种是在2007年之后发表的。无标本物种数较多的科,仍集中在物种数量和标本数量较大的科,如禾本科、兰科、豆科和菊科(表6),其中禾本科无标本物种数最多,有225种,涉及66个属。无标本的物种所在的科或者是野外分类较难的类群,如禾本科和莎草科;或者是近些年发表的新种等狭域分布物种,如Phyllostachys purpureociliata G. H. Lai(2013)、Senecio changii C. Ren & Q. E. Yang(2016)等。

依据“中国高等植物受威胁物种名录”(覃海宁等,2017),无标本物种中有16种为疑似灭绝植物;331种为受威胁物种,占全部受威胁物种及无标本物种的10%,其中有197个物种属于狭域分布物种,仅分布在1~3个县范围内。当用Flora of China(Wu et al., 2013b)认可的197个特有属(含200余种)的物种名录与标本数据库物种名称进行匹配时发现,有一半以上物种缺乏标本,除学名归并及拼写错误之外,缺乏标本记录的比例仍然不低。

(2)标本数小于5份的植物类群

根据标本数据库,有4 698个物种标本数量过少,标本份数在5份以下(标本份数≤4),涉及275科1 325属,约十分之一(12.9%)的物种是采集薄弱的,其中有404个物种的标本仅为模式标本。包括被子植物3 835种、裸子植物7种、蕨类植物194种、苔藓植物662种。仅有1份标本的物种数为1 507个,涉及195科690属,占标本库物种数的4.1%,其中被子植物1 202种、裸子植物3种、蕨类植物59种、苔藓植物243种。

23个科的物种中一半以上标本份数在5份以下(表7),除单型科以及物种数量较少的科外,还包括一些60%左右的物种都是狭域分布的科如秋海棠科、苦苣苔科等。标本份数在5份以下的物种中,有565个物种是受威胁物种(覃海宁等,2017),其中分布地点仅为1~3个的狭域物种有425个,约占采集薄弱的物种数的十分之一。

3 讨论与结论

3.1 中国植物标本采集和研究工作主要在20世纪50年代后由中国作者完成,中国植物标本采集有力地支撑着中国植物分类学的发展

阳文静(2013)通过对650万条标本数据的统计认为我国有3个采集高峰,这三个采集高峰与本文的前三个采集高峰一致,但其所用数据库时间范围仅到2009年,而根据本文的标本数据库第4个采集小高峰是在2013年前后形成。我国植物标本的4个采集高峰真实地反映了我国植物学发展以及植物标本采集的几个重要阶段,并与政府在国家发展的不同阶段所执行的方针政策相呼应。第2和第3个高峰形成于20世纪50至90年代,同时大部分中国植物分类研究也是在20世纪50年代之后完成的,表明中国植物标本采集和研究工作主要在20世纪50年代后由中国学者完成。各国标本采集积累量, 与一个国家植物资源的丰富程度和植物學的研究水平成正比(王文采, 2021)。中国植物标本的采集在短短一百年间,就积累了2 000多万份,平均不到30年就形成了一个采集高峰,并且在2000年之后还有采集高峰,说明中国的标本采集与资源调查工作一直在持续进行,有力地支撑中国植物分类学的发展,给植物分类学研究提供了丰厚的养分。我国的植物标本数字化工作在后植物志时代,继续引领国际潮流,对世界植物分类学的发展持续发挥重要作用。

3.2 我国标本采集空间覆盖度在省级较好,县级标本采集强度和不完整程度极度不平衡

东北平原地区、华北平原地区、长江中下游平原及四川盆地等低海拔地区的标本物种采集完整性严重不足。而山区如横断山区、云贵高原、秦岭、武夷山等生物多样性热点地区(黄继红等, 2014)均有相对较高的标本采集量和较好的物种采集完整性。这个结果和阳文静(2013)的研究结果基本是一致的。造成县级标本采集不平衡现象的主要原因有两个:一方面可能受到采集者偏好(Daru et al., 2018)的影響,如平原地区相对来说多为农耕区,生境异质性较低,物种多样性较低,而我国的标本采集活动大多为专业采集,植物学家相对不重视物种多样性较低地区的采集;山区由于海拔和不同的地理环境差异导致的生境异质性较高,物种的多样性非常高,植物学家更倾向于去山区进行植物采集。另一方面可能与采集地区的知名度相关,如我国一些宗教圣地所处的名山大川,经常吸引植物学家进行采集;此外,还与国家方针政策,植物学家所获科研项目直接相关,如国家部署的资源调查项目等。

3.3 我国标本采集类群覆盖率高,但近五分之一的物种采集不足

我国标本采集类群覆盖率高,但苔藓植物相对于维管植物的采集强度较低。一方面由于研究苔藓植物的专家较少,并且苔藓植物本身矮小使其不易被发现以及高的生境质量要求使其不易被采集,而且鉴定苔藓标本需要花费更多的时间,导致苔藓植物的采集强度及鉴定数量低于其他类群。物种数较多的科,通常标本采集量也较多,并且标本的采集量与植物类群的常见程度紧密相关。物种中采集标本量较多的种,大多是栽培、广布和经济植物,这与该物种的经济价值、采集的便利程度及物种分布幅度有明显的关联,上述结论与阳文静(2013)的研究结果基本一致。另一方面,在类群数字化空缺上,尽管科级采集覆盖度较好,但在科级水平上仍有如白玉簪科等类群存在采集空白的情况。近十分之一的物种标本还没有被数字化, 这些物种大多集中在被子植物和苔藓植物中,其中苔藓植物的种级缺乏率最高。近五分之一的物种标本是采集不足的。

3.4 基于标本数字化建立的数据库对物种多样性的完整性分析仍有一定的局限性我们在运用千万数量级的数据进行时空及类群的现状分析时发现,尽管使用海量的标本数据对我国植物采集情况进行分析,所得到的结论仍可能与真实的情况有所差异,这主要取决于数据库的完整程度, 因为其完整程度对物种编目的完

整性影响非常大(Qian et al.,2018),而采集地理偏差也会导致分析得出的结论不一定真实(Yang et al., 2014;Daru et al., 2018)。之所以造成这种差异,可能主要存在如下因素:(1)类群方面的处理。一方面,数字化标本的数据绝大部分由人工录入,因此可能存在各种问题导致名称的录入错误,从而在我们对标本名称进行校对时,可能会有一些物种因为录入错误而被剔除,从而导致一些类群形成采集空缺;另一方面,由于馆藏标本的鉴定通常滞后于分类学的研究,很多类群在最新的名录系统中已经被处理,然而标本上却未及时更新,以致没有被统计到。尽管我们考虑到这个情况,使用的是2017年的生物物种名录,但是难免还会出现类似的问题。另外,在2017年之后发表的新种的标本采集情况,这里没有进行类群统计。(2)我国标本数字化程度的不均衡。我国标本数字化的程度与参与数字化项目的标本馆数量、运行状况及参与程度直接相关。尽管本文利用了数千万条标本数据进行分析,然而覃海宁等(2019)研究发现,这些标本数据仅占我国馆藏标本的约50%,各馆仍有大量的馆藏标本需要进行数字化,以填补采集空白和薄弱的类群和地区。(3)标本的采集在空间和类群上的分析,没有结合时间分布来进行充分讨论。未来可以考虑分析在一些时间节点之后,哪些物种和地区没有新的标本,据此来布局标本采集的重点。

总体来说,目前中国植物标本数字化工作卓有成效,在类群和时空的覆盖度上都达到了一定的规模。今后的标本数字化工作在继续挖掘馆藏标本的同时,可以考虑:一方面开展对现有数字化标本信息再审核及补充工作,继续面向全国标本馆进行馆藏标本数字化,尤其是加强模式标本及采集薄弱地区,如东北地区馆藏标本数字化,以提高标本数据所承载的时间、空间和类群信息的覆盖度,同时籍此提高馆藏标本的鉴定比例,促进植物分类学的发展;另一方面需要加强与欧美大馆的信息共享以获取更多早期采自中国的历史标本信息。

本文通过对我国目前为止标本收集最全的标本数据库在时间和空间分布以及类群采集方面的分析,了解了我国植物标本在时空、类群方面的采集特点及空缺,所得到的标本采集的未来参考方向,对于国家植物标本资源库生物标本精准采集工作具有重要的参考意义。对采集空白以及采集薄弱的物种进行精准采集,有助于人们了解该物种在目前的野外生存状况,进而有效开展相应的生物多样性评估和采取保护措施;对采集空白及薄弱的地区进行精准采集,可以增加人们对这些地区的植物资源情况的了解且有助于发现新类群。因此,在开展生物标本精准采集时,需要结合分类修订的最新工作,针对标本资源库中空白类群和地区进行精准采集;之后在空缺和薄弱的名单中,按照物种系统学及分类学上的重要意义,以及保护上的重要意义,也可结合其经济上的重要价值进行筛选,如对根据特有属、单种属或寡种属中尤其是木本植物、国家发布的最新《国家重点保护野生植物名录》、新近发表的以及公众关心的一些物种进行精准采集。通过精准采集的科学布局、合理的资源配置,未来国家植物标本资源库将进一步增强实体标本馆能力建设,提高数字化标本质量,以期更好地服务科学及社会。

参考文献:

BAO SY, MAO PY, YUAN S, 1995. A brief history of plant collection in Yunnan: 1919-1950 [M]. Beijing: Science and Technology of China Press.  [ 包士英, 毛品一, 苑淑秀, 1995. 云南植物采集史略: 1919-1950 [M]. 北京: 中国科学技术出版社.]

CHASE MW, REVEAL JL, 2009. A phylogenetic classification of the land plants to accompany APGIII [J]. Bot J Linn Soc, 161: 122-127.

CHEN C, 2002. China administrative divisions history handbook [M]. Beijing: Cartographic Publishing Press: 1-440. [陈潮, 2000. 中国行政区划沿革手册 [M]. 北京: 地图出版社: 1-440.]

CHRISTENHUSZ MJ, REVEAL JL, FARJON A, et al., 2011. A new classification and linear sequence of extant gymnosperms [J]. Phytotaxa, 19 (1): 55-70.

DAI MF, XIANG JP, LIU JA, et al.,2018. Composition Chinese plants based on analysis on specimens and the possibility of discovering new species [J]. Front Data Comput, 9(5): 27-35. [戴迈凡, 向杰平, 刘吉安, 等, 2018. 基于标本探究中国植物的组成变化趋势和新物种发现的可能性 [J]. 科研信息化技术与应用, 9(5): 27-35.]

DARU BH, PARK DS, PRIMACK RB, et al., 2018. Widespread sampling biases in herbaria revealed from large-scale digitization [J]. Newphytol, 217(2): 939-955.

DU C, LIAO S, BOUFFORD DE, et al., 2020. Twenty years of Chinese vascular plant novelties, 2000 through 2019 [J].Plant Divers, 42(5): 393-398.

FREY W, STECH M, FISCHER E, 2009. Bryophytes and seedless vascular plants  [M]. Stuttgant: Gebr. Brontraeger Verlagsbuchhandlung: 1-263.

GOTELLI NJ, COLWELL RK, 2001. Quantifying biodiversity: procedures and pitfalls in the measurement and comparison of species richness  [J]. Ecol Lett, 4(4): 379-391.

GUI LN, LI CY, WANG KN, et al., 2018. Assessment of collection densities of hard-to-collect plant taxa through specimen data and the shortcomings of conducting related studies [J]. Front Data  Comput, 49(5): 41-46.  [桂略宁, 李辰昱, 王康浓, 等,  2018. 通过标本数据评估难以采集的植物类群采集密度及进行相关研究的缺陷 [J]. 科研信息化技术与应用, 49(5): 41-46. ]

HEDRICK BP, HEBERLING JM, MEINEKE EK, et al.,2020. Digitization and the future of natural history collections [J]. BioScience, 70(3): 245-251.

HUANG JH, MA KP, CHEN B, 2014. Diversity and geographical distribution of endemic seed plants in China [M]. Beijing: Higher Education Press: 65-78. [黃继红,马克平, 陈彬, 2014. 中国特有种子植物的多样性及其地理分布 [M]. 北京: 高等教育出版社: 65-78.]

HUANG LQ, ZHAO RH, CHEN SL, et al., 2012. Progress of the Fourth National Census of Chinese Medicine Resources Preparation and Pilot Work [J]. Mod Chin Med, 14(1): 13-15. [黄璐琦, 赵润怀, 陈士林, 等, 2012. 第四次全国中药资源普查筹备与试点工作进展 [J]. 中国现代中药, 14(1): 13-15.]

IGNNBSM, 1983. China Gazetteer [M]. Beijing: Cartographic Publishing Press: 1-313. [国家测绘局地名研究所, 1983. 中国地名录 [M]. 北京: 中国地图出版社: 1-313.]

JAMES SA, SOLTIS PS, BELBIN L, et al., 2018. Herbarium data: Global biodiversity and societal botanical needs for novel research [J]. Appl Plant Sci, 6(6325): e01024.

JIANG CY, YU WX, YANG T, et al., 2018. Analysis of the current status of national botanical specimen collection and prediction of collection trends based on specimen data in Chinese collections [J]. Front Data Comput, 49(5): 94-101.  [姜承勇, 余卫星, 杨婷等, 2018. 基于中国馆藏标本数据分析全国植物标本采集现状及采集趋势预测 [J]. 科研信息化技术与应用, 49(5): 94-101.]

JIN WT, XIANG XG, JIN XH, 2015. Generic delimitation of Orchidaceae from China: current situation and perspective [J]. Biodivers Sci, 23(2): 237-242. [金伟涛, 向小果, 金效华, 2015. 中国兰科植物属的界定: 现状与展望 [J]. 生物多样性, 23(2): 237-242.]

JOHNSON KG, BROOKS SJ, FENBERG PB, et al., 2011. Climate change and biosphere response: Unlocking the collections vault [J]. BioScience, 61(2): 147-153.

LAI GH, 2013. New species of the genus Phyllostachys (Gramineae: Bambusoideae) from Anhui Province, China [J]. Plant Divers, 35(2): 131-140.

LANE MA, 1996. Roles of natural history collections [J]. Ann Mo Bot Gard, 83(4): 536-545.

LIU ZJ, CHEN LJ, 2009. Singchia and Gunnaria, two new genera of Orchidaceae [J]. J Syst Evol, 47(6): 599-604.

MA KP, LOU ZP, SU RH, 2010. Review and prospects of biodiversity research in chinese academy of sciences [J].Bull Chin Acad Sci, 25(6): 634-644. [马克平, 娄治平, 苏荣辉, 2010. 中国科学院生物多样性研究回顾与展望 [J]. 中国科学院院刊, 25(6): 634-644.]

NUALART N, NEUS I, SORIANO I, et al., 2017. Assessing the relevance of herbarium collections as tools for conservation biology [J]. Bot Rev, 83(3): 1-23.

OCONNELL AF, GOLBERT AT, HATFIELD JS, 2004. Contribution of natural history collection data to biodiversity assessment in national parks [J]. Conserv Biol, 18(5): 1254-1261.

PAGE LM, MACFADDEN BJ, FORTES JA, et al., 2015. Digitization of biodiversity collections reveals biggest data on biodiversity [J]. BioScience, 65(9): 841-842.

PONDER W, CARTER G, FLEMONS P, et al., 2001. Evaluation of museum collection data for use in biodiversity assessment [J]. Conserv Biol, 5(18): 1523-1739.

PYKE GH, EHRLICH PR, 2010. Biological collections and ecological/environmental research: a review, some observations and a look to the future [J]. Biol Rev, 85(2): 247-266.

QIAN H, DENG T, BECK J, et al., 2018. Incomplete species lists derived from global and regional specimen-record databases affect macroecological analyses: A case study on the vascular plants of China [J]. J Biogeogr, 45(12): 2718-2729.

QIN HN, LIU HY, HE Q, et al., 2019. Index Herbariorum Sinicorum [M]. 2nd ed. Beijing: Science Press: 1-352. [覃海寧, 刘慧圆, 何强, 等, 2019. 中国植物标本馆索引 [M]. 2版. 北京: 科学出版社: 1-352.]

QIN HN, YANG Y, DONG SY, et al., 2017. Threatened species list of Chinas higher plants [J]. Biodivers Sci, 25(7): 696-744.  [覃海宁, 杨永, 董仕勇, 等, 2017. 中国高等植物受威胁物种名录 [J]. 生物多样性, 25(7): 696-744.]

REN C, TONG TJ, HONG Y, et al., 2016. Seneciochangii (Asteraceae: Senecioneae), a new species from Sichuan, China [J]. PLoS ONE,  11(4): e0151423.

ROBBIRT KM, DAVY AJ, HUTCHINGS MJ, et al., 2011. Validation of biological collections as a source of phenological data for use in climate change studies: A case study with the orchid Ophryssphegodes [J]. J Ecol, 99(1): 235-241.

SUAREZ AV, TSUTSUI ND, 2004. The value of museum collections for research and society  [J]. BioScience, 54(1): 66-74.

The Biodiversity Committee of Chinese Academy of Sciences, 2017. Catalogue of life China: 2017 annual checklist  [CD]. Beijing: Sciences Press.  [中国科学院生物多样性委员会, 2017. 中国生物物种名录2017版 [CD].  北京:  科学出版社.]

THIERS BM, 2021.The Worlds Herbaria 2021: A Summary Report Based on Data from Index Herbariorum(Issue 6.0) [R]. http://sweetgum.nybg.org/science/ih/.

WANG KL, CHEN JX, FAN X, 2018. Analysis of geographical deviations in the collection of specimen records of Rosaceae on the national specimen resource sharing platform [J]. Front Data Comput, 49(5): 54-63.  [王凯莉, 陈嘉欣, 范雪, 2018. 国家标本资源共享平台蔷薇科植物标本记录采集地理偏差分析 [J]. 科研信息化技术与应用, 49(5): 54-63. ]

WANG LS, CHEN B, JI LQ, et al., 2010. Progress in biodiversity informatics [J]. Biodivers Sci, 18(5): 429-443.  [王利松, 陈彬, 纪力强, 等, 2010. 生物多样性信息学研究进展 [J]. 生物多样性, 18(5): 429-443.

WANG WC, 2021. Global plants introduction [M]. Beijing: Beijing Publishing Group Co., Ltd, Beijing Press: 23. [王文采, 2021. 世界植物简志 [M]. 北京: 北京出版集团, 北京出版社: 23.]

WANG YZ, QIN HN, FU DZ, 2004. A brief history of Chinese plant collection  [M]// WU ZY,CHEN XQ. Flora Reipublicae Popularis Sinicae: Tomus 1. Beijing: Sciences Press: 659-703. [王印政, 覃海宁, 傅德志, 2004. 中国植物采集简史 [M]//吴征镒, 陈心启. 中国植物志: 第一卷. 北京: 科学出版社: 659-703.]

WEN J, ICKERT-BOND SM, APPELHANS MS, et al., 2015. Collections-based systematics: Opportunities and outlook for 2050 [J]. J Syst Evol, 53(6): 477-488.

WU CY, RAVEN PH, HONG DY, 2013a. Flora of China: Vol. 1 [M]. Beijing: Science Press; St. Louis: Missouri Botanical Garden Press: 1-254.

WU CY, RAVEN PH, HONG DY, 2013b. Flora of China: Vol. 2-3 [M]. Beijing: Science Press; St. Louis: Missouri Botanical Garden Press.

XU ZP, CUI JZ, QIN HN, 2012. The concept of building Chinas biodiversity e-Science platform [J]. Biodivers Sci, 18(5): 480-488. [許哲平, 崔金钟, 覃海宁, 2010. 中国生物多样性e-Science平台建设构想 [J]. 生物多样性, 18(5): 480-488.]

XU ZP, QIN HN, MA KP, et al., 2012. Research on the management, sharing and application of natural science and technology resources: The case of China Digital Herbarium [J]. Chin Sci Technol Resour Rev, 44(1): 27-33. [许哲平, 覃海宁, 马克平, 等, 2012. 自然科技资源的管理、共享和应用研究——以中国数字植物标本馆为例 [J]. 中国科技资源导刊, 44(1): 27-33.]

YANG WJ, MA KP, KREFT H, 2014. Environmental and socio-economic factors shaping the geography of floristic collections in China [J]. Glob Ecol Biogeogr, 23(11): 1284-1292.

YANG WJ, 2013. Geographical bias in plant collections in China and its impact on the analysis of biodiversity patterns [D]. Beijing: Institute of Botany, Chinese Academy of Sciences: 1-57. [阳文静, 2013. 中国植物采集的地理偏差及其对生物多样性格局分析的影响 [D]. 北京: 中国科学院植物研究所: 1-57.]

YANG Y, 2012. Holdings of type specimens of plants in herbaria of China [J]. Biodivers Sci, 20(4): 512-516.  [杨永, 2012. 我国植物模式标本的馆藏量 [J]. 生物多样性, 20(4): 512-516.

YIN ZL, LIU YQ, XIAO C, 2018. Geographical deviation of orchid specimen record collection and its environmental factor interpretation in the national specimen resource sharing platform [J].  Front Data  Comput, 49(5): 64-71.  [尹朝露, 刘雨晴, 肖翠, 2018. 国家标本资源共享平台兰科植物标本记录采集地理偏差及其环境因子解释 [J]. 科研信息化技术与应用, 49(5): 64-71.]

ZHANG YX, REN M, XIAO C, 2018. Analysis of geographic deviation in the collection of Chinese Rhododendronaceae specimens based on data from the National Specimen Resource Sharing Platform [J]. Front Data  Comput, 49(5): 72-83.  [張玉雪, 任敏, 肖翠, 2018. 基于国家标本资源共享平台数据的中国杜鹃花科植物标本采集地理偏差分析 [J]. 科研信息化技术与应用, 49(5): 72-83.]

(责任编辑 蒋巧媛 邓斯丽)