APP下载

全球标本数字化建设及共享发展趋势

2022-04-30陈建平许哲平

广西植物 2022年13期
关键词:数据共享生物多样性

陈建平 许哲平

摘 要:  標本数字化建设是生物多样性保护和利用的重要工作基础,通过标本数据的整合分析,在生物分类学、生态学、生物工程、生物保护、粮食安全、生物多样性评估、教学教育和人类社会活动等方面提供数据支撑。为了了解全球标本数字化建设工作的现状以及数据共享的策略与技术发展趋势,该文分别调查梳理了北美洲、南美洲、欧洲、非洲、亚洲和大洋洲地区的标本数字化和平台建设情况,对标本数据共享现状和趋势从数据使用协议、新技术新方法和公众科学等方面进行了对比和分析,并为中国国内的标本数字化工作提出了工作建议,包括:(1)加强标本数字化建设、管理和动态更新方面的协同机制建设,确保实物资源和数字化资源信息同步;(2)加强数据整理和发布,促进数据质量的提升,充分开放数据使用协议,减少数据使用的阻碍;(3)加强对新技术的学习和引入,特别是开源软件、机器学习和人工智能技术的应用,能够在标签快速识别、自动鉴定和属性数据提取等方面发挥作用;(4)加强区域和国际合作,推动数据的整合应用;(5)推动公众科学项目发展,促进野外采集、室内整理、在线纠错、数据产品研发等工作的开展。

关键词: 标本数字化, 数据共享, GBIF, 公众科学, 生物多样性

中图分类号:  Q94-34

文献标识码:  A

文章编号:  1000-3142(2022)增刊1-0052-10

收稿日期:  2021-07-13

基金项目:  科技部基础性工作专项(2015FY110200); 中国科学院文献情报领域引进优秀人才计划; 中国科学院A类战略性先导科技专项(XDA19050000)。

第一作者: 陈建平(1974-),硕士,高级工程师,长期从事生物多样性信息学研究及信息平台建设工作,(E-mail)chenjianping@csnbgsh.cn。

通信作者:  许哲平,博士,副研究馆员,长期从事生物多样性信息学以及科学数据管理与利用的研究工作,(E-mail)xuzp@mail.las.ac.cn。

Global specimen digitization and sharing trends

CHEN Jianping1, XU Zheping2*

( 1. Chenshan Botanical Garden, Shanghai 201602, China; 2. National Science Library, Chinese Academy of Sciences, Beijing 100190, China )

Abstract:  The digitization of specimens is an important basis for the conservation and utilization of biodiversity. Through the integrated analysis of specimen data, it can provide data support in taxonomy, ecology, bioengineering, biological protection, food security, biodiversity assessment, human social activities and education and other aspects. At present, the development situation varies from country to country. In order to understand the current status of global specimen digitization work, as well as data sharing strategies and technology development trends, this article summarizes the status of specimen digitization and platform construction in North America, South America, Europe, Africa, Asia and Oceania, and reviews the status and trends of specimen data sharing from data use agreements, new technologies and methods, and citizen science using. After comparison and analysis with the current situation in China, proposed work suggestions, including (1) strengthening the construction of coordination mechanisms in the digital construction, management and dynamic update of specimens, ensuring the synchronization of physical resources and digital resource information; (2) strengthening data collation and publishing, promoting data quality improvement, fully opening data use agreements, and reducing data use obstacles; (3) strengthening  the learning and introduction of new technologies, especially the application of open source software, machine learning and artificial intelligence technologies, which can play a role in rapid tag identification, automatic identification and attribute data extraction; (4) strengthening regional and international cooperation to promote data, and the integration and application of data products; (5) promoting the development of citizen science projects, and promote the development of field collection, indoor sorting, online error correction, and data product research and development.

Key words: specimen digitization, data sharing, GBIF, citizen science, biodiversity

过去450年的时间里,科研人员收集的植物标本数量超过3.81亿,分布在全球3 000多个标本馆中 (Krishtalka et al., 2016; Thiers, 2017)。标本数据的整合分析能够给生物分类学、生态学、生物工程、生物保护、粮食安全、生物多样性评估、人类社会活动和教学教育等领域提供重要支撑(Culley, 2013; Heberling & Bonnie, 2017; Soltis, 2017; 张健,2017; 马克平等,2018)。2012年,GBIF在综合众多专家意见的基础上发布了全球生物多样性信息学展望报告(GBIO)(Hobern et al.,2012)。该报告从文化、数据、实证和知识理解四个层次对未来全球的生物多样性数据相关的研究做了展望,并将标本采集数据作为五类基础数据源之一(其他四类数据源为出版物材料、野外观测、基因测序和自动化遥感观测),为标本数据的整合和应用指明了方向。

在全球范围内,过去十年随着生物多样性信息机构(GBIF)、全球生物物种名录(COL)、网络生命大百科(EOL)和生物多样性历史文献图书馆(BHL)等生物多样性数据项目的推动,生物标本数据的汇聚和共享进展迅速。以全球最大的生物多样性观测数据平台——GBIF为例(GBIF,2021),目前观测记录(occurrences)数据总量为16.97亿条,其中传统标本馆的数字化标本数据为1.85亿条(占整个平台数据的10.9%),包括动物(8 637万条,占比46.5%)、植物(8 586万条,占比46.2%)、菌物(707万条,占比3.8%)等。这些标本数据分布前10个的国家是美国(3 546万条)、巴西(1 258万条)、澳大利亚(1 216万条)、墨西哥(892万条)、加拿大(796万条)、日本(609万条)、哥斯达黎加(526万条)、挪威(452万条)、西班牙(404万条)、瑞典(366万条)。为了进一步加强对全球馆藏资源的整合,GBIF在2019年还启动了全球科学馆藏注册系统项目(GRSciColl)(GBIF,2021),收集研究机构、馆藏和相关工作人员的数据,涵盖了所有相关学科,包括地球与空间科学、人类学、考古学、生物学和生物医学以及农业、兽医学和技术等应用领域,增补了标本数据的元数据与相关背景信息,提升了数据质量。

本文通过梳理世界各大洲的标本数字化建设情况,对标本数据共享现状和趋势进行了调研,与我国当前的建设情况进行对比和分析,在数字化建设与共享服务、协同机制、国际合作和公众科学等方面提出了相应的建议。

1 数字化建设

1.1 北美洲标本数字化建设

北美的标本数字化以美国的iDigBio平台为代表,iDigBio 是一个跨机构合作的综合性生物多样性数据平台,是北美地区标本数字化的门户网站(iDigBio,2021)。目前,已经数字化的标本记录数量为 1.28 亿条(植物占47%),多媒体文件记录 3 917 万条(植物占82.5%),总共1 688个数据集。2017年前是iDigBio数字化工作开展最为迅猛的阶段。2017年至今,数据量则呈现出平稳的上升趋势。在项目组织上,iDigBio将参加单位(数据源)的融入划分为4个阶段,分别是准备、协商、行动和数据汇总,按照参加单位所处的阶段,有序开展工作,使得项目能够稳定持续地推进。

在数据规范与标准上,iDigBio 有详细的标本数字化文件规范、图像存储规范、图像处理规范、图像使用规范,使得数字化工作有明确的操作标准。其规范与标准在iDigBio官网上都有开放性的文档说明。基本原则可以概括为:采集图像尽量采用设备的极限分辨率,保证采集质量,图像应该采用无损压缩格式永久存档,图像处理应避免人为过分修饰,处理图像应该基于原始图像,避免误差积累,应尽量为用户提供最佳质量。

在標本数字化技术上,iDigBio将数字化任务划分为5个核心任务集。

(1)数字化前期:主要是标本实体的修复与规范化整理工作。

(2)图像采集:使用专业单反数码相机或者高清标本扫描仪进行图像采集。

(3)图像处理:包括9个常规工作,分别是质量控制、条形码获取、格式转换、颜色亮度调整、图像修剪、图像叠加增强、图像编辑、文件传输、图像内文字识别。

(4)电子数据获取:是指提取或输入标签数据到数据库的过程。具体的工作方法可以是自动化或手工输入,手段包括OCR图像文字识别、语音输入、键盘输入等。

(5)地理位置的描述与地标化处理:审核文本描述的地名,并标注出精确的经纬度坐标点,建议附上误差范围、坐标系等参数。

1.2 欧洲标本数字化建设

欧洲的植物标本馆历史悠久,馆藏丰富,学术机构众多,机构间也形成了良好的合作关系,其中欧洲分类学联盟(Consortium of European Taxonomic Facilities, CETAF)是最大的分类学研究网络,拥有5 000多会员,联盟下机构保存了全球80%已描述的生物多样性标本与数据。BioCASe(The Biological Collection Access Service ) 是 CETAF 推动下创建的数据标准与软件基础体系,指导着标本的数据化与数据共享。BioCASe 数据标准主推 ABCD 标准,在软件系统上提供了全方位的解决方案,包括适用于创建数据平台的 BioCASe Portal 系统,以及适用于数据提供者的 BioCASe Provider Software(BPS)系统,以及网站监控、数据质量检查的工具。BioCASe是GBIF的成员节点,在数据标准、应用系统、共享政策上对GBIF有着重要的影响。通过 BioCASe 的数据整合,欧洲各国的标本数据最终通过 GBIF 进行共享发布。除了CETAF与BioCASe以及GBIF以外,欧洲各国的标本馆、植物园等分类学相关机构也普遍都创建了自己的网站系统,各类专题性的网络数据库非常丰富,还有大量的数据并未纳入GBIF的共享范围。部分数据库因为起步早,积累丰富,已经成为行业内的基础数据库,成为事实上的国际标准与基础平台,如国际植物名称索引(International Plant Names Index, IPNI)等专题数据库。

在俄罗斯,从2014年开始,国立莫斯科大学开始进行标本数字化项目(Alexey, 2018),形成了“国家生物系统仓储银行”计划(Seregin, 2021),包括两个子项目,分别是莫斯科数字标本馆和俄罗斯植物分布图集,并通过在iNaturalist上创建的“Flora of Russia”项目来维护图库。目前,已经累计形成标本113万份,图片111万张,物种3.9万个,地标化数据66万条,标签46万张,OCR记录66万条。

在法国,国家自然历史博物馆的植物标本馆(馆代码为P)的数字化建设也积累了丰富的经验(Le Bras et al., 2017)。该标本馆的第一个专业化工具Vaillant数据库在20世纪80年代中期就被开发出来。从1993年开始建设现在的标本数据库Sonnerat,该数据库目前不仅用来存放博物馆自身馆藏的标本,同时也是一个法语国家的标本馆网络系统(e-ReColNat项目)。大规模的数字化计划则是从2008年资助的Renobota项目开始的。表1展示了该标本馆数字化建设的历史发展。

1.3 非洲标本数字化建设

非洲的植物资源调查与积累起步于殖民地时期宗主国的植物调查,目前有大量非洲标本分散于欧洲各国的标本馆中,随着欧洲标本的数字化工作已经被逐步上网共享,如比利时的皇家中非博物馆,英国邱园的非洲植物计划等,都创建了专题标本数据库,这些数据最终大多通过GBIF对外共享。然而,非洲各国自身的标本馆建设与网络平台建设还在起步阶段,通过与其他发达国家开展合作研究,正在展开很多项目,标本数字化还有很大潜力。以南非国家生物多样性研究所(The South African National Biodiversity Institute, SANBI)为例,已经创建了独立的网站与专题数据库(SANBI,2021),也参加了世界植物在线、千年种子库等国际合作项目,以及非洲植物POSA项目和国家植被数据库NVD等项目,推动了自有标本资源的数字化,目前公开共享的数据大部分是通过GBIF发布。肯尼亚国家博物馆的东非植物标本馆(East African Herbarium)拥有热带非洲最大的植物学收藏,目前拥有700 000多条植物标本及相关记录,是热带非洲最重要的国家级数据中心,研究主要集中在东非植物的分类、分布、开发利用与保护方面。数据管理技术方面,除了GBIF平台外,BRAHMS系统在非洲应用较为广泛,为肯尼亚国家博物馆、南非BLFU标本馆等多个机构均提供了技术支持(East African Herbarium, 2021;BLFU, 2021)。

总之,非洲的标本数字化工作基础资料在欧洲,主要通过GBIF共享数据,自有标本资料与数字化工作外部依赖性很强,工作空白区较多,未来的潜力很大。

1.4 南美洲标本数字化建设

南美的大量历史标本都保存于美国、欧洲的各个研究所与大学的标本馆中。除巴西外,各国的标本馆数字化建设程度都比较低,目前能够获取的标本数据几乎都来自GBIF,按植物标本记录统计,巴西约有 700万,哥伦比亚 139.2万,秘鲁80.7万,阿根廷 72.2万,玻利维亚 52.6万。在独立的信息系统建设上,巴西的体系比较完整,很有特色。巴西的标本数字化工作主要体现在 speciesLink 平台中(speciesLink,2021),截至2021年4月15日,已经上线的数据包括了 534 个数据集,1 521.9万条在线记录,其中 1 129.5万条记录具有地理坐标,378.5万条记录包含图像,53.2万份模式标本,其中藻类真菌与植物标本合计有1 097万条记录在线。从2002年至今,数字化标本量呈现稳定上升的趋势。在数字标本管理系统方面,speciesLink的精细化实时管理技术十分突出,其指标系统indicators,可以详细展示每天新增的数据集、标本记录、地标化记录等量化指标;其数据清理系统,可以在线展示出数字标本中存在的问题类型与错误统计,诸如必填字段的空缺、地理坐标缺失、地标错误(如位置在海中)、重复的编号、怀疑出错的学名人名、地名错误等,很多问题都附上了自动化的建议,问题可以逐级展开,可跟踪到具体的标本记录本身,可供随时修订;其工具与应用软件服务十分丰富,提供了十余套专业软件服务,涉及到数据管理、地标化与地图应用、物种数据库管理、物种分布模型、物种查询浏览器插件、网络平台管理、专业量化指标系统等方面。

1.5 大洋洲标本数字化建设

澳大利亚虚拟植物标本馆是一套在线资源库(Atlas of Living Australia, ALA,2021),可在線访问澳大利亚和新西兰植物标本数据,总数量超过666万份(来自23家澳大利亚和新西兰的标本馆)。后随澳大利亚生物图集(ALA)项目的开展,AVH被合并到ALA中一起发展(ALA,2021)。在ALA中,与AVH同级别的数据合作伙伴还包括在线动物馆藏记录集(Online Zoological Collections of Australian Museums, OZCAM)、澳大利亚种子银行合作伙伴(Australian Seed Bank Partnership, ASBP)和默里达令盆地管理局(Murray-Darling Basin Authority, MDBA)。

新西兰总的植物标本超过140万件,拥有世界上最多的南极植物标本数据,约有64万件。2011年,新西兰虚拟标本馆(New Zealand Virtual Herbarium, NZVH)正式启动,这是一个拥有11个标本馆数据的虚拟合作网络,可以在线提供70万件标本的查询和检索。该系统由澳大利亚虚拟标本馆(AVH)提供软件和技术支持。随后,该项目也被合并到AVH中,并最终成为ALA的一部分。

1.6 亚洲地区

截至目前,亚洲地区由于民族多、语言复杂及经济和科研工作相对落后的原因,数字化工作还任重道远。尽管中国、印度、日本、韩国等地在生物多样性数据库建设方面有比较好的基础,但大多数亚洲国家尚没有完善的生物多样性数据库, 标本数字化建设工作相对落后。以GBIF上东南亚国家的标本数量及其贡献国家来看(表2),该地区的标本绝大多数并不是由本国发布的,而是欧美国家数字化后发布,还有些国家尚无任何数字标本共享,急切需要内外部力量合作,来共同推动该地区的标本数字化建设工作。

基于此,我国科研人员在亚洲生物多样性保护和数据库网络计划(ABCDNet, 2021) 的基础上提出了亚洲植物多样性数字化计划(Mapping Asia Plant,MAP),分东南亚、南亚、西亚、中亚、北亚(俄罗斯亚洲部分)和东北亚6个区域推进工作,从文献出版物和标本数据整理入手,正在逐步推进亚洲地区的生物多样性数字化建设与共享合作(马克平,2017)。

2 标本数据共享现状和趋势

2.1 GBIF平台上的数据共享现状

GBIF是全球标本数据最大的共享平台,通过对GBIF上各大洲的参与国家和数据发布情况进行分析统计,可以了解全球标本数据的总体共享情况(表3)。由表3可知,欧美国家的数据贡献占了全球的绝大部分,发展中国家的贡献相对有限,与国际经济文化的发展水平密切相关,但发展中国家潜力巨大,将是未来标本数据增长的基础。

2.2 数据使用协议和声明

标本数据在共享和流通之前,需要明确其使用协议,用户才能合法使用和加工。2013年,GBIF对1.2万个数据集中的4.16亿条数据记录做了数据协议的总体分析后发现,只有10%的数据集拥有协议声明,而数据协议竟然有432种,这极大地阻碍了数据的共享和流通(Peter,2013)。在此调研基础上,GBIF管理委员会进行了广泛的沟通和咨询,对混乱的数据协议做了梳理,要求将所有的现有协议都等同地设置为以下三个协议:CC0、CC BY和CC BY-NC。经过梳理之后,目前的数据协议占比情况是CC0 1.0(56.7%)、CC BY 4.0(27.6%)、CC BY-NC 4.0(15.7%)。从对北美和澳大利亚的标本数据平台的共享协议(表4)分析可以看出,CC0和CC BY是最受欢迎的共享协议。但目前仍然有大量的标本馆平台,数据界面没有明确标识使用协议,部分数据使用还需要繁琐的线下申请和审批流程,制约了数据流通和再利用。

2.3 新技术和新方法

在标本数字化与数据共享的技术与方法上,受到IT技术突飞猛进的影响,在几乎所有应用环节都出现了革新。在数字影像的获取上,流水线式作业的高速扫描系统使得海量标本的快速数字化成为可能,在提升图像质量方面,针对分类学研究的需要,为了强化分类学特征,出现了高清扫描仪、标本的侧光摄影术以及结合解剖镜的显微摄影。在动物标本数字化中,还出现了三维高清影像获取设备等新创举。在野外调查工作中,高清数码相机、智能手机、手持GPS等智能设备应用普遍,获取了海量的带有精确地理坐标的植物活体影像数据,为标本提供了丰富的背景资料,某些情况下甚至替代标本成为唯一的凭证资料。

在数据管理与发布方面,除GBIF官方提供的IPT(集成发布工具包)之外,还有BRAHMS (Botanical Research and Herbarium Management System,植物研究和标本馆管理系统)应用比较广泛,由英国牛津大学植物系历经数十年研制而成,广泛用于标本馆、植物园、树木园、种子库等科研单位,可提供数据管理与在线发布。

在数据挖掘与分析方面,基于GBIF数据已有大量的数据分析工具和代码,可对标本和观测数据进行分析和挖掘,仅GitHub网站上,GBIF相关的开源代码库就有686个,其中R语言85个,Python语言54个,Java语言52个,JavaScript语言51个。 iDigBio、BioCASe、AVH、NSII 等平台也都有专门的应用工具专栏。不同开发语言的数据访问工具包也逐步完善,可以通过数据接口与应用程序快速整合, 提供灵活高效的编程环境。例如,iDigBio 提供的Python开发包,使得编程访问iDigBio数据非常顺畅,加上Python科学计算与人工智能的应用生态,可为数据开发者提供强大的技术支持。国内开发的软件工具的功能也日益强大,如用于标本馆管理的herblabel(张金龙等,2016),用于分类树构建与分析的Taxonomic Tree Tool在线工具(Taxonomic Tree Tool, 2021),用于生物多样性数据清洗、统计与分析的 ipybd (Ipybd,2021),在技术实力,以及应用效果上都令人印象深刻,具有极强的实用性。

随着人工智能深度学习技术的突破,图像识别App进入了实用期,互联网巨头如谷歌、微软、腾讯、百度等均有专题应用,也公布了开放的API,人工智能识别已经成为一项公共基础服务。应用于生物学领域,就出现了一批生物图像识别的App,如识别植物的形色、花伴侣,用于识别标本的标本馆伴侣等,虽然在覆盖的物种数量、识别精度上还处于起步阶段,但已经在公众科学、科普领域取得了全社会的关注与认可,对常见植物的识别准确率已经能夠满足普通公众的日常需求,通过实践证明了人工智能巨大的应用潜力。未来还需要在识别中加入地理因素,充分利用分类学知识,尤其是标本数据,强化训练,扩大识别范围,让人工智能技术获得更多的应用场景。另外,在种子鉴定、花粉鉴定、品种鉴定、有害入侵物种自动鉴定等细分领域也将大有可为,让分类学知识通过人工智能服务于社会。标本数字化提供的大量数据,将是人工智能时代机器学习的重要基础。

2.4 公众科学的发展

标本数字化工作和公众科学探索意愿的结合,催生了各种公众科学项目的诞生。如邱园网站提供了19世纪信件识别、 真菌特征补全、 植物和真菌标本标签识别和手机珍稀植物保护计划等公众可参与项目。大英历史博物馆开展了兰花观察者(Orchid Observers)的公众科学项目,通过公众参与获得数据,使用兰花作为模型,用于深入研究气候对英国植物区系的影响。北美地区的iDigBio 平台也提出了公众可参与的众包项目以及LiveScience项目。目前影响最大的项目是iNatrualist,它通过移动App为野外考察提供了非常便捷的工具,创建了在线社区,将分类学家与生物爱好者基于兴趣组织起来,通过众包方式收集了大量的生物影像资料,为科学研究提供了丰富的第一手资料。这些项目拉近了公众与标本馆、数据库的距离,将科学研究、科普宣传与社会服务结合在一起,通过灵活的工作策略,获得了普遍的认同。

与国际趋势类似,中国的公众科学活动经过多年的发展,也形成了多种层次多种方式的公众科学信息平台。包括基于论坛、微博、即时通讯工具等通用公众信息交流平台上的兴趣群组,也包括基于移动App、微信小程序、Web App等专用工具的兴趣群组,如中国自然标本馆(CFH)、中国植物图像库(PPBC)、Biotracks、形色、花伴侣、绿途等均有大量的科学家与爱好者加入。

这些公众科学平台积累了大量的野外观测资料,是对传统标本数据重要的补充,部分资料可以代替标本成为研究的重要凭证。通过整理与审核,其中高质量的数据可以作为标本数据库中的新型数据资源类型,成为标本数字化资源库的正式组成部分。

3 讨论与建议

通过梳理全球标本数字化的现状和进展,与国际相比,国内标本数字化建设与数据共享虽然已经取得了非常好的成效且有自己的优势,但仍然存在一些问题,需要努力解决。例如,标本数字化多是基于数据汇缴的项目制管理,进行集中共享,缺少后期的分布式数据网络节点建设,形成了中心强,节点弱的格局,数据质量的持续更新缺乏相应的机制支持。数据共享方面存在共享协议不规范,标识不明确,尤其是在多语言的互联网环境下,大规模数据使用授权上,仍然需要线下沟通,对数据复用造成困扰。另外,在新技术应用、国际合作以及公众科学方面,虽有良好的基础,但还缺乏亮点项目与应用。通过与国际趋势的对比,结合实际情况,提出以下建议。

(1)加强数字化建设、管理和动态更新方面的协同机制建设,确保实物资源和数字化资源信息的同步。加强标本数据与其他生物多样性数据的融合,成为这个学科的重要资源拼图。

(2)加强数据整理和发布,促进数据质量的提升,尤为重要的是分类学和时空信息等。充分开放数据使用协议,利用CC0或者CC BY协议来减少数据使用的阻碍。充分利用GBIF IPT工具对数据进行对外发布,并通过文献引用的跟踪,分析标本数据在不同领域的应用和服务情况。通过数据的共享服务及使用,获得数据反馈,及更新数据,提升数据质量。

(3)加强对新技术的学习和引入,特别是机器学习和人工智能技术的应用,能够在标签快速识别分类、标本自动辅助鉴定和特征属性的数据提取等方面发挥作用。加强针对标本数据的开源代码研究。

(4)加强区域和国际合作及数据的汇聚和整合。通过MAP等区域或国际合作项目来推动跨国家或跨区域的数据建设和共享,带动薄弱国家的标本数字化建设。

(5)加强公众科学项目的合作和推广,让专业人员和大众爱好者參与进来,促进标本数据的野外采集、室内整理、在线纠错、数据产品研发等工作的开展。

参考文献:

ABCDNet: Asia Biodiversity Conservation and Database Network [EB/OL].(2021-04-15). http://www.abcdn.org.

ALEXEY PS, 2018. The Largest Digital Herbarium in Russia is now available online [J]. Taxon, 67(2): 463-467.

AVH: The Australasian Virtual Herbarium  [EB/OL]. (2021-04-15). https://avh.chah.org.au.

ALA: Atlas of Living Australia [EB/OL].(2021-04-15). https://www.ala.org.au/.

CULLEY TM, 2013. Why vouchers matter in botanical research [J]. Appl Plant Sci, 1(11): 1300076.

East African Herbarium  [EB/OL]. (2021-04-15). http://eaherbarium.museums.or.ke/.

Geo Potts Herbarium (BLFU), 2021.  [EB/OL].(2021-4-15). https://herbaria.plants.ox.ac.uk/bol/blfu/.

Global Biodiversity Information Facility (GBIF), 2021. GBIF Registry of Scientific Collection(GRSciColl) [EB/OL].(2021-04-15). https://www.gbif.org/en/grscicoll.

Global Biodiversity Information Facility (GBIF), 2021. Occurrence Search.( [EB/OL]. (2021-04-15). https://www.gbif.org/occurrence/search.

HEBERLING JM, BONNIE LI, 2017. Herbarium specimens as exaptations: New uses for old collections [J]. Amer J Bot,104:1-3.

HOBERN D, APOSTOLICO A, ARNAUD E, 2012. Global Biodiversity Informatics Outlook: Delivering biodiversity knowledge in the information age  [EB/OL]. (2021-04-15). https://doi.org/10.15468/6jxa-yb44.

Integrated Digitized Biocollections (iDigBio), 2021.  [EB/OL].(2021-04-15). https://www.idigbio.org/.

Ipybd-Powerful Data Cleaner For Biodiversity [EB/OL]. (2021-05-13). https://github.com/leisux/ipybd.

KRISHTALKA L, DALCIN E, ELLIS S, 2016. Accelerating the discovery of biocollections data. Copenhagen: GBIF Secretariat. [EB/OL](2021-04-15). http://www.gbif.org/resource/83022.

LE BRAS G, PIGNAL M, JEANSON ML, 2017. The French Muséum national d′histoire naturelle vascular plant herbarium collection dataset. Sci Data. 2017 Feb 14;4:170016. doi: 10.1038/sdata.2017.16. [EB/OL] (2021-4-15). https://pubmed.ncbi.nlm.nih.gov/28195585/.

MA KP, 2017. Mapping Asia Plants: A cyber infrastructure for plant diversity in Asia [J]. Biodivers Sci, 25(1):1-2  [马克平, 2017. 亚洲植物多样性数字化计划 [J]. 生物多样性,  25(1): 1-2.]

MA KP,  ZHU M,  JI LQ, 2018. Establishing China infrastructure for big biodiversity data [J]. Bull Cas,  33(8): 838-845.  [马克平,  朱敏,  纪力强,  2018. 中国生物多样性大数据平台建设 [J]. 中国科学院院刊,  33(8): 838-845.]

PETER D, 2013. Analyzing the licenses of all 11, 000+ GBIF registered datasets  [EB/OL]. (2021-04-15). http://peterdesmet.com/posts/analyzing-gbif-data-licenses.html.

SEREGIN AP, 2021. Moscow Digital Herbarium: Electronic resource. -Moscow State University,  Moscow.  [EB/OL]. (2021-04-15). https://plant.depo.msu.ru/.

SOLTIS PS, 2017. Digitization of herbaria enables novel research [J]. Amer J Bot, 104: 1-4.

speciesLink  [EB/OL]. (2021-04-15). http://www.splink.org.br/.

Taxonomic Tree Tool (TTT) [EB/OL]. (2021-04-15). http://ttt.biodinfo.org/.

The South African National Biodiversity Institute (SANBI) Website  [EB/OL]. (2021-04-15). https://www.sanbi.org/.

THIERS B, 2017. The Worlds herbaria 2016: A summary report based on data from Index Herbarium.  [EB/OL]. (2021-04-15). http://sweetgum.nybg.org/science/ih/.

ZHANG J, 2017. Biodiversity science and macroecology in the era of big data [J]. Biodivers Sci, 25(4): 355-363.  [張健, 2017. 大数据时代的生物多样性科学与宏生态学 [J]. 生物多样性, 25(4): 355-363.]

ZHANG JL, ZHU HL, LIU JG, 2016. Principles behind designing herbarium specimen labels and the R package ‘herblabel [J]. Biodivers Sci, 24(12): 1345-1352. [张金龙, 朱慧玲, 刘金刚, 2016. 植物标本标签设计的原则及R程序包herblabel [J]. 生物多样性,  24(12): 1345-1352.]

(责任编辑 李 莉 周翠鸣)

猜你喜欢

数据共享生物多样性
科学大数据的发展态势及建议
关于湿地生物多样性保护措施的探讨
新疆夏尔希里自然保护区资源的保护研究利用
数字化迎新系统宿舍分配模块的设计与实现
利用生物多样性防治园林植物病害的可行性分析
贵州大数据产业发展战略理解和实施建议
云南林下经济模式中生态安全问题探析
面向海上平台机械电气设备的数据共享平台的设计与实现
基于协同办公的会议管理系统设计与实现
博斯腾湖湖区植物多样性特征研究