APP下载

水生植物数据库研究进展

2023-12-25娄岱金赵国强

湿地科学 2023年5期
关键词:物种水稻数据库

娄岱金,苏 玥,赵国强,罗 涛

(江西科技师范大学生命科学学院,江西 南昌 330013)

水生植物是指能够在水生环境中长期或者周期性正常生长的植物[1]。水生植物是风景园林和历史文化等建设中的重要组成部分,水生植物不仅具有很高的经济价值,还在植物育种和植物进化等方面具有重要的科研价值[2]。随着各种生物技术的不断发展,水生植物及其相关研究领域产出了海量的数据[3]。存储和整理这些水生植物数据是水生植物研究领域的热点问题。数据库是水生植物研究领域快速发展的基础[4],实现了水生植物数据的网络共享和水生植物研究领域的跨学科交流[5]。

已有的水生植物数据库,例如,中国水生植物数据库、美国水生植物数据库和欧洲水生植物数据库等,为水生植物及其相关研究提供了重要的数据支持。这些水生植物数据库在植物分类、生物地理学、生态学和生理学等方面都有广泛应用[6]。在数据更新和维护的及时性和数据库的稳定性等方面,现有的水生植物数据库还存在着一些问题。为了进一步推动水生植物数据库的发展,需要建立可持续发展的数据更新和维护机制,加强不同水生植物数据库之间的数据共享[7]。未来,水生植物数据库应该向数据标准化、数据共享和互操作性方面发展,这需要水生植物数据库的管理者和水生植物的研究者共同努力[8]。同时,未来的水生植物数据库还需要不断丰富数据内容,提高数据库本身的特色,开发出更加高效的数据分析和可视化工具,以更好地支持水生植物研究的发展。

本文首先介绍了国内外的水生植物数据库以及包含水生植物数据的植物数据库;然后,以莲(Nelumbo nucifera)和水稻(Oryza sativa)等为例,概述水生植物数据库在水生植物研究中的应用;最后,总结了水生植物数据库发展至今存在的问题,提出对水生植物数据库未来发展的建议。

1 水生植物数据库概述

1.1 中国的水生植物数据库

国内的水生植物数据库建设正在逐步发展,一些研究机构和高校建立了水生植物数据库。

中国科学院植物研究所以中国水生植物志名录的内容为基础,建立了中国水生植物数据库(http://www.plant.nsdc.cn/aquaticplants)。中国水生植物数据库记录了中国的90科739种水生植物的信息,其内容不仅包括水生植物的科、属和物种名称、生长方式、分布地点和描述等信息,还提供了在全球范围内观测和记录的物种分布信息等,为中国水生植物研究者提供了基础资料,是国内比较知名的水生植物数据库。

中国湿地植物博物馆建立的中国湿地植物数据库(http://zgsdzw.com/),包括保护植物和入侵植物专题,对分布在中国湿地中的植物的种类、数量、等级和分布等进行了归纳和统计,并对其生态习性、保护现状、入侵途径、文化和应用等进行了描述。该数据库为湿地中植物的爱好者以及相关领域的专业人士提供了湿地中植物的信息,以供交流和参考。

中国水生植物物种库(http://www.nsii.org.cn/2017/minglu/shuisheng.html)是国家标本资源共享平台下的一个分支数据库,由国家科技基础条件平台资助,由中国科学院植物研究所整合生物多样性大数据平台而构建。截至2020 年3 月31 日,该数据库收录了741 种水生植物,按科、属进行分类,包含了植物名录、标本记录、照片、描述和补充数据的信息等,完善了中国水生植物物种多样性的基础数据。

中国科学院武汉植物园建立了LOTUS-DB(http://lotus-db.wbgcas.cn)数据库,全面提供了莲的注释、基因功能和表达信息。这些信息将方便用户有效地查询和浏览莲基因,下载有关基因组DNA、编码序列(CDS)、转录本或肽序列、启动子和标记的各种复杂数据信息。该数据库促进了莲基因克隆、功能鉴定等多方面的研究,同时推动了水生物种和植物进化方面的研究[9]。

中国水稻研究所推出了名为“水稻世界基因组浏览器”的在线数据库——国家水稻数据中心(http://www.ricedata.cn)。该数据库将全球范围内的水稻基因组测序数据与丰富的水稻基因组注释信息整合在一起[10],通过基因组浏览器的可视化展示,为广大研究者提供了全方位的水稻基因组信息,为水稻分子生物学研究提供了有力的支持[11];促进了水稻基因组和基因功能的研究,为水稻育种和农业生产的发展做出了重要贡献。

以上数据库的建设和发展,不仅提高了水生植物(莲和水稻等)的研究水平和育种效率,也促进了水生生物和植物进化等领域的研究[12]。

1.2 国外的水生植物数据库

IWGS水生植物数据库(https://plants.iwgs.org)是由美国国际睡莲和水园艺协会创建的,旨在分享与水生植物相关的信息、图片和新闻等。目前,该数据库已经包含了3 000种水生植物的信息,为水生植物的育种专家、种植者和兴趣爱好者提供了宝贵的数据。

新西兰的淡水水生植物数据库(https://niwa.co.nz/freshwater/our-services/aquaticplants)作为新西兰国家科学中心平台下的子数据库,具有淡水植物信息资源调查、生物多样性服务、生物安全服务和物种鉴定指南等功能,是一个具有研究价值和实用教育意义的数据库门户网站。

水族馆植物数据库(https://en.aqua-fish.net/plants/)是欧洲中部内陆国家的商用数据库门户网站。自2005 年以来,记录了37 科157 种热带淡水植物的相关信息。

德国的Flowgrow 水生植物数据库(https://www.flowgrow.de/db/aquaticplants)是一个大型的水生植物群落集合在线数据库,由一群水族馆爱好者共同建立和维护,拥有非常全面的水生植物数据信息和水景新闻等,提供了大量有关水族馆水生植物主题的信息,数据库主要包含植物概述、物种鉴定、新型和特种水生植物等部分,为科研人员提技术支持和服务设计等帮助。

加拿大的淡水水族馆植物数据库(https://infolific.com/pets/freshwater-aquariums/plant-database/)由Infolific团队创立。2011年以来,该数据库收集了222种水族馆淡水植物信息,为科研人员提供了基础资料和为水族馆文化爱好者提供了科普信息。

1.3 与水生植物相关的非水生植物数据库

在众多的数据库中,有一些非水生植物数据库,也可以用于水生植物研究。例如,由德国综合生物多样性研究中心研发的TRY 数据库(http://www.try-db.org)是一个结合了原始数据源的植物生态类数据库。自2007 年开始,该数据库在全球范围内搜集植物功能性状等各方面的数据,建立了一个全球植物性状网络数据库,至今已经运行15 a,并发展到第三代数据库。截至2019年,TRY数据库提供了11 850 781 个特征记录、279 875 个植物类群信息和214篇出版物[13],形成了较为全面的植物性状信息,成为供水生植物研究人员便捷使用的植物性状数据公共存储库,并计划在未来开发成一个数据仓库,用于集成植物不同特征的数据[14]。

植物化学成分数据库(http://www.organchem.csdb.cn/scdb/main/plant_introduce.asp)由中国科学院上海有机化学研究所建立。该数据库收录了十万种植物的化学成分信息,包括植物分类信息、植物图片、分离的化学成分和相关研究文献等。用户可通过输入水生植物物种名称、科和属描述信息、治疗的疾病以及化合物等来检索植物信息。

MAPS 数据库(http://www.mapsdatabase.com)是一个比较独特并将所有信息结合起来的植物化学物质和结构数据库,由巴基斯坦费萨拉巴德政府学院大学建立。该数据库包含超过500 种药用植物数据,供研究人员查阅、检索和下载,为水生植物化学研究带来了很大的便利。

PlantGDB 数据库(http://www.plantgdb.org/)是纯植物组学数据库,由美国国家科学基金会创建。2004 年以来,该数据库已经收集了超过100种植物的序列信息,并定期上传其他大型平台[例如,美国国家生物技术信息中心建立的GenBank核苷酸序列数据库(http://www.ncbi.nlm.nih.gov/genbank)等]的数据,为水生植物的研究提供全新的和全面的植物序列信息[15]。

这些数据库都可以用于水生植物研究,并且提供了关于植物的各种信息,包括生态学、化学成分和基因组学方面的数据。这些数据库的出现和发展为水生植物研究提供了便利和支持。

2 水生植物数据库在相关研究领域中的应用举例

2.1 在莲研究中的应用

莲是莲科(Nelumbonaceae)、莲属(Nelumbo)的多年生草本水生植物。莲是中国的重要水生经济作物[16],具有药用、食用和观赏等诸多价值。在植物分类和系统发育等方面,对莲的研究具有代表意义。合理利用植物数据库,可以促进莲基因克隆、功能鉴定等多方面研究的发展,还能推动水生植物物种进化方面的研究[17]。真核生物染色体上的着丝粒由大量经过快速进化的DNA 重复序列组成,对莲着丝粒的研究可以提供古老物种的进化视角[18]。随着莲基因组计划的启动,对莲着丝粒的系统研究将有助于研究莲的物种基因遗传学和分子学。利用LOTUS-DB数据库的莲基因组注释数据库,对莲着丝粒标记蛋白NnCenH3(莲花着丝粒特异性组蛋白H3 变体)进行了表征;利用染色质免疫沉淀(ChIP)技术,恢复了莲的NnCenH3核小体相关序列,描述了古老物种莲的特殊着丝粒轮廓[19],莲着丝粒的性质与其他开花植物有明显差异,这为莲着丝粒的进化机制提供了重要线索,促进了莲基因克隆和功能鉴定等方面的研究,为莲的遗传育种提供了技术支撑。

2.2 在水稻研究中的应用

中国是水稻种植大国,水稻研究一直是中国水生植物研究领域的热点问题。为了研究和整合水稻表型组学的相关知识,建立了水稻表型组学的知识图谱。利用国家水稻数据中心数据库(http://www.ricedata.cn)提供的水稻表型组学的相关数据集,进行了水稻表型组学实体研究[20]。

在水稻的杂交和选育等研究领域中,国家水稻数据中心数据库(http://www.ricedata.cn)也得到了广泛应用。通过对国家水稻数据中心公布的48个宜香优杂交水稻品种的米质进行分析,四川省宜宾市农业科学院的有关科研人员发现,该品种米质除了受自身的遗传因素影响外,环境条件对米质也有很大影响,同一品种的米质在不同省份有很大差异[21];他们还利用国家水稻数据中心提供的两系不育系和两系品种审定数据等信息,将四川省和湖南省两个育种大省的两系杂交稻审定情况进行了对比,在育种方向上进行了研究[22]。此外,还有多个研究机构运用国家水稻中心数据库提供的数据信息来进行蛋白质和基因定位等方面的研究。国家水稻中心数据库的构建,为中国水稻行业做出了巨大的贡献。

2.3 在其他植物研究中的应用

南荻(Miscanthus lutarioriparius)是禾本科(Poaceae)、芒属(Miscanthus)的多年生草本植物,南荻是中国特有的湿生物种。利用数据库和数据库中的工具,对南荻的种质资源遗传多样性进行研究,有利于满足其多样性的育种要求[23]。通过查阅数据库资料和实地考察,采用相关分析和通径分析方法,对长江中下游的高大型南荻的农艺性状和物候期进行了鉴定与划分;利用SLAF-seq简化基因组测序,再利用SSR 分子标记技术,依据GenBank 数据库(www.ncbi.nlm.nih.gov/genbank)已经公布的核酸序列,检测南荻种群中的等位变异和考察其种质资源遗传多样性[24]。

木 贼 (Equisetum hyemale) 是 木 贼 科(Equisetaceae)、木贼属(Equisetum)多年生常绿草本植物。木贼是一种重要的中药材。为了能够筛选出可以鉴定木贼属的核心DNA 条形码,首先,选用木贼属的5 种物种共14 个样品,从GenBank数据库中下载了24条matK序列、13条psbA-trnH序列和84 条rbcL 序列,利用生物信息学软件Muscle,进行序列比对;然后,利用PAUP 4.0软件,计算遗传距离;最后,采用聚类分析方法,利用MEGA 6.0软件,系统分析数据,结果显示,在几种组候选序列中,大亚基基因rbcL 在区分木贼属的不同物种方面具有高效性和准确性[25]。

3 水生植物数据库存在的问题

3.1 数据库更新不及时

与GenBank 和DDBJ 等大型数据库相比,一些水生植物数据库的更新速度较慢[26]。例如,中国水生植物数据库是目前比较完整的收录中国水生植物信息的数据库,虽然其有90 科739 种水生植物的基础信息,但是在近几年其数据的更新信息不多。中国水生植物物种库的数据涉及741 种植物,截至2022年3月,新数据尚未上传到网络公共平台上。一些大型的水生植物数据库,例如,Aquatic Plant Information Retrieval System (APIRS)和Aquatic Plant Database(APD)等,都存在数据更新不及时的现象。这种现象可能是因为技术人员和研究人员侧重的领域不同而形成的数据壁垒所致[27],导致获取到的数据未能得到及时处理和上传,从而影响数据库数据的更新速度。

3.2 数据库内容缺乏特色

中国现有的水生植物数据库多数应用于基础研究。例如,中国水生植物物种库提供植物用途、形态描述和濒危物种保护情况等方面的信息;中国水生植物数据库也是如此,所提供的内容是水生植物的属和物种名称、物种生长方式、分布地点、物种描述等信息。而国外的水生植物数据库更偏向于商业用途,例如,新西兰的淡水水生植物数据库旨在提供淡水植物的技术服务和解决方案;加拿大的淡水水族馆植物数据库为水生植物和水族馆文化爱好者提供服务和科普信息。

纵观全局,国内外水生植物数据库在内容上有一定的地域相似性,缺乏独特的数据库特色,所开发的数据库只针对某一类研究或者服务[28]。

3.3 数据库稳定性差

在访问了前文中所提到的诸多数据库后发现,中国水生植物数据库和中国湿地植物数据库存在无法正常访问的情况,同时还出现了数据库页面加载不流畅的问题,无法正常访问LOTUS-DB数据库中论文标注的网址。一些国外的数据库会因为网络、域名和加载时间过长等问题无法进行访问[29]。

4 讨 论

在植物学、生态学和分子生物学等不断发展的基础上,水生植物研究的内容从简单的分类研究、属性研究到生物化学研究等[30]。各种研究和实验积累了大量的水生植物数据信息。传统的以书籍存储数据的方式,在一定时间内保证了数据的存储和数据的小范围传播,但是随着各种先进技术和专业设备的产生,水生植物数据呈爆发式海量增长,传统的存储方式已经满足不了水生植物研究的数据积累[31]。水生植物数据库的出现推进了水生植物研究的发展,使得海量的水生植物数据被存储和共享。

水生植物数据库发展至今,国内外都创建了很多水生植物数据库。例如,国外的Aquatic Plant Information Retrieval System (APIRS)、Aquatic Plant Database (APD)、European Native Aquatic Plant Database (ENAPD)、New Zealand Freshwater Plant Database等水生植物数据库和国内的中国水生植物物种库、中国水生植物数据库等。这些数据库涵盖了世界范围内水生植物的多样性、分类、地理分布和生态特征等方面的信息,为研究人员提供了所需的数据资源[32-33]。相比之下,中国水生植物数据库的发展相对缓慢,尤其缺乏植物化学、遗传学和生理生态学等方面的数据[34]。

5 展 望

建设和完善中国水生植物数据库仍是一个有待解决的问题。首先,需要建立完善的数据更新机制和人员管理制度,以确保及时更新数据库中的数据;其次,可以通过增加数据库的特色内容,例如,交互式地图展示和生态系统模拟等,提高数据库的应用价值和增加用户体验项目;最后,加强数据库的系统维护和及时修复,保障数据安全,确保数据库的稳定性和持续可用性。

猜你喜欢

物种水稻数据库
吃光入侵物种真的是解决之道吗?
什么是海水稻
水稻种植60天就能收获啦
一季水稻
水稻花
回首2018,这些新物种值得关注
电咖再造新物种
数据库
数据库
数据库