APP下载

基于文献计量分析的土壤微生物群落构建研究态势

2023-09-11张泽晋宋秀芳杨幼清夏安全吴文超崔骁勇

生态学报 2023年16期
关键词:发文群落测序

陈 炀,张泽晋,王 芳,3,李 通,宋秀芳,杨幼清,夏安全,吴文超,崔骁勇,7,8,*

1 中国科学院大学生命科学学院,北京 100049 2 中国科学院大学中丹学院/中丹科教中心,北京 100049 3 格里菲斯大学地球健康和粮食安全中心, 布里斯班,澳大利亚 4111 4 中国科学院大学资源与环境学院,北京 100049 5 中国科学院文献情报中心,北京 100190 6 中国科学院大学经济与管理学院图书信息与档案管理系,北京 100190 7 北京燕山地球关键带国家野外科学观测研究站,北京 100408 8 中国科学院青藏高原地球科学卓越创新中心,北京 100101

群落构建机制是生态学研究的核心与焦点,但研究对象多集中于动植物群落[1]。土壤微生物作为陆地生态系统中最重要的分解者,在元素循环、能量流动及生态系统功能中均发挥着重要作用[2],但因微生物自身的特点(体积小、数量庞大、代谢快和变异性强),一度被认为不存在地理分布格局[3]。近些年来,随着测序成本的下降以及测序技术的进步,产生了大量的测序数据[4]。随着测序数据挖掘能力的提升,越来越多的研究者关注并进入微生物群落构建研究领域,并且逐渐认识到微生物群落也存在时空演变规律和经典的生态过程等。与此相应地,微生物群落构建模型迅速发展,从最初的零模型[5],到后来的NST[6]、MST[7]、Sloan中性模型[8]、QGEN[9],再到iCAMP[10],算法的准确性和精度不断提高。模型和算法的进步加深了我们对于微生物群落构建的理解,也为分析确定性过程和随机性过程的相对重要性提供了更为坚实的基础[11—12]。近十年来,土壤微生物群落构建领域的发文数量呈现指数增长,采用精确合理的文献计量方法,对文献数据进行多元可视化分析,可以加深对该领域研究现状的理解,提高对该领域研究热点的把握。

本研究以Web of Science(WOS)核心合集数据库为数据源,检索2003—2022年期间土壤微生物群落构建领域的论文文献,基于文献数据的数量特征以及重要指标之间的关联程度,借助VOSviewer、Scimago Graphica以及bibliometrix包(R语言)可视化工具进行文献计量分析,厘清土壤微生物群落构建领域的研究现状,归纳二十年间国内外的研究进展,梳理该领域未来的研究热点,以期为我国未来在该领域开展研究工作提供借鉴与参考,促进该研究领域的深入。

1 研究方法

1.1 数据来源

本研究分析的文献数据来源于科睿唯安(Clarivate Analytics)Web of Science(WOS)核心合集数据库。Web of Science(WOS)数据库是可进行文献计量数据检索的重要科学搜索引擎[13—15]。与PubMed、Scopus、Google Scholar等其它数据库相比,WOS被认为是全球性的、以质量为导向的数据库,其包含更标准化的记录,可用于检索全球范围内多学科领域的文献记录[16]。预检索的结果表明,自20世纪以来,土壤微生物群落构建研究领域的文章全部发表于2003年之后,因此将检索日期范围设置为:2003年1月1日至2022年3月1日。检索日期为2022年3月11日,所有分析均以当时导出的元数据为基础,以排除重新检索可能导致的检索记录的变化。检索时采用“高级检索”模式,根据前期的文献阅读,将检索主题设置为:“TS=((Soil OR Ground OR Land OR Earth OR Dirt OR Edaphic) AND (Microbe OR Microbial OR Microorganism OR Microbiology OR Germ) AND (Community Assembly))”。总共检索到1141条记录。为聚焦到土壤微生物生态学的研究态势分析,对检索到的条目进行数据清洗[17]。在研究方向一栏中将不相关研究方向剔除,只保留微生物生态学学相关的研究方向(Environmental Sciences Ecology, Microbiology, Agriculture, Plant Sciences, Biotechnology Applied Microbiology, Biodiversity Conservation, Forestry, Evolutionary Biology, Mycology, Physical Geography and Science Technology Other Topics)。数据清洗后总共得到928条记录。将所得到的文献条目的全记录与引用的参考文献导出,以进行后续的文献计量分析。

1.2 分析方法

数据(全记录及引用的参考文献)导出后,对发表年份、被引频次、出版物总量、国家(地区)、作者、作者所属机构、期刊和关键词等信息进行提取与整合。利用WOS数据库的文献计量功能分析土壤微生物群落构建研究领域的年度发文量及被引频次[18—20]。利用VOSviewer(version 1.6.18)文献计量可视化软件挖掘分析检索得到的文献[21],并实现作者、期刊、机构、期刊和关键词的共现网络可视化。VOSviewer是荷兰莱顿大学科技研究中心(The Centre for Science and Technology Studies, CWTS)的van Eck和Waltman[22]于2009年开发的一款分析文献知识单元的可视化工具,其图形展示能力强,适合分析大规模样本数据。利用Scimago Graphica将世界上不同国家(地区)的发文量可视化[13],该软件可以快速绘制个性化地图。利用R语言(version 4.1.3)中的bibliometrix包将关键词(研究热点)的演变趋势可视化[23]。bibliometrix包功能强大,可以实现多种文献计量分析。

2 结果与分析

2.1 年度发文量与被引频次

如图1所示,根据年发文量的变化趋势,可将自20世纪以来土壤微生物群落构建领域的研究大体划分为三个阶段。第一阶段是萌芽期(2003—2005年)。在此期间,开始有研究者关注土壤微生物群落构建,其中2003年Jumpponen[24]在New Phytologist上发表的名为“Soil fungal community assembly in a primary successional glacier forefront ecosystem as inferred from rDNA sequence analyses”的研究论文是该领域的破冰之作,强调了随机性过程和空气中孢子沉降在早期真菌群落构建中的重要性,但总体上看,微生物群落构建并未引起广泛关注。第二阶段是波动发展期(2006—2011年)。这一阶段的发文量较第一阶段有所增加,但年发文数量呈波动状态,且没有一年的单年发文量达到10篇。这说明有更多的科学家关注并进入土壤微生物群落构建研究领域,但可能受限于当时的测序成本高昂、微生物群落构建方法不成熟,在很长一段时间内相关研究论文的发表量一直维持在一个相对稳定的较低水平。第三阶段是指数增长期(2012—2021年)。2012年在Nature[25]上刊登了一篇名为“Revealing structure and assembly cues for Arabidopsis root—inhabiting bacterial microbiota”的文章(被引频次:1144),分析了内生菌在拟南芥根中的定殖过程,引起了广泛的关注。以此为起点,随着测序技术的迅速发展和成本的快速降低,以及更为精致的微生物群落构建模型的出现[10],越来越多的研究者投入到土壤微生物群落构建领域的研究中,发文量也呈现出指数增长的趋势。

图 1 2003—2022年土壤微生物群落构建研究文献的时间分布Fig.1 Annual number of publications on the soil microbial community assembly research from 2003 to 2022

被引频次居于前三名的论文分别发表在Nature、The ISME Journal以及PNAS上[25—27],它们的引用次数均超过了1000次(截至2022年3月11日),分别为1144、1071和1008(表1)。除上文介绍的排名第一的论文外[25],排名第二的论文利用网络分析方法探索了土壤微生物群落的共现模式,排名第三的论文研究了水稻根系相关微生物组的群落构建过程;排名第四、第五的论文的研究内容分别是总结菌根研究进展、微生物群落构建的模式和过程[28—29],被引频次分别为755和701。排名前十的文章的被引频次均超过了480,这说明土壤微生物群落构建目前是一个热门的研究领域,得到了研究者们的广泛关注。国内土壤微生物群落构建领域单篇被引次数最多的学者是来自中国科学院南京地理与湖泊研究所的王建军研究员,其于2013年发表在The ISME Journal的论文被引用高达321,该文探索了跨生态系统细菌组合的系统发育β多样性[30]。

表1 WOS数据库中被引频次前10的文献

2.2 作者及其合作关系

表2列出了2003—2022年间WOS数据库中在土壤微生物群落构建领域收录文献数量居前的作者,包括俄克拉荷马大学植物学与微生物学系环境基因研究所的周集中(Zhou JZ)、中国科学院成都生物研究所的李香真(Li XZ)、南京农业大学的沈其荣(Shen QR)、西北农林科技大学的韦革宏(Wei GH)、中国科学院南京土壤研究所的褚海燕(Chu HY)和西北农林科技大学的焦硕(Jiao S)等,前十位的发文篇数范围在12—21之间,被引频次范围在95—518之间,篇均被引频次范围在7.92—40.33之间,权重链接总强度在13—56之间。权重链接总强度由VOSviewer生成,其值大小反映了该作者与其他作者的合作程度[31—32]。

表2 WOS数据库发文数量排名前10的作者情况

领域的高产出作者以及作者间的合作状况是该研究领域知识积累的关键力量[15]。通过作者共现网络可视化,可以发现该研究领域的核心作者及其合作关系。在作者共现图中,圆点面积越大,代表其发文数量越多;合作者之间相互连接的线条越粗,代表学者之间的合作越紧密;在每一聚类簇中,最大的圆点即是该聚类簇中的核心作者,他们对推进学科发展、拓宽研究领域起到关键性作用。

图2显示了2003—2022年间土壤微生物群落构建研究领域中的99名作者及其合作关系,从图中可以看出,该领域的研究呈现出“多元性”的特点,形成了多个发文量高、合作密切的学术团体。周集中(Zhou JZ,论文篇数21,被引频次518,篇均被引频次24.67,权重链接总强度56)、李香真(Li XZ,论文篇数18,被引频次427,篇均被引频次23.72,权重链接总强度40)和褚海燕(Chu HY,论文篇数13,被引频次384,篇均被引频次29.54,权重链接总强度32)发文量高(图2)、权重链接总强度高(表2),是土壤微生物群落构建研究领域的核心作者,形成了各自的合作关系群。图2还显示,核心作者周集中的合作关系群最大,与多个高产作者之间有紧密合作关系,包括褚海燕、韦革宏和邓晔等。

图2 土壤微生物群落构建领域论文的主要作者及其合作关系Fig.2 The author cooperative relationships of publications on soil microbial community assembly

周集中团队系统综述了随机性过程在微生物生态学中的重要性[11],并先后开发了NST指标以及iCAMP模型[6,10],在理论和应用方面加深了对于微生物群落构建的理解,为推动该领域发展做出了巨大贡献;李香真团队研究了不同生境下(例如:根际、高寒草甸、湿地以及森林等)的微生物群落构建过程中确定性过程和随机性过程的相对重要性[33—36],提高了对于不同环境条件下微生物群落构建过程的认识;褚海燕团队则深入研究了广泛地理格局下的微生物群落构建过程,为进一步推动微生物群落构建在生物地理学中的应用提供了重要科学依据[37—39]。

2.3 国家(地区)研究机构及其合作关系

在2003—2022年期间,共有来自63个国家(地区)的研究者发表了928篇关于土壤微生物群落构建的文章。中国、美国、德国、荷兰、英国、法国、澳大利亚、加拿大、西班牙和瑞士是过去20年在该研究领域发表文章数量最多的10个国家(图3)。40.3%的文章由中国的作者发表或者与中国作者合作发表(374篇),反映出国内学者对该研究领域有着较高的关注程度与研究兴趣[40—43]。美国是发表文章数量排名第二的国家(331篇),占发文总数的35.7%。虽然美国发文总数不如中国,但美国发表的文章有着高被引的特点,331篇文章总共被引用了16774次,相较美国,中国374篇文章总共只被引用了5954次。德国和荷兰发文数量为101篇和69篇,占发文总量的10.9%和7.4%,排名在第三和第四位。英国和法国并列第五,发文量均是55篇,在发文总量中占比均为5.9%。整体而言,有关土壤微生物群落构建的研究文章集中发表于中国、北美、西欧和澳大利亚。

图3 土壤微生物群落构建领域发文量居前10位的国家Fig.3 The top 10 countries with the most publications on soil microbial community assembly

2003—2022年期间在该领域发表文献数量排名前10位的机构有中国科学院(Chinese Academy of Sciences)、加州大学伯克利分校(University of California, Berkeley)、西北农林科技大学(Northwest A&F University)和科罗拉多大学(University of Colorado)等(表3),发文数量在21—168之间,总被引次数在193—3807之间,权重链接总强度在23—217之间。其中,发文数量最高的研究机构为中国科学院,占发文总数的18.1%。在WOS数据库中收录论文数量排名前10的研究机构中有5个是中国的研究机构,分别为中国科学院、西北农林科技大学、浙江大学、清华大学和南京农业大学,发文数量分别占发文总数的18.1%、4.1%、2.7%、2.5%和2.5%。中国科学院相关单位发文数量远超其它研究机构,圆圈面积大(图4),权重链接总强度高,是该研究领域的核心研究机构。由图4及相关论文可知,作为土壤微生物群落构建领域发文量排名第3的研究机构,西北农林科技大学与中国科学院相关单位存在密切合作关系。

图4 WOS数据库中土壤微生物群落构建领域文献来源机构分布及其合作关系Fig.4 Distribution of publications source institutions in field of on soil microbial community assembly in WOS database and their cooperative relationships

表3 WOS文献发文量前 10 位的研究机构

2.4 来源期刊

2003—2022年期间WOS数据库收录的土壤微生物群落构建领域文献来源于154种期刊。表4列出了载文量前10位的期刊,其中Frontiers in Microbiology载文量最高(109篇),占文献总数的11.7%,为该领域的主要来源期刊;The ISME Journal被引频次(5555)和篇均被引频次(115.73)均为最高,影响因子排名第二(IF=9.66),为该研究领域的顶级期刊。Microbiome影响因子最高,为12.24,但在土壤微生物群落构建领域发文量少,仅占发文总量的3.0%。

表4 载文量前10的外文期刊及其影响因子

2.5 关键词及其演变

2.5.1关键词共现分析

关键词是论文的主要研究内容的高度概括。检索结果中出现频次不低于5的关键词共有126个,出现频次居前5位的关键词依次为:Community Assembly(群落构建,141次)、Rhizosphere(根际,60次)、Microbiome(微生物组,55次)、Bacteria(细菌,38次)、Fungi(真菌,35次)。

关键词共现网络图可以清晰地展示出土壤微生物群落构建领域的研究热点,在本研究得到的共现网络图中共有8个聚类簇(图5,表5)。聚类1(紫色)主要是生物多样性以及微生物群落构建过程中确定性过程和随机性过程的相对重要性研究,聚类2(黄色)主要是根际微生物组以及植物—微生物相互作用研究,聚类3(浅蓝色)主要是气候变化对微生物群落构建的影响机制研究,聚类4(红色)主要为生物地理学研究,聚类5(橙色)主要为碳氮循环与微生物群落构建的耦合机制研究,聚类6(绿色)主要包括扩散限制以及微生物相互作用研究,聚类7(深蓝色)主要包括群落构建中的共现网络分析研究,聚类8(褐色)主要为群落构建的理论基础(生态位理论和中性理论)。以上8个聚类簇共同构成了该领域的热点研究方向。

图5 关键词共现网络Fig.5 Keywords co-occurrence network

表5 关键词聚类分析

2.5.2关键词演变趋势

不同时间阶段的热点关键词反映了研究者们关注重心的变化。由于2010年之前发文量较少,所以将2003—2010年设为一个时间段;在2010年之后,每5年设置为一个时间段,总共设置了4个时间段。

如图6所示,2003—2010年期间的热点关键词为群落构建(Community Assembly)和微生物生态学(Microbial Ecology)。在该时间段,Catherine Lozupone等合作设计了一种用于比较生物群落的距离度量—UniFrac距离[44—46]。UniFrac距离分为加权(Weighted)和不加权(Unweighted)两种,Unweighted Unifrac在计算时只考虑物种在样本中是否存在,而Weighted Unifrac在计算时同时考虑物种是否存在及其丰度高低。

图6 关键词演变趋势图Fig.6 Keyword evolution trend map

2011—2015年间的热点关键词分别为丛枝菌根真菌(Arbuscular Mycorrhizal Fungi)、优先效应(Priority Effects)、群落构建(Community Assembly)、宏基因组学(Metagenomics)、土壤(Soil)、454焦磷酸测序(454 Pyrosequencing)和中性理论(Neutral Theory),这说明此阶段的研究随着测序技术的发展(宏基因组、454 焦磷酸测序)而更加深入,并开始借助测序技术为理论(生态位理论和中性理论等)提供证据与解释。在该时间段,Stegen等基于Raup—Crick指数(RCbray),结合系统发育βNTI指数,建立了一种基于群落水平的零模型方法[9,47—48],将群落构建过程细分为同质选择(Homogeneous Selection,HoS)、异质选择(Heterogeneous Selection,HeS)、扩散限制(Dispersal Limitation,DL)、均匀扩散(Homogenizing Dispersal,HD)和漂变(Drift,DR)等五个部分,以进一步探究微生物群落构建过程中确定性过程和随机性过程的相对重要性,引起了广泛关注。

2016—2020年的热点关键词分别为群落构建(Community Assembly)、根际(Rhizosphere)、土壤真菌(Soil Fungi)、细菌(Bacteria)、宏基因组学(Metagenomics)、微生物群落(Microbial Community)和生物多样性(Biodiversity),这说明此阶段的研究重点是关注土壤细菌与真菌的多样性,并开始探究根际的微生物群落构建过程。在该时间段,伴随着测序技术的进步,微生物群落构建算法的精度也进一步提高,Ning DL(宁大亮)等开发了一种基于系统发育分箱的零模型分析框架(iCAMP模型)[10],该模型首先通过将观察到的物种类群划分为不同的箱,然后根据单个箱在群落间的相对多度和周转情况,定量推断群落构建过程。由于不同的生态过程通常作用于基因型或种群上,而非整个群落,因此iCAMP模型的分箱设计可以进一步提高定量推断微生物群落构建过程的准确性和精度。

2021—2022年的热点关键词分别为微生物多样性(Microbial Diversity)、构建过程(Assembly Processes)、微生物组(Microbiome)、微生物群落(Microbial Communities)、根际(Rhizosphere)、高通量测序(High—Throughput—Sequencing)、群落构建(Community Assembly)、随机性过程(Stochastic Process)、β—多样性(Beta—Diversity)以及重金属(Heavy Metal),这说明近一年来的研究热点集中于确定性过程和随机性过程在群落构建过程中的相对重要性,并且开始关注重金属等环境胁迫对土壤微生物群落构建的影响。

3 结论

本研究运用文献计量学方法,借助VOSviewer、Scimago Graphica以及bibliometrix包(R语言)可视化工具,以Web of Science数据库中在2003—2022年期间收录的土壤微生物群落构建领域的文献数据为基础,分析了年度发文量与被引频次、作者及其合作关系、国家(地区)及其合作关系、研究机构及其合作关系、期刊分布情况以及关键词及其演变,得到了如下结论:

(1)2003—2022年期间土壤微生物群落构建领域的研究大体可分为三个阶段。2003—2005年为萌芽期,2006—2011年是波动发展期,2012年之后进入了指数增长期,20年间该领域经历了“从无到有”的发展历程,并成为了当下的热点研究领域。

(2)中国是在土壤微生物群落构建领域发文量最多的国家,而美国是在土壤微生物群落构建领域总被引用量最多的国家;Zhou JZ(周集中)、Li XZ(李香真)和Chu HY(褚海燕)为核心作者;Frontiers in Microbiology是该领域载文量最高的期刊,而The ISME Journal是该领域被引频次和篇均被引频次均最高的期刊。

(3)根据关键词共现分析,土壤微生物群落构建领域的理论基础为生态位理论和中性理论;在各种生境下(气候变化、生物地理学以及根际等),确定性过程和随机性过程在微生物群落构建过程中的相对重要性是研究者们近期关注的重点;关键词的演变趋势分析则表明微生物群落构建领域的发展与测序技术的发展紧密关联,测序技术的进步以及测序成本的降低推动了该领域的进一步发展。

4 展望

目前已开发出了多种基于零模型的算法,用于量化微生物群落构建的机制[6,10,47]。但基于零模型的算法仍然面临诸多挑战,例如,对零模型施加太少的约束会使它变得非常随机,以至于结果很容易与观察到的模式不同,这可能会提高犯Ⅰ类错误的概率;相反,设置过多的约束会使结果过于接近观察到的模式,这可能会提高犯Ⅱ类错误的概率[49],约束零模型的不同方法可能导致完全不同的结果[49—50]。因此,零模型分析的实验结果对所使用的模型、算法和多样性指标非常敏感。Stegen分析框架中的βNTI和RCbray等参数目前常被用来衡量土壤微生物群落构建特征[47],但是直接在群落水平进行零模型检验易高估系统发育距离;采用iCAMP模型虽然可以在一定程度上减少系统发育距离的高估,但是iCAMP模型可能会在某些情况下低估跨箱选择(cross-bin selection)[10],因此基于零模型算法的准确性和精度的进一步提高可能是未来的研究焦点之一。

在理论层面,随机性过程在群落构建过程中是否重要曾引起巨大争议,争议的关键因素在于很难精确地定义什么是随机性过程,并且不同的方法对于随机性过程的描述并不完全一致[11]。除此之外,微生物系统发育的不确定性以及数据分析的不确定性使精准定量随机性过程的相对重要性变得更加困难,因此,未来如何更加精确地界定确定性过程和随机性过程十分重要。

生物多样性与生态系统功能密切相关,相较于微生物群落结构,微生物群落功能同等重要,但是目前对于微生物群落构建过程如何影响生态系统功能的理解仍十分有限[51—52]。微生物生态学领域的核心目标之一是能够在不断变化的环境中预测微生物群落结构及功能的变化[11,53],因此如何将功能基因及其它功能表征指标纳入微生物群落构建分析的框架也可能是该领域未来的研究热点。

猜你喜欢

发文群落测序
杰 Sir 带你认识宏基因二代测序(mNGS)
大学生牙龈炎龈上菌斑的微生物群落
合成微生物群落在发酵食品中的应用研究
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
春季和夏季巢湖浮游生物群落组成及其动态分析
基因捕获测序诊断血癌