APP下载

基于CiteSpace视角下国内外沙生植物的研究进展

2022-11-12熊宽洪温瑞龙温清燕邓传远

山东林业科技 2022年5期
关键词:发文聚类数据库

熊宽洪,温瑞龙,温清燕,邓传远

(福建农林大学园林学院,福建 福州 350002)

沙生植物是一种适应特殊生境条件的植物类型,由于长期适应当地生境,而具有抗风蚀、耐沙埋、耐干旱贫瘠等一系列特性,并有特定的构型特征[1]。在气候变化和人为干扰的影响下,沙地生态环境十分脆弱[2],中国沙地共计1.74 亿hm2,影响了近4 亿人的生产生活[3],而沙生植物对改良沙地生态具有重要作用,它能够促进土壤发育、产生生态水文效应、推动原有地区的植物群落更新演替[4],常被用于治理草原及海岸沙地环境[5,6]。目前国内外已有大量沙生植物研究,如草原植物群落多样性与放牧强度的关系[7]、内生根菌对提高沙生植物抗逆性的作用[8]、梭梭种群基因遗传研究[9]、沙生植物资源调查研究[10]等,但缺少可视化知识图谱对沙生植物领域的整体情况、发展方向、热点前沿等进行系统性分析与总结。

CiteSpace 是陈超美博士利用JAVA 平台开发的可视化工具,利用CiteSpace 可以制作可视化知识图谱,能将一个知识领域的来龙去脉清晰的展现出来,并找出研究领域的热点前沿[11]。因此,本研究以WOS 和CNKI 数据库中有关沙生植物的文献为数据,利用CiteSpace 可视化工具对文献进行数据挖掘和计量分析,梳理发展脉络,寻找热点前沿,为后续沙生植物研究提供参考。

1 材料与方法

1.1 数据来源

文献资料来自WOS 和CNKI 数据库,外文文献以WOS 核心合集数据库搜索主题沙生植物的英文词,索引格式为TS=(″psammophytes″)or(″sand plant″)or(″desert plant″),时间范围选择2002—2021年,文献类型选择Article 格式,语种为英语,经过除重后,共筛选文献542 篇,中文文献以CNKI 数据库的高级检索功能进行搜索,主题为“沙生植物”,时间范围为2002—2021年,选择期刊文章类型,经除重后,筛选出632 篇文献。

1.2 分析方法

本文利用CiteSpace 5.8.R3,设置“Country”(国家)、“Author”(作者)、“Institution”(机构)、“Key word”(关键词)等网络节点,以获得文献各类信息并生成相应的知识图谱。图谱中圆圈越大代表该节点越重要,节点连线越粗代表关系越密切,中心性是指网络中经过某点并连接这两点的最短路径与两点之间的最短路径线数量的比值[12]。核心作者确定采用普赖斯公式进行计算后再进行可视化分析,具体公式如下。

式中M 为核心作者最低发文量,NMAX为最高发文量作者的发文数。

2 结果与分析

2.1 年度发文量与国家地区分布

根据图1所示,2 个数据库均呈现增长趋势,年度发文量在趋势上保持一致,在2002—2016年间CNKI数据库年度发文量要高于WOS 数据库,但在2018年后,WOS 数据库年度发文量逐渐高于国内,在2019—2020年内出现激增并呈现继续增长趋势。CNKI 数据库年度发文量总体上处于波动状态,在2002-2008年间文献数量快速增长,2009—2021年间则是处于波动增长状态,在2009年、2012年、2019年出现下跌情况。

图1 2002—2021年WOS 与CNKI 数据库年度发文量Figure 1 Annual publication volume of WOS and CNKI databases from 2002 to 2021

选择CiteSpace 的Country 节点,统计发文量与中心性前5 的国家,结果如表1所示。发文量最大的是中国(229 篇),其次是美国(130 篇)、以色列(29 篇)、沙特阿拉伯(26 篇)、澳大利亚(20 篇)。从中心性上看,最高的是中国(0.51),其次是美国(0.45),其他国家中心性较低,说明中美两国在该领域具有较高科研水平。WOS 数据库中中国发文量在2020年超过CNKI 数据库,并有持续上升趋势,体现了中国学术界越来越倾向与国际接轨。

表1 国家与地区发表文献量与中心度Table 1 Published literature volume and centrality by country and region

2.2 核心作者合作网络与共被引分析

作者合作网络可以展现领域内核心作者的合作关系,按照普莱斯计算公式,WOS 数据库作者最高发文量是13 篇(M=2.69),CNKI 数据库作者最高发文量是11 篇(M=2.48),即WOS 数据库作者发文量在3 篇以上、CNKI 数据库作者发文量在2 篇以上的作者可以确定为核心作者,利用CiteSpace 对于两个数据库核心作者进行分析,选择网络节点Author,生成核心作者合作网络图谱(图2)。WOS 数据库中核心作者发文量高的分别是德克萨斯大学的Gardea-torresdeyJL与Peralta-videaJR(13 篇)、中国科学院的马小飞(11 篇)、中国医学科学院的丁刚(8 篇)、中国科学院的刘兴荣(8 篇)。CNKI 数据库中发文量高的分别是中国科学院的刘志民(11 篇)、甘肃治沙研究所的张锦春(10篇)、鲁东大学的周瑞莲(9 篇)、中国科学院的曲浩(8 篇)。核心作者共现网络呈现小聚居的现象,不同核心作者团队之间联系较少,科研人员未来需要增强国内外合作,促进不同团队之间交流,集中资源产出高质量成果。

图2 WOS 与CNKI 数据库作者合作网络图谱Figure 2 The network map of author cooperation between WOS and CNKI database

作者共被引是指两个作者文献同时为第3 个作者引用,则这2个作者存在共引关系,共被引频次越高,代表关系越密切,利用作者共被引能够找到该领域内影响力较高的作者。由于CNKI 无法进行CiteSpace 共被引分析,所以只选取WOS 数据库进行分析。图3中高被引频次作者分别是NOY—MEIR I (28)、SCHLESINGER WH(20)、GUTTERMAN Y(19)、ALTSCHUL SF(15)、EHLERINGER JR(13)等,大多是为国外学者,国内作者发文量虽较多,但被引频次偏少。

图3 WOS 数据库作者共被引图Figure 3 Author co-citation map in WOS databases

2.3 机构合作网络分析

利用Citespace 对于WOS 与CNKI 数据库进行分析,选择网络节点institution,生成机构合作图谱(图4)。WOS 数据库机构合作网络图谱中,发文机构共有418 家,发文量前3 的分别是Chinese Acad Sci(中国科学院)123 篇、Univ Chinese Acad Sci(中国科学院大学)38篇、Ben Gurion Univ Negev(本·古里安大学)20 篇。CNKI 数据库中发文机构共有441 家,发文量前3 的分别为中国科学院大学24 篇、甘肃省治沙研究所14 篇、宁夏大学农学院13 篇。从图4可以明显看出国内机构之间的联系较密切,但国内与国外机构间的联系较分散。

图4 WOS 与CNKI 数据库机构合作网络图Figure 4 Institutional Cooperation Network Diagram in WOS and CNKI databases

2.4 关键词共现分析

关键词是文章内容的简要概括与分类,能为研究者提供必要的检索信息,关键词频次越高代表该关键词越重要,越受研究者关注。利用CiteSpace 对WOS 与CNKI 数据库文献进行分析,选择Keyword 节点,生成WOS 数据库与CNKI 数据库关键词共现图(图5)。

图5 WOS 与CNKI 关键词共现图Figure 5 Keyword co-occurrence diagram between WOS and CNKI databases

WOS 数据库关键词共现网络中节点498 个,连线1282 条,密度0.0104,说明关键词之间联系密切,呈现多点发展趋势。WOS 数据库中频次大于5 的关键词有66 个,除desert plant(沙生植物,55 次)外,频次最高的分别是growth(发育,50 次)、plant(植物,38 次)、pattern(模式,33 次)、stress(胁迫,31 次)、vegetation(植被,29 次)。WOS 数据库关键词聚类后Q 值为0.6164 大于0.3,S 值为0.8254 大于0.7,表明聚类的结果合理[11]。聚类越大代表所含文献数量越多,聚类同质性越高代表关键词一致性越高。根据表2所示,聚类规模最大是聚类#0、聚类#1、聚类#2、聚类#3、聚类#4、,反映的是沙生植物的生理生态方面,聚类#5、聚类#6、聚类#7、聚类#8 与聚类#9 涉及的是特定研究区域或植物,规模不大,但同质性均在0.7 以上,这说明这些聚类的关键词关联较强。

表2 WOS 与CNKI 数据库关键词聚类Table 2 Keyword clustering in WOS and CNKI databases

CNKI 数据库关键词共现网络中节点510 个,连线631 条,密度0.0049,相较WOS 数据库的节点多,但连线数量与密度较少。CNKI 数据库频次大于5 以上关键词有31 个,除沙生植物(140 次)与沙生灌木(23次)外,频次最高的分别是是沙产业(16 次)、内蒙古(14 次)、干旱胁迫(13 次)、种子萌发(11 次)、沙生针茅(9 次)等,可以看出国内学者对沙生植物种子萌发、幼苗生长[13,14]及其实际经济生产[15,16]方面较为关注。CNKI数据库关键词聚类后的Q 值0.8129,S 值0.9779,聚类结果令人信服。从表7看,聚类0#的规模与同质性是最大的,是研究对象,其次是聚类1#、聚类2#、聚类3#、聚类4#、聚类5#,聚类7#、聚类8#、聚类9# 这些聚类是沙生植物研究的主要方向,规模较小,但同质性高,整体看CNKI 数据库关键词聚类的同质性整体较WOS数据库高,说明CNKI 数据库中文献相似性更高,关联性更强。

2.5 关键词突现与时区图

关键词突现是指在一段时间内关键词出现频次增多[12],时区图是将关键词与时间因素进行关联,透过关键词突变与时区图能够研究该领域发展趋势,预测未来发展方向,从而分析前沿热点。利用Citespce 对WOS数据库进行分析,获得关键词突现表(表3)及时区图(图6—a),WOS 数据库的沙生植物关键词的发展可以分为3 个时期,各时期关键词的数量变化与年度发文量的趋势相符合。起步时期(2002—2008年),这一时期研究处于起步阶段,大量关键词爆发,但无突现词,desert plant、growth、vegatation 等早期核心关键词出现,diversity(多样性)、ecosystem(生态系统)、community(群落)、climate change(气候变化)、competition(竞争)等关键词的出现标志这一时期的研究主要以生态学内容为主,涉及沙生植物群落的物种多样性、生态环境、种间关系及其与气候变暖的影响。发展时期(2009—2016年),这一时期关键词数量较上一时期少,但生理与胁迫相关的关键词数量增多,如abscisic aid(脱落酸)、stress、response(响应)、expression(表达)等,这个时期关点从沙生植物生态逐渐转向沙生植物生理机制,并出现大量突现词,突现强度最高的是forest(森林),内容是针对沙漠不同生境的植物群落水平[17]与空间格局相关研究[18],其次是gurbantunggut desert(古尔班通古特沙漠)与oxidative stress(氧化应激),为特定地区[19]及沙生植物药用价值[20]的相关研究,突显强度最低的是seed germination(种子萌发),内容为准噶尔无叶豆、梭梭等沙生植物种子萌发研究[21,22]。成熟时期(2017—2021年),这一时期关键词数量最少,但这一时期发文量快速增长,这说明沙生植物研究逐渐成熟,并出现了identification(识别)、protein(蛋白质)这类微观层面的关键词,突显词为identification 与biosynthesis(生物合成),内容是沙生植物抗胁迫相关基因的识别[23]以及沙生植物生物化学[24]。

表3 WOS 数据库关键词突现Table3 Keyword Emergence in WOS Database

图6 WOS 与CNKI 数据库关键词时区图Figure 6 Keyword time zone diagram of WOS database and CNKI database

CNKI 数据库中关键词数量明显少于WOS 数据库,突现词的数量也较WOS 数据库少。按照CNKI 数据库关键词时间分布(图6-b)将其划为两个时期,起步时期(2002—2008年),这一时期大量主要关键词出现,如沙生植物、沙产业、内蒙古、干旱胁迫、发芽率等,突现词为植被,此时国内沙生植物研究不仅注重沙生植物生理、沙地生态恢复等理论研究,也重视沙生植物实际生产运用,致力于提高沙生植物萌发率和经济效益。缓慢发展时期(2009—2021年),丛生禾草、半灌木、生理响应、平潭岛、脯氨酸等词出现,国内有研究开始关注到海岸沙生植物[25],这一时期关键词数量存在波动,文献发表数量也呈现相近情况。突现词为沙生针茅、荒漠草原、发芽率,沙生针茅是西北地区常见牧草,能通过有性繁殖产生大量种子,但在实际生境中通过种子萌发的沙生针茅数量却很少[26],这一时段涌现了较多有关沙生针茅种子萌发研究[27],另外近几年也出现了针对荒漠草原这类特定生态系统与植物群落的研究[28,29]。

3 结论与展望

本研究对2002—2021年内的WOS 与CNKI 数据库中542 篇外文文献及632 中文文献进行分析,分析沙生植物文献中的国家、作者、机构、关键词,从而了解沙生植物的研究进展与前沿热点。

从发文量看,2002—2017年内WOS 数据库外文文献年度发文量要小于CNKI 数据库中文文献,但在2018年后外文文献年度发文量超过了中文文献,2017—2021年这段时间外文文献数量出现激增。反观CNKI 数据库,中文文献数量在2001—2008年内出现持续增长,但自2009年后文献数量总体呈现波动式增长。得益于国家与学术界的支持,WOS 数据库中中国发文量最高,其次是美国,反映了中美两国在沙生植物领域的重视与科研能力。从核心作者与机构看,WOS 数据库中中国作者发文数量较多,但被引频次较少,国内机构小团队联系较为密切,但与国外作者团队联系较少。

从关键词共现看,WOS 数据库关键词主要侧重在植物群落多样性、环境胁迫与生理响应、抗逆性等生理生态学关键词,而CNKI数据库除上述关键词外,沙产业、种子萌发这类有关实际生产应用的关键词也有出现。不同数据库关键词聚类分别出现了一些特定沙生植物,如WOS 数据库的ammopiptanthus nanus、ambrosia dumosa 和CNKI 数据库的沙生针茅、沙生冰草、梭梭等植物,反应了国内外对不同地域沙生植物重视,后续可以针对不同地区沙生植物的资源评估、引种驯化、育种等方向进行研究。

从关键词突现和时区图看,WOS 与CNKI 数据库关键词发展时间总体上与年度发文量相对应,国外沙生植物研究能分为3 个时期,起步时期、发展时期、成熟时期,内容不断深化,从生态慢慢转向生理生化,从宏观层面转向微观层面,出现了医学药物、基因等新方向,体现了多学科交叉的特点,但这类研究的数量仍然较少,未来需要继续加强,国内也出现了海岸沙生植物研究,这对扩大沙生植物研究尺度,丰富沙生植物内容具有重要作用。

表4 CNKI 数据库关键词突现Table 4 Keyword emergence in CNKI database

猜你喜欢

发文聚类数据库
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
数据库
数据库
数据库
数据库
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例