基于WoS和CiteSpace的绿色生态农业研究可视化分析
2023-12-28郭董菊钱小鸿杨胜英
郭董菊,钱小鸿,杨胜英
(浙江科技学院 信息与电子工程学院, 杭州 310023)
进入21世纪以来,我国常年粗放式的农业发展方式带来了一系列问题,环境污染与生态破坏日趋严重,给人们的生产生活和身体健康带来了严重的影响和危害[1]。在此背景下,我国迫切需要实现农业绿色化转型。如今,资源的使用量和持有量日益矛盾,加强绿色农业发展具有重大意义[2]。农业是产业之基,关系到全国人民的生活,基于此背景,中国实现农业绿色化转型势在必行[3]。绿色生态农业的发展受到诸多研究者的持续关注,由于个人研究背景和研究专长的不同,其研究成果大多呈现碎片化的特点,在深入研究该领域内部知识结构和演化脉络上存在一定的局限性。
因此,本研究通过CiteSpace6.1.R2[4]和Web of Sciecne数据库对2003—2022年绿色生态农业领域的相关文献进行计量统计和可视化分析,从文献特征趋势、研究内容和前沿等方面展开讨论,旨在呈现该领域的研究脉络和知识架构,对该领域的研究内容做归纳总结,以便清晰、准确地展示绿色农业生态领域的研究动态和趋势,为后续深入研究该领域提供参考。
1 数据来源与分析方法
1.1 数据来源
本研究所有样本数据均来源于Web of Sciecne(以下简称WoS)核心合集数据库,在检索时以“ecological agriculture(生态农业)”或“green agriculture(绿色农业)”为主题词进行检索,共检索到13 474条结果,国家/地区选择“中国”,文献类型选择“论文”或“综述论文”后,文献检索时间跨度为2003—2022年。对检索结果进行筛查、去除重复后,共得到2 582条文献信息,检索时间为2022年8月13日。将其全记录与引用的参考文献以纯文本格式导出,并导入CiteSpace6.1.R2软件中。
1.2 分析方法
本研究所采用的数据统计和分析工具为WPS软件和CiteSpace6.1.R2软件。采用WPS软件对2003—2022年绿色生态农业研究领域的发文数量及时间分布、发文出版物进行了计量统计分析。采用CiteSpace6.1.R2软件对该领域的相关文献进行可视化分析,该软件是由陈超美教授团队开发的可视化分析工具,可以把大量的文献数据转换为可视化知识图谱,使人们更加直接地发现隐藏在大量数据中的信息和难以察觉的关联关系,具有便捷、高效的特点[5-6],基于此,本研究应用CiteSpace6.1.R2软件绘制可视化知识图谱,对绿色生态农业研究领域的成果进行整理分析,梳理出国内在此方面的研究现状和未来趋势。
1.3 数据处理
本研究主要采用知识图谱分析、聚类分析等方法对文献进行定量分析。首先将下载好的数据文件名称改为以“download_”开头的格式,并将数据导入CiteSpace6.1.R2软件中,然后在“Node Types”中分别选择Author、Institution和Keyword进行分析,以得到相应的可视化图谱。为了梳理绿色生态农业领域研究的基本现状,用文献计量学方法,对导入的2 582篇文献从每年发表的文章数量、期刊、机构、作者和研究内容五个维度进行分析;通过发文年度分析、作者分析、期刊和机构发文情况分析,厘清绿色生态农业领域研究的演进脉络;通过对关键词分析,揭示绿色生态农业领域研究的热点和趋势。
2 研究现状分析
2.1 年度发文量分析
通过统计图表可以直观看出该领域年度发文量情况。由图1可知,中国绿色生态农业领域研究在2003—2022年期间总体发展迅速,并且发文量呈现逐年递增的趋势。图1中蓝色线代表总发文量(论文+综述论文),橙色线代表论文发文量。总发文量大致分为三个阶段:第一阶段2003—2008年为萌芽期,在2003年仅发文一篇,为绿色生态农业领域研究打下了基础,是绿色生态农业领域研究的始祖文章,随后的五年间没有发文量,可见绿色生态农业领域还没有引起人们的关注;第二阶段2009—2015年为发文量平稳增长期,研究者们开始渐渐地关注到了绿色生态农业领域,这期间论文数量随着总发文量的增长而相应地增长,年均发文增长量为11.3篇;第三阶段2016—2021年为快速增长期(剔除2022年不完整的一年),年均发文增长量为93.6篇,由此可见,研究者们对绿色生态农业领域关注度不断增强且形成了一定的规模。
图1 中国绿色生态农业领域相关文献发表情况(2003—2022年)Fig.1 Literature publication of green ecological agriculture in China (2003-2022)
2.2 出版物统计
从出版物统计来看,2 582篇绿色生态农业领域相关论文出版在201种期刊上。其中出版文献数量最多的10种出版物见表1。这10种期刊的刊登论文数量一共为745篇,占论文总数的28.85%。其中,排名前3的期刊SUSTAINABILITY(《可持续发展》)、SCIENCEOFTHETOTALENVIRONMENT(《总体环境科学》)和JOURNALOFCLEANERPRODUCTION(《清洁生产杂志》)发文量都在100篇以上,分别为153篇、127篇和102篇。通过查找期刊的大类学科可以发现,排名前10的期刊中,有7家期刊属于环境科学与生态学。由此可以看出,大部分研究者热衷于研究环境科学与生态学,为目前研究者的研究方向提供了一定的借鉴。
表1 2003—2022年发文量排名前10的出版物统计Table 1 Statistics of top 10 publications by publication volume from 2003 to 2022
2.3 发文机构分析
研究机构发表的论文数量及机构之间的合作关系可以反映出该领域的学术影响力,利用CiteSpace可视化软件对2 582篇文献进行机构发文量分析,在软件中选择节点类型为Institution,时间切片选择1,Pruning选择“Pathfinder”和“Pruning sliced networks”,其余默认,运行后得到机构合作分析图谱,如图2所示。由图2可知,N(网络节点数量)=500,E(连线数量)=1 285,网络密度为0.010 3,这表明共有500个研究机构,生成了1 285条有节点的连线,网络密度值为0.010 3,表明该领域众多研究机构都产生了相应的合作关系,受到了学术界的广泛关注,但机构间学术交流还有待加强。前五名的机构分别为Chinese Academy of Sciences(中国科学院)、University of Chinese Academy of Sciences(中国科学院大学)、China Agricultural University(中国农业大学)、Beijing Normal University(北京师范大学)和University of Michigan(密歇根大学),前五名机构的发文量均在100篇以上,占总发文数的44.3%,其中Chinese Academy of Sciences(中国科学院)这个机构的发文量为539篇,位居第一,可见该机构研究者的研究成果对该领域的研究起到了主导作用。
图2 有关绿色生态农业发展研究的机构合作分析图谱Fig.2 Analysis map of institutional cooperation on green ecological agriculture development research
2.4 作者合作分析
通过分析文献的作者可以了解每位研究者的产出情况和贡献程度,将WoS数据库中的文献导入CiteSpace6.1.R2可视化分析软件中。节点类型选择Author,时间切片选择1,Pruning选择“Pathfinder”和“Pruning sliced networks”,其余默认。运行后得到图3作者合作分析图谱,其中N=498,E=1 724,网络密度为0.013 9。由图3可知,在绿色生态农业发展领域,Wang J、Li Y、Zhang Y和Wang X等研究者发文量较高,均为100篇以上,其次为Liu Y、Wang J、Li X和Zhang J,发文量均为80篇以上,其中Wang Y和Li Y两位研究者发文量均为120篇,对绿色生态农业研究领域的贡献最大,影响力也比较深远。
图3 有关绿色生态农业发展研究的作者合作分析图谱Fig.3 Co-analysis map of authors on green ecological agriculture development research
3 研究内容与发展趋势分析
3.1 关键词共现分析
对文献中的关键词进行统计分析可以概括该领域的研究热点[7],论文中的关键词是对研究内容的高度浓缩和概括,把WoS数据库中的文献导入CiteSpace6.1.R2软件中,节点类型选择Keyword,时间切片设置为1,阈值设置为T50,Pruning选择“Pathfinder”和“Pruning sliced networks”,其余默认。运行得到N=534、E=1 908、网络密度为0.013 4的关键词共现图谱,如图4所示。图4中的节点的大小与关键词出现的频次成正比,线条的多少与关键词间的紧密程度成正比。agriculture(农业)、impact(影响)、management(管理)和climate change(气候变化)4个关键词出现的频次均在200次以上,以绿色农业和生态农业作为论文数据的检索词,农业的词频出现最高在情理之中。system(系统)、model(模式)、land use(土地使用)和ecosystem service(生态系统服务)4个关键词出现的频次均在120次以上。从这些高频词可以看出,近20年来中国绿色生态农业领域的研究侧重农业管理,重视发展农业与环境之间的和谐关系。
图4 有关绿色生态农业领域的关键词共现图谱Fig.4 Co-occurrence map of keywords related to the field of green ecological agriculture
基于绿色生态农业领域的关键词共现图谱,为了进一步了解关键词的频次和中心性[8],本研究统计了排名前20的中心性关键词,结果见表2。由表2可知,在所有关键词中,中心性最高的是soil(土壤),中心性为0.11,这表明土壤与其他关键词之间的关系最为紧密,其次是accumulation(堆积物)、system(系统)、heavy metal(重金属)和maize(玉米),其中心性分别是0.09、0.09、0.07、0.07,与其他关键词的紧密程度略逊一筹。关键词“堆积物”的频次排名较低,但是中心性却排名较高,说明“堆积物”不是该领域的研究热点,但却是该领域多样化的研究中心。
表2 中心性排名前20的关键词Table 2 Top 20 words for keyword centrality
通过对关键词中心性和频次进行统计分析,发现研究涉及的领域不全面。目前涉及土壤研究[9]、堆积物研究[10-11]、重金属研究[12-13]等方面,研究者们还对绿色生态农业的影响[14-15]、管理[16]和气候变化[17]等问题进行了探讨。结合表2可以发现,热点关键词主要集中在概念界定(系统[18]、生态风险[19]、管理、生物多样性[20]、流域[21]、农业[22-23]、生物[24-25]、群落结构[26]),研究方法(消费[27]、模式[28]),研究内容(土壤、堆积物、重金属、玉米[29]、水[30-31]、中国[32])和研究结果(挑战[33]、质量[34]、持续性[35]、产量[36])四大研究热点主题。
3.2 关键词聚类分析
为了了解绿色生态农业发展研究的类别,在分析了关键词共现图谱的基础上,对关键词进行聚类分析,采用LLR算法(对数似然率算法)进行计算,结果见图5。一般而言,聚类结构显著的指标是聚类模块值Q大于0.3;聚类合理的指标是聚类平均轮廓值S大于0.5,聚类令人信服的指标是聚类平均轮廓值S大于0.7[37]。图5中的Q=0.791 1>0.3,S=0.908 5>0.7,可以认为图5中的关键词聚类图谱是显著且有一定说服力的。
图5 有关绿色生态农业发展研究的关键词聚类图谱Fig.5 Keywords clustering map on green ecological agriculture development research
绿色生态农业领域研究关键词聚类的具体信息见表3,顺序是从0到13,聚类是由多个紧密相关的关键词组成的集合。聚类的大小代表着聚类中所含的文献数量,如聚类0“ecosystem services(生态系统服务[38])”的聚类大小为78,表示该聚类中包含了78条相关的文献信息,是所有聚类中包含文献信息最多的聚类,表明在绿色生态农业发展研究领域研究生态系统服务的文献最多,同其他关键词的联系最密切。紧接着为聚类1“land use change(土地利用变化[39])”、聚类2“heavy metals(重金属[40])”、聚类3“sustainable agriculture(可持续农业[41])”,聚类大小分别为70、67、57。同质性数值越大,代表聚类成员的相似性越高,如聚类12“spectral analysis(光谱分析法[42])”的同质性为0.979,为所有聚类中同质性指标最高的聚类,该聚类中的文献信息具有较高的相似性。从表3可知,平均引用年份为2018年的聚类5“paddy field(稻田[43])”和聚类7“ecological engineering(生态工程[44])”时间距离当今最近,是近几年绿色生态农业领域的研究热点。
表3 绿色生态农业领域研究关键词聚类信息表Table 3 Keywords cluster information table in the field of green ecological agriculture research
3.3 关键词突现分析
通过关键词突显分析可以对某个领域的研究前沿和最新动态进行识别和探索,关键词突显在关键词出现的基础上,依据关键词出现次数的增长率确定热点词汇,这些热点词汇与时间的关联特点通常被视为某个领域的研究前沿[45]。图6是2003—2022年排名前20的绿色生态农业关键词突现图谱,从图中可以看出,在排名前20的突现关键词中出现最早的是“sustainability(可持续性[46])”“management(管理[47])”“conservation(保护[48])”和“trend(趋势[49])”,说明研究者们在研究初期更倾向于关注这几个方面的研究。“sustainability(可持续性)”和“virtual water(虚拟水[50])”这两个关键词的突现强度均超过了5,说明在此期间,更多的研究者关注绿色生态农业领域这些方面的研究。“surface sediment(表面沉积物[51])”“environmental kuznets curve(环境库兹涅茨曲线[52])”“sector(区域[53])”“security(安全性[54])”和“waste(浪费[55])”都是近2年来出现的突现词,说明这些方面会成为未来绿色生态农业的研究前沿和热点趋势。
图6 2003—2022年排名前20的绿色生态农业关键词突现图谱Fig.6 Emergence map of top 20 keywords of green ecological agriculture from 2003 to 2022
4 结论与展望
4.1 结 论
本研究以绿色生态农业领域研究的2 582篇文献为研究样本,数据来源为WoS数据库,通过CiteSpace6.1.R2和WPS软件进行可视化研究和计量分析,分析了绿色生态农业领域研究的基本现状、演进脉络、研究热点和趋势,得出以下结论:
1) 从年度发文量来看,绿色生态农业领域研究发表的文章数量呈增长态势。大致分为三个阶段:第一个阶段(2003—2008年)为研究的萌芽期,关于绿色生态农业发展的研究内容较少;第二个阶段(2009—2015年)为平稳增长期,这个时期研究者们的发文量呈现逐年递增的趋势,可以看出,研究者们的研究重心开始向此领域靠拢;第三个阶段(2016—2022年)为快速增长时期,研究者们对该领域的关注度逐年增强,有越来越多的研究者加入进来。由此可以推测出,我国在2003年开始关注绿色生态农业研究领域,自2009年开始有了初步的发展,之后的十几年间,研究者在此领域有了更深的建树,为后续研究者研究此领域提供了良好的理论基础和实际指导意义。
2) 从出版期刊来看,2582篇绿色生态农业领域的相关论文出版在201种期刊上,刊文量排名前三的期刊分别是SUSTAINABILITY(《可持续发展》)、SCIENCEOFTHETOTALENVIRONMENT(《总体环境科学》)和JOURNALOFCLEANERPRODUCTION(《清洁生产杂志》),刊文量都在100篇以上。从期刊大类来看,大部分研究者热衷于研究环境科学与生态学。
3) 在发文机构和作者当中,以中国科学院的研究者为核心,展开相关的合作研究,大多是研究所与高等院校之间的合作,而其他机构研究者之间联系较少,今后应该加强其他机构研究者之间的交流和合作。
4) 从高频关键词共现方面来看,生态系统、模式、土地使用和生态系统服务受到研究者们的高度关注。从关键词聚类方面来看,稻田和生态工程是近几年绿色生态农业领域研究的热点。从关键词突现方面来看,未来的研究前沿热点集中在表面沉积物、生态环境的安全性和土地浪费等方面。国内绿色生态农业领域已经形成了较为完整的发展体系,从热点关键词开始,逐渐深入整体的发展模式中,重视生态系统、生态环境和生态工程的相互关系,为后续绿色生态农业领域的全面发展打下了坚实的基础。现阶段绿色生态农业领域研究更注重其带来的生态效益和经济效益,而这也将成为目前绿色生态农业领域的研究前沿。
4.2 展 望
就研究力量而言,为了促进中国绿色生态农业领域的发展,该领域的研究机构、研究者间的学术交流有待加强。就研究范围而言,绿色生态农业领域研究范围较广,由于本研究以外文文献为主,因此后续的研究可针对国内数据库的绿色生态农业领域相关文献进行分析,不断深入,增强绿色生态农业领域研究的前瞻性,拓宽绿色生态农业领域研究的思路和方法,为绿色生态农业领域研究提供理论支撑和实践依据。