APP下载

环境期刊文献关键词可视化分析

2021-07-23张玉斌

环境保护与循环经济 2021年5期
关键词:图谱重金属聚类

张玉斌

(《环境保护与循环经济》编辑部,辽宁沈阳 110161)

1 引言

环境保护是我国的一项基本国策,随着环境保护理念的日益深化,环境保护力度的不断加大,我国生态环境保护事业取得了历史性成就,发生了历史性变革[1]。“十二五”和“十三五”是我国生态环境质量改善成效最显著的10 年,生态环境保护各项工作都取得了积极进展。

环境科学是一门新兴学科,环境类期刊作为展示环境科学领域研究成果的重要载体,为生态环境保护工作提供着学术支撑和技术保障[2]。特别是环境类核心期刊,兼具弘扬科学精神、规范学术行为、引导研究方向、推动学科发展的重要作用,其关注的研究热点与环境科学的最新研究方向基本一致。运用文献计量和知识图谱相结合的方法,统计环境类中文核心期刊文献关键词在一定时期内出现的频次,分析我国环境领域近年来的研究热点,一方面,有助于环境领域的研究者和从业者了解行业发展态势,为未来的环境科研提供启迪和借鉴,推动环境科研工作进一步拓展与深化;另一方面,有助于期刊编辑出版人员关注关键词的标引问题,推动学科健康持续发展,对于提高科技期刊出版质量具有重要意义。

2 研究对象与研究方法

2.1 研究对象

北京大学图书馆组织编制的《中文核心期刊要目总览(2017 年版)》收录了27 种环境科学类核心期刊[3],其主办单位多是具有一定办刊实力的生态环境科研院所、国家部委隶属单位、高等院校等,这27种期刊在环境科学领域发挥着引领作用,其近年来的研究热点也契合我国环境科学的发展进程。

本文分析文献来源于中国知网数据库,因期刊创刊年份及出版周期不同,为提高文献的分析信度和效度,选择2011—2020 年为时间区间,将27 种环境类核心期刊刊载的文献按被引频次从高到低排序,选取截至2021 年2 月28 日每种期刊排名前500位的文献,共获得13 500 篇有效文献,将其关键词作为研究样本进行统计分析,以探索环境科学领域近10 年的研究热点。

2.2 研究方法

词频分析法是一种文献计量方法,通过分析表达文献核心内容的关键词出现的频次高低来判定某一领域研究的热点,并预测其发展动向[4]。CiteSpace是由陈超美博士研发的一款应用广泛的文献分析软件,可对某一领域文献的关键词进行词频统计和共词分析,并以可视化图形界面展示[5]。本文主要利用CiteSpace 软件生成关键词共现图谱和聚类图谱,并进行高频词中心性统计分析。

进入知网高级检索系统,分批次输入27 种环境类核心期刊,将检索出的文献按被引频次降序排列后,以Refworks 格式导出文本数据,运用CiteSpace5.7.R2 进行关键词词频分析。主要参数设置如下:Time Slicing(统计年份)选择2011 年1 月—2020 年12 月,Years Per Slice(时间切片)选择1 年;Node Types(文献节点)选择Keyword(关键词);Selection Criteria(提取节点阈值)选择Top50,即每年提取对象的数量为50;由于导入数据较多,预先进行Pruning(图谱修剪),剔除一些次要链接,以简化网络并突出重要的结构特征[5];其他设置参数默认不变。

3 统计与分析

3.1 关键词共现分析

3.1.1 高频关键词提取及共现分析

关键词是文献计量学领域广泛使用的文献特征信息,同时也是计算机自动文献检索的一个重要信息点[6]。由于环境科学领域的研究范围宽泛,信息密度较大,研究主题也较为分散,难以通过数量众多的关键词对学科热点和发展态势进行全面判断,为此本文采用共词分析法进行研究。共词分析的基本原理是通过抽取一定时期内一个文献集合里所有的关键词进行统计分析,根据高频关键词来确定这个文献集合所代表研究领域的热点[7]。将从知网中筛选的27 种环境类核心期刊的文献题录经预处理后导入CiteSpace5.7.R2,选取“关键词”作为节点类型,绘制出关键词共现知识图谱,见图1。

图1 2011—2020 年环境科学领域主要关键词共现知识图谱

图1 中,Nodes=336,Links=741,Density=0.008 7,即图谱中包含336 个节点和741 条连线,网络密度为0.008 7。图中圆圈代表节点,即关键词,圆圈大小与关键词共现频次成正比,圆圈越大表明该关键词出现的次数越多。图1 中“重金属”的圆圈最大,说明在2011—2020 年间“重金属”出现的频次最高,累计达948 次。在关键词共现知识图谱中,两个关键词如果在同一篇文献中出现,二者之间就会出现一条连线[5]。图1 中重金属与土壤、矿区、耕地、原位钝化、生物修复、潜在生态风险等关键词之间均出现连线,表明重金属与这些关键词具有较强的共现性。在图谱中,选中“重金属”的节点圆圈,通过Node Details(节点详细信息)可了解与“重金属”相关的文献信息。本研究中累计948 篇文献将“重金属”与其他关键词同列,可见“重金属”是具有较强共现性的高频关键词,重金属污染及其防治是环境科学研究的一个热点领域。

经统计,本研究样本中共含有335 个关键词,总计频次为8 340 次,其中排名前30 位的高频关键词为重金属(948)、土壤(457)、吸附(431)、PM2.5(323)、沉积物(247)、影响因素(228)、废水处理(188)、中国(177)、生物炭(155)、多环芳烃(151)、空间分布(131)、风险评价(121)、重金属污染(121)、富营养化(120)、污染特征(112)、水稻(110)、地下水(103)、评价(101)、人工湿地(98)、分布特征(94)、Gi(94)、来源(89)、抗生素(89)、氨氮(88)、碳排放(87)、时空分布(77)、PM10(77 次)、活性炭(76)、气候变化(73)、健康风险评价(73)等(括号内为关键词累计共现的频次)。

3.1.2 高频关键词中心性分析

高频关键词在一定程度上反映了环境科学领域研究热点的演变,但同一关键词在不同文献中可能代表不同的研究领域[8],如“多环芳烃”作为关键词,可能出现在土壤、大气、水等不同研究课题中,因此要有效识别环境科学的发展态势,还需结合节点中心性(简称“中心性”)来进行综合分析。中心性是网络分析中衡量节点最直接的度量指标,取值范围介于0~1 之间,超过0.1 的为关键节点[5]。对关键词共现知识图谱中的关键节点进行统计,得出中心性排在前30 位的关键词,见表1。

表1 2011—2020 年环境科学领域主要关键词中心性统计

高中心性关键词是连接不同研究领域的关键点,在不同知识结构中具有桥梁作用,在共现图谱中其圆圈外环具有突出色彩标记[5]。表1 中大多数中心性较高的关键词出现的频次也较高,其中与上节中统计的高频关键词重合的为重金属、土壤、吸附、PM2.5、中国、生物炭、重金属污染、水稻、地下水、人工湿地、时空分布、健康风险评价、气候变化,共计13 个。

关键词的中心性越高,其在网络中的地位和作用也就越重要,如表1 中“重金属污染”中心性最高,其在图1 中的节点圆圈外环颜色也最深,在2011—2020 年共出现了121 次,说明其在一定时期内是环境科学领域的研究热点。

综合分析图1 与表1 关键词的共现频次及中心性,在去除影响较小的研究样本数据的基础上,合并“重金属”与“重金属污染”等同义或近义词汇,统计出能够代表2011—2020 年环境科学领域研究热点的关键词有重金属、土壤、PM2.5、废水处理、生态风险、生物炭、多环芳烃、水稻、地下水、地表水、人工湿地、健康风险、气候变化、土地利用等。

3.2 关键词聚类分析

在关键词共现图谱的基础上,根据关键词之间的共现关系及其强度[5],运用CiteSpace5.7.R2 的聚类功能(Cluster)形成关键词聚类分析图谱(见图2)。在关键词聚类图谱中,Modularity Q(聚类模块值)>0.3,说明聚类结构显著;Silhouette S(聚类平均轮廓值)>0.7,说明聚类结果令人信服[5]。图3 显示,Q=0.905 6,S=0.964 4,说明本文的关键词聚类可信度较高,图谱网络结构合理,能够展示我国环境科学领域的研究热点。

图2 2011—2020 年环境科学领域主要关键词聚类图谱

对CiteSpace5.7.R2 自动生成的聚类进行适当调整,共得到11 个聚类,聚类标签为同组聚类中的某一关键词。聚类#0(重金属)包含的关键词有土壤污染、地下水环境、潜在生态风险、重金属污染等,相关研究主要集中分析重金属污染成因及危害,提出具体的防治措施。聚类#1(沉积物)包含的关键词有生物降解性、人工湿地、农业生态、垃圾渗滤液等,相关研究主要聚焦防治水资源环境进一步污染,保护修复水生态。聚类#2(污泥)包含的关键词有印染废水、废水处理、沟渠泥沙、污泥吸附剂、生物脱氮工艺等,相关研究重点是利用物理、化学和生物方法对废水进行处理并回用,充分利用水资源。聚类#3(自然灾害)包含的关键词有海洋经济、低温冷害、可持续发展能力等,主要强化生态保护和维持生态平衡;聚类#4(土壤)包含的关键词有健康风险评价、挥发性有机物、土壤颗粒物等,相关研究主要为土壤污染治理与修复技术,改善土壤环境质量;聚类#5(碳排放)包含的关键词有经济增长、低碳试点、低碳经济、生态压力等,相关研究重点为控制温室气体排放,增强低碳经济发展能力;聚类#6(PM2.5)包含的关键词有PM2.5、PM10、空气质量、大气水平能见度等,相关研究主要研究大气污染综合治理技术,提出改善空气环境质量措施;聚类#7(反硝化)包含的关键词有厌氧氨氧化、人工湿地、反硝化除磷等,相关研究主要集中在脱氮除磷工艺的应用与推广,提高水污染防治技术;聚类#8(多环芳烃)包含的关键词有生态风险评价、农业生产、土壤盐渍化等,相关研究的重点为危险废物、持久性有机污染物等,加强固体废物污染防治;聚类#9(零排放)包含的关键词有抗生素、脱硫废水、畜禽粪便等,相关研究主要为探索环境扰动小、修复成本低的方法与技术,推广清洁生产技术,发展循环经济;聚类#10(地理信息系统)包含的关键词有地理信息系统、遥感、人居环境等,相关研究主要为提高环境监测水平,探索环境检测新型技术。

将具有相同时间节点的关键词集合到相同时区,以时间维度展示不同聚类下关键词热度及其随时间的推演情况,可以更加直观地了解环境科学领域的发展进程。

经统计可知,2011 年出现的关键词有重金属、地下水、气候变化、碳排放等,共计51 个;2012 年出现的关键词有PM2.5、土地利用、水稻、地表水等,共计

22 个;2013 年出现的关键词有生物炭、生态风险、抗生素、环境污染等,共计16 个;2014 年出现的关键词有脱氮、健康风险、地质灾害、大气污染等,共计9个;2015 年出现的关键词有土壤修复、大气污染物、排放清单、生态环境等,共计21 个;2016 年出现的关键词有微生物、秸秆、零排放、海绵城市等,共计9个;2017 年出现的关键词有过硫酸盐、玉米、京津冀、脱硫废水等,共计8 个;2018 年出现的关键词有面源污染、有机污染物、土壤重金属、微塑料等,共计21 个;2019 年出现的关键词有土壤微生物、景观格局、资源化利用、畜食粪便等,共计69 个;2020 年出现的关键词有生境质量、农村、塑料地膜、耕地等,共计109 个。

通过关键词首次出现时间以及彼此之间的关联,可以探析环境科学领域研究热点的交互关系和演进路径。“十二五”“十三五”期间,我国先后出台了“大气十条”“水十条”“土十条”等一系列环境保护重要措施,环境科学领域中的研究热点也相应不断变化。如重金属、土壤、气候变化等相关方面的研究从2011 年延续到2020 年,一直受到较高关注;有的研究热点受政策法规或突发环境事件影响,持续时间较短,如与“太湖”相关的15 篇文献均出现在2012年,与“京津冀”相关的8 篇文献均出现在2017 年;海洋环境、面源污染、农业生态、生态恢复成为近年来环境科学领域较受关注的研究热点,特别是随着我国现代农业和新农村建设的进程加快,聚焦农村环保与农业生态等领域的研究工作正在逐渐深入。

4 关键词标引

在对关键词的统计分析过程中发现,有些文献未能规范地标引关键词,导致一些无效、宽泛、专指性较差的关键词中心性较高,如“影响因素”在本研究中频次为228 次,但其中心性却为0.00,说明“影响因素”虽然是高频关键词,但其词义较为宽泛,不能准确归纳文献主题,也不利于计算机检索,所以其在共现网络中的影响力较弱。

关键词是为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语[9]。根据GB/T 3860—2009《文献主题标引规则》、CY/T 173—2019《学术出版规范关键词编写规则》等规范要求,关键词既要能体现文献主题,又要便于检索,并且尽量选用《汉语主题词表》等词表提供的规范词[9]。随着信息化与网络化的快速发展,在各大文献数据库中,关键词的标引检索将比主题词更具有优越性[6],因此应尽可能避免使用无效或泛化关键词。

常见的不规范关键词有应用、对策、问题、管理、设计、措施、影响、现状、研究等[10],环境类期刊常见的不规范关键词有产量、评价、分布、来源、形态、相关性、去除率、研究进展、影响因素等。这些关键词含义过于宽泛,指向性不明确,还有的关键词虽然有实质内容,但只是随意拆分主题,无法突出文献重点,或者简单摘取文献部分内容,未能体现文献全貌,在一定程度上降低了文献的传播率和利用率。

针对以上问题,建议作者能充分认识到关键词是反映自己学术思想的关键信息,在创作时选取精准的、指向性强的关键词;建议编辑人员能高度重视关键词在文献利用率和传播率方面的重要作用,在审读过程中把好关键词标引规范关。此外,期刊编辑部可在投稿须知中明确关键词标引的具体规范,以便作者有章可循、编辑有据可依,进而实现文献关键词标引的标准化和规范化,提高文献传播效果和科技成果的转化率。

5 结语

环境科学领域前沿热点的交互关系和演进路径,与我国经济社会发展进程及生态环保的重点工作紧密相关。“十四五”期间,实现减污降碳协同效应将成为重要的环境保护目标,预计未来环境科学领域将在推动绿色低碳循环发展、深入打好污染防治攻坚战、构建现代环境治理体系、谋划和实施“十四五”生态环境保护规划等方面开展广泛深入研究,为我国的生态环保工作提供强力智力支持和技术保障。进入“十四五”时期,随着国家对环保投入的不断增加以及公众环保意识的日益增强,环境科学领域的学术交流也会随之进一步深入,科研成果产出必将更加丰硕。环境类期刊在把牢稿件质量关和提高影响因子的同时,也要根据环境领域的科技成果及自身特色,规范关键词标引,保证期刊的良性发展,以提高文献传播效果和科技成果的转化率,更好地发挥主导学术传播、把关学术评价、展示科研成果、推动学科发展的重要作用。

猜你喜欢

图谱重金属聚类
高清大脑皮层发育新图谱绘成
基于图对比注意力网络的知识图谱补全
沉淀/吸附法在电镀废水重金属处理中的应用
绘一张成长图谱
鱼头中重金属含量真的很高?
吃蘑菇不会重金属中毒
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法