基于CiteSpace的重金属时空污染热点及前沿可视化研究
2019-09-20高煜杨宁宁梁青芳张军
高煜 杨宁宁 梁青芳 张军
摘要:为了解国内GIS技术支持下的重金属污染研究现状和未来发展路径,采用文献计量方法和信息可视化软件CiteSpace V,对CNKI数据库中1996—2018年GIS技术支持下的重金属污染领域的1 128篇文献进行了基础知识框架、研究热点、研究前沿分析,并绘制了网络知识图谱。结果表明,重金属污染相关主题研究热点和前沿大致分为3个阶段,即1996—2005年,研究热点和前沿为基于地统计学的重金属空间分布;2005—2010年,研究热点和前沿为基于GIS的重金属时空分布与空间变异;2010年至今,研究热点为沉积物重金属,前沿为重金属的风险评价与源解析。
关键词:重金属;GIS;时空分布;文献计量;CiteSpace V
中图分类号:X53 文献标识码:A
文章编号:0439-8114(2019)16-0160-05
DOI:10.14088/j.cnki.issn0439-8114.2019.16.037 开放科学(资源服务)标识码(OSID):
Abstract: In order to understand the research status and future development path of heavy metal pollution supported by domestic GIS technology, using the literature measurement method and information visualization software CiteSpace V, the basic knowledge framework, research hotspots and research frontiers were studied in the 1 128 papers in the field of heavy metal pollution supported by GIS technology in the CNKI database from 1996 to 2018, and the network knowledge map was drawn. The results show that the research hotspots and frontiers of heavy metal pollution are divided into three stages, namely, from 1996 to 2005, research hotspots and frontiers are spatial distribution of heavy metals based on geostatistics; from 2005 to 2010, research hotspots and frontiers are spatial and temporal distributions and spatial variability of heavy metals based on GIS; and since 2010, the research focus has been on heavy metals in sediments, and the frontier is the risk assessment and source analysis of heavy metals.
Key words: heavy metal; GIS; spatial and temporal distribution; bibliometrics; CiteSpace V
重金屬是一类典型的环境污染物,能对生物和生态环境造成伤害,尤其对人体健康会造成严重威胁。重金属能通过各种介质包括土壤、水体、空气等[1,2],给人类社会及自然环境带来巨大的经济损失和环境污染。地理信息系统(GIS)作为一门空间科学,以其独特的空间观点和空间思维,从空间相互联系和相互作用出发,揭示各种事物与现象的空间分布特征和动态变化规律[3]。目前,重金属的时空分布研究大多都借助于GIS分析。
借助知识图谱法及文献计量软件,对研究热点及前沿进行分析具有图谱可视化特点,越来越受到研究者的重视。信息可视化软件CiteSpace可通过对文献引文网络的分析,绘制整个学科或知识域在一定时期内的历史演进过程、研究前沿热点及未来发展趋势[4,5]。国内最早引入和应用该软件的是大连理工大学WISE实验室的刘则渊教授团队,国内第一个以CiteSpace为分析软件发表论文的是侯剑华等人,并首次于2007年将“CiteSpace”列入文章关键词[6]。当前,国内外基于GIS的重金属污染研究已有大量成果,研究者可以通过相关文献来把握研究进展,但大量文献阅读需要时间,再加上个人学术水平及个人偏好等主观因素,导致研究者很难短时间把握当前研究热点及前沿。
本研究基于CNKI相关文献分析,采用知识图谱法及文献计量软件CiteSpace,对国内GIS技术支持下的重金属污染的研究热点和前沿进行可视化分析,对其研究热点、前沿及发展趋势进行预测,以期为重金属污染防治提供理论依据。
1 数据来源与研究方法
1.1 数据来源
数据来源于CNKI,通过专业检索:SU=(‘重金属)*(‘GIS+‘时空分布+‘空间分布),时间阈值为1996年1月1日—2019年1月31日,人工剔除会议、报纸、无作者及与主题无相关性的论文,共得到与主题相关的论文1 128篇。
1.2 研究方法
1.2.1 关键词共现频率计量 共现频率是指词汇在题目、关键词或文献摘要中出现的次数[7]。本研究中采用夹角余弦指数公式计算关键词共现频率,余弦指数取值范围[0,1],指数越接近于1,说明两个词或两个文献集的相似度越高,取值接近于0,说明两个词或两个文献集的相似度越低[8]。
式中,Cij表示词i和j的共现频率,Ci和Cj分别代表词i和j在各自的文献集中出现的次数,d1、d2代表文献1和文献2出现的次数。
1.2.2 数据分析方法 借助CiteSpace V对研究热点和共引进行分析,主要分析参数设置为(c,cc,ccv)阈值为(2,2,20),即被引或出现的频次为2,共被引或共现频次为2,共被引率或共现率为20%;设定单个时间分区抽取值为1年,选用最短路径方式裁剪,共现聚类采用谱聚类算法,最小可视聚类数为软件默认值[9,10]。
2 结果与分析
2.1 发文量
通过词条专业检索,绘制年发文量趋势(图1)。由图1可以看出,相关文献从1997年开始发表,2006年发文量突增,2017年为发文量最多的一年,2014—2018年发文量基本持平,表明该主题研究热度趋于饱和,预计2019年发文量将继续持平。
2.2 主要研究机构及团队
将获取的文献导入CiteSpace Ⅴ中,在节点类型处选择“Institution”,阈值设定为Top N=20,进行机构知识图谱的可视化,获得机构被引共现图谱(图2),图中每一个节点代表一个机构,节点的大小代表节点机构被引频次,节点越大,说明该节点被引越多,中介中心性越大。中介中心性(Betweenness centrality)是测量节点在整个网络图谱中重要性的一个指标,在CiteSpaceⅤ可视化分析软件中,该指标可以表示数据库中文献的重要性[11,12],共引频次越高则相关性越强[13]。图2中中心性最强的是中国科学院大学,表明中国科学院大学在该主题研究上具有一定的权威性(中国科学院研究生院于2012年更名为中国科学院大学)。被引排行前十的机构中,被引频次最高的是中国科学院大学,共被引10次;其次是中国科学院研究生院,共被引8次;排名第三的是南京农业大学资源与环境科学学院,共被引6次。排行前十的机构,有7所是资源与地理、环境机构,说明重金属污染、时空分布及空间分布研究主要集中在资源与地理、环境机构,且具有一定的权威性。
将发文量前十的机构及发文量导出(表1),发文前三的机构为华东师范大学、南京农业大学、浙江大学,分别发文40、37、28篇。由表1可知,排行前十的机构有9所为高校,其中有2所农业大学、3所师范大学、3所综合性大学及1所地质大学。可以预测,该主题研究仍将会集中于高校。对各机构团队发文被引频次进行分析,可以得到各机构主要研究团队及研究方向,通过跟踪这些团队可以了解当前该主题的研究进展及前沿。
2.3 关键词共现分析
将所得文献导入CiteSpace V,在节点类型处选择“Key word”,设定阈值为Top N=50,其余选项为默认,进行关键词知识图谱可视化分析,结果见图3。产生294个节点,表示有294个关键词,图中每个节点代表一个关键词,节点越大表示被引频次越高。被引排名前十的关键词有“重金属”“空间分布”“污染评价”“土壤”“土壤重金属”“重金属污染”“地统计学”“GIS”“沉积物”“空间变异”。
2.4 关键词聚类分析
知识基础反映科学领域前沿本质,通常由一系列高被引文献组成[14]。因此,通过共被引时间线可视化图谱分析基础研究对后续研究可能产生的影响[15]。将文献导入CiteSpaceⅤ,共得到11个聚类、205个节点、502条连线的共被引网络图谱(图4)。由图4可知,图谱网络聚类效果良好(Modularity Q为0.487 3),聚类主题明确(Mean silhouette为0.508 9)。从聚类时间轴来看,最早研究追溯到1997年张朝生等在《地理学报》上发表的《长江水系沉积物重金属含量空间分布特征研究——地统计学方法》;20世纪末,经济快速发展带来大量重金属污染环境问题,表现为节点的数量和规模增加,一批代表性学者贡献的经典文献为该主题的发展奠定了知识基础。
3 研究热点与前沿
3.1 研究主题分析
关键词中心度反映了其在整个关键词共现网络中的重要性,代表了一定時期内核心的研究主题,根据中心度对关键路径图谱中的关键词进行筛选[16],选取前十高频高中心性关键词,结果见表2。
本研究数据中最早出现的关键词为“重金属”,共被引666次,1996年“重金属”的中心度为0.05,表明重金属作为一个新的研究主题开始被关注;1997年关键词“地统计学”中心度达到0.16,说明在该研究主题下,地统计学成为了当时的热点研究方法;1998年中心度最高的为“空间分布”,空间分布成为该主题的研究热点;2005年关键词“重金属”共现周围出现了“地统计学”“空间分布”“重金属污染”等关键词,但“重金属污染”为中心度最高的节点,表明基于地统计学重金属污染的空间分布成为该研究的热点;2006年关键词“重金属”周围出现了“污染评价”“空间变异”“土壤”“GIS”等关键词,且出现了4个高中心度的关键词,表明基于GIS的重金属污染形成了新的研究方向,成为重金属研究的热点;2007年“重金属”关键词周围又出现了“土壤重金属”“城市土壤”“生态风险评价”等关键词,而中心度最高的“土壤重金属”以0.09的中心度成为最大的节点,表明基于GIS的重金属时空分布研究以土壤重金属为主,成为2007年的研究热点;2010年出现了新的关键词,即“沉积物”“潜在生态风险评价”“污染”等,关键词“沉积物”以0.19的中心度成为最大的节点,表明该主题研究出现了新热点,集中于沉积物重金属研究。
3.2 研究主题演化路径
“重金属”作为研究主题,首次出现是在1996年,在这之后“地统计学”“空间分布”成为研究热点,到2006年“基于GIS的重金属污染”这一主题研究才趋于成熟。2006年至今,中国经济快速发展,尤其是东南沿海地区,但经济发展带来众多环境问题,因此,研究主题也随之增多,出现了“污染评价”“空间变异”“土壤”“GIS”等热点主题,主题比较分散。
3.3 研究前沿分析
研究前沿分析能够追踪研究主题的最新发展状况,为研究者提供一定的指向作用,运用CiteSpace关键词及突现词共现,能够把握主题的研究前沿。在突现词导出时,阈值范围为默认,共导出突现性强的12个突现关键词(图5)。由图5可知,1996年以重金属为主题的研究才開始,“重金属”为突现词最强的关键词(19.519 4),1997年地统计学开始进入重金属的研究,并与重金属研究一起成为研究前沿,直到2009年该主题研究突现性消失,表明该主题研究趋于成熟;2006—2007年,“GIS”“空间变异”“空间分析”及“评价”等高突现性关键词出现,重金属主题研究转向基于GIS的重金属时空分布及影响评价,并且新主题作为研究前沿持续了7年,2012年该主题研究趋于成熟;2013—2014年,没有新的高突现词关键词,表明该时间段依然为前研究主题方向;2015—2016年,突现出“生态风险评价”“健康风险评价”“健康风险“分布特征”及“源解析”等高突现词关键词,表明从2015年开始,以这些高突现词关键词为主题的新研究方向增多,且一直持续到2019年。
4 结论
1)重金属污染相关主题文献发文始于1997年,至2015年发文量持续上升,2018年之后渐趋平稳;中国科学院大学为被引最多的权威型发文机构,华东师范大学发文量最多(40篇),主要团队为陈振楼等,主要研究领域是生态环境安全与风险评估。
2)关键词图谱共现分析中,被引最多的为“重金属”,其中“沉积物”为近几年被引最多的关键词。关键词聚类分析得出,近几年主要研究主题为“基于GIS的地表沉积物重金属时空分布”。
3)该主题研究热点和前沿大致分为3个阶段,即1996—2005年,研究热点和前沿为基于地统计学的重金属空间分布;2005—2010年,研究热点和前沿为基于GIS的重金属时空分布与空间变异;2010年至今,研究热点为沉积物重金属,前沿为重金属的风险评价与源解析。
参考文献:
[1] 张善红,李堆淑.基于GIS的土壤重金属污染评价研究进展[J].现代农业科技,2017(22):151-153.
[2] 顾济沧,赵 娟.云南省土壤重金属污染现状及治理技术研究[J].环境科学导刊,2010,29(5):68-71.
[3] 周成虎.全空间地理信息系统展望[J].地理科学进展,2015,34(2):129-131.
[4] 辛 伟,雷二庆,常 晓,等.知识图谱在军事心理学研究中的应用——基于ISI Web of Science数据库的CiteSpace分析[J].心理科学进展,2014,22(2):334-347.
[5] CHEN C M. CiteSpace Ⅱ: Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American society for information science and technology,2006,57(3):359-377.
[6] HOU J H,CHEN Y. Research on visualization of the evolution of strategic management front[J].Studies in science of science,2007,25(S1):15-21.
[7] 冯 扬,张新平,刘建军,等.基于CiteSpace的国内外城市生态修复研究进展以及对西北地区的启示[J].中国园林,2018,34(S1):76-81.
[8] 吴晓秋,吕 娜.基于关键词共现频率的热点分析方法研究[J].情报理论与实践,2012,35(8):115-119.
[9] 董 洁,张新平.基于文献计量视角的国内外高职人才培养研究进展对比分析[J].职业技术教育,2017,38(21):48-56.
[10] 张新平,张芳芳,王得祥.国内外土地利用研究动态文献计量与可视化分析[J].世界农业,2017(8):40-48.
[11] CHEN Y,CHEN C M,LIU Z Y,et al. The methodology function of CiteSpace mapping knowledge domains[J].Studies in science of science,2015,33(2):242-253.
[12] 李洪远,杜志博.基于CiteSpaceⅤ的城市生态修复研究的可视化分析[J].安全与环境学报,2018,18(3):1209-1214.
[13] WHITE H D.Pathfinder networks and author co-citation analysis:are mapping of paradigmatic information scientists[J].Journal of the America society for information science and technology,2003,54(5):423-434.
[14] PERSSON O. The intellectual based and research fronts of JASIS 1986-1990[J].Journal of the American society for information science and technology,1994,45(1):31-38.
[15] 刘清泉,江 华.森林应对气候变化研究热点和前沿分析——基于CiteSpaceⅤ的计量研究[J].干旱区资源与环境,2018,32(1):70-76.
[16] 秦晓楠,卢小丽,武春友.国内生态安全研究知识图谱——基于CiteSpace的计量分析[J].生态学报,2014,34(13):3693-3703.