APP下载

基于CNKI和WOS的非点源污染模型的研究热点及趋势分析

2018-07-18荆延德

生态学报 2018年11期
关键词:词频热点聚类

荆延德,樊 蕊

1 山东省高校南四湖湿地生态与环境保护重点实验室,济宁 273165 2 曲阜师范大学地理与旅游学院,日照 276826

非点源污染,又称面源污染,是当前社会面临的主要难题[1],其中又以农业非点源污染的贡献率最大[2],而农业非点源污染中氮磷元素超标排放是造成水体富营养化的直接原因[3]。非点源污染具有形成过程复杂、随机性大、机理模糊、分布范围广、影响因子复杂、潜伏周期长和危害大等特点[4-5],不利于进行监测与管理[6]。由于计算非点源污染负荷的难度比较大,因此,非点源污染的定量化研究尤为重要[2,7- 8]。而模型化方法是定量研究的重要方法。

共词分析法(Leximappe program),其思想来源于文献计量学中的引文耦合与共被引分析[9],广泛应用于学科的热点分析,揭示某一领域的研究主题和研究热点,以及探索研究主题的历史脉络和演化态势与主题之间的关系[10- 11]。

借助流域非点源污染机理模型,可以帮助管理者量化污染负荷,并在空间层面快速定位污染负荷的关键区域,现已成为研究非点源污染最直接有效的途径之一[12- 13]。近年来,我国有关非点源污染模型的研究逐渐增多,但运用文献计量法从宏观上把握国内外非点源污染模型的研究现状及其发展过程的相关论文很少,所以本文以中国知网和WEB OF SCIENCE中的文献资料为基础,运用共词分析法并结合相关软件,对非点源污染模型的研究热点和发展方向进行宏观上的分析,以期为非点源污染模型的进一步发展提供方向。

1 研究方法1.1 数据来源

本文以中国知识基础设施工程(China National Knowledge Infrastructure, CNKI)的中国知网知识发现网络平台和科学引文索引数据库“Web of Science”的核心合集为检索来源,作为本文的基础数据,这两个数据库收录了大量高水平研究论文,是进行文献计量的可靠数据来源。

1.2 研究工具

本文运用CiteSpace、SPSS和SATI软件对检索结果进行分析,利用Ucinet和NetDraw软件绘制出共词网络可视图,同时结合共词分析方法对检索结果进行分析,通过分析发表文章的关键词、年代分布、发表期刊、著者、高被引文章来展示非点源污染模型研究领域的研究概况、研究热点和研究趋势。

2 非点源污染模型数据来源途径及分析

2.1 国外非点源污染模型数据来源途径及分析

2.1.1国外非点源污染模型文章逐年发表数量分析

图1 国外非点源污染模型文献数量分布图Fig.1 The number of foreign periodicals in non-point source pollution models

以WEB OF SCIENCE数据库的核心合集作为数据源,在2017年2月17日,以Model和non-point pollution or diffused pollution or non-point source pollution作为主题检索。检索时间范围为1986—2016年,WEB OF SCIENCE中收录的非点源污染模型的文献数量在2006年以前为零,共检索到文献数1046篇,每年发文量如图1所示。

由图1可以看出:国外有关非点源污染模型的文章在2014、2016年达到两个小高峰,发表论文数达到128篇和136篇,表明随着水环境污染日益严重,非点源污染对水环境的损害已受到高度关注,成为热点研究课题。从2006年开始,国外对非点源污染模型的研究一直保持在较高的水平,每年的发文量都高于60篇,虽然在过程中伴随着间或性下降,但整体来看,几乎是呈线性增长的状态,表明学术界对非点源污染模型的关注度还是比较高的。

2.1.2关键词频次分析

使用文献计量分析软件Bibexcel统计关键词频次,由于相同的关键词可能表述不同,所以将所得关键词进行整合,除去频次最高的关键词“non-point source pollution”外,选取词频较高的前30个关键词。这30个关键词在一定程度上反映了国际上非点源污染的研究方向和研究热点,结果如表1所示。

从表1得出:(1)研究的热点领域出现在“water quality(水质)”、“non-point source(非点源)”“SWAT”和“Phosphorus(磷)”方面,关键词词频都超过了70,共占统计关键词的30.96%,远高出平均水平。可见研究范围比较明确,研究内容相对具体。(2)有关SWAT模型的研究占统计词频关键词的8.2%,是所有研究非点源污染的模型中占比最高的,远高于其他模型的占比。因其准确强大的模拟功能、与3S技术友好结合等特点,SWAT模型成为非点源污染模型研究中的热点研究模型,并且在研究过程中不断改进,日趋成熟,表明国际学术界对于用SWAT模型解决非点源污染问题的关注度很高。(3)有关“Nitrogen(氮)”、“Phosphorus(磷)”和“Nitrate(硝酸盐)”的研究也较多,关键词词频都高于50,证明非点源污染与化学元素息息相关,尤其是“Nitrogen(氮)”、“Phosphorus(磷)”两种元素,是造成地表水体富营养化的主要原因,一直是学术界解决水体富营养化问题,研究水环境污染的重要元素。这也与郭琳琳[14]的研究相符合。(4)在统计关键词中,有关农业的关键词较多,如:“Agricultural(农业的)”、“Land use(土地利用方式)”等平均占比都比较高,表现出农业生产对非点源污染的贡献率是比较高的,非点源尤其是农业非点源是导致地表水污染的主要原因,其中又以农业非点源污染贡献率最大[15-16],所以对于土地利用方式、城市与农村合理布局的研究是以后非点源污染领域研究的重点内容。(5)数学模型是定量化描述和评价非点源污染的重要手段,而 GIS 技术可以和数学模型友好结合,分析非点源污染产生的时间及其空间分布特征,是研究非点源污染过程中的重要工具,与统计关键词中“GIS”的词频较高相对应。

表1 国外“非点源污染模型”期刊论文中高频关键词和词频

2.1.3关键词可视化分析

以上关键词虽然能在一定程度上反映出非点源污染模型领域的研究热点和方向,但是仅按他们的频次分析,并不能反映出他们之间的关系。因此采用 Bibexcel 软件将这30个高频关键词进行两两配对,统计它们的共现频次,形成 30×30的共词矩阵。但是关键词的关联度对可视化结果有一定的影响,因此本文采用了关联强度 Ochiia 系数统计指数来减少这一影响[17]。其计算公式如下:

于是结合NetDraw和Ucinet软件得出关键词共现网络可视图,如图2所示。

图2 国外关键词共现网络可视图Fig.2 The common network visual map of foreign high-frequency keywords

这30个高频关键词之间形成了相互联系密切的交错关系(图2),其中节点大小表示关键词的中心度,节点越大表示中心度越高,节点之间的连线表示节点之间两组关键词出现的频次,连线越粗表明出现频次越高,代表两组关键词的关系就越密切[13]。这种交错关系网络呈现出以居于可视图中心位置的高频关键词如“water quality(水质)”、“Nitrogen(氮)”、“BMPs”、“Nitrate(硝酸盐)”、“SWAT”和“Phosphorus(磷)”为研究中心的主体结构,表明“water quality(水质)”、“Nitrogen(氮)”、“BMPs”、“Nitrate(硝酸盐)”、“SWAT”和“Phosphorus(磷)”是非点源污染模型工作研究的热点方向,这与关键词词频统计得出的结果基本一致,同时也表明了国外非点源污染的研究对于非点源污染问题的重视,探索最优管理措施,并且在探索解决途径的过程中注重模型的运用。在这些热点方向和研究热点中,氮、磷和硝酸盐等营养物质一直处于重要研究地位,表明了水体富营养化已经是一个重要的国际问题。

2.1.4被引频次分析

论文引用率是指科学论文对文献的引用次数,是衡量一个国家科研文献被其他国家或机构的认可度的标志。现选取年均被引频次排名前十五位的论文,整理其发文期刊、发表年份、总被引频次、年均被引频次和第一作者,如表2所示。

由表2可以看出:(1)Ongley, Edwin D于2010年在ENVIRONMENTAL POLLUTION上发表的论文,年均被引频次是最高的,达到17次以上,同时其总被引频次也相对较高,达到125次,其主要对中国的农业非点源污染评价进行了研究,对非点源污染的研究模型、中国不同流域中重要化学元素的污染负荷量、美国不同流域的TN、TP、中国评价非点源污染的方法以及研究中国农业非点源污染的条件做了总结,对农业非点源污染的研究具有重要的参考价值。(2)JOURNAL OF HYDROLOGY是年均被引频次排名前十五位论文的最主要发文期刊,在发表年均被引频次排名前十五位的论文期刊中其发表论文数最多,是国外研究非点源污染的核心力量。(3)总体看来,在年均被引频次排名前十五位的论文中,有4篇是在2008年发表的,占统计年份的26.67%,说明国外对非点源污染模型的研究在2008年之前已相对深入,对非点源污染问题有较深程度的研究。

表2 国外论文发表年份和年均被引频次

2.1.5关键词聚类分析

聚类分析是研究“物以类聚”的一种科学有效的方法。本文中,在对30个高频关键词进行聚类时,采用系统聚类的方法,首先将每一个关键词看成单独的一类,通过选定的方法把最近的两类合并,然后重新计算各类之间的距离,再把距离最近的两类合并,如此下去,每次重复都减少一类,直到最后所有的关键词都归为一类为止[18]。以上文构造的30×30的相异矩阵为基础,运用SPSS软件进行聚类分析,得出聚类树状图,如图3所示。

图3 聚类树状图Fig.3 The clustering tree

结合图3,并结合非点源污染模型之间的联系,可以将上述30个高频关键词划分为4个主要的聚类群体,每个聚类群体包含的关键词如表3所示。

从表3中可以看出,集群1的内容主要集中在点源和非点源水污染,尤其是水体富营养化现象严重。集群2的内容主要是关于水污染的一些模型和框架条约,可见非点源污染造成的水污染问题的严峻性和学者们对这一问题的重视。集群3的内容比较复杂,涉及非点源污染模型的各种模型、特性、解决措施等等诸多方面。集群4主要涉及处理非点源污染模型的工具,与GIS等的结合,可以充分发挥GIS在分析非点源污染产生的时间及其空间分布特征上的作用。

为了更加显著的看出高频关键词之间的聚类群体,采用SPSS 统计软件中的多维尺度分析来构建多维尺度可视化图谱(图4),从可视化图谱中可以直观、清楚的得出关键词之间的聚类群体,更好地显示出分类情况,从图中可以看出,相同群集的关键词分布情况与系统聚类的结果基本一致。

表3 国外“非点源污染模型”聚类群体划分

图4 国外“非点源污染模型”线性拟合散点图Fig.4 The linear fitting of the abroad non-point source pollution models

2.2 国内非点源污染模型数据来源途径及分析

2.2.1国内非点源污染模型文章逐年发表数量分析

以中国知网学术期刊网络出版总库(CNKI)作为数据统计源,在2017年2月17日,以非点源污染或面源污染和模型为主题进行检索,检索范围为1986—2016年,共发表论文1474篇,每年发文数量如图5所示。

图5 国内“非点源污染模型”论文数量分布变化图Fig.5 The number of domestic periodicals in non-point source pollution models

从图3中可以看出:(1)在2001年之前,有学者对非点源污染进行研究,但是当时在我国并没有引起太大关注,相关研究比较少,论文发表数量很少。(2)随着污染问题日益严重,国家对可持续发展的重视,在2003年之后,我国有关非点源污染模型的研究论文开始增多,尤其是2008年之后,每年发表论文数量都在90篇以上,并且在2012年达到高峰,相关文献发表达143篇。(3)虽然在某些年份论文数量有所下降,但整体来看,我国关于非点源污染模型的论文发表数量呈现上升趋势,表明随着可持续发展要求不断深入,我国非点源污染的研究也逐渐加深。

2.2.2关键词频次分析

利用文献计量分析软件CiteSpace统计得出关键词的词频。由于相同含义的关键词,不同文章表述不同,所以本文将含义相同的关键词进行合并整理,并且除去频次最高的关键词非点源污染,整理后选择前30个高频关键词进行统计分析,研究这些高频关键词之间的关联度。这30个关键词在一定程度上反映了我国非点源污染模型领域的研究热点和研究方向。选取的关键词和词频如表4所示。

表4 国内“非点源污染模型”论文中高频关键词及词频

从表3可以得出:(1)在关于非点源污染模型的文章中,“SWAT模型”词频高达173,占统计关键词的11.88%,仅次于非点源污染。可见我国在研究非点源污染问题时,最常用的模型是SWAT模型,是国内研究非点源污染模型中的研究热点,这与国际上对SWAT模型的研究是相对应的。同时在高频关键词中“输出系数模型”、“AnnAGNPS模型”词频相对而言也比较高,表明这些模型是我国研究非点源污染问题的重要模型。(2)在高频关键词中,有关农业生产和土地的关键词比较多,如“农业面源污染”、“土地利用”、“农业”等说明农业生产是造成非点源污染的一个重要因素,农业生产过程中喷洒的农药,化肥等流入到河流中,造成严重的水污染,所以解决农业生产过程中造成的非点源污染是我国面临的重要问题,对此Zhuang等[19]也提出了相似的看法。(3)“地理信息系统”的词频相对而言比较高,占统计关键词的7.62%,远高于平均占比,表明地理信息系统凭借其对地理信息的收集、处理、存储、分析等功能,在非点源污染领域得到广泛应用,是我国解决非点源污染问题的一个重要工具,同时这也与国外关键词的统计相对应。(4)“总氮”和“总磷”词频也比较高,说明了N、P是国内外非点源污染问题研究过程中的重要元素,是重要污染物,造成严重的水体污染。

2.2.3关键词可视化分析

为了更直观的得到高频关键词之间的联系,结合Bibexcel、Ucinet和NetDraw软件得出了高频关键词的可视化网络图,如图6所示。

图6 国内高频关键词共现网络可视图Fig.6 The common network visual graph of domestic high-frequency key words

从国内高频关键词共现网络可视图可知,除去非点源污染外,“SATI模型”、“污染负荷”、“氮”和“磷”等关键词占据中心位置,因此它们是我国非点源污染模型的研究热点和研究方向,这与高频关键词统计所得结论基本一致,可见研究模型来解决土地利用合理分配,解决农业非点源污染以及氮、磷元素的处理和利用是当前非点源污染的重要研究问题和领域。

2.2.4被引频次分析

对国内年均被引频次排名前十五位的论文进行统计,如表5所示。

由表5可知:

(1)何浩然于2006年在《农业技术经济》上发表的论文,年均被引频次最高,被引频次达到19次以上,同时其总被引频次也相对较高,达到217次,其主要运用了统计分析和构建计量经济模型的方法研究了化肥对农业非点源污染的影响,并且在研究过程中发放了问卷,更加真实的了解了农户的基本特征,进而再运用回归分析研究化肥施用的影响因素,对农业非点源污染的研究具有参考意义。(2)从表4可以看出,《生态学报》和《环境科学》收录的年均被引频次排名前十五位的论文最多,是重要的两个发文期刊,是国内研究非点源污染的核心力量。(3)整体来看,国内年均被引频次排名前十五位的论文主要出现在2002年之后,说明我国对非点源污染模型的研究主要是在2002年开始,这也与论文发表年份和数目的统计相对应,从2003年之后每年发表论文数目较之前显著增多。

表5 国内论文总被引频次和年均被引频次

2.2.5关键词聚类分析

采用与上述国外非点源污染模型研究相同的方法,得到系统聚类树状图(图7)、聚类群体划分表(表6) 以及多维尺度分析图(图8)。

图7 聚类树状图Fig.7  The clustering tree

表6 国外“非点源污染模型”聚类群体划分Table 6 Cluster of “non-point source pollution models” in China

图8 国外“非点源污染模型”线性拟合散点图Fig.8 The linear fitting of the domestic non-point source pollution models

由上述图表可看出,集群1的内容主要涉及氮、磷营养物质,说明氮、磷等营养物质是造成非点源污染的重要元素,这与国外非点源污染中的一个主要的研究方向相对应,要采取措施解决水体富营养化现象。集群2主要是解决非点源污染的工具,地理信息系统可以更加准确的描述非点源污染的空间分布。集群3的内容比较复杂,涉及非点源污染的模型、影响、其发展历程等多个方面,与国外非点源污染的集群划分基本一致。集群4主要是针对太湖流域和三峡库区进行分析研究。

3 结论与讨论

(1)从数量上看,国内外论文发表数量在2010年之后都较之前增多,说明非点源污染模型的研究在国内外受到重视。总体来看,从2006—2016年间我国发表的论文数较国外而言比较多,说明我国非点源污染模型的研究得到重视,与我国提出的可持续发展,加强环境保护相对应。

(2)从研究热点上看,国外研究热点为“water quality(水质)”、“Nitrogen(氮)”、“Watershed(流域)”和“Phosphorus(磷)”等,而国内的研究热点为“SATI模型”、“GIS”、“农业”、“土地利用”、“总氮”和“总磷”说明国内外研究热点有相同之处,但我国相对于国外而言更重视地理信息系统的研究和使用以及农业生产对非点源污染的贡献,而国外则更注重以流域为基础的非点源污染模型的探讨。

(3)从群集分类上看,国内外的群集划分情况基本相同,可以概括为非点源污染的模型、工具、影响、发展历程四个主要方面。

(4)本文选取累积出现频次达到11的前30个英文关键词和累积频次达到17的前30个中文关键词作为统计关键词,但并不排除一些频次比较低的关键词未来也可能成为研究热点。利用共词分析法探讨学科领域的研究热点,其结果受关键词统计的完整程度、专业水平和学科门类的影响,存在一定的局限性。

猜你喜欢

词频热点聚类
热点
基于K-means聚类的车-地无线通信场强研究
热点
结合热点做演讲
基于高斯混合聚类的阵列干涉SAR三维成像
词频,一部隐秘的历史
一种层次初始的聚类个数自适应的聚类方法研究
儒法两家经典的共词分析与研究*
以关键词词频法透视《大学图书馆学报》学术研究特色
热点