基于文献计量学的地下水水质评价研究现状
2022-09-01叶婷陈康丁永康黄靖宇
叶婷陈康丁永康黄靖宇
(1.河北地质大学城市地质与工程学院,河北 石家庄 050031;2.河北地质大学水资源与环境学院,河北 石家庄 050031;3.成都理工大学环境与土木工程学院,四川 成都 610059)
地下水作为人类生产活动的重要供水水源,科学有效的评价水体质量等级是不同地区地下水进行规划管理、开发利用中极为关键的评判标准[1]。在我国现行规范《地下水质量标准》(GB/T 14848-2017)中提出单因子评价法的确定地下水质量等级[2],在长期的实践中表明该方法有一定的局限性,即由于其施行的单项否决而忽视其他污染程度较低或者无污染的指标,夸大了地下水恶劣程度,从而不利于表征地下水的整体状况[3]。为此,众多学者尝试引入理论数学、统计模型和机器学习等技术手段针对于不同环境条件、污染类型及功能价值等方面的地下水水质评价方法进行适宜性优化[4-8],研究成果在不同程度上丰富了地下水水质评价体系,使得水体质量状况得到更为全面客观的反应。
国内对地下水水质评价的相关研究迄今已有40余年[9],在学术研究日益深入的同时,迫切需要对国内地下水水质评价研究成果进行归纳总结,梳理其发展脉络,并对比国外在该领域研究的异同并寻求差距,识别领域热点前沿,为后续研究提供相关数据参考。近年来文献计量学的蓬勃发展为地下水水质评价的系统分析总结提供了新的定量化角度[10,11],其通过数学与统计学思维的交叉融合,对一定时间内的知识载体进行聚类描述,将知识图谱可视化并揭示其内部联系,从而探析各学科领域的发展脉络与研究趋势。文献计量法在生态环境、生物修复、地球科学[12-15]等多个研究领域方向发展历程的系统分析总结中得到广泛应用且取得了极为显著的效果。
鉴于针对国内外地下水水质评价发展历程系统性总结的迫切性与必要性,本文基于文献计量学理论,在CNKI(中国知网)和WoS(Web of Science)中检索2000—2020年地下水水质评价研究领域的主题文章作为数据源,采用CiteSpace文献可视化分析工具,构建地下水质量评价研究的知识图谱,对该领域研究热点的演化轨迹进行刻画并识别未来研究的发展趋势,以期为地下水水质评价领域的发展提供有益参考。
1 数据来源与研究方法
1.1 数据来源及处理
数据来源于中国知网(简称CNKI)文献库和Web of Science(简称WoS)核心数据库。中文文献数据样本来源于CNKI数据库,在高级检索中以“地下水”并“水质评价”为主题词进行检索,检索时间跨度为2001年1月1日—2020年12月31日,经人工剔除重复记录、会议论文和科技成果后,共得到1128篇中文文献。外文文献数据样本来源于WoS核心数据库,检索主题为“groundwater quality evaluation”或“groundwater quality assessment”,文献类型选择“Article”或“Review”,时间跨度同样为2001年1月1日—2020年12月31日,在CiteSpace软件中进行除重操作后,得到4986篇英文文献。最终收集国内外文献共6114篇,以此作为研究分析的主体数据源。
1.2 研究方法
文献计量分析利用CiteSpace5.8.R3软件,其是由陈超美教授的团队基于Java平台所开发的用于探测某研究领域中发展前沿与新兴趋势的文献计量软件[16,17]。导入原始数据源后选择相应的节点类型(Node types)分别运行出Country、Author、Institution、Keyword和Reference网络知识图谱,进而对国内外地下水水质评价领域的相关研究进行可视化对比分析。软件参数设置:时间分段(Time slicing)为2001年1月—2020年12月,时间切片为1a。阈值G-index、TopN和TopN%分别为25、50和100,网络裁剪方式选择Pathfinder、Pruning the Merged network和Pruning sliced networks,其他参数均为系统默认值。
2 结果与分析
2.1 文献数量
历年发文量的变化特征可以在一定程度上反映该领域的研究热点及其更替情况。总体来看,在2001—2020年CNKI和WoS在该领域的发文量基本呈波动上升趋势,见图1,但二者发文量的年均增长速度存在显著的差异:前者为4篇·a-1,后者为34.85篇·a-1,相差约为8倍。根据近20a CNKI中地下水水质评价相关文献的数量变化趋势,大致可将其分2个阶段:2001—2013年为地下水水质评价方法发文数量的缓慢上升期,发文量逐年递增,2013—2020年发文数量虽有波动,但是整体呈平稳趋势,说明国内该领域的研究进入了稳定发展阶段。WoS年发文量的增长速度在2005年后开始加快,并在15a内由从71篇增至742篇,整体呈持续上升趋势,特别是2017年后,增长速度急速上升,2020年发文量较2017年增长了94.75%,反映出近4a国际学者对地下水水质评价领域的相关研究持有较高的关注度。我国在WoS中发文量在2017年后的2a出现快速增长,表明自2017年修订《地下水质量标准》后,地下水水质评价在我国进入成熟期,在一定程度上引起国内学术界的探究与实践的热潮,同时更注重学术成果的国际传播与影响。此外,2021年国务院印发《地下水管理条例》并于当年12月实施,表明党中央、国务院充分关注地下水资源管理工作。在该政策背景下,预计地下水水质评价方法领域在中英文文献发文量仍会呈持续增长趋势。
图1 2001—2020年地下水水质评价研究发文量
2.2 发文国家与机构
运用CiteSpace软件生成地下水水质评价研究的国家合作图谱,见图2,其中N=141,E=199(N为节点数;E为连线数),连线的密度与粗细代表各国家之间的关联程度与强度[18],由此可见该领域我国在国际上的活跃程度较好,且与德国合作关系最为密切。在地下水水质评价方法研究中发文量排名前3的国家分别为美国、中国、印度,见表1。中心性是判断文章影响力与重要性的指标[19],如美国(0.03)这一节点的中心值低于中国(0.21),表明尽管美国发文量较大但其文章的影响力与重要性相较于中国偏弱;综合来看,目前我国地下水水质评价有关的研究成果影响力处于世界领先地位。
表1 地下水水质评价英文文献发文量前10的国家
图2 WoS地下水水质评价研究国家合作网络图谱
通过在节点类型中选择institution,对发文机构进行发文数量统计,见表2。WoS中发文量排首位的机构为中国科学院(Chinese Academy of Sciences),其次分别为长安大学(Changan University)、美国农业部农业研究所(United States Department of Agriculture-Agriculture Research Service)、美国地质勘探局(United States Geological Survey)、中国地质大学(China University of Geosciences),其中3所机构来自于中国,表明地下水水质评价的相关研究引起我国学者较高的关注度。中国科学院在地下水水质评价研究领域中发展快、研究成果多、实力较雄厚。在CNKI中发文量较多的研究机构有吉林大学、中国地质大学、长安大学。其中吉林大学以发文量51篇的数量位居首位,占总量的4.52%。长安大学和中国地质大学在国内和国际发文量排名都位列前5,说明二者在地下水水质评价领域活跃程度较高。
表2 中、英文文献发文量前5的机构
2.3 代表作者群体
在节点类型区域选择Author,运行出作者共现网络图谱并分析地下水水质评价领域研究的核心团队及其间合作关系。WoS中作者合作网络大致呈现出局部聚集但整体分散的布局,见图3,体现该领域中的学者基本以独立团队的形式进行研究,团队间协作关系较弱。该领域主要研究团队有中国长安大学环境科学与工程学院的钱会团队,印度中央矿业和燃料研究所的Ashwani Kumar Tiwari和Abhay Kumar Singh的团队,中国北京师范大学的滕彦国团队。其中,发文量最多的3位作者均来自长安大学,为钱会教授、吴健华副教授、李培月教授,说明长安大学在地下水水质评价中取得较为丰硕的成果。
图3 WoS英文文章作者合作图谱
CNKI中作者合作关系同样具有独立而分散的特点,见图4。目前,此领域的核心研究团队主要有5个:北京工业大学建筑工程学院张永祥团队、成都信息工程大学资源环境学院李祚泳团队、吉林大学新能源与环境学院肖长来团队、吉林大学环境与资源学院卢文喜团队、长安大学环境科学与工程学院的钱会团队。其中,吉林大学卢文喜教授发文量达13篇,是该领域CNKI中发文最多的学者,其近年在该领域主要研究方向是地表水地下水水质耦合模拟。总体来看,国内研究机构和团队目前已基本成熟稳定,团队内部学者的联系较紧密,但团队之间合作交流较弱,部分团队研究活动较为独立。
图4 CNKI中文文章作者合作图谱
2.4 研究方向与热点识别
关键词是文章主题及内容的提炼,能直接体现文章的核心内容,对高频关键词的分析能够进一步挖掘研究领域的方向与热点[20]。通过CiteSpace软件中的关键词共现功能,得到近20a来CNKI和WoS数据库中关于地下水水质评价研究中的高频关键词,见表3。由于“地下水水质评价”为检索主题,CNKI和WoS中“地下水”和“质量”都是频次最高的关键词。除检索主题之外,在CNKI中关键词频数较高的有“熵权”、“模糊数学”、“GIS”等,说明国内学者重视各类方法在地下水质量评价中的优化与应用。WoS中高频关键词则包括污染(contamination)、含水层(aquifer)、盆地(basin)、饮用水(drinkingwater)等,反映国际上更倾向于对地下水污染引起的水质成分变化对地区环境以及人类活动影响的研究主题。
表3 CNKI&WoS高频关键词
利用CiteSpace聚类功能可生成CNKI和WoS数据库中有关地下水水质评价研究领域的关键词聚类图谱,软件根据网络结构和聚类的清晰度,引出模块值(Q值)和平均轮廓值(S值)2个指标并将其作为量化图谱绘制效果的主要尺度。通常情况下,Q值一般介于[0,1)区间内,Q>0.3就意味着划分出来的聚类结构是显著的,当S值>0.7时,聚类是高效有说服力的[21]。并且不同颜色代表不同聚类,聚类序号越小表示该聚类包含的成员越多,是该研究领域普遍关注的焦点。
在国内关键词聚类图中Q=0.8572、S=0.9848,见图5,表示该聚类结构显著且聚类效果有意义。国内地下水质量评价主要研究内容可分为10类,包括#0“地下水”、#1“水质评价”、#2“GIS”、#3“数值模拟”、#4“水源地”、#5“综合评价”、#6“水质分析”、#7“模糊数学”、#8“权重”、#9“污染”。其中,#0“地下水”和#1“水质评价”与其他相关研究有着密集的连结线,展现出较高的聚类中心性。聚类#5、#7、#8是水质评价的主要方法聚类,分别为“综合评价”、“模糊数学”、“权重”,其中水质指标、遗传算法、正态云模型、熵权法、层次分析法等为高频关键词。#2“GIS”和#3“数值模拟”是进行水质预测的主要方法聚类,关键词包括水质预测、污染风险、模型、地下水环境、咸水入侵等,反映出随着现代信息技术发展不断推进,各种数据处理工具在地下水的模型研究、水质监测等领域得到实际应用。#4“水源地”和#9“污染”中高频关键词包含农村、城市供水、供水安全、过量开采、防治措施等,展现出学者们通过构建研究区地下水水质评价体系评估城镇发展与生态环境之间的协调关系。
图5 CNKI关键词聚类图谱
从图6关键词的聚类分析看,国外地下水水质评价的主要研究可以归纳为10类,分别是“风险(#0 risk)”、“磷(#1 phosphorus)”、“盆地(#2 basin)”、“河流流域(#3 riverbasin)”、“土壤(#4 soil)”、“不确定性(#5 uncertainty)”、“统计分析(#6 statistical analyses)”、“美国(#7 unitedstates)”、“海水入侵(#8 seawater intrusion)”、“水质指数法(#9 WQI)”。其中最大的聚类为风险(risk),关键年份出现在2011年,该聚类中主要文献主题为地下水健康风险评价,反映出国际学者较为重视地下水中某些组分对人体健康的影响并进行风险定量评价[22]。“盆地(basin)”、“河流流域(river basin)”、“海水入侵(seawater intrusion)”表明了进行地下水水质评价的主要集中地区。不确定性(uncertainty)、统计分析(statistical analyses)和水质指数法(WQI)3个类群是进行地下水水质评价的主要研究方法。磷(phosphorus)和土壤(soil)是近年来重点关注的地下水污染对象。美国(United States)是地下水水质评价领域的典型研究区。
图6 WoS关键词聚类图谱
时间线图主要侧重于刻画各个聚类在同一时间线上的研究脉络,能够较为直观地观察到该聚类的演化路径[23],见图7、图8。在CNKI中,地下水水质评价的研究在近20a一直保持较高的热度,如图7所示,其中“GIS”和“数值模拟”中聚类成员较多,且研究时间持续较长,说明在地下水质量评价研究领域中重视对地下水水质的预测及其可视化,并且未来将会持续研究下去。“水源地”的相关研究自2008年后开始频繁起来并长期保持较高的研究热度。在水质评价方法中,“模糊数学”在地下水水质评价中的运用较为广泛且持续时间较长,目前关注度有所降低但仍在水质评价方法研究中发挥一定的作用。“污染”这一研究主题在2010年前具有较多的文献产出但在2010年后其讨论热度逐渐下降,表明经过地下水超采综合治理后地下水污染问题得到了缓解。由WoS关键词时间线图谱,如图8所示,可以观察到各个聚类的研究都持续较长时间,但是研究热度却有所变化。如2008年左右学者们进行了较多关于盆地(basin)的研究,而在2014年左右盆地(basin)的讨论热度有所下降,相反河流流域(riverbasin)和海水入侵(seawaterintrusion)的相关研究在2014年左右大幅增加且十分密集,这表明了在2014年地下水水质评价的重点关注地区由盆地转移到河流平原和海岸线。
图7 CNKI关键词时间线图谱
图8 WoS关键词时间线图谱
2.5 研究主题演变与核心文献分析
通过对比研究主题的变化可以反映出该领域研究方法、热点及分析角度随时间演变的规律[24]。在CiteSpace中的节点类型区域选择Reference,生成共被引文献共现图谱后,在Layout中选择Timeline View,得到文献共被引时间线图,见图9。图9展示了地下水水质评价研究领域中共被引文献的15个聚类主题的演化动态与其间引证关系,反映出研究前沿的方向性变化及研究主题间的结构关系。Q值为0.9105,远大于0.3;S值为0.9616,大于0.7,表明该聚类结构显著且高效。被引频次较高的成果主要集中在聚类#8健康风险(health risk)中,该主题出现时间较晚且目前仍处于热度较高的状态。各聚类持续时长截然不同,其中聚类#0地下水适宜性(groundwater suitability)和聚类#3水化学研究(hydrochemical studies)相关研究持续时间最长,长达11a。聚类#1水文地球化学特征(hydrogeochemical characterization)和#2地下水脆弱性评价(groundwater vulnerability assessment)持续时间也较长,均为9a,并且目前还保持。#14重金属污染(heavymetal pollution)出现时间较晚,但是在近期活跃程度较高并处于快速发展阶段,反映出地下水重金属污染问题已引起国际学者的高度关注,可能成为未来地下水水质评价的研究热点。
图9 文献共被引时间线图谱
3 结论与展望
本文通过CiteSpace文献可视化分析工具,对CNKI和Web of Science核心数据库2001—2020年地下水水质评价相关领域的文献进行统计分析,研究结果从文献数量、发文国家与机构、代表作者群体、研究方向与热点及研究主题演变与核心文献分析5个方面进行论述。主要结论如下。
近20a该领域在国内外数据库的发文量均处于增长趋势;我国在该领域研究的处于世界领先地位,其主要代表机构有长安大学、中国地质大学、中国科学院,我国优良的科研环境与资金支持和广大学者不懈的探索努力奠定了我国在地下水水质评价领域的国际地位。
该领域研究方向分别为以国内期刊为代表的对地下水水质评价方法的优化与应用;以国际期刊为代表的对地下水污染引起的水质成分变化对地区环境以及人类活动的影响研究;理论数学与水质指数法是该领域主要的研究方法;盆地、河流流域、沿海带是该领域主要的研究地区。
地下水适宜性与水化学研究在近20a该领域中均保持较高的研究热度,地下水水质的预测及其可视化、河流与沿海地区水质评价及重金属污染与健康风险评价是该领域潜在的发展方向与突破点。
纵观地下水水质评价国内在近20a的发展史,从引入数学方法对地下水水质评价进行优化应用的初期探索,到针对复杂自然条件采用特定的技术手段进行定性与定量的分析评价,我国在该领域研究的日益成熟,代表性研究团队呈分散式多元化的发展。在信息时代科学研究愈发倾向于广泛合作,我国研究学者和团队在既有研究基础上,应加强与不同院校、不同国家与地区的交流合作,引入更多学科、方法的交叉融合与更多新技术的相互印证,共同推进地下水水质评价领域的研究发展。