基于CiteSpace知识图谱的水文大数据研究进展
2024-03-26孟露杨海波
孟露 杨海波
摘要:水文大数据相关研究是近些年水文领域的研究重点和核心问题,同时也是提高水文事务处理效率和增强水文规律真实性及可信性的重要内容。现将从中国知网(CNKI)收录的264篇文献和Web of Science(WOS)收录的219篇文献作为样本数据,利用CiteSpace软件对其进行研究人员、研究机构及热点分析,深入探索该领域研究的发展趋势。研究表明:从发文量总体来看,国内和国际发文量均呈现上升趋势。从研究人员和研究机构来看,国内学者和机构间呈现“大分散,小聚集”的现象。从研究热点来看,以“智慧水文” “预警系统” “Big data testing”等为突现关键词意味着该领域的研究重点逐渐向技术化、数字化方向演进,无论在国内还是国际,现代的水文监测技术与水文学方法相对于传统的技术和方法,均具有更高的准确性和稳定性,可以更充分地满足实际应用需求,将水文和大数据相结合逐渐成为了该领域的研究趋势。
关键词:CiteSpace;知识图谱;水文大数据;可视化分析
中图分类号:P333文献标识码:A文章编号:1001-9235(2024)02-0038-07
Research Progress of Hydrological Big Data Based on CiteSpace Knowledge Graph
MENG Lu,YANG Haibo*
(School of Water Conservancy and Civil Engineering,Zhengzhou University,Zhengzhou 450001,China)
Abstract:Research related to hydrological big data has been a focal point and core issue in the field of hydrology in recent years.It is also an important component for improving the efficiency of hydrological affairs processing and enhancing the authenticity and credibility of hydrological patterns.This study utilized a sample dataset comprising 264 papers collected from China Knowledge Infrastructure (CNKI) and 219 papers collected from Web of Science (WOS).Using CiteSpace software,this paper analyzed the researchers,institutions, and research hotspots and explored the development trend of research in this field in depth.The findings indicate that,overall,both Chinese and international publications show an increasing trend.Regarding researchers and research institutions,there is a phenomenon of “large scattering and small gathering” among Chinese scholars and institutions.Examining research hotspots reveals that keywords such as “intelligent hydrology,”“early warning system,”“big data testing” signify that the focus of research in this field is gradually shifting towards technological and digital directions.Whether domestically or internationally,modern hydrological monitoring technologies and hydrological methods,in comparison to traditional technologies and methods,demonstrate higher accuracy and stability.They can more fully meet the practical application requirements,and the combination of hydrology and big data has gradually become a research trend in this field.
Keywords:CiteSpace;knowledge graph;hydrological big data;visual analysis
隨着物联网技术的普及,大数据、云计算和人工智能技术的逐步成熟,中国水利信息化发展进入智慧水利的新阶段[1]。在当前大数据环境下,水文相关部门主要依靠自动测报系统中的传感器设备来采集雨量、流量以及水位等水文信息;在水文水情数据信息采集的基础上,需借助大数据技术根据实际需求对数据进行分析和处理,并进一步对采集的数据进行存储[2]。水文作为水利行业的重要基础工作,是智慧水利的重要组成部分,也是大数据技术发展、智能化建设的基础内容之一[3]。因此通过检索“水文大数据”相关领域论文,从而对该领域进行研究和讨论很有必要。
在水文大数据研究方面做出成就的研究人员数不胜数[4-6],但由于各位学者的研究区域不同、数据来源不同、环境不断变化等情况,尽管众多学者都对该研究方向提出了自己独到且有科学性的见解:针对流域水文模型的本质和特征,诠释了“分解”与“继承”的科学思维在流域水文模型建模中的作用并做出了反复论证和思考[7-9];针对现有水文气象条件对流域具体情况进行分析,并利用大数据分析方法对洪水过程做出预报[10];针对软件开发、模型组合生成以及遥感数据的应用现状进行分析,指出水利云平台开发过程的各种研究问题[11];面向具体水文应用的水温时空数据挖掘模型,研究人员也为相关决策提供了信息支撑[12]。为进一步加深对水文大数据研究过程、研究成果以及研究具体问题的理解和认识,本文将针对以上几个方面进行较为概括且全面的研究成果梳理与相关数据分析。
通过文献计量学方法开展的相关研究涉及面较广,可以较系统地分析各个领域的研究进展和趋势。如在对流域产汇流方面进行文献计量分析时,结果表明产汇流模拟和暴雨洪水管理模型(SWMM)等的运用是当前的研究热点[13];在对美国农业部水土保持局(SCS)模型在中国流域的研究现状进行分析时,研究表明其与其他模型的耦合应用以及遥感技术的应用为该领域的研究重点[14]。近些年来,该领域的研究内容正在向地质灾害方向过渡,且在今后的岩溶水文地质研究中应加强与各国社会经济等建设的内在联系,共同促进可持续发展[15-16]。关于水文大数据的文献定量并不多见。因此,本文利用CiteSpace软件对来自中国知网(CNKI)和Web of Science(WOS)平台的文献进行整理和分析,以知识图谱的形式将“水文大数据”领域的研究作者、机构和热点问题表示出来,使结果更加可视化。
1 数据与方法
1.1 数据来源
本文将对国内和国际期刊文献分别进行文献计量和筛选分析。首先从CNKI平台进行检索,以“水文”和“大数据”为检索主题的关键词,以2002年1月1日至2022年12月1日为检索的时间范围,剔除相关性较差的结果后得到有效文献共计264篇;然后以Web of Science为平台进行检索,以“Hydrology”和“Big data”为检索关键词,以2002年1月1日至2022年12月1日为检索时间范围,通过分析检索结果的主要内容及发表刊物,剔除与本文研究领域相关性较差的结果,得到有效文献共计219篇。
1.2 研究方法
知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、構建、绘制和显示知识及它们之间的相互联系。概括来说,就是把众多有关图形分析学科的理论和方法与计量学的方法相结合,以可视化图谱的形式将知识的发展趋势和热点等内容直观地表示出来[17]。可视化分析就是将海量数据进行关联分析,由于这些数据中存在分散和结构不统一的情况,通常会辅以人工操作,借助功能强大的可视化数据分析平台将海量数据进行分析和整理,并做出完整的包含分析过程和数据图表。本文采用的CiteSpace软件是一款信息可视化软件,主要用于分析可视共被引网络,帮助探测知识领域中潜在的新趋势[18],此次筛选为“Keyword”网络节点,时间切片为1 a,运用CiteSpace软件对“水文大数据”相关文献中的关键词进行聚类分析,经裁剪后可得到所选文献中主要关键词共现聚类图[19]。
2 主要研究力量分析
水文是关乎水利和国民经济建设与发展重要的基础工作。水文大数据被广泛应用于防汛抗旱、水利工程规划设计、水资源管理与开发利用、水环境保护、水科学研究及其他国民经济建设。随着科学技术的发展和人们生活水平的提高,大数据技术逐渐应用于水资源保护领域,无论是水文要素的监测还是水利工程的建设与平台搭建,均离不开大数据技术的支撑。本文主要从发文趋势、主要作者和研究机构3个方面概括性分析以“水文大数据”为研究主题的文章总体情况,如此分析更有利于了解这类文章的研究热点和发展趋势。
2.1 发文趋势分析
图1展示了该领域相关文献的发表量情况。国内期刊论文中最早的有关“水文大数据”主题的论文发表于2008年,该文展示了在水文大数据驱动下的关于洪水预报模型方面的关键技术及应用,创新性地提出了在洪水预报方面一项新的科技成果。从2014年开始,国内期刊论文中“水文大数据”主题相关论文的发表量逐渐增多,并于2021年发表65篇相关论文,达到峰值。在WOS核心文献集论文中,最早的相关论文是于2002年发表的2篇论文,这些文章讨论并分析了长时间的高水位导致的栖息地环境质量的恶化、土壤湿度图像的统计与分析等相关内容[20-21]。从2002—2015年WOS数据库相关主题的发文量比较稳定但数量较低。近些年发文量有较大增加,而图中所展示2022年发文量下降,是由于所筛选的时间范围截至到2022年12月1日,并未覆盖2022年全年,此外由于2022年新冠疫情严重,受其影响学科研究有所下滑。图1所示发文量的微小波动不足以阐明该领域具体的研究方向和变化趋势,从整体来看,该领域的研究呈现上升趋势。
综合两平台的发文量数据进行分析,近几年“水文大数据”主题的相关论文发表量增多较快,这说明水文大数据已开始被国内和国际相关机构注意并深入研究,逐渐成为这一方面的研究重点和热点主题。近些年关于保护生态环境的关键词频繁出现于国内和国际人们的视野里面,所以水资源环境方面也逐渐得到重视。在大数据平台的支撑下,水文行业高速进步,构建了许多科技平台以供各种水文要素的监测和水生态环境的保护等的应用。水文大数据的应用需要跨领域的协同合作和数据共享,因此建立开放、高效的数据共享平台和机制,对于推动水文大数据的应用具有重要意义。当前,全球已经涌现出许多开放式数据共享平台,未来的研究将更加注重数据共享和协同创新。
2.2 研究作者分析
图2可以直观地表达国内和国际对于该研究主题发表过论文的作者情况。其中节点直径越大代表该作者发表的相关论文越多,而节点之间的连线代表作者之间具有合作关系,节点和线条的颜色对应作者发表论文的时间[22]。图2a表明国内期刊论文作者间合作相对集中,发文量较多的作者是高露雄[23-25](10篇)、王立海[23-24](18篇)、张健[26-27](7篇)、刘荣华[28-29](25篇)和余国锋[30](3篇)。其中高露雄研究员来自长江水利委员会水文水资源勘测局,与王立海所在的研究院有合著关系,主要研究内容为长江流域水文大数据平台的架构以及GIS在水文方面的应用[23];图2b所示,国际作者间合著关系相较于中国更为繁多,WOS文献数据库作者中发文量较多的是Tyralis(20篇)和Papacharalampous[31](20篇),其中Tyralis的主要研究方向为水文过程中出现的Hurst现象、贝叶斯统计及随机水文学的应用[31]。针对以上结论,随着技术的不断发展和应用场景的不断扩展,水文大数据相关领域将会迎来更多的机遇和挑战,加强各研究团队之间的交流与合作有利于更快地推动该领域的研究发展,促进更多创新性成果的研究和发现。
2.3 研究机构分析
图3a表明在国内主要发文机构中,发文量最多的是河海大学水文水资源学院,是在该领域较早进行开展相关研究的发文机构。图3b可以发现,中国科学院(CAS)在国际上的发文机构间的合作较多,形成了较密集的联系网,其主要研究方向为SWAT模型、分布式水文模型等结合大数据技术在流域中的应用等[32-36]。与WOS期刊进行对比可以发现,加强合作和联系有助于推进国内相关研究的发展,各研究机构应促进知识交融,通过相互交流可以发现更多学术上的新思想,进行更深度的探讨。
3 主要研究热点分析
3.1 关键词聚类分析
图4a中可以看出国内期刊可以分为“大数据” “智慧水文” “防汛抗旱” “预警系统” “水文数据共享”等几个聚类,图4b表明国际上的期刊可以分为“Deep learning” “Hydrological series” “Big data testing”等几个聚类。其中“大数据技术”可以充分利用和融合多来源、多类型、多尺度的数据,突破传统方式难以处理的管理瓶颈,获得更高准确度的问题分析以及趋势分析结果,从而促使对目标项目决策的制定[37],大数据分析技术已经在许多领域成功应用并取得了很大的效益,获取了许多应用传统手段难以获取的信息,解决了应用传统手段难以解决的问题[38];“智慧水文”是近些年提出的一个新兴词汇,是指应用云计算、物联网、大数据、移动互联网等新一代信息技术,对各种水文研究对象及水利活动进行透彻感知、全面互联、智能应用等的现代化新模式[39-41];“Deep learning”即深度学习,作为人工智能的一个分支,现已被充分利用于水文水情预报、洪水预警、水质检测、地形探测等智慧水利的工作中[42-43]。
研究表明国内各研究机构将研究热点放在技术与实际应用相结合的方面,依靠各种传感器采集雨量及水位等水文信息,借助大数据技术根据具体情况对数据进行分析、处理以及存储工作[44-45],与传统的水文信息处理方式相比,这种方式更能体现水情信息的时效性和准确性;而国际上在该领域的研究重点侧重于机器学习方面,更倾向于研究河流运动和各种水文现象的规律等方面。如某个预测地下水位变化的研究模型,将复杂网络理论和水文学方法结合,构建一种地下水位变化预测模型,分析不同水文因素对地下水位变化的影响,通过科学的计算方法表明该模型预测的地下水位的变化趋势,则该模型比传统的统计模型具有更高的准确性和稳定性[46]。
3.2 关键词突现分析
图5表明从突发时间来看,“水文模型”与“数据安全”等研究热点在水文大数据主题相关的国内期刊中突发起始时间最早,“Digital elevation model”等研究热点在国际期刊中突发起始时间最早,说明这些模型的构建在当时该领域已得到各位学者和研究机构的重视,并开始将研究重心往水文大数据模型架构的方向转移;从突发强度来看,“物联网”“智慧水利”等在水文大数据主题相關的国内期刊中突发强度较大,“Machine learning”在国际期刊中突发强度最大,这说明科学技术与水文的结合成为了当时各地研究机构的研究热点问题,并逐渐将水文监测技术平台与网络和大数据等技术联系起来,从而投入真正的生产生活中;从持续周期来看,“洪水预报”“防汛抗旱”等与防御洪水和预警预报等有关的关键词在国内期刊中持续时间较长,“Digital elevation model” “Machine learning” “Artificial intelligence”等与大数据技术相关的关键词在国际期刊中的凸显持续时间较长,其涌现率一直持续至今,说明在水文领域内这些相关的技术为当前研究的主要发展趋势,是近些年该领域重点聚焦的热点前沿。人工智能、机器学习和深度学习等技术的应用,在水文大数据领域中的应用具有重要意义。这些技术可以自动分析、识别和提取水文数据的特征和规律,有效提高水文数据的预测和决策能力。未来的研究将会更加注重智能算法和模型的开发和应用。
4 结论
通过知识图谱的可视化展示,可以得知国内和国际代表文献中的研究人员、机构及热点问题,较为直观地了解到以上内容,同时对于水文大数据领域前沿的研究动态也有了进一步的认识。利用CiteSpace软件进行数据分析和绘图,对2002年1月1日—2022年12月1日与水文大数据研究领域相关的国内和国际代表文献进行了文献计量学分析,并得出了如下结论。
a)从发文量和发表趋势进行分析,国内和国际期刊的发文量在整体上都呈现上升趋势,近些年国内相关期刊发文量相较于国际增长更快,从某一程度上反映了水文大数据领域的研究热度正持续上升。
b)从发文作者和研究机构方面分析,各研究机构和学者的合作均呈现“小聚集、大分散”现象,高露雄、王立海等多位研究人员以及河海大学和中国科学院等研究机构组成了国内和国际水文大数据领域研究的主要核心力量。根据图2、3分析可知,加强作者和研究机构之间的联系有助于推动该领域的研究进程,加强彼此思想上的碰撞,掀起更深层次的研究浪潮。
c)从关键词聚类共现的方面分析,国内研究重点放在了大數据技术与水文信息的结合应用方面,如洪水预报、防汛抗旱等,与传统的技术相比保证了水文信息的时效性和准确性;国际则侧重于研究河流、湖泊等的运动规律及水文信息的收集方面如各种结合大数据技术后应用的水文模型,与传统模型相比保证了水文信息的准确性和稳定性。
d)从关键词突现时间分析来看,对各种水文模型的研究是最先出现的热点问题,但近年来研究热点逐渐偏向应用角度,如“防汛抗旱” “洪水预报” “Soil moisture”等,即将各项先进技术与水文领域的各项实际应用相结合。
随着大数据技术的发展,水文大数据的研究也更加普遍。在各种因素的影响下,水文现象呈现不稳定的变化规律,水文大数据领域的研究应进一步得到关注,这也是新时代水资源可持续发展和生态系统水资源保护的研究热点和重点所在。
参考文献:
[1]蔡阳.智慧水利建设现状分析与发展思考[J].水利信息化,2018(4):1-6.
[2]黄兴春,邱鹏,黎春蕾,等.大数据技术对重庆水文发展的启示[C]//2019(第七届)中国水利信息化技术论坛论文集.河海大学:北京沃特咨询有限公司,2019:116-119.
[3]张芸.5G赋能智慧水文建设分析与建议[J].河北水利,2022(11):34-35.
[4]张建云,刘九夫,金君良.关于智慧水利的认识与思考[J].水利水运工程学报,2019(6):1-7.
[5]邱超,王威.基于云计算架构的水文大数据云平台建设[J].人民长江,2018,49(5):31-35.
[6]曾金凤.东江源区智慧水文的设计与实现[J].人民珠江,2018,39(3):11-15.
[7]芮孝芳.水文学与“大数据”[J].水利水电科技进展,2016,36(3):1-4.
[8]芮孝芳.论流域水文模型[J].水利水电科技进展,2017,37(4):1-7,58.
[9]芮孝芳.对流域水文模型的再认识[J].水利水电科技进展,2018,38(2):1-7.
[10]王丽娟.基于大数据分析方法的汉江流域安康段洪水预报研究[D].昆明:云南师范大学,2019.
[11]袁定波,艾萍,熊传圣.水文时空数据挖掘方法及其应用评述[J].水利信息化,2018(1):14-17,22.
[12]林林.水利云平台若干技术问题研究[D].北京:中国水利水电科学研究院,2016.
[13]胡金辉,孙颖娜,王宁,等.基于文献计量学对流域产汇流研究的热点分析[J].人民珠江,2021,42(9):41-46,104.
[14]唐中楠,杨国丽,李军,等.基于文献计量学的中国流域SCS模型研究现状分析[J].人民长江,2021,52(10):95-100,106.
[15]李伟,石超.水文地质的研究进展与研究趋势:基于CiteSpace的可视化分析[J].甘肃地质,2022,31(3):39-45.
[16]郭永丽,章程,吴庆,等.基于文献计量学分析岩溶水文地质学研究热点[J].中国岩溶,2020,39(6):817-828.
[17]秦长江,侯汉清.知识图谱:信息管理与知识管理的新领域[J].大学图书馆学报,2009,27(1):30-37,96.
[18]刘光阳.CiteSpace国内应用的传播轨迹:基于2006—2015年跨库数据的统计与可视化分析[J].图书情报知识,2017(2):60-74.
[19]陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253.
[20]OLDAK A,PACHEPSKY Y,JACKSON T J,et al.Statistical properties of soil moisture images revisited[J].Journal of Hydrology,2002,255:12-24.
[21]BENNETTS R E,KITCHENS W M,DREITZ V J.Influence of an extreme high water event on survival,reproduction,and distribution of snail kites in Florida,USA[J].Wetlands,2002,22:366-373.
[22]吴丹,向筱茜.中国水资源利用与经济发展协调评价可视化分析[J].人民珠江,2022,43(12):82-91.
[23]高露雄,王立海.大数据背景下长江水文数据开放平台设计研究[J].水利信息化,2021(6):88-92.
[24]王立海,肖志远,高露雄.长江水文移动应用服务系统设计与实现[J].水利信息化,2014(5):26-30.
[25]高露雄,肖志远.GIS在堰塞湖应急水文容积曲线计算中的应用[J].人民长江,2015,46(S1):51-53,63.
[26]徐胜,王琳,郑文,等.黄淮流域天气雷达应用系统介绍与应用分析[J].水文,2013,33(3):47-51.
[27]范辉,吴志勇,张健.VIC模型汇流方案的改进[J].水文,2012,32(5):7-11,86.
[28]刘荣华,孙朝兴,田济扬,等.山洪灾害监测预报預警云平台及应用[J].中国防汛抗旱,2022,32(1):63-69,95.
[29]李锐,刘荣华,田济扬,等 山洪灾害预警信息靶向服务系统设计及应用[J].水利水电技术,2021,52(7):33-43.
[30]余国锋,袁亮,任波,等.底板突水灾害大数据预测预警平台[J].煤炭学报,2021,46(11):3502-3514.
[31]PAPACHARALAMPOUS G,TYRALIS H.Time Series Features for Supporting Hydrometeorological Explorations and Predictions in Ungauged Locations Using Large Datasets [J].Water,2022,14(10):2073-4441.
[32]孔繁翔,胡维平,范成新,等.太湖流域水污染控制与生态修复的研究与战略思考[J].湖泊科学,2006(3):193-198.
[33]宋晓猛,张建云,占车生,等.气候变化和人类活动对水文循环影响研究进展[J].水利学报,2013,44(7):779-790.
[34]刘昌明,李道峰,田英,等.基于DEM的分布式水文模型在大尺度流域应用研究[J].地理科学进展,2003(5):437-445,541-542.
[35]王中根,刘昌明,黄友波.SWAT模型的原理、结构及应用研究[J].地理科学进展,2003(1):79-86.
[36]石培礼,李文华.森林植被变化对水文过程和径流的影响效应[J].自然资源学报,2001(5):481-487.
[37]刘晋高,方神光,许劼婧,等.基于河湖长制的河湖岸线智慧监管方案设计:以珠江三角洲河网区为例[J].人民珠江,2019,40(9):121-127.
[38]李冬杰,王爱娜,肖凤林,等.大数据和云技术在省级山洪监测预警中的应用[J].水利信息化,2016(4):10-14.
[39]程海云.推进新时代长江水文高质量发展体系建设构想[J].人民长江,2023,54(1):88-97.
[40]毛兴华.水文信息化思路与总体框架设计探讨[J].水利信息化,2021(5):69-72.
[41]王培,王美玲,曹晓宁.江苏水文自动测报系统智慧化运维研究与设计[J].水利信息化,2019(3):1-3,9.
[42]孙涛,王雷,付文博,等.深度学习在水利行业上的应用综述[J].中国农村水利水电,2018(12):90-93,100.
[43]MARCAIS J,DE DREUZY J-R.Prospective Interest of Deep Learning for Hydrological Inference[J].Groundwater,2017,55(5):688-692.
[44]翟思贝,范海玲,杨波.基于水文大数据分析技术的洪涝灾害预警系统设计[J].水利技术监督,2022(5):53-56,74.
[45]谢宇扬.云平台下的水文监测数据共享模式研究[D].西安:西安科技大学,2019.
[46]李娇,等.基于复杂网络的地下水位变化预测模型研究[J].水利科技进展,2019,39(4):1-8.
(责任编辑:程 茜)