APP下载

我国水利信息化研究热点分析与趋势展望
——基于 CiteSpace 和 VOSviewer 的知识图谱分析

2022-06-29王文佳

水利信息化 2022年3期
关键词:水务水利智慧

王文佳

(1.清华大学水利水电工程系,北京 100084;2.北京奥特美克科技股份有限公司,北京 100193)

0 引言

随着物联网技术的普及,大数据、云计算和人工智能技术的逐步成熟,我国水利信息化发展进入智慧水务的新阶段[1]。水利信息化作为一个偏重应用和实践的领域,以往研究大多集中在建设现状及发展对策方面[2-3],对学术成果研究的回顾和总结较少。

近年来,在科学计量学、数据可视化、知识图谱等领域的共同发展下,各界学者开发了以 CiteSpace和 VOSviewer 为代表的一系列用于知识图谱和文献计量分析的软件。相关软件能够对科技文献标题、作者、机构、国家/地区、摘要、关键词、参考文献、发表期刊及其他索引信息等知识单元,进行科学计量、图谱构建和可视化展示,对关注领域进行共词、合作网络、引文等的分析,以及研究热点捕捉和前沿展望,已在众多研究领域得到广泛的应用。前期研究主要集中在管理学和人文社科领域[4],近年在自然科学和工程技术领域开始迅速应用,在水资源管理[5]、水生态环境[6]领域相继开展了研究热点分析及图谱绘制。黄沣爵[7]对 2010—2019 年国内外智慧城市的研究热点和趋势进行了图谱量化分析,结果表明智慧城市研究进程正逐渐由概念向技术实践及应用场景转换,研究热点集中在BIM、新型城镇化建设、机器人(大数据)及评价指标等 9 个方向。对水利信息化的研究历程及不同研究阶段的研究热点进行梳理和分析,能够为下一阶段智慧水务研究重点和方向提供参考。

1 研究数据来源与方法

1.1 数据来源

研究数据主要来源于 CNKI(中国知网)数据库文献。在高级检索板块下,以主题词水利信息化、智慧水务、智慧水利或水联网为检索条件,不限制时间范围并将来源类别设为“全部期刊”,检索日期为 2021 年 1 月 26 日,符合检索条件的文献共计 4 606 篇,其中学术期刊文献 3 968 篇,会议文献 213 篇。由于智慧水务领域近年来发展迅速,相关会议和项目成果较多。检索结果中无效文献主要包括会议、培训举办通知和报道,项目成果评审和验收新闻,期刊宣传和征稿启事,行业公司宣传稿,人物访谈纪要,以及作者为本刊记者或编辑部的评论文章。经人工剔除后选取 2 894 篇文献作为CiteSpace 分析的数据源。

1.2 研究方法

研究采用 CiteSpace 和 VOSviewer 软件对 CNKI数据库可用知识单位进行文献计量分析和可视化展示。CiteSpace 是在科学计量学及信息可视化背景下开发的引文可视化分析软件,也是近年来在科学计量研究中应用较为广泛的工具[8],本研究中用于机构合作网络、关键词聚类和突现分析。VOSviewer是基于知识单元间相似度进行可视化展示的软件[9],本研究中用于关键词共现分析及可视化。

1.3 数据分析

共现分析是对文献中的特征项(如关键词、作者、机构等)共同出现现象的定量研究,对关键词的共现分析又叫共词分析。特征项之间的共现频次越高,其关联程度越强,VOSviewer 中采用特征项共现绝对频次代表关联强度,CiteSpace 中默认采用余弦指数Sc进行特征项间相似性的度量,计算公式如下:

式中:ci j为特征项i和j共现的总次数;si和sj分别为特征项i和j各自出现的频次。

中心度是网络分析中常用的一个测度指标,用于指示某个节点在其所处网络中的位置和重要性。节点中心度越高,说明其越重要,根据中心度定义和测度方式不同,又分为点度中心度、接近中心度和中介中心度等。本研究采用点度中心度进行节点中心性度量,以节点与网络中其他节点连线数量多寡进行计量,数量越多,点度中心度越大。

关键词聚类分析采用从图谱论中演化出来的谱聚类算法,即将所有关键词看作图空间中的节点,2 个关键词在同一篇文献中共现则将其所在点用边连接起来,距离较远的 2 个点之间边权重值较低,距离较近的 2 个点之间边权重值较高。对所有数据点构成的网络图进行切割,使得切割后的子图内部边权重和尽可能高,不同子图间边权重和尽可能低,从而达到聚类目的,CiteSpace 中采用 Ncut 算法进行网络切割。聚类结果中的平均年龄以聚类成员所在文献平均年龄计算得出。

2 研究文献计量分析

2.1 年发文量分析

年发文量是分析研究领域发展历程和预测未来发展趋势的一个重要成果指标,能够直观反映该领域研究力量投入的动态变化,累计发文量变化趋势的研究,能够帮助识别研究学科的发展阶段和未来发展趋势。

水利信息化领域研究成果最早见于 1996 年[10],1996—2000 年为萌芽起步阶段,年发文量不足 10 篇,2001—2010 年间发文量稳步攀升,2011 年至今,发文量迅速增多,2020 年年发文量超过 350 篇。1996—2020 年水利信息化领域研究成果发表年度趋势如图 1 所示,说明水利信息化研究逐渐受到国内众多学者的关注和重视。根据著名文献计量学家德里克·普赖斯(Derek de solla Price)提出的科学文献指数增长规律,以累计科学发文量为纵轴,以历史年代为横轴,科学文献增长与时间呈指数函数关系。用F(t)表示时刻t的文献量,则F(t)可表达为

图 1 近 25 a 水利信息化领域研究成果发表年度趋势(1996—2020 年)

式中:a为条件常数,即统计的初始时刻的文献量;b为时间常数,即持续增长率。

去除发文数量较少且不稳定的最初年份,对2001—2020 年近 20 a 发文累积量和年份进行拟合,可得拟合曲线y=104.4e0.17t(R2= 0.96)。按照库恩在《科学革命的结构》中提出的科学发展模式,说明水利信息化领域研究仍处于原始科学阶段,预期未来该领域研究论文将快速增长。

2.2 发文期刊分析

水利信息化相关文章集中发表在《中国水利》(217 篇)和《水利信息化》(202 篇)2 个期刊上,占总发文量的 14%,其后依次为《河南水利与南水北调》《山东水利》《黑龙江水利科技》《海河水利》《治淮》《人民长江》《江苏水利》和《水利发展研究》等期刊,具体发文量分布如图 2 所示。从发文期刊看,水利信息化相关论文主要发表在水利部主管的各类综合性科技期刊上,以及流域管理机构和地方水利厅主办的综合性刊物上,说明该领域的理论研究较为薄弱,研究方向更偏向于定性分析和技术应用探讨。其他“智慧 +”产业,如智慧旅游[11]、智慧图书馆[12]、智慧政务[13]等产业领域研究也呈现出类似特征,当前研究理论和实践方面均处于理念探讨和定性研究阶段,研究初具规模但权威性研究成果较少。

图 2 水利信息化相关文献期刊发文量分布

2.3 研究机构合作网络分析

研究机构合作网络分析是在发文作者合作网络分析基础上对作者所在机构间合作网络的分析,若作者在发表的论文中共同署名,则认为作者发表论文时所在机构之间存在合作关系。机构合作网络图以机构出现频率为节点半径,研究机构所在节点越大,说明该机构出现频率越高,其研究成果越为丰硕,水利信息化研究机构合作网络图如图 3 所示。

图 3 水利信息化研究机构合作网络图

从研究成果数量看:河海大学、水利部信息中心和中国水利水电科学研究院(以下简称中国水科院),以 92,80 和 57 篇论文位居前列;西安理工大学、武汉大学、华中科技大学、华北水利水电大学等高校发文均超过 15 篇;长江水利委员会、黄河水利委员会、海河水利委员会、太湖流域管理局等水利部流域派出机构,以及新疆维吾尔自治区、江苏省、山东省水利厅等地方水行政主管部门的研究成果较为丰硕。此外,市县级地方水务局、水利(水务)专业规划设计院、开展供排水投资运营的水务集团,以及从事水利信息化业务的科技公司等机构,在前沿技术引入及场景应用方面的研究成果也竞相涌现,但从学术成果角度看尚未有明显优势企业出现。

从机构合作网络看出:机构间合作网络以水利部信息中心为核心,分别与长江水利委员会、海河水利委员会、淮河水利委员会、太湖流域管理局等水利部派出流域机构,中国水科院、河海大学、首都经济贸易大学和四川省水利科学研究所等高校和科研院所,以及北京金水信息技术发展有限公司、北京东华合创科技有限公司等企业建立了合作网络;中国水科院为仅次于水利部信息中心的研究合作网络中心,与水电水利规划总院、水利部防洪抗旱减灾工程技术研究中心、大唐环境产业集团等机构也建立了良好的合作网络。目前已初步形成政府机构、科研院所、高校及产业界共同推进和合作研究的格局。

3 研究历程与热点分析

3.1 关键词词频分析

关键词词频用于分析水利信息化领域研究热点和发展趋势,表 1 中列出词频大于 20 次的核心关键词。从时间分布看:首次出现高频关键词“水利信息化”和“信息化建设”是在 1999 年,2000 年高频关键词为“水利现代化”“水利信息化建设”和“水利行业”,2001 年高频关键词为“防汛抗旱”“数字水利”“数据库”和“防汛抗旱指挥系统”,2002—2003 年高频关键词主要为“水利工程”“水利信息化技术”,2004—2005 年高频关键词为“水资源”“灌区”“工程建设”和“地理信息系统”,2006 年高频关键词为“应用”“现状”和“信息系统”,2007—2008 年高频关键词为“水资源管理”和“水利管理”,2009—2010 年高频关键词为“档案管理”“资源整合”“问题”“研究”及“信息安全”;2011 年高频关键词为“智慧水利”“顶层设计”和“措施”,2012 年高频关键词为“物联网”“云计算”“信息化技术”和“信息化管理”;2013 年高频关键词为“智慧水务”“大数据”“信息技术”和“水利水电工程”,2014 年高频关键词为“信息化系统”和“智慧城市”,2017 年高频关键词为“河长制”和“施工管理”,其余年份关键词出现频率较低。

表 1 关键词总词频统计表

3.2 关键词共现分析

关键词共现分析基本原理是统计 2 个关键词或主题词在同一篇文献中同时出现的次数,通过分层聚类,揭示主题间的亲疏关系。本研究采用VOSviewer 对数据库中的 4 528 个关键词进行了共现分析,并在此基础上选取了点度中心度最高的前1 000 个关键词进行展示,叠加时间视图后形成如图 4 所示的关键词共现图谱。图中节点的大小和颜色分别代表节点关键词与其他关键词的连接数及其发表的平均年份,节点越大,说明节点关键词与其他关键词的连接数越多,该节点的点度中心度越高,地位越重要;连线的粗细和颜色变化代表 2 个关联节点间的年份和关联程度,连线越粗代表节点间的关联越强。

为简化知识共现图谱,突出核心关键词间的共现关系,本研究选取出现频率超过 10 次的 138 个关键词进行图谱绘制,共有 1 346 条共现关系连线,总连线强度为 3 815 次。从网络位置看,“水利信息化”为最核心的关键词,其与“水利现代化”“智慧水利”“水利工程”“云计算”“大数据”和“物联网”等高频关键词共现强度均较高。“智慧水务”和“水利工程”是新的核心关键词,其平均年龄为2016 年,指示着未来研究和发展新方向。从关联强度角度分析,“信息化”和“水利”高度相关,水利行业信息化发展是本领域主要研究内容;新的核心关键词“水利工程”与“信息化技术”“施工管理”“档案管理”关联强度较高,“智慧水务”和“物联网”“云计算”“大数据”“智慧城市”关联最强,反映当下智慧水务和水利工程领域采用的主要 ICT 技术及应用领域。

图 4 基于 VOSviewer 的关键词共现网络图

“水利信息化”与 2010 年间的“水利信息化建设”“水利现代化”“水利行业”“防汛抗旱”,2010—2015 年间的“信息化建设”“信息化”,以及 2015 年至今的“水利工程”“智慧水利”“云计算”和“物联网”共现最多,但与“智慧水务”在网络间的距离较远,无共现关系。此外,“水利信息化”及“水利工程”和“信息化”领域研究成果较多,研究密度较高,说明该领域的研究较为成熟,但针对“智慧水利”和“智慧水务”,以及一些新技术“云计算”“物联网”“大数据”在水利行业的应用研究密度较低,仍有待进一步深入研究。

3.3 关键词聚类分析

本研究采用 CiteSpace 对关键词进行聚类分析和结果可视化展示,主要采用模块度Q值和轮廓系数S值法评估聚类划分结果:Q值用来衡量 1 个网络划分为多个类簇独立的程度,取值范围为 0~1,Q值越高说明划分后的模块独立程度越高,Q>0.3说明聚类结构显著;S值是评估类簇性质不确定性的指标,取值范围为 [-1,1],S值越高说明该类簇内聚性越好,与其他类簇区分性越佳,通常S>0.5聚类合理,S>0.7 聚类结果可信服。本研究中,Q值为 0.427 3,S值均值为 0.752 3,说明聚类结果合理,各类簇内部同质性较高,与其他类簇具有较好的区分性。采用谱聚类算法对关键词进行聚类分析,并采用 LSI(Latent Semantic Indexing),LLR(Log-Likelihood Ratio)和 MI(Mutual Information)3 种不同关键词提取算法提取聚类标签,最大的 8 个关键词类簇详情如表 2 所示。LSI算法提取与主关键词语义相关的关键词,强调研究的方向和主体内容;LLR 通过相似度计算提取得分排序靠前的关键词;MI 算法注重强调研究特色。结合 3 种聚类标签提取算法能够对聚类结果进行综合分析和全面解读。

表 2 最大的 8 个关键词类簇详情

水利信息化关键词经聚类形成 8 个类簇,其中智慧水务类簇规模最大,包含 93 个关键词。除灌区管理由于关键词少、S值较高以外,其余各类簇S值为 0.623~0.857 不等。按照关键词出现的平均年份,各类簇按年份顺序依次为:

1)水利信息化建设知识群组(2007 年)。水利信息化建设的重要成果是水文基础设施和国家水文数据库,应以优质的水文水资源信息支撑水资源的可持续利用,支撑经济社会的可持续发展。

2)灌区管理知识群组(2007 年)。基于数学模型建立灌区管理的决策支持系统。

3)水利信息化知识群组(2012 年)。水利信息化发展趋势是整合共享,以各省(自治区/直辖市)水利厅顶层设计为指导和抓手,进行资源整合和服务平台搭建。

4)移动互联知识群组(2013 年)。在“互联网 +”的发展浪潮下,对水利通信专网进行整合、扩容,实现水利事业单位间的互联互通,同时对水利信息化工程建设质量和运行管理进行研究。

5)水利工程知识群组(2013 年)。实现对水利工程尤其是小型水库的智能质量检测和水利工程档案管理,发挥后发优势。

6)智慧&高质量发展知识群组(2014 年)。新时期我国经济由高速增长阶段转向高质量发展阶段,智慧水利也将驱动水利事业高质量发展,重要方向是提高防汛抗旱能力,保障饮水和水生态安全。

7)智慧水利知识群组(2014 年)。智慧水利是云时代信息化技术在水利行业和信息系统中的应用,应进行河湖全要素感知、智慧泵闸站的标准化建设,实现信息自动化和水资源的合理开发利用。

8)智慧水务知识群组(2016 年)。是物联网产业在水务行业的逐步落地和应用,集中在供水管网的监测、远程监控和漏损控制方面,注重服务端的设计和项目移交。

3.4 关键词突现分析

在 CiteSpace 中,采用 Kleinberg 基于内容分析和时间序列建模相结合提出的突现检测算法,检测某个主题词、关键词在短时间内跃迁的现象,以发现其兴起或衰落的情况。被突现检测识别出的主题词、关键词代表其在过去或者当下特定时段内是研究热点。2000—2021 年间智慧水务研究领域突现强度大于 5.0 的 36 个关键词,其突变起止年份和强度如图 5 所示,其中智慧水务/智慧水利突变程度最强,突变强度指数分别为 104.30 和 70.48,其后依次为水利工程(29.58)、物联网(22.14)、水利信息化建设(19.63)、云计算(18.04)和水利现代化(15.71)等。

图 5 关键词突变起止年份和强度

水利信息化建设、防汛抗旱指挥系统、水利行业发展是水利信息化长期的研究热点,其突变持续了将近 10 a(2000—2009 年)。2010 年后,随着信息技术的逐渐成熟,水利信息化的研究方向逐渐转向大数据、物联网和云计算等信息技术在水利行业的应用方面;2017—2019 年间河(湖)长制的提出也短暂成为水利信息化的研究热点;2018 年后研究热点集中在智慧水务/智慧水利方面,并且预计在未来一段时间仍将是研究热点。可以预见,智慧水务/智慧水利作为信息技术与水务行业的交叉应用学科,未来仍将随着新技术的不断涌现而焕发新的生命力。

4 研究历程与热点分析

我国关于水利信息化的研究由早期的水利信息化发展至现阶段的智慧水利/智慧水务,根据关键词时间线,结合年发文量的变化趋势,可将水利信息化研究历程大致划分为 3 个阶段。

4.1 水利信息化研究起步阶段(1996—2000 年)

20 世纪 90 年代以来,随着空间、信息、网络通信等技术的发展,全世界范围内掀起了信息化的浪潮。1996 年 1 月,国务院成立了信息化工作领导小组,中央和地方都确立了信息化在国民经济和社会发展中的重要地位,各行各业纷纷启动本领域的信息化建设。水利作为一个信息密集型行业,早期以防汛信息化为核心,建立了雨水情报汛站、防汛通信线路及水情信息接收处理系统。“九五”时期启动了金水工程,初步形成了信息化水文基础数据,并逐步实现了全国流域机构的水情信息互联。1996—2000 年期间,水利信息化领域年发文量较低(低于10 篇),主要关键词“水利信息化”“信息化建设”“水利信息化建设”均在此阶段提出,研究内容从水利信息系统现状回顾向发展的必要性和可行性探讨逐步收敛,形成水利信息化的发展思路和建设任务[14],并针对国家防汛抗旱指挥和水利部机关办公自动化 2 个系统建设开展探索研究。

4.2 水利信息系统建设与应用阶段(2001—2010 年)

1998 年长江全流域特大洪水发生后,水利部党组提出由工程水利向资源水利转变,由传统水利向现代水利、可持续发展水利转变,以水资源的可持续利用支撑社会经济可持续发展的治水新思路[15]。2001 年,水利部党组确立了“以水利信息化带动水利现代化”的发展思路。在数字地球背景下,水利行业先后提出“数字流域”“数字水利”“数字灌区”“数字水库”等概念及相关建设规划。在此背景下,全国各地尤其是东南沿海发达地区开始全力推动数字水利信息系统的研究与建设。水利电子政务领域开展了综合办公、档案管理、财务管理等系统的开发建设,业务管理领域主要对三防指挥、水资源管理、水土保持监测、水利工程管理、水质监测评价及灌区管理决策支持等业务应用系统开展了研究。此外还对 3S、三维可视化、高性能计算等技术,在水利信息化应用、信息系统的建设及运行管理、水利信息化评价指标体系及网络安全问题分析等方面进行了研究和探讨,实现了各类水利信息的数字化与集成化,有力推动了传统水利向现代水利的转变。2001—2010 年期间,年发文量稳步提高,2010 年年发文量首次突破 100 篇。“水利现代化”“数字水利”“水利工程”“应用”“对策”等高频关键词在 2001—2002 年间集中出现,奠定了“十五”“十一五”水利信息化大规模发展的基调,解决了水利业务应用从无到有的问题。但由于信息化建设初期相关法规和规划的缺乏,大量特定的专用的业务应用系统之间重复建设,资源割据,共享困难,建立水利数据中心进行资源整合和共享,以及网络和信息安全又成为水利信息化进一步发展面临的重要难题[16-18]。

4.3 水利信息化新阶段——智慧水利/智慧水务(2011 年—至今)

2008 年 11 月,IBM 提出智慧地球发展理念,“智慧”取代“数字”孕育出“智慧城市”“智慧水利”“智慧水务”等概念。2010 年,江苏省水利厅推进江苏省智慧水利信息化建设[19]。2011 年起,在智慧地球概念下,智能信息技术逐渐深入应用到水利行业,衍生出智慧水利作为融合各水利业务系统互联互通的平台,各地水利信息化建设开始由单个信息系统开发转向注重信息系统之间的互联互通和信息平台的顶层设计。2012—2013 年,在物联网、云计算、大数据等信息化技术及 IBM 智慧城市概念加持下,智慧水务概念应运而生;在全国水利信息化“十三五”规划关键问题的研究和思考中,认为水利信息化已经从推进基础设施建设和基本业务应用进入到“全面渗透、深度融合、加速创新、转型发展”的新阶段[20]。2011—2013 年主题词“智慧水利”“物联网”“信息化技术”“顶层设计”“云计算”“智慧水务”和“大数据”相继出现,新一轮针对新一代 ICT 技术在水利信息化中的应用,以及智慧水利/智慧水务构想、顶层设计、建设框架成为研究热点。2017 年,随着中共中央《关于全面推行河长制的意见》的印发,各地纷纷探索建设基于河长制的河湖管护系统和综合信息管理平台。

5 研究趋势展望

从水利信息化研究主体和发展历程分析结果看出:水利信息化研究具有以国家和水利部政策为总体指导,以新一代 ICT 技术发展为创新引擎,以水行业管理和服务需求为出发点和落脚点等主要特征,其研究进程由政策引导、技术创新、业务需求“三轮”共同驱动。展望水利信息化和智慧水利/智慧水务研究趋势,可能有以下几个方向:

1)在水利高质量发展新阶段下,随着 5G 网络、物联网和云服务等数字基础设施大规模建设和投入使用,以及在智慧水利先行先试成果可推广复制到全国范围的大背景下,智慧水务宏观层面的研究将从前期智慧水务体制机制建设、顶层设计和标准规范建立,逐渐转向信息平台运维保障、平台间信息共享及应用协同、信息平台网络及安全管理,以及智慧水务建设成果量化评价等方面。

2)未来智慧水务建设和运营主体势必将进一步丰富,地方政府、水管机构、水务集团和各类用户群体将共同投资,共同受益,多主体间的权责探讨将是重要研究内容之一。

3)水务行业逐渐实现全面数字化管控,势必会产生海量数据。传输、处理和分析水务大数据的5G,边缘计算,人工智能,以及保障信息安全的区块链[21]和深化信息应用的数字孪生[22]等技术已经受到业内学者的关注和研究。随着 ICT 技术领域的不断革新,其在水务行业中的应用场景研究成果将持续增加。

4)科学技术创新成果最终都服务于生产实际和业务需求,水务业务系统的演进从防汛抗旱、水资源管理到河(湖)长制,从水利工程项目的档案管理到运行安全检测和建设施工管理,从供排水基础信息管理到供排水厂无人值守、管网漏损控制和智能调度,经历了信息平台的从无到有,从单一到综合,从信息化到数字化和智能化的进程,未来能够满足各类涉水相关业务的精细化和科学化管理需求的综合解决方案和关键支撑技术,也将是智慧水务的重点研究方向。

猜你喜欢

水务水利智慧
智慧水务在大港油田水务供水管网漏损控制方面的运用分析
《山东水利》协办单位
为夺取双胜利提供坚实水利保障(Ⅱ)
为夺取双胜利提供坚实水利保障(Ⅰ)
水利项目EPC总承包管理模式下的若干问题探讨
基于新农村水务PPP模式下在我国农村饮水工程建管中的探讨
新时期水务档案管理工作的创新途径分析
富阳:启动智能水务
有智慧的羊
智慧派