APP下载

顾及地理要素的生态流量预警知识图谱构建及应用

2023-09-02杨华伟沈红霞蔡思宇王超朱健锋

关键词:图谱用水预警

杨华伟, 沈红霞, 蔡思宇, 王超, 朱健锋

(1.辽宁师范大学 地理科学学院,辽宁 大连 116029; 2.水利部信息中心,北京 100053; 3.中国水利水电科学研究院,北京 100038)

随着社会经济的快速发展,水资源的开发利用量不断增加,导致河流生态系统功能受损以及生物多样性丧失[1]。普遍认为,流域生态流量是流域生态系统稳定的关键因素之一[2],对流域水资源管理和规划至关重要[3]。流域生态流量是指为了维系流域生态系统的结构和功能,需要保留在流域内符合水质要求的流量(水量、水位)及其过程[4]。江善虎等[5]研究认为,影响河道生态流量的主要因素是气候变化和人类活动,例如极端气候、降水、水库径流调节、取用水活动等。因此,为了保证流域生态系统的稳定,实现流域可持续发展,考虑以人类活动以及气候变化为基础的流域生态流量预警方法至关重要。目前,对流域生态流量预警方法的研究较多:张代青等[6]以河流流量为河流健康表征因子,建立二元水循环河流流量比率阈值模型进行河流流量预警;郭玉雪等[7]利用径流信息、历史气象数据作为影响因子,通过递归神经网络模型预测流量;李远军[8]通过逻辑算法实现水电站生态流量在线监测和实时预警。已有的各种模型算法为生态流量预警提供了理论基础。

近年来,国家大力推进智慧水利建设,数字孪生流域技术体系迅速发展[9],以数字孪生流域为核心构建具有预报、预警、预演、预案功能的智慧水利体系[10],实现数字孪生流域需要构建水利实体及其属性之间的关联关系,形成强大的水利知识网络。知识图谱是一种结构化的语义知识库,能够将实体和属性通过关系进行联结和组织的知识网络[11],是实现数字孪生流域的关键技术之一。目前,已有少量研究将知识图谱引入水利工程调度等相关领域:段浩等[12]以水利行业关系型数据库、互联网数据与百科知识等为数据源,构建了水利综合知识图谱;陈胜等[13]以水工程联合调度计算方案生成为切入点,研究知识图谱在水利行业的应用技术;冯钧等[14]以水利对象数据为基础,实现了基于推理规则的知识推理方法,并应用于水利信息知识图谱构建与检索系统,构建了水利信息知识图谱。上述研究表明,知识图谱能够用于复杂的水利工程调度问题,提高水利工程调度的智能化水平,但目前还存在不足。目前,水利工程调度知识图谱主要基于传统的语义关系,而部分水利工程相关要素具有空间位置属性(以流域生态流量调度为例,如监测断面、雨量站、水库等具有空间位置信息),且要素之间存在空间拓扑关系(比如雨量站与水库汇水区的关系)。忽略空间位置属性和空间关系,仅基于语义建立知识图谱导致建模过程需要大量人工处理,耗时耗力。

因此,本文考虑地理要素空间关系的知识图谱对生态流量预警建模,并通过九交模型算法实现流域内监测断面与取用水户、水库、雨量站的空间拓扑关系的自动构建,提高了建模效率,同时通过对导致生态流量预警事件的成因进行定量分析和可视化展示,可以直观地了解预警成因,便于决策者采取精准的管控措施,有利于保持流域生态系统的稳定。

1 知识图谱与地理知识图谱

1.1 知识图谱

谷歌于2012年首次提出了知识图谱的概念,其基本组成单位是“实体-关系-实体”三元组[15]。目前,知识图谱已在问答系统、推荐系统以及信息检索系统中被广泛应用[16],服务于医疗、新闻、教育、电力等各个领域[17-20]。

知识图谱构建的核心主要包括知识建模、知识抽取以及知识融合3个阶段[21]。首先,将分散的数据源以及实体关系中的知识组织起来,形成统一的模型;然后,从各种各样的数据资源中将研究内容相关的实体以及实体间的关系抽取出来,存储到知识库中;最后,在同一框架规范下进行异构数据整合、消歧等工作,并加入现有结构化数据,形成知识图谱。

1.2 地理知识图谱

地理知识图谱是在知识图谱的基础上对与地理位置有关的概念、实体及其相互关系进行形式化描述的知识系统,能够提供系统的、深层次的结构化地理知识[22]。与传统知识图谱相比,地理知识图谱不仅是结构化的语义知识库,还集成了海量的地理空间数据和信息[23],具有空间特征、时间特征以及属性特征。

地理知识图谱的基本组成单位为“实体-关系-属性”三元组,相比一般知识图谱,地理实体是地理知识表达的核心[24],利用相邻、连通、包含等拓扑关系描述地理实体间的空间关系。

水利工程调度中存在与空间位置有关的地理要素,引入地理知识图谱,可以增强图谱与对象实体的联系。例如,在流域生态流量预警过程中考虑要素的空间位置及相互拓扑关系,并利用空间关系自动建立要素实体间的关联,从而构建监测断面与雨量站、取用水户、水库等实体之间的知识图谱。因此,顾及地理要素的生态流量预警知识图谱增强了图谱的物理意义,同时为自动化生成图谱提供了基础。

2 顾及地理要素的生态流量预警知识图谱构建

2.1 知识背景

为了对流域生态流量进行预警,在河道上选择监测断面对流量进行定期监测[25],将监测值与断面生态流量设计阈值进行比较,判断是否发生预警及发生的预警级别。通过分析预警产生的原因制定响应预案,对水库下泄流量或生产生活取用水实施管控。

因此,若以一个预警周期为研究对象,则有如表1中的要素对象。

表1 预警周期各阶段包含的要素对象

2.2 知识图谱构建

2.2.1 知识建模

根据知识背景建立流域生态流量预警知识图谱本体[26],采用自上而下的方法构建知识图谱,知识图谱包括以下内容:

1)以预警为核心面向预警生命周期建模,当产生预警事件时,记录预警级别和时间;

2)预警发生时及预警周期结束后分别记录降水、水库状态以及取用水信息;

3)预警来自监测断面,降水、水库状态以及取用水信息分别来自雨量站、水库及取用水户;

4)预警期间同样可能产生针对水库和取用水户的管控措施。

因此,在流域生态流量预警知识图谱本体中可抽象出预警、断面、雨量站、水库、取用水户等实体及其相互之间的关系,如图1所示。

图1 生态流量知识图谱概念模型

2.2.2 知识抽取和存储

目前流域生态流量预警相关信息主要通过关系数据库存储,例如流量水位数据、断面取用水数据、测站下泄量数据、取用水户位置信息等,将这些结构化数据进行实体识别和属性抽取。在实体识别之后进行关系抽取,将实体之间的关系信息抽取出来,最终得到三元组形式的知识。最后将实体与关系存储在Neo4j图数据库中。

2.2.3 知识融合

文中的知识融合主要为实体、数据属性等层面的融合,将预警前、后各水库、雨量站、取用水户之间的关系以及数据属性进行关联,获取不同状态时断面的信息,确定流域生态流量状态,初步形成知识图谱,实现流域生态流量的动态监测。

2.3 顾及地理要素的知识图谱构建

2.3.1 在本体中融合地理要素

提取流域生态流量预警知识图谱中的节点,记为N(a),其中a表示节点的属性集。对于监测断面、雨量站、取用水户、水库等具有地理属性的节点,将地理要素加入节点属性集,即N(a,[geo]),其中,geo表示节点代表的实体的地理对象,如具有经纬度坐标的点。

节点间的关系记为R(n),其中n表示关系的属性集。若为地理要素之间的关系,则在属性集中加入空间拓扑关系。地理要素之间的空间关系通过九交模型法表示[27],即:

(1)

式中:topo表示空间拓扑关系;x表示知识图谱中带有地理要素节点的位置属性,通常为点要素,如雨量站、取用水户、水库等;y表示监测断面的汇水区,通常为面要素;I、B、E分别表示地理要素的内部、边界和外部。为了方便存储和表达,通常将式(1)表示为一个仅包含T和F且长度为9的字符串[28],T指true,F指false。

将地理要素之间的空间关系与知识图谱中实体间的关系融合,记为R(n,[topo])。据此,顾及地理要素的流域生态流量预警知识图谱可表示为:

G=(N(a,[geo]),R(n,[topo]))。

(2)

式中:G表示知识图谱;N代表图中节点;R代表关系,即图谱中的边。

顾及地理要素的流域生态流量预警知识,如图2所示。

图2 顾及地理要素的生态流量知识图谱概念模型

2.3.2 知识图谱的自动构建

在融合地理要素的基础上,可实现流域生态流量预警知识图谱的自动构建。

步骤1通过知识抽取在原有节点属性的基础上添加地理要素属性,其中:雨量站、水库、取用水户为点要素;断面为其汇水区面要素。

步骤2通过式(1)计算流域内汇水区与雨量站、取用水户、水库的空间拓扑关系。

步骤3在知识融合阶段只保留那些在汇水区内部的关系,从而完成雨量站、取用水户、水库等实体与断面实体的关系的自动构建。

2.4 基于知识推理的生态流量预警分析方法

2.4.1 预警成因分析

在流域生态流量预警知识图谱中主要通过历史比较法分析预警成因,将当前预警发生时取用水户的取用水量、水库出库流量、雨量站降水量分别与历史同期观测值比较,计算变化量Vwhen和动态度DIwhen,即:

Vwhen=Cwhen-H,

(3)

(4)

式中:Cwhen为预警发生时的当前状态数据;H为历史状态数据。

由于每次预警事件发生时均记录降水、水库状态以及取用水信息,因此在知识图谱中有:

Rwhen(alert,feature)=Rwhen(alert,state)+Rfrom(state,feature)。

(5)

式中:Rwhen、Rfrom分别表示知识图谱中的关系;alert为预警;feature为预警关联要素,如雨量站、水库、取用水户等;state为上述关联要素在预警发生时的状态,即预警与要素的关系转化为图谱中预警节点与要素节点之间的路径。

将式(3)和式(4)中的Vwhen和DIwhen写入对应关系Rwhen(alert,state)的属性中,进而可通过式(5)推理出要素对本次预警的影响程度,得出预警事件发生的潜在关联因素。

2.4.2 管控成效分析

同理可得,比较预警周期结束后与预警发生时的取用水量与水库出库流量等信息,可得到预警期间所实施的管控措施的成效,即有:

Vafter=Cafter-Cwhen,

(6)

(7)

式中Cwhen、Cafter分别为预警时和预警周期结束时的状态数据。

3 研究实例

3.1 汉江流域概况

汉江是长江中游左岸最大的支流,干流流经陕西、湖北两省,于湖北省武汉市汇入长江。汉江全长1 577 km,其中陕西省境内干流长657 km,湖北省境内的干流长920 km,总落差1 964 m,其支流延展至四川、甘肃、重庆、河南4省(直辖市),流域总面积约15.9 万km2。

汉江流域共设置了3个生态流量监测预警断面,即安康断面、黄家港(二)断面,以及皇庄断面,3个断面及关联水库、取用水户的关系如图3所示。安康断面位于陕西省安康市,其监测范围在陕西省境内;黄家港(二)断面位于湖北省丹江口市,监测范围涉及陕西省、河南省以及湖北省;皇庄断面位于湖北省荆门市,监测范围在湖北省境内。

图3 汉江流域生态流量预警监测断面设置示意

3.2 预警方案设计

汉江流域生态流量预警等级为蓝色预警、橙色预警和红色预警3个等级。预警阈值分别按照生态基流的120%、100%和80%设置,对应预警等级分别为蓝色预警、橙色预警和红色预警。预警时长与断面流量报送时长一致。不同预警等级的流量控制指标见表2。

表2 汉江流域主要控制断面不同预警等级的生态流量

3.3 汉江流域生态流量预警知识图谱构建

3.3.1 数据结构设计

按照上述生态流量知识图谱的建模方法设计公式(2)中节点及关系的数据结构,其中部分节点及关系结构见表3—6。

表3 预警节点属性结构

表5 取用水户节点属性结构

表6 预警时取用水状态关系属性结构

3.3.2 系统结构设计

在现有汉江流域日监测数据库的基础上,编写Java接口程序,识别汇水区范围及关联的取用水户、水库及雨量站信息,自动构建汉江流域生态流量预警知识图谱。知识图谱通过Neo4j等图数据库存储,支持预警事件的展示和基于历史数据的预警成因分析推理。Neovis.js将图数据库中的数据通过页面进行可视化展示,方便集成到前端应用中。生态流量预警知识图谱系统结构设计如图4所示。

图4 生态流量预警知识图谱系统结构

3.3.3 可视化展示

以安康监测断面为例,根据监测断面位置计算汇水区范围,并根据空间关系取得与该监测断面关联的取用水户56 户、水库3座及雨量站579 个。以2021年1月19日安康监测断面发生的蓝色预警事件为例,得到预警与降水、取用水和水库状态图谱如图5所示。

图5 预警时降水、取用水、水库部分状态节点示例

3.4 汉江流域生态流量预警分析实例

3.4.1 预警成因分析及可视化

通过公式(5)推理得到2021年1月19日安康监测断面蓝色预警的成因分析结果,如图6所示。图中不同形状符号节点分别表示预警发生时断面关联的取用水、水库和降水状态,预警节点与状态节点之间的关系属性按照公式(3)和公式(4)分别存储状态的变化量和动态度,连接线的粗细反映了动态度大小。

图6 安康监测断面预警事件知识图谱

从图6中可以看出,在本次预警发生时,取用水总量相较往年的明显增加,且主要为安康市片区的增加。因此,该图谱可以为预警成因分析及管控预案制定提供依据。

图7给出了2020年以来安康监测断面的生态流量预警知识图谱。

从图7中可以看出,安康断面发生的预警主要是蓝色预警和红色预警,且基本发生在当年12月至次年2月期间,预警成因以取用水变化及水库蓄水变化为主。

3.4.2 管控成效分析及可视化

以取用水管控措施效果评价为例:在图谱中,针对预警期间的取用水管控措施目标取用水户,比较预警发生时和预警周期结束时的取用水变化量及变化动态度,对管控效果与生态流量恢复效果进行反馈评价。如图8所示,以汉中市国中自来水有限公司取用水户为例,预警时取用水监测值为58 333 m3,历史同期DIwhen为60%;管控后日取用水量为36 294 m3,预警时DIafter为-38%,证明对该取用水户的管控措施效果较为理想。

图8 取用水户管控成效知识图谱

4 结论

文中围绕流域生态流量预警,提出了一种顾及地理要素的知识图谱模型构建方法,并在此基础上实现了生态流量预警知识图谱的自动构建。同时,将上述知识图谱在汉江流域生态流量监测中进行了初步应用,实现对汉江流域生态流量的动态监测,并对预警成因和管控成效进行有效分析。应用实例证明,充分利用水利要素中的空间特征、时间特征与属性特征,将传统知识图谱扩展至地理知识图谱能够有效完善水利要素间的关联,提高图谱构建效率。此外,通过知识图谱推理进行预警成因分析相较传统关系数据库查询效率更高。当前,已有论文对地理知识图谱进行论述,但是在数字孪生流域建设中,地理知识图谱与实际应用结合起来的成果较少,本文研究可为相关研究提供参考。在未来的研究中,将进一步挖掘基于自然语言等多源数据的地理知识图谱建模方法,为水利知识图谱的智能应用提供基础。

猜你喜欢

图谱用水预警
哪些火灾不能用水扑灭?
节约洗碗用水
绘一张成长图谱
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
机载预警雷达对IFF 的干扰分析
一次性用水
预警个啥