APP下载

险情处置知识图谱的构建及应用研究

2024-04-01李露平刘玉敏

水利建设与管理 2024年2期
关键词:三元组险情防汛

陈 磊 李露平 刘玉敏

(1.讯飞智元信息科技有限公司,安徽 合肥 230088;2.讯飞华中(武汉)有限公司,湖北 武汉 430000;3.安徽省引江济淮集团有限公司,安徽 合肥 230601)

中国是一个幅员辽阔的国家,地理环境复杂多样,同时也是世界上经历洪涝灾害频繁和严重的国家。在过去的几十年里,中国汛情的影响范围和程度都在不断扩大。据统计,每年的夏季和秋季期间,中国的洪涝灾害造成的直接经济损失和间接损失都非常巨大,给人民的生命和财产带来了极大的威胁和危害。河南郑州“7·20”特大暴雨造成遇难失踪380人,直接经济损失409亿元[1]。据2023年1月12日应急管理部发布的2022年全国十大自然灾害事件,暴雨洪涝灾害占一半,主要发生在6—8月,涉及珠江流域及福建、江西、湖南、四川、辽宁、青海等地区。其中珠江流域形成较大洪水,导致广东、广西两省(自治区)因灾失踪死亡37人,直接经济损失278.2亿。

面对不确定性和突发性的洪涝灾害,亟须提高抢险队伍防汛应急抢险技能和处置能力,便于高效开展防汛应急抢险工作。目前,防汛应急抢险主要存在应急预案体系不够完善[2]、抢险队伍人员及专业能力不足、抢险物资存储不足、抢险设备落后、信息化能力弱等问题,积极探索提升防汛应急抢险能力的举措势在必行[3]。

近年来,人工智能[4]、大数据[5]、知识图谱等新型技术在监测预警、类案推送[6]等方面的高效率和高准确度发展,给防汛应急抢险举措提供了一种新的思路。朝阳市通过“互联网+”、大数据技术构建了智能防汛指挥系统,实现了积水、除涝泵闸、实时水位、实时雨量等综合汛情数据的实时监测,为汛情研判提供了支持[7]。瞿智豪等[8]基于知识图谱技术利用深度学习模型和传感器信息判断故障的发生,提出一种多模态信息融合的设备故障处理方案推荐方法,实现了工业设备故障处置的智能推荐。本文详细介绍了利用知识图谱技术构建防汛应急抢险方案智能推送系统的思路和技术方案。

1 技术路线

建立汛期险情与险情处置方案之间的关联,当汛期出现险情预警时,主动向防汛管理人员推送预警信息及历史同类险情的处置方案,为防汛管理人员处置险情提供强有力的数据支撑,以缩短险情处置时间,大大降低灾害人员伤亡和经济损失。同时可将新的险情处置方案进行结构化处理,存储于历史抢险方案库,指导后续险情的快速处置。技术路线见图1。

图1 技术路线

2 技术方案

2.1 总体架构

构建险情处置知识图谱,梳理险情、材料、部门之间关系,明确事项申请材料,挖掘关联事项、关联材料,简化办件和智能审批。险情知识图谱的构建及应用架构见图2。在平台支撑层面,利用通用知识图谱平台构建、存储、管理知识图谱;大数据和云计算平台为知识获取和智能应用提供算力支撑。在数据层面,主要利用水雨情、工情等结构化数据以及视频等非结构化数据来支撑知识图谱的构建。构建图谱层面使用通用建设方案,基于业务需求进行知识建模、知识获取、知识融合和知识计算。在业务能力上,整理险情处置知识图谱通用的算法能力,为业务能力提供基础算法支撑;结合业务需求和应用场景梳理险情处置领域的业务能力,为智能化应用提供算法接口。

图2 险情处置知识图谱架构

2.2 险情处置方案管理

对历史上发生的险情以及处理方案进行收集、整理、入库,建立历史险情处置方案数据库,包括处置方案的查询、上传、下载、删除、智能推送等功能。

2.2.1 数据检索

支持对历史全部险情处置方案进行全面检索和调看。系统提供险情处置方案模糊查询功能,查询条件分为险情类型、工程类型、方案来源、方案编号、方案名称、险情处置专家等条件。

2.2.2 关联分析

通过知识图谱技术,把险情处置方案与当前洪水形势、工程基础信息建立关联关系,作为险情处置的基础方案库。

2.3 险情处置知识图谱构建

从历史险情处置方案数据库中进行相关知识抽取,包含各类实体、属性及其之间的关联关系,进而对抽取的知识进行自动分类、关联性分析等信息融合,最后借助专家知识和现有知识库进行知识建模,储存形成险情处置知识图谱。

险情处置知识图谱构建流程包括知识建模、数据获取、知识抽取/消歧、知识计算/更新/融合等步骤[9],构建流程见图3。

图3 险情处置方案知识图谱构建流程

在概念层设计中,首先识别出险情发生的行为主体(水闸、泵站、水库、堤防等)涉及的险情类型、产生原因、抢护原则、抢护方法、注意事项等限定条件,并进一步抽象为概念及其属性。随后,判别出险情处置的依据模式以及需要的其他数据,据此设计形成险情处置知识图谱本体。

由于限定条件中涉及多种上下位关系,因此,在数据获取层中需要首先获取结构化条件关系数据,以及半结构化报表、档案数据,非结构化文本、图片数据等;其次,使用D2R、启发规则、信息抽取等方法实现实体、关系以及属性的抽取,并进行实体消歧以及共指消解等对齐处理;最后,对抽取的三元组进行数据质量评估,融合限定条件(险情类型、产生原因、抢护方法等)扩展知识图谱中的知识,完成关系推理以及知识更新、补全等计算,最终形成险情处置知识图谱,并不断反馈质量评估结果,持续对知识三元组进行更新,从而形成闭环。在此过程中,险情处置本体对知识抽取、消歧、更新、融合等步骤起着指导作用。

2.3.1 险情处置知识建模

知识图谱一般包括自上而下和自下而上两种构建方法,前者是在定义好知识图谱的语义和逻辑结构的基础上丰富数据,后者是先通过对数据的实体和关系抽取进而归纳语义,再确定知识图谱的结构。由于本次研究的是专业性强的垂直领域知识图谱,所以采用自上而下的方法进行知识图谱构建[10]。

险情处置知识图谱本体分为险情、案例、抢护方法三个核心概念。围绕险情又可细分为险情类型、产生原因、抢护原则、注意事项、抢护方法,见表1~表5。案例可细分为案例时间、案例概况、案例图片、险情描述、处置措施、处置效果,见表6~表12。

表1 险情类型

表2 产生原因

表3 抢护原则

表4 注意事项

表5 抢护方法

表6 案例

表7 案例图片

表8 险情描述

表9 案例概况

表10 案例时间

表11 处置措施

表12 处置效果

2.3.1.1 概念导入

本体构建完成后,需要将相关概念、关系、属性导入通用知识图谱平台,提供三种方式实现概念导入。

a.手动添加。在“知识建模→概念构建”菜单栏中,选择指定的父类概念,可手动添加或删除其子概念,包括编辑子概念的名称、标示、描述,及其属性、涉及的概念关系等。

b.Excel导入。在“知识建模→概念构建→概念导入”菜单栏中,选择导入Excel文件也可实现本体的构建。Excel文件模板包括分组、英文名称、上位概念、中文名称、中文描述、值域类型等字段。

c.OWL导入。在“知识建模→概念构建→概念导入”菜单栏中,选择导入Protégé生成的OWL文件也可实现本体的构建。

2.3.1.2 概念可视化

完成本体构建之后,可在“知识建模→概念可视化”中对险情处置知识图谱本体进行可视化浏览,见图4。可选择树状或者网状结构表示,并提供显示/隐藏功能。

图4 险情处置知识图谱概念可视化

2.3.1.3 概念导出

险情处置知识图谱本体构建完毕后,可将相关概念、实体、关系、属性等导出保存为Excel文件或OWL文件,其中OWL文件可进行可视化展示。

2.3.2 险情处置知识抽取

本体建模只提供机器认知的基本骨架,还要通过知识获取环节来充实知识实例。本次研究基于水利行业领域的业务数据库、专家的经验总结文档和历史险情案例的数据进行手工三元组标注,以实现险情处置知识的抽取。依据险情处置知识图谱本体设计,逐条抽取险情类型、产生原因以及相应的抢护方法。险情处置对应关系见表13。

表13 险情处置对应关系

2.3.3 险情处置知识存储

2.3.3.1 知识导入

知识抽取完成后,需要基于通用知识图谱平台完成关系三元组的导入,同样提供以下三种知识导入方式。

a.手动添加。在录入三元组之前,需要预先在概念层中构建好概念之间的关系,并且关系具有方向性,在属于被指向概念的实体集合中,无法获取到该条关系。因此,若关系三元组中存在本体未定义的关系时,需要返回概念导入模块手动添加该关系。

选择“知识存储→实体管理→添加实体”,输入实体名称以及消歧标识,可完成实体录入。确保实体与关系均合法后,点击实体编辑按钮,对该实体所属的概念、实体属性、实体关系进行手工编辑,即可完成三元组的手动录入。若三元组中的实体已存在,则仅在该实体的关系属性中新增一条关系指向即可。

b.Excel导入。通用知识图谱平台支持三元组的Excel导入,并且可实现实体或关系的单独导入。选择“知识存储→实体管理→实体导入”,选择实体对应的概念,下载实体导入模板并填写。该模板可根据概念属性自动设置表头字段,实现实体及其属性的导入。

关系导入流程类似于实体导入,选择“知识存储→实体管理→关系导入”,下载关系导入模板,填写关系三元组涉及的起点与终点实体概念标识以及关系名,即可实现关系的导入。若该关系表存在知识图谱实体集合中不存在的实体时,可选择忽略该条关系或在图谱中新建实体,但新建实体时,无法新建该实体的属性。

c.工作流导入。通用知识图谱平台提供以任务流的形式将知识图谱的构建过程进行可视化展示功能,即将图谱构建的每一步操作如数据导入、数据清洗、模型训练、信息抽取等配置成任务流的工作节点。通用知识图谱平台内置数据导入、数据清洗、实体抽取、非结构化文本转换等通用节点,同时支持用户自定义节点能力。因此可通过构建工作流的方式实现关系三元组的导入。

在基于工作流导入三元组之前,需要构建搭配工作流输入输出的数据空间。选择“数据空间→文件管理”,即可进入自建数据管理页面。

数据空间提供MySQL、Oracle、Mongo DB等数据库数据的接入能力,并且提供外接爬虫平台和标注平台的能力,同时还支持对自建数据(Excel)的智能导入或在线构建,提供对已接入数据的增、删、查、改等基础数据管理能力。将关系三元组数据保存为JSON格式,选择“新增文件夹→上传数据”,将JSON文件上传至数据空间,即可完成自建数据集的上传。

将关系三元组导入知识图谱,选择通用节点中的“数据输出→保存数据”。右键选择节点属性保存为“SPO三元组”,点击运行工作流,即可完成三元组导入。

2.3.3.2 知识管理

知识导入完毕后,可在通用知识图谱平台对实体、关系进行管理。选择“知识存储→实体管理”,可查看所有概念类别下的实体集合,选择“知识存储→可视化管理”,可基于可视化交互操作的形式,对实体及关系进行增、删、查、改。可视化界面还可以设定关系层数,设定筛选关系方向等操作。

2.4 防汛应急抢险方案智能推送

险情知识图谱中记录了大量的险情及对应的抢护方法,利用知识图谱可以辅助防汛工作人员快速完成险情的判定、消除和抢护,便于高效开展防汛应急抢险工作。

图5所示为险情处置方案的智能推送流程,首先通过基层防汛人员上报的险情描述判断出险情类型,确定险情类型后,进行实体识别和对齐,为防汛人员自动推荐历史类似案例的处置措施和效果。同时支持历史方案的下载展示,供现场防汛专家进行会商决策。在完成本次险情处置后,防汛工作人员将该次险情案例的整个过程记录下来(包含案例时间、案例概况、险情描述、处置措施、处置效果等信息),经过知识抽取和存储后,更新到知识图谱中,便于后期更好地进行防汛应急抢险方案推荐工作。

图5 险情处置方案的智能推送流程

3 应用成效

本次研究的险情处置方案知识图谱已在安徽省水旱灾害抢险专家系统[11]中成功应用。系统可结合基层上报的险情主动推送历史同类险情的处置方案,供专家进行会商研判和指导险情处置。当新的险情处置成功后,可对险情进行结构化处理,作为新的经验进行积累用于指导处置未来发生的险情。系统的建设显著提高了安徽省水旱灾害防御和险情处置的水平,使科学决策和精准处置成为现实。

4 结 语

本研究利用知识图谱技术辅助防汛工作人员在汛期快速制定防汛应急抢险方案,提升防汛应急抢险能力。险情处置知识图谱通过对各类险情信息进行分析和整合,包括管涌、散浸、滑坡、堤溃等,帮助政府和防汛应急管理部门实现对险情的精准管控。同时,险情处置知识图谱可以对历史险情数据、处置方法及效果等进行分析和统计,提取有用信息并进行可视化展示及类案推送,帮助应急指挥部门快速作出决策。但险情处置知识图谱的构建和应用是一项需要不断更新完善的工作,数据源需要不断扩充、实体抽取准确率需要不断提高、险情处置知识图谱需要在实践中不断挖掘更多的应用场景和实现相关知识系统的落地。

猜你喜欢

三元组险情防汛
基于带噪声数据集的强鲁棒性隐含三元组质检算法*
夏季防洪防汛
我将赤脚走向荒野
河北销售备战险情
特征标三元组的本原诱导子
防汛当前莫添乱
关于余挠三元组的periodic-模
防汛,就是要和隐患“对着干”
淮委组织开展2017年防汛抢险联合演练
基于模糊理论的拦河闸病险情分析及安全评价