APP下载

基于多源异构数据的水行政执法综合管理平台研究与应用

2024-01-08李冬杰杨柳郑策陈良帅

水利信息化 2023年6期
关键词:水事水利部流域

李冬杰 ,杨柳,郑策,陈良帅

(1.北京金水信息技术发展有限公司,北京 100053;2.水利部信息中心,北京 100053)

0 引言

水行政执法是水行政主管部门履行法定职责、管理水利行政事务的重要方式,水行政执法质量直接关系到涉水法律法规的有效实施、法治政府建设成效及人民群众切身利益。2022年6 月,水利部印发《水行政执法效能提升行动方案(2022—2025 年)》[1],明确提出建设全国水行政执法综合管理平台,加强信息共享、数据汇集,支持水利部、流域机构和省(区、市)各级水政监察队伍水政监察人员在线执法办案,逐步打造全国水行政执法一张图,进一步提升水行政执法智慧化水平。《“十四五”期间推进智慧水利建设实施方案》[2]也明确提出,在水行政执法方面要围绕业务需求,依托水利部在线政务服务平台等,搭建水行政执法综合管理平台。

通过前期项目实施,各流域机构、省市各级水行政管理部门针对水行政执法建立多个信息系统[3-5],因业务内容和需求不完全相同,不同用户使用的系统存在差异,基础数据缺乏统一技术标准规范,各单位之间存在数据壁垒,导致数据共享不充分,水事案件信息割裂。现阶段主要依托水行政执法统计直报系统,对业务数据进行静态汇集及分析,难以全面掌握案件线索、办案、执行的全过程信息,对案件办理质量进行全过程监督及深入研判的支撑不够,无法支撑新时期全国水行政执法业务的分析预警、综合决策和调度指挥。

本研究以多源异构数据融合为目的,重点研究如何提取多源异构数据,并对数据进行清洗、整合、加工,在此基础上提出全国水行政执法综合管理平台设计方案,全面推进水行政执法相关数据共享及业务协同,实现案件线索自动发现、案件办理网上流转、执法行为在线监督等协同应用,分析初步应用效果,展望总体应用成效。

1 多源异构数据融合

1.1 数据来源

全国水行政执法综合管理平台多源异构数据主要源于以下 5 个方面:1)各流域机构相关水行政遥感、执法巡查等系统,主要包括人员、装备、线索、办案、队伍等信息。2)视频识别技术在违法线索识别中的大量应用产生的海量数据。3)前期水行政执法能力提升行动中遥感监控工程产生的几何精校正产品、DOM(数字正射影像图)、DSM(数字地表模型)等。4)水信息基础平台的水利基础信息,包括水旱灾害防御、水资源管理等业务协同数据。5)其他行业相关的案件线索,协同办案信息等。数据来源千差万别,数据获取方式多种多样。

1.2 数据融合难度分析

在数据标准化方面,空间数据格式包括 MapGIS(WT/WL/WP),ArcGIS(shp),AutoCAD(dwg/dxf/dwt)等。格式不统一,通用性较差,成果转换难度较大。结构化数据尚未建立统一的标准,目前各流域机构已建系统主要参照司法部等相关系统进行建设,标准适用性不高,数据理解难,机器可读性差,存在语义分歧。在数据存储方面,各类信息分散于各业务系统,管理数据分散,数据平台支撑能力参差不齐。

1.3 基于数据湖架构的多源异构数据融合方法

针对相关领域结构化、半结构化与等异构数据增加,数据来源逐渐多元化的现状,数据湖作为一种新型大数据存储处理架构和共享机制已被广泛应用[6-7]。通过构建数据湖,实现对水行政执法各相关系统数据的全量汇聚存储,并通过数据复杂关联计算和深度分析与挖掘,完成数据汇总、模型搭建及运行,为上层系统提供预测分析、即席查询、复杂计算、数据挖掘等功能,提供一体化、智能化的水行政执法数据融合服务,满足跨部门、区域、层级的数据流通和治理需求。基于数据湖的数据处理架构如图 1 所示。

1)数据汇集。面向水行政执法数据汇集场景,实现水行政执法统计直报系统、流域机构执法、跨部门等领域业务系统数据接入,以数据资源目录为核心,通过数据湖汇集平台实现灵活可配置的数据汇聚、清洗、处理、入湖过程。在数据汇集过程中,对于结构化数据的实时采集,利用 HinkCDC(变化数据捕捉工具)构建采集任务,实现全量与增量数据采集;离线采集则使用 Sqoop(结构化数据连接器模块)构建采集任务,首次采集执行全量采集,后续使用增量采集方法。对于相关行为数据,使用本研究设计的MongoDB(存储分布式文件的数据库)构建 Flume 程序实现增量与全量采集。

2)数据存储。数据湖中数据具有多样性特征,通过数据湖多范式存储系统,保证对数据的有效访问[8]。将具有原始数据结构的元数据、管理数据,以及指标数据存储到关系数据库,将文本、图片、视频、日志等非结构化数据存储到 NoSQL 文本数据库中,将空间坐标、格栅数据等地理数据存储到空间数据库,将非现场执法相关的实时监测数据存储到时序数据库,将相关的检索、查询索引等存储到索引数据库。

3)数据处理。根据水行政执法业务流程和规则,对需要汇集的原始数据进行质量检查,并按照数据标准和转换规则等进行数据抽取加载、清洗转换、除冗规约,实现数据的标准化整编。根据结构化数据的业务需求建立关键词抽取规则,实现对业务数据的提取并上传。针对非结构化数据,通过建立关键字抽取规则,将 XML 格式文件作为中间数据存储,将非结构化数据进行转换,在此基础上,面向水行政执法分析、辅助、决策等专业应用需求,进行数据融合、关联,形成不同的案件主题、产品等数据。

4)数据服务。对数据进行计算逻辑的封装(过滤查询、多维分析和算法模型等计算逻辑),生成 API服务,上层数据应用可以对接数据服务 API,将数据快速应用到业务场景中。除 API 服务之外,业务用户也可以在智能数据分析平台中使用一站式的数据即席查询、自助取数、自助创建报表等在线功能。同时,数据湖提供横、纵向级联和级联拓扑功能,级联对象为信息资源目录,所挂接的服务将与信息资源一并被级联到下级节点。

2 水行政执法综合管理平台设计与实现

图1 基于数据湖的数据处理架构

围绕水利部及流域管理机构水行政执法业务需求,基于水信息基础平台和水利一张图,汇集各流域管理机构和省、市水行政执法部门已建数据成果,建成水行政执法数据仓,开发水利部水行政执法管理工作平台,将案件来源、执法巡查、执法办案、水事纠纷调处、行政复议/诉讼、水法律法规、水政监察队伍和装备管理、水行政执法监督检查管理和综合调度指挥纳入信息化管理,建设集数据交换、预警研判、业务协同、案件督办、辅助决策和调度指挥等功能的一体化水行政执法综合管理平台,逐步构建预警防控及时化、执法操作规范化、执法文书标准化、执法过程痕迹化、统计分析可量化、执法监督严密化的水行政执法管理信息化应用,形成全国各级水行政执法部门水行政执法一体化要求,实现一个平台、多点应用、全面带动的水行政执法高效能模式。

2.1 平台框架

水行政执法综合管理平台以水利部信息化顶层设计、智慧水利为指导,充分利用云计算、大数据、移动互联网等先进技术,按照整体规划、统一建设、集中部署、分级应用的总体原则开展建设,总体框架如图 2 所示。

图2 总体框架图

2.2 数据标准

针对水行政执法数据在信息流程各环节的数据格式及存储不统一、不规范等问题,制定《水行政执法综合管理数据资源共享交换管理办法》《水行政执法综合管理业务数据库表结构标准》等,为避免各自为政和形成信息孤岛提供指导性意见,是实现资源共享和互联互通的重要技术保障。

2.3 业务流程

水行政执法相关业务包括执法办案、水事纠纷调处、行政复议、水法律法规、水利普法等,其中,核心业务主要为执法办案,依法处理包括下发责令停止水事违法行为通知书、责令改正违法行为通知书、水事案件处理呈报表、重大案件集体讨论记录、限期拆除通知书、催告通知书、公告书、强制执行审批表、强制执行决定书等过程,水行政执法概化业务流程如图 3 所示。

2.4 平台核心功能

2.4.1 执法线索监控管理

图3 水行政执法业务流程图(概化)

执法线索监控主要来自投诉举报、遥感监测、网络舆情、流域上报等。根据具体任务需要,通过批量交换、动态采集和服务接口等多种方式,将执法线索汇集至综合监管数据库。各流域对已建视频监控工程及遥感数据进行分析,将疑似案件接入水行政执法综合管理平台。

1)投诉举报。接收水利部监督举报服务平台相关的水行政执法投诉举报信息,进行转派、核查、立案、处理、结案等全流程管理。

2)遥感监测。以各流域管理机构重点执法区域遥感影像数据为基础,通过遥感“四查”平台,全方位获得岸线变化、沿江河湖库工程建设情况、围湖造地、围网养殖、非法占用水面等水事活动信息,从而提高全国水政执法监控、调查取证和案件查处准确性。对监测发生变化的区域进行重点现场巡查,及时发现和查处水事违法活动。

3)网络舆情。基于水利部已建舆情信息系统定制水行政执法专题,接入每个舆情分类对应的新闻列表,包括总条数、分页数,以及每条新闻的标题、摘要、来源、原文链接及当前新闻报警级别等相关信息。其中报警分为红色和蓝色 2 个级别,分别代表重点和一般舆情。

4)流域上报。在水利部统一制定水政业务信息模型和存储交换标准的基础上,各级流域管理机构按统一标准要求对已建执法数据和数据源进行转换,建设本级执法基础数据库,存储水政执法监控工程产生的卫星遥感、无人机、执法音视频和监控视频等监控数据,存储执法管理系统的业务数据。水利部执法基础数据库按照业务要求,从各流域管理机构执法基础数据库提取相关的监控和业务管理等数据,并进行汇总处理。执法基础数据库为水行政执法统计系统提供统一标准的业务数据汇集上报渠道,同时为各水政业务应用系统提供数据支撑。流域上报信息包括流域管理机构遥感监测成果、无人机监控、视频监控目录、执法巡查等信息。

5)各专业监管系统转办。各专业监管系统发现水事违法事件,可直接推送到水行政执法管理应用。

2.4.2 水行政执法业务管理

按照业务流程实现水行政立案审批、登记立案、调查取证、提出初步处罚意见、处罚事先告知审批、处罚事先告知(初步处罚意见、陈述申辩权、听证权)、记录申辩意见、制作听证记录、形成调查终结报告、法制审核、行政处罚决定及送达、执行行政处罚决定、结案、案件卷宗管理全环节线上办理。支持动态采集水事矛盾和纠纷情况,主要包括水事纠纷基本信息和调处过程及结果等管理。

2.4.3 水政监察队伍和装备管理

实现对水政监察队伍、人员、培训、证书等动态管理,便于各级水行政监察队伍掌握管辖范围内水行政执法能力情况;实现执法装备建设管理;提供水行政执法培训管理功能,通过集成中国水利教育培训网的水行政执法模块完成培训计划、记录和监督等内容。

2.4.4 水行政执法监督检查管理

调取水行政执法业务管理相关资料,对巡查检查记录、执法台账、执法案卷、执法“三项制度”的执行情况进行检查;根据《水行政执法监督检查办法(试行)》,对行政处罚过程中执法行为、程序进行检查,对于检查发现的问题进行责任追究;以水行政执法业务管理相关数据为基础,强制性全流程监督,对以上过程提供监管过程及责任追究结果的管理,重点检查责任落实、执法能力建设等情况。

2.4.5 水行政执法综合调度指挥

主要内容包括:1)一图展示。将巡查、详查、核查、复查等业务过程数据与空间地图关联,实现执法过程回溯,增强上下游业务的透明度,具备空间定位、展示、分析等功能。支持基于空间位置的违法水事对象监测信息综合查询,具备轨迹录制和回放,以及视频输出等辅助功能。2)一图监管。以执法一张图和综合监管等数据为基础,建立执法监管信息展示、执法监管分析、监管预警与处理等功能于一体的一图监管体系。3)综合决策支持。依托数据汇集,结合一张图应用,通过数据处理分析,对水行政执法工作中各个环节进行全流程业务展示,提供数据、综合预警研判、会商、案件抽样监督、重大案件督办、历史事件复现等决策支持。

2.5 技术对接

水利部前期已通过本研究项目发布的《水行政执法综合管理平台接口文档》,各级部门须按照文档规定的统一标准进行办案业务系统对接改造。流域管理机构及各级水行政主管部门可依托本研究系统开展水行政执法业务,对于已建相关业务系统的流域机构及省级水行政主管部门,须根据水行政执法综合管理平台开发的标准接口,主动做好本地区平台与水行政执法综合管理平台的对接。由于目前数据湖的相关建设工作还在推进过程中,不能满足水利部水行政执法数据汇集进度要求,现阶段提供 2 种数据汇集方式:1)流域机构或相关水行政主管部门先将历史数据从原有系统导出或者收集,经整理后,再由水利部信息中心统一一次性导入本研究平台数据库;2)采取中间库对接方式,对接规范依据《水行政执法综合管理平台接口文档》。

3 建设成效分析

围绕水利部及各流域管理机构水行政执法业务,目前完成流域管理机构已建数据成果汇集,初步建设水行政执法数据仓,并搭建水行政执法综合管理平台,通过接口开发打通数据交换链路,实现与黄河水利委员会和海河水利委员会等流域机构执法巡查监控系统、案件、队伍、装备、人员等 7 类实时在线数据,以及统计直报系统水事纠纷、行政复议、诉讼等 3 类实时在线数据的对接,完成长江水利委员会、黄河水利委员会等 7 家单位,执法巡查、案件、水事纠纷等 10 类,共10 320 条历史数据的对接入库。统计实时数据,通过热力图形式精准聚焦重点区域案件、线索分布情况,基于多维度指标分析各流域执法巡查情况,提供案件重点领域及办件量趋势等拓展分析功能。水行政执法综合管理平台如图 4 所示。

4 结语

本研究围绕全国水行政执法数据共享和业务协同管理需求,综合考虑多源异构数据融合难点,采用基于数据湖架构的水行政执法数据融合治理方法,提出水利部水行政执法管理工作平台的建设框架与核心功能,实现了流域级数据共享和业务协同,对于下阶段推动全国水行政执法数据共享和业务协同具有积极意义。下阶段水行政执法综合管理平台将作为全国水行政执法数据汇集和交换的总枢纽,推动试点省份对接建设,探讨采用基于数据湖架构的数据融合处理方式,实现数据汇集与业务协同,充分挖掘统计分析广度与深度,进一步提升水行政执法决策支持能力。

图4 水行政执法综合管理平台

猜你喜欢

水事水利部流域
三晋重大水事报道
半月水事
三晋重大水事报道
压油沟小流域
堡子沟流域综合治理
罗堰小流域
晋重大水事报道
打造智慧流域的思路及构想——以讨赖河流域为例
水利部2017年1月批准发布的第一批水利行业标准
水利部2017年1月批准发布的第二批水利行业标准