深圳市水务数据治理的探索与实践
2024-02-28王晓辉
王晓辉,吉 海,张 顺,陈 冰,喻 冲
(深圳市水务局,广东 深圳 518036)
0 引言
当前水务工作进入高质量发展新阶段,数字孪生流域建设成为推动实现水务治理体系和能力现代化的重要抓手[1]。数字孪生流域的本质是对物理流域全要素和水务治理管理活动全过程进行数字化映射及智能化模拟[2],关键是打造一个坚实可靠的数据底板,体系化开展数据治理工作是形成高质量数据底板的前提和基础[3]。
水务数据是支撑水务业务管理和决策的核心,由于来源广泛、体量巨大、类型复杂、存储多样等原因[4],各类水务数据往往存在一数多源、权责不清、质量不高、标准不统一、无法有效关联等问题[5],如同一水库特征水位值、河流信息在不同系统中数据不一致,水务对象空间坐标系统、高程系统不统一,“排放口”在水利、住房和城乡建设、生态环境等部门定义不一致等。如果缺少数据治理,数据价值将无从谈起。低质量数据导致低效率工作,数据孤岛制约业务协同[6]。
随着水务数据影响数字孪生建设效益的问题愈发凸显,数据治理工作关注度日益提高,已有一定的研究探索和试点。雍熙等[7]49以水库为对象开展数据治理研究,基于数据仓库和中台技术,构建以基础层、明细层、专题层为框架的数据资源体系,在统一的数据资源体系基础上开展数据应用。杨胜飞[8]提出水利数据治理7个流程步骤,包括数据资源调查与梳理、资源目录建设、水利数据库建设、数据资源汇集、数据资源治理、数据管理平台和运行环境建设。王铭铭等[9]探讨了水资源静态、动态多源数据汇聚的方式,并按照数据规整、逻辑判断、数据清洗、数据建模的流程完成从数据接入到治理的过程,最后通过建立数据关联关系,实现对水资源多元数据的融合与检索。刘叶森等[10]面向防洪“四预”领域,围绕数据采集整编、多源异构数据汇聚、多维多尺度数据融合、业务信息资源库构建、数据可视化、数据服务、数据共享等方面提出数据底板建设框架和主要技术路线。目前关于水务数据治理的研究主要集中在技术实现领域,且仅涉及部分数据类型,缺乏全面性、系统性数据治理体系的梳理和实践应用。为此,本研究以深圳市水务治理为例,从问题发现、目标提出、框架设计、实践路径等方面进行水务数据治理的探索与实践。
1 数据治理目标
深圳市智慧水务开展“一体化、集约化”顶层设计以前,信息化建设呈现烟囱式、孤岛式特点,主要是基于业务条线垂直运作、单部门内循环的模式,以解决单一业务问题为目标建设应用系统,涉及的数据归集、治理、应用较为片面局部,难以发挥组织数字化转型的效益[11]。
传统的信息化建设模式面临转型突破的挑战与契机,须树立系统工程思维,系统性开展数据治理,从底层打破数据孤岛,以统一标准提升数据质量,形成可靠的数据底板,方可统一支撑各类业务场景,进而形成“用数据说话、用数据管理、用数据决策、用数据创新”的管理新模式,推动业务协同[12]。
基于以往信息化建设的问题与形势,深圳市智慧水务建设明确以数据治理为核心,基于一数一源的原则,以打造数字孪生水务为目标,业务需求为导向,数据资产为核心和纽带,构建水务数据生产、归集、清洗、融合、服务、应用的一体化治理链条,构建管理体制健全、标准规范统一、质量安全可靠、协同平台高效的综合保障机制,形成“全要素归集、全过程管理、全方位共享、全场景应用”的高质量数据治理体系,建立统一的基础、监测和业务专题等数据集,形成语义精准、定义规范的水务资产数字化表达,以及逻辑清晰、要素精准的水务数据脉络图,融入城市级、流域级数字底座,为业务转型创新及跨部门协同联动奠定坚实的数据基础。
2 数据治理框架
水务数据治理框架一般包括数据源、平台工具、数据服务、融合应用、数据资源和标准体系等方面。通过大数据平台工具完成数据源采集、集成、加工等流程,构建水务数据资源体系,基于数据中台提供的数据资源,搭建各类水务业务场景[7]50。根据深圳市水务数据治理目标,结合业务实际,借鉴国内外 ICT(信息与通信技术)数据治理方法论,深圳市水务局搭建了“1 + 3 +N”的水务数据治理总体框架,框架图如图1 所示。
图1 深圳市水务数据治理框架
深圳市水务局的数据治理框架总体上由汇聚多源数据的数据生产层、存储数据的数据资产层、治理和管控数据的数据治理层及最上方的数据应用服务层组成,具体分析如下:
1) 数据生产层。数据生产层按数据来源主体、产生方式、数据类型等不同角度进一步细分。涉水数据来源主体主要有市区水务部门、供排水企业、生态环境局、气象局、规划和自然资源局等部门,产生方式主要有水位站、水质站、流量站等自动监测及人工填报等方式,数据类型主要包括结构化表格、文本、图片视频等。
2) 数据资产层。数据资产层是整个治理框架的核心。通过深度分析深圳市水务的业务特征,数据资产层分为以下 3 类数据资产:a. 基础数据,分为江河湖泊、水务工程、监测站(点)和其他管理对象 4 种类型,共 4 个大类 120 个水务对象小类;b. 监测数据,包括河道、水库湖泊、堰闸、泵站等水文(流量) 46 类监测数据;c. 业务数据,按不同业务类别分为“六水共治”、工程管理、政务运行等N个数据集,实现对数据资产的合理划分与分类管理。
3) 数据治理层。数据治理层也是治理框架的核心,主要涵盖生产—归集—清洗—融合—服务—应用一体化治理链条,以及体制机制、标准规范、质量安全、协同平台综合保障机制,结合深圳市水务现有体制制定相应规范和标准,建设相关管控与协同平台,形成 1 套数据治理体系,对历史数据和后续新增数据进行有效治理。
4) 数据应用服务层。数据应用服务层是在数据归集、治理的基础上形成的可用于支撑深圳市水务局各类业务的数据资源池和服务台,为各类业务场景提供清洁可靠、一数一源的水务数据。
3 数据治理路径与方法
根据深圳市水务数据治理目标和框架体系,治理路径推进思路如下:通过制定技术标准规范,建立水务资产“一物一码”管理模式,明确权责关系,并通过一体化数据治理平台固化相应规则,构建可贯穿数据生产、归集、清洗、融合及对外服务全过程的治理体系,从规范性、完整性、准确性、实时性等方面提升数据质量,打破数据孤岛,强化数据关联关系挖掘和分析,为业务场景建设提供“数出一孔”的数据底座。
数据治理路径具体包括以下 4 个步骤:
1) 制定标准规范。在遵循 SL/T 213—2020《水利对象分类与编码总则》、SL/T 799—2020《水利数据目录服务规范》、SL/T 801—2020《水利一张图空间信息服务规范》等行业标准规范的基础上,结合深圳市实际,编制水务对象分类与编码、数据存储和传输等标准规范;印发管理要求,明确各类数据数源主体及审核流程;同时按照“数据不出底座,使用者不拥有数据”的原则,明确要求水务行业应用场景必须基于水务大数据中心开展建设,确保水务数据一数一源,初步形成水务数据治理技术和管理保障体系。
2) 搭建一体化数据治理平台。搭建覆盖数据归集、清洗、融合及对外服务的数据治理一体化支撑平台,打造基于 GIS + BIM 融合技术的数据可视化呈现平台,建设基础、监测数据管理平台,对全深圳市水务基础、监测、业务等数据资产进行统一归集和治理,内置数据权责关系,对发现的数据问题进行跟踪和处置,保证数据一数一源及准确性;形成深圳市水务一张图,汇集呈现全市水务对象信息;统一发布数据资源目录和服务接口,向上级行业主管部门、全市各行业提供统一标准的水务数据服务。
3) 融合城市数据底座。依托深圳市统一的 CIM(城市信息模型)平台,基于城市地理空间数据、涉水基础要素和监测数据等信息资源,建设数字孪生水务基础底板,可为数字孪生城市提供准确规范、逻辑清晰的水务数据集,为跨部门涉水业务协同和联动奠定数据基础,将水务管理深度融入城市治理。
4) 建立数据与业务双轮驱动机制。一方面,信息化部门通过构建一体化的数据治理平台,内置数据权责关系,统一数据调用机制,驱动各业务部门参与数据底板的建设,持续更新、维护、使用数据;另一方面,通过典型业务场景的构建倒逼数据底板持续完善,构建水环境达标、水量平衡、水旱灾害防御等核心业务场景,通过业务场景数字化目标的实现反向推动各业务部门、上下级机构完善数据采集体系,提升数据质量,增强数据共建共享意识。
4 数据治理成果及成效
目前,深圳市水务局初步建成数据底座 1.0 版,整合归集已有普查成果和数据资源,以统一的数据标准及管理规则初步完成全市“河、库、厂、网、站、线”等 6 个大类 30 个小类约 5 300 个重点水务对象基础数据归集和治理,汇聚了全市各涉水部门水、雨、工情约 6 000 个测站的实时监测数据,改变了以往数据烟囱式分散存储于 10 余个不同应用系统的情况,初步解决了数据不同源、不可信、不维护的问题。基于全市 CIM 平台底座,围绕水务对象关联关系构建水务一张图,对外共统一提供了 2 200 项水务数据服务,有力推动了数据共享从“数据搬家”向“产品服务”模式的转变,提升了数据服务应用效率。构建的深圳市水务一张图如图2 所示。
图2 深圳市水务一张图
数字底座的建设为深圳市区水务部门、供排水企业提供了统一平台工具,以供更新维护、使用数据,确保水务数据一数一源,厘清数据权责关系,规范数据标准,提升数据质量,助力业务人员提高数据统计工作效率。数据底座的建设也为数字化业务场景的搭建奠定了坚实的数据基础,有效支撑了以下业务管理:
1) 水安全。通过汇聚全市雨、水、工、险情数据,并建立河流、水库、水闸、泵站等水务对象空间拓扑关系,打造水旱灾害防御场景,初步实现了水库、河道、内涝风险分析,为水旱灾害防御形势研判提供了支撑。
2) 水资源。通过汇聚全市“取、供、用、耗、排”水循环全链条各部门水量数据,打造了水量平衡场景,支撑了水量平衡相关业务的联动和协同,推动了用水效率的提高。
3) 水环境。通过建立河流、水质净化厂、重点排口等水环境要素监测和关联分析的数字化表达,打造水环境达标场景,有效支撑生活污水收集率、进厂BOD(生化需氧量)质量浓度、优良河长稳步提升。
5 结语
数据治理是数字孪生流域(水务)建设的核心,是实现水务业务数字化转型的基础,数据治理体系包括数据生产层、资产层、治理层和应用服务层。数据治理可分为制定数据标准规范、搭建一体化数据治理平台、融合城市数字底座及建立数据与业务双轮驱动机制等步骤。深圳市智慧水务通过体系化数据治理,建立了统一的基础、监测和业务专题等数据集,形成了水务数据资产,可为水务业务工作提供数据基础和依据。
现阶段数据治理主要以数据清洗、确保数据的正确性和唯一性为主,随着水务数据资产库的不断富集、累积,下一步可探索数据关联关系的挖掘和分析,逐步提升数据赋能业务决策的能力。