“大数据时代”背景下智慧规划信息化平台的数据治理
2021-11-09田朝晖秦晓莉
田朝晖,秦晓莉,范 琰
(湖南省国土资源规划院,湖南 长沙410004)
当前,致力于大数据、人工智能、普适计算、万物互联和无穷感知的信息革命正在以前所未有的广度和深度影响和改变着人类的生产与生活方式[1]。这一变革同样也影响着国土空间规划行业未来的转型与变革,需要规划信息者借助新技术、新技能不断创新思想,使计划更加科学有效。为使在大数据环境下的国土空间规划工作变得更有效率,迫切需要建立一个以大数据为支撑的,集信息采集、储存、应用和科研协同为一体的,以“自动化、大数据、复合型、交互性和增长性”为特征的智慧信息平台,提高国土空间规划的质量和效率。
在信息化平台建设过程中,面对海量的、高速增长的和多源化的数据,如何有效地整合和共享数据资源,如何为平台建设提供可靠的数据支撑,如何保障数据的安全等,这些与大数据治理相关的一系列问题不断显现。因此,有必要开展大数据治理研究,并提供一套有效的数据治理方案,以解决信息平台项目建设中的实际问题。
1 数据治理体系构建
数据治理体系是数据有效利用的基本保障,建立一套完整的数据治理体系,并形成与之相配套的组织治理机构、流程制度及支撑工具,从而实现对数据的标准、模型、采集、集成、安全等方面进行统一管控,最终确保数据治理环境的可靠、高效、安全。对于信息化平台的建设而言,数据治理体系主要包括元数据管理、数据资源目录管理、数据标准管理、数据模型管理、数据质量管理等[2]。
1.1 设计思路
按照目前国土空间规划的工作要求,建立一套涵盖数据“采、存、通、用”全生命周期的、多模式混合的数据治理系统(见图1)。治理思路涵盖“采”“存”“通”和“用”四个流程,其中“采”和“存”重点解决数据来源问题,并实现数据的及时采集、集中存储;“通”主要统一各种来源数据的标准,用于解决数据质量问题;“用”则着重解决数据价值转化的问题,通过开展各类开发应用,从而为各业务部门具体开展工作提供个性化支撑。
图1 数据治理设计思路
1.2 治理框架及内容
数据治理主要包括四个方面的内容(图2)。
图2 数据治理框架
1.2.1 数据集成
按照一定数据目录结构进行存储和集成。如有效整合现有数据、遗留数据及外部应用数据;提高办事效率,解决企业内外数据信息孤岛问题。
1.2.2 数据汇总
按照特定标准对原始数据进行处理、清洗、转换,实现原始数据到标准数据的汇总。
1.2.3 数据治理
通过制定相关的组织、制度和流程以及数据标准,完成对数据的治理。主要是对数据环境的治理,包括主数据治理和元数据治理。
(1)主数据治理:通过主数据管理工具(MDM)统一进行维护,采用编码规则、数据校验等功能对数据进行校验、查重、匹配、合并等操作,确保数据一致性、完整性和准确性。
(2)元数据治理:元数据是描述诸如信息资源或数据之类的对象的数据。它的作用是识别数据,跟踪数据使用中的变化,以实现简单有效地管理大量基于信息的数据[3]。数据治理主要用来明确业务数据从哪里来、谁来使用及数据间的关联,可以提供数据源管理、分析数据血缘关系、分析数据影响等,实现对复杂数据环境的监控管理,为平台提供安全可信的数据,为数据仓库的运行与维护提供有效支撑。
1.2.4 数据应用
由查询统计、监督评估、大数据分析、知识管理、电子档案管理等部分和日常应用管理组成。
1.3 治理原则
数据治理应遵循如下原则[4]:
1.3.1 有效性原则
数据治理过程中应体现数据的质量、标准及管控价值的有效性和高效性。
1.3.2 统一性原则
数据平台应体现标准、架构、元数据、质量流程、资产价值的五统一。
1.3.3 开放性原则
应体现人人参与数据治理、人人参与数据运维的开放性思想。
1.3.4 价值化原则
应最大化平台的数据价值,实现数据资产的价值核心。
1.3.5 安全性原则
应建立一套有效的从平台到数据、从运行安全到数据安全的技术防护体系,保障平台数据的安全可控。
2 某院智慧规划信息化平台的数据治理实践
2.1 平台建设背景
随着自然资源机构的改革,自然资源各部门的业务、关系、管理等迫切需要对信息化建设的内容、方向等方面进行重构、整合与优化,这不仅仅是简单的人员整合和部门机构改革,更是自上而下的业务变革与技术革命。与此同时,国务院、自然资源部及各级政府出台了一系列有关信息化建设的指导意见和通知,要求借助GIS、大数据、物联网新技术,建立起一套能够实现全面覆盖的动态化、精细化自然资源信息化管理平台。此外,以互联网、大数据、人工智能等新一代技术发展与应用为基础的“智慧社会”的崛起,为当前正在开展的国土空间规划编制与信息化建设工作提供了新环境,也提出了新的要求。在此背景下,可以说智慧规划信息平台建设适逢其时。
2.2 数据治理需求
数十年来,全院积累了包括基础测绘、基础土地、基础地质、矿产资源、地质灾害等大量信息数据,涵盖空间矢量、栅格影像、电子档案、统计表格及视频图片等各种类型。然而,数据在管理与应用上存在着许多问题,主要表现为:数据涉及省、市、县多个级别,其比例尺、精度坐标系和空间维度不统一;信息孤岛大量存在,找寻、共享难度大;缺乏对大数据的有效管理和检索,“数据有,但不好找”;缺乏数据到价值的转化渠道,“不知道能用数据做什么”。因此,数据的治理势在必行,通过数据治理过程,全面梳理院内各类数据,建设各类数据的审核管理、元数据管理和维护机制,维护数据的完整性、准确性以及一致性,实现数据的全生命周期管理,从而使得数据标准、数据内容以及数据质量都能够得到持续地提升,保证数据资产的长久价值。
2.3 数据治理
2.3.1 数据治理架构
数据治理架构主要包括数据采集、数据治理、数据标准制定、数据使用和数据全生命周期管理等,整体架构如图3所示。
图3 平台数据治理架构
2.3.2 数据标准规范建设
如表1所示,数据标准规范体系建设分为5大类,13小类。参照国际、国内行业等标准,并结合院内的实际需求来确定统一的数据标准、坐标体系、转换规则、资料目录及数据共享规则,以达到解决数据统计口径不一、数据定义不明、数据内容谬误及各部门间数据屏障等问题。
表1 信息平台数据标准规范体系表
2.3.3 数据集成入库
构建涵盖基础地理、自然资源、空间规划、实施评价以及社会经济等在内的多源时空大数据库。平台数据以统一的编码规则、数据校验方式向数据中心进行注册,支持矢量数据、栅格数据和属性数据等,导入数据时严格按照制定的数据标准进行匹配检查,对于缺失的非重要字段、图层,系统自动完善数据的元数据信息。
2.3.4 元数据管理
元数据管理是指对元数据标准的管理,可参考《地质信息元数据标准》(DD2006-05)、《基础地理信息数字产品元数据》(CH/T 1007-2001)、《国土资源信息核心元数据标准》(TD1016-2017)等标准进行管理。将与国土资源数据有关的信息进行整理、制作和入库,例如数据的内容、覆盖范围、质量、管理方式、所有者、提供方式等。管理主要包括三个功能模块:元数据实体管理、元数据关系梳理、元数据应用(详见表2)。
表2 元数据管理功能模块分类表
2.3.5 构建数据资源目录
以反映业务需求和应对应用需要为导向,结合国土空间规划对数据的新要求和新标准,分析各种类型数据之间的层次、类别和关系,系统化地梳理与空间规划有关的数据,制定统一的数据资源编码和分类体系,建立包含现状、规划、管理、经济社会等数据资源目录。
2.3.6 海量数据专业可视化展示
面向平台数据可视化的需求,围绕基础数据、成果管理、数据分析三个方面,采用可视、交互的方式直观地展示数据信息。基于海量数据及项目多样性,形成数据资产,分析应用全面掌控数据来龙去脉,获得更多的数据洞察力,进而挖掘出隐藏在资源中的价值。
2.3.7 打造智慧规划信息服务高地
汇集整合各业务部门数据、城市各类基础信息和手机信令大数据等,构建“一张图”地理空间大数据体系[5],建立起支撑自然资源管理、国土空间规划的底板数据库。借智慧型信息化平台建设之机,加强智慧规划所需的专业技术与管理人才的培养,最终打造形成“大数据时代”新形势下自然资源和空间规划建设管理所需的智库。
2.3.8 数据安全管理
数据安全管理是通过建立完善的数据安全管控体系,降低数据泄露风险,实现数据资产的安全防护。主要包括安全管控机制建设、数据访问权限管理、数据脱敏管理、数据分级分类管理和数据安全审计等方面的内容。
3 结束语
数据治理工作是一个庞大的工程,本文设计并阐述了智慧型信息化平台建设过程中数据治理方面的实际需求,取得了一定的工作成果,但也存在着一些不尽如人意的地方,需要改进与完善。从理论依据与实际业务需求来看,由于大数据治理仍处于新生状态,仍需要在不断的发展过程中去探索和完善。