大数据背景下多源数据在自然资源政务中的应用与实践
——以广东省土地管理与决策支持系统为例
2021-09-10杨锦
杨 锦
(广东省国土资源技术中心,广州510000)
1 引言
随着全国土地调查、地理国情普查、自然资源调查监测等工作的推进,自然资源行业积累了大量的数据资源,包括不同类型的自然资源现状类、规划类以及管理类数据,并建设了国土资源大数据平台、地理信息大数据中心、规划“一张图”等数据管理与应用的软件系统[1-3]。为充分利用这些数据资源,黄华坤等人对大数据背景下的国土资源档案管理进行了探索性研究[4];李宁等对大数据平台支持下的土地资源管理模式进行了创新探索[5];杨辉山等对大数据环境下的数据整合和更新技术进行了探究[6],通过大数据平台的建设,完成了对自然资源数据的整合,可以方便快捷地利用不同来源、不同种类的数据资源。为继续深入挖掘数据资源的深度利用价值,贺宝成等在领导干部自然资源资产离任审计方面进行了应用方式的探索[7];Ibrahim Abaker Targio Hashem等对大数据在智慧城市方面的应用进行尝试,并开始关注政府在大数据环境下所扮演的角色[8-9];李茜等围绕国土空间规划基于空间地理信息对政务信息进行整合[10];不少学者也利用多源数据在数据融合、遥感监测、城市规划等方面进行了深入的研究和探索[11-13]。这些研究及应用,主要集中在数据平台的建设管理和数据层面。
近年来,也有一部分研究侧重于数据的应用系统建设,如张何欣等利用空间数据仓库的GIS大数据技术架构建立决策模型,对自然保护区监测、住宅开发强度评价方面进行有效应用,提升了管理水平[14];周浩等以管线规划辅助审批为例验证了多源数据一体化应用的方向和价值[15],也有不少学者利用多源数据对特定的内容如人口密度、地铁出行、城市结构等内容进行研究[16-18],但只是对数据进行基本的综合应用,未进一步深入数据的支撑应用。在国家大数据战略的要求下,自然资源行业如何充分利用多源、多类型数据,提升自然资源数据的价值,为不同行业、不同部门的发展提供支持,开始成为相关领域研究者重点关心的问题。经过长时间的数据整合与更新,广东省自然资源管理部门积累了覆盖全省65 个大类1 030 个图层近3 亿个要素的自然资源数据。深入挖掘这些自然资源数据的价值,服务于广东省自然资源“两统一”管理、“自然资源高水平保护高效率利用”(双高)示范省建设,支撑各行业需求,成为形式要求下的迫切需求。
基于自然资源数据建设和应用的问题以及形式对数据资源应用要求的迫切性,本文以广东省土地管理与决策支持系统为例,进一步探索自然资源数据在实际政务中的应用方式。根据多源信息融合理论,融合不同来源、不同类型的数据可获取到比原来更准确的信息,利用空间相关性对广东省积累的自然资源数据进一步挖掘,通过政务办理过程与数据资源相结合的方式,将数据生产过程和数据成果使用相结合,有效提升自然资源业务精细化管理水平,提高自然资源监测监管和决策支持能力,扩展了自然资源数据应用服务的新方向。
2 多源数据应用的理论基础
多源数据应用实践的理论基础是大数据环境下基于相关性原理的多源信息融合。多源数据融合旨在将不同来源、不同类型的数据进行融合与处理,进而获取到比原来更为准确的信息,最先应用于军事领域,后来逐渐在其他领域得到应用。Van der Zee E 等提出在大数据环境下利用地理概念和空间分析将不同的事物联系在一起,形成万物互联[19],自然资源行业从不同方式、不同渠道产生不同类型的海量数据,围绕空间位置比其他数据具有更强的相关性。因此,利用空间相关性将自然资源行业内的多源信息和数据的多层次多方面内容进行组合,为业务管理和决策提供有效的支持。
自然资源数据在空间方面的相关性主要体现在两个方面:(1)业务管理方面,不同数据的生产、使用、再生产等环节都具有明显的空间属性,通过空间位置将不同来源的数据建立强有力的联系,将多源信息融合进而支持具体业务决策;(2)数据统筹方面,数据围绕空间位置随着时间产生变化,每一次时间变化都会产生一系列的新数据,利用空间的相关性统筹数据在时间范围内产生的变化,有利于进一步挖掘数据价值,减少信息疏漏。因此,在大数据环境下,利用相关性原理围绕主题相关、要素相关、任务相关等问题将多源信息融合成为应用实践的基础。
3 多源数据的来源
通过调查积累的数据以及业务办理过程中产生的数据,是自然资源数据的主要来源。以数据的共同本质属性或特性为基本依据,可划分出具备基础性和通用性空间信息服务特征的公共基础数据类、支撑业务管理的专业基础数据类、涵盖业务管理过程或成果的业务管理数据类、汇集政务信息资源的公共政务数据类。涉及数据分类及涵盖内容如表1所示。
表1 涉及数据来源及简要信息
3.1 公共基础数据
公共基础类数据主要包括基础地理、遥感影像、地理国情、地理空间框架数据、三维数据等数据。此类信息具有基础性和通用性空间属性,作为统一的底层数据,为自然资源业务提供最基础和最准确的数据支撑。
3.2 专业基础数据
面向自然资源业务核心应用需求,专业基础类数据主要包括资源调查、资源评价、空间规划、资源监测、权籍调查等数据分类。此类数据为自然资源业务根据业务实际生产的应用型数据,为业务的办理过程提供专业的数据辅助,支撑业务管理活动。
3.3 业务管理数据
业务管理数据主要包括开发利用、确权登记、耕地保护、调查监测、矿产管理、执法监督等等分支结构,是面向测绘、土地、矿产、地质环境和海洋、林业等业务管理过程产生的数据。此类数据具有较强的专业相关性,是业务管理活动中实时产生的成果或过程数据,最为直观地反映了业务的实际情况。
3.4 公共政务数据
公共政务数据主要内容包括三个方面:一是政府部门办理业务和服务过程中产生的数据;二是政府统计调查的社情民意数据;三是通过物理采集获取的环境数据,例如机构职能、业务办理流程信息、政策文件、政务信息、电子证照、公示信息、宏观经济、交通、人口等。
4 多源数据的应用模式
4.1 数据互动
自然资源土地业务涉及管制、利用、耕保、规划等十余个分散的业务内容,不同业务相互支撑形成了编、批、征、供、用、验、登的土地生命周期。在周期内的每一个环节、每一项业务都需要不同的数据进行支撑,同时也会产生对应的专业基础数据与业务管理数据,通过数据使用与数据生产的深度互动,以定时更新、准实时更新、实时更新三种方式进行数据沉淀,使得不同数据完成多层次的利用和共享,共同支撑和协助业务完成,提升数据利用率和业务办理效率。数据与业务互动示意图如图1所示。
图1 数据与业务互动示意图
4.2 数据分析
采用多源数据融合模式将自然资源进行融合利用,进而提升矢量数据的几何精度,丰富要素的属性,提高矢量数据的现势性,以融合后的数据完成对自然资源业务办理的支撑。在统一空间参考系统下,利用数据融合、数据挖掘,以及空间分析,将不同类型、不同层级的数据统筹利用,构建不同分析模型,完成对业务的数据支撑。涉及数据分析模型如表2所示。
表2 涉及数据分析模型信息
4.3 数据流动
数据作为一种资源突显出越来越重要的价值,同时在实际业务办理过程中,数据在不断生产和更新,而数据的时效性也是数据价值极为重要的一部分。为充分利用业务数据的价值,支撑业务办理过程,广东省土地管理与决策支持系统通过内部数据共享、外部数据对接的方式推动业务数据的循环流动。业务数据一方面在系统内部不同模块之间进行流动,如建设用地报批、拆旧复垦备案等业务数据相互支撑;另一方面与外部系统如规划、违法等相关数据内容完成循环流动。数据流动示意图如图2所示。
图2 数据流动示意图
5 数据应用的建设与实践
广东省土地管理与决策支持系统是自然资源数据应用的最直接体现,将与建设用地报批、拆旧复垦备案、“三旧”改造审批等七个业务相关的8类47种数据纳入,利用自然资源数据支撑广东省省级、市级、县级各级部门自然资源部门土地管理与土地利用行政审批业务办理,通过数据参与业务办理完成对数据生产的支持,将数据互动、数据分析,及数据流动三种数据应用模式纳入框架,数据利用的主要功能是在线浏览、占压分析、数据填充等。
5.1 数据应用框架
广东省土地管理与决策支持系统从大数据中心获取与土地业务相关的多源数据,根据实际业务需求将多源数据在系统中进行整合。以具体业务的空间位置为关键点,将多源信息进行融合处理,通过系统建立的数据分析模型,针对业务应用实际从数据中提取所需要的准确数据信息。系统中数据应用框架如图3所示。
深度整合基础地理、规划、现状、所有权、耕保等多源数据,利用多源数据融合原理,完成数据之间的相互校核,对数据进行集中共享,利用数据流动模式使数据实现全流程、多业务、多系统中共享使用,通过数据分析模式建立不同数据的分析模型,直接利用多源数据,采用数据互动模式对过程数据进行校核,并对结果数据进行回流沉淀,数据使用与数据沉淀完成模式互动,形成“以图驱动,以图管地,以数说话”的业务模式,让自然资源沉淀积累的数据动态流转起来。
5.2 数据应用功能
广东省土地管理与决策支持系统面向一线业务政务办理人员,目前累计省市县三级用户六千余人,而系统功能是用户最直接的数据应用方式,因此,根据用户实际业务需要设计功能才能实现数据的有效利用。在业务使用过程中将数据使用方式分为三类:一是以参考为主的数据浏览;二是以使用为主的数据填充;三是参考与使用同步的数据分析。
5.2.1 多种数据在线浏览 不同时期、不同精度的影像数据、难以矢量化话的栅格数据,及三维数据等内容,是业务办理参考数据的核心,将这部分数据以在线浏览的功能支撑业务办理过程,业务使用人员根据不同图形内容进行对业务内容进行审核,准确获取业务范围的情况,系统中浏览运行效果如图4—5所示。
5.2.2 数据填充功能 利用空间相关性将多源数据融合,获取到准确描述业务的范围、面积、土地类别等数据,将生成的数据直接填充到对应的业务表单,由数据精确描述业务内容,减少数据到业务之间的人工干预,实现了数据到业务的直接应用。多源数据在同一张业务表单内以融合结果的方式展现出来,数据填充功能如图6所示。
5.2.3 数据模型分析归类 以多源数据建立统一的叠加分析模型,可对不同数据内容进行相互校核,进而获取更准确的数据结果。如耕地质量分析模型以地类数据中的地类为基准,对应去取质量等级数据并考虑线状地物和扣除面积等数据,生成兼顾不同类型、不同来源数据的业务结果。数据分析结果一方面作为决策处理的参考结果,另一方面则是可以利用结果数据对业务内容进行强制性约束,如占压永久基本农田的业务不予通过等。数据分析模型的展示如图7所示。
6 结束语
图3 广东省土地管理与决策支持系统数据应用框架图
随着社会的发展,数据作为一种资源展现出越来越重要的价值,自然资源行业累计了大量数据,如何挖掘数据的价值,让数据发挥更大的价值,成为行业内关注的重点。本文基于多源数据融合理论,以空间相关性为关键将多源数据统筹融合,根据业务需求建立数据分析模型,并以系统功能的方式将积累的数据应用起来。通过这种方式服务了广东省全省六千余业务人员,累计办理业务四万余件,极大提高了业务办理效率,为广东省自然资源“两统一”管理和“自然资源高水平保护高效率利用”(双高)示范省建设提供了最为直接的服务保障。
将数据资源与业务办理过程进行深入结合,即是将数据成果应用与数据生产过程相结合,可以对数据成果进行及时验证应用,促使数据资源由“死”变“活”,在不断循环的过程中将多源数据整合,使得历史数据在多源数据验证下完成纠错,进一步提升数据质量。
信息技术的发展使得自然资源行业内基于数据的遥感技术研究、算法研究等内容不断深入,在基于自然资源数据成果的学术研究方面, 在广度和深度上都有出色的研究成果,然而目前对自然资源成果数据应用于行业政务方面的需要进一步进行深入。因此,本文尝试对这方面技术进行探索实践,取得了较好的结果。从本文涉及的土地方面的政务实践来看,将数据成果应用政务办理过程,一方面促进了办理效率的提升,另一方面推动了历史数据更新完善,下一步需结合业务需求进一步将遥感、深度学习等研究成果纳入政务实践,推动自然资源管理服务水平的提升。
图4 二维数据多屏展示(顺时针数据为:所有权宗地、1999地类图斑、期末地类图斑、遥感影像)
图5 二三维数据同时展示
图6 数据填充功能展示
图7 数据分析结果展示