APP下载

多场景下自然资源业务审批地理底图智能调度技术

2022-07-26周安发

上海国土资源 2022年2期
关键词:中间件图层决策树

周安发,金 群,王 韦

(1. 湖北省测绘成果档案馆,湖北·武汉 430072;2. 湖北省自然资源厅信息中心,湖北·武汉 430070;3. 湖北省地图院,湖北·武汉 430072)

自然资源业务审批既要满足各部门业务的关联联动,又要便捷易操作,信息化程度的高低直接关系到审批办件的效率[1-2]。近几年来,湖北省自然资源厅先后承担了湖北省自然资源“一张图”修改为“湖北省不动产登记信息管理基础平台”国土空间基础信息平台、自然资源政务云平台等省级信息化工作,形成了较为完善的应用支撑体系,建立了涵盖土地、地质、矿产、基础测绘等数据库,形成了自然资源“一张图”,部分行政许可和审查事项实现了电子化申报和全流程网上办理,并初步构建了国土资源综合信息监管体系,实现了部分业务的动态监管[3-4],较好支撑了各类业务管理和监管决策工作。当前,对自然资源业务审查和审批的建设研究多以系统建设[5-7]和数据指标关联研究为主[8-9],对审查和审批过程中涉及空间图形自动分析结果提取及分析效率的研究较少。如何利用大数据、GIS空间分析、人工智能等技术,开展审批项目地块属性的关联性和规律性研究,实现最优地理空间信息分析调度方法,对维护系统稳定和提高业务审批效率具有重要意义。因此,本文提出多场景下地理空间分析任务智能调度技术,以提高自然资源业务审批空间分析能力。

1 研究思路

针对湖北省自然资源业务审批存在的地块大小不均、图层多样、坐标点数目差异性大等特点,建立一种多场景条件下的复合式智能分析机制,解决单一空间分析方式存在的问题,减少业务空间审查平均分析时间,提高空间审查系统的分析效率。总体技术流程如图1。

图1 总体技术流程Fig.1 Overall technical process

研究内容包括以下两个方面:

(1)建立湖北省自然资源业务审批多场景分析样本库,针对多个审批项目分别进行页面分析、地理处理服务、要素分析中间件三种分析模式下耗时计算,最后采用人工标注方式建立样本库,利用分层采样方式建立训练集和测试集。

(2)开展基于梯度增强决策树算法的多场景地理空间分析任务分类技术研究,以CART TREE为弱分类器,通过多次迭代训练,根据湖北省各类建设用地审批、矿业权审批项目特点,实现空间审查过程最优分析方法的自动调度过程。

2 地理空间耗时分析

地理空间分析方法包括页面分析、地理处理服务分析和要素中间件分析三种方法,不同分析方法具有各自特点。页面分析简单快速,消耗系统资源少,对小型地块分析迅速,排队等待时间较少,但对复杂型超大地块的分析时间过慢,分析效率降低;地理处理服务数据标准统一、覆盖规则,但灵活性适应性较差,消耗资源大,当业务量大时,容易对整套系统产生阻塞效应;要素中间件分析对超大型超复杂型项目分析速度较快,缺点是系统启动时间慢、响应时间慢。根据自然资源业务审批项目多地块、多图层、多界址点等不同分析应用场景特点,建立页面分析、地理处理服务、要素分析中间件三种不同的空间分析服务,以审批效率和审批时长为优化目标,实现多场景境下空间分析模型的智能化匹配和调度。

2.1 页面分析

页面分析使用地理信息软件提供的各种基础的空间计算服务,通过组合后封装为空间分析服务。页面分析的优点在于体量较轻,可以部署在任何一台服务器上,由于其使用的是基础的空间计算服务,从软件层面上更容易处理服务器的负载均衡,如可以对请求做排队处理,或者多线程处理。其对简单图形处理的速度非常快,消耗资源较少。适合处理简单小型项目,少排队等待时间。页面分析原理如图2。

图2 页面分析原理图Fig.2 Web page analysis principle diagram

2.2 地理处理服务

地理处理服务是采用地理信息软件建立简单的辅助分析处理模型,并发布成服务,如土地规划分析模型,基本农田压覆分析模型等。地理处理服务的优点是处理大型项目空间或者复杂型项目分析时较快,缺点是过于依赖地理信息软件,并且分析规则组合单一,也比较消耗系统资源。当处理并发业务过多时必须依靠地理信息软件服务器自身的负载均衡来减轻服务器的计算压力,适合处理中型规模的项目。当自然资源业务繁忙时,很容易造成系统阻塞,而导致业务排队积压。地理处理分析示意如图3。

图3 地理处理分析示意图Fig.3 Geoprocessing analysis of schematic diagram

2.3 要素中间件分析

要素中间件分析是使用中间件将固定的图层和分析方案封装成定制模型,提供完整的分析结果,分析的优点是对超大型超复杂型项目进行分析时速度较快,缺点是系统启动时间较慢,对小型项目分析时间反而速度没有前两种方案快。另外要素分析中间件的消费系统资源比较大,对项目的并行处理不强,不能同时展开多个项目的分析,必须排队处理,处理方式不灵活。要素分析中间件示意如图4。

图4 要素分析中间件Fig.4 Element Analysis Middleware

3 多场景分析样本库构建

湖北省自然资源业务审批类项目多样,包括小型建设项目,城市批次类建设项目,跨城域铁路公路类建设项目,水利工程,风电项目等,各种项目的面积、地块数及界址点数目相差很大,从几百平方米到几十平方公里,从一个地块到数千个地块,坐标点数从数个到数十万个不等,不同审批项目其分析耗时和项目本身属性有具备强相关性,因此,在进行空间分析任务智能调度研究之前,需针对不同空间分析方法建立多场景分析样本库,样本库采用日志文件自动抓取后,结合人工标注方式产生。

审批过程包括图层加载、空间叠加分析计算、分析结果汇总(入库)等,通过对审批过程中的日志文件进行分析,能够获得不同场景下的分析耗时分布图。通过对审批日志的自动分析,共抽取9684个审批项目分别进行页面分析、地理处理服务、要素分析中间件三种分析模式下耗时统计,结合人工标注结合方式建立样本库,利用分层采样方式建立训练集和测试集,其中训练集样本为6456个,测试集样本为3228个。

图5和表1为针对地块、面积、坐标点数目、分析耗时等不同属性条件下建立的分析样本库。

图5 不同场景项目图形Fig.5 Different scene project graphics

表1 项目信息及分析情况Table 1 Project information and analysis

4 基于梯度提升决策树的智能调度

在已生成的空间分析样本库基础上,采用梯度提升决策树方法,针对审批项目的地块大小、地块数目以及坐标点数目的属性值,对样本数据进行多次迭代计算形成决策树,形成多环境下的针对页面分析、地理处理服务分析和要素中间件三种不同分析模式下的审批项目智能化匹配调度机制。

4.1 算法实现与训练结果

梯度提升决策树通过构建并结合多个机器学习器来完成任务[10-11],本文以CART树为基本分类器,在基本分类器生成过程中,穷举以地块数、地块大小和坐标数目为节点的阈值,得到以(大于和小于)该属性值两个分支的最大熵,并以此为依据得到新的节点,直至所有样本被分配至唯一叶节点,完成本次一次基本决策树的生成,然后将每次迭代计算过程得到弱分类器加权求和,得到一个以梯度方向损失函数减少为优化策略的强分类器,最终实现三分类决策树的生成。梯度提升决策树计算原理如图6。

图6 梯度提升决策树计算原理图Fig.6 Calculation principle diagram of gradient boosting decision tree

本文采用优化后的梯度提升学习算法—XGBoost,该算法是一个优化的分布式梯度提升算法库,其特点是针对传统的梯度增强算法,在并行计算、防止过拟合、提高学习率等方面进行了优化。XGBoost是对梯度提升算法的改进,求解损失函数极值时使用了牛顿法,将损失函数泰勒展开到二阶,另外损失函数中加入了正则化项。训练时的目标函数由两部分构成,第一部分为梯度提升算法损失,第二部分为正则化项。损失函数定义为:

其中:n为训练函数样本数,K为树的总个数,fk表示第K颗树,l是对单个样本的损失,假设它为凸函数,为模型对训练样本的预测值,为训练样本的真实标签值。正则化项定义了模型的复杂程度:

其中:λ为设置的参数,ω为决策树所有叶子节点值形成的向量,T为叶子节点数。

经1000次迭代计算后生成的决策树结构如图7。

图7 多场景下地理空间分析任务智能调度决策树Fig.7 Intelligent scheduling decision tree for geospatial analysis tasks in multiple scenarios

4.2 模型应用

经过对生成决策树模型进行评估,其查准率为87.4%,查全率为82.1%,表2为多场景下地理空间分析任务智能调度体系应用效果采样汇总,图8为在湖北省自然资源政务云平台中“一张图”访问图层统计与图层调用耗时分析。

图8 省市重点访问图层统计与图层调用耗时分析Fig.8 Key access layer statistics and layer call time-consuming analysis of Provincial and municipal

经在湖北省自然资源政务云平台中测试应用,取得如下应用效果:

(1)系统稳定性增强,计算效率显著提升:目前整个平台共有地图服务1099层,其中各地市州地图服务中现状类服务和规划类服务使用频率最高,此两类图层分析服务平均每日使用达到610次,所有图层分析使用平均每日达到1300多次,系统稳定性明显增强,计算资源使用率得到显著提升。

表2 空间智能分析结果采样表Table 2 Sampling table of spatial intelligent analysis results

(2)空间分析速度得到极大提升:在自然资源行政审批的空间审查工作中,单个图层的平均分析时长由原来的17.3秒缩短至3.5秒以下;针对面积、地块数及界址点数目相差很大的各种项目,审批分析耗时由原来的几十秒上百秒缩短至10秒左右,空间分析速度得到了极大的提升。

5 结语

本文通过归纳业务审查和审批涉及的空间分析方法,探索采用集成学习技术对业务审批样本数据进行监督学习,形成梯度增强决策树模型,自动将业务根据复杂度进行分类,进而快速选择相应的空间分析方法,并使用新生成样本数据持续学习完善模型,提升业务审查和审批速度。

(1)针对湖北全省域自然资源特性多样、项目地理特征复杂及利用不均衡等特点,结合审批日志自动抽取与人工标注方式,建立了集页面分析、地理处理服务及要素分析中间件一体的湖北省地理空间信息分析样本库,含训练样本6456个、测试样本3228个,为多地块、多图层、多界址点的地理空间要素精准适配分析与应用提供统计学依据。

(2)研究了基于梯度增强决策树集成学习技术的地理空间信息分析任务分类方法,建立了梯度增强决策分类树模型,通过对样本训练学习,实现了项目空间特征的自动分类识别与最佳分析方案的精准匹配,空间分析审查平均耗时大大缩短,计算资源利用率和业务审批效率提升显著。

猜你喜欢

中间件图层决策树
为《飞舞的空竹龙》加动感
决策树和随机森林方法在管理决策中的应用
RFID中间件技术及其应用研究
解密照片合成利器图层混合模式
基于Android 平台的OSGi 架构中间件的研究与应用
基于决策树的出租车乘客出行目的识别
基于模糊关联规则和决策树的图像自动标注
基于肺癌CT的决策树模型在肺癌诊断中的应用
中间件在高速公路领域的应用
一种支持智能环境构建的中间件