APP下载

基于GIS的多源地理空间信息提取方法

2021-07-28李飞强张信超

北京测绘 2021年7期
关键词:数据表空间信息决策树

李飞强 张信超

(浙江有色勘测规划设计有限公司, 浙江 绍兴 312000)

0 引言

地理信息系统(Geographic Information Systems,GIS),是一门空间信息分析技术[1]。通过计算机硬件、软件系统的支持,能够完成地球整个或部分表层(包括大气层)空间中,有关地理分布数据的采集、储存、管理、处理、分析、显示和描述,为地理研究和地理决策提供服务[2]。GIS技术在有效地管理具有空间属性的各种资源环境信息的同时,能够快速和重复的完成多源地理资源管理和实际应用的分析测试,使其更利于对决策的制定和科学地完成政策的标准评价,还能够监测多阶段的资源环境状况及分析及比较动态变化,有效、快速完成数据收集、空间分析和决策的所有信息,并将所有信息汇集成一个共同的信息流,极大幅度的提高工作效率。决策树作为GIS技术中一种新型的数据分类预测算法,可以发现数据库数据的潜在的价值信息知识,是能够从一组无规律、无顺序的事例中推理出表达决策树的分类规则,简洁又高效。

多源地理空间信息是地理信息系统的基础,可以通过图形、图像、文字、表格或者数字等多种方式表达。多源地理空间信息作为GIS作用的对象,是GIS技术所表达的现实世界通过模型抽象的实质性内容[3-4]。但是越来越多的人研究和介入GIS技术,建立了具备行业特点的符合规范的独立体系,导致各个行业均积累了海量的、不同形式的、不同获取手段的地理空间数据,由不同的部门收集和维护,并且每个部门又根据不同的需求选取不同的表达方式,使地理空间信息数据出现各种差异和冲突的现象[5]。

因此,为了使地理空间信息数据重复采集的状况减少,及现有的多源地理空间信息数据资源能够被充分利用,本文提出基于GIS技术的多源地理空间信息提取方法,有效处理以上问题。

1 基于GIS技术的多源地理空间信息提取

1.1 多源地理空间信息数据目录节点的设计与呈现

为了更好地完成多源地理空间信息数据的查找,需要设计多源地理空间信息数据的目录结构树节点。分别为数据表节点、非数据节点、矢量数据集节点和栅格数据集节点、文件数据节点、矢量数据层节点和栅格数据层节点,其作用依次分别是:与存储在元数据表中的记录其他节点数据相关信息的特定数据表相对应;没有和具体的数据关联,创建的目的仅为搭建数据目录结构;与数据库中的相关数据集相对应;与包括了空间信息数据与非空间信息数据的非存放在数据库中的数据相对应[6-7];分别与数据库中相应数据集下面的数据层相对应。设计的多源地理空间信息数据目录节点用图1描述。

图1 设计的多源地理空间信息数据目录节点

多源地理空间信息数据目录节点设计完成后,为实现各个节点信息能够存储在数据表中,需要通过数据库技术的数据结构来建立索引实现;为了获取向节点对象赋值的对应节点信息,采用面向对象的编程技术和基于GIS技术与文件读取技术,完成相应的数据的获取[8-9]。多源地理空间信息数据表与数据节点对象的结构设计用表1描述。

表1 多源地理空间信息数据表与数据节点对象结构设计

设计的多源地理空间信息数据目录节点,是一个数据组织工具,并具备灵活好、适应性强等优点。如果用户想要实现各类型数据的整合,可以通过自行建立的相应数据节点与对应的数据完成组织和关联,根据业务或者其他的数据组织方式有效管理各类型的数据来实现目标[10]。并且对数据节点对象增加了便于各类数据节点操作的功能,例如添加、删除、复制、剪切、刷新等,使后台数据库能够根据前台的操作同时完成修改和调整,并实时呈现。

需要利用相应的组件完成不同类型数据的解译与可视化,使多源地理空间信息数据被充分利用,完成其价值体现[11]。创建的多源地理空间信息数据目录结构只是一个框架,如果无法读取与分析数据,数据目录结构只是一个框架,没有使用价值。为实现能够在同一个平台上读取多源地理空间信息数据,向一个开发环境中融合所有相关的组件,保证各种组件之间的连贯调配和使用[12]。通过模块的建立,使不同的数据类型都与各自的模块相对应。并且在展示某类数据时,通过对此类数据的模块调用后,利用其相对应的可视化窗口呈现。在各组件的基础上完成归纳分类并形成模块后,完成模块调用是多源地理空间信息数据的读取思路。多源地理空间信息数据读取思路框架用图2描述。

图2 多源地理空间信息数据读取的思路框架

1.2 多源地理空间信息提取

利用ArcGIS对读取到的信息数据展开预处理,提取包括各个波段的灰度值、物理小区标识(Physical Cell Identifier,PCI)、归一化差分植被指数(Normalized Difference Vegetation Index,NDVI)、数字高程模型(Digital Elevation Model,DEM)、地质、地貌、土壤信息样本数据后,用SPSS19.0对其分析,并建立决策树获取分类规则,向遥感图像处理平台(The Environment for Visualizing Images,ENVI)导入分类规则,完成遥感影像分类[13],多源地理空间信息数据预处理流程用图3描述。

图3 多源地理空间信息数据预处理流程

采用QUEST(quick unbiased efficient statistical tree)决策树算法完成多源地理空间信息提取。QUEST决策树是一种较新的二叉树生长算法,全称为快速的、无偏的、高效的统计树。QUEST在具体分割节点的过程中,具备2个明显特点,分别是能够单独考虑分割变量的选择和分割点选择。这种单变量的分割在变量的选择上几乎是不存在偏差[14]。通过建立光谱数据决策树,集光谱数据、遥感图像处理软件(PCI)、地质等辅助数据于一体的多源数据地理空间信息决策树,获取决策树对多源数据地理空间信息提取的结果[15],用图4描述。

图4 决策树信息提取结果

2 测试分析

选取面积为148 600 km2、地势自北向南,东西两侧向中部倾斜,属温带季风气候,辖14个地级市的某地区作为研究测试对象。该测试对象地表植物种类繁多,分布相对不均。选取2015年6月10日的美国陆地卫星4~5号专题制图仪所获取的多波段扫描遥感影像实测样本点数据为测试的多源地理空间信息数据。测试对象的遥感图像及土地利用分类体系分别用图5和表2描述。

图5 测试对象的遥感图像

表2 土地利用分类体系

测试从两个方面展开,分别是决策树分类的精度和信息提取的全面性。信息提取的全面性受决策树分类的精度的影响。进行精度评价后,获取精度评价表,表3为光谱数据决策树的土地利用分类矩阵,耕地、林地、草地、水域、居住使用以及未利用的用户精度以及制图精度分别为88.43%、90.36%、63.87%、100%、68.77%以及88.11%,制图精度分别为96.1%、90.1%、87.2%、80.4%、100%以及95.24%。表4为多源数据决策树的土地利用分类矩阵,耕地、林地、草地、水域、居住使用以及未利用的用户精度以及制图精度分别为68.54%、97.82%、92.21%、100%、96.65%以及86.11%,制图精度分别为95.25%、90%、70.4%、96.43%、100%以及95.24%。用图6描述本文方法对于表2中划分的土地种类和面积信息提取的结果。

表3 光谱数据决策树土地利用分类矩阵

表4 多源数据决策树的土地利用分类矩阵

分析表3、表4可以看出:基于多源数据的决策树分类方法,使水域的错分和漏分情况明显降低和减少,使得水域被漏分为居住使用的概率减少。居住使用地的划分在两种决策树方法下划分结果均较为理想,但基于多源数据决策树方法的精度更高,使建设用地被错分为水体的概率明显减少。两种决策树方法对林地的划分都相对较好,制图精度和用户精度均能达到 90.0%以上,由于遥感影像上,林地的色调与其他覆盖类型存在较大差别,便于区分。遥感影像分类的一大难点的是草地和耕地的划分,影响两者划分的原因为该测试地区地表覆盖类型分布破碎的实地情况:成片的草地减少,分布散乱,耕地面积较大,草地、耕地镶嵌分布。出现将部分的草地被漏分到耕地之中的现象,但总体分类精度较高,并不影响实际运用。通过整体数据的体现,说明本文方法能够有效完成土地划分,具备较好的划分精度。

图6为使用本文方法提取到的6种土地类型中的3种进行详细划分信息,提取结果清晰呈现了准确完成划分的3种土地类型的同时,实现类型信息的提取并形成信息分布呈现,说明本文方法能够有效实现多源地理空间信息提取。

图6 三种土地种类详细划分信息提取结果

3 结束语

为了使地理空间信息数据在采集时出现不必要的重复情况大幅度降低,及实现现有的多源地理空间信息数据资源的有效和充分利用,本文提出基于GIS技术的多源地理空间信息提取方法。该方法利用ArcGIS对读取到的信息数据实行预处理,提取包括各个波段的灰度值、PCI、NDVI、DEM、地质、地貌、土壤信息样本数据后,再通过决策树获取多源地理空间信息的提取结果。测试结果表明:该方法能够实现多源地理空间信息的提取,并且分类方法快速简单,使工作效率有效提高。下一步的研究工作是如何利用本文方法实现其他方面具体量化信息的提取。

猜你喜欢

数据表空间信息决策树
结合多层特征及空间信息蒸馏的医学影像分割
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
湖北省新冠肺炎疫情数据表
简述一种基于C4.5的随机决策树集成分类算法设计
共建空间信息走廊 助力“一带一路”
决策树学习的剪枝方法
城市空间导示系统中的空间信息编码研究
决策树在施工项目管理中的应用