APP下载

空间数据挖掘方法浅析

2014-08-15韩祚鹏范占永黔南州水利水电勘测设计研究院

河南水利与南水北调 2014年14期
关键词:空间数据数据挖掘聚类

□ 韩祚鹏 □范占永(黔南州水利水电勘测设计研究院)

0 概述

数据挖掘由很多成分组合而成,而空间数据挖掘的技术只是这个家庭当中的一个成员,空间数据的挖掘实际上以空间数据库作为主要的支柱,在进行多种技术的结合。在海量的数据空间当中进行知识的挖掘与筛选,对选择的知识通过专业的手段进行空间关系或者是别的意识的提取,并能够分析出其内在的信息,包括数据以外的真实世界、其与外界的具体联系以及以后的发展方向等等,从而能够更加方便的进行技术的决策以及经营的决策。

1 空间数据库中的知识

由于GIS以及遥感技术的广泛运用,能够在空间数据当中获取的知识主要包括以下几个方面的内容:

1.1 普遍的几何知识

普遍的集合知识,实际上就是人们普遍认知的知识,包括该目标的具体数量、目标的大小、目标的具体形状以及目标的主要特征等方面的内容,举个简单的例子:点状的目标的具体位置,这个目标的大小、其长度的具体值、其周长的值、面积的大小、几何的中心等等,都能够通过计算或者是总结出GIS当中空间目标的具体的几何特点,还包含了其特征量的最大数值、最小数值、平均值、以及特征量的特征图都能够得出。

1.2 空间分布规律

空间的分布规律实际上指的的就是具体的目标在地里范围之内的如垂直的方向、水平方向包括垂直方向与水平方向的分布的概率等等。垂直分布也就是空间的目标顺着空间目标的调和的状况。

1.3 空间关联规则

空间关联,顾名思义,指的就是空间目标相互之间的联系,例如临近关系、共同生长的关系、相互包含的关系等等,例如:道路与河流是相互连接的,而不同的国家之间就是临近的关系。

1.4 空间分类(聚类)规则

空间分类的规则指的就是按照目标的具体空间情况或者是非空间的特点对各自的类型划分的一个原则,这种规则能够用在GIS的空间概括以及空间组合当中。

1.5 空间特征规则

空间特点的规则指的就是某一类的或者多类别的空间的目标的结合特征与属性之间的特征,同时也是对他们的共性的总价,在空间特征当中,通常的几何知识空间特征当中的组成本部分,之所以将其分离出来,是因为其具有非常关键的作用,尤其是在遥感影像当中的作用更为关键。

1.6 空间区分规则

空间的区分规则特征也是比较容易理解的,指的就是在两种或者两种以上的目标的几何属性之间的特征,需要注意的是,空间的区分规则只是对一个目标的描述,其与空间分类的规则还是具有一定的区别的,分类的规则对于目标的划分更加准确,精度也属于比较高的,为了保证分类的准确程度,通常都是在比较低的层次进行分类的处理,但是区分规则的不同在于它是对已经了解对象的比较,通常情况下,是在比较高的层次上进行的描述。

1.7 空间演化规则

空间演化的规则实际上就是空间的变化的规律,主要包括了空间的几何过滤、属性特征的规律,其变化的规律是会随着时间的变化而发生改变的。

1.8 面向对象的知识

2 空间数据挖掘的方法

空间数据挖掘就是对于隐含的信息的提取,以及其空间的联系等等,最终了解出其具有一定作用的特征以及模式、方式以及技能。常用的空间数据挖掘方法主要有:

2.1 基于概率论的方法

基于概率论的方法实际上就是一种利用与计算出非确定性的特征的概率来获取空间信息的方法,在此过程当中所了解到的信息大多数情况下都被表达成为在特定情况下的某一种具体的假设为真实条件的概率,通过对于误差矩阵的分析来进行遥感的区分的时候,能够利用这样的条件的概率当做是背景的知识。

2.2 空间分析方法

空间的分析方法是一种综合的分析方法,其中主要包含了数据的分析与处理、缓冲区域的分析、距离的分析、地形的分析与总结等等分析相互结合的一种分析的方法,这种方法能够更加便捷而又准确的发现目标在空间范围内的链接的情况,还能够得出目标之间的最短距离,或是最优知识。

2.3 统计分析方法

统计的分析方式指的就是借助于空间对象的特有信息或者是非确定性的信息,进行的一系列的统计与分析,然后对分析结果进行合理的评估,并能够实现空间测试的功能。

2.4 归纳学习方法

归纳的学习方式,顾名思义,指的就是在特定的指示状况下,对于数据的总结以及分析的一种方式,在空间的数据库当中通过搜索与挖掘的方式,了解到常用的规则以及模式的方式,在实际的归纳当中,包含多种多样的算数方法,例如:决策数的计算方式以及基于属性特征的归纳方式等等。

2.5 聚类分析方法

指的就是根据物体的基本特征如形状、大小、体积等等,然后对该物体进行的聚类或者分析,进而能够归纳出数据集的空间分布的状况以及模式的具体方式等等,目前,较为常用的聚类方式主要包括K-mean,K-medoids以及集合关系的亲近联系以及公共特性的基本算术方式等等。

2.6 神经网络方法

指的就是利用较多的神经元组合而成的网路系统,最终能够满足独自使用的非线性的动态系统,并能够满足具备一定的分布存储的能力以及事物的联系的能力,并能够实现较大规模的处理、独立学习、独自组织等等方面能力的一种方式,在空间数据挖掘当中能够用来实现分裂以及聚类的相关信息的以及特点的挖掘处理。

2.7 遗传算法

遗传算法实际上并不是一种真实的算术方法,其指的就是某种模拟的生物进化阶段的算术方式,能够实现问题的空间数据的搜索,并能在整个的搜索阶段实现空间信息的自动获取以及数据整理的功能,还能够在搜索的过程进行适当的控制,并对存在的问题进行优化处理等等,因此,在空间数据的挖掘过程当中发现的诸多困扰,都能够借助于遗传的算法来解决,例如:空间数据挖掘比较难处理的分类的问题、聚类的问题、预测的问题等等都能够得到很好的解决。

3 有待研究的问题

尽管在数据挖掘方面取得了一定的成就,但是还是有一些值得思考与解决的地方,下面就我国数据挖掘技术的主要问题进行了列举说明。

3.1 数据访问的效率和可伸缩性

由于空间数据具有复杂程度高,数据信息量大的特点,使得计算的发放更加繁琐,也给搜索带来一定的阻力,怎样有效地进行不重要信息的去除,同时获取到有效地信息,使得问题发生的可能性不断较低,这一系列的问题都给数据挖掘造成了巨大的挑战。

3.2 对当前一些GIS软件缺乏时间属性和静态存储的改进

由于数据挖掘的局限性,使得数据的挖掘在应用方面遇到了很大的难题,尤其表现为程序方面的时序关系,这也就导致了静态的数据存储在极大影响了数据挖掘的使用,由于图层的计算模式的却别,不一样的尺度空间的割裂,使得空间数据挖掘的设置阶段面临着重要挑战,空间实体所依赖的信息比较复杂,不仅包括了标识码,还包含了其他的一系列的信息,这就造成了一维的联系方式损失了非常多的联系资源,使得多维与隐含的内在关系缺乏真实性,也就给计算造成了一定的难度,使得工作的效率无法提高。

3.3 发现模式的精炼

在空间数据的挖掘技术方面,尤其关键的分析与运用方向主要包括:在网络环境当中的数据挖掘方式、非确定性状况下数据挖掘的方式、分布状况下的数据挖掘方式等等。

4 小结

空间数据的挖掘技术还有许多需要不断深入的地方,通过本文的叙述,不难了解到,在未来数据挖掘技术将逐渐迈向智能化、网络化的发展方向,空间数据挖掘的分析方法和应用结果,为全球变化和区域可持续发展提供有力的分析工具,将会更好的服务社会。

[1]李德仁,史文中,等.论空间数据挖掘和知识发现[J].武汉大学学报:信息科学版,2001,26(6).

[2]周海燕,王家耀,等.空间数据挖掘技术及其应用[J].测绘通报,2002(2).

[3]毛克彪.空间数据挖掘技术方法及应用[J].遥感技术与应用,2002,17(4).

猜你喜欢

空间数据数据挖掘聚类
探讨人工智能与数据挖掘发展趋势
基于K-means聚类的车-地无线通信场强研究
基于并行计算的大数据挖掘在电网中的应用
基于高斯混合聚类的阵列干涉SAR三维成像
元数据驱动的多中心空间数据同步方法研究
一种基于Hadoop的大数据挖掘云服务及应用
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例
基于GPGPU的离散数据挖掘研究
基于文件系统的分布式海量空间数据高效存储与组织研究