APP下载

特定空间对象同位模式挖掘算法研究

2015-03-16周剑云

电脑知识与技术 2015年4期

摘要:空间同位模式挖掘研究主要以区域划分为基础,考虑对象实例两两之间的距离关系,这样挖掘出的同位模式是双向对称的。但区域的划分起止位置不确定,可能出现由于区域划分的不一致而得到不一样的空间同位模式结果。该文提出以指定对象为核心的空间同位模式挖掘,这样不必担心区域划分的起止位置对挖掘结果的影响,而且更能有针对性地发现特定空间对象与其它哪些对象具有空间同位关系。

关键词:空间数据库;空间数据挖掘;空间同位模式

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)04-0082-04

Abstract: The research concerning over Spatial data mining based mainly on partitioning of areas, in regard to the spatial distance between each object instance, Co-location pattern obtained will be symmetric. Yet the position where the partition begins and ends is indeterminate, therefore the Spatial Co-location pattern obtained could vary due to different partition. This paper proposed a specified object centered Spatial data mining method in case of inaccuracy caused by partitioning position, moreover, the finding of Spatial Co-location pattern between specific spatial object and the others can get more well-focused.

Key words: spatial database; spatial data mining; spatial Co-location pattern

空间数据挖掘是从大量空间数据中发现潜在知识的过程。目前,空间数据挖掘技术主要包括空间分类、空间聚类、空间离群挖掘、空间关联规则以及空间同位模式挖掘。其中空间同位主要关注空间对象之间在一定区域内同时出现的关系,这些空间对象的实例在地理空间上接近并且频繁出现,期间蕴涵了某些关联关系。因此,空间同位模式的研究对于发现在地理位置上具有依存性、关联性的对象有着重要的帮助和意义,例如用于挖掘共生植被分布情况、城市公共资源布局决策等。

空间同位模式挖掘研究主要以区域划分为基础,考虑对象实例两两之间的距离关系,这样挖掘出的同位模式是双向对称的。但区域的划分起止位置不确定,可能出现由于区域划分的不一致而得到不一样的空间同位模式结果,如Meter Celick的分区模式挖掘算法[1],从四个四边形中得到的频繁同位模式,与它们中间的重叠区域得到的同位模式不一样。该文提出以指定关注对象为中心的同位模式挖掘,也即原来我们挖掘的是“哪些对象具有同位关系”,而现在我们考虑的是“这个对象与哪些对象具有同位关系”。这样的挖掘结果更具针对性和实用性,对决策支持或是空间布局等更具指导性。

1 相关概念

4 实验及评价

算法用模拟数据进行实验,JAVA编写程序,通过在程序入口和出口处使用函数 System.currentTimeMillis() 计算时间差,从而获得程序运行所需时间开销。

4.1 算法时间消耗

随着最小参与度阈值的增加,k阶频繁同位模式减小,从而k+1阶候选表实例数也快速减少,算法时间开销也随之减小。

4.2 对象数对算法运行时间的影响

以文献1中的Zonal Co-location挖掘算法和本文的SDCLM算法进行对比实验,在同一距离阈值要求下,SDCLM算法可能会得到更多的频繁同位模式,因为SDCLM算法考虑的是某个特定对象周围的同位模式,而Zonal Co-location算法考虑的是两两对象互为同位的模式。

当距离阈值增大到一个较大范围时,两个算法得到频繁同位模式集基本一致,因为距离阈值范围的增大也就意味着包容的对象实例数增多,则对象实例的单向同位和互为同位就趋于平衡,因而频繁模式数差异不大。

5 小结

本文提出挖掘特定对象的空间同位模式概念,旨在发现更具针对性的空间同位模式,寻找与该对象在同一区域范围内频繁出现的对象。为此,对传统空间同位模式的定义进行了相应调整,定义了一组相匹配的概念,并给出了挖掘算法及实验分析。接下来还将考虑对空间同位模式挖掘的效率问题以及有效性问题进行研究。

参考文献:

[1] Mete Celik,James M.Kanf,Shashi Shekhar. Zonal Co-location Pattern Discovery with Dynamic Parameters[C].Proceedingof the 7th IEEE International Conference on Data Mining(ICDM 2007).2007

[2] 周剑云,王丽珍,杨增芳.基于加权欧氏距离的空间Co-location模式挖掘算法研究[J].计算机科学,2014,41(6A):425-428.

[3] 高世健,王丽珍等.基于凝聚层次聚类的co_location模式挖掘[J].广西师范大学学报:自然科学版,2011(29):167-173.

[4] Yoo Jin Soung,Shekhar S,Celik M.A Join-less Approach for Co-location Pattern Mining: A Summary of Results[C].Proceedings of the IEEE International Conference on Data Mining (ICDM),Houston,USA,2005.

[5] Yoo Jin Soung,Shekhar S.A partial join approach for mining co-location patterns[A] Foser D P,ruz IF,Ronthaler M ,eds.12thACM International Workshop on Geographic Information Systems[C]. Washington,DC,USA,2004:241-249.