APP下载

基于多维数据模型的城市建设用地数据挖掘研究——以北京市为例

2012-12-28丽,魏科,颜涯,孔彦,冯

地理与地理信息科学 2012年6期
关键词:数据仓库数据模型空间数据

关 丽,魏 科,颜 涯,孔 令 彦,冯 学 兵

(1.北京市测绘设计研究院,北京 100038;2.北京市规划委员会,北京 100045)

基于多维数据模型的城市建设用地数据挖掘研究
——以北京市为例

关 丽1,魏 科2,颜 涯2,孔 令 彦1,冯 学 兵1

(1.北京市测绘设计研究院,北京 100038;2.北京市规划委员会,北京 100045)

针对城市建设用地数据的多源异构、多维、复杂度高等特点,探讨基于空间数据仓库理论挖掘城市建设用地潜在的空间信息,提出了面向城市建设用地利用的多维数据模型,并基于该模型构建了以城市建设用地利用为主题的空间数据仓库,实现空间数据挖掘过程。以北京市中心城区的建设用地扩展为例,研究了城市建设用地的空间格局及其演变特征,为城市建设用地管理提供决策依据,同时也为城市建设用地数据的集成、分析和高层决策支持提供了方法论。

城市建设用地;多维数据模型;空间数据仓库;数据挖掘

城市建设用地是城市发展的动力和载体,也是公共利益和可持续发展的关键保障。城市建设用地的管理是一个复杂的系统控制与决策过程,它必须充分利用现有的大量历史业务数据和空间数据,挖掘信息潜力,提供政府决策。空间数据挖掘(Spatial Data Mining,SDM)是挖掘信息潜力有效解决方案之一[1-3]。其中,空间数据仓库的数据集成能力以及对复杂数据分析、高层决策的支持为城市建设用地管理提供了方法论。通过城市建设用地的数据挖掘能够实现对城市建设用地对象的空间分析,用以支持城市建设用地管理业务控制、决策分析及策略制定。本文基于空间数据仓库的空间聚类和统计挖掘方法对北京市城市建设用地的空间格局及其演变特征进行了研究,探讨实现空间数据挖掘多维分析的方法,提出了适用于城市建设用地管理的多维数据模型。通过对北京市城市建设用地空间格局的时空定量分析,为城市建设和规划提供科学决策依据,引导城市土地空间合理、有序发展。

1 多维数据模型的构建

多维数据模型是空间数据仓库进行空间在线分析处理 (Spatial Online Analysis Processing,SOLAP)或多维分析的基础[4-6],是空间数据仓库应用的重要手段。基于城市建设用地的多维数据模型包括7个维度:建设用地类型维、建筑高度维、区域维、面积维、方位维、环线方位维、时间维。其中,区域维为空间维,其他均为非空间维。事实表中包括3个度量:容积率、建筑量为数值度量,建设用地分布图为空间度量。空间度量是指向空间对象集合的一组指针,进行空间OLAP操作时,需要计算空间对象的合并、叠加和连接等;数值度量涉及分布式聚集(如总数、总量或最大值等)、代数聚集(如平均值、标准差等),最终形成的多维数据模型如图1所示。

图1 城市建设用地利用的多维数据模型Fig.1 Multi-dimensional data models of urban construction land use

为了从不同的角度层次观察数据,在每一维上定义了概念层次[7];概念层次定义了从低到高的一系列映射,允许数据在不同的抽象层次上进行操作。非空间维的概念分层是对非空间维的细节描述,按维的实际意义分层。空间维可按地理要素的几何特征进行概念分层,在城市建设用地多维数据模型中,其概念层次为:

2 空间数据仓库的建立

2.1 空间数据仓库的建立流程

空间数据仓库的架构(图2)由数据获取、空间数据仓库构建和客户端应用3部分构成。1)数据获取:数据源是空间数据仓库的基础,位于空间数据仓库构架的最底层,由空间数据和非空间数据构成[8,9]。按照元数据驱动机制,异质异构的非空间数据通过ETL(Extraction Transformation Loading)技术,实现数据提取、转换、转载等操作,完成按照主题管理数据,存储于空间数据仓库中,这也是构建数据仓库的重要环节。从数据源中抽取出所需要的数据,经过清洗后,最终按照预先定义好的多维数据模型将数据加载到空间数据仓库中,完成数据从数据源向目标空间数据仓库转化的过程。异构的空间数据经过数据预处理后,通过SDE存入空间数据库。非空间数据仓库和空间数据库之间通过空间数据的ID号建立连接,方便空间OLAP服务同时处理非空间和空间数据。2)空间数据仓库构建:在空间数据仓库中,搭建多个面向主题的空间数据集市和空间OLAP服务器。空间数据集市是根据不同的功能划分空间数据仓库的子集[10,11],而空间OLAP服务器协助用户为分析查询报表和数据挖掘进行数据准备。3)客户端应用:用户访问空间数据仓库中数据的工具,并利用空间数据挖掘、空间OLAP分析、报表分析和可视化等技术进行数据分析,最终实现向用户提供决策级空间数据服务。

图2 空间数据仓库的架构Fig.2 Architecture of spatial data warehouse

2.2 数据集的划分

根据城市建设用地空间数据仓库的特点与主题,将其划分为4个数据集:建设用地扩展数据集、建筑高度数据集、建设用地利用强度数据集、空间数据集。每个数据集市需要的指标都可在多维数据模型的支持下从空间数据仓库中挖掘获得。

(1)建设用地扩展数据集。用地扩展速度(Mue)和扩展强度指数(Iue)可用于分析和描述各方位城市建成区用地的扩展状态,比较不同时段各研究单元建成区面积扩展的强弱、快慢和扩展趋势。

式中:Mue为城市用地扩展速度,Iue为城市用地扩展强度指数,ΔUij为j时间段第i个研究单元(如方位或某格网)建成区扩展数量,Δtj为j时间段的时间跨度,ULAij为j时间段初期第i个单元建成区总面积,TLAij为j时间段第i个单元土地总面积。

(2)建筑高度数据集。根据建筑的楼层数*100的数量,按照方位、环路、区县等范围比较研究低层(3层及以下)、多层(3~6层)、高层(7层以上)建筑的分布变化。

(3)建设用地利用强度数据集。通过容积率、建筑量在时间的变化率上,按照方位、环路、区县、规划界研究建设用地利用强度的变化规律。

(4)空间数据集。主要为其他数据集提供空间数据支持。

2.3 空间数据挖掘方法的选择

本项目从实际出发选择k-mean空间聚类方法和点分布的空间统计方法,空间数据挖掘步骤如图3所示。

图3 空间数据挖掘步骤Fig.3 Steps of spatial data mining

3 空间数据挖掘成果分析与评价

以北京市中心城区的建设用地扩展为例,研究城市建设用地的空间格局及其演变特征,对建设用地的空间扩展和发展特征完成数据挖掘过程,并对结果进行评价。建设用地扩展主题中利用的数据有面积维(包括建成区面积和土地总面积)、建设用地类型维(居住用地)、方位维(全部方位)、时间维(十年间隔)。

3.1 时间角度的建设用地扩展分析

利用用地扩展速度(Mue)和扩展强度指数(Iue)的计算方法,对中心城的建设用地扩展情况从时间和空间角度进行分析。城市用地扩展速度表示各城市用地类型在整个研究期内不同阶段用地扩展面积的年增长速率,用以表征各阶段不同类型城市用地扩展的总体规模和趋势;而城市用地扩展强度指的是用各空间单元的土地面积对其年均扩展速度进行标准化处理,使不同时期城市用地扩展的速度具有可比性。

根据数据仓库的建设用地扩展数据集中的数据,按照点分布的空间统计方法,计算出1934-2009年北京中心城区城市建成区面积,利用GIS模块制作完成建成区的面积扩展图(图4、图5)。

图4 北京中心城区建成区面积变化Fig.4 Area change of built-up range in Beijing central city

图5 北京中心城区建设用地扩展速度与扩展强度曲线Fig.5 Expansion speed and extension strength curves of urban construction land in Beijing central city

从数据挖掘的结果可以看出,北京中心城区建设用地面积在不断扩张。根据建设用地面积和速度、强度的阶段性差异,可以分为以下阶段:1)20世纪80年代前缓慢增长阶段。在民国时期与新中国成立初期,北京作为一个消费性城市,城市增长速度缓慢;之后,北京重新确立为全国政治中心的地位,并实行“变消费性城市为生产性城市”的城市建设方针,城市扩张进程相对加快。2)80年代至90年代中期快速增长阶段。改革开放后,受市场经济、亚运场馆建设、二三四环路相继建成等影响,城市快速发展。3)90年代中期至21世纪初中期高速增长阶段。受全球经济一体化、大北京城市建设规划、2008年奥运会场馆建设、轨道交通建设的影响,北京城市进入有史以来最快的扩张阶段。4)21世纪缓慢增长阶段。中心城进入调整优化的阶段,中心城扩张速度放缓。

3.2 空间角度的建设用地扩展分析

中心城建设用地扩展的各向异性分析通过各方位的面积增长、扩展速度和扩展强度的差异,揭示城市用地空间扩展方向与规模的差异。本研究统计了以天安门为中心,16个方位的建设用地扩展强度指标(%),建设用地扩展强度如图6所示,四大方向的建设用地扩展强度堆积曲线如图7所示。

从结果可以看出,不同阶段北京城市的发展方向如下:1934-1956年,城区范围突破了内外城墙,扩张方向主要在西部;1956-1965年,城市空间主要扩张方向仍然在西部与西北部,南边的扩张主要是由于将南苑机场也纳入了城市建设用地;1956-1975年,城市空间主要扩张方向呈“三叶草”型,主要沿长安街东西方向以及城市西北部扩张;1975-2003年,城市空间主要在北部以较高强度扩展;2003-2007年,西北面由于天通苑等大型社区建设扩展强度较大;2007-2009年,东面和东北面由于靠近通州和望京地区的发展,扩展强度较大。

总之,北京城市扩展模式可概括为1975年以前,沿扩展翼缓慢扩展;1975-2003年,呈现出高强度圈层渐进式扩展,发展方向偏北;2003年后扩展强度放缓,主要由一些重点地区带动了西北和东北方向的发展,就目前来看,南部扩展远不如北部。

4 结语

本文面向城市建设用地利用主题建立了多维数据模型,并以该模型为基础构建了空间数据仓库,为城市建设用地的集成、分析和决策提供了方法。对建设用地主题的事实、维度、维层次及维层次关系进行识别。针对时空维的复杂度,以星型数据模型结构构建城市建设用地多维数据仓库。本文以北京市城市建设用地空间格局为主题,构建北京市城市建设用地空间数据仓库,提供北京市城市建设用地的空间分布模型,为城市建设用地管理提供决策依据。

[1]AH MAD I,AZHAR S.Development of a decision support system using data warehousing to assist builders developers in site selection[J].Automation in Construction,2004(13):525-542.

[2]石磊,石云.空间数据仓库中维和度量的建模[J].计算机应用,2000,20(10):19-20.

[3]李一军,樊博.空间 OLAP技术研究[J].管理科学学报,2003,6(4):9-16.

[4]DATTA A,THOMAS H.The cube data model:A conceptual model and algebra for on 1ine analytical processing in data warehouses[J].Decision Support Systems,1999,27:289-301.

[5]邹逸江.多维空间分析的关键技术——空间数据立方体[J].地理与地理信息科学,2006,22(1):12-16.

[6]STEFANOVIC N,HAN J W.Object-based selective materialization for efficient implementation of spatial datacubes[J].IEEE Transactions on Knowledge Data Engineering,2000,12(6):938-958.

[7]HAN J W.范明,孟小峰(译).数据挖掘:概念与技术[M].北京:机械工业出版社,2001.

[8]陈崇成,肖桂荣,孙飒梅,等.空间决策支持系统的集成体系结构及其实现途径[J].计算机工程与应用,2001,37(15):55-57.

[9]迟忠先,李艳红,张春涛,等.OLAP核心技术——数据立方体的研究现状与展望[J].计算机工程,2002,28(10):316-318.

[10]王晓明,高勇.面向水环境管理的空间数据仓库构建[J].计算机应用研究,2005(11):165-167.

[11]余达太,蓝荣钦,张世涛,等.空间数据挖掘的方法和实施[J].测绘学院学报,2003,20(2):132-134.

Research on Data Mining of Urban Construction Land Based on Multidimensional Data Model:A Case Study of Beijing

GUAN Li1,WEI Ke2,YAN Ya2,KONG Ling-yan1,FENG Xue-bing1
(1.BeijingInstituteofSurveyingandMapping,Beijing100038;2.BeijingMunicipalCommissionofUrbanPlanning,Beijing100045,China)

For the characteristics of urban construction land data,such as multi-source,heterogeneous,multi-dimensional and high complexity,to mine the potential spatial information of urban construction land based on spatial data warehouse theory is discussed in this paper.Multi-dimensional data model-oriented urban construction land use is put forward and designed to build spatial data warehouses in the theme of urban construction land use and to achieve spatial data mining process.Taking construction land in Beijing central city for example,the spatial structure and evolution features of urban construction land are researched to provide methodology and basis for management,integration,analysis,and high-level decision-making of urban construction land.

urban construction land;multidimensional data model;spatial data warehouse;data mining

P 208;F293.2

A

1672-0504(2012)06-0049-04

2012-03- 06;

2012-06-01

关丽(1980-),女,博士,从事空间数据组织理论与应用方法研究,发表论文30余篇。E-mail:binger02600@163.com

猜你喜欢

数据仓库数据模型空间数据
GIS空间数据与地图制图融合技术
基于数据仓库的住房城乡建设信息系统整合研究
面板数据模型截面相关检验方法综述
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
元数据驱动的多中心空间数据同步方法研究
财政支出效率与产业结构:要素积累与流动——基于DEA 和省级面板数据模型的实证研究
基于数据仓库的数据分析探索与实践
基于分位数回归的电力负荷特性预测面板数据模型
基于文件系统的分布式海量空间数据高效存储与组织研究