基于ARCGIS的人口数据库建立
2014-08-22邵林杉
邵林杉
(贵州省地质矿产勘查开发局 测绘院,贵州 贵阳550018)
0 前言
人口信息是国家的基础信息之一,而我国是一个人口众多的国家,目前人口统计局的工作重点和难点已经逐步聚焦在如何有效管理和利用日益增多的统计数据上。传统的人口管理信息已无法满足信息时代经济快速发展的需要,开发GIS人口资源数据库管理系统势在必行[1]。GIS先进的空间数据库管理和强大的空间数据分析功能,可以轻松地实现多元异构数据的有机融合,快速完成大量统计数据的空间分析,并以地图语言的形式表达最终的分析与计算结果[2]。
1 利用GIS建立人口数据库的优势
将GIS应用于人口信息数据库的优势主要体现在两个方面:①GIS为人口信息提供了数据采集和管理的平台。GIS可以实现空间图形信息与属性信息的一体化管理,建立空间与属性的有机联系,通过地图图元的空间唯一位置将分析模型相关的所有数据有机串联起来。②G1S为人口信息分析模型提供了模型集成平台。GIS具有强大空间数据管理和查询分析功能。同时,这些功能也能方便地与其他人口分析模型进行集成,进而解决各种实际应用,GIS的开放结构也使得系统扩展其他模型非常方便[3]。
2 建立人口数据库的技术方法
人口空间数据库是连接人口统计数据和地理基础数据,并实现两者信息相匹配的复杂数据库系统。从内容上可将其划分为两类:空间数据库和属性数据库。空间数据库是由具有基础性和空间分布特征的矢量和栅格数据组成的图形数据库(内容包括行政区划、土地利用、水系、道路等);属性数据库主要由来源和数据质量相对可靠的社会统计信息构成[4]。
2.1 数据采集阶段进行数据源数据的收集、选取和分类
在这期间要确保数据的准确性、完整性和时效性。可以进行抽样对地区的人口数据进行校正,可以将县总人口数与县域范围内的乡镇总人口数进行比较、将省总人口与省域范围内的县人口总数比较、全国人口与各省总人口数进行比较等[5]。
2.2 数据的预处理阶段
包括矢量化地图,栅格地形图处理,遥感影像处理例如进行遥感影像解译提取出居民地、水系、交通、地形要素,生成点居民地层、面居民地层、面状河流湖泊层、公路层、铁路层、乡镇居民点层;人口普查属性数据表建立例如对地区的人口密度进行地理编码,就是指定人口数据与它的地理位置关联起来,实现人口密度数据与实际空间位置的统一[6]。
2.3 人口统计模型的设计与建立
一般包括三个部分:数据存储、数据管理和数据访问。数据存储,即将数据以某种格式记录在计算内部或外部介质上。其存储方式与数据文件的组织密度相关,关键在于建立记录的逻辑顺序,即确定存储的地址,以便提高存取的速度;另外要确定在数据管理系统中存储和检索数据的基本结构。数据管理,需要管理的数据包括空间几何体数据、非空间属性数据。可采用文件管理与关系数据库管理相结合的数据管理方案,同时使用文件和关系数据库来管理GIS数据。数据的访问一般根据用户的要求进行选择查看并应用。
2.4 数据入库
基于后台关系型数据库管理系统Oracle和数据库引擎ArcSDE,运用GIS特有的空间数据和属性数据管理能力,将相关的窄间数据和属性数据进行匹配、叠加等一系列处理,生成地区人口空间、属性一体化数据库。
图1 空间数据库要素组织图
在服务器端ArcSDE连接到Oracle以后,根据人口统计数据模型,创建各种要素集和要素类,以及关联关系和拓扑关系规则,就可以利用ArcGISDesktop中的功能模块ArcCatalog提供的向导,根据人口统计模型结构,创建要素集、要素、属性表、关联类等;再分别导人空间数据和属性数据,实现人口数据库的数据入库和数据统一管理,并且提供各种常用的城市人口空间信息查询、分析、专题地图和图表制作的功能。
3 以重庆市为例建立人口数据库
3.1 数据的准备
所需数据基本分为两类:空间数据和属性数据。空间数据主要包括重庆市1:10000的行政区划图、城市道路图、地形图、河流等矢量图;还包括带有明显空间位置的地理信息遥感影像数据资料图。属性数据包括人口专题属性数据(主要包括统计年鉴、各街道办事处的人口调研数据等描述性的属性信息)。
3.2 数据的预处理
重庆市人口GIS空间数据主要由地理底图数据、点文件、线文件、面文件组成,其中地理底图数据包含一些最基本的信息,如道路、建筑物等;各城市位置的空间数据形成点文件;省界、市界等的空间数据形成线文件;省、市、流域等的空间数据形成面文件,将这些文件进行合理的保存和安排(如图1)。然后将空间数据和属性数据相连,比如行政区的面文件和其人口数据相连例如,用ID公共字段连接空间信息和属性信息。且在空间信息关联的过程中,有时要关联的扩展属性表不止一个,所以必须充分考虑空间要素与扩展属性信息的相关性,尽量避免产生数据结构的冗余性。比如重庆市的行政区划名称、代码、编号、面积等具有持久性的信息存放在一个文件中。另外,人口数量、受教育程度、性别比例、农业或者非农业人口、民族、信仰等具有变动特征的信息存放在另一个文件中,并通过关键字段相连(如图2)。
4 核心技术以及存在问题
4.1 数据库的设计
如果将与人口有关的属性数据和空间数据都存储在数据库中,则数据量庞大,数据的存储、修改、读取困难,也影响计算机的运行速度,所以要考虑的问题首先是需要考虑哪些与人口相关的因素入库。人口空间分布受多种因素的影响,其中比较主要的几个因素是气候、地貌、交通、水系、土地利用、城市规模等。重庆市人口数据的空间分布研究,最重要的是要研究城市与乡村人口分布的地理规律特征和区域特点,针对不同地区,对影响人口分布的各因素分别进行分析,确定影响人口分布的主导因子。
图2 重庆市人口数据库建立流程图
4.2 数据库的数据存储
面对庞大的数据量如何选择有效的方法对数据进行存储,方便数据的修改和读取也是难题之一。需要建立一个空间索引,建立一个检索模型,通过城市区域坐标建立R树索引——快速检索几何数据管理表。当数据库的客户端调用的时候通过检索行政区划的省—市—区(县)——乡得到需要的数据。
5 结语
Geodatabase作为面向对象的GIS数据模型,将空间数据和属性数据有效地融合起来,对于处理复杂的地理空间对象有极大的优越性。在此基础上建立的人口统计数据模型。以地理空间数据和人口属性数据为主要研究内容,探讨如何更好地将空间地理信息和人口普查信息有效地集成起来,建立面向对象的人口空间数据库,便于人口信息的各种空间检索和分析处理,对人口信息资源进行充分开发与应用,对于加强人口信息管理、科学决策可起到积极作用。存在的不足是可能由于数据量巨大而是操作速度变慢,在以后的学习中还将进行深入研究。
[1]李恒凯,陈优良,李亮.基于GIS的江西省人口信息分析系统开发[J].人民黄河,2011,32(8):88-92.
[2]王均,陈向东.两汉时期人口数据库建设与应用探讨[J].测绘科学,2001,26(3):43-48.
[3]刘艳萍,刘五周.基于ArcGIS的河南省人口资源数据库设计与实现[J].科学时代,2010,21:232-235.
[4]白洁,陈 曦,杨辽,李江宏.梁承东基于GIS的面向对象人口空间数据库设计[J].兰州大学学报,2009,45(4):13-19.
[5]陆伟东.同治以前陕甘回民聚落分布与数据库建设[J].西北民族研究,2012,(4):37-45.
[6]李明玉,黄虎国,金爱芬.GIS的人口信息空间可视化技术在专题地图制作过程中的作用[J].东疆学刊,2007,24(3):102-106.