APP下载

基于ARCGIS的空间统计方法研究

2021-11-25董静张淑美

科学与生活 2021年16期

董静 张淑美

摘要:本文以空间数据模型所提出的空间统计的分类标准为基础,将空间统计方法分为空间点模式分析、面状数据的空间模式分析以及地统计分析,对空间统计方法进行了一一阐述,在对理论进行研究的同时选取其中较为典型的部分方法结合实际在ARCGIS中进行应用。基于ARCGIS进行空间统计方法的研究,能够帮助我们更深入的了解空间统计方法,也便于我们以更为简单、方便的方式去使用这些方法,使其面向的受众更为大众化,普及到社会生产生活的很多方面,从而推动空间统计方法的研究以及空间统计学的发展。

关键词:空间统计学;空间统计方法;ARCGIS

1绪论

空间统计学是近年来的研究热点 , 常出现在地理学、计算机科学、生态学、环境学、生物学等诸多领域中, 影响着社会发展的很多方面。尤其在地学研究中, 应用空间统计学分析方法分析问题更是常态。

GIS技术与空间统计方法的融合使用,在一次次的实验中证明了它的优势,因此,可以预料基于GIS技术的空间统计方法的研究会是未来空间统计学发展的一大趋势。

2空间统计方法

2.1空间点模式分析

在地理信息系统研究中任何一个带有位置属性的对象都可以被抽象为一个空间点特征。这些点特征有的是具体的地理实体,有的是事件发生的地点。因此这种根据点对象的空间位置来分析他们的空间分布模式的方法称为空间点模式。空间点模式分析是空间统计分析的方法之一常应用于流行病学、犯罪学、生态学等领域,有着十分重要的应用价值。空间点模式的分析方法有很多,我们以点对象在空间分布上的聚集性和离散性为基础,将其分为基于密度的方法和基于距离的方法,前者的方法主要为样方分析法和核密度法;而后者的主要方法为最邻近指数法、G-函数、K-函数等方法,其中最常用的是K函数。

2.2面状数据的空间模式

2.2.1空间接近性

对于各面积单元之间的“距离关系”我们用空间接近性来定义,测度空间接近性其实就是利用面积单元之间的距离定义接近性。

2.2.2空间权重矩阵

空间权重矩阵可以对面积单元的空间邻接性进行定量化测度。如果说空间接近性是用来描述不同距离关系下的地理相互作用,那么空间权重矩阵则用来描述面积单元之间的接近性程度。

2.2.3空间自相关

空间自相关分析在一定程度上可以反映空间事物的分布是否具有自相关性,是空间统计中的一种重要方法。在空间统计分析中,通过自相关分析可以直观的分析出现象间的改变是否存在相关性,且分析不同观察对象的同一属性变量,可称之为自相关。空间自相关反映的是一个空间区域单元上的某种地理现象或某一属性值与邻近区域单元上同一现象或属性值的相关程度,是一种检测与量化从多个标定点中取样值变异的空间依赖性的空间统计方法。

空间自相关分析分为全局性和局部性,全局空间自相关分析用于分析整体范围内某一属性间相关程度,但其不能确定演变过程中产生显著影响的集聚簇的位置。局部空间自相关是全局的补充,用于分析局部地区之间某一理现象或某一属性的相关程度。

2.3地统计分析

2.3.1探索性空间数据分析

探索性空间数据分析 ( Exploratory Spatial Data Analysis,ESDA) 是对实验样本不做假设的统计分析方法,让样本数据自己说话,实现对数据的分析。ESDA利用统计学原理和图形图表相结合,通过对事物或现象空间分布格局的描述与可视化,从而发现空间集聚和空间异常,以揭示研究对象之间的空间相互作用机制。ESDA 基于数据驱动的,是一种具有识别功能的空间数据分析方法,注重发现空间数据的分布模式,用来发现隐藏在数据背后的重要信息或规律。

在使用地统计分析时首先使用ESDA工具处理相关数据,然后再更具数据分析结果更准确的选择合适的插值方法和参数设置。

每个ESDA工具都在处理完数据后给出相应的结果视图,如直方图、QQ概率图、趋势分析、voronoi地图、半变异/协方差函数云图、正协方差函数云图等,并在单独的窗口显示出来。

2.3.2确定性插值法

确定性插值法一般是用数学函数进行插值研究区域内部属性的相关性,通常可分为两类:精确性插值方法和非精确性插值方法。顾名思义,前者给出的样点值与实测值相等;后者预测出的样点值一般与实测值不相等,但使用非精确插值法可以使輸出表面较为平缓。精确性插值法包括反距离加权法和径向基函数插值法,而非精确性插值法则包括全局多项式内插法和局部多项式插值法,其中反距离权重插值法是在确定性插值方法中最具代表性的。

2.3.3地统计插值法

克里金插值法是地统计插值法中最为典型的方法,是基于变异函数和结构分析,将被插值的要素看做区域化变量并进行无偏估计且得到最优解。包括普通克里金、简单克里金、通用克里金、概率克里金等。

克里金插值法基于空间结构分析进行估值,在估值前首先考虑属性在地理位置上的变异分布,确定一个范围,然后用该范围内的采样点来估计其他待测点的属性值。

克里金插值方法应用步骤:

①输入采样点数据,并对所选区域进行网格化处理;

②对原始数据进行检验、分析,根据实际情况剔除明显差异点;

③利用ESDA的相应方法对数据进行处理;

④利用变异函数进行计算,便于了解变量的空间结构;

⑤克里金插值估计

3基于ARCGIS的空间统计方法应用

前面三章概述的是空间统计方法的由来以及相关基本理论,为了更好的理解并研究空间统计方法,因此本章主要从上述的空间统计方法中选取较为典型的几种方法,基于ARCGIS10.4对数据进行处理应用。

3.1利用核密度函数分析中国城镇密度分布状况

3.1.1数据来源

数据来源:GaotHR | 中国国家基础地理信息系统数据,CSDN分享

数据内容:中国国界线.shp 中国省界线.shp 中国省市驻点.shp 中国县镇驻点.shp

3.1.2操作方法与步骤

使用核密度分析法,以各城镇内县城驻点为样本点,进而对城镇密度进行分析。

首先在ArcGIS工具箱中找到所需工具,配置所需参数。首先选择要输入的点要素,Population字段表示各要素的population值,而从概念上来说,假设每个点上方均覆盖着一个平滑曲面,而该曲面与下方的平面所围成的空间的体积等于此点的 Population 字段值,因此,在无特殊要求下,Population字段值指定为NONE,不更改,使得每一个要素只计数一次;输出栅格则自选路径;输出像元是指输出的栅格集的像元,可根据需要进行设置,若未进行专门设置,系统一般会根据情况默认设置;此外,其他设置皆可默认选项。同时,还要进行环境配置,参数根据要输出的栅格内图像的范围设定。

3.1.3数据分析

由以上分析结果,能够非常直观的展现出我国城镇的密度分布。如图可知,我国城镇在中部地区分布的更为密集,尤其河北地区,而西北地区、东北地区则分布的较为为稀疏,尤其西藏与宁夏、新疆交界处。这同时也反映了我国地区发展的现状,因此若掌握此数据,可以由此为国家的下一步发展做规划。

3.2基于空间自相关的芝加哥各区人口分布冷热点分析

3.2.1数据来源

数据来源:CSDN

数据内容:芝加哥行政区划.shp  芝加哥人口分布.csv

3 .2.2操作方法与步骤

首先将芝加哥人口分布.csv导入ArcMap并转换成shapefile,然后基于芝加哥行政区划的面要素对其进行属性连接,连接完成即表明芝加哥行政区划的属性表中包含了人口分布数据,此时,通过该图层属性工具中符号系统下数量分级就可以获得芝加哥各区的一个简略的人口密度分布图。

当然,上述只是一种基于面要素所蕴含的字段数值直接表明的分布图,并没有涉及空间之间的相关性。因此,我们还需要更定量的统计各区的人口分布情况,即利用热点分析工具进行处理。

首先对数据进行全局性的统计,用于检验数据的分布模式。打开空间统计工具箱,选择其中的空间自相关(Moran’s I)分析工具,因为是基于芝加哥行政区划的面要素去考虑各区人口的相关性,所以在输入要素类中选择芝加哥行政区划shapefile数据,即airbnb_Chicago 2015;然后在输入字段选择population即可,记住要选择生成报表。分析成功后,可以得到结果报表。报表中,P值是远远小于0.05的,且图示显示为集聚,可知数据在统计上显著的呈现集聚,这是全局分析的结果。接下来探究局部,即研究人口分布的局部上的冷、热点分布。仍在空间统计工具箱中,选择热点分析(Getis-Ord Gi*)。

热点分析参数设置参考自相关分析参数设置,但要注意空间关系概念化下选择反距离加权法。热点分析完成得到输出要素,然后将分布图加以添加各类地图要素得到成图,即图2。其中,红色区域为人口分布热点区,蓝色部分则为冷点区。

3.2.3数据分析

由图中冷、热点分布可以看出,Chicago西北地区如Avondale是人口热点区,且其周围也普遍是热点区域,而对应的如South Deering则是冷点区,其周边地区人口密度也较低。此图充分体现了各区人口密度之间的相关性。若金融公司开展业务或政府进行建设,都可以根据这种具有人口密度相关性的热点图结合自己的项目进行建设。

3.3基于克里金插值法的中国年降水量分布分析

我们可以利用空间统计学中的地统计方法,如克里格插值方法等去研究一些气象现象。

3.3.1数据来源

数据来源:GaotHR | 中国国家基础地理信息系统数据,中国气象数据网

数据内容:中国国界线.shp 中国省界线.shp  中国地面国际交换点气候资料日值数据集中降水量数据

3.3.2操作方法与步骤

使用克里金插值法,以某一年的降水量为样本数据,对中国年降水量进行分析。

首先将所需数据导入ArcMAP,克里金插值法使用前需要利用交叉验证和对备用模型进行比较,进而选择最优的插值模型,因此我们可以使用地统计向导进行操作,即在菜单空白处右击,选择Geostatistical Analyst进行选取,然后进行界面,开始设置。由数据对象和统计方法可知数据集中数据字段分别为降水量和高程值,选择普通克里金类型,趋势的移除阶数为一次得到年降水量分布的趋势。利用ArcGIS工具箱中的平均最近邻工具,得到结果中的NNObserved即为步长大小。完成以上插值参数设置后,得到结果图,然后进行掩膜法提取所需形状.

由于为降水量分布图,故还需要对图像进行降水量分層并绘制等值线。最终成图为图3

3.3.3数据分析

如图,江苏安徽等地区以及福建、上海等沿海地区属于蓝色区域,且颜色较深,可知这些地区的降水量较为充足,而新疆、宁夏等地区属于红色地区,且新疆宁夏交界处红色最深,说这些地区降水较少。因此,可以据此分析出当地农作物情况以及当地人民的生活习惯等,如降水量较少地区,当地农作物为了适应天气必然选择耐旱作物,甚至无法进行农业种植;而降雨量较多地区可能会偏向种植水稻等作物。

4总结与展望

本文从空间统计学的发展入手,详细解释了空间统计方法的由来,并阐述了空间统计方法发展与应用的必要性。在对理论基础进行研究后,为了更加深刻的了解这些方法,又选取了几种较为典型的方法基于ARCGIS对空间数据进行了详细的处理和应用。如此,理论与应用相结合,使得基于ARCGIS的空间统计方法研究得以简介明了的进行。

参考文献

[1] 佘冰,朱欣焰,呙维,徐晓. 基于空间点模式分析的城市管理事件空间分布及演化——以武汉市江汉区为例[J]. 地理科学进展,2013,32(06):924-931.

[2] 冒小栋,刘琼芳. 江西省人口分布空间自相关分析[J]. 华东交通大学学报,2014,31(02):131-138.

[3] 沈体雁,冯等田,孙铁山. 空间计量经济学[M]. 北京:北京大学出版社,2010.

[4] 刘湘南, 黄方, 王平. GIS空间分析原理与方法[M]. 科学出版社, 2005.