APP下载

基于随机灰度图的空间自相关指数的计算与分析

2015-04-16陈丛

电脑与电信 2015年9期
关键词:指数值低值高值

陈丛

(福建师范大学协和学院,福建 福州 350108)

1 空间自相关

自相关作为一种常用的数学工具在不同领域有不同含义。随着时间的推移,自相关这个概念被扩展应用于各个研究领域,如图像处理、通信工程、医学研究、地理科学等。空间自相关这一研究领域的理论基础是由美国地理学家W.R.Tobler所指出的空间相关性的存在。地理学第一定律[1]可以表述为:“Everything is related to everything else,but near things are more related than distant things.”空间自相关使统计学在地理学领域中获得了更大程度的运用,它的发展推动了空间统计学、计量地理学等学科的发展;这种相关性也可以扩展到图像分析领域。

空间自相关既可研究地理对象,判断不同对象之间的空间联系;也可针对图像中像元的特定属性展开计算分析,反映出一个单元与邻近单元的关联程度,并由此来判断图像的空间结构。空间自相关包括三种情况:空间不相关即区域内像元的属性值呈随机分布,无特定规律;空间负相关表示区域内相距较近的像元的属性值的相似程度低于相距较远的像元的属性值相似程度;空间正相关则与负相关相反,并可以根据像元的属性值大小将聚集区分为高值聚集和低值聚集。空间自相关的程度由空间自相关指数的数值来体现。

2 常用的空间自相关指数

空间自相关分析包括全局空间自相关分析和局部空间自相关分析[2],其结果可以揭示图像中隐含的聚集性。全局分析主要着眼于研究整个区域的总体空间分布;而局部分析则着眼于各个单元的属性在空间中的局部分布,度量每个单元与其邻近区域的局部相关程度。下文中我们主要针对Moran's I和Getis G指数进行分析。

计算空间自相关指数,空间权重矩阵(Spatial Weight Matrix)[3]的构建是不可忽略的环节。针对不同领域的应用特点和不同的实际计算需求,我们需要选择不同的权重矩阵构造方式[4],从而提高计算结果的准确性。三种计算方法中,欧式距离的计算结果比较精确,但计算量大;其余两种方法的计算过程简单,但结果存在一定的计算误差[5]。综合比较后,我们采取城区距离的方法构造空间权重矩阵。

2.1 Moran's I(I)指数

1948年,Moran提出了全局Moran’s I指数,其计算公式[6]为:

其中,Xi表示区域i的某个指定属性(在数字图像中表示某像元的属性值);Wij表示区域i与j的空间权重值,即权重矩阵W中第i行第j列的值;-X表示属性均值;n表示变量(区域)个数。全局Moran's I指数的取值范围为[-1,1]。指数值为0时,属性X的值在空间上表现为随机分布;指数值越接近1,表现为空间位置上相近的区域属性值比较远的区域属性值更相似,即区域内存在的空间正相关的程度越高;指数值越接近-1,表现为空间位置上相近的区域属性值比较远的区域属性倾向于更不相似,即区域内存在的空间负相关的程度越高。该指数的取值受区域聚集程度的影响较大,能够较为敏感地感知聚集范围的变化趋势,但并不能确定聚集属于高值聚集还是低值聚集[7]。

为了度量研究对象在局部层面上的空间自相关程度,Anselin在全局Moran's I指数的基础上提出了局部Moran's Ii指数,其计算公式[8]为:

公式(2)中各变量含义与公式(1)中相同,局部Moran's Ii指数的取值范围为全体实数。指数值高于数学期望值,说明研究区域可能存在局部空间正相关;指数值低于数学期望值,说明研究区域可能存在局部的空间负相关。每个研究区域的局部指数均反映了该区域与邻近区域的相关程度,根据计算公式,局域Moran's Ii指数实质上是对全局Moran's I指数的分解;整个区域的局部指数之和理论上应与全局指数成正比。

2.2 Getis(G)指数

由于Moran's I指数在识别空间自相关聚集类型时存在一定的缺陷,1992年,Getis和Ord提出了全局Getis指数,简称G指数,其计算公式[6]为:

全局Getis指数的取值范围为全体实数。G指数同样可以通过标准化统计量Z进行检验,“当Z(G)的值大于零时表示研究区域存在高值聚集,当Z(G)的值小于零时表示研究区域存在低值聚集[7]”。

为了更好地进行局部空间自相关分析,1995年,Getis和Ord对全局Getis指数进行了改进,提出了局部Getis指数,简称 Gi指数[9],其计算公式[10]为:

Gi指数的取值为全体实数,该指数同样也可以通过标准化统计量Z进行检验,当指数值大于零时表示存在高值聚集,当指数值小于零时表示存在低值聚集。

从计算公式上分析,Getis(全局和局部)指数是通过邻近位置上的属性值的乘积衡量相关程度。根据计算公式可知,对同一个研究区域计算时,分母部分总是一个固定值,而分子的值由邻近空间位置上的属性值决定。如果邻近的属性值都是高的,则指数值也高,从而体现出高值聚集;如果邻近的属性值都是低的,则指数值也低,从而体现出低值聚集。

3 实验设计

3.1 全局指数的计算

本文继续使用65*65随机灰度图[5]进行实验设计。由基础实验可知,全局Moran's I指数能够描述某区域的整体属性分布,判断此区域是否存在聚集,同时对聚集范围的变化趋势比较敏感。但是,该指数只能从总体上给出一个指标,无法确定聚集的类型,也无法确定聚集区域的中心位置[5]。

随着权重间隔d从1扩大至65,基于随机灰度图像计算所得的全局Getis指数值扩大趋势明显,但总体均小于1,表现为图像中不存在明显的空间自相关,即图像呈现随机分布,与图像的来源相符合。

基于全局Getis指数的计算原理进行分析,该指数并不考虑像元本身属性值与均值间的差异,而是直接使用属性值计算,因此计算结果均大于零。基于随机图像,随着权重间隔的不断扩大,像元的邻接区域也不断扩大,其邻接像元的数量增多,从而使分母和分子的值不断接近,最终表现为指数值的不断扩大。若图像中存在聚集,像元本身的属性值与邻近像元的值相近,从而扩大分子的数值,减小分子与分母的差异,扩大最终的指数值,指示出聚集特征。

在随机灰度图像的左上角3行3列聚集区域中代入不同属性值(0至255)分别计算,所得全局Getis指数值的变化趋势基本相同,曲线基本重合;指数值在同一权重间隔下的差异值处于10-3的数量级。但是,在同一权重间隔下,使用属性值0至255依次代入时,全局Getis指数值的变化呈现出一定规律性,偏向于低于均值的聚集值,如图1所示。根据这一特征,可将全局Getis指数用于判断聚集的类型。在图1中line1直线表示了原图像在权重间隔为15时的全局Getis指数值;line2曲线表示同一权重间隔下使用0至255依次代入时计算所得的指数值。同时,权重间隔越大时,计算所得的曲线越接近于直线。

图1 不同属性值代入的全局Getis指数值(权重距离为15)

但是全局Getis指数对于聚集范围的变化并不敏感。当聚集区域从左上角3行3列扩大到5行5列、7行7列、9行9列时,指数值的变化较小,曲线基本重合。

接下来,我们需要验证指数检测聚集中心位置的敏锐性。选择上文实验中相关性相对显著的9行9列的聚集区域(灰度值设为250,高值聚集)进行实验,设定权重间隔为1,计算该区域沿对角线从图像左上角向右下角移动的过程中指数值的变化。低值聚集时,聚集区域位于图像两个角点时指数值高于聚集区域位于图像内部区域,如图2(属性值为50)所示;而存在高值聚集时其规律正好相反。当该聚集区域在四个边缘移动时同样有类似的规律,可以较好地判断聚集区域是否位于或接近角点位置。

图2 全局Getis指数的边缘检测

综合上述结果,单核聚集时,全局Moran's I指数在检测聚集的存在及聚集范围的变化方面具有一定的优势,但是无法区分聚集类型和聚集中心的位置;而全局Getis指数在一定程度上可以区分聚集类型。在边缘检测上,全局Getis指数的指向性会优于全局Moran's I指数。

3.2 局部指数的计算

总体上,全局空间自相关指数对于聚集中心的指向性都不够明确,因而在下一步的实验中将尝试通过局部空间自相关指数确定空间聚集的细节指标。对于局部Moran's I指数和局部Getis Gi指数的计算我们侧重于在随机图像上添加了聚集区域后的分析。

3.2.1 局部Moran's Ii指数的计算

基于随机灰度图像,我们设定属性值50用于模拟低值聚集,属性值250用于模拟高值聚集。在单核聚集的情况下,设定聚集区域为21行21列的范围。基于模拟聚集后的图像,实验计算了局部Moran's Ii指数并使用Matlab将结果用图像方式(图3)进行呈现。

图3 局部Moran’s Ii指数

3.2.2 局部Getis Gi指数的计算

局部Getis Gi指数的计算结果如图4所示。该指数同样具有较强的检测聚集中心位置的能力,同时在聚集范围的检测上会稍强于局部Moran's Ii指数,检测所得的范围大小更接近于实际区域面积;但在聚集区域边角点的计算与检测中会稍弱于局部Moran's Ii指数。无论聚集中心处于什么图像位置,局部Getis Gi指数都能够检测到聚集;由于受到边缘像元的影响,聚集范围的大小有所变化。

图4 局部Getis Gi指数

3.3 多核聚集

现实图像中单核聚集比较少见,多核聚集则大规模存在。我们以双核聚集为例,设置聚集区域为21行21列,其中一块为高值聚集(属性值为250),另一块为低值聚集(属性值为50)。图5表示了两块聚集区域所在位置,以8行8列图像中的两块3行3列聚集为例,其中黑色表示低值聚集,灰色表示高值聚集,白色表示原有随机属性值;本文使用图中列出的十二种方案完成指数计算。

图5 双核聚集方案

固定权重间隔d为1,计算全局Moran's I指数,结果如表1所示。根据计算结果,结合聚集区域所在位置分析可得,全局Moran's I指数对于聚集位置的改变并不敏感,从总体上来说,边缘位置的识别略高于内部区域;当双核同为高值聚集或低值聚集时,该指数识别高值聚集的能力明显高于低值聚集。使用上述方案对全局Getis指数进行计算时,方案九至十二的计算结果略高于一至八,显示出聚集中心位于边缘区域与位于内部区域的区别,且差异值高于全局Moran's I指数的结果。由此说明,多核聚集时,全局Getis指数对于聚集位置的判断与识别仍然优于全局Moran's I指数。

基于上述12种方案使用局部指数进行计算,结果所反映出的局部Moran's Ii指数和局部Getis Gi指数的差别与单核聚集时基本相同。

表1 全局Moran’s I指数

4 结论

基于随机灰度图,本文通过设置单核聚集、多核聚集、移动聚集中心、改变聚集区域大小、权重间隔、高值聚集、低值聚集等比较了全局和局部的Moran's I指数、Getis指数,根据实验结果可以总结出以下规律:

(1)无聚集时,两种全局指数都能正确地反映出图像的随机特征。随着权重间隔的扩大,全局Moran's I指数呈现出振荡中相关程度逐渐减小的规律,比全局Getis指数更符合实际。

(2)存在聚集时,两种全局指数都能够检测到聚集,但是全局Getis指数检测低值聚集的能力强于高值聚集;同时全局Moran's I指数无法区分聚集的类型。

(3)全局Moran's I指数对聚集范围的变化较敏感,能够以此指示研究区域内某种现象的变化趋势;全局Getis指数则能够较好地区分聚集位于图像边缘或图像内部。

(4)局部Moran's Ii指数对于边角区域的检测能力较强,但是无法区分聚集的类型,所检测到的聚集范围总是小于实际的聚集范围。而相同条件下,局部Getis Gi指数虽然检测边角聚集的能力较弱,但是在聚集中心、聚集范围的检测上正确性更高。

综上所述,总体考虑指数对于聚集类型、聚集范围、聚集中心位置等方面的指向性,从全局角度上看,Moran's I指数的性能优于Getis指数;从局部角度上分析,Getis Gi指数的性能优于Moran's Ii指数。

[1]Tobler W R.A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46(2):234-240.

[2]Getis A,Ord J K.Local spatial statistics:An overview[A].Spatial Analysis:Modelling in a GIS Environment[C].John Wiley&Sons.1996,261-277.

[3]张晓萌,付燕.图像分割技术研究[J].科技情报开发与经济,2007,17(18):183-184.

[4]阴国富.基于阈值法的图像分割技术[J].现代电子技术,2007,30(23):107-108.

[5]陈丛.基于随机灰度图的全局Moran’s I指数的计算与分析[J].电脑知识与技术,2014,10(26):6149-6154.

[6]SAWADA M.Golbal Spatial Autocorrelation Indices-Moran’s I,Geary’s C and the General Cross-Product Statistic.http://www.lpc.uottawa.ca/publications/Moransi/Moran.htm.2006-05-16

[7]张松林,张昆.全局空间自相关Moran指数和G系数对比研究[J].中山大学学报(自然科学版),2007,46(4),93-97.

[8]Anselin,L.The Local Indicators of Spatial Association-LISA[J].Geographical Analysis,1995,27(2):93-116.

[9]Ord JK,Getis A.Local spatial autocorrelation statistics:distributional issues and an application[J].Geographical Analysis,1995,27(4):286-306.

[10]Getis A,Ord JK.The analysis of spatial association by use of distance statistics[J].Geographical Analysis,1992,24(3):189-206.

猜你喜欢

指数值低值高值
养殖废弃物快速发酵及高值转化土壤修复生物肥料关键技术
显微镜手工计数法在低值血小板计数中的应用
手术室一次性低值耗材套餐式管控平台的开发与应用
麻文化发展与高值利用前景展望
医院医用低值耗材精细化管理措施探究
要控血糖,怎么吃水果才对对?
要控血糖,怎么吃水果才对
PDCA循环管理法在医院高值耗材管理的应用
高值无害化利用 废白土大有可为
我国各地区官方微博综合绩效的指数法测评
——兼析少数民族地区官方微博综合绩效现状