中国人口文盲率的探索性时空分析
2014-12-09焦晨静
摘 要:经济的高速发展使得中国人口受教育水平不断提升,文盲率反映人口的受教育状况。为了获得中国大陆地区文盲率的时空分布及其演变趋势,文章以1997-2012年的省级人口文盲率数据为研究对象,采用探索性空间数据分析方法对其进行研究。结果发现,省级文盲率之间表现为显著的空间正相关,但Morans I指数整体上呈现下降趋势且2009年之后趋于稳定,表明文盲率在空间分布上逐步由聚集模式向随机模式发展。整个过程中西藏自治区对各省文盲率的空间分布模式有重要影响,需要进一步加大对西藏的扫盲力度。
关键词:文盲率;空间自相关;空间分布模式
引言
人口受教育状况通常被当作衡量一个国家或地区经济发展状况的重要指标[1]。文盲率反映一个国家的人口受教育状况。改革开发以来,我国的经济水平得到快速提升,教育事业的发展也取得了历史性成就。然而,我国文盲率与发达国家相比仍然偏高。目前国内外已有学者对文盲率的影响因素展开研究[2-4],并取得一定成果。但基于空间信息和时间序列,从时空分布角度进行的研究还很少。探索性空间数据分析方法能反应地理特征间的关系及空间模式,已广泛应用于区域经济[5]、疾病控制[6]、环境污染[7]、遥感[8]领域。因此,文章运用探索性空间数据分析方法研究全国省级人口的文盲率空间分布、关联模式及时序变化,试图为文盲率的地区差异研究提供一种新思路,通过展示文盲率的空间分布,为扫盲工作提供科学参考与信息支持。
1 数据与方法
文章选取的研究区域为除港澳台以外的全国31个省(自治区、直辖市),所用的数据来自中国国家统计局发布的1996-2012年全国省级区域的文盲人口占15岁及以上人口的比重数据[9]。空间自相关基于地理学第一定律[10],目前在社会人口学领域[11-13]已有一定研究。文章主要采用空间自相关的方法研究中国大陆地区人口文盲率的省际空间分布模式,并探测其随时间的演变情况。
1.1 空间权重矩阵
基于空间对象之间的一阶邻接关系可定义空间权重矩阵(Spatial weight matrix,记为W)[11],它表达了对象之间的空间布局。假设有n个空间单元,如果第i个单元和第j个单元相邻,则Wij=1;否则,Wij=0。一般根据公共边界和距离两种规则来定义邻接关系,前者依据空间单元之间是否具有公共边界来判定邻接关系,后者依据空间单元之间的距离是否位于某一给定的阈值之内来判定。文章依据公共边界来判定空间单元之间的邻接关系,并选取一阶邻接关系作空间权重。由于海南省是一个孤立省份,生成邻接矩阵时会出现“孤岛”现象,因此文章采用常用的处理方法,定义海南省与广东省相邻[6,14]。
1.2 全局空间自相关
全局Morans I[15]是经典的全局空间自相关指数[11],具有定性与定量相结合的优势[6],文章将它引入到文盲率分析中。设研究区域中包含n个空间单元,yi为单元i上的观测值, W为空间权重矩阵,则Morans I指数可定义为[16]:
2 实验结果与分析
2.1 文盲率的全局自相关特性分析
2009年以前,各年份的全局Moran's I值均超过了0.2,且经过标准正态化后的Z值均大于0.05显著性水平下的临界值1.96,说明邻近区域间的文盲率在地理空间的总体分布不是随机的,而是呈现出显著的空间集聚模式。另外通过分析各省人口文盲率Morans I指数的变化趋势,发现指数在1997年、2002年、2005年等年份出现局部峰值,表明这些年份中各省市人口文盲率空间相关性更强,在空间上呈现出聚集形态。2009年之后,全局Morans I指数逐步降到0.2以下,经检验之后的Z值也降到了临界值1.96附近,表明随着我国扫盲工作的展开,文盲率已显著降低,在空间分布上逐步在向随机模式发展,文盲率聚集分布的区域已明显减少。如图1所示,纵观整个过程,指数呈现出下降趋势,但并不是自始至终稳定下降,而是在局部出现了一些增长,2009年之后才趋向于稳定下降。这可能与各区域的扫盲工作实施力度有关,但总体上扫盲工作已取得明显成效,文盲率的集聚性已明显降低。
2.2 文盲率的局部自相关特性分析
Moran散点图[18]具有较好的表现局部自相关的功能。文章利用它分析各省文盲率的局部自相关特性,结果如图2所示。
蓝色圆圈表示各省文盲率的分布,红色圆圈表示Moran散点图与图3中地图联动的结果显示,回归拟合线的斜率反映了数据的空间自相关程度。散点图的四个象限分别代表了文盲率的高高相邻(HH)、低高相邻(LH)、低低相邻(LL)、高低相邻(HL)四种空间关联模式。其中高高相邻(HH)和低低相邻(LL)为正相关,低高相邻(LH)和高低相邻(HL)为负相关。紫线表示原始的回归拟合线,蓝线表示剔除联动散点后重新计算的回归拟合线。
由图2可知,西藏自治区对应的散点(红色圆圈)一直处于散点图中横坐标最大的位置,因此西藏一直是文盲率潜在的高值异常区域。当去除它对应的散点之后,重新计算得到的回归系数比原始的Moran's I指数要高很多,说明西藏自治区对全国文盲率的空间分布模式有很大的影响。与图3进行地图联动分析局部空间关联模式,进一步印证了文盲率相关性总体下降的趋势。如图2(a)所示,在1997年31个点主要集中在第一象限(HH区域)和第三象限(LL区域),说明该年份人口文盲率的低值省份与低值省份之间及高值省份与高值省份之间存在较强正相关,文盲率的高值区域和低值区域在空间上成片分布。到了2000年(图2(b)),第一象限(HH区域)和第三象限(LL区域)中的部分点开始向原点集中,说明该年份各省之间文盲率的相关性有所降低,但仍存在一些高值聚集省份。2005年,31个点又主要分布在第一象限和第三象限,同1997年一样,Moran's I指数又一次出现局部峰值,部分省份的文盲率在空间上又表现出较强的相关性。2009年、2010年、2012年, 31个点趋于向原点集中且较多的点回到了第三象限(LL区域),说明人口文盲率自相关性在整体上已经大大减弱,并逐步趋于稳定。进一步分析可以发现,这六个年份中处于第一象限(HH区域)的点虽然在逐渐减少,但有四个点出现的频率最高,说明这四个省的文盲率一直相对较高,这个省分别为西藏(34.81%)、青海(12.24%)、云南(8.34%)、四川(6.85%)。由于青海、云南和四川在空间上均与西藏邻接,所以西藏自治区的文盲率对这三个省的文盲率有较大影响。endprint
3 结束语
文章利用空间自相关分析方法对我国人口文盲率的时空分布和演变进行了研究。自1996年到2012年,中国人口文盲率的全局空间自相关指数呈减弱趋势,且文盲率较高的省份主要都集中在西部,但在局部又表现出某些细节特征:西藏、青海、云南、四川等高值区域之间相关性较强,新疆具有与这些西部区域显著不同的低值水平,值得进一步研究。后续工作会结合各省的经济、教育、人口、地域特点等进行空间回归分析,对这些空间关联模式的内在形成机理进行进一步析和研究。
参考文献
[1]黄晨曦.1964-2005年我国人口受教育状况的变动—基于人口普查/抽查资料的分析[J].人口学刊,2011,4(188): 3-13.
[2]Wang Zhengyao.A Spatial Analysis of Educational Inequality in Mainland China [D]. University of Michigan,2012.
[3]SUNDARAM A,VANNEMAN R. Gender Differentials in Illiteracy in India:The Intriguing Relationship with Women's Labor Force Participation[J]. World Development, 2008, 36(1): 128-143.
[4] Zahiduzzaman A. K. M, MOHAMMED N Q, MRIDUL K, etal. Spatial Data Mining on Literacy Rates and Educational Establishments in Bangladesh[C]. Proceedings of 13th International Conference on Computer and Information Technology (ICCIT 2010), Dhaka,Bangladesh, 2010: 23-25.
[5]陈斐,杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报·信息科学版,2002,27(4):391-396.
[6]陈江平,张兰兰,余远剑,等.利用空间自相关的中国内陆甲型H1N1流感疫情分析[J].武汉大学学报·信息科学版,2011,36(11):1363-1366.
[7]周天墨,付强,诸云强,等.空间自相关方法及其在环境污染领域的应用分析[J].测绘通报,2013,1:53-56.
[8]许雄,钟燕飞,张良培,等.基于空间自相关BP神经网络的遥感影像亚像元定位[J].测绘学报,2011,40(3):307-311.
[9]国家统计局,中国统计年鉴[EB/OL]. http://www.stats.gov.cn/tjsj/ndsj/,2014-03-30.
[10]TOBLER W. A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46(2):234-240.
[11]张旭,朱欣焰,鲍曙明.中国人口生育率的时空演变与空间差异研究[J].武汉大学学报·信息科学版,2012,37(5):516-519.
[12]王泽宇,孙然,韩增林,等.中国人口老龄化水平测度与空间关联研究[J].地域研究与开发,2013,32(3):138-143.
[13]OLIVEAU S,GUILMOTO C Z. Spatial Correlation and Demography: Exploring India's Demographic Patterns [C].International Population Conference, Tours,France,2005.
[14]MENG Bin, WANG Jinfeng,ZHANG Wen-Zhong, etal. Evaluation of Regional Disparity in China Based on Spatial Analysis[J]. SCIENTIA GEOGRAPHICA SINICA,2005,25(4):393-400.
[15]Moran P. A. P. Notes on Continuous Stochastic Phenomena [J]. Biometrika,1950,37(1/2):17-23.
[16]王远飞,何洪林.空间数据分析方法[M].北京:科学出版社,2007:110-118.
[17]ANSELIN L, SYABRI I, KHO Y. GeoDa: An Introduction to Spatial Data Analysis[J]. Geographical Analysis, 38(1), 2006: 5-22.
[18]ANSELIN. L, The Moran Scatterplot as an ESDA Tool to Assess Local Instability in Spatial Association. In: Fischer MM, Scholten HJ, Unwin D (eds) Spatial analytical perspectives on GIS[M]. London: Taylor & Francis: 111-125.
作者简介:焦晨静(1990-),女,河南新乡人,硕士生,主要研究GIS应用。endprint
3 结束语
文章利用空间自相关分析方法对我国人口文盲率的时空分布和演变进行了研究。自1996年到2012年,中国人口文盲率的全局空间自相关指数呈减弱趋势,且文盲率较高的省份主要都集中在西部,但在局部又表现出某些细节特征:西藏、青海、云南、四川等高值区域之间相关性较强,新疆具有与这些西部区域显著不同的低值水平,值得进一步研究。后续工作会结合各省的经济、教育、人口、地域特点等进行空间回归分析,对这些空间关联模式的内在形成机理进行进一步析和研究。
参考文献
[1]黄晨曦.1964-2005年我国人口受教育状况的变动—基于人口普查/抽查资料的分析[J].人口学刊,2011,4(188): 3-13.
[2]Wang Zhengyao.A Spatial Analysis of Educational Inequality in Mainland China [D]. University of Michigan,2012.
[3]SUNDARAM A,VANNEMAN R. Gender Differentials in Illiteracy in India:The Intriguing Relationship with Women's Labor Force Participation[J]. World Development, 2008, 36(1): 128-143.
[4] Zahiduzzaman A. K. M, MOHAMMED N Q, MRIDUL K, etal. Spatial Data Mining on Literacy Rates and Educational Establishments in Bangladesh[C]. Proceedings of 13th International Conference on Computer and Information Technology (ICCIT 2010), Dhaka,Bangladesh, 2010: 23-25.
[5]陈斐,杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报·信息科学版,2002,27(4):391-396.
[6]陈江平,张兰兰,余远剑,等.利用空间自相关的中国内陆甲型H1N1流感疫情分析[J].武汉大学学报·信息科学版,2011,36(11):1363-1366.
[7]周天墨,付强,诸云强,等.空间自相关方法及其在环境污染领域的应用分析[J].测绘通报,2013,1:53-56.
[8]许雄,钟燕飞,张良培,等.基于空间自相关BP神经网络的遥感影像亚像元定位[J].测绘学报,2011,40(3):307-311.
[9]国家统计局,中国统计年鉴[EB/OL]. http://www.stats.gov.cn/tjsj/ndsj/,2014-03-30.
[10]TOBLER W. A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46(2):234-240.
[11]张旭,朱欣焰,鲍曙明.中国人口生育率的时空演变与空间差异研究[J].武汉大学学报·信息科学版,2012,37(5):516-519.
[12]王泽宇,孙然,韩增林,等.中国人口老龄化水平测度与空间关联研究[J].地域研究与开发,2013,32(3):138-143.
[13]OLIVEAU S,GUILMOTO C Z. Spatial Correlation and Demography: Exploring India's Demographic Patterns [C].International Population Conference, Tours,France,2005.
[14]MENG Bin, WANG Jinfeng,ZHANG Wen-Zhong, etal. Evaluation of Regional Disparity in China Based on Spatial Analysis[J]. SCIENTIA GEOGRAPHICA SINICA,2005,25(4):393-400.
[15]Moran P. A. P. Notes on Continuous Stochastic Phenomena [J]. Biometrika,1950,37(1/2):17-23.
[16]王远飞,何洪林.空间数据分析方法[M].北京:科学出版社,2007:110-118.
[17]ANSELIN L, SYABRI I, KHO Y. GeoDa: An Introduction to Spatial Data Analysis[J]. Geographical Analysis, 38(1), 2006: 5-22.
[18]ANSELIN. L, The Moran Scatterplot as an ESDA Tool to Assess Local Instability in Spatial Association. In: Fischer MM, Scholten HJ, Unwin D (eds) Spatial analytical perspectives on GIS[M]. London: Taylor & Francis: 111-125.
作者简介:焦晨静(1990-),女,河南新乡人,硕士生,主要研究GIS应用。endprint
3 结束语
文章利用空间自相关分析方法对我国人口文盲率的时空分布和演变进行了研究。自1996年到2012年,中国人口文盲率的全局空间自相关指数呈减弱趋势,且文盲率较高的省份主要都集中在西部,但在局部又表现出某些细节特征:西藏、青海、云南、四川等高值区域之间相关性较强,新疆具有与这些西部区域显著不同的低值水平,值得进一步研究。后续工作会结合各省的经济、教育、人口、地域特点等进行空间回归分析,对这些空间关联模式的内在形成机理进行进一步析和研究。
参考文献
[1]黄晨曦.1964-2005年我国人口受教育状况的变动—基于人口普查/抽查资料的分析[J].人口学刊,2011,4(188): 3-13.
[2]Wang Zhengyao.A Spatial Analysis of Educational Inequality in Mainland China [D]. University of Michigan,2012.
[3]SUNDARAM A,VANNEMAN R. Gender Differentials in Illiteracy in India:The Intriguing Relationship with Women's Labor Force Participation[J]. World Development, 2008, 36(1): 128-143.
[4] Zahiduzzaman A. K. M, MOHAMMED N Q, MRIDUL K, etal. Spatial Data Mining on Literacy Rates and Educational Establishments in Bangladesh[C]. Proceedings of 13th International Conference on Computer and Information Technology (ICCIT 2010), Dhaka,Bangladesh, 2010: 23-25.
[5]陈斐,杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报·信息科学版,2002,27(4):391-396.
[6]陈江平,张兰兰,余远剑,等.利用空间自相关的中国内陆甲型H1N1流感疫情分析[J].武汉大学学报·信息科学版,2011,36(11):1363-1366.
[7]周天墨,付强,诸云强,等.空间自相关方法及其在环境污染领域的应用分析[J].测绘通报,2013,1:53-56.
[8]许雄,钟燕飞,张良培,等.基于空间自相关BP神经网络的遥感影像亚像元定位[J].测绘学报,2011,40(3):307-311.
[9]国家统计局,中国统计年鉴[EB/OL]. http://www.stats.gov.cn/tjsj/ndsj/,2014-03-30.
[10]TOBLER W. A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46(2):234-240.
[11]张旭,朱欣焰,鲍曙明.中国人口生育率的时空演变与空间差异研究[J].武汉大学学报·信息科学版,2012,37(5):516-519.
[12]王泽宇,孙然,韩增林,等.中国人口老龄化水平测度与空间关联研究[J].地域研究与开发,2013,32(3):138-143.
[13]OLIVEAU S,GUILMOTO C Z. Spatial Correlation and Demography: Exploring India's Demographic Patterns [C].International Population Conference, Tours,France,2005.
[14]MENG Bin, WANG Jinfeng,ZHANG Wen-Zhong, etal. Evaluation of Regional Disparity in China Based on Spatial Analysis[J]. SCIENTIA GEOGRAPHICA SINICA,2005,25(4):393-400.
[15]Moran P. A. P. Notes on Continuous Stochastic Phenomena [J]. Biometrika,1950,37(1/2):17-23.
[16]王远飞,何洪林.空间数据分析方法[M].北京:科学出版社,2007:110-118.
[17]ANSELIN L, SYABRI I, KHO Y. GeoDa: An Introduction to Spatial Data Analysis[J]. Geographical Analysis, 38(1), 2006: 5-22.
[18]ANSELIN. L, The Moran Scatterplot as an ESDA Tool to Assess Local Instability in Spatial Association. In: Fischer MM, Scholten HJ, Unwin D (eds) Spatial analytical perspectives on GIS[M]. London: Taylor & Francis: 111-125.
作者简介:焦晨静(1990-),女,河南新乡人,硕士生,主要研究GIS应用。endprint