基于元胞自动机的遗传神经网络在土地利用变化模拟分析中的应用
2014-08-25韦春竹郑文锋孟庆岩王春梅
韦春竹,郑文锋,孟庆岩,王春梅,刘 苗
(1.电子科技大学,四川 成都 610000; 2.中科院遥感应用研究所,北京 100101)
基于元胞自动机的遗传神经网络在土地利用变化模拟分析中的应用
韦春竹1,郑文锋1,孟庆岩2,王春梅2,刘 苗2
(1.电子科技大学,四川 成都 610000; 2.中科院遥感应用研究所,北京 100101)
元胞自动机模型在土地扩展的转换规则设计上具有随机性,受周围环境影响较大。文中建立基于BP神经网络和遗传神经网络算法优化的元胞自动机土地扩张模型,对广州市2009—2011年进行城市扩张模拟分析。实验结果显示:BP神经网络能够较好地模拟分布较集中的耕地和林地等区域,精度可达到70%以上,而对于面积较零碎的建筑用地区域,模拟效果较差;而遗传神经网络优化算法能够总体提高模拟精度约5%,部分精度能提高至20%。同时,该算法还能充分考虑影响土地变化的各种扰动因素,优化选择驱动因子和缩短迭代次数,对于城市土地扩张研究具有可行性。
城市扩张;元胞自动机;BP神经网络;遗传算法
随着我国经济的高速发展,城市化进程加快。据统计2006年全国人口城市化水平达到43.90%。据专家预测,到2050年我国城市化水平将提高到70%[1-2]。城市规模的不断扩张伴随城市建设用地的需求急剧增加,大量新兴城市带来的生态环境问题也对城市的可持续发展起到牵制作用。研究城市扩张问题,获取土地利用和土地覆盖变化(Land Use/Cover Change,LUCC)情况,已经成为地球系统科学新的研究重点[3]。目前,国内外研究学者逐渐开始利用元胞自动机[4-6]、神经网络[7-9]、模糊算法[10]、粗糙集算法[11]、马尔科夫链[12]、遗传算法[13]、蚁群算法[14]、支持向量机[15]等人工智能算法从宏观上反映土地利用系统的结构、功能和行为之间的相互作用关系,为城市可持续发展的决策制定提供依据。这些人工智能算法能够解决在建模过程中遇到的数据不足或难以量化等问题,通过要素的因果关系和结构关系进行推算,分析获得主要信息,适用于机制过程复杂的土地扩张变化模拟研究。为此,本文拟结合BP神经网络和遗传优化算法,进行基于元胞自动机的城市扩张模拟,希望通过研究社会经济要素定量化表达方法、土地利用过程中自然与人文数据的统一与同化的方法与技术,为发展土地可持续利用提供决策和支持。
1 研究区域
广州市开发建设迅速,全市建设用地从1996—2009年年均增长率为3.94%[16-17]。根据城市发展规律和广州市社会经济发展的方向,未来城市建设仍将会占用较多土地,建设用地供给不足已成为广州城市发展的限制因素之一。为此本文选取广州市作为研究区域,选择2009—2011年的广州市HJ-1A/1B数据,利用面向对象的土地利用分类方法[18]提取土地利用分类数据(见表1),为下文的城市扩张模拟提供数据基础。
表1 广州市土地利用/覆盖类型变化 %
2 基于 BP神经网络的元胞自动机模拟
元胞自动机(CA)模型主要包括元胞、状态、邻域、转换规则函数、时间5部分,是基于时间、空间以及状态均离散下的空间实体相互作用而构成的网格动力学模型。但是在城市扩展的模拟过程当中,土地扩展的转换规则往往具有随机性,受周围环境影响较大[5]。为此,本文划分土地为元胞对象,基于BP神经网络优化城市扩张CA算法,CA的转换规则函数由神经网络自组织参数训练获得,离散状态则最终由规则函数得出。并且定义CA的八邻域元胞及相关城市规划的环境参数作为变量参与到训练当中,虚拟模拟时间。
2.1 环境参数的获取
土地属性是城市扩张最直接、最重要的自然地理因子。为此,本文选择距离市区中心的距离、离主要河流的距离、邻近建设用地的单元数量、邻近单元的土地利用类别统计量等作为网络模拟的环境参数。其中,距离市区中心的距离参数通过ArcGIS的缓冲区分析和邻域分析获得,如图1(d)所示;距离河流的距离参数通过ArcGIS 软件中Spatial Analysis 模块中Distance 命令,如图1(a)所示;邻近建设用地数量和单元土地利用的类别统计值则由在Matlab软件中设计的统计模块获取,如图1(b)、图1(c)所示。
与此同时,对于经济和人口因子的度量,本文根据统计年鉴获取广州市12个县市级区域的人口和经济发展数据,在ArcGIS当中进行矢量化,通过空间插值分布获取广州市经济和人口的分布值(见图1(e)、图1(f))。最终所有经过缓冲区分析、邻域分析和统计分析后的参数将通过ArcGIS转化为30 m×30 m单元大小的栅格数据作为预测模型的输入因子,并且在Matlab中进行归一化处理。
2.2 BP-CA模型设计
传统的BP神经网络模型[19](又称反向传播神经网络),是一种适于非线性模式识别和分类预测问题的人工神经网络,由网络输入层、隐含层和输出层三部分组成,连接权连接神经元节点,同层神经元相互不连接。本文设计的BP-CA模块仍为神经网络通用的3 层结构。第1 层为数据输入层,共14个神经元,分别对应于影响城市土地利用动态演化的14个变量。第2 层为隐藏层,BP神经元为非线性结构,即分别采用tansig和logsig激励函数,其隐藏层的神经元数目设为样本数的平方根。第3 层为输出层,由8个神经元组成,分别对应于向周围八邻域8土地利用类型的转换概率。神经网络训练的子数据库来源于原始元胞数据表(占原始数据1/3为最佳),剩余数据为验证子数据库。子数据库最终训练结果和验证子数据库用于模型精度评价。在这个过程当中BP神经网络利用最小二乘算法原则,通过根均方误差和梯度下降法来实现对网络连接权的修正。最终使网络实际输出与规定的输出之间的根均方误差(Root Mean Squared Error,RMSE)最小。
2.3 BP神经网络训练结果分析
基于上述的数据准备和模型设计,本文利用Matlab的神经网络模块,随机抽取2009年的300个样本实现广州市 2010年和2011年的土地利用变化模拟,并用2011年的土地利用数据预测2015年的广州土地变化情况。其中,2010年的土地变化模拟结果如图2所示。
图1 模型的环境参数设计
图2 基于BP神经网络的2010年土地利用变化模拟
广州市2010年土地利用变化模拟的总体模拟精度为75.7%,其中林地的模拟精度为83.3%,耕地为76%,建筑用地为55%,河流为49%。由模拟结果显示,BP神经网络对于面积较大且较为集中的特征向量的模拟精度均达到70%以上,精度较高,比如林地和耕地;而建筑用地相对较为分散,模拟效果次之,河流的模拟结果最差,这可能是因为流域的变化受周围的区域影响较小的缘故。BP神经网络模拟2015年的广州土地利用变化情况为:林地面积较2011年缩小约11%,耕地面积扩大约12%,建筑用地面积扩大约4%,河流面积缩小1%,广州市的城市扩张现象依然呈现增长的趋势。
3 基于遗传算法的土地变化模拟
虽然神经网络有很强的非线性拟合能力,可以映射任意复杂的非线性关系,而且学习规则简单,便于计算机实现。但是存在以下缺点:①容易陷入局部极小值;②收敛速度慢;③隐含层节点的个数难以确定。这些缺点都影响到网络的收敛性速度和泛化能力等。为此本文提出遗传算法( Genetic Algorithm, GA)来优化神经网络。GA能突破邻域搜索的限制实现整个解空间分布上的信息搜索、采集和继承,并且算法不依赖梯度信息,能够引导搜索过程向着更高效的方向发展,尤其适合于处理传统搜索方法难以解决的复杂和非线性问题[20]。
3.1 GA优化BP神经网络的模型设计
本文主要集中利用GA全局优化BP神经网络的权重,主要包括以下3个步骤[20]: ①将每个染色体通过实数编码成为BP网络的权重;②采用整个网络的误差函数作为适配函数,通过计算实际输出与目标输出总的均方差来评估网络权重集;③确定遗传策略,在染色体的交叉变异过程中,本文选取种群规模为30的定长。遗传神经网络可以在元胞初始权值分布优化后,在解空间中找出一个较好的搜索空间,更好地防止搜索陷入局部极小值。
3.2 GA-BP网络训练结果分析
利用Matlab实现GA-BP优化算法,模拟2010年广州的土地利用变化(见图3),总体模拟精度达到83.84%,其中林地为88.86%,耕地为84.08%,建筑用地为69.6%,河流为51.7%。对比BP神经网络,GA-BP优化算法模拟的精度有较大提高。而GA-BP优化算法预测2015年的广州城市扩张情况为:林地面积较2011年缩小约6%,耕地面积较2011年约扩大4 %,建筑用地面积较2011年扩大约2%,河流面积较2011年约缩小1%。综合两个算法对2015年的广州市土地变化预测结果得知,广州市的城市扩张现象在2015年依然明显,其中,耕地退化严重,城市建筑用地增长显著。
图3 基于 GA-BP神经网络的2010年广州土地利用变化模拟
3.3 模型对比分析
本文结合BP神经网络和遗传算法可以较大程度上改变传统元胞自动机土地利用模拟过程当中的规则设计问题。并且遗传神经优化算法较BP神经网络算法在城市扩张模拟的应用中仍具有明显的优势,表现[21]为:①BP神经网络的初始权值异常敏感,容易导致完全不同的模拟结构:例如本文中的BP神经网络算法对于广州市2009年和2011年的河流模拟精度相差近30%;②BP神经网络训练过程中缺乏理论指导,经验值极其容易引起网络震荡:例如基于不同的环境变量,BP神经网络的模拟精度幅度在30%~70%之间变动。
遗传算法优化BP神经网络的连接权可以在一定程度上弱化和克服这些问题,由表2可以看出,GA-BP优化算法对于分布较为零散的建筑区域的模拟,精度约提高15%;而对于受邻近区域影响较小的河流地区,模拟精度也有近10%~20%的提高;虽然BP神经网络对于林地和耕地的模拟精度较好,已能达到70%以上,但是GA-BP优化算法还能够在此基础上提高约5%。由此可以看出,GA-BP优化算法模拟效果较好,可行性较高。
表2 BP神经网络与GA-BP优化算法的土地变化模拟精度对比 %
4 结束语
本文基于环境遥感影像数据,运用面向对象方法获取广州市2009—2011年的土地利用分类数据,并通过Matlab建立BP神经网络和遗传神经网络的元胞自动机土地扩张模型。实验结果显示,在复杂多变的土地利用变化过程当中,GA-BP优化算法能够很好地获取影响土地转变的影响因子,并利用函数逼近进行模拟和预测分析,模拟效果优于BP神经网络算法。但是,本文研究只是选取土地利用类型中的一级要素,例如耕地、林地和建筑用地等进行预测分析,但是真正的城市用地还包括道路,工业用地等更详细的要素划分。并且土地类型随着经济和政策的不断发展变化依然在不断更新,影响土地利用结构的因素指标层出不穷。如何综合考虑多因素进行区域多级土地类型的模拟分析,更好地反映土地利用结构的变化,依然是下一步工作的重点和难点。
[1]C NUNES, J AUGE.Land-use and land-cover change (LUCC): Implementation strategy[J].1999:1187-1202.
[2]L XIUBIN.A review of the international researches on land use/land cover change [J].Acta Geographical Sinica, 1996(6) :1354-1362.
[3]J LIU and X DENG.Progress of the research methodologies on the temporal and spatial process of LUCC[J].Chinese Science Bulletin, 2010,55:1354-1362.
[4]赵晶.基于CA的城市土地利用演变人工神经网络模拟[J].兰州大学学报:自然科学版,2006,42(5):27-31.
[5]黎夏,叶嘉安.基于神经网络的元胞自动机及模拟复杂土地利用系统[J].地理研究,2005,24(1):19-27.
[6]钱育蓉,李建龙,干晓宇,等.基于BP网络研究城市扩张中的道路因素——以张家港市为例[J].华东师范大学学报:自然科学版,2009(3):63-71.
[7]钱育蓉,李建龙,王卫源,等.基于BP-MC网络的张家港市耕地安全定量化分析[J].农业工程学报,2009,25(12):299-305.
[8]王良健,师迎春,林目轩.BP神经网络结合小波处理在城市扩张预测中的应用——以长沙市区为例[J].中国土地科学,2008,22(1):39-48.
[9]赵晶,陈华根,许惠平.元胞自动机与神经网络相结合的土地演变模拟[J].同济大学学报:自然科学版,2007,35(8):1128-1132.
[10]F WU.Simulating urban encroachment on rural land with fuzzy-logic-controlled cellular automata in a geographical information system[J].Journal of Environmental Management,1998,53:293-308.
[11]杨青生,黎夏.基于粗集的知识发现与地理模拟—以深圳市土地利用变化为例[J].地理学报,2006,61(8):882-894.
[12]杨国清,刘耀林,吴志峰.基于CA-Markov模型的土地利用格局变化研究[J].武汉大学学报:信息科学版,2007,32(5):414-418.
[13]秦真珍,杨帆,黄胜林,等.基于GA-BP算法的大坝边坡变形预测模型[J].测绘工程,2010,19(1):13-16.
[14]刘小平,黎夏,叶嘉安,等.利用蚁群智能挖掘地理元胞自动机的转换规则[J].中国科学,2007,37(6):824-834.
[15]杨青生,黎夏.基于支持向量机的元胞自动机及土地利用变化模拟[J].遥感学报, 2006,10(6):836-846.
[16]韦亚平,赵民,肖莹光.广州市多中心有序的紧凑型空间系统[J].城市规划学刊,2006(4):41-46.
[17]G ONKAL-ENGIN, I DEMIR, H HIZ.Assessment of urban air quality in Istanbul using fuzzy synthetic evaluation[J].Atmospheric Environment, 2004,38:3809-3815.
[18]W ZHOU,A TROY.An object-oriented approach for analysing and characterizing urban landscape at the parcel level[J].International Journal of Remote Sensing, 2008,28:3119-3135.
[19]苏高利,邓芳萍.论基于 MATLAB 语言的 BP 神经网络的改进算法[J].科技通报,2003,19(2):130-135.
[20]潘昊,王晓勇,陈琼,等.基于遗传算法的BP神经网络技术的应用[J].计算机应用,2005,25(12):2777-2780.
[21]田正杰,梁明.遗传BP算法在特征级遥感影像融合中的应用[J].测绘工程,2008,17(6):59-62.
[责任编辑:刘文霞]
Geneticneuralnetworkbasedoncellularautomataappliedtothesimulationanalysisoflandusechange
WEI Chun-zhu1, ZHENG Wen-feng1, MENG Qing-yan2,WANG Chun-mei2,LIU Miao2
(1.Chengdu University of Electronic Science and Technology, Chengdu 610000, China; 2.Institute of Remote Sensing Applications of Chinese Academy of Sciences, Beijing 100101,China)
Cellular automata model comes up with the random in the design of transit mechanism for land expasion, which is affected by the surrounding environment. The BP neural network (BP) and the genetic algorithm (GA) combined with the cellular automata (CA) are used as a model into the land expansion simulation in order to analyze the case in Guangzhou from 2009 to 2011. Experimental results show that the BP neural network is suitable for the simulation of cultivated land and forest land, the precision of which can reach up to 70%, but can not be suitable for the simulation of the urban building areas of fragmentary. The BP genetic neural network can be improved with simulation precision in general abby 5%, and part of the precisions can go up to 20%.In addition, the GA-BP model can not only better choose the factors that influence the urban expansion, but also shorten the number of iterations to improve the processing speed. To sum up, it is feasible and effective to apply the genetic neural network to the predicting of land use change.
urban expansion; cellular automata; genetic algorithm; BP neural network
2013-03-13
广东省省院产学研合作资金资助(2011B09030090;2012B091100219);科技部国际科技合作与交流专项项目(2010DFA21880);中国科学院对外重点合作项目(GJHZ1003)
韦春竹(1987-),女,硕士研究生.
TP183
:A
:1006-7949(2014)01-0045-05