基于BP人工神经网络的开发区土地集约利用评价——以浙江省为例
2011-05-09徐建春李翠珍徐知渊范晓娟
李 焕,徐建春,李翠珍,徐知渊,范晓娟
(浙江工商大学a.土地研究所;b.旅游与城市管理学院,杭州310018)
开发区作为城市发展和土地利用的重点区域,已经成为产业升级、区域发展的推动器和科技创新基地。然而,由于存在功能定位不清、产业结构趋同等问题,开发区的集聚效应和规模效益并未得到充分体现,土地浪费与低效利用现象仍然存在[1]。目前,在开发区土地集约利用评价研究中,运用较多的是层次分析法和回归分析法,通过构建递阶层次结构、确定权重、估算理想值等环节建立评价体系,从而度量土地集约利用程度的高低。但是,以上评价方法的各个环节都存在不同程度的主观性判断,进而影响评价结果的科学性。本研究经过大量的数据搜集,尝试运用BP人工神经网络建立一个合适的评价模型,摆脱主观因素的负面影响,体现研究的客观合理性。
1 样本数据的采集与分类
研究样本数据共有65组,占浙江省开发区总数的56%,样本总面积为2 810.47 hm2,占浙江省开发区总面积的58.1%,覆盖了浙江省全境,共11个市(表1),除丽水和舟山市样本量较小外,其他9个市的样本数量均在5~10个之间。根据研究需要,将65组样本数据细分为2类:第1类样本数据采集时点为2010年,共11组,是从浙江省11个市中各选取1个具有代表性的开发区作为本研究的评价对象,每组样本包括14项评价指标(表2)。第2类样本数据为剩下的54组,并随机选取其中的45组样本作为BP人工神经网络训练数据,9组作为测试数据。此类数据主要参考了2009年浙江省开发区土地集约利用评价的成果,不仅包括14项评价指标,而且还有一项开发区土地集约利用集约度分值。研究运用第2类样本数据对BP人工神经网络模型进行训练和测试,并将第1类数据代入模型,预测这11个开发区2010年的土地集约利用集约度分值。
表1 样本分布表 个Tab.1 The sample distribution item
表2 评价对象一览表Tab.2 Table of the evaluated objects
2 BP人工神经网络概要
根据T.Koholen的定义:“人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。”它的基本结构如图1所示。
图1 人工神经网络基本结构Fig.1 The basic structure of artificial neural network
图1内容可用一个数学表达式进行抽象概括,即
式中:Qj(t)表示神经元j在t时刻的状态;Wij表示神经元i到j的突触连接系数;Xi(t)表示t时刻神经元j接收的来自神经元i的输入信息;Kj=Oj(t)表示t时刻神经元j的输出信息;Tj表示神经元j的阈值;F表示神经元转移函数。
人工神经网络具有多种模型,其中,BP神经网络是一种单向传播的多层前向神经网络,它是指误差反向传播的算法。BP算法是目前应用最为广泛、最具代表性的神经网络学习算法,可以把BP人工神经网络看成是一个从输入到输出的高度非线性映射[2]。
3 BP人工神经网络的构建与应用
3.1 BP人工神经网络的构建
3.1.1 确定网络层数。Roberto等已证明,对任何在闭区间内的1个连续函数都可以用1个3层BP网络(即含1个输入层、1个隐含层、1个输出层)逼近[3],因此,3层的BP网络就可以完成任意的n维到m维的映射,故将BP网络设计为3层。
3.1.2 确定输入及输出形式。土地集约利用评价指标体系是直接反映土地集约利用目标、内容、程度等不同属性特征的按隶属关系和层次关系组成的有序集合。评价指标体系必须具备解释功能、评价功能及预测预报功能,使土地集约利用评价具有动态发展的连续性[4]。因此,为了保证研究的科学合理性,笔者主要参考《浙江省开发区土地集约利用评价规程》中的14个评价指标(输入因子)作为BP神经网络的输入层:土地开发率u1、土地供应率u2、土地建成率u3、工业用地率u4、综合容积率u5、建筑密度u6、工业用地综合容积率u7、工业用地建筑密度u8、工业用地固定资产投入强度u9、工业用地产出强度u10、到期项目用地处置率u11、闲置土地处置率u12、土地有偿使用率u13、土地招拍挂率u14。此外,因为2类样本数据都具有一个开发区土地集约利用程度的集约度分值,因此,将BP网络的输出层设计为1个节点S。
3.1.3 确定隐含层节点数。在BP网络中,隐含层节点数非常重要,它对神经网络模型的性能影响很大,是训练时出现“过拟合”的直接原因,但是,目前理论上还没有一种科学和普遍的确定方法。本研究主要参考了严太山等[5-6]提出的经验公式法,他们认为最佳隐含层节点数与问题的要求、输入输出单元的多少以及训练样本数都有直接的关系,并在实验的基础上归纳出了一种直接估算最佳隐含层节点数目的简单方法。其公式为:NH。式中:NH为最佳隐含层节点数;Ni为输入层节点数;NO为输出层节点数;NP为训练样本数。根据上式。至此,本次研究所运用的BP人工神经网络拓扑结构正式确立,具体如图2所示。
图2 BP人工神经网络拓扑结构图Fig.2 The topologic structure of BP artificial neural network
3.1.4 数据标准化处理。由于部分评价指标量纲不同,这些原始数据无法建立统一的综合评价网络,因此,需要对这些搜集的指标数据进行标准化处理。正效应指标与负效应指标分别采用极差标准化,即
式中:x′ij为标准化后某指标值;xij为处理前某指标值;xi,max为处理前某指标值的最大值;xi,min为处理前某指标值的最小值;i为样本数;j为指标数。45个训练样本的14个评价因子组成1个45行、14列的输入矩阵X。
此外,输出层样本也构成了一个45行、1列的输出矩阵 S=(s1s3s3…s45)T;T表示矩阵转置,行列互换。
3.1.5 网络训练与测试。运用Matlab软件,将输入矩阵X与输出矩阵S导入已建立的BP人工神经网络,并设置参数,对BP人工神经网络进行训练。经过2 462次训练,网络收敛,最终的均方差为9.996 2×10-4。为了保证所建立并已经收敛的BP网络符合研究要求,从第2类样本中抽取9个作为测试样本,并对其进行测试,结果如表3所示,测试的9个样本误差绝对值均小于3%。至此为止,BP人工神经网络模型建立完毕[7-8]。
表3 BP网络测试结果表Tab.3 The test results of BP network
3.2 BP人工神经网络的应用
运用在Matlab中已经建立并通过测试的BP人工神经网络,将11组待估样本分别进行土地集约利用程度预测,预测结果见表4。
表4 开发区土地集约利用程度预测表Tab.4 Prediction of intensive land use
4 评价结果分析
4.1 浙江省开发区土地集约利用程度普遍较高
浙江省地处长江三角洲南翼,东临东海,南接福建,西与江西、安徽相连,北与上海、江苏接壤。凭借优越的地理区位以及经济、科技和人才优势,大力发展电子、能源、计算机等土地集约利用程度高的高科技产业集群,形成开发区的产业核心竞争力,发展外向型经济[9]。经过多年的发展,已经形成了一套行之有效的管理体系,促进了开发区土地的高效、有序、合理利用。如表5所示,82%的开发区集约度分值在0.8以上,属于集约利用范围。其中,36%的开发区集约度分值在0.9以上,属于高度集约利用范围。此外,浙江省开发区在用地效益和用地结构状况等各方面都显示出了较高的土地集约利用水平。其中,开发区平均工业用地容积率为72%,土地开发率为78%,土地建成率89%,平均资产密度为2 926.8万元/hm2,工业土地产出率为 4 357.65 万元/hm2,工业土地税收产出率2 250万元/hm2,均高于全国平均水平,在长江三角洲地区也处于领先地位。
表5 浙江省开发区集约度分值表Tab.5 The evaluation result of land intensive use in development zone of Zhejiang Province
4.2 开发区土地集约利用程度存在空间差异
根据采集的样本数据并结合评价结果,利用ARCGIS中的专题地图制作工具对浙江省开发区土地集约利用程度划分等级,并进一步结合浙江省的实际情况,得出开发区土地集约利用程度在空间分布上具有以下特征:东高、中平、南北低(图3)。东部沿海的宁波、温州、台州等地开发区土地集约利用水平较高,集约度分值均在0.9以上,属于高度集约利用;绍兴、金华作为浙江省的腹地,集约度分值在0.85~0.9之间,处于中间水平;南北两端的湖州、嘉兴、衢州、丽水等市的开发区土地集约利用程度相对较低,集约度分值在0.85以下。
图3 浙江省开发区土地集约利用程度空间分布图Fig.3 Directional distribution of the land intensive use in development zone of Zhejiang Province
开发区土地集约利用程度的空间差异与开发区内部的产业结构和发展方向具有密切联系。浙江省东部沿海地带的开发区主要以提高自主创新能力为目标,以科技为支撑,发展外向型经济。生物医药、信息通信、新材料、先进制造等科技含量高、经济效益大、土地需求小的高新技术产业的存在,保证了开发区土地得以高度集约利用。而以绍兴、金华为代表的浙江中部地区的开发区多把纺织、五金冶炼等粗放型的制造业作为支柱型产业,虽然这些产业投入高、产出高,但是用地需求量也高,土地集约利用程度有待进一步提高。与前两者相比,浙江省南北两端的开发区土地集约利用程度相对比较低,工业生产多为高污染、高能耗产业,土地利用相对粗放,因此,加快地区经济发展和产业结构转型升级是此类地区的重要任务,也是提高开发区土地集约利用程度的有效措施。
虽然浙江省开发区土地集约利用程度在空间上主要以东高、中平、南北低为特征,但也存在几个特殊情况。其一,杭州市虽然地理位置比较靠西,在浙江省不属于东部沿海城市,但是作为省会城市,是浙江省政治、经济、文化中心,杭州市开发区的规划、投资与建设得到了从中央到地方的高度重视,土地集约利用程度也相应较高。其二,舟山是浙江省最东端的一个、属于东部沿海城市的范畴,但是作为国家的海防前线,其工业化发展受到一定限制,当地主要以渔业和旅游业作为经济来源,开发区内食品加工和渔具生产类企业较多,产值低、用地量大是导致舟山开发区土地集约利用程度较低的主要原因[10-12]。
4.3 集约度与经济发展水平高度相关
土地集约利用是处理好经济发展与资源保护之间关系的重要措施。经济的快速发展是开发区土地集约利用的前提条件,土地集约利用又为经济持续发展提供了保障。随着浙江省各市GDP由高到低排列,集约度曲线也呈下降趋势(图4)。
图4 经济发展水平与土地集约利用程度Fig.4 Economic development and land intensive use
为了能更精确地研究两者之间的关系,借助SPSS17.0软件对GDP与集约度进行了相关性分析,结果显示两者之间的相关系数高达0.903。因此,开发区土地集约利用程度与经济发展水平之间是相互联系、相互影响的,一方面只有经济发展了,土地集约利用所需要的各种投入才能有所保证;另一方面,土地集约利用为实现经济包容性增长提供了条件[13]。
5 结论
开发区土地集约利用评价是一个综合性的系统工程,不仅需要构建一套全面合理的评价指标体系,而且要凸显出科学性与合理性。与传统评价方法相比,BP人工神经网络的最大优点在于评价的客观性。它能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小[14],从而避免了人为因素对评价结果的影响。通过本次研究,不仅准确客观地评价了浙江省开发区土地集约利用水平,而且证明了BP人工神经网络在土地集约利用评价工作中的实用价值。因此,随着模型本身不断发展和完善,BP人工神经网络技术可成为土地集约利用非线性定量评价的一个好方法。
[1]龙花楼,蔡运龙,万军.开发区土地利用的可持续性评价[J].地理学报,2000,55(6):719 -728.
[2]Li Chaoqun,Guo Shenglian,Zhang Jun.Modified NLPMANN Model and Its Application[J].Journal of Hydrology,2009(1-2):137-141.
[3]苑韶峰,吕军.利用人工神经网络进行国有土地价格评估的探讨[J].上海交通大学学报(农业科学版),2004,22(2):188 -203.
[4]周伟,王秀兰.节约和集约用地评价指标体系研究[J].安徽农业科学,2007,35(2):491 -493.
[5]严太山.基于BP神经网络的玻璃瓶裂纹检测模型[J].科技情报开发与经济,2005,15(8):182 -183.
[6]李双成,郑度.人工神经网络模型在地学研究中的应用进展[J].地球科学发展,2003,18(1):68 -78.
[7]常青,王仰麟,吴健生,等.城市土地集约利用程度的人工神经判定——以深圳市为例[J].中国土地科学,2007,21(8):26 -31.
[8]Joseph P Bigus.Data Mining with Neurak Networks[M].McGraw:Hill Companies,1996:88 -89.
[9]蔡昕,曾维忠,张华,等.中国南方经济开发区土地集约利用评价——以浙江、四川、贵州、海南为例[J].中国农学通报,2010,26(14):314 -318.
[10]吴旭芬,孙军.开发区土地集约利用的问题探讨[J].中国土地科学,2000,14(2):17 -21.
[11]曲福田,吴郁玲.土地市场发育与土地利用集约度的理论与实证研究[J].自然资源学报,2007,22(3):445-454.
[12]叶剑平,蒋妍,罗伊·普罗斯特曼,等.2005年中国农村土地使用权调查研究——17个省调查结果及政策建议[J].管理世界,2006(7):77-84.
[13]陶志红.城市土地集约利用几个基本问题的探讨[J].中国土地科学,2000,14(5):1 -5.
[14]杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001:23-24.