基于BP神经网络法的耕地质量定级评价
——以襄阳市城区为例*
2019-07-03张朝晖马泽玥
张朝晖,聂 艳,马泽玥
(华中师范大学地理过程分析与模拟湖北省重点实验室,湖北武汉430079)
0 引言
“像保护大熊猫一样保护耕地”[1],耕地是人们赖以生存的基本条件,耕地质量对于保障国家粮食安全起着重要作用。在推动高质量发展的背景下,更加关注耕地质量,妥善保护耕地和推动高标准基本农田建设则愈加重要。
耕地的质量是各种因素综合影响的结果,包括经济、自然、社会、环境等多方面。目前,耕地质量评价多以定性和定量方法进行,常见方法有因素法[2]、模糊评价法[3]、层次分析法[4]、主成分分析法[5]、灰色关联度法[6]、熵权法[7]等。然而这些方法多少存在主观性过大或者其他不足,在保证评价客观性上存在欠缺。BP神经网络是一种多层前馈网络,其算法原理是基于数据的逆向传播,能够很大程度上减轻评价中主观因素影响,以获得客观准确的评价结果[8]。研究表明,耕地质量评价适宜使用神经网络的方法,通过对样本的训练来自动找寻质量水准与各影响指标因素之间的非线性关系,从而更方便、科学、客观地对耕地质量进行模拟评价。文章以襄阳市城区为例,在耕地质量评价工作中采用了BP神经网络的评价方法,后利用BP神经网络法得出的质量评价结果与传统因素法的评价成果进行对比分析,以探究神经网络方法的可行性、准确性,也为耕地的精准定位、分类保护提供参考与借鉴。
1 研究区域概况与数据来源
1.1 研究区概况
襄阳市,坐落于湖北省西北部,是汉江流域中心城市以及著名的历史文化名城,该研究的襄阳市城区包括襄城区、樊城区、高新技术开发区、鱼梁洲经济开发区、东津新区以及襄州区的部分区域,襄阳市城区主要有由丘陵和平原两种地貌类型所组成,市区地势由西南向东北降低,该区属于亚热带湿润性季风气候,冬冷夏热,春秋无常,年均温度约在15℃左右,年降水量可达820~1 100 mm。土地资源方面,城区土地面积以农用地最多,达10.499 1万hm2,占比69.02%;建设用地3.474 1万hm2,占比22.84%;未利用地1.238 6万hm2,占比8.14%。
1.2 数据来源
研究数据包括自然、经济、区位等多方面资料,通过资料收集、实地调查等方式,得到湖北省土肥站的耕地样点数据、襄阳市最新的耕地质量等别年度更新成果、襄阳市土地利用现状数据库、襄阳市年鉴等自然环境与经济情况资料,其中气温、降水资料来源于湖北省土肥站襄阳市城区的1 389个耕地样点的气候数据,研究区的社会经济资料主要参考襄阳市统计年鉴和实际走访调查数据,有关土地的相关信息资料则是提取自襄阳市国土局的襄阳市耕地质量等别年度更新数据库和襄阳市土地利用现状数据库。依据来源实际可靠、单位标准统一、符合实际操作要求的原则,对收集数据进行核对检测,以确保数据真实可靠,并通过野外调查对部分资料进行补充完善。
2 研究方法
2.1 评价单元确定
耕地质量评价要以评价单元为基本,考虑到襄阳市城区耕地较多,能够反映农用地质量特征,故该文襄阳市城区耕地质量定级评价研究采用地块法划分定级单元,直接采用襄阳市耕地质量等别年度更新数据库中已有的耕地图斑作为该次评价工作的基本评价单元,共计1.2368万块。
2.2 指标体系构建
耕地质量具有多因素性,其受到自然、经济、社会等多方面综合影响,同时耕地质量的侧重点和主导因素也因研究尺度和研究区域的不同而有所差异,因此耕地质量评价体系要体现因地制宜的特点。奉婷等以自然质量、利用条件、空间形态和生态安全4个层面建立指标体系对北京市平谷区进行研究[9];温良友等用“过程—功能—质量—特性—指标”的体系建立田块尺度的评价体系[10];马瑞明等以河北省内丘县为对象,综合考虑气候因素、土地因素、人为工程设施因素对耕地质量的影响[11];辛芸娜等基于土壤、生态、环境和管理4个质量维度建立县域耕地质量指标体系对北京市大兴区耕地进行评价[12];马佳妮等从地学特征、土壤特性、环境状况、建设水平和生物多样性等5个维度构建耕地质量评价指标体系[13]。
该文在充分遵循生产性、可行性、典型性、主导性原则的基础上,结合襄阳市城区耕地的特点,基于自然因素、社会经济因素和区位因素3方面构建目标层,并以气候、地形、土壤、土地利用、基础设施、耕作条件、区位条件、交通条件8方面建立准则层,最终确定20个指标,构建起襄阳市城区域耕地评价指标体系,详见表1。
表1 襄阳市城区耕地质量评价指标体系Table 1 Cultivated land quality evaluation index system in Xiangyang urban area
2.3 指标属性获取
根据指标属性特点的不同,采用的多种方法获取指标属性数据。其中坡度、耕层厚度、剖面构层、地表岩石裸露度、表层土壤质地、土壤侵蚀程度、有机质含量、土壤pH值、灌溉保障率指标数据直接采用襄阳市耕地质量等别年度更新数据库中的对应资料。
积温和降水量指标数据则是通过克里金插值的方法对耕地样点的气候资料进行插值分析,并对属于襄阳市城区内的属性数据进行截取,以获取各耕地图斑气候数据。
耕地比重、人均耕地指标的属性数据是采用公式计算的方法进行,因耕地比重和人均耕地数据无法精准到各个地块,故以村庄为基本单位,通过咨询和走访调查收集整理每个村庄的人口数据,并通过公式计算获得每个村庄的耕地比重和人均耕地数据,最后把属于该村庄的耕地图斑都赋予同一数值。耕地比重和人均耕地的计算公式分别为村庄耕地面积与村庄总面积的比值和村庄耕地面积与村人口数量的比值。
沟渠密度、水系密度以及路网密度指标属性数据的获取。首先沟渠密度、水系密度和路网密度数据直接提取自襄阳市土地利用现状数据库,而后采用叠加分析的方法使其与耕地数据进行叠加,获得每块地块所对应的沟渠、水系、路网数据,最后通过公式计算得到指标属性。密度的计算公式则为地块中对应的沟渠、水系、路网的面积或长度除以地块总面积。
耕作距离和中心城镇影响度是空间扩散型因子,应采用缓冲区分析的方法进行数据获取。首先在襄阳市土地利用现状数据库中提取中心城镇点和居民点数据,后通过ArcGIS中的多级缓冲分析,设定不同的缓冲距离,再与评价单元进行空间叠加以获取评价单元的数据值。
空间扩散型因子也要考虑其数值的空间衰减问题,以中心城镇影响度为例,首先将中心城镇对周围空间的影响度Fi分为几个典型等级并赋予其分值,采用二次衰减模型获取di值,距离越小作用分值越大。依据不同的di做缓冲区分析后将各等级缓冲区图进行叠加,在相应的缓冲区带中赋予相应的值,公式为[14]:
式(1)~(2)中,di表示某点在其影响因素的最大距离内距离其影响因素的实际距离;d0表示该要素的最大影响距离;Fi表示不同空间距离上的作用分值;S表示评价区域总面积;n表示影响中心的数量。
田块连片度和田块形状的属性数据也采用公式计算获取。可直接在ArcGIS中使用字段计算器功能获得,田块连片度、田块形状计算公式分别为:
式(3)中,F表示连片度,n为斑块总个数,Ai为斑块i面积,A为斑块总面积。
式(4)中,D表示田块形状,P表示田块周长,A表示田块面积。
2.4 因素法
因素法是一种比较经典的耕地质量评价方法,其通过对研究区域耕地质量的各种影响因素进行研究分析,设置耕地质量的评价指标体系,然后对每个指标的影响程度和重要性进行判别获取,以得到指标对应权重,而后依据指标数据对其进行量化赋分,最后通过计算得出耕地的质量分值。因素法定级具有独立性强、自成体系、受等别指数干扰小、易于操作等特点[15]。
依据《农用地质量分等规程》(GB/T 28407—2012)、《农用地定级规程》(GB/T 28405—2012)等相关规程和文件的指导,襄阳市于2018年采用因素法开展了襄阳市城区耕地质量定级评价工作,并形成了襄阳市城区耕地质量定级评价成果与数据库。
2.5 BP神经网络法
BP是一种多层前馈式误差反向传播网络,其高度的仿真功能经过网络反复学习能有效修正误差,可以跨越传统评价中的专家打分环节,在一定程度上避免主观因素对结果的影响[16]。BP神经网络的另一优势在于其可以不断调整模型参数,如权重和阈值,以便不断降低模型误差,提高网络的精确性。
近年来,人工神经网络不断趋于成熟与完善,并且在许多领域均有运用,该文在耕地质量评价上尝试采用BP神经网络的方法,对BP神经网络方法的可行性、准确性进行测试和研究,并与因素法结果进行对比分析。
3 基于神经网络的耕地质量评价
3.1 数据的量化与归一化处理
根据属性数据的特点,可将耕地质量评价指标分为语言型、域值型和扩散型。语言型指标,是指指标的数据不是具体的量化数字,而是语言性的描述,如坡度、土壤质地、剖面构层、地表岩石裸露度等;域值型指标,是指指标数据自身就具有级别划分,并且存在一定的区间,域值型指标包括土壤有机质和pH值;扩散型因子,该类因子的数值会随着影响距离的增加而呈现出逐渐减弱的趋势,中心城镇影响度和耕作距离属于扩散型因子。因此,对于不同类型的指标数据,也要采用特定的量化方法。对于语言型指标的量化赋值可直接参考依据《农用地质量分等规程》(GB/T 28407—2012)和其他相关资料中的量化标准,成果如表2。
表2 土壤质地的量化结果实例Table2 Example of quantitative results of soil texture
域值型指标,域值型指标数据的量化处理应采用下式进行量化赋值[17]:
式(5)中,Fi指标因子第i级别所对应的分数;Ti表示指标因子第i级别域值的中值;T优表示指标因子最优级别域值的中值;T劣表示指标因子最劣级别域值的中值。
中心城镇影响度和耕作距离是空间扩散性因子,指标属性数值获取工作中已对其指标数据进行了获取与量化,故不需要再次处理,可直接采用。其余已有数值的指标则不需要再进行量化处理,以上各项指标量化完成。
BP神经网络要求输入数据要在0~1的区间内,因此该文采用极差法[18]的方式对输入数据预先进行归一化处理,分为两种情况,公式(6)是正相关指标的处理,公式(7)是逆相关指标的处理:
式(6)~(7)中,maxXij表示各指标最大值;minXij表示各指标最小值;Xij表示各指标实际值。
3.2 神经网络模型构建与参数选取
该文网络模型采取使用由输入层、隐含层、输出层组建的3层次BP神经网络模型。tan-sigmoid型传递函数的tansig的输入值可任意选取,线性传递函数purelin的输入输出都能取任意值,因评价指标数据都进行了归一化处理,故选取tansig函数为隐含层函数,purelin函数为输出层函数,训练函数选取L-M反向传播算法即trainlm函数[19]。
评价所构建的指标体系共有20个指标,所需要得到的结果为1个即评价分值,故分别采用20和1作为此次BP神经网络模型的输入层和输出层神经元数。
对于网络模型隐含层节点数量的选择则可采用多种方式,最常用的方法是Kolmogorov[20]法,公式为:
式(8)中,Q表示隐含层节点数;A表示输入层节点数;B表示输出层节点数;C表示1~10之间的任意整数。
为了得出更好的实验结果,综合考虑训练次数、拟合程度等因素,多次改变隐层数量进行实验,结果表明当隐层数为12时,模型效果最佳。在BP神经网络模型的参数选择上,学习率选取0.01、期望误差选取0.001、最大训练次数则选取10 000次,综上BP神经网络模型建立完成,详见图1。
3.3 训练检验样本选择
构建一个BP神经网络模型需要选取一定的样本数据以作为训练样本和测试样本,并通过训练样本数据以构建和训练网络模型,通过测试样本对模型的性能和精度进行检验。本着随机分布的原则,选择1 000个地块数据作为训练样本,200个地块数据作为检验样本,共1 200个样本数据。
图1 襄阳市城区耕地质量评价的BP神经网络模型结构Fig.1 BP neural network model structure of cultivated land quality evaluation in Xiangyang urban area
3.4 评价结果
将选取的1 000个评价单元数据作为训练样本带入Matlab中进行模型计算,对网络模型进行构建和训练;而后将选取的200个检验样本带入模型,以检验网络模型的精度,并绘制检验样本的仿真分数与真实分数的相对误差图,详见图2、图3。
如图2所示,该BP神经网络模型的各项指标精度都达到0.93,相对误差都在0.08以下。通过以上误差数据的分析,可知此次构建的BP神经网络模型精度高且误差小,适用于耕地质量评价,可以用于预测其他耕地的质量。
图2 神经网络模型精度图Fig.2 Neural network model accuracy
图3 检验样本相对误差图Fig.3 Test sample relative error
3.5 结果对比
通过构建的网络模型对襄阳市城区的全域耕地质量分数进行预测,同时为了进一步检验模型精度,选取部分地块的预测结果与襄阳市城区耕地定级评价成果中对应地块的分数进行对比,详见表3。
表3 两种方法的耕地质量评价分值对比Table3 Comparison of the scores of cultivated land quality evaluation by two methods
由表3可知,BP神经网络法的预测结果十分接近常规因素法所得出的质量分值,进一步证实了BP神经网络法的可行性。依据襄阳市城区耕地定级评价成果中的耕地分级标准,对模型预测的分值进行级别划分,并从数量角度对各级别耕地的面积以及占比进行对比分析,见表4。
表4 两种方法耕地级别面积与比例Table4 Two methods of arable land level and proportion
由表4可知,BP神经网络法相比较因素法的评价结果在数量上存在一定差异,因素法的评价结果相对偏高,而BP神经网络法的评价结果偏低。同时,通过空间的比较也能更直观地观察出两种评价方法结果的异同之处,详见图4、图5。
由图4可知,BP神经网络法与因素法的评价结果在空间分布上差异不大,只在耕地级别分布上存在细微不同。张湾镇和东津镇西南部,神经网络法的评价结果略低于因素法;东津镇东北部耕地,神经网络法的评价结果高于因素法;卧龙镇以北,汉江以南的部分耕地,神经网络法的评价结果低于因素法。
图4 BP神经网络法耕地级别分布Fig.4 BP neural network method for cultivated land level distribution
图5 因素法耕地级别分布Fig.5 Factor method for cultivated land level distribution
同时,由图5也能对襄阳市城区耕地质量水平进行一定的把握。襄阳市城区的耕地质量水平总体良好,从耕地数量分布来看,位于中心城区的乡镇(街道)耕地的数量较少,城区周边的各乡镇是耕地分布的集中区域,其中东津镇和太平店镇的耕地面积最多;从耕地质量分布来看,襄阳市城区的耕地质量由东北向西南其质量水平不断下降,其中优质耕地在东津镇、张湾镇比较集中,而稍劣耕地则在卧龙镇和牛首镇分布较多。
4 结论与讨论
4.1 结论
该文以襄阳市城区耕地为研究对象,采用BP神经网络方法,建立网络模型,并通过模型进行耕地质量分值预测。同时,将BP神经网络法的评价结果与传统因素法的评价结果进行对比分析。初步得到以下结论。
(1)BP神经网络法模型的各项指标精度以及检验数据的相对误差都在可接受的范围,表明BP神经网络法具有一定可行性和准确性,并且适合用于耕地质量评价工作。通过对比分析,BP神经网络法的预测结果与因素法的成果差异不大,且使用神经网络法进行预测能够有效减轻人为主观因素对评价结果的干扰,同时提高评价过程的客观性和评价结果的准确性。
(2)襄阳市城区耕地整体质量水平良好,其中以二级地和三级地居多,面积占比分别为33.56%和46.19%;耕地数量分布状况存在空间差异,主要是中间少,四周多,城区少,郊区多;耕地质量的空间分布也不平衡,主要呈现出东北优西南劣的特点。
4.2 讨论
耕地质量评价是有效把握耕地质量水平、合理保护耕地、有效管理耕地的重要基础性工作,尤其是耕地质量评价指标的构建是进行评价工作的基本前提,该文以自然要素、社会经济要素、区位因素3方面建立起耕地质量评价体系,一定程度上反映了耕地各方面水平和质量,具有一定合理性、科学性;但也存在许多不足,如指标构建角度、构建层次、具体影响因素因子等还有待研究和优化,指标属性的获取与量化也需进一步改进和完善。
耕地质量评价方法多种多样,定性和定量的评价方法也层出不穷。该文采用的BP神经网络法具有客观、定量、非线性的特点,能够减少评价过程中的主观因素影响,其能够利用已知数据进行构建并训练神经网络模型,然后使用已建立的模型去预测未知数据,可有效避免主观因素带来的误差,且不需要提前设定权重,提高了耕地质量评价的准确度和效率;同时BP神经网络法也存在着问题和不足:(1)在进行网络参数数值设定时缺乏相关规范性的理论指导和标准依据,一般只能采用依据经验的方法进行;(2)BP神经网络可能存在预测结果不准确、不稳定的现象,称之为“过度拟合”,一般来说训练样本的数量多少和模型的精确度成正相关关系,但在训练样本达到一定数量时,训练样本数量增加模型的精度反而会下降。总之,BP神经网络法适合运用于耕地质量评价工作且具有一定的准确性,同时需要进一步的研究与完善。