基于maxEnt模型的包头市达茂旗居民点空间分布适宜性评价
2021-02-05周海涛宁小莉张雪峰魏光慧
周海涛, 宁小莉, 张雪峰, 魏光慧
(内蒙古科技大学 包头师范学院, 内蒙古 包头 014030)
农村居民点作为人类生产生活的重要载体[1-3],伴随着中国改革开放社会经济的飞速发展,在快速城镇化和工业化的扰动下[4],以及城乡二元结构的长期束缚和“重城轻乡”发展战略导向驱使下[5-6],农村居民点用地粗放、功能单一、缺乏规划、空心化、贫困化、环境污染化等一系列“乡村病”日益凸显、越发严重[7]。党的“十九大”审时度势,鲜明指出中国特色社会主义进入新时代,并首次提出“实施乡村振兴战略”,致力于建设“产业兴旺、生态宜居、乡村文明、治理有效、生活富裕”的现代化新农村[6]。乡村振兴,生态宜居是关键,居民点适宜性评价是进行乡村整治、优化重构,改善人居环境的前提基础[8-10]。因此,在新时代实施乡村振兴战略背景下,基于科学、客观的居民点适宜性评价结果,立足区域发展实际、根据资源禀赋因地制宜的探索开展人居环境整治,已成为亟待解决的重点前沿课题。
国际学者针对农村居民点适宜性评价开展了大量研究,取得丰硕成果。总结已有研究,主要呈现以下几方面特点:(1) 研究地域多样化。涵盖平原、山地、农区、盆地、少数民族区域和生态经济区,主要有陕西关中平原腹地西安杨陵区[11]、宝鸡市陇县[12]、黑龙江省五常市[13]、山西忻定盆地忻府区[14]、江西省潘阳湖生态经济区潘阳县[15]、西南典型低山丘陵区[16]以及四川盆地震后重建北川羌族自治县[17]、川中丘陵隆昌市[18]、成都平原都江堰市[19];(2) 评价指标完善化。在传统的土地适宜性评价指标,例如高程、坡度、坡向等自然因素[19]以及距道路、距城镇等区位因素[16]的基础上,根据评价目标的导向性以及区域的差异性,反映社会经济发展状况的人居可支配收入、人口城镇化率、土地经济密度等因子,以及土地利用类型、生态保护区、人文景观、地质灾害、植被覆盖度等生态环境因素逐渐纳入到评价指标体系中[13-15,20];(3) 研究数据多源化。涵盖了中国资源3号卫星、全球MODIS NDVI,Landsat OLI,DEM等遥感影像数据,土地利用现状、国土资源调查及年度变更等土地利用数据,地形图、土壤图、交通道路、河流水系、植被、地质灾害、城乡规划等辅助数据以及统计年鉴等社会经济统计数据[11,13,21-22];(4) 评价模型、理论丰富化。在传统的土地资源学土地适宜性评价理论基础上逐渐引入景观生态学、生态位理论[23-24]、AVC三力[20]、“源、汇”景观理论等[25]新理论,评价模型在传统的AHP层次分析法基础上,利用RS遥感影像,基于GIS空间分析,最小积累阻力模型[19]、灰靶模型[26]、生态位适宜度模型[27]、物元模型等[28]模型方法已广泛应用到居民点适宜性评价中。已有研究成果丰富了农村居民点适宜性评价前沿研究,为农村居民点规划、整治、重构,人居环境改善及乡村振兴战略实施提供科学依据。但尚且存在部分问题没有很好的解决,例如评价因子权重赋值人为主观臆断现象。截至目前,评价指标因子选取和因子权重赋值尚无统一规范或标准,主要依靠参与人员或专家经验进行权重赋值,因而由于人员的专业背景、学术经验差异化以及研究区域的独特性,导致因子权重赋值存在较为严重的人为主观臆断现象,进而引发评价结果准确性存在偏差。
基于数据驱动的机器学习方法可以杜绝人为主观臆断影响。近年来,随着信息科学技术的兴起,使得基于数据驱动的机器学习方法在土地科学领域的土地类型分类[8]、城市扩张[29]、资源生态安全评价[30]、栖息地适宜性评价等[31]方面得到了广泛运用。探讨基于数据驱动的机器学习方法在居民点适宜性评价领域应用的案例成果虽为罕见,但已成为学术前沿研究趋势[8]。因此,本文以生态环境脆弱、少数民族边疆地区的内蒙古包头市达尔罕茂明安联合旗(简称达茂旗)为例,基于数据驱动的机器学习maxEnt模型方法,选取DEM、坡度、坡向自然环境因素,距道路距离、距城镇距离区位条件因素,距耕地距离、距林地距离、距水域距离生产条件因素以及植被覆盖度、距草地距离生态环境因素,对达茂旗居民点空间分布适宜性进行评价研究,进而厘清各因子要素对居民点适宜性影响的重要程度,明晰适宜区居民点与各因子要素的最佳配置关系,以期为该区域居民点优化整治、人居环境改善提供新思路。
1 研究区概况
达茂旗全称达尔罕茂明安联合旗,地理位置处于109°16′—111°25′E,41°20′—42°40′N,位于阴山山脉北麓,北与蒙古国接壤,东邻乌兰察布市四子王旗,西接巴彦淖尔市乌拉特中旗,南连呼和浩特市武川县、包头市固阳县,国境线长88.6 km。达茂旗是包头市唯一以蒙古族为主体、汉族占多数、多民族聚居的边境少数民族地区,旗内总人口12万人,其中少数民族1.83万人(蒙古族1.73万人),有蒙、汉、回、满等15个民族。全旗管辖7个镇、2个乡、3个苏木、77个村(嘎查)委员会,总面积1.82万km2,其中天然草场面积1.66万km2,是内蒙古自治区十大天然牧场之一。达茂旗地处大青山西北内蒙古高原地带,地势南高北低,缓缓向北倾斜,南部属丘陵区,中、西有低山陡坡,北部属高平原台地,间有开阔原野,最高海拔1 846 m,平均海拔1 367 m。达茂旗地处中温带,又深居内陆腹地,大陆性气候特征显著,属中温带半干旱大陆性气候。达茂旗地广人稀,资源丰富,民族文化底蕴深厚,居民点建设功能单一,缺少规划,呈“满天星”的高度离散特征[32]。
2 数据来源与研究方法
2.1 数据来源及处理
研究所用数据主要包括达茂旗2016年1∶5万土地利用类型及道路数据、Landsat8 OLI(时相为7—8月)和DEM遥感影像数据,研究区行政边界等矢量数据。基于ArcGIS 10.0软件平台,利用DEM数据提取研究区坡度、坡向因子。以土地利用类型数据为基础,提取研究区河流水域、林地、草地、耕地、居民地及城镇图层。利用ENVI 5.1软件对Landsat8 OLI数据进行辐射定标、大气校正、镶嵌等处理。所有因子图层统一投影坐标系,进行掩膜裁剪等预处理。
2.2 研究方法
2.2.1 maxEnt模型 生态位被认为是一个生物单元(个体、种群或物种)生存条件的总集合体,其主要反映生物个体或种群在生态系统中,在时间空间上所占据的环境、位置及其与相关种群之间的功能关系与作用[23-24,33-34]。农村居民点是生产生活等综合功能的重要载体,受区域自然、社会、经济等多重因素的影响与制约,是一种自然—社会—经济综合一体的复合生态位[23-24]。因此,生态位理论已广泛应用到居民点适宜性研究领域中。maxEnt模型由Philips团队于2004年利用JAVA语言编写开发,利用物种“出现点”样本数据及周边环境特征信息,计算最大熵概率的可能分布进而预测物种潜在的最佳空间分布位置及释义与周边环境关系的一种基于数据驱动的机器学习生态位理论经典模型[35-36]。maxEnt模型自发布以来在物种潜在分布预测[37]、栖息地适宜性评价[31,36]、疾病空间传播[38]、人口与社会环境关系评价[39]、古文化遗址保护等[40]研究领域备受国内外学者的青睐,部分学者已将maxEnt模型引入到居民点适宜性评价[41]、聚落格局优化等[42]人居环境研究领域中。
2.2.2 因子选取 农村居民点作为人类活动的重要空间场所,其空间分布受自然因素、社会经济条件等多重因素影响与制约[32]。综合已有研究成果[43-45],本文选取DEM、坡度、坡向自然环境因素,距道路距离、距城镇距离的区位因素,距耕地距离、距林地距离、距水域距离生产条件因素以及植被覆盖度、距草地距离生态环境因素对达茂旗居民点空间分布适宜性进行评价研究。
(1) 自然环境因素。基于ArcGIS 10.0软件平台,利用空间分析功能,从研究区30 m×30 m分辨率的DEM数据中计算出研究区坡度、坡向因子。
(2) 区位条件因素。基于研究区2016年1∶5万土地利用数据,利用属性提取功能提取出研究区城镇图层,采用距离制图功能计算出距城镇距离因子。对研究区1∶5万道路数据距离制图得到距道路距离因子。
(3) 生产条件因素。基于研究区2016年1∶5万土地利用数据,利用属性提取功能提取出研究区耕地、林地、水域图层,采取距离制图功能得出距耕地距离、距林地距离和距水域距离因子。
(4) 生态环境因素。利用研究区时相为7—8月的Landsat8 OLI影像数据,采用ENVI 5.1软件,结合像元二分法[46-47]提取研究区植被覆盖度因子。利用ArcGIS 10.0属性提取功能从土地利用数据中提取草地图层,采用距离制图功能获得距离草地距离因子。
2.2.3 模型构建 将2016年居民点数据按照maxEnt模型要求,以名字和经度、纬度编辑保存为.asv格式文件。所有图层统一投影坐标系,统一边界及分辨率,转换为.asc格式。随机选取70%居民点数据用于模型驱动,30%数据用于精度验证,选择刀切法(Jackknife)判读环境因子重要性。利用ROC曲线下的AUC值检测模型精确度,AUC值在0.5~0.7表示模型精度较低;0.7~0.9表示模型精度较好;0.9~1代表模型效果最优精度较高[41,48]。为提高评价精度,模型重复迭代运行10次,结果以Logistic形式输出。
阳光餐饮示范街(区)的审核是与中国烹饪协会北京市餐饮行业协会联手,从基础条件、明厨亮灶、管理水平、诚信管理、社会责任、清洁卫生等维度进行的综合评判。今年首次开展的阳光餐饮示范村遴选工作,中国烹饪协会结合北京美丽乡村建设,挖掘出了6个各具特色的示范村,即:门头沟清水镇黄塔村、昌平十三陵镇仙人洞村、延庆大庄科乡铁炉村、怀柔喇叭沟门满族乡中榆树店村、怀柔汤河口镇后安岭村、平谷黄松峪乡刁窝村。
3 结果与分析
3.1 评价体系因子量化结果
适宜性评价指标体系因子量化结果见图1。研究区高程值为1 000~1 861 m(图1A),其坡度(图1B)最大值为53.947°,坡向值范围为0°~359.665°(图1C);区位条件因素中居民点距道路距离(图1D)及距城镇距离(图1E)其最大值分别为68 503,112 281 m;生产条件因素中居民点距林地距离最远,其峰值为112 295 m(图1G),距耕地(图1F)及水域距离(图1H)最大值依次为87 957, 69 385 m;生态环境因素其植被覆盖度(图1I)值在0~1区间,达茂旗东南部地区植被覆盖度值较高;居民点距草地距离最大值为66 628 m(图1J)。
图1 评价因子量化结果
3.2 maxEnt模型评价结果
ROC曲线分析表明,模型10次迭代运行结果AUC平均值为0.753,远高于模型随机AUC值(0.5),表明maxEnt模型评价精度较好,具有一定适用性。
3.3 居民点空间分布适宜性评价结果
利用ArcGIS 10.0空间分析的重分类Natural Breaks(Jenks)方法对maxEnt模型适宜性评价结果进行适宜性等级划分,依次划分为4个等级(图2),分别为非适宜区、次适宜区、较适宜区和最适宜区。根据适宜区空间分布图,计算出各适宜等级区所占研究区的面积及百分比(表1)。达茂旗居民点最适宜区面积为3 274.498 km2,仅占研究区总面积的18.738%,研究区内较适宜区所占面积最大,占比为27.656%,略高于次适宜区等级面积。
图2 达茂旗居民点空间分布适宜性等级
由图2可见,达茂旗居民点空间分布最适宜区主要分布在百灵庙镇东北部、石宝镇东南部的石宝村、腮乌素村、幸福村,希拉穆仁镇的哈拉乌素、白彦淖尔,乌克忽洞镇的乌克忽洞村、大西滩村、乌兰忽洞村和东河村,西河乡的西河村、前河村及德令沟村,达尔罕苏木乡的查干敖包嘎查南部、哈沙图嘎查等区域。非适宜区主要分布在达茂旗北部的满都拉镇、巴音花镇及查干哈达苏木区域内,达茂旗西南部的明安镇也存在大面积非适宜区。
表1 2016年居民点空间分布适宜性等级划分
3.4 结果分析
3.4.1 因子重要性分析 maxEnt模型使用刀切法判断环境因子的重要性。如图3所示,距道路距离、距耕地距离及距林地距离因子对居民点空间分布适宜性影响较大,其次为距草地距离、距城镇距离及植被覆盖度值,而距水域距离、坡度、DEM及坡向因子对居民点适宜性影响作用较弱。
3.4.2 评价因子与居民点空间分布适宜性关系分析根据maxEnt模型模拟各因子对居民点空间分布适宜性影响的反映曲线(图4),可以直观分析出达茂旗居民点空间分布适宜性随各因子数值的改变而变化的趋势。图4A显示达茂旗居民点随着DEM值的增加其适宜性逐渐增大,大约DEM值在1 350~1 400 m区间时适宜性达到峰值,DEM值在1 400~1 650 m时居民点适宜性趋于平稳变化不大。坡度因子(图4B)反映出随着坡度值从0°增大其适宜性增加,在坡度值达到约2.5°时最适宜,随后坡度值增加其适宜性迅速降低。坡向值大约在126°~234°区间时最适宜居民点分布(图4C),该区间为东南坡、南坡和西南坡。图4D为达茂旗居民点适宜性与距道路距离的关系,随着距道路距离的增加其适宜性逐渐降低,大约在距离道路1 500 m时适宜性不再随距离的增加而发生变化。达茂旗居民点空间分布适宜性距城镇距离的变化趋势整体与距道路距离因子呈现出一致性,但距城镇距离因子变化趋势缓慢(图4E)。随着距耕地距离的增加达茂旗居民点适宜性下降,在距耕地距离约为4~15 km时,适宜性无变化,超过15 km时适宜性呈断崖式下降,超过临界值约20 km之后适宜性趋于平缓(图4F)。距林地距离对达茂旗居民点适宜性的影响表现出随着距离的增加其适宜性逐渐降低的趋势(图4G)。图4H表明距水域距离与距耕地距离因子影响趋势相似,距水域距离值约在1.5~12.5 km区间时适宜性无明显变化,在此临界值后,适宜性断崖式迅速降低,断崖式现象较明显。达茂旗居民点空间分布适宜性随着植被覆盖度值的增加而表现出明显的增加趋势,表明植被覆盖度值越大适宜性越高(图4I)。草地对达茂旗居民点空间分布适宜性的影响表现出距草地距离增加其适宜性增加,大约在300~800 m距离时最适宜居民点空间分布(图4J)。
图3 因子重要性刀切图
4 讨 论
评价因子响应曲线显示出,达茂旗居民点空间分布适宜性分区在高程值选择上并未呈现出低地取向性,高程值约在1 350~1400 m时适宜性最高,在1 400~1800 m时也呈现出较好的适宜性,该结果与已有研究结论一致[32,49]。达茂旗地处阴山北麓,区内地势南高北低,呈现出向北逐渐倾斜趋势,居民点空间分布上也具有南部聚集北部较离散的特征。坡度值在0°~2.5°区间内随着坡度值增加其适宜性增高,而在15°临界值之内,随着坡度增加其适宜性降低,该结果与一般研究结论相同。达茂旗居民点空间分布适宜区多集中在坡向值126°~234°,即东南坡、南坡和西南坡上。李飞等[50]对同属于农牧交错区的科尔沁左翼中旗农村居民点研究中同样证实农牧交错区的居民点在坡向选择中部分居民点坐落于东南坡等阴坡,同样现象在张鑫等[49]对达茂旗居民点空间分异特征研究中也得到佐证。
maxEnt模型与传统模型对比在对达茂旗居民点空间分布适宜性评价中表现出一定的优越性,为基于数据驱动的机器学习模型与方法对乡村地理学研究中居民点适宜性评价、人居环境优化重构等研究提供参考案例。但在maxEnt模型评价结果进行适宜区等级划分中尚无统一标准,进而导致各类适宜区空间分布位置及面积大小等受到一定影响。农村居民点作为人类生产生活的重要载体,已然成为一种自然—社会—经济的复合生态位,深受自然环境、社会经济发展、民族文化、民族信仰,政府调控政策等多重因素的影响,由于数据获取等原因,本文仅局限于单一时间点分析,而未能够对其进行长时间序列的综合全面研究。maxEnt模型虽然备受国内外学者青睐,近年来得到了较为广泛的认可和较高的使用率,但该模型其普适性等问题还需慎重考虑,通过广泛的应用及逐渐的改进优化,该模型将会给居民点适宜性研究带来新的憧憬,基于数据驱动的机器学习模型与方法也终将开拓乡村地理学研究的新境界。
图4 因子响应曲线
5 结 论
(1) 达茂旗居民点空间分布最适宜区面积最小,主要分布在达茂旗百灵庙镇东北部、石宝镇东南部、希拉穆仁镇南部、达尔罕苏木乡西北部及达茂旗南部的乌克忽洞镇及西河乡范围内,非适宜区多集中在达茂旗北部的满都拉镇、巴音花镇和查干哈达苏木区域内,所占面积高于最适宜区占比。
(2) 距道路距离因子对达茂旗居民点空间分布适宜性影响最为重要,距草地距离、距城镇距离及植被覆盖度因子影响重要性低于距耕地距离和距林地距离因子。相比较上述因子而言,距水域距离、坡度、DEM及坡向因子对达茂旗居民点空间分布适宜性影响作用最弱。
(3) 高程值在1 350~1 400 m时最适宜,无低地取向性,但有较明显的低平缓坡度指向性,0°~2.5°适宜性最高。坡向方面适宜区青睐于南坡和西南坡,东南坡阴坡上也具有一定适宜性。随着距道路、城镇的距离值增加适宜性降低。距耕地距离因子与距水域距离因子影响趋势相似,起初适宜性随着距离增加而降低,接着出现适宜性平缓区域,超过某个临界值后适宜性呈断崖式下降,最后趋于无变化。距草地距离约300~800 m时适宜性最好,植被覆盖度值越高其居民点空间分布适宜性越高。