APP下载

黄桃种植区提取及其潜在适生区预测*

2022-09-03李中元郑正彬林博文蔡祎晨王新生汪权方陈志杰

中国农业资源与区划 2022年5期
关键词:三湖环境变量适生区

李中元,郑正彬,林博文,唐 锰,蔡祎晨,王新生※,汪权方,陈志杰

(1.湖北大学资源环境学院,武汉 430062;2.区域开发与环境响应湖北省重点实验室,湖北 武汉 430062;3.湖北省农业遥感应用工程技术研究中心,武汉 430062)

0 引言

发展地方特色产业是乡村振兴的强大生命力,对加强当地自然资源的保护并促进其有效利用发挥着重要作用[1]。乡村特色产业中尤以种植业为代表,现有产业种植区域的快速获取及其适宜性区域的准确分析与预测,对产业的健康可持续发展有着重要意义[2]。

我国水果种植规模与产量位居世界前列,桃树的种植比例约占8.4%,黄桃作为桃树的一个亚属,在我国分布较为广泛。由于其富含α-胡萝卜素、β-胡萝卜素等氧化剂及多种人体所需的氨基酸,不但具有良好的食用价值和营养价值,而且还具有提高免疫力,延缓衰老,降低血糖血脂等功效,近年来备受人们的喜爱和关注[3]。黄桃的大量种植可以美化环境、涵养水土、调节气候,果业与旅游业更是能够推动当地的经济发展[4]。

合理利用土地资源,实现果业可持续发展,已经成为全球社会共同关注的问题[5]。目前的黄桃种植区分布广泛且过于分散,传统的果树种植面积调查大多是采用人工测量、统计抽样的方法,效率低,时效性较差,且工作量大。遥感技术具有时效性高,成本低等优点,被广泛应用于土地利用分类、作物种植提取等研究中并取得良好效果[6-8]。如徐新刚[9]等利用高分辨率遥感影像提取作物种植面积。姚红岩[10]等基于高分辨率遥感影像结合互花米草与芦苇的物候差异与光谱特征,运用实测剖面观测数据确定光谱指标和阈值综合提取湿地互花米草与芦苇混合交错带。姬兴辉[11]团队利用遥感评估赣南油茶种植区域适宜性并为当地该产业的发展提供科学参考依据。遥感在果树等经济作物的应用也比较广泛,如邢东兴[12]利用逐月高分影像探寻石榴树遥感辨识的最佳时相,杨屹鹍[13]将国产高分一号(GF-1)卫星结合Landsat-8 卫星进行香梨种植面积的提取,Anderson[14]等以遥感树木光谱结合机器视觉估算果园的收割前水果负荷并使用高分辨率卫星图像估算其指数,Yaohui Zhu[15]等采用时间序列遥感数据反演现有各果园的连续生长年龄。吴愈锋[16]等以多源遥感技术提取湄潭县全县茶叶种植信息,结合实地地质调查成果,利用GIS平台展开对茶叶潜在适生区的探索。由于哨兵二号(S2A)卫星空间分辨率较高分一号和Landsat-8遥感卫星空间分辨率高且具有高重访周期的环境监测能力[17],这为黄桃种植区的精准识别提供了很好的契机,同时也为特色产业潜在适生区的预测提供了数据基础。

种植业的发展往往受到水、土、气、热、地形等多种条件的影响。因地制宜、因时适宜是特色产业能够健康发展和推广的关键所在,需要进行准确的分析预测。在众多种植适宜性预测模型中[18,19],MaxEnt模型在模拟病虫害的传播,估计濒危动植物潜在生境质量[20],评估入侵物种风险[21],预测作物适宜生境[22]等均表现出良好效果。如Zhihang Zhuo[23]利用MaxEnt 结合GIS 分析得到全国范围花椒的生境适宜区。Touraj[24]等利用MaxEnt并结合土地利用预测模型模拟野生动物和生物的适宜性,根据生态系统服务功能划分保护重点,并模拟未来土地利用或土地覆被的变化,为保护生物多样性提供建议。以往对适宜区预测所需样点数据主要来源于全球生物多样性数据库(https://www.gbif.org/),但该网站的种质资源数据时效性不强,部分资源数据只能精确到“属”级别,“桃属”种植样点虽然丰富,但“种”一级的黄桃分布样点极少,这就给黄桃潜在适生区的预测造成了一定限制。因此,文章使用哨兵二号卫星影像数据,先提取黄桃种植区域,在此基础上结合影响黄桃生长的各类环境变量,利用最大熵模型MaxEnt 对黄桃在江汉平原的潜在适生区进行分析预测,力图为特色产业的种植与发展提供完整的技术体系,并为当地乡村振兴及产业布局与发展提供决策依据。

1 研究区概况

三湖农场,位于江汉平原四湖地区湖北省江陵县境内,空间分布范围为112°44'E~115°44'E,29°54'N ~30°39'N(图1)。始建于1960 年9 月,国土面积61km²,其中耕地33.3km²、林地11.33km²、精养鱼池1.33km²,总人口1.5万人,下辖3个生产大队26个生产小组。是湖北省农业现代化首批试点单位,该地区属亚热带季风湿润气候区,具有四季分明、热量丰富、光照适宜、雨水充沛、雨热同期,无霜期长等特点。全年日照时数1 827~1 897h、平均气温16~16.4℃、无霜期252~262d、平均降水量900~1 100mm[25]。地质地貌pH以中性、微酸性为主,耕地中有机质平均含量为5.4%;全氮含量平均为0.363%。农作物类型主要包括水稻、棉花、黄桃等。得天独厚的气候和自然环境非常适合黄桃的生长,其种植面积约667hm2(1 万亩)左右,占耕地面积的20.1%,目前黄桃已发展成为当地的特色产业。该实验区无论是地理环境,还是产业特色,都具有较强的代表性。

图1 研究区范围及样本点分布

2 数据与材料

2.1 遥感数据

该次使用的影像数据为2019年2—8月的Sentinel-2号卫星影像,来源于欧空局,Sentinel-2号卫星携带一枚多光谱成像仪(MSI)对植被、土壤具有良好的成像功能,Sentinel-2A 与Sentinel-2B 两颗卫星互补,重访周期为5d,通过(欧空局https://scihub.copernicus.eu/)进行免费下载。在光学数据中,该卫星含有3个对植被监测及其重要红边范围的波段。该文使用的是Sentinel-2 号卫星L1C 级品,L1C 是经过正射校正和几何精校正的大气表观反射率产品,并没有进行大气校正,利用欧空局提供的插件Sen2cor对该数据进行大气校正和辐射定标。经处理后L2A 主要包含经过大气校正的大气底层反射率数据,该文主要使用其蓝、绿、红以及近红外4个波段[26]。

2.2 黄桃地面样点数据

2019 年开展野外实地调查,利用无人机航拍以及地面GPS 记录,共获得建筑、水体、黄桃、林地、农田样点共500个,其中黄桃样点100个。将所得的黄桃样点数据按照种名、经度和纬度顺序存于excel表中然后另存为(.csv)格式。

2.3 环境变量数据

气象因子来源于世界气候数据库(https://www.worldclim.org/),高程数据来源于United States Geological Survey (USGS)网址(http://glovis.usgs.gov/),其中坡度、坡向由DEM 数据计算获得;土壤因子来自世界土壤数据库(http://webarchive.iiasa.ac.at/),中国地图与中国省级行政区划图(1∶400 万)来源于国家基础地理信息系统网站(http://nfgis.nsdi.gov.cn/)该文共选取了植被因子、气象因子、地形因子、土壤因子等共计4类18种环境变量,环境变量数据统一选自2015 年用于研究(表1)。

表1 潜在适生区预测环境变量

3 研究方法

将2019 年2—8 月三湖农场逐月时间序列遥感卫星影像数据经过辐射定标,正射几何校正、影像配准等预处理流程,利用哨兵二号的蓝、绿、红、近红,4 个波段,计算其归一化植被指数(Normal‐ized Difference Vegetation Index,NDVI)、归一化水体差异指数(Normalized Dif‐ference Water Index,NDWI)、比值植被指数(Ratio Vegetation Index,RVI)。根据现有各类地物样点数据提取各类地物不同时期植被指数并制作时间序列折线图,选取图中黄桃等地物两两间指数差异较为明显的3月份桃花开花时期影像,利用随机森林算法进行分类,以2019年野外实地监测地面样点等辅助数据计算其混淆矩阵求得精度评价。在生成的黄桃分布区选取100 个随机样本点,结合野外获取的100 个黄桃样点组成样点数据集导入最大熵模型MaxEnt,对黄桃潜在适生区进行预测(图2)。

图2 黄桃种植区提取及其适生区预测技术路线

3.1 植被指数计算

使用蓝band2、绿band3、红band4、近红外band8,4 个波段分别构建归一化植被指数,归一化差异水体指数,比值植被指数[27,28]。用于区分建筑、水体、黄桃、林地、农田5类主要地物。具体参数如表2所示。

表2 三湖农场各类地物指数及其说明

3.2 植被指数特征分析

提取2—8 月时间序列的建筑、水体、黄桃、林地、农田5 类地物的NDVI 并生成特征曲线如(图3)。从图3 可以看出,在3 月份,由于正值桃花盛开的季节,黄桃的NDVI 较高,其特征也较为明显,而研究区主要以中稻为主,3 月份农田中还未插秧,所以农田的NDVI 较低,介于水体和建筑之间;林地中有常绿针叶林和一部分落叶阔叶林,而在阳春3 月,落叶阔叶林也正处于新叶萌发时期,因此,林地的NDVI值高于农田、水体和建筑,但低于黄桃。因此,3 月份5 类地物的NDVI 均有较大的差异,是区分黄桃和其他地类的最佳时期。

图3 三湖农场各类地物NDVI时间序列曲线

3.3 随机森林分类

随机森林分类器,它是由Breiman[29]于21世纪初提出一种基于分类与回归树的机器学习算法,具有学习过程快,稳定性好,处理数据的精度高等特点,且不易产生过拟合。该文分别构建建筑、水体、黄桃、林地、农田5类地物样本,并计算了样本之间的可分离度,均介于1.8~2.0之间[30]。利用Python调用Scikitlearn 库 中的Random Forest Classification 工具,输入70%的样本对模型进行训练,并利用剩余的30%的样点进行交叉验证与打分,发现决策树数量为370时分类效果达到最佳,精度为0.848[31](图4)。

图4 随机森林决策树数量拟合精度

利用370颗决策树对随机森林的其他参数进行检验,确定其他参数最佳值如表3所示。

表3 随机森林分类重要参数最佳值及其含义

3.4 MaxEnt模型

1957 年Jaynes 提出最大熵理论,此后MaxEnt 在计算机科学,统计学等领域得到广泛应用[32],相比Bioclim,CLIMEX,DOMAIN,GARP 等物种分布预测模型,王运生[33]等利用ROC(Receiver Operating Characteristic)曲线分析法对进行了对比分析,研究结果显示MaxEnt预测效果最佳。且该模型对计算机配置要求较为简单,无需复杂的代码操作,操作界面简洁,运算速度较快,能够有效地以已知物种分布点作为样本数据,综合各类环境变量为约束条件,估算物种空间分布的概率,概率的高低对应其种植区域适宜性的强弱[34,35]。MaxEnt 最大熵模型被广泛应用于各类经济作物的适宜性预测。

在环境参数设置中利用刀切法来评价各生态因子的权重,用第1次筛选出的因子进行10 次MaxEnt 模型建模,选取预测模型最佳计算结果参与生境适宜度的提取及分析。然后将MaxEnt 模型输出的结果以ASCII 格式输出,最终将ASCII 转栅格进行重分类[36,37]。MaxEnt 模型运算通过开启刀切法反映不同环境变量在影响黄桃的生长适宜度中所占的权重,以ROC 曲线下所围成的面积AUC(Area Under Curve)对模型结果精度进行评价,以自然间断点分级法将AUC 分为以下4 类:AUC<0.6(失败),0.6≤AUC<0.7(较差),0.7≤AUC<0.8(一般),0.8≤AUC<09(良好)[36],当AUC小于0.75时,一般认为模型不可使用[37]。

4 结果分析

4.1 分类结果与精度评价

该文使用随机森林分类器对研究区的建筑、水体、黄桃、林地、农田5种主要类型进行分类,分类结果如图5 所示,黄桃主要分布于研究区的东部,研究区的中部、西南和北部也有零星的分布。经统计,研究区的遥感分类的黄桃种植面积为676 hm²,农场的统计数据显示,湖北省江陵县三湖农场现有黄桃676 hm²,一致性为98%,分类结果相对令人满意,说明利用遥感技术提取黄桃种植区具有较强的可行性。

图5 三湖农场黄桃分类

由表4 可知,总体分类精度为87%,Kappa 系数为0.84,黄桃的生产者和用户精度分别达到了91.4%和88.6%,满足分类精度要求。建筑和林地的分类精度较低,主要是因为农场的居民区较为分散,道路大多为田间小路,也较为细碎;而林地分类精度较低则是因为在三湖农场处于常绿针叶林和落叶阔叶林的过渡带,3 月份落叶阔叶林正处在返青并逐步长出新叶的过程中,而且三湖农场除黄桃外并没有大面积的林场或者森林,树木主要分布道路两旁,选用的哨兵二号卫星遥感影像的空间分辨率为10m,对于道路及两旁的行道树的提取就难免会受到一定限制。该文的主要研究对象为黄桃,因此,在时相上的选择主要是以黄桃的开花期为典型特征进而将黄桃与其他地物进行了很好的区分,并且也得到了满意的结果。

表4 三湖农场黄桃分类结果精度评价

4.2 黄桃潜在适生区预测

该文选取黄桃随机样本点共200个保存为(.csv)文件,对表1 中的18 个环境变量的栅格数据集统一经掩膜、坐标系转换、重采样等标准化处理为MaxEnt 模型要求的格式。将样点及环境变量导入MaxEnt 中,随机选取75%的样点数据作为训练集,其余25%的样点数据作为测试集。

该文Jackknife 结果表明:模型训练集的AUC 值为0.993,测试集的AUC 值为0.994,大于随机预测分布预测值0.5,同时达到了优秀水平(图6)。这表明预测出的黄桃分布记录不具随机性,即模型对黄桃在江汉平原的潜在适生区的预测结果可靠且结果精度较好。

图6 模型适用性检验AUC 值

环境变量对MaxEnt 模型的贡献率显示(表5):最小辐射(54.2%)、最大辐射(32.5%)、最低温度(9.4%),3 个变量对MaxEnt 模型预测贡献最大,累计贡献率达94.9%,是预测黄桃适生区必要的因素,能反映生境分布的大部分信息,以上环境变量贡献率各不相同,最小贡献的土地利用因子为0.9%左右,说明没有无关变量参与预测分析,环境变量筛选有效。

表5 主要环境变量贡献率 %

该文对上述5 个环境变量进行皮尔逊相关性分析,变量间相关系数绝对值大于0.8 则表明其两两之间具有较强的相关性[38-40],由于该文的环境变量两两之间相关系数绝对值均未超过0.8,因此选定上述变量作为影响黄桃种植适宜性的主要变量有效(表6)。

表6 影响黄桃地理分布关键环境变量之间皮尔逊相关系数

将Maxent 模型生成的江汉平原黄桃适生区数据根据经验和概率论“存在性”的原理分为5个等级[41,42](图7)。

由图7 可知,黄桃在江汉平原的高度适生区主要位于江陵县的中部及北部,中度适生区主要位于江陵县、沙市区南部,潜江市西南。在松滋市西部和宜城县和京山县北部也有零星中高度适生区。

图7 基于MaxEnt模型预测黄桃在江汉平原的适生区分布

建模中各主要变量的响应曲线如图8 所示:光合有效辐射是影响黄桃光合作用的重要因素,辐射强度过高会影响果树水分过度蒸发代谢失调,过低会影响果树酶的活性;最低辐射阈值为1.2~6.8W/m2,最高辐射阈值为78~113 W/m2,其次最低温度阈值为10.3~14.8℃,该变量满足了黄桃在休眠期所需的低温,然后才能正常地萌芽、生长、开花、结果。此外高程限制了黄桃的生长区域,由图8d 可知合适的地势直接影响光、温、水、热在地面上对黄桃的配比需求,当DEM 为37.5m 左右时更利于桃树的种植,图8e 则表明黄桃主要种植在耕地(旱地)林地等区域。

图8 主要变量响应曲线

5 结论与讨论

该文以哨兵二号遥感影像为主要数据源,利用机器学习的随机算法对湖北省荆州市江陵县三湖农场的黄桃种植区进行提取,并在此基础上,利用最大熵模型MaxEnt 对其潜在适生区进行预测,得出以下结论。

(1)黄桃特有的开花期是区分黄桃与其他作物及植被类型的关键物候,可以最大限度地排除杂草、农作物及其他植被信息的干扰,该生长期的黄桃与其他地物光谱差异较大,找到分类的关键时期,结合NDVI、RVI、NDWI等植被指数可以对黄桃种植区进行有效地识别与提取;以随机森林分类器为代表的机器学习方法能够有效降低“过拟合”所产生噪声的影响,可以有效地提取黄桃种植区,获得较为理想的分类精度,满足应用需求。

(2)黄桃主要分布于三湖农场的东部、中部、北部及西南区域也有分布,其种植面积占当地耕地的20%左右,反映了当地居民对于土地有效利用以及因地制宜的思想,挖掘并发展出了地方特色产业。

(3)通过预测黄桃潜在适生区发现:黄桃在江汉平原的适宜区范围并不大,最适宜区主要分布在江陵县、沙市南边及潜江的西南地区,说明黄桃的种植对地理环境条件要求较为敏感,尤其对于光合有效辐射、最低温度以及地形的敏感性最为突出。该成果可以为黄桃的准确识别及其潜在适生区提供参考。建议在黄桃实际推广种植之前,仍需结合当地的各项条件,进行小范围试种,依据试种黄桃的成长状况酌情推广种植。

该文的研究区三湖农场黄桃品种为“锦绣黄桃”,是当地特有品种,并不能代表全国所有黄桃品种,其他黄桃品种的种植适宜性还有待进一步研究。除此之外,该文探讨的研究区域范围较小,仅对江汉平原的黄桃潜在适生区用MaxEnt 一种模型进行了预测,对全国尺度的黄桃潜在适生区缺少指示,其结果有待进一步验证,后期拟引入其他机器学习方法以尝试优化预测结果,并且拟对全国的黄桃种植区开展遥感与实地调研,争取在全国尺度上给出黄桃潜在适生区的指导,为特色产业的健康可持续发展以及乡村振兴提供更多理论参考与决策依据。

猜你喜欢

三湖环境变量适生区
气候变化下中国蒟蒻薯科箭根薯的地理分布格局预测
未来气候条件下当归适生区预测及时空变化分析
三湖红橘再飘红
从桌面右键菜单调用环境变量选项
气候变化下濒危植物半日花在中国的潜在分布
宗炳故里 黄桃之乡 秀美三湖 “三湖杯”建场六十周年 全国诗词楹联散文新诗大赛征稿启事
彻底弄懂Windows 10环境变量
巴拉圭瓜多竹适生区分布研究
春晓(外二首)
鲜为人知的石屏“三湖”变迁史 异龙湖、赤瑞湖、鉴湖