APP下载

基于Sentinel-2 影像数据的耕地撂荒信息提取
——以甘肃省天水市八里湾镇为例

2020-06-10马引弟李纯斌李晓杰

生产力研究 2020年5期
关键词:坡度波段土地利用

马引弟,吴 静,李纯斌,李晓杰

(1.甘肃农业大学 管理学院,甘肃兰州 730070;2.甘肃农业大学 资源与环境学院,甘肃兰州 730070)

一、引言

随着城乡一体化和社会经济转型的快速推进,在农业生产效益低下与农村劳动力向外转移等多重因素的影响下,农村撂荒耕地面积逐年增加,在我国经济欠发达地区尤其是丘陵和山区最为明显[1]。我国人多地少,耕地撂荒危及粮食安全和当地生态环境。当前撂荒地的提取多基于MODIS、Landsat、SPOT、高分一号、TM/ETM+等数据[2-8],但这些影像数据时空分辨率或光谱分辨率较低,对地形复杂区域的地类提取有一定的干扰。欧空局于2015 年发射Sentinel-2A 卫星以及2017 年发射的Sentinel-2B卫星遥感空间分辨率达10 m,且增加了4 个与叶绿素含量密切相关的红边波段,现已运用于作物识别[9]、地物类型的划分[10-11]等各方面研究,对于地形复杂区域的地类划分有着重要的作用,如张卫春等(2019)[12]在研究低山丘陵区土地利用分类时,加入Sentinel-2 数据红边波段的相关指数特征,有效地提高了低山丘陵区土地利用的分类精度。

甘肃省天水市八里湾镇地形复杂,地块破碎,土地利用分散,混合像元较多,对地物信息精准提取造成很大干扰,利用随机森林算法对八里湾镇的Sentinel-2 高分辨率遥感卫星数据进行土地利用分类,利用混淆矩阵检验分类结果精度,并依据耕地撂荒判别规则,提取耕地撂荒信息。

二、研究区概况

八里湾镇位于甘肃省天水市甘谷县渭北的浅山区,其所处位置如图1 所示。从地形上看,地形崎岖,地块破碎,以山地为主,平均海拔1 820 m,西南部坡度较大,总耕地面积50.80 km2,以旱地为主,平均降水量440 mm,年平均气温7.8 度,全年无霜期158 天,当地主要作物有玉米、冬小麦、洋芋等,作物一年一熟,冬小麦生长周期从当年9 月份种植,来年7 月收割,而玉米和洋芋在3 月份种植,当年8月底开始收割。

图1 八里湾镇位置图

三、数据来源与方法

(一)数据来源

Sentinel-2 数据(https://scihub.copernicus.eu/dhus/#/home):同一组包含了AB 两颗星,Sentinel-2A 发射于2015 年6 月23 日,Sentinel-2B 卫星发射于2017年3 月7 日,Sentinel-2 数据空间分辨率为10 m。本文选择2017-06-06 和2018-06-11 的Sentinel-2A以及2019-06-01 的Sentinel-2B 影像数据,三期影像集中在6 月份,此时,主要农作物冬小麦进入乳熟阶段,玉米开始出穗,洋芋的叶子生长茂盛,与混杂植被覆盖的差异较大,容易区;采用30 m 分辨率的DEM 数据,来源于地理空间数据云(http://www.gscloud.cn/);在提取采样点时,参考了来自于全能电子地图下载器的Google Earth 影像数据,地图级别越高分辨率越高,在这里采用了18 级,分辨率为0.6 m的Google Earth 影像。

(二)数据预处理

本文调用欧空局提供的Sen2cor 中的L2A_Process及L2B_Process 进行大气校正,并保留10 m 分辨率的波段,使用snap 软件对数据进行重采样成hdr 格式,并裁剪出研究区范围,计算提取NDVI、RENDVI、S2REP 三个指数特征;将DEM 数据重采样为10 m,计算坡度;将原影像的红波段、绿波段、蓝波段、近红波段、NDVI、RENDVI、S2REP、DEM、坡度组合为9 个波段的待分类影像。

土地利用分类是研究土地利用变化的基础,根据研究区实际情况结合《土地利用现状分类》(GB/T 21010—2017)将研究区内的土地利用状况分为旱地、林地、草地、水域、裸地以及建设用地六类,结合八里湾镇Google Earth 影像数据和实地调查数据提取采样点以及验证样本点共195 个点,约70%的样点作为分类样本点,30%的样点作为验证样本点。研究区内水域少且集中分布,因此水域采样点较少且密集分布。

(三)随机森林算法分类

随机森林算法是2001 年由美国科学院院士Leo Breiman(2001)[13]综合他提出的Bagging 集成、CART决策树以及特征随机选取思想而提出的机器学习算法,该算法的基本思想是利用bootstrap 重抽样方法从原始样本中抽取多个样本,对每个bootstrap 样本进行决策树建模,然后将这些决策树组合在一起,通过投票得出最终分类或预测的结果。建立步骤如下:在原始样本中,随机且有放回地抽取N 个训练样本,训练集的大小约为原始数据的2/3;测试数据集的样本约为原始数据的1/3。

基于抽取的训练样本集分别建立N 棵CART决策树组成随机森林,在每棵树生长过程中,从M 个特征变量中随机抽取m 个(m≤M)进行内部节点的划分,m 个特征组成的子集被称为特征的随机子空间。

最后组合N 棵决策树的预测结果,利用投票的方式确定新样本的类别。

通常情况下,树的个数(N)设为100,单棵树的最大特征数目(m)为总特征数个数的平方根[14-15]。

(四)耕地撂荒的提取规则

1.耕地撂荒的定义。在前人的研究里,一般结合研究区实际情况与耕作制度来确定撂荒,在不同地区有把耕地闲置一年以上定义为撂荒[6-7],有把耕地荒芜一季或一季以上的视为撂荒[16-17]。八里湾镇受季风影响,降水分布极不均匀,主要农作物一年一熟,当地一年一次调整作物或是对耕地进行休耕,两年及两年以上则是放弃耕种,据此本文将耕地撂荒定义为:耕地闲置或荒芜两年以上(包括两年)为耕地撂荒,而耕地闲置或荒芜一年为耕地休耕。

2.耕地撂荒的提取规则。八里湾镇位于山区,土地破碎严重,撂荒地在影像上难以直接分辨,因此通过建立撂荒判别规则,以耕地向其他地类的转变判断撂荒状况。根据实际调查情况,在研究区内,耕地荒芜以后可能演变为裸地、草地两种类型。根据以上定义及研究区耕地撂荒演变状况,对撂荒地的判别规则如下:在第2017 年有耕地斑块A、B、C、D,在2018 年A、B 斑块转变为裸地或草地,C、D 斑块依旧为耕地;2019 年A 斑块恢复耕种为耕地、B 斑块依旧为裸地或草地、C 斑块依旧耕种、D 斑块转变为裸地或草地。在演变的过程中B 斑块连续两年为裸地或草地状态,则判断其为耕地撂荒,而A、D 斑块有一年变为裸地或草地状态,则将其视为休耕且D 斑块存在潜在撂荒,如表1 所示。

表1 耕地撂荒判断规则

耕地撂荒通常用耕地的撂荒率定量化表达,即每年的撂荒面积占本底耕地面积的比例。具体表达式如下:

式中:Pi表示撂荒率;Ai表示第i 年的耕地撂荒面积;A0表示本底耕地面积。

四、结果与分析

遥感影像分类结果利用混淆矩阵进行精度评价,确定分类的精度和可靠性,评价精度的因子有总体分类精度、Kappa 系数等。2017—2019 年随机森林分类结果的分类精度依次为87%、76%、86%,Kappa 系数依次为0.85、0.71、0.83。可以看出,分类精度均在75%~90%之间,2018 年分类结果精度低于2017 年和2019 年的分类结果精度,由于2018 年局部的小块云覆盖影响了分类。

利用随机森林算法得到的土地利用分类结果,得到2017 年的耕地数据作为本耕地数据,使用撂荒地的判断规则提取了2017—2019 年耕地撂荒空间分布图,2017—2018 年以及2018—2019 年的休耕空间分布图(图2a、图2b、图2c、图2d)。

图2 休耕以及耕地撂荒分布图

从图2 可以看出,耕地休耕每年都存在且不能确定休耕具体位置以及面积大小,分布面积较大,较广较均匀,计算得到2017—2018 年休耕面积为11.374 5 km2,2018—2019 年休耕面积为6.736 4 km2,2018—2019 年休耕面积少于2017—2018 年休耕面积,说明上一年没有耕种的耕地下一年开始耕种,或者一年内轮换作物,在遥感影像上呈现出裸地或草地状态。

以2017 年土地利用分类的耕地为本底耕地数据,与2018 年、2019 年草地和裸地相交得到了2017—2019 年撂荒数据,计算得到撂荒面积为3.964 1 km2,从撂荒分布图可以看出撂荒集中在西南部,东北部撂荒较少。

影响山区地形的重要因素之一是坡度,按照1984 年中国农业区划委员会颁发《土地利用现状调查技术规程》对耕地坡度分为≤2°、2°~6°、6°~15°、≥15°四个级别,将耕地撂荒信息落在坡度图上,如图3(d)所示,可以更明显地看出在坡度大于15° 的西南部耕地撂荒更多,由此可见,坡度越大,撂荒概率越高。

五、结论与讨论

(一)结论

本文基于2017—2019 年甘肃省天水市甘谷县八里湾乡的Sentinel-2 数据,利用随机森林算法分类,根据建立的耕地撂荒提取规则提取2017—2019年的休耕、撂荒范围,制作休耕以及撂荒分布图,得到以下结论:(1)采用随机森林算法分类对2017—2019 年影像进行分类,其分类精度均在0.7~0.9 之间,可以将分类结果运用于耕地撂荒的判别。(2)通过计算,2017—2018 年休耕面积为11.374 5 km2,2018—2019 年休耕面积为6.736 4 km2,2017—2019年撂荒面积为3.964 1 km2,得到撂荒率为7.8%,可以看出甘谷县八里湾镇的休耕现象比较普遍,耕地撂荒现象是比较严重的。(3)结合坡度来看,撂荒主要分布在坡度大于15° 的西南部,则说明坡度越大,越不适宜于耕种。

(二)讨论

本文中利用新的Sentinel-2 遥感影像数据,分辨率为10 m,比之以往的Landsat 等数据,有更高的准确性,但Sentinel-2 遥感影像数据时间较短,无法从长时间分析当地耕地撂荒情况;在土地利用分类图时,结合了红波段、绿波段、蓝波段、近红波段、NDVI、RENDVI、S2REP、DEM、坡度9 个因子,是否可以结合更多遥感影像波段组合的特征指数,更准确地执行土地利用分类;在实地调查时农村老人儿童留守人口居多,对过去的事不清楚或者回忆不起来,验证数据存在一定的误差,且实地调查需要花费大量的时间和资金。

猜你喜欢

坡度波段土地利用
最佳波段组合的典型地物信息提取
关于公路超高渐变段合成坡度解析与应用
大坡度滑索牵引索失效分析及解决措施研究
关于场车规程中坡度检验要求的几点思考
基于PLL的Ku波段频率源设计与测试
土地利用生态系统服务研究进展及启示
小型化Ka波段65W脉冲功放模块
滨海县土地利用挖潜方向在哪里
日常维护对L 波段雷达的重要性
CT和MR对人上胫腓关节面坡度的比较研究