基于GEE的宝鸡峡灌区耕地灌溉面积遥感监测方法
2022-11-26徐超吕婧妤刘昱君降亚楠
徐超,吕婧妤,刘昱君,降亚楠,2*
(1. 西北农林科技大学水利与建筑工程学院,陕西 杨凌 712100;2. 西北农林科技大学旱区农业水土工程教育部重点实验室,陕西 杨凌 712100)
耕地是农业生产最基本的生产要素,耕地及其灌溉面积的变化会造成粮食生产波动,进而影响到粮食有效供给及粮食的安全水平[1].准确识别耕地灌溉区域,对于粮食安全和农业水资源的有效管理至关重要[2].然而,目前对于中国灌区实际耕地灌溉区域识别的研究却非常有限,现有的灌溉遥感产品如MIRCA2000产品[3]和国际水资源管理协会(IWMI)的灌溉区域地图[4]等,由于空间分辨率较低,统计出来的灌溉面积往往偏大[5],难以满足实际需要.
近年来,基于遥感的耕地识别与提取技术与方法已经比较成熟[6-7],但是根据卫星观测数据对灌溉区域进行识别的技术还不够成熟和完善[8],是一项更加复杂且富有挑战性的工作.目前国内外的研究中,对于耕地灌溉区域的识别主要有决策树算法[9]、光谱匹配法[4,10]、支持向量机算法[11]、随机森林算法[12]、半自动训练法[13]等方法.其中随机森林算法是以决策树为基础分类器的集成分类器,与传统的决策树相比,有更强的泛化能力和更好的分类效果,是目前最有效的机器学习算法之一,近年来在遥感影像分类领域得到了广泛的应用[14-15].
现阶段耕地灌溉面积遥感监测研究主要存在两方面的困难:一是样本点的获取,由于灌溉区域识别的特殊性,样本点往往只能通过实地采样调查获得,而历史样本点的获取则更加困难;二是目前研究中使用的指数或指标[8]大多是只对土壤水分或者植物绿度比较敏感,例如归一化植被指数(NDVI)[16-17].但是有研究表明NDVI对于作物的灌溉情况不够敏感[17-18],因此DEINES等[12,19]提出了土壤水分和植物绿度结合的新型灌溉指数:水调节绿色指数(WGI),这种综合性指数往往对于作物的灌溉情况更加敏感.
文中将综合考虑以上问题,结合实地采样样本点,并根据宝鸡峡灌区实际,提出一种获取历史样本点的思路和方法,基于GEE云平台提供的随机森林(RF)算法,结合水调节绿色指数WGI等,在中国西北干旱半干旱地区的典型灌区(陕西省宝鸡峡灌区)开展耕地灌溉面积的遥感监测研究,并分析2010—2020年间宝鸡峡灌区耕地面积及其灌溉面积的变化.
1 研究区概况
宝鸡峡灌区设计灌溉面积为197 707 hm2,是陕西省最大的国有灌区,位于关中平原西部地区;西起宝鸡峡,东至泾河,南界渭河,北抵渭北高原腹地.灌区属温带大陆性季风气候,降水时空分布不均,易发生干旱,作物生长对灌溉需求较大.灌区主要灌溉水源为地下水、宝鸡峡和冯家山水库.灌区主要作物为冬小麦、夏玉米、果树(包括猕猴桃、苹果、梨、桃等)和少量蔬菜等经济作物.宝鸡峡灌区田块面积较小,且种植结构复杂.因此,文中将灌区的农用地分为耕地和果树2类,并对耕地灌溉情况进行识别.
2 数据源及预处理
2.1 卫星遥感数据
首先对GEE云平台提供的2010年Landsat5 TM和2020年的Landsat8 TM卫星图像进行辐射定标、大气校正、影像去云、影像拼接等预处理.然后调用GEE云平台内SRTM DEM数据辅助训练,再调用平台函数计算归一化植被指数(NDVI)、归一化水体指数(NDWI)、归一化建筑指数(NDBI)以提高对植被、水体及建筑物的识别精度.除此之外,为了能更加精确地识别耕地灌溉区域,添加了增强植被指数(EVI)、绿色叶绿素植被指数(GCVI)、水调节绿色指数(WGI)3个指数,其中GCVI和WGI是对于作物灌溉特别敏感的指标[8,12,19].GCVI,WGI计算公式为
(1)
WGI=NDWI·GCVI,
(2)
式中:NIR,Green分别为近红外波段、绿波段的反射率.
2.2 样本点数据
2020年实地采样样本点以耕地、果树为主,包括典型的灌溉区与非灌溉区,共计427个,样本点分布如图1所示.由于2010年的灌溉情况已无法进行实地考察,文中基于宝鸡峡灌区实际,提出了一种获取历史样本点的思路和方法:对2020年实地样本点在2010年的光谱曲线和指数特征进行分析,确定其灌溉情况,然后随机添加目视解译点,依据光谱特征筛选作为样本补充,最后确定样本个数为395个,样本点分布如图2所示.土地利用分类样本点可以在Google Earth Pro中对2010年和2020年的高分辨率影像进行目视解译获得.
图1 2020年样本点分布示意图Fig.1 Sample point distribution diagram in 2020
图2 2010年样本点分布示意图Fig.2 Sample point distribution diagram in 2010
3 研究方法
3.1 随机森林算法
随机森林是BREIMAN[20]于2001年提出的一种以决策树为基础,结合Bootstrap aggregating集成学习理论与特征随机选取的机器学习算法.随机森林的核心即为随机性,具有样本和特征2个随机性.有了这2个随机性,在处理复杂且高维的数据时,随机森林就不会出现过拟合现象,抗噪能力很强,而且随机森林几乎不需要人工干预,处理速度较快.
3.2 耕地灌溉区域识别
在进行耕地灌溉区域识别前,首先进行了土地利用分类,以便将耕地与其他土地利用类型区分开.而为了将灌溉作物和雨养作物分开,需要准确捕捉由于灌溉导致的作物光谱特性和指标的差异.考虑到农民进行灌溉的时间通常是作物生长的关键时期,可以根据作物生长关键期的作物生长状况,以有效地识别与提取耕地灌溉区域.在宝鸡峡灌区,小麦生长的关键期3—5月份、玉米生长的关键期7—9月份,均存在云量低于15%的影像,满足使用要求.
基于GEE云平台对实测耕地灌溉与非灌溉样本点的光谱特征及时相特征进行分析,主要采用样本点的NDVI,NDWI,EVI,GCVI与WGI时间序列曲线.图3为2个典型灌溉区域样本点与2个典型非灌溉区域小麦种植样本点的NDVI与WGI时间序列曲线,图中t为1 a中的天数.可以明显看到,灌溉区域样本点与非灌溉区域样本点的曲线波动趋势基本一致,但是非灌溉区域的波动幅度明显小于灌溉区域,而且灌溉区域样本相同时间的参数值均大于非灌溉区域样本点,这说明在干旱半干旱地区,灌溉对于作物的长势影响非常大.通过对比NDVI与WGI时间序列图,可以发现并确认DEINES等[12,19]提出的新型灌溉指数WGI放大了作物生长关键期灌溉与非灌溉样本点参数值的差距,使灌溉与非灌溉区域更易区分,可以有效描述作物的灌溉情况.
图3 小麦种植期NDVI,WGI时间序列Fig.3 Time series of NDVI, WGI in wheat planting period
4 结果分析
4.1 土地利用分类结果及精度验证
通过在GEE API平台中进行多次可视化试验对比,选取Landsat影像的B2,B3,B4,B5,B6,B7辅以NDVI,NDWI,NDBI,EVI以及DEM共11个波段作为RF算法的测试变量,以建设用地、水域、耕地、果树4种土地利用类型作为分类体系,最终应用于宝鸡峡灌区的Landsat 影像分类,分类结果如图4所示.在GEE云平台通过Java代码编程实现面积统计和精度评价,其中2010和2020年耕地面积分别为121 689,90 328 hm2.2010年分类结果总体精度为92.86%,Kappa指数为0.900;2020年分类结果总体精度为92.86%,Kappa指数为0.902,说明分类精度较高,分类效果良好.
图4 2010年和2020年宝鸡峡灌区土地利用分类结果Fig. 4 Land use classification results of Baojixia Irrigation District in 2010 and 2020
4.2 耕地灌溉区域识别结果及精度验证
在GEE云平台计算指数NDVI,NDWI,EVI,GCVI,WGI作为分类参数,应用随机森林算法实现分类面积统计.
将实测样本点的80%作为训练样本,20%作为验证样本,然后根据筛选补充得到的样本点使用同样的分类方法对2010年Landsat卫星影像进行耕地灌溉区域识别.统计识别提取得到的2010和2020年宝鸡峡灌区耕地灌溉面积分别为104 211 和90 174 hm2,识别提取结果如图5所示.
对提取结果进行混淆矩阵精度评价,2010年总体精度达91.67%,Kappa系数为0.832,生产者精度为93.75%,用户精度为88.24%;2020年总体精度达95.35%,Kappa系数为0.907,生产者精度为97.56%,用户精度为93.02%.识别精度较高,耕地灌溉区域提取效果良好.
图5 2010年和2020年宝鸡峡灌区耕地灌溉区域提取结果Fig.5 Extraction results of cultivated land irrigation area in Baojixia Irrigation District in 2010 and 2020
4.3 耕地及其灌溉面积变化分析
查阅《2010陕西统计年鉴》[21]得知统计的宝鸡峡灌区实际灌溉面积为104 000 hm2,与2010年提取结果比较接近.根据土地利用分类结果,2010年耕地面积为121 689 hm2,而2020年耕地面积为90 328 hm2,比2010年少了31 361 hm2.这一方面是由于人口增加,城镇扩张,占据了部分耕地;另一方面由于猕猴桃、苹果等果树的推广,果树种植收益大于传统的小麦、玉米,部分耕地转变为果树种植区.虽然研究区耕地面积减少了31 361 hm2,但是耕地灌溉面积仅仅减少了14 037 hm2.2010年研究区耕地灌溉率为85.6%,而2020年已经提高到了99.8%.这与近年来政府加大投资力度、普及灌溉设施以及灌区水资源的合理调控十分相关,基本保证了每田皆有水灌;也可能与2020年宝鸡峡灌区降水充沛,导致灌溉面积识别存在误差有关.
5 结 论
1) 基于GEE云平台随机森林算法,并结合新型灌溉指数WGI的耕地灌溉面积遥感监测方法,对于耕地灌溉区域的识别总体精度较高,WGI对于作物的灌溉状况十分敏感,可以有效识别作物的灌溉情况,在耕地灌溉面积遥感监测的研究中可以推广使用.
2) 基于宝鸡峡灌区实际,提出了一种获取历史样本点的思路和方法,根据实测样本点的光谱曲线和指数特征可以获取历史位置的灌溉情况,扩大了灌溉区域识别研究的时间尺度.但若要进行更大范围的耕地灌溉面积识别,则要考虑包括影像融合、气候、作物种类等许多其他因素,难度会大大增加.
3) 文中研究方法及成果可以为灌区水资源管理、灌区灌溉系统运转监测、干旱的预防、灌区水资源优化配置等提供技术支持和参考.