基于时序Landsat遥感影像枣树种植面积提取
2021-09-14安霞孙占海张学东
安霞 孙占海 张学东
摘 要:基于不同特征时间序列数据集,使用动态时间规整(dynamic time warping,DTW)方法对时间序列遥感影像进行分类。基于时间序列Landsat 8影像数据,使用NDVI、EVI、第一主成分(principal component analysis 1,PCA1)3种特征数据集结合DTW算法,对比分析不同特征量对枣树的识别精度。结果表明:基于DTW(NDVI)的时间序列特征数据集结合DTW算法能够得到较好的分类结果,基于时序DTW(EVI)特征量的方法次之,基于时序DTW(PCA1)特征量的方法的分類精度最低,总体精度分别为95.23%、93.73%、83.84%,Kappa系数分别为0.858、0.824、0.738。
关键词:遥感;动态时间规整算法;枣树;时间序列
中图分类号 S127 文献标识码 A文章编号 1007-7731(2021)16-0135-04
Extraction of Jujube Planting Area Based on Time Series Landsat Remote Sensing Images
AN Xia et al.
(School of Information Engineering, Tarim University, Alar 843300, China)
Abstract: This paper uses dynamic time warping (DTW) method to classify time series remote sensing images based on different characteristic time series data sets. Based on the time series Landsat 8 image data, using NDVI, EVI, and principal component analysis (PCA1) three feature data sets combined with DTW algorithm to compare and analyze the recognition accuracy of jujube trees with different feature quantities. The results show that the time series feature data set based on DTW (NDVI) combined with DTW algorithm can get better classification results, the method based on time series DTW (EVI) feature quantity is second, and the classification based on time series DTW (PCA1) feature quantity method The accuracy is the lowest. The overall accuracy is 95.23%,93.73%,83.84%, and the Kappa coefficient is 0.858,0.824,0.738.
Key words: Remote sensing; Dynamic time warping algorithm; Jujube tree; Time series
枣树是阿拉尔垦区经济林的重要组成部分,也是兵团第一师重要的经济发展基础,具备经济、生态两大效益[1]。通过遥感卫星影像对阿拉尔垦区枣树经济林进行监测,具有快速、准确、大范围、时间连续性等特点,并且是获取地物信息的高新技术手段[2],因此利用遥感技术为兵团农作物决策提供相关数据支撑具有重要现实意义。由于枣树的生长发育时期与其他果树基本相同,因此在遥感影像中提取枣树的种植面积容易出现错分的现象;而且同一品种枣树的生长发育也有早有晚,增加了枣树识别的难度。由于农作物在生长过程中具有独特的物候特征,农业土地在不同时间的遥感影像上具有不同的表现,利用时间序列遥感数据中枣树物候期特征值的变化规律,进行枣树种植面积的提取具有实践意义[3]。
针对时间序列遥感数据的农作物识别,充分利用各种作物的生长规律及物候特征,可以有效提高农作物分类精度。时间序列曲线是表征植被特征、生长状态及植被绿度的最佳指示因子,同时也可以反映季节和人为活动的变化[4]。Oliphant Adam-J[5]使用Landsat影像,构建了蓝光波段、近红外波段等10个光谱段的时间序列曲线,通过随机森林算法获得东南亚地区土地利用图,精度较高。宫诏健等[6]使用S-G重构法对MODIS NDVI时序曲线进行处理,并有效提取了辽宁省春玉米的种植面积。Pan等[7]利用时间序列数据重构NDVI时间序列曲线,对冬小麦种植面积进行提取。Murali[8]等通过使用光谱匹配技术将各类作物基于时间序列生成的时序曲线与标准时间序列曲线进行匹配,对南亚地区农作物进行分类。在使用时序曲线的方法提取作物种植面积时,更多的采用了对NDVI时序曲线进行处理,因此选取不同特征的时序曲线对分类效果的影响值得研究。本研究采用时间序列的Landsat 8数据,以新疆阿拉尔市为研究区域,进行枣树分类识别,采用动态时间规整(dynamic time warping, DTW)算法,利用中高分辨率时间序列影像探究不同特征指标对枣树的识别能力。
1 材料与方法
1.1 研究区概况 新疆维吾尔自治区阿拉尔市(80°30~81°58E、40°22~40°57N)辖4个街道、1个乡、15个镇,占地面积约5200km2。北接天山山脉,南部深入塔里木盆地北部边缘地区,整体地势由西北向东南倾斜,平均海拔1km左右,境内有多条水系,虽处于温带大陆性气候带,但北部山峰绵延不绝,南部的塔克拉玛干沙漠一望无际(图1)。深处内陆且大山环绕,使当地降水量非常稀少,气候干燥,但丰富的高山河流水资源和充足的光照时长使这里成为典型的灌溉农业区。
由于研究区域地理环境的特殊性,在南部沙漠地区几乎无法进行农业生产,农业生产很大程度上依赖于灌溉水资源。阿拉尔市傍依阿克苏河、塔里木河、台兰河、多浪河水系,在靠近这些河流的地区,种植的作物种类比较多样化,而在大部分水资源短缺的区域,通常采用修建水利工程与滴灌技术结合的种植方式。2017年,研究区枣树种植面积近4.47万hm2,红枣产量占当年全国总产量的10%,是我国非常典型的枣树种植区域,因此选择该地区为研究区域具有代表性。
1.2 数据来源 本研究使用美国地质勘探局(USGS)网站上下载的Landsat 8影像,获取2017年枣树物候期内生长季无云或少云的影像,影像的空间分辨率为30m,共9景影像(05/24、06/09、07/27、08/12、08/28、09/13、09/29、10/15和10/31),影像时间覆盖了2017年枣树从发芽到收获的整个生长发育期,所获取的Landsat 8遥感数据时相序号、传感器、轨道号和获取时间等详细信息见表1。
1.3 试验设计 设计了3组试验进行对比,分别是基于时间序列NDVI数据的DTW法(简写为DTW(NDVI))、基于时间序列EVI数据的DTW法(简写为DTW(EVI))以及基于时间序列PCA1数据的DTW法(简写为DTW(PCA1))。对获取的2017年枣树物候期内的10景影像进行指数计算和主成分分析,生成NDVI、EVI和PCA 3个特征数据集,然后根据枣树样本点提取对应特征值,将不同特征值分别按照时间排序,生成不同特征的枣树时间序列曲线;通过S-G滤波方式对曲线进行平滑处理,得到枣树标准曲线,然后分别计算在3类特征数据集下待分像元与枣树标准曲线的最小累计距离,得到基于像元的隶属度图;最后利用随机森林算法分类,得到研究区域枣树种植情况,通过计算得到枣树种植面积;采用以上3种方案进行匹配计算,得到分类结果,并进行精度评价和分析(图2)。
2 结果与分析
2.1 标准时序曲线生成 针对本研究选取的3种不同特征量生成不同的时序标准曲线。NDVI数据作为Landsat中高时间分辨率植被的有效测量手段,有助于对植被生长和活动的季节和年际变化进行有意义的比较。NDVI的优势在于其定量配给的概念,由于波段数量增加,产生的噪声形式也会增多,NDVI可以减少多个波段中存在的多种形式的噪声(光照差异、云影、大气衰减和某些地形变化)。此外,对植被覆盖动态的敏感性比较表明,由于NDVI数据在生长季节表现出更高的可变性和突变性,因此NDVI数据更为敏感,能够更准确地检测变化[9]。
根据枣树采样点提取相关数据,分别生成了NDVI时序数据集、EVI时序数据集和PCA1时序数据集,然后对各自的数据进行S-G滤波处理,去除相关噪声,生成标准的枣树不同特征的时序曲线(图3)。
2.2 时序曲线隶属度图 得到标准时间序列后,计算不同特征数据集中每个像素的时间序列到标准时间序列的DTW距离(图4)。DTW距离可以反映标准枣树生长时间序列与像素时间序列的相似程度和相异程度。在DTW距离图中,当DTW距离较短时,图中显示的颜色更深,表现为红色。距离越小,表明该地区种植枣树的可能性越大。
2.3 分类结果 按照上述步骤得到3种试验方案的分类结果,如图5所示。使用验证样本点对分类结果进行验证,得到混淆矩阵精度结果,如表2所示。由表2可知,基于时序NDVI特征的DTW方法的分类精度最高,总体精度为95.23%,利用时序EVI特征量的DTW方法次之(93.73%),基于时序PCA1特征的DTW方法的分类精度最低(83.84%),观察Kappa系数值可以得到同样的结论。
3 结论与讨论
采用时间序列的Landsat 8数据,以新疆阿拉尔市为研究区域,利用动态时间规整(DTW)算法进行枣树分类识别,探究使用中高分辨率时间序列影像和DTW算法相结合对枣树的识别能力。利用随机森林模型进行枣树信息提取,并比较不同特征量分类结果差异,结果表明:基于时间序列数据,基于NDVI的DTW分类方法精度最高,总体精度为95.23%,利用时序EVI特征量的DTW方法次之(93.73%),基于时序PCA1特征的DTW方法的分类精度最低(83.84%)。因此,在使用DTW算法时,采用NDVI特征量分类能得到较好的分类效果。
参考文献
[1]《新疆兵团第一师阿拉尔市统计年鉴-2018》编辑委员会.王虹主编,新疆兵团第一师阿拉尔市统计年鉴[M].北京:中国统计出版社,2018.
[2]唐华俊,吴文斌,杨鹏,等.农作物空间格局遥感监测研究进展[J].中国农业科学,2010,43(14):2879-2888.
[3]李晓东,姜琦刚.基于多时相遥感数据的吉林西部土地覆被分类提取[J].农业工程学报,2016,32(9):173-178.
[4]陈晓苗.基于MODIS-NDVI的河北省主要农作物空间分布研究[D].石家庄:河北师范大学,2010.
[5]Adam J. Oliphant,Prasad S. Thenkabail,Pardhasaradhi Teluguntla,et al. Mapping cropland extent of Southeast and Northeast Asia using multi-year time-series Landsat 30-m data using a random forest classifier on the Google Earth Engine Cloud[J]. International Journal of Applied Earth Observations and Geoinformation,2019:81.
[6]宮诏健,田景仁,陈杰,等.基于MODIS NDVI数据的辽宁省玉米种植面积提取研究[J].江西农业学报,2020,32(09):119-126.
[7]Pan Y Z,Li L,Zhang J S.Crop area estimation based on MODIS-EVI time series according to istint characteristic of key phenology phase[J]. Journal of Applied Remote Sensing,2011,15(3): 578-594.
[8]Gumma M.Mapping rice areas of South Asia using MODIS multitemporal data[J].Journal of Applied Remote Sensing,2011,5(1): 530-547
[9]Granero-Belinchon Carlos,Adeline Karine,Briottet Xavier. Impact of the number of dates and their sampling on a NDVI time series reconstruction methodology to monitor urban trees with Ven[formula omitted]s satellite[J]. International Journal of Applied Earth Observations and Geoinformation,2021:95.
(责编:徐世红)