APP下载

基于多时相遥感数据聚类决策树方法的白水县农作物识别

2023-01-12刘状李纲石晨烈魏永强王建荣杨秀策

关键词:物候决策树农作物

刘状,李纲,石晨烈,魏永强,王建荣,杨秀策

基于多时相遥感数据聚类决策树方法的白水县农作物识别

刘状1,2,3,李纲1,2,石晨烈3,魏永强1,2,王建荣1,2,杨秀策1,2

1. 地理信息工程国家重点实验室, 陕西 西安 710054 2. 西安测绘研究所, 陕西 西安 710054 3. 西北大学城市与环境学院, 陕西 西安 710127

利用Sentinel-2、Landsat8OLI、SRTM等多源遥感数据,根据白水县物候特征经验构建不同典型时间序列数据集进行聚类分析,同时结合影像分割和决策树支持方法首次对陕西省白水县的多种农作物进行提取分类。结果表明:1)本文提出的方法能够有效提取典型地物信息,总体分类精度达到91.22%,Kappa系数为0.8949,相比基于单一时相的光谱特征的分类有着较大优势。2)白水县的三种主要农作物苹果、玉米和小麦的物候特征显著,分步提取的地物类别极少发生类间像素重叠,且表现的物候规律与白水县农作物的实际物候规律高度吻合,侧面证明了分类结果的适用性。3)白水县苹果种植分布西多东少,中北部多南部少;玉米主要分布于白水县西部和北部较高海拔地区;小麦主要分布于白水县南部;白水县的苹果种植仍有推广空间。这些结果发展了聚类分析结合决策树分类在农作物遥感方面的用法以及为白水县的农业经济发展提供有益参考。

遥感;聚类分析; 农作物识别

随着遥感数据来源的不断丰富和时空分辨率的不断提高,高分辨率的遥感数据在资源调查等方面的应用越来越广泛[1-4],虽然单一时相的遥感影像对于固定地物的识别精度较高,但是对于随时间不断变化的农作物难以进行有效识别,在不同时相下的光谱特征中存在不同的同物异谱和异物同谱情况,因此基于多时相遥感数据的地物信息提取成为研究热点之一。

遥感多时相数据包含了丰富的植被生长规律信息,基于多时相遥感数据的影像序列可以反映植被的季相特征以及物候变化规律[5-9],能够表现不同植被的生长物候差异,在农地物分类研究方面得到广泛应用,例如Wardlow等利用MODIS250 m分辨率的时序产品数据提取平原区大范围农作物信息[10,11];刘瑞清分析了时间序列重构模型下基于植被物候特征的分类方法在滨海湿地分类中的优势及适用性,分类总体精度达87.61%[12];同时,结合智能训练学习和滤波的算法也应用于时间序列数据的处理中,例如杜保佳在SG滤波下的面向对象方法在作物分类的结果中精度较高[13];王德军在基于时序数据结合随机森林分类算法取得了较高的分类精度[14]。以上研究利用多时相的遥感数据对农作物进行分类,取得了较好的分类结果,但多对于先验知识有较高要求,对不同典型地区的分类效果和效率区别大,且还未见适用于关中平原与黄土高原过渡区域典型农耕区的作物分类研究。

关中平原是秦汉以来的主要粮食产地,黄土高原由于其地形和气候因素粮食产量较少,白水县作为关中平原最北部和黄土高原的最南部拥有独特的气候类型和农作物物候规律,本研究以陕西省白水县为研究区,利用Sentinel-2和Landsat8影像数据构建典型时间序列数据集,同时考虑了时序特征、光谱特征和地形特征,结合聚类分析和影像分割等研究方法首次对白水县的多种地物进行提取,探究适用于白水县的地物分类决策树模型,以期为白水县的经济发展和其他地区的相关研究提供有益借鉴。

1 研究区概括

白水县古称粟邑县,位于关中平原东北部,属于关中平原与黄土高原的过渡区域,总面积约986 km2,海拔454~1 556吗,年平均气温11.4 ℃。从图1可以看出,洛河穿县而过,地势从东南到西北逐渐抬升,属于关中平原向北延伸末端,境内土层深厚,独特水质和充足光照可以满足优质苹果生长期间对养分的要求[15],相比关中平原具有较大昼夜温差,与黄土高原相比有丰润的降水量,典型气候特点也有利于苹果糖分和有机物的积累。虽然苹果的亩产经济收益高,但苹果树苗存在三年无果期,种植十五年后产量下降,成本周期较长,拉枝定果套袋等作业无法机械化,对体力和经验要求高,部分留守中老年人没有条件在果园劳作,还存在果价不稳等经济问题,因此小麦、玉米等也是白水县的主要经济作物之一。

图1 研究区位置示意图

2 数据源

本研究的数据包括Sentinel-2、Landsat8和SRTM。Sentinel-2空间分辨率较高,在可见光和近红外波段的分辨率达到10 m,且双星重访周期为5 d[16],本文选取白水县域2021年20个时相的40幅Sentinel-2 L2A数据产品,研究区域的云量均小于1%,该产品是已经经过Sen2cor插件大气校正的地表反射率数据,数据下载网址为欧空局数据中心网站(https://scihub.copernicus.eu),投影均为WGS_1984_UTM_zone_49N。由于Sentinel-2在三月份影像云量均较大,选取3月27日的Landsat8OLI影像作为时间序列的补充,下载自地理空间数据云(https://www.gscloud.cn)。SRTM数据有一定精度保障,且易于获取[17],选取白水县域的SRTM数据作为坡度计算的数据来源,下载自(https://earthexplorer.usgs.gov)。

3 方法与步骤

本文以多种遥感数据为基础,构建时间序列数据集,同时在时序特征、光谱特征和地形特征下构建适用于研究区地物分类的决策树模型,分类地物包括建设用地,水体,苹果,小麦,玉米,林地,灌草和其他人造(主要是其他农作物)。数据预处理过程包括landsat8OLI影像的大气校正以及Sentinel-2 L2A的裁剪、镶嵌和点云滤波等步骤。

技术路线如图2所示:

图2 研究技术流程

3.1 植被指数时间序列数据集构建与聚类分析

归一化植被指数(Normalized Difference Vegetation Index,)是应用最为广泛的植被指数之一,能够有效的衡量植被覆盖度[18]。取值范围位于[-1,1]之间,正值代表有植被覆盖,并随着植被覆盖度增加而增加。计算公式为:

=(近红波段-红波段)/(近红波段+红波段) (1)

作为关中平原和黄土高原的过渡地带,白水县有独特的作物和成熟模式,苹果树3月份发芽,11月份落叶,小麦10月种植,6月份收割,玉米4月份种植,10月份收割。关中平原地区通常可以在一年中先后种植小麦和玉米,表现为两熟区,粮食产量高,是秦汉以来的重要粮食产区,与关中平原不同的是,白水县的小麦和玉米在一年内通常只能二选其一,表现为一熟制,因此白水县的小麦和玉米收获后,通常会种植蔬菜豆类等经济作物或休耕,而这使得全年的植被指数曲线更加复杂,直接分析其植被指数曲线存在较大的噪音。

表1 白水县主要农作物物候

针对白水县的三种主要农作物苹果、小麦和玉米构建其独特的时间序列,可以使得时间序列规律性部分显现出来。依据苹果、小麦和玉米的生长周期,分别选取3月17日至11月14日、11月14日至6月22日和5月8日至11月14日栅格进行波段合成三个时间序列数据集。使用ISODATA聚类分析方法对时间序列数据集进行分类[6,19],得到三个初步分类栅格数据,栅格属性值没有量化的高低之分,仅代表初步分类类别。

3.2 影像分割

多尺度分割是指将影像中空间异质性较小的相接像元自下而上合并为相同属性的影像对象[20,21],影像分割是后续进一步分类的范围基础,分割的大小尺度直接关系到分类的精度。本文利用 eCognition软件的Multiresolution Segmentation模块进行多尺度分割。实际调绘过程中发现农田分布较细碎,部分农田分块宽度仅为10多米,考虑到影像分辨率仅为10 m,分割尺度不宜过大,经过多次不同尺度测试,分割尺度设置为34。分割效果如图所示,同一矢量对象内部具有较好的一致性,不同矢量对象间有较大异质性。

图3 尺度34的分割效果

3.3 典型指数提取与阈值分割

归一化水体指数(Normalized Difference Water Index, NDWI)是最早提出的可以凸显水体信息的指数,已得到了广泛的验证与应用[22],计算公式为:

=(绿波段-近红波段)/(绿波段+近红波段) (2)

比值居民地指数(Ratio Resident-area Index,RRI)最早发现于于TM影像上,TM影像中第1和第4波段对比度较大,能很好地反映城镇和裸地信息[23],马应用Sentinel-2影像对不同的建筑指数进行了对比,发现相比归一化建筑指数(Normalized Difference Built-up Index,NDBI)和垂直不透水层指数(Perpendicular Impervious Index,PII)具有更高的精度[24],计算公式为:

=(蓝波段)/(近红波段) (3)

选取2021年5月8日的Sentinel-2L2A数据,分别计算其NDWI和RRI栅格,对SRTM数据转换投影坐标系,利用ArcMap坡度工具计算坡度栅格,采用大津法[25]和人机交互结合的方法确定阈值,最终、和坡度的分割阈值分别为-0.09、0.44和7,将其重分类为二值化栅格图像。

3.4 决策树构建

构建决策树对白水县域地物进行分类提取,对于固定地物主要采用了阈值分割方法进行提取,对于植被主要考虑其物候特征以及地形因素,具体如下:

(1)利用NDWI阈值区分水体。(2)在未分类像元中利用RRI阈值区分道路建筑用地。(3)对苹果对应的聚类栅格数据重分类,将属于林木的部分提取出来,这其中包括了苹果树和自然林地,这两者有相似的物候规律,山区坡度大作业难度高,无法种植苹果,均为自然林地,而平原区域都得到了很好地利用,坡度可以很好地区分这两种地物,用二值化坡度栅格对分类结果进一步加权区分,分别提取平原苹果树像元和山区林地像元。(4)对麦田对应的聚类栅格数据重分类,提取麦田像元。(5)对玉米对应的聚类栅格数据重分类,提取玉米像元。(6)用二值化坡度栅格对剩余像元进一步区分,将山区未分类像元归为灌草,将平原未分类像元归为其他人造地表。

4 结果与分析

4.1 白水县植被物候曲线特征对比分析

如图4为白水县地物分类结果中林地、苹果、小麦和玉米四种植被的变化曲线。

图4 植被指数变化曲线

林地和苹果园的时间序列变化曲线相似,苹果园在五月份和八月份的值有两个小低谷,这是由于苹果在五月份进入花期,平视和俯视果树均有大量的白色苹果花遮挡绿叶,导致值降低,六月份花落,果树结出极小的青色苹果,随着夏季到来急剧升高,苹果八月份逐渐成熟,果实膨大转红,导致值暂时降低,而在九月份苹果采摘后值又再次回升,从十月末进入深秋后树木落叶增多,苹果和林地的值逐渐降低。

小麦在年初的的值比其他地物均高,这是由于仅有小麦在冬季生长,二月末小麦返青,值逐渐增高,小麦在五月抽穗期前后的值达到最高,在六月份急剧下降,在六月以后,麦田通常长杂草或种植较短周期的经济作物。玉米在四月底发芽,六月份起急剧升高,九月末随着作物成熟逐渐降低,玉米在年初的值也一直较低,这说明了玉米种植地的休耕期太短,没有条件利用休耕期种植其他作物,这主要是由白水县的气候条件造成。白水县的地物分类结果表现的物候规律与走访调查的农作物物候规律吻合,侧面证明了分类结果的适用性。

4.2 分类精度验证对比分析

除了上文在不同典型时间序列下构建的决策树分类,还对全年不加筛选的时间序列进行直接分类以及对单一时相光谱特征进行分类,以便对比分析该决策树的适用性,其中水体和建设用地作为底部图层不变。

表2 分类精度指标

在研究区内选择524个精度验证点,通过野外实地调绘、高德卫星图和Google Earth综合判定地物类别,其中132个点为实地调绘点,392个点为均匀分布的渔网点,应用混淆矩阵对分类结果进行精度评价,精度评价结果如表1所示。

对全年时间序列直接进行分类的总体分类精度达到84.73%,Kappa系数为0.8174,与典型时间序列决策树模型分类结果相比,存在更多的错分情况,苹果、小麦和玉米的生产者精度与典型时序分类的生产者精度接近,但其用户精度存在明显差距,在北乾村的大量花椒树应分类为其他人造地表,而其错分为苹果,图5第一行显示村落的庭院树和县城的行道树等也错分为苹果,三种主要农作物基本是在典型时序分类结果的基础上扩大了范围,花椒树、油菜、苜蓿和豆类等其他经济作物分别归为苹果、小麦和玉米中。6月22日麦田已经收割,玉米仍在拔节期,经过实验对比已经处于最佳分类时相,但在单一时相光谱特征下的分类精度仍然最低,总体分类精度仅为64.31%,Kappa系数为0.5726,基于光谱特征分类中的林地和小麦的分类精度尚可,这是由于这两者具有易于识别的光谱特征,而玉米分类精度极低,在全县区域普遍存在玉米和苹果的混杂情况,在图5前两行行中可以看出郁闭度较低的苹果树苗像元被归为玉米,在县城东部的大量太阳能发电场地错分为灌草,在图5第四行中可以看出方山林场区域存在大量玉米图斑被错分为其他人造地表,在图5第三行中扶蒙村西部的梯田实际为花椒树,属于其他人造地表,被错分为玉米地,这些都导致在光谱特征下分类的总体分类精度较低。

图5 分类结果局部对比

在典型时间序列决策树模型下的分类精度最高,总体分类精度为91.22%,Kappa系数达到0.8949。水体提取效果最好,林皋水库、铁牛河水库边界清晰准确;县城东南的部分大棚由于其反射率较高被错分为建设用地;天然林地内部没有错分情况,苹果的分类精度也较高,但林地和苹果地交界处存在错分情况,在史官镇西部小沟内的林地被错分为苹果,这主要是由于SRTM分辨率有限,虽然经过重采样处理,但与Sentinel-2 L210 m的空间分辨率相比仍存在差距;麦田主要分布于海拔较低的县城周边,分类精度仅次于水体;其他人造地表主要是苹果、玉米和小麦之外的经济作物以及待建设的撂荒地;玉米主要分布于白水西部和北部高海拔地区,林皋湖以西和洛河以北,山坡上开垦的梯田多为玉米地。苹果的分布最广,在全县多个地区有连片的苹果园,除此之外,从北乾村至扶蒙坡的沟内的开垦地无法大面积灌溉,不利于种植苹果树,种植了耐旱的花椒树,还有少量油菜、苜蓿、豆类和大棚蔬菜等经济作物种植于全县各处。分类结果和实地调绘结果均显示苹果、玉米和小麦三种农作物占据了白水县大部分可耕用地。

图6 白水县2021年分类结果

5 结论

本文主要利用多源遥感数据,根据白水县物候特征经验构建不同基于典型时间序列数据集进行聚类分析,同时结合影像分割和决策树支持方法首次对陕西省白水县的主要作物进行提取分类,提出了适用于白水县地情的分类方法,进行精度评价对比,主要结论如下。

(1)白水县作物种类较为单一,且三种主要农作物物候特征差异性显著,同一农作物物候特征统一,主要噪音来自其他地物以及农作物生长空窗期,本文在没有先验知识条件下能够快速有效提取白水县三种主要典型农地物信息,地形变化地区存在部分错分情况,但总体分类精度达到91.22%,相比基于单一时相的光谱特征的分类有着巨大优势。白水县地物分类结果表现的物候规律与白水县农作物的实际物候规律高度吻合,侧面证明了分类结果的适用性;

(2)苹果、玉米和小麦是白水县最主要的农作物,占据了全县大部分耕地。白水县苹果种植分布西多东少,中北部多南部少;玉米主要分布于白水县西部和北部较高海拔地区;小麦主要分布于白水县南部。白水县的苹果种植仍有推广空间,白水县大部分地区的主粮每年只能一熟,相较关中平原没有粮食种植的气候优势,政府应帮助苹果产业扩大销路,促使在新的供需条件下自发调节苹果种植,把握白水县独特的气候条件;

(3)苹果树由于灌溉和拉枝等作业便捷性方面原因,只能在平地种植,与天然林地存在十分显著的地形区分关系,而玉米和小麦的物候特征是可以显著区分的,不涉及地形因素,因此本文利用坡度区分林地和果树的边界在白水县是合理精确的,SRTM空间分辨率和精度对苹果和林地的分类精度有一定影响,替换国内天绘卫星和资源卫星经过人机立体交互编辑的秘级DEM数据,可以对分类精度有进一步的提升。

[1] 李前景,刘珺,米晓飞,等.面向对象与卷积神经网络模型的GF-6 WFV影像作物分类[J].遥感学报,2021,25(2):549-558

[2] 陈玲,贾佳,王海庆.高分遥感在自然资源调查中的应用综述[J].国土资源遥感,2019,31(1):1-7

[3] Vintrou E, Desbrosse A, Bégué A,Crop area mapping in West Africa using landscape stratification of MODIS time series and com-parison with existing global land products [J]. International Journal of Applied Earth Observation and Geoinformation, 2012,14(1):83-93

[4] 朱永森,曾永年,张猛.基于HJ卫星数据与面向对象分类的土地利用/覆盖信息提取[J].农业工程学报,2017,33(14):266-273

[5] 刘昊.基于Sentinel-2影像的河套灌区作物种植结构提取[J].干旱区资源与环境,2021,35(2):88-95

[6] Ball GH, Hall DJ. ISODATA, a novel method of data analysis and pattern classification [R]. California:Stanford Research Institute, 1965

[7] 郝鹏宇,牛铮,王力,等.基于历史时序植被指数库的多源数据作物面积自动提取方法[J].农业工程学报,2012,28(23):123-131,297

[8] Atzberger C, Rembold F. Mapping the spatial distribution of winter crops at sub-pixel level using avhrrtime series and neural nets [J]. Remote Sensing, 2013,5(3):1335-1354

[9] Masek JG, Goward SN, Kennedy RE,. United states forest disturbance trends observed using Landsat time series [J]. Ecosystems, 2013,16:1087-1104

[10] Wardlow BD, Egbert SL. Large-area crop mapping using time series MODIS-250m NDVI data An assessment for the U.S. Central Great Plains [J]. Remote Sensing of Environment, 2008,112(3):1096-1116

[11] 毕恺艺,牛铮,黄妮,等.基于Sentinel-2A时序数据和面向对象决策树方法的植被识别[J].地理与地理信息科学, 2017,33(5):16-20,27,127

[12] 刘瑞清,李加林,孙超,等.基于Sentinel-2遥感时间序列植被物候特征的盐城滨海湿地植被分类[J].地理学报,2021,76(7):1680-1692

[13] 杜保佳,张晶,王宗明,等.应用Sentinel-2A时间序列和面向对象决策树方法的农作物分类[J].地球信息科学 学报,2019,21(5):740-751

[14] 王德军,姜琦刚,李远华,等.基于Sentinel-2A/B时序数据与随机森林算法的农耕区土地利用分类[J].国土资源遥感, 2020,32(4):236-243

[15] 马遇伯,李全新.中国苹果产业发展现状与前景——以陕西省白水县为例[J].农业展望,2019,15(4):38-42

[16] Drusch M, Del Bello U, Carlier S,. Sentinel-2:ESA’s Optical High-Resolution Mission for GMES Operational Services [J]. Remote Sensing of Environment, 2012,120(2018):25-36

[17] 高志远,谢元礼,刘状,等.陕北黄土区SRTMDEM精度对不同地形因子的响应[J].水土保持研究,2019,26(3):174-178

[18] 程红芳,章文波,陈锋.植被覆盖度遥感估算方法研究进展[J].国土资源遥感,2008,20(1):13-18

[19] 侯榆青,胡跃林,易黄建,等.应用ISODATA选取可行域的荧光分子断层成像[J].光学精密工程,2018,26(8):2074-2083

[20] 田甜,范文义,卢伟,等.面向对象的优势树种类型信息提取技术[J].应用生态学报,2015,26(6):1665-1672

[21] Drgut L, Tiede D, Levick SR. ESP: a tool to estimate scale parameter for multiresolution image segmentation of remotely sensed data [J]. International Journal of Geographical Information Science, 2010,24(5/6):859-871

[22] Katja D, Anna G, Peter G,. Water constituents and water depth retrieval from Sentinel-2A: A first evaluation in an oligotrophic lake [J]. Remote Sensing, 2016,8(11):941-965

[23] 查勇,倪绍祥,杨山.一种利用TM图像自动提取城镇用地信息的有效方法[J].遥感学报,2003,7(1):37-40

[24] 马羽赫,赵牡丹,周鹏,等.基于两种卫星传感器的不透水面提取指数比较[J].航天返回与遥感,2021,42(2):139-151

[25] Otsu N. A threshold selection method from gray-level histogram [J]. IEEE Trans on Systems, Man and Cybernetic, 1979,9(1):62-66

Identification for Crops in Baishui County by Clustering Decision Tree Method Based on Multi-temporal Remote Sensing Data

LIU Zhuang1,2,3, LI Gang1,2, SHI Chen-lie3, WEI Yong-qiang1,2, WANG Jian-rong1,2, YANG Xiu-ce1,2

1.710054,2.710054,3.710127,

Using Sentinel-2, landsat8OLI, SRTM and other multi-source remote sensing data, according to the experience of Baishui County's phenological characteristics,and different typicaltime series datasets were constructed for cluster analysis, used image segmentation and decision tree support methods classify various land objects in BaiShui County,Shanxi Province for the first time. The results show that: 1) The method proposed in this paper can effectively extract the information of typical land objects,the overall accuracy of mapping of phenological characteristics was 91.22% and the Kappa increased was 0.8949,compared with the classification of the spectral features based on a single phase, it has great advantages. 2) The three main crops in BaiShui County have significant phenological characteristics, the land object categories extracted by the step-by-step extraction rarely have pixel overlap between categories, and the phenological law of the performance is highly consistent with the actual phenological law of crops in Baishui County, which proves the applicability of the classification results. 3) The distribution of apple planting in Baishui County is more in the west and less in the east, and more in the north and south than in the south; maize is mainly distributed in the west and north of Baishui County at higher altitudes; wheat is mainly distributed in the south of Baishui County; there is still room for promotion of apple planting in Baishui County. These results develop the use of cluster analysis combined with decision tree classification in remote sensing of agricultural crops as well as provide useful references for the economic development of Baishui.

Remote sensing;cluster analysis; crops identification

S127

A

1000-2324(2022)05-0728-07

2022-06-04

2022-07-13

地理信息工程国家重点实验室开放基金(SKLGIE2021-zz-2);航天系统部综合研究项目(TJ20203C040257)

刘状(1994-),男,硕士,研究方向为遥感技术应用,地理信息数据空间分析. Email:1065661608@qq.com

猜你喜欢

物候决策树农作物
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
海南橡胶林生态系统净碳交换物候特征
基于植被物候特征的互花米草提取方法研究——以长三角湿地为例
厉害了!农作物“喝”上环保酵素
决策树和随机森林方法在管理决策中的应用
‘灰枣’及其芽变品系的物候和生育特性研究
基于决策树的出租车乘客出行目的识别