APP下载

基于NDVI-NSSI空间与HSV变换的成熟期农作物遥感识别

2023-08-22宋承运曲雪杉胡光成

农业机械学报 2023年8期
关键词:成熟期决策树冬小麦

宋承运 曲雪杉 胡光成 苏 涛

(1.安徽理工大学空间信息与测绘工程学院, 淮南 232001;2.矿山采动灾害空天地协同监测与预警安徽普通高校重点实验室, 淮南 232001;3.中国科学院空天信息创新研究院遥感科学国家重点实验室, 北京 100101)

0 引言

农作物的识别与生长状态的动态监测有助于掌握农作物种植结构与变化信息,在农作物估产、精细农业,以及粮食安全、社会稳定、国家区域经济相关政策规划制定等方面具有重要意义[1-2]。其中,成熟期的农作物识别可排除作物生长期所受各种因素的影响,更接近实际作物收获情况,在农作物产量的估算与统计中具有极其重要作用。

相对于传统的统计方法,遥感技术在冬小麦、油菜等农作物的识别与监测中,具有快速、宏观、精度高等优势,在农作物的监测与估产等领域发挥重要作用[3-4]。根据使用的遥感数据,可以分为单一时相与多源长时序遥感数据的识别方法。

采用单一时相遥感数据识别农作物主要根据农作物的光谱特征及其统计学特征进行识别。以亮度、色调、纹理、时间等为基础的人工目视解译方法,监督与非监督分类法等常用于冬小麦等农作物识别[5-6]。为了提高提取精度,许多研究结合随机森林、面向对象分类法、卷积神经元网络、混合像元分解等方法进行冬小麦等农作物的识别[7-12]。同时,无人机技术在冬小麦识别与长势监测等方面进行了许多的研究应用[13-15]。此类方法使用数据量较少,可操作性强,但易受到“同物异谱”、“异物同谱”的影响,在农作物成熟期易与土壤背景混淆,降低农作物识别精度。

利用多源多时相遥感卫星数据,结合农作物生物物候学规律,可以提高冬小麦等农作物的识别精度。该方法通常以归一化植被指数(Normalized difference vegetation index,NDVI)、增强植被指数(Enhanced vegetation index, EVI)、宽动态植被指数(Wide dynamic range vegetation index, WDRVI)等特征指数为基础,利用长时序遥感数据对农作物进行识别[16-21]。其中,高空间分辨率Sentinel-2数据在冬小麦等农作物识别中具有较大的潜力[22-23]。但长时序遥感数据往往需要面对大量遥感数据的获取以及遥感数据处理、云的影响等诸多问题,会直接影响农作物的识别精度与可操作性。同时,目前大部分研究集中于冬小麦发育期、越冬期和生长期遥感识别,对于成熟期冬小麦的遥感识别研究较少,而成熟期也是农作物的重要生长期之一,在农作物种植面积估算、农业生产及产量统计方面具有重要作用。如何利用较少的遥感数据识别成熟期农作物,在丰富农作物生长期遥感识别的方法与提高识别效率方面具有重要意义。

鉴于以上分析,以安徽省滁州市凤阳县为研究区,利用Sentinel-2A 数据,以NDVI与归一化光谱分离指数(Normalized spectral separation index,NSSI)空间模型为基础,采用混合像元分解方法,提取成熟期农作物的空间分布,针对研究区内冬小麦与油菜具有相同的成熟期,两者不易区分的问题,利用油菜开花期光谱特征,结合Hue saturation value (HSV) 变换方法,研究成熟期冬小麦、油菜遥感识别方法。

1 研究区与数据源

1.1 研究区概况

安徽省滁州市凤阳县(32°37′~33°03′N,117°19′~117°57′E,图1)位于安徽省东北部,淮河中游南岸,地形北低南高,北部以平原为主、中部多为高岗丘陵、南部山地丘陵为主。气候属于北亚热带湿润季风气候,年均气温14.9℃;降水丰富,年均量840~920 mm,境内有淮河、濠河等8条河流。

图1 研究区位置及采样点分布图Fig.1 Location of study area and map of observation points

凤阳县是全国首批商品粮基地县,也是国家商品粮生产基地县,常年粮食总产量为6.0×108kg。主要农作物包括冬小麦、水稻、玉米、花生、油菜等,其中油菜与冬小麦的物候期较为相似,主要农作物物候期如表1所示。

表1 凤阳县主要农作物物候历Tab.1 Phenological calendar in Fengyang County

1.2 数据源

1.2.1遥感影像数据

Sentinel-2A遥感影像数据覆盖从可见光、近红外到短波红外波段,共13个通道,最高空间分辨率为10 m。数据获取时间为2021年3月22日与2021年5月21日,前者处于油菜的开花期,用于开花期油菜空间分布信息提取,后者处于冬小麦和油菜的成熟期,用于成熟期冬小麦与油菜空间分布信息提取。

1.2.2验证数据

主要包括野外采样数据与FROM-GLC10-2017数据。

野外采样数据为2021年3—5月地面采集数据,共选取样点65个,如图1中白色采样点所示。其中,冬小麦采样点32个,油菜采样点21个,其他地物采样点22个。

FROM-GLC10-2017数据是由清华大学研发的10 m分辨率全球土地覆盖产品(http:∥data.ess.tsinghua.edu.cn/fromglc2017v1.html)。该产品基于Google Earth Engine平台,使用全球1.3×105个样本点,基于随机森林分类器,利用Sentinel-2影像,得到全球10 m土地覆盖图,总体精度可达72.76%[24]。该数据集共分为10类,包括耕地、林地、草地、水体等地物类型。根据不同农作物的物候特征和纹理特征进行目视解译,区分出耕地中的各种农作物,共选取样本点50个,主要分布于大面积农作物种植区域,如图1中黑色采样点所示。其中冬小麦采样点25个,油菜采样点15个,其他地物采样点10个。

2 研究方法与技术路线

2.1 基于NDVI-NSSI空间混合像元分解法

农作物进入成熟期后,茎叶逐渐变黄,直至枯萎,光合作用逐渐降低,此阶段可以通过非光合植被(Non-photosynthetic vegetation,NPV)覆盖度监测成熟期农作物生长状况及分布[25-26]。在750~900 nm,NPV的一阶微分光谱反射率几乎都大于裸土,由此,利用NDVI -NSSI空间可以监测光合植被和非光合植被覆盖度变化。NSSI与NDVI可由Sentinel-2A影像数据得到,其数学表达式为

(1)

(2)

式中,B4、B6、B8、B8A分别为Sentinel-2A影像的B4(中心波长为665 nm)、B6(中心波长为740 nm)、B8(中心波长为842 nm)、B8A(中心波长为865 nm)波段反射率。其中,B4、B8采用均值法由10 m重采样至20 m,得到分辨率20 m的NDVI与NSSI。

2.1.1线性混合像元分解

根据像元三分模型,混合像元由光合植被(PV)、非光合植被(NPV)、裸土(BS)3种成分组成,则像元三分模型的数学表达式为

S=∑fiSi=fPVSPV+fNPVSNPV+fBSSBS

(3)

N=∑fiNi=fPVNPV+fNPVNNPV+fBSNBS

(4)

∑fi=fPV+fNPV+fBS=1

(5)

式中S——Sentinel-2A遥感影像像元NSSI值

N——Sentinel-2A遥感影像像元NDVI值

SPV、NPV,SNPV、NNPV,SBS、NBS分别表示PV、NPV与BS端元的NSSI和NDVI值,可通过由NDVI-NSSI空间确定的PV、NPV、BS纯端元计算得到;fPV、fNPV、fBS分别表示像元内PV、NPV 和 BS 的覆盖度。

在研究区内PV、NPV与BS纯端元的NSSI和NDVI值已知时,可以通过解算式(3)~(5)组成的方程组得到fPV、fNPV、fBS值。最后,由fNPV确定成熟期农作物的空间分布。

2.1.2基于NSSI-NDVI空间的纯端元提取

将遥感影像像元投影到由NDVI与NSSI组成的空间中,可以构成如图2所示的三角空间。三角形的3个顶点分别代表裸土、植被、非光合植被的纯端元,三角内部像元代表了不同“裸土-光合植被-非光合植被”丰度组合的像元。

图2 NDVI-NSSI空间示意图Fig.2 Diagram of NDVI-NSSI space

图2中NDVI-NSSI空间3个顶点提取的像元作为PV、NPV和BS的纯端元。

2.2 基于光谱特征的油菜提取方法

由于研究区内冬小麦与油菜具有相似的生长期,由混合像元分解提取的成熟期农作物主要包括小麦与油菜,因此,需要进一步区分冬小麦与油菜。油菜在3月开花期间,花瓣呈现出明显的亮黄色,可以利用此时期光谱特征识别出油菜,通过HSV变换提取出油菜范围,进而提取识别出成熟期小麦空间分布。

HSV变换是一个有效并被广泛应用的图像变换方法,在HSV颜色空间中,H分量代表颜色,S分量代表颜色纯度,V分量代表颜色亮度[27]。遥感影像一般表示为RGB颜色空间,利用标准颜色空间转换实现RGB空间到 HSV 空间的转换,其数学表达式为

(6)

由于油菜在开花期冠层为亮黄色,可以通过S分量与V分量提取油菜分布范围。

2.3 支持向量机与决策树分类法

支持向量机(Support vector machine, SVM)与决策树分类方法提取的作物类型信息将主要用于对NDVI-NSSI空间与HSV变换方法识别的农作物结果进行交叉对比验证。

SVM以统计学习理论为基础,被广泛应用于遥感领域农作物分类研究。SVM根据一定数量的样本特征值构建分类模型,通过核函数将输入向量映射到一个高维特征空间, 构建最优分类超平面,实现目标的识别分类[28]。由2021年5月21日研究区Sentinel-2A单景影像数据,通过实地采集样本和目视解译获取的不同地物类型样本,提取出成熟期冬小麦与油菜。

决策树分类利用多时相遥感数据集,按照判别规则分层分级逐渐细分地物,定义决策树的各分支,实现地物分类与提取[22]。冬小麦与油菜具有相似的物候期,12月处于分蘖期与长叶期,此时,其他水稻、玉米等农作物还未播种,表现为裸地; 次年6月中旬冬小麦与油菜已收割表现为裸地,其他农作物未收割,由12月与6月中旬数据可以将冬小麦、油菜与其他作物区分开;3月油菜处于开花期,NDVI值较低,而冬小麦处于拔节期,NDVI较高,可将冬小麦与油菜区分开。由此建起决策树,如图3所示。

图3 决策树模型Fig.3 Decision tree model diagram

2.4 技术路线

本研究通过构建NDVI-NSSI空间,结合HSV变换,识别成熟期冬小麦与油菜,技术路线如图4所示。

图4 技术路线图Fig.4 Technical road

首先,Sentinel-2A遥感影像预处理。主要包括重采样、波段融合、影像裁剪等工作;并利用归一化水指数、归一化建筑指数去除水体、建筑物。

其次,成熟期农作物面积提取。由Sentinel-2A数据计算NSSI与NDVI,并构成特征空间,提取PV、NPV与BS的纯端元,通过混合像元分解法,得到非光合植被覆盖度,提取成熟期冬小麦与油菜等农作物。

然后,利用油菜开花期Sentinel-2A数据,通过HSV变换提取出油菜的覆盖范围。在提取的成熟期农作物的范围中,由叠置分析,提取出冬小麦。

最后,结合地面观测数据、辅助数据,以及SVM和决策树分类结果进行精度评价与分析。

3 结果与分析

3.1 三角空间混合像元分解法结果分析

选取2021年5月21日研究区Sentinel-2A多光谱数据,由式(1)、(2)计算得到NSSI与NDVI,并组成散点图,如图5所示。该时期中一稻为分蘖期,玉米为拔节抽穗期,花生为出苗生长期,都处于光合作用旺盛的时期,可视作光合植物,NDVI值较高,NSSI值较低,如图5散点图中绿色圈区域。祼土的NDVI与NSSI值较低,生长中的植被NDVI值高,如图5散点图中红色圈区域。成熟期的冬小麦与油菜为非光合植被,NSSI值较高,NDVI值较低,如图5散点图中黑色圈区域。

图5 NDVI-NSSI空间散点图Fig.5 Scatter plot of NDVI-NSSI space

3.2 冬小麦与油菜空间分布

研究区内像元在NDVI-NSSI空间中分布于PV、NPV、BS构成的三角空间中,通过三分像元分解模型求解PV、NPV、BS的覆盖度。结合实地观测数据,混合像元中NPV覆盖度占比大于50%的像元确定为成熟期农作物,此成熟期农作物为冬小麦和油菜,其空间分布如图6所示。

图6 2021年5月21日凤阳县成熟期农作物分布图Fig.6 Distribution map of mature crops in Fengyang County on 21 May of 2021

油菜在开花期呈现亮黄色的特征,由2021年3月22日Sentinel-2A遥感影像,通过HSV变化得到S分量与V分量,其阈值分别设为0.3与0.09,提取出油菜分布范围,并通过叠置分析,分别得到研究区内成熟期冬小麦与油菜的空间分布,如图7a所示。SVM分类法与决策树分类结果如图7b与图7c所示。

图7 不同方法提取结果Fig.7 Results of crop map using different algorithms

图7中,3种方法提取到的冬小麦与油菜的空间分布相似,研究区内冬小麦与油菜种植面积大,分布广,尤其在北部与西北部平原地区。冬小麦作为主要的粮食作物在研究区内种植面积明显大于油菜,除在南部及东部山地区域外,北部及西北部分地区都有大面积集中种植;而油菜的种植则呈现零散分布,中部区域种植较多,东北部和西南部区域种植较少。

在农作物大面积种植区域,如北部临淮关镇地区(图7中黑色矩形区域),3种方法提出的冬小麦聚合程度高,边界清晰,空间分布基本一致,如图8所示,其中,分布于河流两侧,种植面积较小的油菜,NDVI-NSSI空间方法能够较为完整地识别(图8b),而一些田间道路,如图8a中部田间环形道路,SVM法与决策树法将大部分道路识别为油菜,如图8c、8d,未能将裸土与成熟期农作物区分开。凤阳县中部及东部地区,农作物种植面积较小,冬小麦与油菜分布较为零散,如中部总铺镇地区(图7中红色矩形区域),像元多为混合像元,相较于SVM与决策树法提取结果(图9c、9d),NDVI-NSSI空间方法能够更好地提取出零散分布的冬小麦与油菜,如图9b所示。

图8 临淮关镇地区不同方法提取结果Fig.8 Results of different methods in Linhuaiguan area

图9 总铺镇地区不同方法提取结果Fig.9 Results of different methods in Zongpu area

3种方法提取的冬小麦与油菜的种植面积相比较(图10),NDVI-NSSI空间方法提取的冬小麦与油菜的面积最大,SVM方法提取到的面积最小,决策树方法与NDVI-NSSI空间方法提取的冬小麦与油菜种植面积较为接近。

图10 冬小麦与油菜种植面积统计图Fig.10 Histogram of planting area of winter wheat and rape

3.3 精度分析

不同方法提取到的冬小麦和油菜的用户精度、制图精度、总体精度及Kappa系数如表2所示。

表2 不同分类结果精度Tab.2 Evaluation of classification results

表2中,NDVI-NSSI空间法的总体精度最高(95.34%),Kappa系数为0.904,高于SVM分类法(91.66%,Kappa系数为0.813)与决策树分类方法(92.39%,Kappa系数为0.838)。冬小麦与油菜的制图精度与用户精度也都高于SVM与决策树。3种方法识别的冬小麦的制图精度高于油菜的提取精度,用户精度相似。

3.4 讨论

利用2景Sentinel-2A数据提取成熟期冬小麦、油菜空间分布,通过65个地面采样点和50个辅助数据的采样点对结果进行精度分析,总体精度在95.34%,Kappa系数为0.904,高于采用单一时相的SVM分类法与多时相数据的决策树分类结果,3种方法主要差异在于凤阳县中部与南部地区种植面积小,分布较为零散的冬小麦与油菜的识别。该地区以侵蚀剥蚀山、丘陵为主,农田多以零散不规则形状分布,面积较小,水田、祼地分布较多,成熟期冬小麦、油菜等光谱特征与祼地相似,且多为混合像元,SVM与决策树分类法易将成熟期的农作物识别为裸地,而NDVI-NSSI空间与HSV变换方法,能够将具有相似光谱的成熟期冬小麦、油菜与土壤背景分离,在一定程度上减少了“异物同谱”的影响。

NDVI-NSSI空间与HSV变换方法能够提取出面积较小的冬小麦与油菜,总面积大于SVM与决策树分类法提取结果。被错分的主要为一些非成熟期农作物因干旱、病虫害等引起枯萎、死亡,成为非光合植被,易被提取为成熟期农作物,同时,种植时间、方式等因素影响,遥感影像成像日期内,个别区域冬小麦、油菜未完全成熟,NDVI值较高,易被识为光合植被,都会造成结果被错分、漏分。

研究中还有一些不足之处,首先,该研究中由NDVI-NSSI空间方法提取出成熟期的农作物,需要借助HSV变换方法分离出冬小麦与油菜,具有相似成熟期的不同农作物识别时,可能需要借助其他数据与方法识别。其次,很多农作物成熟期雨水天气较多,受云覆盖等影响,有效遥感数据的获取会受到一定限制,但随着长时序遥感数据重建及去云处理等研究的深入,可以进一步提高数据的可获取性及方法的可操作性。

4 结论

(1)通过NDVI-NSSI空间可以有效地提取出光合植被、非光合植被、祼土纯端元,将具有相似光谱的成熟期植被与土壤背景区分开,减小“异物同谱”的影响,为成熟期农作物的识别提供了简便的方法,也为提取农作物成熟期内的裸地以及与裸地具有相似波谱的地物提供了新的思路与方法。

(2)NDVI-NSSI空间与HSV变换相结合,可以有效识别非光合植被,提取小面积、混合像元的成熟期冬小麦与油菜。其中,NSSI参数的引入对成熟期农作物识别具有很大贡献。同时,该方法具有需求数据少,可操作性好的优势,也为油菜的遥感识别,以及分离具有相似成熟期的农作物提供了新的方法。

猜你喜欢

成熟期决策树冬小麦
陈晓明 进入加速期和成熟期,未来十五年是花都滨水新城黄金时代
果实成熟期土壤含水量对‘北红’葡萄花色苷和果实品质的影响
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
甘肃冬小麦田
基于决策树的出租车乘客出行目的识别
不同成熟期桃品种在衢州市的引种试验
冬小麦和春小麦
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于SPOT-5遥感影像估算玉米成熟期地上生物量及其碳氮累积量