多样种植区冬小麦RS影像精确提取方法研究
2023-08-01张殷钦王利书
李 宾,荆 华,张殷钦,王利书
(1.河北工程大学河北省智慧水利重点实验室,河北 邯郸 056038;2.邯郸市漳滏河灌溉供水管理处,河北 邯郸 056001)
我国耕地总面积位列世界第三,不仅耕地面积大,种植作物结构也复杂多样,在开展农业精细化水资源管理过程中,急需对不同作物分布情况进行精确监测。但截至目前,我国大多数地区还是以实地调查并逐级汇总上报的形式进行统计[1],组织人力去实地调研勘察冬小麦种植面积,不仅监测范围有限,还费时费力,若利用遥感技术则可高效获取大面积耕地影像分布数据,对农业管理与水资源管理具有重要意义。当前,国内外众多学者对此开展了大量的研究。姚玉梅等[2]基于遥感技术对邯郸市馆陶县实现了高精度、大面积的农作物水分消耗监测,为农业节水管理提供了依据;冯权泷等[3]运用机器学习方法和深度循环神经网络模型,获取了冬小麦空间分布特征,提取精度达0.93 以上;吴及[4]在1999—2010年Landsat4-5TM 卫星遥感数据的基础上,通过最大似然分类法提取出三峡库区的四类土地利用,得到了三峡库区各土地类型规模占比与变化速率;刘焕军等[5]使用最大似然法基于多时相遥感数据对土壤进行分类,精度达91%,为土壤精细制图提供了依据;李振今等[6]使用最大似然法监测济南市林业变化结果,总体精度达98%以上;孙坤等[7]对比监督分类法中的6 种分类器的分类精度及计算效率,得出最大似然分类法效果几乎具备各分类器的全部优点且计算时间相对较短,适合在中低空间分辨率多光谱遥感影像的分类研究中应用。
邯郸市永年区作为河北省多样蔬菜种植基地和全国粮食生产的先进县,作物结构复杂多样,冬小麦种植范围大,本文以邯郸市永年区为例,针对区域现状,详细阐述了基于ENVI(The Environment for Visualizing Images)遥感操作平台,使用该方法获取冬小麦分布影像的流程,可为农业遥感监测提供借鉴。
1 数据获取和预处理
1.1 数据获取
本文以欧洲航空局Sentinel-2 光学卫星影像为数据源,选取与地面观测时间同步目标影像。该卫星2015年成功发射,空间分辨率可见光10 m,近红外20 m,短波红外60 m,其多光谱仪器每10 d 就可以提供全球从北纬83°到南纬56°的多光谱图像,时效性较高。
1.2 数据预处理
欧洲航空局的SNAP 哨兵数据应用平台是所有Sentinel-2工具箱的基础平台,具有可以处理更大规模的业务、更简单地从某一环境转移到另一环境下与将复杂系统分解为更好的可管理模块的界面。对影像的处理通过SNAP(Sentinel Applications Platform)软件窗口(Geometric)中重采样(Resampling)工具对Sentinel-2数据进行波段重新采集至10 m×10 m的空间分辨率。
由于重采样的波段文件较多、空间储存较大,通过ENVI5.3 可合并所有波段,也可根据需要合并部分波段。以B2、B3及B4波段为例,使用图层合并工具Layer Stacking将3个波段合成为真彩色影像。
2 影像提取方法
2.1 ROI建立
ROI(Region of Interest)即为样本区域的选取,也称为训练样本或检验样本,可使用点、线、面进行绘制,主要是为遥感影像分类做基础准备。通过ROI 可完成图像的掩膜提取、裁剪以及对影像进行局部统计的相关操作。
训练样本分离性的差异程度也可利用Jeffries-Matusita 距离参数确定,取任意2 种样本类别之间的检验区Jeffries-Matusita 距离作为衡量标准[8],根据式(1)计算Jeffries-Matusita距离,由此来确定任意2个训练样本间的相似性和可分离度的一致性是否符合要求。Jeffries-Matusita 距离参数是依据不同波段反射率内的每个训练样本计算而来,其值域[9]为0~2,若Jeffries-Matusita值超过1.8,则说明选取的2个样本差异性明显,两者分离性较强;若该参数为1.4~1.8,则说明2个样本差异性降低,两者分离性较弱;若该参数小于1.4,则说明2个样本差异性不大,需对2个样本重新划分取样;若该参数小于1,则说明2 个样本可能为同一种土地利用类型,应合并为同一类,合并后还需重新进行样本分离度计算并验证其是否符合精度要求。
式中:Jmn指检验区Jeffries-Matusita 距离;指在影像中任意像元x出现在m类中的条件概率;指图像中任意像元x出现在n类中的条件概率。
监督分类前,在下载的Sentinel-2 影像基础上,根据野外收集调查整理的资料,可通过室内目视解译的方法,对不同土地利用类型进行划分,并在不同用地类型上选取一定量的样本作为训练样本。在此基础上,选取的每个训练样本与整个影像上的像元作比较,在ENVI 平台操作最大似然分类工具,将所要提取影像的像元划分到与选取样本最相近的类别中,以此完成对整个遥感影像的分类[10]。ROI 建立流程,如图1所示。
图1 ROI建立流程
2.2 分类方法选择
遥感图像方法因具有观测覆盖面广、信息提取速度快的特性,已应用于冬小麦的信息收集。当下的遥感方法中,监督分类法中主要使用的方法有最小距离法、平行六面体法和最大似然分类法等[11]。
最大似然分类法采用了遥感卫星的多频带数据分布中的多维正态分布,并以此建立了训练样本判定识别的分类方法[12],即为每一种像元在同一类别中的占比将相对应的像元分配在该类型中,其步骤如图2所示。其主要原理为贝叶斯公式,即:
图2 最大似然分类法步骤
式中:gi(x)为分类函数;P(ωi|x)属于ωi的概率;P(x|ωi)为似然概率;P(ωi)表示ωi这一类中出现像元x的概率;P(x)为变量x与样本类别没有相互关联下出现的概率。这表示在不同类别之间的判断中,利用统计的方法建立非线性的判别函数集。
2.3 精度评价
精度评价是指将实地勘察数据与遥感分类结果相比较,从而判断分类结果的精确度及可靠性。基于ENVI 平台,利用混淆矩阵工具评价分类精度。混淆矩阵是将实测的像元个数与分类提取的像元个数相对比形成的阵列关系,以n×n的矩阵表示,是一种最常用的影像分类结果评价的计算工具[13],其步骤如图3所示。
图3 混淆矩阵流程
整体影像分类完成后,由混淆矩阵精度计算工具计算Kappa 系数、总体精度(Overall Accuracy),并分别计算样本点正确分类为要求类别的比率、地面真实参考数据被正确分类的概率、错误分类的概率以及被遗漏的误差[14]。其中,Kappa系数是基于ENVI平台对分类精度进行评价的一个指标[15],如式(3)所示。Kappa系数的评价指标通常在0~1,用来表示分类前后的一致性:Kappa系数的值若小于0.2,则表示分类结果精度弱;若在0.2~0.4,则表示分类结果精确度微弱;若在0.4~0.6,则表示分类结果前后一致性中等,即样本划分结果精确度中等;若在0.6~0.8,则表示分类结果前后一致性高,即样本划分结果精确度显著;若超过0.8,则表明分类结果前后几乎完全一致,即样本划分结果精确度最高[16]。
式中:Kappa系数表示精确度评价指标;M为感兴趣区提取的样本总数;n代表划分的土地利用类型总数,i表示数量(i=0,1,2,…,n);Xii代表混淆矩阵对角线上的值;Xi+和X+i分别表示混淆矩阵中划分类别列和行的和。
3 区域示例
河北省邯郸市永年区位于东经114°20′~114°52′、北纬36°35′~36°56′,地处半湿润半干旱地区,总面积760.72 km2,是全国粮食生产先进县和全国蔬菜产业十强县,主要农作物为轮作冬小麦、夏玉米,兼种大蒜、温室大棚蔬菜等其他作物,种植结构较复杂,具有显著多样性。
按上述方法,通过Sentinel-2 影像预览邯郸市永年区,最终选取云层覆盖度较低、经重采样后空间分辨率为10 m 的遥感数据,成像时间为2019年5月4日。原始影像如图4 所示,地理位置如图5所示。
图4 永年区原始影像
图5 永年区地理位置
3.1 样本提取
本文将遥感影像数据划分为冬小麦、建筑物、其他耕地、荒地4 类样本数据。选取不规则边框划分样本边界,以避免在取样时选取到其他土地利用类型。根据样本分离度计算结果,冬小麦与荒地、荒地与建筑物、冬小麦与建筑物、建筑物与其他耕地及荒地与其他耕地的分离度均大于1.8,属于样本分离性最强、差异性较好类型。由于选取试验区种植结构较为复杂,其他耕地区域在选取影像时间段内种有大蒜等农作物,其中大蒜在目视解译过程中与冬小麦差异性相差较小,但其种植密度较低,进而导致冬小麦与其他耕地分离度在1.4~1.8,分离度较弱。综上,样本分离度符合差异性评价要求,样本选取合格。感兴趣区分离度评价,如图6所示。
图6 感兴趣区分离度评价
3.2 分类结果
根据《邯郸统计年鉴2020》,永年区冬小麦实际占地面积330.21 km2,约占总面积的43.4%。基于目视解译的4 种土地利用类型,为直观了解其分布情况,通过最大似然分类法使其可视化,如图7 所示。去除其他3 种土地利用类型后,清晰展示了冬小麦分布情况,如图8 所示,冬小麦主要分布在刘营乡、刘汉乡、讲武乡、大北汪镇、曲陌乡与正西乡东北区域,永年西部及南部地区以种植大蒜等蔬菜为主,与实际情况较为符合。
图7 土地利用类型
图8 冬小麦分布
基于ENVI 平台中的分类统计工具,计算各土地利用类型像元数量,像元总数即永年区整体占地面积。以计算冬小麦占总体像元数量的百分比作为本次分类面积与实际面积的精度验证。通过最大似然分类法的像元数量分析,提取的冬小麦像元数为3025316 个,约占总面积像元数量的40.01%,与实际占地面积相差仅为3.09%。像元分布数量,如图9所示。
图9 像元分布数量
经过ENVI 平台中的混淆矩阵工具的精度验证结果,如图10 所示,影像提取总精度达95.9%,Kappa系数为0.94,表示分类结果几乎一致,分类精度最佳,错分误差及漏分误差都在0.08 以下,生产者精度与用户精度达0.92 以上,因此可认为分类精度较高。
图10 精度验证结果
4 结论
以河北省邯郸市永年区为示例,使用最大似然分类法在作物种植较为复杂的情况下,实现了对冬小麦空间分布和种植面积的快捷、准确获取,其中冬小麦遥感提取面积为304.33 km2,与实际统计面积相差仅为3.09%,误差较小,识别的总精度及Kappa系数分别达0.95 与0.94,准确度较高。由此可以看出,最大似然分类法在实际应用中有较强的适应性,不仅可实现种植情况的提取,也可对建筑物以及林地覆盖范围进行识别等,应用领域较广。