基于遥感云计算平台的四川盆地水稻种植面积提取
2024-01-09李世华刘开通张子建郭佳轩
李世华,刘开通,何 泽,张子建,郭佳轩
(1.电子科技大学 资源与环境学院,四川 成都 611731)
中国是全球最大的水稻生产国,水稻是中国的主要粮食作物[1-2]。四川盆地拥有悠久的水稻种植传统,是中国的水稻主产区之一,其温和的气候和充足的降水为水稻种植提供了适宜的自然条件[3]。水稻种植面积描述了稻田的数量与空间分布,及时准确监测四川盆地的水稻种植面积有助于估算水稻产量、协调农业资源配给、指导灾害风险管理和经济政策制定[4]。水稻种植面积提取可以通过地面调查测量、农业统计估算和遥感成像制图等方法实现,其中遥感成像制图具有高效实时和覆盖区域广等优点,是监测大范围水稻种植面积的关键手段[5]。
星载光学传感器可以精准捕捉地物多波段可见光谱信息,使遥感图像具有直观性和信息量,因此是水稻种植面积提取的传统数据源。然而,光学遥感对于天气条件敏感,云雾天气现象会严重干扰图像获取,限制了其在多云雾地区(如四川盆地)水稻生长季内的可用性[6]。使用高时间分辨率的光学传感器(MODIS)可以通过高频次观测一定程度上缓解云雾天气导致光学数据缺失的问题[7-8],然而其空间分辨率相对较低,像素尺寸通常大于250 m。由于四川盆地地形复杂、地块破碎且种植结构多样,中低空间分辨率的遥感制图存在混合像元效应,限制了水稻种植面积提取的精度[9-10]。星载合成孔径雷达能够在复杂气象条件下提供可靠的地表后向散射信息,高时空分辨率且开源获取的SAR 传感器(如Sentinel-1)日益成为云雾频繁地区水稻遥感观测的替代数据源[11]。VH极化SAR数据对水稻植株和下垫面的理化属性和结构特征变化敏感,通过探测水稻关键物候期(如移栽期和抽穗期)的VH 极化后向散射特征可实现水稻种植面积提取[12]。目前基于SAR数据进行水稻种植面积提取的方法主要分为影像分类法和物候判别法。
影像分类法在采集大量地类样本的基础上,获取水稻生长季或全年的SAR影像,使用机器学习算法实现土地利用分类和水稻种植面积的提取[13-15]。Bazzi[16]等获取法国研究样区的年度时序双极化Sentinel-1 数据,分别使用决策树和随机森林算法进行水稻种植面积提取,随机森林算法获得了最高的精度(总体精度为96.6%,Kappa系数为0.93)。Castro[14]等获取巴西研究样区的年度时序VH极化Sentinel-1数据,使用长短期记忆(LSTM)神经网络模型进行水稻种植面积提取,将该模型与传统的支持向量机、随机森林、k-最近邻和正态贝叶斯等机器学习算法进行比较,LSTM模型取得极高的精度(总体精度为99.14%,Kappa系数为0.99)。随着机器学习算法的快速发展,影像分类法可以获得较高的制图精度。然而,有2 个问题制约了该方法的大区域应用,分别是代表性样本获取和大规模运算。四川盆地土地覆盖类型和作物种植结构复杂多样,获取足够数量且具有代表性的训练样本极为耗时耗力。四川盆地幅员辽阔,大面积影像获取和机器学习模型运算对存储和算力的要求极高。
物候判别法在构建后向散射时间序列的基础上,识别水稻关键物候期的特征,使用时序经验阈值实现水稻生长过程的识别和水稻种植面积的提取[17-19]。Son[17]等获取中国台湾研究样区的年度时序VH 极化Sentinel-1 数据,设置后向散射经验阈值识别水稻移栽期和抽穗期物候特征,实现水稻种植面积提取(制图精度>82.6%,用户精度>82.1%)。Xiao[18]等获取中国浙江研究样区的年度时序VH 极化Sentinel-1 数据,设置后向散射经验阈值识别水稻移栽期物候特征,协同光学遥感指标实现水稻种植面积提取(总体精度为95.4%,Kappa 系数为0.89)。在物候时空一致性较高的区域,物候判别法可以获得较高的制图。然而,有3 个问题制约了该方法的大区域推广,分别是时序噪声、非水稻地物干扰和阈值普适性。SAR散射相干和无规律降雨会导致时序噪声,干扰物候特征的识别。与水稻种植时期接近的夏季植被和水域有时呈现与水稻相似的后向散射特征,可能被误分为稻田。通过特定样本数据得到的经验阈值存在偶然性误差,在不同稻作区的阈值适用性也缺乏检验。
上述问题的存在,导致目前使用SAR数据进行水稻种植面积提取的研究主要关注小区域[20-22]。为实现大区域水稻种植面积提取,本文提出一种基于Sentinel-1 时序数据与遥感云计算平台的四川盆地水稻种植面积提取方法。使用国产遥感云计算平台PIE-Engine进行时间序列VH极化Sentinel-1数据的获取与处理,满足大区域空间分析对存储和算力的需求。基于地面调查和农业普查数据确定四川盆地水稻物候历,划定水稻移栽和抽穗的宽松时间窗口,提升物候分析的时相代表性。对窗口内的Sentinel-1 时序数据进行多时相均值滤波,抑制时序噪声干扰。分析水稻和非水稻地物在窗口内的后向散射差异,按照层次分类的思想,依次去除夏季植被和水域干扰。层次分类中的阈值通过大津(OSTU)法进行全局自适应分割获得,避免了样本选取和经验阈值设置的偶然性误差。选择地形气候存在显著差异的多个样区进行大津阈值的交叉评估,确定适用于四川盆地全域的最优阈值,提升算法普适性。基于高分辨率光学影像判读的土地覆盖样本被用于像素尺度的精度验证,四川盆地各市的农业普查数据被用于区域尺度的结果对比。
1 研究区与数据
四川盆地位于中国西南部,由青藏高原、大巴山、华蓥山和云贵高原环绕而成,大部分位于四川省内,小部位于重庆市内,总面积约10 万km2。盆地内气候温暖、水资源丰富、土壤肥沃,是中国重要的粮食基地。水稻是四川盆地的主要粮食作物,广泛种植于肥沃的盆西平原、盆中丘陵和盆东岭谷。本文选取了气候和地形差异显著的3个地级市(眉山、内江和广安)进行代表性稻作区分析,在此基础上进行四川盆地全域分析。
由于大面积长时序遥感数据获取和处理需要充足的存储与计算资源,本文使用航天宏图信息技术股份有限公司自主研发的PIE-Engine国产地球科学大数据实时计算平台开展四川盆地2020年遥感数据分析,包括Sentinel-1 地距探测模式VH 极化SAR 数据、高分1号B/C/D光学数据和ALOS,DEM数据。PIE-Engine提供的Sentinel-1数据为无量纲的辐射校正处理数据,升降轨协同成像条件下重访周期为6 d,分辨率为10 m,本文实施的预处理包括边缘无效值掩膜和对数单位转换。PIE-Engine 提供的高分1 号B/C/D 数据经过正射融合处理,分辨率为2 m,在本文中用于土地覆盖类型目视解译和样本选取。PIE-Engine 提供的ALOS DEM 数据由L 波段SAR 采集,水平及垂直精度达到12.5 m,本文实施的预处理为坡度计算。此外,通过四川省农业农村厅和重庆市农业农村委员会获取2020年四川盆地农业普查信息,包括各地级市的水稻移栽时间、抽穗时间和种植面积统计数据。
2 研究方法
本文使用的研究流程如图1所示,结合Sentinel-1数据和ALOS DEM 数据获取平坦区域VH 极化后向散射时序,使用农业普查数据确定水稻物候时间窗口,基于物候分析和均值复合生成关键物候时期影像。使用OSTU 法自适应确定层次分类中的影像分类阈值,选择地形、气候差异较大的3 个样区,通过交叉评估确定最优阈值用于水稻种植面积制图。基于目视解译样本进行像素级别的精度检验,并利用四川省和重庆市农业统计数据进行区域尺度的精度检验。
图1 技术路线图
2.1 后向散射时序与水稻物候分析
四川盆地典型土地覆盖类型包括耕地(分为水稻与非水稻耕地)、林地、草地、人工地表和水体。基于高分1 号目视解译样本,提取不同土地覆盖类型的VH 极化后向散射时序,分析各时序的变化规律与趋势差异。由于地形起伏对雷达散射特性会产生显著影响,而四川盆地水稻主要种植在平原或平坦的谷地,因此本文在实施SAR 数据分析前,首先使用ALOS DEM数据移除四川盆地中坡度大于15°的区域。
移栽期和抽穗期是水稻生长过程中最具特点的2个物候阶段。在移栽期,水稻植株矮小稀疏,田间积水深度在5 cm以上,水稻种植区域通常呈现出平静水体的低VH 后向散射特征。在抽穗期,水稻植株高大密集,田间积水基本消失,水稻种植区域通常呈现出茂密植被的高VH后向散射特征。从移栽期到抽穗期,水稻种植区域的VH后向散射通常呈现显著上升的趋势。因此,水稻种植面积提取的关键是区分水稻与其他土地覆盖类型在上述2个物候阶段的VH后向散射差异。
根据农业普查信息确定四川盆地水稻移栽期和抽穗期的宽松时间窗口,获取各窗口内的所有Sentinel-1 VH极化影像。为抑制噪声干扰,对移栽窗口内影像进行时序均值运算,获得移栽均值影像。对抽穗窗口内影像进行时序均值运算,获得抽穗均值影像。对抽穗期均值影像和移栽期均值影像进行差值运算,获得物候差异影像。
2.2 层次分类与水稻种植面积提取
层次分类是一种递进式的图像分类方法,使用特定规则对图像类别进行逐级细化,实现感兴趣类别提取[18]。基于层次分类的思想,依次对移栽均值影像和物候差异影像进行阈值划分。将移栽均值影像中的像元分为低值(水稻和水体)和高值(其他土地覆盖类型)两类,移除高值像元,保留低值像元。将移栽均值影像中的低值像元区域作为掩膜矢量,对物候差异影像进行裁剪。将裁剪后的物候差异影像中的像元分为低值(水体)和高值(水稻)两类,移除低值像元,保留高值像元。
为实现移栽均值影像和物候差异影像中低值和高值像元的精确划分,本文使用大津(OSTU)法自适应确定阈值[23]。大津法将影像分为背景和目标两类,使用类间方差描述背景与目标的差异,通过遍历像元值查找类间方差最大的阈值,实现背景与目标的最佳分割。在分割移栽均值影像时,低值像元为目标类,而在分割物候差异影像时,高值像元为目标类。在代表性稻作区(眉山、内江和广安3个地级市全境),分别开展层次分类的大津法阈值分割,计算不同稻作区大津阈值的均值,将其作为四川盆地全域的层次分类阈值,实现大范围水稻种植面积提取。
2.3 精度验证
基于空间分辨率为2 m的高分1号B/C/D光学数据人工目视解译获得土地覆盖类型样本,影像成像时间从2020 年4 月1 日至9 月30 日,覆盖水稻的生长期,综合利用遥感影像光谱特征、纹理特征、时相特征进行目视解译,从而确定水稻样本与非水稻样本(包括非水稻典型地物:人工地表、林地、草地、非水稻耕地、水体),共获得水稻样本8 202像素,非水稻样本9 406 像素,样本均匀离散的分布在整个四川盆地。利用目视解译得到的样本进行像素尺度的精度检验,使用混淆矩阵中的制图精度、用户精度和总体精度量化水稻种植面积的提取效果。基于四川省农业农村厅和重庆市农业农村委员会的农业普查数据进行区域尺度的精度检验,将各市县的水稻种植面积统计数据与本文结果进行比较。
3 结果与分析
3.1 后向散射时序与水稻物候
四川盆地典型土地覆盖类型的VH 后向散射时序如图2 所示,水稻后向散射在5 月初接近谷值,随后显著升高,并在8 月初接近峰值。根据农业普查数据,确定四川盆地水稻的移栽窗口为4 月15 日至5 月15 日,抽穗窗口为7 月15 日至8 月15 日。从4 月至9 月,人工地表、林地、草地和水体的后向散射时序整体保持平稳,而非水稻耕地的后向散射相较于水稻呈现较弱的上升趋势。
图2 典型土地覆盖类型的VH后向散射时序
3.2 层次阈值与四川盆地水稻种植面积
分别在眉山、内江和广安3 个地级市全境进行层次分类的大津法阈值分割,并计算区域均值(表1)。确定适用于四川盆地全域的移栽均值影像阈值为-8.3 dB,物候差异影像阈值为0.8 dB。
表1 层次分类阈值/dB
结合四川盆地全域阈值和坡度掩膜,实现水稻种植面积提取(见图3)。四川盆地水稻种植面积共22 393 km2,主要集中在盆西平原(成都市、眉山市、德阳市和绵阳市)、盆中丘陵(内江市、自贡市、广安市和泸州市)和盆东岭谷(达州市和重庆市西北部)。
图3 四川盆地水稻种植面积
3.3 结果评价与分析
基于土地覆盖类型样本的像素尺度精度检验如表2所示,水稻种植面积提取的总体精度达到82.08%。16.38%的非水稻像素被误分为水稻,主要是受到季节性降雨的影响,降雨导致某些非水稻耕地在5 月发生了田间积水或土壤含水量高的情况,而在8 月出现茂密的作物冠层,因而形成了与水稻相似的后向散射时序。19.69%的水稻像素被误分为非水稻,主要是因为部分水稻生长周期较长,抽穗期冠层较为密集,冠层对雷达信号的衰减作用较强,导致其在物候差异影像中的像元值低于分割阈值而被漏分。
表2 像素尺度精度检验
表3 区域尺度精度检验/hm2
川中丘陵地势起伏,雷达信号在山区的成像几何和散射特性发生变化,山区稻田的后向散射时序受到干扰,降低了层次分类中全局阈值的普适性。此外,山区地形会导致部分地区在雷达波束下形成阴影,无法被正确成像,且部分种植于梯田或坡耕地的水稻被坡度掩膜移除。因此,水稻种植面积可能被高估(内江市和自贡市)或低估(南充市、宜宾市和广安市)。虽然使用全局阈值不可避免地在部分地区出现错分和漏分,但本文的方法实现了大面积水稻种植面积提取在精度和效率的平衡。
4 结 语
本研究提出了一种基于Sentinel-1 时序数据与PIE-Engine遥感云计算平台的大面积水稻种植面积提取方法,通过农业普查数据明确水稻物候历,划定关键物候期时间窗口,使用多时相均值滤波抑制时序噪声,采用层次分类和大津阈值法进行水稻和非水稻像元的自适应分割,基于多样区交叉评估确定全局阈值,实现了四川盆地水稻种植面积提取,总体精度达到82.08%。四川盆地水稻种植面积共22 393 km2,主要集中在盆西平原(成都市、眉山市、德阳市和绵阳市)、盆中丘陵(内江市、自贡市、广安市和泸州市)和盆东岭谷(达州市和重庆市西北部)。本文提出的方法不依赖训练样本和经验统计,能够有效区分水稻与非水稻作物,适用于省级尺度水稻种植监测,为农业部门的政策制定提供信息支撑。