基于Sentinel-1A 数据和BP 神经网络的裸露地表土壤含水量反演研究
2023-01-30马梦梦孙培彦
郭 文,马梦梦,孙培彦
(1.黄河勘测规划设计研究院有限公司,河南 郑州 450003;2.水利部黄河流域水治理与水安全重点实验室(筹),河南 郑州 450003;3.邓州市桑庄镇人民政府农业服务中心,河南 邓州 474150)
0 引言
土壤水是地表和大气界面水-热能量交换的关键参数,在全球水循环和气候变化的研究中扮演着重要角色[1]。及时、准确、高分辨率的土壤含水量估测在水文学、气象学、生态学以及农业管理等领域有着重要的现实意义和科学价值[2]。光学遥感和微波遥感是目前土壤含水量反演的主要手段。相比于光学遥感,微波遥感不受天气状况的影响,能够实现全天时、全天候的对地观测。微波后向散射系数与土壤介电特性之间独特的敏感性,使微波遥感成为目前最具潜力的土壤含水量反演手段[3]。
利用微波遥感反演土壤含水量的算法可分为理论模型、经验模型和半经验模型三类。一般情况下,土壤的介电常数随着土壤含水量的增大而增大,而雷达后向散射系数直接受土壤介电常数的影响,这是微波遥感反演土壤含水量的主要机理,也是理论模型所依托的物理基础。目前常用的裸露地表土壤含水量反演理论模型包括积分方程模型(IEM)[4],以及在IEM 模型的基础上发展的改进积分方程模型(AIEM)[5];经验模型包括Oh模型[6]、Dubois模型[7];半经验模型包括基于L波段雷达数据提出的Shi模型[8]。张祥等[9]利用IEM 模型,分析了土壤含水量变化与雷达后向散射系数变化之间的关系,根据雷达后向散射系数差估算土壤水分变化信息;余凡等[10]引入了综合粗糙度参数描述地表粗糙状况,利用AIEM 模型,提出了一种基于微波双极化数据的裸露地表土壤水分反演方法;耿德源等[11]基于地基雷达L 波段全极化数据,比较了Oh 模型、Dubois 模型、Shi 模型以及AIEM-Oh 模型的土壤水分模拟精度。研究表明,对于裸露地表,雷达系统参数(入射角度、极化方式)和地表参数(土壤含水量、地表粗糙度等)与雷达后向散射系数之间存在复杂的非线性关系[12-14]。然而,经验与半经验模型建立在特定的数据集上,适用范围较小,精度不高;理论模型虽然适应性强且可以达到较高的土壤含水量反演精度,但其机理性较强,所需参数复杂,这些因素限制了其在土壤含水量反演研究中的应用潜力[15,16],有学者尝试利用机器学习算法替代传统的回归方程法对土壤含水量进行反演,但其训练集与验证集均为实测数据,虽精度高但缺乏理论支撑[17]。目前,仍未有研究在高空间分辨率的Sentinel-1A 数据支撑下,将微波遥感理论模型与机器学习算法相结合,对裸露地表含水量的反演进行探索。
本研究基于C 波段Sentinel-1A 数据,首先利用AIEM 模型模拟不同入射角度、地表均方根高度、相关长度、以及土壤含水量参数下的微波后向散射系数,建立理论模型模拟数据库,分析各参数对后向散射系数的影响。然后将实测数据加入模拟数据库,按7∶3 的比例拆分为训练集和验证集,构建BPNN 模型。最后,利用野外实测数据测试BPNN 模型在土壤含水量反演中的精度和适用性。研究一方面通过分析后向散射系数随雷达参数、地表参数的变化规律,削弱数据局限性和空间异质性造成的反演误差;另一方面基于AIEM 模型生成BPNN 训练数据库,为机器学习模型嵌入微波散射物理基础。两方面相结合,可在保证地表土壤含水量反演精度的同时,为有效降低反演过程的复杂度提供新思路。
1 数据来源
1.1 试验区概况
研究区隶属于河南省邓州市(32.5°~32.7°N,112.16°~112.32°E),属于典型的暖温带大陆性季风气候,四季分明,光照充足,冬春季干燥寒冷,夏季炎热多雨,秋季天高气爽。多年平均气温14.9 °C,多年平均降水816.2 mm。本次试验时间为2021年10 月中旬,研究区夏玉米已完全收获,冬小麦陆续播种,因此,地表几乎无植被覆盖,可近似为裸露地表。
1.2 雷达数据源及预处理
Sentinel-1A 卫星是欧空局哥白尼计划发射的首颗环境监测卫星,于2014 年4 月3 日发射升空。Sentinel-1A 载波波段为C 波段(5.4 GHz),具有VV、VH 两种极化方式,以及条带、干涉宽幅、超幅宽和波模式四种成像模式。本研究获取的Sentinel-1A 数据为干涉宽幅模式下的GRD Level-1影像,分辨率5 m×20 m,幅宽250 km。利用欧空局SNAP 软件对数据进行轨道校正、热噪声去除、辐射定标、相干斑滤波以及地形校正等预处理。其中,采用Refined Lee 滤波降低图像中的相干斑噪声,利用SRTM 数字高程模型进行地形校正。预处理完成后,根据以下公式将雷达影像的亮度值DN转换为后向散射系数σ0:
1.3 野外地表参数采集
地面数据采集时间为2021 年10 月19 日,与Sentinel-1A 卫星过境时间一致。在研究区内均匀选取15个裸露地表采样点,实地采集土壤含水量、土壤粗糙度、经纬度等地面参数,采样点分布见图1。土壤含水量采用TDR300土壤水分仪测量,探针长度7.5 cm。测量时,在以采样点为中心半径10 m 的范围内,均匀采集5 个测量点的土壤含水量数据,取5 次测量结果的平均值作为该采样点的土壤含水量。土壤粗糙度采用0.9 m×0.6 m尺寸的粗糙度板进行测定,分别沿南北方向、东西方向测量地表均方根高度和相关长度,取两个方向的平均值作为该采样点的土壤粗糙度。利用手持双频GPS 接收器记录采样点的经纬度坐标,测量精度为厘米级。
图1 研究区采样点分布Fig.1 Distribution of sampling sites in the study area
2 理论模型与研究方法
2.1 AIEM模型
研究区主要为裸露地表,且土壤表层含水量相对较低,因此,在比较了一系列微波散射理论模型原理及其适用条件的基础上,结合研究区特征,采用AIEM 模型进行微波散射模拟,以建立裸露地表微波散射特征数据库。
AIEM 模型是基于微波辐射传输方程的地表散射模型,由Chen 等在IEM 模型的基础上发展而来。该模型通过建立后向散射系数与地表参数之间的关系来模拟地表粗糙面的散射特征,以求解土壤水分。相比于IEM 模型,AIEM 模型对自相关函数与Fresnel反射系数进行了改进,去除了原模型中格林函数的近似假设,重新推导了补偿场系数,使之能够在较宽的地表粗糙度范围内更精确地模拟地表的散射和辐射特征。AIEM 模型的单次散射可表示为:
式中:p,q为极化方式;k为自由空间波数,kz=kcos(θ),kx=ksin(θ);θ为雷达入射角;s为均方根高度;Wn为地表粗糙度功率谱表示如下:
其中,fqp和Fqp是Fresnel反射系数的函数。
交叉极化(VH)下的后向散射系数采用Oh 模型计算,公式如下:
式中:为VV极化下的后向散射系数;l为相关长度。
2.2 土壤介电常数模型
土壤介电特性主要受土壤中水分含量、质地构成以及孔隙度等因素的影响。研究选用Dobson 土壤介电常数模型来描述土壤介电常数与含水量之间的关系。将土壤介电常数模型与AIEM 模型相结合,可建立土壤含水量—土壤介电常数—后向散射系数3个关键参数之间的联系,从而达到模型应用的目的。
Dobson土壤介电常数模型的表达式为:
式中:ϵ'为土壤介电常数实部;ρb为土壤容重,g/cm3;ρs为土壤中固态物质密度,一般取ρs=2.66 g/cm3;εs为土壤中固态物质介电常数,一般取4.7;α为常数因子,取0.65;Mv为土壤体积含水量,%;β'为束缚水修正系数,由土壤中砂粒、黏粒百分含量计算得到;表示自由水介电常数实部,由水温度(与土壤温度相同)和微波频率计算得到。
2.3 BPNN
BPNN 是一种多层前馈神经网络,该网络的学习过程分为信号的前向传输与误差的反向传播两个部分。在前向传输过程中,样本数据从输入层传入,经过各隐含层处理后到达输出层;若输出层预测值与期望值之间存在差异,则转入误差的反向传播过程,误差信号通过隐含层向输入层反向传递。以误差信号作为修正网络各层权值的依据,前向传输和反向传播两个阶段交替进行,这一过程即为神经网络的训练过程。当训练次数达到预先设定的迭代次数,或者误差减少到可接受的程度时,训练过程终止。BPNN 具有自适应学习能力,能够快速建立输入和输出之间的高度非线性映射关系,因此,被广泛应用于复杂多元非线性关系的建模与研究[18,19]。
本研究的具体技术路线见图2。
图2 技术路线图Fig.2 Technology roadmap
3 结果与分析
3.1 AIEM模型模拟结果分析
土壤含水量是影响雷达后向散射系数的主要因素之一。为探讨不同的雷达参数和地表粗糙度参数下土壤含水量与雷达后向散射系数之间的响应关系,研究利用Matlab R 2018a 编程实现AIEM模型和Dobson土壤介电常数模型的构建。并利用模型生成不同入射角、均方根高度、相关长度以及土壤含水量条件下的地表后向散射系数数据库。各参数的具体范围及模拟步长见表1。
表1 模拟参数设定Tab.1 Simulation parameters
为直观表明雷达参数、土壤粗糙度参数、土壤含水量与微波后向散射系数之间的关系,使用高斯相关函数条件下的均方根斜度公式m=2s/l将均方根高度和相关长度两个地表粗糙度参数合并,根据研究区雷达入射角范围,以30°入射角为例,绘制与m、Mv之间的三维关系,见图3。从图3 中可以看出,不同极化方式的雷达后向散射系数对土壤含水量的响应呈现出相同的变化趋势,由于VH 极化易受地物多次散射影响,导致其后向散射强度弱于VV 极化。在特定的地表粗糙度条件下与Mv之间呈现明显的对数关系,随着Mv的增加缓慢增加并逐渐趋于饱和,且VV 极化下的后向散射强度对Mv变化的敏感度略高于VH 极化。在相同Mv条件下随着m的增大明显增加,然而,当m增加到一定程度时,这一增长趋势逐渐减弱。这是由于当地表粗糙度较小时,微波散射以单次散射为主,而随着m的增加,地表散射中的多次散射贡献逐渐增大,造成对m变化的敏感性明显下降[20]。因此,在对土壤含水量进行模拟时,必须考虑地表粗糙度的影响[21]。
图3 30°入射角下与m、Mv的三维散点图Fig.3 Three dimensional scatter plots of and m、Mv at 30° incident angle
3.2 基于BPNN的土壤含水量反演模型构建
BPNN模型的建模步骤如下:
(1)将AIEM 模型模拟数据与实测数据共6 735 组数据按7∶3的比例拆分为训练集和验证集。其中训练集用于拟合数据之间的关系,构建模型;验证集用于调整超参数,以及监控模型训练过程是否发生过拟合。
(2)模型设置1 个隐含层,包含10 个隐含神经元,采用Relu函数作为隐含层激活函数。
(3)采用Adam 优化器训练神经网络。相比于传统的梯度下降算法,Adam 优化器可以基于训练数据迭代更新神经网络权重,具有收敛速度快、调参过程简单等优点。本研究将最大迭代次数设置为2000,batch_size为20,学习率、指数衰减率等参数保持默认,当训练次数达到最大迭代次数时,停止训练。
(4)选用决定系数(R2)与均方根误差(RMSE)对模型精度进行评价与验证。R2越接近于1,RMSE越小,说明模型精度越高。
3.3 不同模型对微波后向散射系数的模拟结果对比
将入射角、土壤粗糙度和含水量作为输入参数,不同极化方式下的后向散射系数作为输出参数,随机取出模拟数据库中的70%数据训练BPNN 模型,其余的30%数据用于精度验证。以验证集为例,AIEM 理论模型和BPNN 模型对后向散射系数的模拟值对比见图4。结果显示,VV 极化和VH 极化方式下,BPNN 模型的R2分别为0.998 和0.997,RMSE分别为0.22 和0.26。总体来看,经过训练后的BPNN 模型可准确拟合不同雷达参数、地表粗糙度、土壤含水量条件下的后向散射系数,其模拟结果与传统AIEM 理论模型模拟结果高度一致,且无需繁杂的计算与推理过程,在基于微波遥感的土壤含水量反演研究中具有巨大的应用潜力。
图4 AIEM模型和BPNN模型后向散射系数对比Fig.4 Comparison of backscattering coefficients between AIEM model and BPNN model
3.4 土壤含水量反演结果验证与分析
将入射角、土壤粗糙度和Sentinel-1A 影像提取的后向散射系数作为输入参数,采用构建的BPNN 模型反演土壤含水量,并利用野外实测数据对BPNN 模型反演结果进行验证,结果如图5所示。
图5 基于BPNN模型的土壤含水量模拟值与实测值对比Fig.5 Comparison between the soil water content estimated by BPNN and the measured value
通过实测数据和模型反演数据之间的对比可以发现,BPNN 模型预测的土壤含水量与实测值之间的R2为0.72,RMSE为0.033 g/cm3。在土壤含水量介于0.20~0.30 g/cm3时,模型模拟效果最好。当土壤处于干燥状态时,模型模拟的土壤含水量略高于实测值,而当土壤含水量高于0.30 g/cm3时,模型对土壤含水量有一定程度的低估。总体来看,BPNN 模型在裸露地表土壤含水量的微波反演领域精度较高,可以利用其进行裸露地表土壤含水量的监测与评估。
4 结论
以Sentinel-1A SAR 影像作为微波数据源,根据AIEM 理论模型构建不同入射角度、地表粗糙度、以及土壤含水量参数下的雷达后向散射系数模拟数据库,分析了各参数对雷达后向散射系数的影响。在此基础上构建BPNN 模型,将模拟数据库与实测数据相结合用于模型的训练和验证。研究得出结论如下:
(1)在特定入射角下,地表粗糙度对土壤含水量反演精度的影响不可忽略。在相同Mv条件下随着m的增大明显增加,当m增加到一定程度时对m变化的敏感性明显下降。
(2)VV极化和VH极化方式下,研究构建的BPNN模型对后向散射系数的模拟结果与理论模型模拟结果高度一致,二者之间R2分别达到0.998 和0.997。表明通过将微波散射物理机制嵌入BPNN模型,既可保证模拟精度,又可有效降低模拟过程的复杂性。
(3)采用野外实测数据测试BPNN 模型对土壤含水量的预测精度,模型预测值与实测值之间的R2为0.72,RMSE为0.033 g/cm3。表明利用C波段主动微波遥感和BPNN模型可以实现对裸露地表土壤含水量的准确反演。本研究成果可在农田灌溉管理、环境变化监测、水文循环等领域提供科学支撑。