基于地相位优化估计的RVoG三阶段森林冠层高度反演
2022-08-08罗洪斌朱泊东岳彩荣杨文俊徐婉婷
罗洪斌 朱泊东 岳彩荣 杨文俊 龙 飞 徐婉婷
(西南林业大学林学院, 昆明 650224)
0 引言
在全球气候变化的背景下,森林生态系统的监测显得尤为重要[1]。森林冠层高度是反映森林生物量、碳储量、森林健康状况的重要指标之一,在森林的演替和变化监测中也具有重要作用[2-4]。因此准确快速地获取森林高度信息对森林资源的动态监测具有重要意义,传统的人工调查效率低,成本高,虽可获得精确的结果,但在大区域尺度的调查中并不适用。遥感技术的应用,极大改善了这一被动局面[5]。
现阶段森林资源调查中使用的遥感技术方法主要包括光学、激光雷达、微波遥感等[6]。光学遥感的优势在于可用数据源多、时间序列长以及重访周期短,虽然能获取地表反射率信息,但对森林的垂直结构信息并不敏感,而且受云的影响较为严重[7];激光雷达可全天候作业并快速获得林分冠层以及内部三维结构信息,但观测尺度有限且成本较高[8];虽然星载平台的激光雷达如ICEsat-1、ICEsat-2和GEDI已开始广泛应用,改善了观测尺度问题,但由于传感器平台和数据量限制,目前也只做到条带覆盖而不是面覆盖,微波遥感具备全天候、主动性、大范围面覆盖的特点,相较于前两者优势极为显著[9]。
其中,极化干涉合成孔径雷达(Polarimetric interferometric SAR,PolInSAR)既具有干涉合成孔径雷达(Interferometric SAR,InSAR)对地表植被散射体的空间分布和高度很敏感的特性,同时又具有极化合成孔径雷达(Polarimetric SAR,PolSAR)对植被散射体的形状和方向很敏感的特性,所以在森林冠层高度的监测中得到了广泛应用[10-11]。但是基于PolInSAR的森林冠层高度反演需要考虑雷达波长、重访周期、空间基线和信噪比等因素。为此,德国宇航中心(DLR)发射了首个双星同步观测任务TanDEM-X(TDX),消除了时间去相关问题[12-14]。
在基于PolInSAR的森林冠层高度反演中应用最为广泛的是地面随机体(Random volume on ground,RVoG)相干散射模型和RVoG三阶段反演方法[15-17],三阶段反演法通过干涉复相干的分布规律估计地表相位,利用查找表进行森林冠层高度反演,并已成功应用于不同的频段,包括C-波段、L-波段、P-波段和x-波段。在RVoG三阶段反演方法的理想条件下,不同极化通道的复相干在复平面内呈直线分布,采用最小二乘回归(Least square regression,LSR)求解直线与单位圆的交点,结合先验知识就可获得地表相位[17],但在实际情况中却存在一定误差,PolInSAR数据由于受基线、信噪比以及地形条件的影响,造成观测到的复相干存在误差,因此复相干的实部和虚部在复平面内的分布会偏离理想的相干线[18],另外由于TDX的波长较短,穿透性较差,难以获得地表散射信息,得到的体散射和地表散射相位中心差别较小造成线性分布规律不明显[19-20],而最小二乘法仅考虑自变量中的误差未考虑因变量的误差,以此求解的地表相位也存在误差[21]。另外,在体相干的选择时,以往的研究多采用固定极化通道作为体相干,若复相干存在误差时,所选择的体相干与地相位的差异并不是最大。
为此,CLOUDE等[17]提出采用整体最小二乘法来改善对地相位的估计,在文献[18]的研究中也得到了验证,考虑了自变量与因变量的误差来改善直线拟合和地相位的求解可提高森林冠层高度反演精度,除此以外,戴明回归(Deming regression,DMR)和正交回归(Orthogonal regression,OGR)2种直线拟合方法也考虑了自变量和因变量存在误差的情况,正交回归的基本原理是在样本中间找到一条直线,使得点到直线的距离之和最小,若在样本点的横纵坐标都包含误差的情况下,使用正交回归能够得到更准确的结果[22],戴明回归则是正交回归的一般化,在样本点的横纵坐标都有误差且误差大小不同时,在目标函数中加入一个误差比来限制直线拟合,此时优化的便是样本点与直线的斜距,当误差比为1时,戴明回归也就是正交回归[23],但是将此方法结合RVoG三阶段反演方法估计地相位进行森林冠层高度反演的研究报道较少。因此,为进一步探索RVoG三阶段森林冠层高度反演中地相位估计所采用的直线拟合方法以及体相干的选择对反演结果的影响,本文将采用正交回归和戴明回归2种直线拟合方法与传统最小二乘回归进行地相位估计,并以地相位为参考逐像素选择体相干来反演森林冠层高度。
1 研究区与数据
1.1 研究区概况
思茅区地处云南省普洱市(100°19′29″~100°26′57″E,22°27′7″~23°5′29″N),东接江城县,西接澜沧县,南邻西双版纳州,北接宁洱县,地势西北高东南低,区域内山脉、峡谷、水系众多,平均海拔为2 155 m,气候类型属于南亚热带季风气候,干湿季节不分明,常年高温、湿润、多雨,年平均气温为17.8℃,平均降水量为1 524 mm,在特殊气候类型的作用下,境内森林覆盖率较高,样地分布位置见图1。
1.2 样地数据
样地数据的获取时间为2017年3月,在研究区内设置了42个样地,优势树种为思茅松,其中成熟林和中龄林居多,幼龄林和过熟林最少,样地冠层高度主要采用刻度杆、激光测距仪、微波测距仪相结合进行获取,首先通过 GPS 确定样本点中心,设置半径为10 m的圆形样地;随后绕测、记录胸径,计算样圆内样本木的平均胸径以及所属径阶,选择属于该径阶的3~4棵标准木,使用刻度杆测量其冠层高度,对于森林冠层高度超过刻度杆有效值的情况,采用激光测距仪、微波测距仪相结合进行测量。样地森林冠层高度最小值为8.210 m,最大值为20.230 m,平均值为16.108 m。
1.3 TanDEM-X数据的获取与处理
TanDEM-X数据获取时间为2015年10月6日,该数据由德国宇航中心DLR提供,获取模式为Bistatic 模式,数据格式为CoSSC全极化单视复数,中心入射角为39.640°,有效基线为361.310 m,模糊高度为17.700 m。对数据进行了平地相位去除、多视、滤波等处理,并计算不同极化基下的复相干,包含线极化基下的干涉复相干(γHH、γHHmVV、γHHpVV、γHHVV、γHV、γHVpVH、γVV)、圆极化基下的干涉复相干(γLL、γLR、γRR)、SVD相干优化下的干涉复相干(γOpt1、γOpt2、γOpt3)以及PD相干优化的干涉复相干(γPDhigh、γPDlow)[24-25]。
2 研究方法
2.1 RVoG相干散射模型
RVoG模型是一种应用广泛的两层相干散射模型,能够基于PolInSAR复相干反演森林冠层高度[26-28],TanDEM-X为双基站工作模式,在不考虑时间去相干等因素时,干涉复相干可表示为
(1)
其中
式中m(ω)——有效地体幅度比
φ0——地相位,当m(ω)=∞时为地表散射,当m(ω)=0时为体散射
γv——仅由植被引起的失相干
不考虑地表散射的贡献时γv可表示为
(2)
其中
式中σ——植被平均消光系数
hv——植被高度
θ——主影像入射角
z——散射层位置
f(z)——植体散射部分的相对反射率
α——距离向坡度
kz——垂直有效波数,表示相位对高度变化的敏感性
R——斜距B⊥——垂直基线长度
n取决于雷达图像的获取模式[29],单基工作模式时n=2;双基工作模式时n=1。
2.2 RVoG三阶段反演流程
三阶段森林冠层高度反演方法由CLOUDE等[17]提出,该方法基于复相干的空间分布特征进行地相位的求解,并基于RVoG模型进行森林冠层高度反演,过程分为3个阶段:
(1)拟合相干直线。根据主辅影像的散射矩阵得到极化干涉矩阵,对不同极化状态下的复相干和最优相干的实部和虚部进行相干直线拟合。
(2)从相干直线与单位圆的2个交点中求解地相位,基于极化通道的物理散射机制认为HV通道只有植被层的体散射,γHV地体幅度比较小,可以通过2个相干点与γHV的距离来判断地相位,距离γHV最远的那一个即为地相位φ0。
(3)
式中γ0、γ1——相干线与单位圆的2个交点
arg()——取相位函数
(3)森林冠层高度(hv)和消光系数(σ)的估计。根据式(2)中γv与hv、σ的关系设置合理的hv和σ,创建二维查找表(LUT),反演过程就是在查找表中搜索与体相干(γ(vol))距离最小的模型体相干(ejφ0γv)所对应的森林冠层高度(hv)和消光系数(σ)
(4)
2.3 地相位求解的相干直线拟合方法改进
传统的三阶段反演采用最小二乘回归(LSR)来拟合相干直线求解地相位,文中采用3种直线拟合方法进行地相位求解,分别为最小二乘回归(LSR)、戴明回归(DMR)和正交回归(OGR)。
在n个样本点:(x1,y1)、(x2,y2)、…、(xn,yn)中,目标函数为y=ax+b。最小二乘的原理是在样本点中寻找一条直线,计算y的误差与残差,使拟合函数的拟合误差(残差和)达到最小来构建直线方程,此过程仅考虑了自变量x的误差,目标函数优化的是样本点到直线的竖直距离[30]。
正交回归则是在样本中间找到一条直线,使得n个样本点到直线的距离之和最小,此方法考虑了自变量x和因变量y都包含误差情况,相较于最小二乘回归增加了因变量误差的权重[23]。
戴明回归则是正交回归的一般化,若自变量x和因变量y均有误差且误差不同时,可在目标函数的构建中加入一个误差比(0~1)来限制直线拟合,此时优化的便是样本点与直线的斜距,误差比为1时,戴明回归也就是正交回归[22]。
2.4 体相干优化选择
基于极化通道的物理散射机制认为HV通道只有植被层的体散射,γHV地体幅度比较小,通常以γHV作为体相干进行森林冠层高度反演,但是在体相干的选择中由于HV极化通道的散射相位中心并不是最靠近冠层顶部的,因此本文基于逐像素单元选择距离φ0最远的复相干作为体相干,以φ0为参考得到的体相干散射相位中心更接近冠层顶部,从而避免使用固定极化通道作为体相干造成反演结果存在误差。
(5)
式中γi——各极化基和极化通道复相干
γmax——距离地相位最远的体相干
abs()——取模值
2.5 精度评价指标
采用决定系数R2、均方误差(MSE)对反演精度进行评价。
3 结果分析
本文基于逐像素进行体相干选择并采用3种直线拟合方法来进行相干直线的拟合求解地相位来反演森林冠层高度,探讨地相位估计方法和体相干的选择对森林冠层高度反演的影响。其中,在地相位拟合方法中戴明回归需加入一个自变量与因变量的误差比来限制直线拟合,当误差比为1时戴明回归也就是正交回归。为了对结果进行对比,分别采用误差比0.3和0.6来构建戴明回归目标函数,并基于3种不同方法估计的地相位结合RVoG三阶段方法进行森林冠层高度反演,不同反演策略的验证结果如图2所示。
图2 不同方法的反演结果对比Fig.2 Comparison of inversion results of different methods
由图2可知,在5种不同地相位估计方法的森林冠层高度反演中,采用LSR拟合相干线求解地相位并直接基于HV极化通道相干性γHV的反演精度最低,R2为0.349,MSE为7.097 m2;以地相位为参考,采用基于像元的最大距离体相干选择相较于使用γHV为体相干的反演精度有明显提升,R2由0.349增加到0.383,MSE由7.097 m2降低到5.755 m2,表明以地相位为参考选择体相干能有效提高森林冠层高度反演精度,散点图2b相较于图2a也较为收敛。
在不同的相干直线拟合方法反演的结果中,无论采用DMR进行相干线拟合还是采用OGR进行相干线拟合,求解地相位的反演精度相较于LSR也有一定提升,R2均提高了15.927%左右,MSE约减少2 m2,其中采用DMR拟合相干直线且误差比为0.3时的精度最高,MSE为4.897 m2,但是三者之间的差异并不明显,但结果充分说明了在RVoG三阶段森林冠层高度反演中地相位估计方法对最终的反演结果有一定影响。从散点图中也能看出明显的变化,在LSR地相位估计反演验证结果中(图2a、2b),样本点在趋势线周围的分布较为离散,其余3种地相位估计的反演验证结果中样本点的分布更靠近趋势线(图2c~2e)。
前文提到,RVoG三阶段反演的理想条件下,不同极化通道的复相干在复平面内呈直线分布,采用最小二乘法(LS)可求解地表相位。但在实际情况下却存在一定的误差,本文也做了验证(图3),受基线长度、信噪比以及地形条件的影响,干涉复相干本身存在误差,在复平面内的分布会偏离理想的相干线,另外TDX的波长较短,穿透性差的局限性造成体散射和地表散射相位中心差别较小,这也会使复相干的分布偏离相干线,此时采用LSR进行相干直线拟合会使拟合直线偏离总体趋势,因此求解的地表相位也存在误差; DMR和OGR 2种回归方法均考虑了自变量和因变量的误差,在误差比的约束下,即便数据存在噪声点,但拟合得到直线仍然服从样本的总体变化规律。另外由于复相干存在误差,体相干的选择时采用固定极化通道作为体相干也并不合理,在后续讨论中将对此问题进行进一步分析。
图3 不同直线拟合方法结果Fig.3 Results of different straight line fitting methods
4 讨论
本文对三阶段反演算法中的地相位估计方法进行了比较优化,说明在复相干存在误差的情况下,对地相位估计方法进行优化能改善森林冠层高度的反演结果,结合研究区和数据情况来看,本文的研究区位于云南省普洱市思茅区,该区域地处南亚热带季风气候区,林下植被情况复杂且地形起伏也较大,平均坡度为23°、最大高差为1 036 m(来源于DEM)。在此条件下,由于SAR数据的成像机制限制,地形起伏较大带来的直接影响就是数据的叠掩和透视收缩现象,使数据出现无效区域和引起失相干,这对于森林冠层高度的反演有直接的影响[31]。
另一方面是研究所使用的TDX数据的波长较短,对森林结构的穿透性有限,虽能获得有效冠层散射相位中心,但是难以获取地表散射信息,相干优化算法也难以有效进行相位分离,各复相干的相位中心差别较小,且本研究使用的数据空间基线相对较大会带来基线失相干,以上的因素都会给复相干带来误差,此时用最小二乘法拟合相干直线估计的地相位误差也相对较大[18-20,32],固定极化通道的体相干与地相位的距离也并不是最远,而文中引入戴明回归和正交回归来改善地相位的估计能在一定程度上克服复相干噪声点的影响从而使估计的地相位更加准确,从而提高森林冠层高度反演效果,此结论与文献[18]的研究一致。本文的研究结果可为地相位估计方法的优化选择提供一种参考。对于体相干的选择优化,在确定地相位之后,以地相位为参考选择距离大的相干性作为体相干相较于采用固定极化通道更为合理。
但从总体反演结果来看,地相位估计的优化和体相干的优化选择能改善反演精度,但总体的反演精度略低于相关研究的反演结果[16,33],一方面是受到上述所提到的环境、地形以及卫星平台和数据自身存在的问题,另一方面是所使用的验证样本数据带来的影响,在人工测量时,若森林冠层高度分布不均匀,最终所得到的测量结果与反演结果也存在一定差异,其次是结果验证中使用的数据样本量有限,在今后的研究中,可以采用LiDAR、GEDI、ICEsat的冠层高度产品来进行验证,在大样本数据的支撑下,结果可能更据说服力。
虽然TDX数据与样地数据的测量时间相差1年,在1年中森林冠层高度会发生变化,但研究对象多为成熟林和过熟林,高度变化相对缓慢,因此1年间植被的高度变化并不会太大,采用样地测量数据来对反演结果进行验证是有效的。
5 结束语
在RVoG三阶段森林冠层高度反演算法中,PolInSAR数据受传感器自身和环境条件的影响,干涉复相干存在误差,此时采用最小二乘拟合相干直线来求解地相位的误差相对较大,本研究采用了戴明回归和正交回归方法来优化RVoG三阶段反演算法中地相位估计,并以地相位为参考来选择体相干。结果表明,在复相干存在误差的情况下,以地相位为参考选择体相干的反演结果比基于固定极化通道的反演结果要好。另外,戴明回归和正交回归拟合的相干线求解地相位的反演结果也比采用最小二乘方法拟合相干直线的反演结果要好,因此对RVoG三阶段反演算法中的地相位估计和体相干的优化选择可改善森林冠层高度的反演结果。