基于干涉相位-相干幅度法和基线选择的森林冠层高度反演
2022-10-17罗洪斌岳彩荣
罗洪斌,岳彩荣,王 宁
(西南林业大学 林学院,昆明 650224)
实现碳达峰、碳中和,是构建人类命运共同体的重要一环,是积极参与全球气候治理的重要手段。提高森林生态系统碳估算精度,在全球碳循环和气候变化研究中意义重大。森林冠层高度是表征森林生物量和碳储量的重要指标之一,目前主要依靠遥感手段来获取大区域尺度下的森林冠层高度信息,常用的遥感方式主要包括光学遥感、激光雷达遥感、合成孔径雷达遥感等[1]。但是,在森林垂直结构信息的监测反演中,光学遥感对森林垂直结构信息的灵敏度较低,容易出现饱和且较易受到天气影响;激光雷达能获得高精度的三维垂直结构信息,但其局限性在于观测尺度小,花费成本高;合成孔径雷达(Synthetic Aperture Radar,SAR)兼顾主动性、全天候、观测尺度大的特点,能有效弥补其他方法的不足[2]。
基于合成孔径雷达的森林冠层高度反演主要借助干涉合成孔径雷达(Interferometric SAR,InSAR)和极化干涉合成孔径雷达(Polarimetric Interferometric SAR,PolInSAR)技术。其中,PolInSAR兼备PolSAR和InSAR的特点,既能够获取植被的散射特征信息又能获取植被散射相位高度信息,被广泛应用于森林冠层高度反演[3-4]。目前常用的PolInSAR森林冠层高度反演方法主要包括DEM差分法、RVoG模型法、相干幅度法和相位-相干幅度方法。DEM差分法根据PolInSAR的散射机理,通过计算地面和冠层的散射相位中心,进行差分,得到森林冠层高度,但受到森林结构和消光的影响,该方法容易造成低估现象,需要利用实测数据进行修正[5-6]。另一种方法是RVoG模型法,此方法将森林结构简化为两层(体积层和地面层),利用复相干性估计森林高度,RVoG三阶段算法则是RVoG模型的扩展[7-9],是目前使用最广泛的森林冠层高度反演方法。在RVoG三阶段方法中,地面相位通过拟合相干线来计算,并设置恰当的消光系数和森林冠层高度构建二维查找表来反演森林冠层高度,该方法虽然精度可靠,但是耗时较长,反演过程复杂。在RVoG模型中,若假设消光系数为0,而且不考虑表面散射时,森林冠层高度与“纯”体积相干的关系可以用SINC函数来表示,此时可以用相干幅度信息来反演森林冠层高度,称为相干幅度法。但是在森林中,干涉信号常受到去相干和环境条件的影响,尤其在复杂植被条件下,由于相位信息的缺失,仅依靠相干幅度信息来反演森林冠层高度的结果并不理想,结果往往出现高估现象。为此,Cloude等[10]提出了相位差分和相干幅度联合的森林冠层高度反演方法,称为相位-相干幅度法。该方法有效弥补了相位差分法和相干幅度法单一反演的不足,不仅在精度上有了极大的改善,而且模型的耗时也较短[10-11]。
以往的研究多是以单基线数据为基础,而随着多基线PolInSAR技术应用,PolInSAR森林冠层高度反演精度得到了进一步提高。多基线PolInSAR相较于单基线的优点是对同一观测地面单元内存在多个基线的观测数据,可针对不同的地面观测单元选择最优的基线,这将有利于提高森林高度的估测精度。根据森林冠层高度的反演理论可知,PolInSAR的模糊高度对最终的反演结果有重要影响,较低矮的森林需要较小的模糊高,高大的森林需要较大的模糊高,多基线PolInSAR则可以有效解决此问题。在基线的选择中,目前常用的基线选择方法主要包括高度变量法或高程精度法(VAR)、偏心率法(ECC)和平均相干幅度与分离度乘积法(PROD)、原点到拟合直线距离与分离度乘积法(LINE)[12-13]。本研究采用机载多基线PolInSAR数据,基于相位-相干幅度法反演森林冠层高度,在传统的相位-相干幅度法的基础上,使用RVoG三阶段方法估计地相位,计算相位差分部分的森林高度,同时比较了4种基线选择方法下的反演结果差异。
1 研究区与数据
试验区位于中非西海岸的加蓬共和国。2016年,美国宇航局与欧洲航天局和加蓬航天局合作开展了AfriSAR项目。2016年2—3月,美国宇航局的无人机合成孔径雷达(UAVSAR)与机载LiDAR分别获取了L波段多基线全极化PolInSAR数据和全波形激光雷达数据集。文中多基线UAVSAR来源于NASA的喷气推进实验室(JPL),该数据经过了极化定标、基线精配准和频谱滤波处理,并以单视复数的形式提供。激光雷达的相对高度变量RH100来源于NASA橡树岭国家实验室生物地球化学动力学分布式主动档案中心(DACC)。本研究以Pongara作为试验区(图1),该试验区的PolInSAR数据轨道为5,垂直基线长度分别为0,20,45,105m。距离向分辨率为3.33m,方位向分辨率为4.8m。使用Python对单视复数的距离向和方位向进行了8×6的多视处理以消除噪声的影响,计算多基线极化相干矩阵,并使用PD相干优化算法[13]计算冠层和地表为主导的两个复相干。森林冠层高度反演结果采用激光雷达的相对高度变RH100进行验证[14]。
2 研究方法
2.1 相位-相干幅度法
单一的相干幅度信息和相位信息都容易受到消光系数和垂直结构的影响,造成森林冠层高度估计不准确。因此,Cloud等[10]提出将DEM差分法与SINC模型法相结合来反演森林冠层高度,利用相干幅度信息弥补差分法的不足,从而改善森林冠层高度的估计精度。该方法包含两个部分,第一部分是干涉相位差分的森林冠层高度,在差分部分的森林冠层高度估计中,通常选择靠近冠层和地表的两个相干相位中心来计算差分高度(式1),这样得到的地相位通常位于地表偏上的位置,因此导致反演值偏低。本文中采用RVoG三阶段方法来[9,15]估计地相位(φ0),计算差分森林冠层高度,以提高差分部分的估计精度。该方法的第二部分是相干幅度法(SINC模型)。这一方法假设地体幅度比和植被层的消光系数均为0,此时,RVoG模型简化为SINC函数,受去相干的影响,仅依靠相干幅度信息容易造成高估,所以需要通过系数ε进行补偿,ε通常取0.4[11],模型的具体表达式如式(2)所示。
(1)
(2)
式中:φ0表示地相位,kz表示垂直有效波数,γhigh表示距离地相位最远的相干点,arg表示取复数的相位。本研究使用RVoG三阶段方法求解地相位φ0,由RVoG模型可知,在不考虑其他因素时,干涉复相干的表达式可表示如下:
(3)
式中:m(ω)表示地体幅度比,γV表示仅由植被体散射引起的去相干。
由式(3)可知,在理想条件下,不同极化通道的复相干在复平面内呈直线分布,因此使用RVoG三阶段方法的第一阶段来拟合相干点(γhigh和γlow)所在的相干直线,得到相干直线与单位圆的两个交点(φ1和φ0),使用RVoG三阶段方法的第二阶段来确定地相位φ0,并选择距离地相位最远的复相干为体相干(γhigh),如图1所示。
图1 地相位求解示意
2.2 基线选择方法
上述提到,理想条件下,复相干在复平面内呈线性分布,受植被和环境条件的影响,实际的复相干点的分布形状近似为椭圆。基线选择的依据就是从多个基线组合中选择相干分布最理想的一对基线组合,进行森林冠层高度反演,或者根据高程相位标准差来选择高程精度最佳的基线组合,目前常用的基线选择方法主要有PROD方法、LINE方法、ECC方法和VAR方法,具体的计算方法请参见本文作者之前的研究和相关学者的研究[12-13]。
其中,PROD方法以相干分离度和整体相干幅度的乘积作为判断依据,当基线所对应的相干分离程度和相干幅度乘积达到最大时,更符合RVoG模型假设[13,16]。LINE方法与PROD方法的基线选择依据较为相似,该方法以相干直线与单位圆原点的距离和相干分离度乘积最大原则来选择基线,这样能够避免相干直线靠近原点的情况[16]。ECC方法根据相干区域椭圆的长短轴的比值来选择合适的基线,当相干区域的长短轴比率越大,复相干的线性规律越好,此时越符合RVoG模型假设[17-18]。VAR方法则是根据高程精度最大原则来选择最佳基线组合[18]。
2.3 精度评价指标
采用决定系数(R2)、均方根误差(RMSE)和偏差(BIAS)对模型的预测结果进行评价。
(4)
(5)
(6)
3 结果与讨论
4种不同基线选择方法下的森林冠层高度反演结果如图2所示,本研究在LiDAR数据-RH100的覆盖范围内随机选取4 602个激光雷达冠层高度值作为验证。
图2 不同基线选择方法反演的森林冠层高度
从图3和表1可知,在4种不同基线选择下的相位-相干幅度法森林冠层高度反演结果中。采用LINE方法选择基线的反演结果最佳(图3(b)),R2为0.746,RMSE为7.715m,BIAS为-3.412m,但是在森林冠层高度较低矮的区域,存在轻微的低值高估现象,在森林冠层高度大于45m后,则存在高值低估和低值高估现象,但总体的反演结果与LiDAR冠层高度之间的相关性较好,这充分说明多基线PolInSAR在森林冠层高度的反演中具有较高的价值和潜力。
图3 不同基线选择方法反演高度的验证结果
表1 不同基线选择方法反演结果对比
ECC方法选择基线的反演精度次之(图3(c)),R2为0.732,RMSE为7.918m,BIAS为0.139m,从散点图中发现,该方法的低值高估和高值低估现象明显。森林冠层高度较低时,高估比较明显;森林冠层高度较大时,低估较为明显。
PROD方法选择基线的反演精度略低于ECC(图3(a)),但两者的反演精度差异不大,R2为0.720,RMSE为8.099m,BIAS为-4.056m,拟合线位于1∶1线上方,总体呈现高估,且森林低矮时高估明显。通过散点图的对比(图3(a)和图3(c))发现,虽然PROD方法的总体精度略低于ECC方法,但PROD方法的拟合直线比ECC方法的拟合直线更接近1∶1线。这主要是由于PROD方法的反演结果中,少部分样本点较为离群,所以降低了总体精度。
4种基线选择的反演结果中,VAR方法基线选择的反演结果整体最差(图3(d)),R2为-0.245,RMSE为17.079m,BIAS为12.945m,高度大于10m以后就出现严重的低值高估现象。
本文作者之前的研究比较了不同基线选择方法下RVoG模型反演的森林冠层高度差异,本研究得到的结论与之前的研究一致[13],说明基线选择方法的不同是造成反演结果存在差异的主要原因。从基线选择方法的原理上来说,LINE与PROD方法较为相似,PROD以平均相干分离度和相干幅度乘积作为基线选择依据,LINE方法考虑了相干分离度和相干线与复平面原点的直线距离乘积,以此作为基线选择依据得到的基线组合下的复相干更加符合理论假设,所以反演结果较为理想。ECC方法假设复相干的分布区近似椭圆,选择偏心率较大的基线组合,这与LIN和PROD也具有相似之处,均考虑了复相干的线性分布规律,但是不能更好地反映相干分离度,所以反演结果的不确定性也更大,结果中表现出的低估和高估现象也相对明显。VAR方法以高程精度作为基线选择依据,本研究的试验区位于非洲西海岸的热带雨林区域,森林的结构较复杂,且森林冠层高度较大,随着森林冠层高度的增加相干分离度信息对森林高的响应更为显著,而VAR方法并未考虑相干分离度信息,所以反演低估现象最严重的。
相关的研究表明[19],基于经验方法的基线选择方法也存在不足之处,SAR数据受到时间去相干和复杂森林条件的影响,仅依靠复相干的分布规律假设来选择基线与森林实际条件存在差异,因此选择出的基线组合并不一定是最佳的,这会导致反演结果存在高值低估和低值高估现象。由此,提出使用半经验的方法结合机器学习来选择基线,从而提高最后的反演精度,在今后的研究中这也是值得深入的一个研究点。
从SAR数据的穿透性来看,L波段的波长为23cm左右,对森林具有一定穿透性,更适合热带雨林地区的森林结构参数反演,同时穿透深度也会造成森林冠层高度被低估的现象;另一方面,SAR数据会受到去相干因素和地形的影响,而且复杂森林条件下SAR信号对森林结构的响应也难以用具体模型来表达。此外,数据处理过程中的多视和滤波处理也会造成SAR信息的丢失,这也是造成误差的因素之一。
4 结论
极化干涉合成孔径雷达在森林结构参数的反演中有着重要的地位和作用,本研究采用相位-相干幅度森林冠层高度反演方法,结合4种基线选择方法,进行森林冠层高度反演研究,并采用了大样本的LiDAR高度数据,对反演结果进行了验证。结果表明,相位-相干幅度法与RVoG三阶段方法结合能够精确高效地估计森林冠层高度。与传统的相位-相干幅度法和RVoG三阶段方法相比,该方法在保证精度的前提下,极大地减少了模型运算时间。但基线选择方法对森林冠层高度的反演有显著影响,使用LINE方法选择基线的反演效果最佳,PROD和ECC方法的反演结果次之,VAR方法反演精度最低。今后的研究中,可考虑从基线选择方法的优化入手,从而提高多基线PolInSAR的森林冠层高度反演精度,以便更好地服务于森林资源监测。