基于多基线PolInSAR基线选择的森林高度反演方法
2019-12-31张建双范文义
张建双 范文义 于 颖
(1.东北林业大学林学院, 哈尔滨 150040; 2.东北林业大学森林生态系统可持续经营教育部重点实验室, 哈尔滨 150040)
0 引言
森林高度是森林资源调查的主要因子。森林高度与森林生物量密切相关,是估算森林地上生物量所需的重要参数之一[1],同时还是计算立木材积、监测林木长势和评价林分立地条件等森林经营活动的主要依据,为获取森林生产力和生物多样性提供必要的信息。
森林高度的测定有地面调查法、摄影测量法、激光雷达法等。目前极化SAR干涉测量(Polarimetric SAR interferometry,PolInSAR)和多基线层析SAR具有反演森林高度的潜力。多基线层析SAR是一种新兴技术,能够反演森林的3D垂直剖面,进而估算森林高度[2-6]。PolInSAR技术使用多种理论模型将森林的生物物理参数与雷达可观测量相关联反演森林高度[7-20]。由于最高森林的可靠估计取决于可用的最短基线,最矮森林的可靠估计取决于可用的最长基线,因此单基线PolInSAR不能在森林高度变化大的区域准确地反演森林高度[15],而多基线PolInSAR可以解决这一问题,但需要为每个像元选择合适的基线。
多基线PolInSAR数据集由多个不同飞行轨道获取的PolSAR数据组成。多基线PolInSAR反演森林高度需要数据对之间具有理想的基线,基线长度取决于平台、目标几何、森林高度和森林垂直结构[7, 15],并且垂直基线的长度决定了干涉测量相位差对不同高度散射体的敏感性[19,21]。对于给定的像元,某个基线比其他基线更能准确地反演森林高度,因此有必要为每个像元选择合适的基线,以提高森林高度反演的精度。文献[22-23]使用相干边界的偏心率(Eccentricity of the coherence boundary,ECC)选择基线,ECC方法反演森林高度的精度相对传统单基线算法提高了44.05%[23]。文献[24]对Mondah森林的多基线PolInSAR SLC数据使用PROD方法选择合适的基线,其反演的森林高度与样地数据具有良好的一致性,平均偏差为3.75 m。
本文数据作为NASA/ESA “AfriSAR活动”[25-26]的一部分,是JPL/NASA于 2016年在加蓬一些森林区域获取的无人驾驶飞行器合成孔径雷达(Uninhabited aerial vehicle synthetic aperture radar,UAVSAR)数据和陆地植被冰传感器(Land, vegetation and ice sensor,LVIS)雷达数据。该活动旨在校准和验证即将到来的星载数据,以研究森林在全球碳循环中的作用。
本文使用JPL/NASA在加蓬森林区域获得的UAVSAR L波段的多基线全极化 PolInSAR数据反演森林高度,针对复相干未达到最大分离的问题,使用相干分离最大算法(Maximum coherence difference,MCD)[27]使复相干达到最大分离,改进PROD 方法与ECC方法,对这两种方法进行对比分析,并使用激光雷达LVIS RH100数据验证反演的森林高度,解决单基线PolInSAR在森林高度变化大的区域误差大的问题,以探索效果更优的基线选择方法。
1 研究区域概况
刚果盆地的热带森林被称为地球的第二个肺,加蓬的森林区域是刚果盆地的一部分,加蓬的Pongara公园位于9°10′~10°10′E、0°0.3′S~0°15′N,主要为红树林,并且地形相对平坦。本文使用UAVSAR L波段全极化PolInSAR数据集反演森林高度,并使用激光雷达数据LVIS RH100验证反演的森林高度。UAVSAR是JPL/NASA开发的L波段重复轨道干涉测量的机载全极化SAR系统,飞行高度为12.5 km,入射角的范围为25°~60°不等。UAVSAR SLC数据集的方位向分辨率为0.6 m,距离向分辨率为1.6 m[28]。该数据的获取时间为2016年2月27日,轨道数为5,其水平基线几乎为零,垂直基线不同(表1)。使用20∶5多视后,获得方位向分辨率为12 m、距离向分辨率为8 m的多视图像。图1为研究区域主图像的Pauli基彩色合成图。
表1 获取的研究区域UAVSAR数据Tab.1 UAVSAR data acquired in study area
图1 UAVSAR Pauli图像Fig.1 UAVSAR Pauli image
图2 激光雷达获取的LVIS RH100数据Fig.2 LVIS RH100 data acquired by LiDAR
由于激光雷达不受PolInSAR误差源的影响,因此使用激光雷达获得的森林高度验证多基线PolInSAR反演森林高度的精度。激光雷达数据是NASA提供的LVIS数据,LVIS为中等足迹的激光雷达,足迹直径为20 m,获取时间为2016年3月4日。LVIS L2级数据包含完整波形数据以及许多相对高度(RH)指标,例如RH100、RH95,这些指标代表激光雷达在地面上方接收到的反射幅度的百分比,RH100、RH95分别表示100%、95%。本文选取LVIS L2级数据中的RH100指标作为森林高度的验证数据(下文用LVIS RH100表示)。图2为研究区激光雷达获取的LVIS RH100数据。
2 研究方法
2.1 多基线PolInSAR的森林高度反演
对UAVSAR的SLC数据进行配准、光谱滤波和极化定标[29]等预处理。假设满足互易性,以Pauli基散射矢量k形式表示SLC数据[18-20]
(1)
式中SHH——HH极化通道的SLC图像
SVV——VV极化通道的SLC图像
SHV——HV极化通道的SLC图像
对于具有5轨道的PolInSAR数据集的散射矢量为
(2)
式中km——轨道m的散射矢量
K——多轨道散射矢量
为了计算相干性,使用估计协方差矩阵T来表示散射矢量的二阶统计量[19]
T=〈KKH〉
(3)
式中 H——复共轭的转置
〈〉——空间平均或多视
多基线PolInSAR数据的矩阵TMB为[10]
(4)
式中TMB——多基线协方差(或相干)矩阵
Tm——轨道m的极化协方差矩阵(3×3)
Ωm-1,m——参考轨道m-1与轨道m的极化干涉协方差矩阵(3×3)
任意基线的复相干γ估计公式[19,30]如下
(5)
式中ω——极化权重向量
Ωm,n——参考轨道m与轨道n的极化干涉协方差矩阵(3×3)
Tn——轨道n的极化协方差矩阵(3×3)
本文基于地面随机体散射(Random volume over ground,RVoG)模型使用三阶段反演法[7,14-18]反演森林高度。
2.2 多基线PolInSAR的基线选择方法
PolInSAR相干区域形状是预测森林高度反演性能的关键指标[27,31-33],本文选取ecc与prod两个指标衡量多基线PolInSAR相干区域的形状,为多基线PolInSAR数据选择合适的基线,分别称为ECC方法与PROD方法。针对已有研究使用相位分离最大优化算法[24]未使复相干达到最大分离的问题,本文使用MCD[27,34]使复相干达到最大分离,改进PROD与ECC方法,并详细地对比分析这两种基线选择方法。
2.2.1ECC方法
使用相干边界的偏心率来选择基线[22-23],计算公式为
(6)
式中a——相干区域的长轴长
b——相干区域的短轴长
ecc——相干边界的偏心率
假设相干区域是椭圆,a等于|γhigh-γlow|,其中γhigh为与森林冠层散射矢量相对应的冠层散射复相干,γlow是与地面散射矢量相对应的地面散射复相干。而b等于相干区域边界上两个相对点之间的最小距离;ecc的范围为0~1,ecc的值越大,相干区域的短轴长和长轴长的比率越小,观测的相干区域越符合RVoG模型的直线假设[33]。
2.2.2PROD方法
ECC方法只考虑了相干区域的偏心率,BABU等[24]进一步使用相干区域的长轴与相干区域中心幅度|γhigh+γlow|的乘积来选择基线:该方法优先选出复相干之间具有最大分离的基线(分离越大,越符合RVoG模型的直线假设),同时也在整体上保持高的复相干幅度(时间去相干最小)。PROD方法是对文献[25]方法的简化,计算方法简单,并且在测试中产生了类似的结果[24],计算公式为
prod=|γhigh-γlow||γhigh+γlow|
(7)
选择prod值最大的基线作为每个像元的合适基线,这有利于选择复相干分离大和整体复相干幅度高的基线。
3 结果与分析
本文应用两种基线选择方法为每个像元选择合适的基线,同时使用MCD所对应的复相干来反演森林高度。图3为反演的森林高度图,图4为与LVIS RH100森林高度相比,获得的森林高度误差(两种基线方法反演的森林高度减去LVIS RH100森林高度)。图5为森林高度误差的统计图。
图3 两种方法反演的森林高度图Fig.3 Forest height maps inversed by two baseline selection methods
图4 两种方法反演的森林高度误差图Fig.4 Forest height error maps inversed by two baseline selection methods (difference between forest height and LVIS RH100)
图5 森林高度误差统计图Fig.5 Statistical histogram of forest height error
由图3可知,两种基线选择方法反演的森林高度具有良好的一致性;与LVIS RH100相比,两种基线选择方法反演的森林高度的误差也具有良好的一致性(图4)。由图3与图4可看出,低矮与高大森林区域的误差较大,且低估了高大森林(误差为负值),高估了低矮森林(误差为正值);同时,ECC方法低估或高估森林高度的程度比PROD方法大,精度低于PROD方法(图5)。
图6为森林高度与LVIS RH100的密度图。图中包含LVIS RH100大于3 m时的592 460个样本点,红色实线是y=x,黑色虚线是拟合的线性方程。两种基线选择方法都存在高估低矮森林,以及低估高大森林的现象,与图3~5的分析一致。图6a中拟合的线性方程为y=0.50x+10.60,R2=0.69。图6b中拟合的方程为y=0.63x+8.21,R2=0.70。以LVIS RH100作为验证数据,ECC方法的均方根误差RMSE为9.80 m,PROD方法的RMSE为8.86 m,比ECC方法精度提高了9.63%。总体来说,PROD方法反演结果更接近LVIS RH100的森林高度,结果更优。
图6 森林高度与LVIS RH100的密度图Fig.6 Density map of forest height and LVIS RH100
图7为两种基线选择方法对应的冠层复相干幅度与地面复相干幅度的密度图。ECC方法拟合的直线方程为y=0.94x+0.04,R2=0.93;PROD方法拟合的直线方程为y=0.84x+0.11,R2=0.80。表明PROD方法冠层复相干幅度与地面复相干幅度的差异大于ECC方法。由于地面复相干幅度与冠层复相干幅度之间的差异很小[24],因此只绘制两种基线选择方法对应的冠层复相干幅度与LVIS RH100的密度图(图8)。由图7与图8可知,低矮森林的复相干幅度较大,高大森林的复相干幅度较小,随着森林高度的增加,复相干幅度减小[7, 35]。PROD方法在高大森林区域选择的复相干幅度大于ECC方法,但在低矮森林区域选择的复相干幅度小于ECC方法。复相干幅度对反演森林高度的精度有一定的影响。
图7 基线选择方法对应的冠层复相干幅度 与地面复相干幅度的密度图Fig.7 Density map of canopy complex coherence amplitude and ground complex coherence amplitude map corresponding to baseline selection method
图8 基线选择方法对应的冠层复相干幅度 与LVIS RH100的密度图Fig.8 Density maps of canopy complex coherence amplitude corresponding to baseline selection method and LVIS RH100
为了详细分析比较两种基线选择方法的性能,在[3,10)、[20,30)、[50,60) m区间内分别选取LVIS RH100为6.71、21.90、54.02 m的像元表示低矮、中等高度、高大森林区域,且绘制复单位圆内两种基线选择方法对应的复相干,如图9所示。其中,MCD高表示使用MCD方法获取的与冠层散射对应的复相干,MCD低表示使用MCD方法获取的与地面散射对应的复相干。由图9a、9b可知,低矮森林的复相干相对集中且复相干幅度大[7,23,35],虽然ECC方法对应的复相干幅度与线性程度优于PROD方法,但其复相干的相干分离程度低于PROD方法,因此可得PROD方法反演森林高度的误差小;由图9e、9f可知,高大森林的复相干幅度减小[6-7,35],与ECC方法相比,PROD方法不仅使其复相干幅度变大,也使复相干的相干分离程度优于ECC方法,因此可得PROD方法反演森林高度的误差小。由图9c、9d可知,中等高度的森林区域,复相干的相干分离程度与相干幅度介于低矮森林与高大森林之间,线性程度是影响反演森林高度的主要因素,PROD方法综合考虑复相干的相干分离程度与相干幅度,虽然使复相干幅度增大,但同时使复相干的相干分离程度低于ECC方法,因此可得ECC方法反演森林高度的误差小[23]。
4 讨论
为了更准确地比较分析两种基线选择方法,列出以10 m为间隔的分段森林高度的RMSE(表2);ECC方法在区间[10,20)、[20,30) m反演森林高度的均方根误差(RMSE)小于PROD方法,但在区间[3,10)、[30,40)、[40,50)、[50,60) m反演森林高度的RMSE大于PROD方法。
图9 复单位圆内基线选择方法对应的复相干Fig.9 Coherence maps corresponding to baseline selection method in complex plane
为了直接评估ECC方法与PROD方法基线选择的差异,本文给出两种基线选择方法对应的垂直波数kz与LVIS RH100的密度图,如图10所示。h的计算公式为
(8)
(9)
式中h——森林高度
φ——相干相位
Δθ——主辅SAR图像的入射角之差
θ——平均入射角
Bn——垂直基线
H——传感器高度
λ——传感器波长
为了更准确地反演森林高度,高大森林应尽可能使kz较小,即为较短基线,低矮森林应尽可能使kz较大(较长的基线)。根据以上分析,PROD方法所选择的kz更能准确地反演森林高度。根据式(8),令φ固定,当选择的kz小于合适的基线对应的kz时,导致森林高度被高估,当选择的kz大于合适的基线对应的kz时,导致森林高度被低估。在低矮森林区域(LVIS RH100小于10 m),ECC方法选取的kz大部分都较小,且小于PROD方法选取值;进一步说明了低矮森林区域被高估,且说明了ECC 方法反演的森林高度高估的程度比PROD方法严重的原因。当LVIS RH100大于30 m时,ECC方法选择的kz开始增大,PROD方法选择的kz减小,进一步说明了对高大森林区域产生低估,且说明了ECC方法低估程度更严重的原因。
表2 研究区森林高度的RMSETab.2 RMSE with forest height in study area
图10 基线选择方法对应kz与LVIS RH100的密度图Fig.10 Density maps of kz corresponding to baseline selection method and LVIS RH100
为了验证两种基线方法的适用性,将其应用于加蓬的Lope区域,分段森林高度的RMSE如表3所示。ECC方法在区间[10,20)、[20,30) m反演森林高度的RMSE小于PROD方法,但在区间[3,10)、[30,40)、[40,50)、[50,60) m反演森林高度的RMSE大于PROD方法,与Pongara区域获得的结果一致。
表3 研究区Lope森林高度的RMSETab.3 RMSE with forest height in study area of Lope
由表2、3可知,ECC方法在区间[10,20)、[20,30) m反演森林高度的精度优于PROD方法,但在区间[3,10)、[30,40)、[40,50)、[50,60) m反演森林高度的精度低于PROD方法。分析原因可能在于:低矮森林区域,由于L波段能穿透森林到达地面,各极化通道的复相干无法有效分离且复相干幅度大[23],高大森林区域,随着植被高度的增加,加上其他去相干因素,体散射复相干减小且达到饱和,不同极化通道的复相干相对集中[6-7, 35]。这两种情况下,复相干幅度与复相干的相干分离程度是影响反演森林高度的主要因素,虽然ECC方法的直线拟合效果优于PROD方法,但由于其不能使复相干达到最大分离,且PROD方法综合考虑复相干的相干分离程度与相干幅度,因此PROD方法反演的森林高度的精度高于ECC方法。中等高度的森林区域(高度在10~30 m之间),复单位圆内的复相干相对分散,复相干幅度也未达到饱和,相干区域的直线拟合效果是影响反演森林高度的主要因素,虽然PROD方法可使复相干幅度增大,但复相干的相干分离程度低于ECC方法,因此ECC方法反演森林高度的精度高于PROD方法。
低矮与高大森林的区域,复相干的相干分离程度或复相干幅度较小时,复相干的相干分离程度与复相干幅度是影响反演森林高度的主要因素,PROD方法比ECC方法更适用于反演低矮与高大森林。中等高度的森林区域,复相干较为分散,复相干幅度未达到饱和时,相干区域的直线拟合效果是影响反演森林高度的主要因素,ECC方法比PROD方法更适用于反演中等高度的森林。
5 结论
(1)两种基线选择方法反演的森林高度与LVIS RH100相一致。ECC方法将相干区域的线性程度作为判断标准,PROD方法综合考虑了复相干的相干分离程度(相干直线的拟合效果)与相干幅度,在一定程度上解决了ECC方法低估高大森林与高估低矮森林的问题。PROD方法森林高度反演的精度高于ECC方法,精度比ECC方法提高了9.63%。
(2)PROD方法更适用于反演低矮与高大森林,ECC方法更适用于反演中等高度的森林。