APP下载

多时相PolInSAR数据土地覆盖类型分类研究

2022-09-25程腾辉范文义吴国明

森林工程 2022年5期
关键词:相干性时相极化

程腾辉,范文义,2*,吴国明

(1.东北林业大学 林学院,哈尔滨 150040;2.森林生态系统可持续经营教育部重点实验室(东北林业大学),哈尔滨 150040)

0 引言

合成孔径雷达(synthetic aperture radar , SAR)具备全天时、全天候的成像能力,可以与光学遥感相互补充,在部分区域SAR数据优于光学遥感数据[1]。使用单时相极化SAR(polarimetric SAR,PolSAR)数据进行分类研究是SAR的重要研究方向之一,现阶段已经取得了比较好的成果[2-9]。然而,单时相极化SAR影像在森林、城市和森林城市混杂区域的分类效果并不理想,主要原因是受到相干斑噪声和地形等的影响[10]。SAR数据早年的获取方式主要是单极化、单时相、单波段,随着SAR技术的发展,多种SAR传感器已经研发并投入使用,SAR数据的获取方式包括了多极化、多时相、多波段和多角度等多种方式,SAR数据源的多样性为散射机制类似区域土地覆盖类型分类提供了更多的可能性,也为数据的应用方法提供了更多的机遇。

随机森林(Random forest,RF)是一种机器学习算法,该方法采用决策树作为基础技术支撑[11],在处理多种类型和高维数据集时具有高精度和抗过拟合的优点[12],可以有效地降低分类问题中维数过大、局部极小等问题,在SAR影像土地覆盖类型分类研究中广泛应用[13-16]。使用单时相、多时相PolSAR、干涉SAR(interferometric SAR,InSAR)、多时相InSAR影像进行土地覆盖类型分类研究在国内外已经产生了部分研究成果,但是,基于多时相PolInSAR(polarimetric interferometric SAR,PolInSAR)数据的分类研究,尤其是将时相极化分解信息融合进行分类的研究还比较少见。相关学者利用多时相InSAR数据提取不同时相影像的干涉相干性和后向散射系数,根据干涉相干系数分析地物类型、林分疏密度之间的差别,对土地覆盖类型和林分疏密分类取得了可用于实际应用的分类结果[17-21]。李明泽等[22]采用多时相PolSAR和SPOT数据,提出了融合多时相PolSAR数据和光学数据的林分类型识别方法,结果表明综合采用多时相数据的极化分解参数对于林分类型的识别有很好的制图效果。Fu等[23]使用Sentinel-1B、Sentinel-2A多时相双极化数据对红河国家级自然保护区进行湿地分类研究,提出了一种基于对象的RF结合卫星图像数据的湿地分类方法,结果表明该方法在对森林林分类型进行分类识别的结果最好。

以上研究中已经有利用单时相极化分解、多时相干涉相干性、多时相极化分解特征相结合进行地物类型分类的研究,但尚未有综合考虑将多时相干涉相干性和多时相极化分解特征结合应用于分类。因此,本文将干涉相干性引入到多时相极化分解,结合经典的RF分类方法,在时相因素不同的情况下,比较了不同分类方案的分类精度,实现了一种基于多时相、全极化的RF土地覆盖类型分类方法。

1 研究区与数据源

1.1 研究区概况

研究区位于河北省围场县境内,处于内蒙古高原的边缘(42°22′~42°31′ N,116°53′~117°31′ E),地形地貌组合为高原-波状丘陵山地, 包括塞罕坝机械林场和御道口牧场的大部分区域,气候介于半湿润和半干旱之间,是寒温带大陆性季风气候[24]。研究区地表覆盖类型多样,包括林地、灌草、农田、水体、城市及建筑用地等,其中植被覆盖率达80%以上,主要由白桦(Betulaplatyphylla)、华北落叶松(Larixprincipis-rupprechtii)、山杨(Populusdavidiana)、油松(Pinustabuliformis)、云杉(Piceaasperata)和樟子松(Pinussylvestrisvar.mongolica)等组成,并且灌草和林分、不同林分混杂分布,呈现明显的分布不连续性、破碎性。7—9月是林分生长季,7月11日林分生长基本完成,处于生长旺季,9月19日落叶松和阔叶林均已开始出现大面积落叶。本文采用1景卫星图像范围覆盖区域开展土地覆盖类型分类研究工作,研究区位置如图1所示。

1.2 数据选择与准备

本研究采用日本JAXAALOS-2卫星PolSAR数据,数据的获取间隔时间为14 d。由于部分重访日期获取影像失败,因此获取了塞罕坝地区5个时相的PALSAR全极化Level1.1级产品数据,每幅影像的方位向、距离向分辨率分别为2.64、2.86 m,影像的具体参数见表1。该数据为L波段数据,受时间相干性的影响较轻,在植被覆盖区仍然可得到有效的PolInSAR数据。

表1 ALOS-2 PALSAR数据主要参数

为了获取分类所需的高精度训练样本及检验样本,地面调查数据主要由2020年土地利用分类图、2020年森林资源调查小班资料和2021年8月研究区森林类型野外调查数据组成。森林资源二类调查小班资料和土地利用分类图来源于河北省塞罕坝机械林场,森林类型野外调查数据完成样地调查90块。对森林资源二类调查小班资料中单一树种的小班进行整理,主要是将所有阔叶林类型、灌草等土地覆盖类型相同的小班进行合并,并将面积较小且未在分类系统中的小班(如裸岩,矿地等)拆分去除。同时,结合野外调查数据共获得584个参考样点,其中,落叶松104个、针叶混交林73个、灌草99个、阔叶林107个、水体61个、农田79个、建筑61个,对主要树种和样地点分布较为集中的区域进行精准定位,以确保获得的地表实测数据的可靠性。由于地面实测时间和影像数据获取时间不完全相同,通过调查该地区土地覆盖类型变化,只有部分林分进行了间伐,林分密度略有变化。因此,可以认为影像获取时间和实测数据获取时间之间土地覆盖类型没有发生变化,不影响最后的分类结果。地面调查数据样地分布如图1所示。

图1 研究区地理位置及样点分布

2 分类与方法

2.1 分类系统

本研究参照《TD/T 1010—2015土地利用动态遥感监测规程》[24],同时综合考虑研究区的地表特征和多时相PolInSAR数据的地物识别能力,对研究区采用两级分类。在一级分类系统中分为其他类型和有林地;在二级分类系统中,其他类型又分为农田、水体、建筑和灌草。有林地中落叶松、桦树、山杨和油樟松(樟子松和油松)是研究区的主要树种和未来发展的目标树种,云杉、山杏、榆树和柞树等树种占地面积相对较少,因此将桦树、山杨、柞树等阔叶林树种合并为阔叶林类型,将云杉和油樟松合并为针叶混交林类型。最终,将分类系统划分为:灌草、落叶松、针叶混交林、阔叶林、水体、农田和建筑7类。

2.2 研究方法

2.2.1 后向散射和干涉相干性特征参数提取

每个时相的后向散射系数和不同时相PolInSAR影像之间的干涉相干性是本文进行地物分类的重要参数。后向散射系数是回波强度的度量,干涉相干性度量了两幅单时相单视复数(single temporal single look complex,single-temporal SLC)的相关程度。两者主要与地表地物类型和地物散射方式相关,后者还代表了主辅影像获取时间间隔内地物目标的变化信息,两者均可独立进行部分地物类型识别。两幅影像s1和s2之间的干涉相干性γ定义为[24]

(1)

式中:H代表共轭转置;γ的取值范围为[0,1]。

2.2.2 极化分解特征参数提取

极化SAR在成像过程中,不同地物对电磁波产生不同的散射特性,如:地面和水体主要是发生表面散射;农作物、森林等则易于产生体散射。极化相干矩阵能够记录并描述地物的散射特性,而极化分解是利用散射矩阵、相干矩阵或协方差矩阵实现提取地物目标散射特性的重要方法。因此,极化分解参数是地物目标的散射特征,是极化SAR图像分类、地表参数反演等应用的重要依据。采用目标分解获取极化散射信息是利用单时相极化SAR数据进行土地覆盖类型分类的重要研究方法[2,25-27],采用极化相干矩阵作为目标分解的初始特征。利用PolSARpro_v6.0.2进行极化分解参数的提取,通过查阅文献筛选取用该软件中提供的12种极化分解方法,共81个极化分解参数用于下一步的分类,具体见表2。

表2 ALOS-2 PALSAR数据极化分解初步筛选参数

2.2.3 分类特征组合与分类器选择

按照3种方案组合提取到的特征,3种方案分别是:①单时相独立分类(包括5个时相后向散射系数、干涉相干性)共7种特征组合;②单时相极化分解结合后向散射、干涉相干性方案共15种特征组合;③多时相极化分解结合后向散射、干涉相干性方案共4种特征组合,见表3。

表3 分类特征组合方式

初步筛选得到的极化分解方法虽然分解模型和思路不同,但提取到的极化特征之间可能存在一定的相关性,如果采用初步筛选的所有极化分解特征,就可能会增加冗余信息,因此需要对初步筛选的极化分解特征再次筛选。并且5个时相的后向散射系数和干涉相干性之间也可能存在一定的相关性,同样需要对这些特征进行筛选。

随机抽取地面调查数据中每类的50%作为训练样本,其余作为检验样本。对每种组合方式采用scikit-learn提供的RF分类器进行土地覆盖类型分类。RF分类器首先对分类特征进行重要性评估,评价标准为平均不纯度减少(Mean Decrease in Impurity,MDI),将分类特征按照评估结果进行排序,逐一进行筛选得到分类精度最高的特征个数。

2.2.4 分类结果精度评价标准

使用混淆矩阵计算生产者精度(PA)、用户精度(UA)、总精度(OA)和Kappa系数4个指标以进行精度评价。其中Kappa系数计算公式为

(2)

式中:K为Kappa系数;p0为混淆矩阵对角线样本之和与总样本数的比值,即OA。

3 结果与分析

3.1 各类特征单独进行RF筛选后的分类精度(方案1)

方案1的7种特征组合结合RF分类器分类的Kappa系数随特征数量的变化,如图2(a)所示,Kappa系数的最大值均不是在特征数量最多时获取,证明RF特征筛选是有效的。就不同时相而言,获得最优分类精度所使用极化分解特征的数量和类别均不相同,证明时相信息对分类结果产生了影响。单时相分类在7月11日(林木生长初期)获得最高分类精度,总体精度为87.33%,Kappa系数为0.851 0,但使用单一时相极化分解特征进行分类落叶松和针叶混交林之间存在严重的混分,落叶松的生产者精度、针叶混交林的用户精度均低于65%,不能满足目前的实际运用要求;单独使用后向散射或干涉相干性时,虽具备一定程度的时相信息,但总体分类精度均低于80%,也不满足实际需要。

3.2 单时相极化分解特征结合后向散射、干涉相干性进行RF筛选后的分类精度(方案2)

在方案2中增加一部分时相特征(后向散射、干涉相干性),结合不同时相下的极化分解特征进行分类结果的Kappa系数变化如图2(b)所示。相较于方案1的7种分类方法,方案2各方法总体精度的增幅为3%~7%。对比方案2中15种分类结果发现,后向散射系数结合单时相极化分解能够明显提高总体分类精度,其中b711方法在15种分类结果中最优,总体精度为90.75%,Kappa系数为0.891 4,但落叶松和针叶混交林之间的混分现象仍然非常严重,落叶松的生产者精度、针叶混交林的用户精度均低于70%;干涉相干性结合单时相极化分解明显提高落叶松和针叶混交林之间的分类精度,落叶松生产者精度最高为68.97%,针叶混交林最高为77.78%;两者融合结合单时相极化分解虽然能进一步提高2种树种的分类精度,但仍低于80%。因此,该方案在实际生产应用中仍然存在一定的缺憾,需要寻找更高精度的分类方案。

3.3 多时相、多特征综合使用的分类精度(方案3)

综合单时相不同极化分解方法仍然不能解决主要树种和次要树种之间的混分现象,分类精度无法进一步提升以满足实际生产的需求,因此,进一步增加时相信息,结合多时相极化分解、后向散射和干涉相干性,最终得到最优的分类精度,见表4。

表4 多时相、多特征结合的分类精度

对比3种方案的所有分类精度可知,单独融合多时相极化分解特征相对于单时相极化分解,总体分类精度提高了1.71%,Kappa系数提高了0.020 2,增幅并不明显;将多时相后向散射和干涉相干性结合多时相极化分解特征,即方案3中bcpsp方法,总体分类精度达到93.84%,Kappa系数为0.927 6。相较于方案1和方案2中的方法分类精度均有较大的提升,总体精度和Kappa系数的增幅分别为3.09%~18.5%、0.036 2~0.217 6。并且落叶松的生产者精度为75.41%,针叶混交林的用户精度为80.56%,主要树种和次要树种的分类精度得到提高,基本上满足实际生产的需要。

3种方案均显示Kappa系数随参与分类特征数量的增加而增长,但当特征数量增加到30个之后Kappa系数的增长趋势变缓;当Kappa系数达到最大值之后,增加参与分类的特征数量,Kappa值呈现缓慢下降趋势,如图2所示,其中,(a)为方案1,(b)、(c)、(d)为方案2;(e)为方案3。对分类精度产生重要影响的主要集中在MDI值较大的部分,后续增加的特征不仅无助于分类,甚至还增大了分类噪声。

筛选3种方案当中分类结果较好的如图3所示,对于塞罕坝地区灌草、农田、落叶松、针叶混交林和阔叶林混杂分布调查,图3(c)与实际情况最为符合,这进一步证明了采用bcpsp方法结合RF分类器的有效性。

图3 3种方案最优结果

4 结论

本文以河北省围场县塞罕坝机械林场和御道口牧场为研究区,对所获的多时相PolInSAR数据进行辐射定标、配准(两两配准)和滤波等预处理,得到1个具有多时相信息的后向散射强度、干涉相干性和极化分解参数多特征数据集。将经过1次筛选的极化分解数据、后向散射、干涉相干系数组合形成3种研究方案,并结合RF分类器进行二次特征筛选、分类,最终得到了基于多时相全极化、干涉SAR的最优随机森林土地覆盖类型分类方法。通过对3种方案进行比较分析,得到以下结论。

(1)对于类似塞罕坝地区,灌草、农田和不同林分混杂分布的地区,单时相极化分解不足以支持林分类型分类的精确应用,如不能获取多时相数据,在生长季的初期是最佳的土地覆盖类型识别时间。

(2)分类精度在RF重要性评估的前30个特征提升较快,当极化特征继续增加时分类精度的提升趋势减缓,达到最高后反而开始降低。

(3)综合多时相、多特征数据可以很好地将不同林分类型区分开来。本文提出的方法得到的总体分类精度为93.84%,Kappa系数为0.927 6,比最优单时相(7月11日)极化分解分类结果提升了6.51%,取得了可用于实际生产应用的分类结果。

本研究是将多时相PolInSAR应用于塞罕坝地区土地覆盖类型分类和林分类型识别,虽然得到了一些初步的结论,但是仍然有许多问题要在未来解决,如对提取到的分类特征并未做全面的冗余分析;对于全极化数据还可以尝试提取纹理特征、不同时相之间的相关系数等作为分类参数。因此,在未来的研究中可就分类特征筛选和进一步分析干涉相干对林分类型识别的敏感性进行更深层次的研究。

猜你喜欢

相干性时相极化
认知能力、技术进步与就业极化
极化雷达导引头干扰技术研究
关联退极化量子信道中qutrit-qutrit系统的量子相干性演化*
基于干扰重构和盲源分离的混合极化抗SMSP干扰
两体系统量子相干性的动力学和守恒
非理想极化敏感阵列测向性能分析
血清白细胞介素及急性时相反应蛋白在细菌性痢疾患者中的变化研究
基于量子相干性的四体贝尔不等式构建∗
乒乓球运动员在经验相关图形识别中的脑电相干性分析
抑郁症患者急性时相反应蛋白水平检测及其临床意义