基于GF-3全极化SAR数据的滨海湿地信息提取方法
2022-01-06何陈临秋陈金奋张晓平
何陈临秋, 程 博, 陈金奋, 张晓平
(1.中国科学院空天信息创新研究院,北京 100094; 2.中国科学院大学,北京 100049)
0 引言
滨海湿地作为海洋与陆地交汇的过渡带,具有调节气候、护岸减灾和水产养殖等功能。因人类生存及生产活动的侵蚀与破坏,我国滨海湿地面积急剧减少,生态功能日益退化[1]。面对土地利用转型和可持续发展的要求,对滨海湿地生态系统的遥感监测研究成为认识和了解滨海湿地的有效途径,也是促进滨海湿地保护与科学发展的重要保证。在滨海湿地信息提取研究中,对于湿地地物类别的区分难度相对较大,有些地物类型之间特点极为相似,反映在遥感影像上的特征差异较小,空间位置分布也存在错综复杂边界模糊的难点。因此,如何选择和利用能够反映滨海湿地地物差异的特征变量,高效地提取湿地信息,是湿地信息提取研究工作需要解决的问题。
近年来,由于全极化合成孔径雷达(synthetic aperture Radar,SAR)影像能够快速客观地提供充足的地物散射信息,丰富的极化特征可以直接反映地物目标结构特点,全极化SAR数据在滨海湿地研究中已逐步占据主要地位,多元化的湿地资源监测研究方向呈现不断升温的趋势。围绕全极化SAR的湿地分类方法研究热点主要集中于利用极化特征向量进行图像分类,数据选择上也多以Radarsat-2、TerraSAR、ALOS等国外卫星为主: Schmitt等[2]基于Curvelet变换的变化检测方法证实了利用极化分解进行湿地制图和变化检测分析的巨大潜力; Touzi等[3-4]将Huynen参数应用于Cloude特征分解,用对称散射型来描述目标物理特性,使得湿地分类取得更好的应用效果; 陈媛媛等[5]采用特征组合方式,利用SVM方法对沿海滩涂进行分类,得出各向异性度参数与平均散射度结合可以提高地物分类精度的结果; 亓宁轩等[6]为改进单波段极化湿地分类现存问题,将星载C波段和机载P波段的极化特征组合构建高维特征数据集,充分利用两波段的互补信息,为湿地分类提供更好的依据; 徐梦竹等[7]结合极化特征与香农熵,有效提升了海水和泥、沙滩的分类精度,并利用主动深度学习方法择优选择样本以改善分类效果。虽然全极化SAR数据在滨海湿地研究中已取得初步进展,但受滨海湿地自身复杂性和极化特征冗余等诸多因素的影响,基于全极化SAR数据的滨海湿地信息提取精度依然难以取得实质性的突破。
综上,为提高国产SAR卫星的行业应用能力,降低极化信息冗余度,本研究针对国产高分三号(GF-3)影像的全极化特征,基于极化目标分解方法和可分性指数来探究极化特征选择对滨海湿地信息提取结果的影响,力图为建立统一完善的滨海湿地国产卫星遥感分类体系提供新的技术支撑。
1 研究区概况与数据源
研究区是位于辽宁省盘锦市的辽河口国家级湿地自然保护区,地理坐标介于E121°28′24.58″~121°58′27.49″和N40°45′00″~41°05′54.13″之间,面积达12万hm2。辽河口湿地自然保护区地处渤海辽东湾北部,是辽河三角洲的中心区域,地物类型主要包括自然水域、芦苇沼泽、翅碱蓬滩涂、淤泥质海滩和养殖池塘等湿地类型以及属于非湿地类型的建筑用地。辽河口湿地自然保护区优越的地理位置和良好的生态环境使其成为鸟类栖息繁殖和迁徙停歇的理想场所,区域内繁茂的芦苇和翅碱蓬植被也具有极高的生态价值和经济价值。因此,对其开展遥感监测可以准确掌握辽河口湿地自然保护区的地物类型与空间分布,保护滨海湿地资源免于侵占和破坏。
研究使用的全极化SAR数据是成像于2019年3月28日的GF-3雷达影像(图1),C波段单视复数数据,成像模式为全极化条带1模式(QPSI),入射角为44.635°,频率为5.4G Hz,方位向分辨率为5.197 5 m,距离向分辨率为2.248 4 m。由于SAR数据获取过程中存在电磁波信号在方位向和距离向上的压缩现象,影像会产生严重的辐射与几何畸变。同时合成孔径雷达主动发射的电磁波与地物后向散射的电磁波发生干涉,形成SAR影像特有的相干噪声[8]。所以为了获取正确的极化信息、提高分类精度,采用国产雷达影像数据处理软件PIE-SAR 6.0对全极化SAR数据依次进行复数据转换、多视处理、自适应滤波、地理编码等预处理来减少斑点噪声和几何畸变带来的影响。预处理后影像如图1所示。
图1 预处理后GF-3全极化SAR影像(HH极化)Fig.1 Pre-processed full-pol SAR image from GF-3 satellite (HH polarization)
2 研究方法与结果
通过极化目标分解方法提取极化特征,然后利用可分性指数进行特征的优化选择,以极化特征和地物类型作为变量构建原始训练样本集,结合随机森林分类模型提取研究区中的地物信息,最后采用混淆矩阵对分类结果进行精度评价。流程图如图2所示。
图2 研究方法流程图Fig.2 Flow chart of research methods
2.1 分类系统
由于滨海湿地具有高度多样性、结构复杂性和区域差异性的特点,各类型湿地之间、湿地地物与非湿地地物之间均易发生混淆,在遥感影像上难以区分,因此对滨海湿地进行科学分类是湿地研究的前提保障。
参考2009年颁布的《湿地分类》国家标准以及《湿地公约》[9],结合辽河口湿地自然保护区地表类型分布的实地调研结果,本文根据中国滨海湿地的综合分类系统[10]建立了适合本研究区域以及研究目标的分类体系(表1),将研究区的地物类型分为: 芦苇沼泽、翅碱蓬滩涂、淤泥质海滩、自然水域、水稻田、养殖池塘6种湿地地物类型以及建筑用地1种非湿地类型共7种地物类型。
表1 研究区遥感分类体系Tab.1 Remote sensing classification system of the research area
2.2 特征提取与选择
目标分解理论首先由Huynen[11]提出,为了更好地解译极化数据,将极化散射矩阵以符合散射体物理机理的形式标出,有助于提高极化信息利用效率,是地物目标极化信息提取的主要方法[8]。
极化特征能够直接反映地物目标的结构特点,包括对称性和表面粗糙度等其他雷达参数无法提供的信息,在湿地分类应用中,这种优势可以提供强有力的技术支持。各类湿地地物在不同目标分解方法提取的极化特征上表现出明显差异(图3),例如: 在Pauli分解的极化特征图像中,水体为黑色,芦苇沼泽为大面积规则的暗紫色色块,光滩为紫红色,翅碱蓬滩涂为灰白色,稻田主要为规则形状的亮灰色块,水产养殖区为黄棕色和绿色的细小网格; 而在Freeman分解的极化特征图像中,水体为黑色或深蓝色,芦苇沼泽为大面积规则的紫色和棕色色块,光滩为紫红色,翅碱蓬滩涂为亮白色,稻田主要为规则形状的亮蓝色,水产养殖区为黄棕色和绿色的细小网格。
(a) Pauli极化分解 (b) Freeman极化分解图3 极化分解特征假彩色影像Fig.3 False color images of polarization decomposition features
依据地物目标的不同散射机制,可以通过多种目标分解方法提取不同极化信息对地物进行分类,但盲目增加分解特征数量可能会造成信息冗余,从而降低分类精度。研究采用5种极化目标分解方法提取了15项极化分解特征(表2),并利用可分性指数计算分析各个特征对不同地物的区分能力。
表2 极化分解特征Tab.2 Polarization decomposition features
可分性指数公式[20]为:
SIab=|μa-μb|/Sa+Sb)
(1)
式中:μ和S分别为a类地物或b类地物在某一特征下的均值和标准差。可分性指数SIab的值越大表明a类地物和b类地物之间的可分性越好,0.8
图4 研究区各类地物可分性指数柱状图Fig.4 Columnar chart of SI of different objects in the research area
2.3 分类方法
随机森林分类法[21-22]是通过多个分类器的集合,生成大量CART决策树进行共同投票,分类结果由每个决策树的得分决定。这种方法通过减少分类误差的方差来提高分类精度,并且具有较好的稳定性。以经过极化目标分解方法提取和可分性指数优化选择的5种极化特征作为预测变量,以及作为目标变量的7类辽河口湿地自然保护区地物类型,二者构成容量为N的原始训练样本集; 基于自助法重采样技术,在原始集合中随机抽取自助样本集,每个自助样本集作为训练数据集生成单棵分类树; 分类树的单个节点上按照节点不纯度最小的原则从随机抽取的M个特征变量中选择1个特征分支生成新的分类树,直至随机数充分生长。随机森林法随机抽取样本集和特征变量,使得分类器不会过度拟合,并且可以处理大量离散型数据,而且可以通过人工设定阈值来调整分类结果。分类结果如图5所示。
图5 分类结果Fig.5 Classification result
2.4 精度评价
为确定分类结果准确性,需要对分类结果与实际地表情况之间的吻合程度进行评价。研究团队于2020年9月赴辽宁辽河口湿地自然保护区开展了野外调查工作,获取芦苇沼泽、翅碱蓬滩涂、淤泥质海滩、稻田、河流、养殖区等主要滨海湿地地物类型以及建筑用地等非湿地地物的验证点信息。在实际野外调查作业中,记录各验证点准确的经纬度坐标数据,并拍摄记录验证点周围的植被类型、植被覆盖度和土地利用现状。
本文利用实地验证和目视解译获取的112个验证样本点与实验分类结果进行对比并生成混淆矩阵,混淆矩阵对角线上的值表示此类地物的正确分类像元数,非对角线值表示错分像元数[23]。由于各地物类别样本像元数总数不一,所以采用更加合理的加权平均表示总精度。
利用可分性指数优化选择极化特征,结合随机森林法进行滨海湿地保护区的地物分类,此种方法的分类结果对应的混淆矩阵、用户精度、生产精度、总体精度和Kappa系数如表3所示。通过极化目标分解方法和可分性指数得到的极化特征集,在随机森林模型中发挥了积极的作用,总体分类精度达到75.47%,Kappa系数为0.70。结果表明国产高分三号全极化SAR数据能够适用于滨海湿地保护区的地物分类,并且所提取的各种极化分解特征对于不同湿地地物的区分能力差异明显且具备较高质量。
表3 分类结果混淆矩阵Tab.3 The confusion matrix of the classification result
3 结论与展望
研究选取辽宁省辽河口湿地自然保护区GF-3全极化SAR数据,通过可分性指数,将不同极化目标分解方法提取的特征信息进行优化选择,利用随机森林法实现滨海湿地保护区的雷达图像地物分类。结论表明:
1)对于极化目标分解方法提取的极化特征,因地物响应与其散射机理相关,所以不同湿地地物对不同极化分解特征的响应具有显著差异。
2)可分性指数作为优化极化特征选择的一种指标,可以有效降低极化信息冗余度,提高分类效率。
3)国产GF-3卫星的全极化SAR数据大大丰富了我国高分辨率雷达数据的自给率,可以在滨海湿地监测与资源保护遥感应用方面提供数据保障和信息服务。
后续将考虑进一步分析典型湿地地物对不同极化特征的响应差异,提高特征选择标准,加入分层分类法和其他波段的雷达数据来展开湿地分类研究,以期更加准确地提取湿地地物信息,更加细致地反映湿地利用现状,更加科学地进行湿地资源监测。