面向对象的PolSAR图像SVM分类

2022-03-22韩宾宾

中国民航大学学报 2022年1期

韩宾宾，韩萍，程争

（中国民航大学a.电子信息与自动化学院；b.工程技术训练中心，天津 300300）

极化合成孔径雷达（PolSAR，polarimetric synthetic aperture radar）是一种搭载在卫星、飞机等空间平台上的对地观测系统，其通过发射和接收特定频率（微波波段）和极化方式的电磁波进行成像，具有全天时、全天候、高分辨、穿透强、信息丰富等特点，已经在农作物长势监测、地质勘探、海洋监测、军事侦察等领域获得了广泛应用[1]。

地物分类是PolSAR 图像解译的重要内容之一。文献[2]利用多分量散射模型（MCSM，multiple-component scattering model）和灰度共生矩阵（GLCM，graylevel co-occurrence matrix）提取特征，用支持向量机（SVM，support vector machine）实现分类。文献[3]研究了利用不同极化分解进行特征组合实现SVM 分类的问题。以上两种算法虽然取得了一定的分类效果，但其分类准确率仍不能满足现实需求。究其原因在于：其都以单个像素为基本分类单元，像素特征受相干斑噪声影响严重，且随着众多遥感卫星升空和系统分辨率不断提升，遥感数据呈海量增长趋势，以单个像素为基本单元的图像解译方式在计算效率上也面临巨大挑战。

在此背景下，以图像块为基本单元的面向对象分类算法引起相关学者的关注。超像素，即空间邻近、特征相似的图像块，是最为常用的面向对象分类的基本单元之一。文献[4]在PauliRGB 伪彩色图上进行超像素分割得到待分割对象，然后将Wishart 分类器应用于超像素实现图像分类，该算法在分类对象生成中只用了部分极化信息，是一种次优算法。文献[5]首先提取了27 维极化特征，然后用拉普拉斯特征映射（LLE，Laplacian Eigenmaps）进行特征降维，再用SVM 分类器进行分类，最后利用超像素在局部区域内进行众数投票确定分类结果。文献[6]与文献[5]采用相似结构，由主成分分析（PCA，principal component analysis）替换LLE 进行特征降维，在众数投票中设定优势阈值，最优类别占比小于阈值则以像素为单位进行Wishart 分类，否则将超像素整体标注为优势类别。以上两种算法的主要分类过程仍以像素为基本单位完成，超像素仅起到局部平滑作用，没有充分发挥面向对象分类算法的计算效率优势。

针对以上问题，提出一种面向对象的SVM 分类算法。在分类对象生成阶段，算法从计算效率和分割效果出发，采用前期研究成果（文献[7]）生成基本对象单元；在特征提取阶段，算法利用转换矩阵将PolSAR 图像极化协方差矩阵转化为多个单极化雷达系统的散射截面积参数，这些参数物理意义明确且均可以用对数正态分布加以描述，有利于后续分类，同时简单矩阵相乘的特征提取方式保证了特征提取步骤的高效性；在分类阶段，考虑到面向对象分类在减少分类处理单元的同时，也必然减少训练样本数量，算法选择在小样本条件下依然具有较好学习性能和泛化性能的SVM 分类器实现分类。

1 特征提取

满足互易性的单站全极化雷达数据可以用极化协方差矩阵C 表示

式中：S 表示雷达散射系数；下标h 表示水平发射或接收；下标v 表示垂直发射或接收；上标*表示复数共轭；〈·〉表示时间或空间的集合平均。

从式（1）可以看出，极化协方差矩阵C 为共轭对称矩阵，其全部信息可以由以下9 个“实数”参数表示

式中：Re[·]表示复数实部；Im[·]表示复数虚部。式（2）中参数虽然为实数，但其物理意义难以明确。文献[8]根据不同坐标系下散射系数转换关系将式（2）表示为9 个雷达散射截面积参数（RCS，radar cross section），且这些参数均服从对数正态分布，使其能够非常方便地服务于后续分类任务，即

式中

2 SVM 分类器

SVM 分类器是机器学习领域一种非常经典的分类方法，在小样本情况下依然具有较好的学习能力和泛化能力。假设数据样本集为{（x1，y1），（x2，y2），…，（xn，yn）}，其中xi∈Rd为d 维特征向量，yi∈{1，-1}为样本类别标号，n 为样本数目。SVM 分类器的学习目标是寻找一个最优分类超平面的f（w，b）= wTx + b = 0，使其到两个类别的距离最大化。超平面到两个类别距离定义为

式中：Ⅰ为类别标号为“1”的样本集合；Ⅱ为类别标号为“-1”的样本集合。从式（4）可以看出，SVM 将类别到超平面的距离定义为“所有样本到超平面的最短距离”。上述分类器设计原理可以等价描述为优化以下目标函数

式中Lhinge（u）=max{0，u}，∀u∈R。求解式（5）可以得到如下分类表达式

式中αi≥0 为目标优化过程中的拉格朗日乘子。

从分类器设计原理可以看出，以上SVM 分类器只能处理线性可分二分类问题，对于非线性可分问题，需要先用映射函数ϕ（x）将样本特征映射到高维线性可分空间，再利用特征内积实现分类。根据Mercer 定理[9]，可以通过某些核函数在不显著增加计算量的情况下实现高维特征空间内积运算，从而在一定程度上解决线性不可分问题。常用的核函数有线性核函数、多项式核函数、径向基核函数，即

式中q，σ2为对应核函数的参数。

对于多分类（N≥3）问题，一般采用两种方式解决：①将SVM 分类器进行扩展使其适用于多分类问题；②将多分类问题拆解为多个二分类问题。针对具体拆分方式又可以分为“一对多”、“一对一”两种：“一对多”依次将某一类视为单独一类，其余类视作另一类，如此对于N 类分类问题需要N 个分类器；“一对一”则在两两类别之间建立一个分类器，如此需要N（N-1）个分类器。

3 算法描述

所提算法流程图如图1 所示，首先对图像进行超像素分割产生待分类对象，然后利用转换矩阵提取待分割对象的雷达散射截面积参数，最后构造训练集和测试集，利用SVM 分类器完成图像分类。具体分类步骤细节描述如下。

图1 算法流程图Fig.1 Flowchart of proposed algorithm

1）超像素分割生成待分类对象

对象生成为图像分类的预处理步骤，应该具有较高的运算效率，同时生成的对象应该具有较好的内容一致性，为此采用前期研究成果[7]产生超像素对象，并将超像素内的协方差矩阵平均值作为对象内容，以此实现滤波降噪，同时大大降低后续分类基本单元数目，提升图像分类效率。

2）对象特征提取

理想的特征提取应该具有特征意义明确、提取步骤简单和特征信息完备等特点。上文提取的特征为各坐标系下的雷达散射截面积参数，物理意义非常明确；特征提取可以通过简单的矩阵乘法完成，具有计算简单的特点；转换矩阵为可逆矩阵，可以在协方差矩阵元素和特征集之间相互转换，具有信息完备性。因此，选择前述矩阵转换方式提取雷达散射截面积特征。同时，考虑到这些特征服从对数正态分布，将这些特征进行”对数”处理。

3）分类器训练和分类

面向对象分类方法在减少待分类对象的同时也必然减少了可用的训练样本数目，为此选择SVM 分类器作为主干分类算法进行分类。关于核函数选择问题，考虑到雷达散射截面积参数服从对数正态分布，选择径向基核函数。PolSAR 图像通常包含多种地物，综合考虑分类效果和计算效率，选择“一对多”方式进行多分类。

4 实验分析

为了验证所提算法的有效性，用PolSAR 图像处理领域的公开实测San Francisco 场景数据进行实验。实验所用数据的PauliRGB 图和对应场景真值图[10]如图2 所示，数据由机载AIRSAR 系统于1989年采集，成像采用L 波段，图像大小为900×1 024，场景中主要包括山区、海洋、植被、平坦城区和倾斜城区5 种地物。为保持分辨率，不预先对数据进行滤波降噪处理。

4.1 统计特性分析

为了验证雷达散射截面积参数的统计特性，对海洋区域数据（图2 的红框区域）进行采样，分析其统计特性。数据统计结果如图3 所示，分别为9 个雷达散射截面积参数的对数直方图和对应均值、方差的正态分布曲线。从图3 中可以看出，正态分布曲线很好地拟合了直方图。

图2 San Francisco 场景数据Fig.2 Data image of San Francisco field

图3 雷达散射截面积参数统计分布Fig.3 Statistical distribution of radar cross section

4.2 视觉分析

为了便于分析所提算法的分类效果，编程实现了文献[2]和文献[3]算法作为对比算法。同时，为了说明所提特征提取和面向对象分类策略的合理性，编程实现了仅基于极化分解特征的SVM 分类，包括MCSM 分解特征（记为MCSM）、Cloude 分解和Freeman 分解组合特征（记为C-F，文献[3]的特征组合之一）和雷达散射截面积参数特征（记为RCS）；基于极化分解特征和GLCM 纹理特征的SVM 分类，分别记为MCSM-GLCM（文献[2]算法）、C-F-GLCM 和RCS-GLCM，同时包括上述算法的面向对象分类策略，记为MCSM-Object、C-F-Object、RCS-Object（所提算法）、MCSM-GLCMObject、C-F-GLCM-Object、RCS-GLCM-Object。

上述算法的MCSM、Cloude、Freeman 分解特征由PolSARpro 软件计算得到。GLCM 纹理特征包括能量、相关性、对比度及和平均[2]，特征计算的局部窗口为7 × 7，灰度等级为16，像素对方向为{0°，45°，90°，135°}，距离为1。通过交叉验证方式确定SVM 分类器最优分类参数：惩罚项c = 1 000，径向基核函数σ=0.01。训练样本按固定比例随机采样确定，考虑到图像的像素数目水平在百万级，面向像素分类的训练样本采样比例设为0.1%；面向对象分类的训练样本采样比例设为10%。以上述参数重复实验10 次，各算法的最优结果如图4 所示。

图4 所提算法和对比算法的分类结果Fig.4 Classification results of the proposed and contrast algorithms

从图4 中可以看出，相对于面向像素分类，面向对象分类策略显著提升了分类效果；对于面向像素分类来说，加入纹理特征后的分类效果提升非常明显，这是由于GLCM 特征为局部区域特征，受相干斑噪声影响较小；相对地，纹理特征没有显著提升面向对象分类的分类效果，甚至对于RCS-Object 来说，纹理特征的加入反而降低了分类效果，如图4（k）中黄框标识区域；比较仅基于极化分解特征的MCSM、C-F 和RCS分类效果，RCS 的分类视觉效果更加接近真值图。

4.3 定量分析

以分类精度作为评价指标对以上算法进行定量评价，评价结果如表1 所示。定量评价结果与视觉评价结果整体一致。相对于面向像素分类，面向对象的分类准确率提升在10%左右，最高达到30.37%；加入纹理特征使面向像素分类的准确率最低提升了7.30%，而使面向对象分类的准确率最高仅提升了3.42%，由此可以看出，纹理特征对于面向对象的分类策略提升效果有限；对于所提算法，加入纹理特征使分类准确率降低了0.26%；对于仅依赖极化分解特征的MCSM、C-F和RCS 3 种算法，其分类准确率分别约为56.18%、69.65%和75.90%，RCS 特征表现出更加优秀的地物区分能力。相对于文献[2]和文献[3]，所提算法的分类准确率提升了约10%。

表1 所提算法和对比算法的定量分析结果Tab.1 Quantitative analysis of the proposed and contrast algorithms

从不同地物的分类效果来看，所提算法对山区、植被达到了最优分类性能，对海洋和平坦城区接近最优分类性能；对倾斜城区分类效果较差，原因是算法对植被和倾斜城区进行了一定程度的混淆，对比Paui RGB 图发现，植被和倾斜城区确实表现出非常相似的极化特征。加入纹理调整后，对倾斜城区的分类效果有所改善，相比较RCS 特征提取而言，GLCM 纹理特征提取计算复杂度较高，因此，从分类处理效果提升和计算复杂度出发，在特征提取步骤中没有加入纹理特征。

5 结语

针对PolSAR 图像强噪声、大场景特点，利用超像素分割、快速特征提取和SVM 分类技术提出一种具有强抗噪声干扰能力的高效分类算法。实测数据的实验结果表明，所提算法显著地改善了PolSAR 图像分类效果。同时，实验发现算法对于极化特征相近地物（如植被和倾斜城区）的分类效果还不是非常理想，下一步将针对该问题进行重点研究。