基于CNN和RFC的极化SAR图像分类

2021-03-16陈彦桥张泽勇陈金勇柴兴华

无线电工程 2021年2期

陈彦桥，张泽勇*，陈金勇，高峰，柴兴华

(1.中国电子科技集团公司第五十四研究所，河北石家庄050081;2.中国电子科技集团公司航天信息应用技术重点实验室，河北石家庄050081)

0 引言

极化合成孔径雷达(Synthetic Aperture Rader, SAR)数据能够获取观测目标的幅度信息以及相位信息[1]，在各个领域都得到了广泛的应用，而极化SAR图像分类又是极化SAR数据处理的关键技术。近些年来，许多极化SAR图像分类算法被提出，上述可以被划分成3类:第1类方法是基于极化分解的分类方法，如Freeman分解[2]、Krogager分解[3]、Cloude分解[4]、Huynen分解[5]和Cameron分解[6]等目标分解方法；第2类方法是基于统计特性的分类方法，极化SAR相关研究学者已证明极化相干矩阵与极化协方差矩阵都服从复Wishart分布[7]，J.S.Lee等人[8]提出了Wishart距离并将其应用于极化SAR图像分类；第3类方法是基于机器学习相关算法的分类方法，例如支持向量机(Support Vector Machine, SVM)[9]、神经网络(Neural Network，NN)[10]、K近邻(K-Nearest Neighbor, KNN)[11]以及随机森林分类器(Random Forest Classifier, RFC)[12]等算法。

近些年来，卷积神经网络(Convolution Neural Network, CNN)[13]在极化SAR图像分类中也得到了广泛应用。在CNN分类框架中，需要将像素点的邻域设置为模型输入从而得到该像素点的分类结果。然而，在图像的类别边界区域，单像素点的邻域区域的像素点的类别并不一定与该像素点的类别一致，因此CNN在图像的类别边界区域分类效果并不好。RFC算法在极化SAR图像任务中表现性能良好，但是在类别非边界区域的分类结果没有CNN好。在本文中，在类别边界区域使用RFC的分类结果，在类别非边界区域使用CNN的分类结果，通过此种集成方式，得到更好的分类结果。

1 特征提取

1.1 极化相干矩阵

通过线性水平和垂直方向发射和接收极化电磁波的方式，极化散射矩阵[14]可以表示为：

(1)

在满足互易定理SHV=SVH的情况下，极化散射矩阵可以表示为：

(2)

(3)

1.2 Cloude分解

根据特征分解模型，T矩阵可以分解为[14]：

(4)

(5)

本文使用T矩阵(T11,T22,T33, Re(T12), Re(T13), Re(T23), Im(T12), Im(T13), Im(T23)和Cloude分解特征(H,A,α,λ1,λ2,λ3)作为输入特征，其中Re(Tij)和Im(Tij)代表Tij的实部和虚部。

2 方法

2.1 卷积神经网络

CNN主要由卷积层、池化层和全连接层组成[13]。卷积层是用卷积核处理数据，而且通过卷积提取的特征具有平移不变性。池化层的主要作用是降低特征维度，从而降低计算量。激活函数主要作用于卷积层，使模型可以提取数据之间的非线性关系，提取的特征更加抽象。常见的激活函数有sigmoid函数、ReLU函数和tanh函数。

2.2 随机森林分类器

随机森林[15]使用Bagging方法为每棵决策树生成用于训练的样本集，而且这些样本集是独立同分布的，每棵决策树在训练过程中确定的参数会组成随机向量，而且随机森林中所有决策树的随机向量也是独立同分布的。随机森林分类器是由所有决策树集合而成的分类器，该分类器可以表示为：

h(x,θk),k=1,2,…,n，

(6)

式中，x代表输入数据；k代表第k棵决策树；θk代表第k棵决策树的参数向量，可以在bootstrap样本集上学习得到；h(x,θk)则代表第k棵决策树对输入数据x进行分类。对于输入数据x的最终类别由所有决策树的分类结果综合得到。

2.3 基于CNN和RFC的集成分类器

本文使用信息熵表示CNN分类结果的不确定性，其可以表示为：

(7)

式中，N表示类别总数；i表示类别i；p(i)表示将样本x分类为第i类的概率。H(x)的值越大，意味着x的分类不确定性越强，x位于类别边界区域的概率也就越大。通过此种方式，可以得到图像的类别边界区域。

本文算法(RFC-CNN)流程如下：

① 用RFC得到分类结果；

② 用CNN得到分类结果；

③ 根据式(8)从CNN的分类结果得到类别边界区域；

④ 类别边界区域使用RFC的分类结果，类别非边界区域使用CNN的分类结果。

3 实验与分析

如第1节所述，本文使用T矩阵(T11,T22,T33,Re(T12), Re(T13),Re(T23), Im(T12), Im(T13), Im(T23))和Cloude分解特征(H,A,α,λ1,λ2,λ3)。使用精致Lee滤波[1]方法作为滤波方法，使用总体正确率(Overall Accuracy, OA)以及Kappa系数作为评价指标。RFC的决策树的数目为100。CNN架构图如图1所示，其中Image代表输入图像，Conv代表卷积层，Pool代表池化层，Flat代表拉成一列，fc代表全连接层，Result代表分类结果。

图1 CNN框架图Fig.1 CNN framework

3.1 Xi’an图像分类实验

Xi’an图像[14]是全极化C波段的极化SAR图像，由RADARSAT-2卫星获取，覆盖中国陕西省西安市渭河部分场景，含有3类地物：Water(水域)、Grass(草地)和Building(建筑区)。Xi’an图像大小为512 pixel×512 pixel，其分辨率为8 m×8 m，Xi’an图像的Pauli伪彩色图、类标图以及配色方案如图2所示。

(a)Pauli伪彩色图

(b)类标图

(c)配色方案图2 Xi’an极化SAR图像Fig.2 PolSAR image of Xi’an

图2中有标记的样本数目为237 416。本文从有标记样本中随机选取的比例为0.5%，剩下的有标记样本被设置为测试样本。图3给出了该图像的分类结果，表1给出了该图像的分类正确率以及Kappa系数。

(a) RFC

(b) CNN

(c)边界

(d) RFC-CNN图3 Xi’an图像分类结果Fig.3 Classification result of Xi’an image

表1 Xi’an图像分类正确率Tab.1 Classification accuracy of Xi’an image

由图3可以看出，RFC-CNN确实得到了图像的边界区域，而且该方法确实得到了比RFC和CNN更好的分类结果，在图像边界区域比CNN分类结果好，在图像非边界区域比RFC的分类结果更好。由表1可以看出，本文方法的整体正确率和Kappa系数都是所有方法中最高的。上述结果表明，本文方法的集成策略在Xi’an图像分类中是有效的。

3.2 Oberpfaffenhofen图像分类实验

Oberpfaffenhofen图像[14]是全极化L波段的极化SAR图像，由E-SAR卫星获取，覆盖了位于德国Oberpfaffenhofen的部分地区，包含3类地物：Open Areas(开放区域)、Wood Land(森林)和Built-up Areas(建筑区)，该图像大小为1 300 pixel×1 200 pixel，其分辨率为3 m×2.2 m，Oberpfaffenhofen图像的Pauli伪彩色图、类标图以及配色方案如图4所示，该图像的有标价样本数目为1 374 298，本文采用0.2%的标记样本作为训练样本，剩余标记样本作为测试样本。图5给出了该图像的分类结果，表2给出了该图像的分类正确率以及Kappa系数。

(a) Pauli伪彩色图

(b) 类标图

(a) RFC

(b) CNN

(c)边界

(d) RFC-CNN图5 Oberpfaffenhofen图像分类结果Fig.5 Classification result of Oberpfaffenhofen image

表2 Oberpfaffenhofen图像分类正确率Tab.2 Classification accuracy of Oberpfaffenhofen image

由图5可以看出，RFC-CNN成功找到了图像边界区域，相比于RFC和CNN，本文方法也得到了更好的分类结果。由表2可以看出，RFC-CNN的总体正确率和Kappa系数确实比RFC和CNN更高。综上，本文方法的集成策略在Oberpfaffenhofen图像分类的有效性得到了证明。

4 结束语

本文提出了一种基于CNN和RFC的集成学习方法用于极化SAR图像分类。CNN在类别非边界区域分类性能优异，但是在类别边界区域分类结果较差，RFC在类别非边界区域分类结果不如CNN，但是在类别边界区域分类性能比CNN优异，本文方法的集成策略是使用CNN对类别非边界区域进行分类，使用RFC对类别边界区域进行分类，以此取得更好的分类结果。本文将T矩阵以及Cloude分解特征设置为输入特征，使用Xi’an和Oberpfaffenhofen两幅极化SAR图像作为测试图像，与对比方法RFC以及CNN相比较，本文方法在类别非边界区域比RFC分类结果好，在类别边界区域比CNN分类结果好，因此本文方法的集成策略是有效的。