基于引力自组织神经网络的震害遥感影像分类

2019-09-12黄惠郑雄伟孙根云郝艳玲张爱竹容俊马红章

自然资源遥感 2019年3期

黄惠，郑雄伟，孙根云，郝艳玲，张爱竹，容俊，马红章

(1.中国石油大学(华东)地球科学与技术学院,青岛 266580； 2.青岛海洋国家实验室海洋矿产资源评价与探测技术功能实验室,青岛 266071； 3.中国自然资源航空物探遥感中心，北京 100083； 4.中国石油大学(华东)理学院,青岛 266580)

0 引言

震后灾情快速评估对应急指挥、救援决策具有极其重要的意义[1]。常规的人工实地勘测方式受人力物力的限制，难以满足宏观、快速的检测需求[2]。高空间分辨率遥感影像蕴含着丰富的空间细节信息[3]，基于其分类结果来快速识别和提取震害目标，已在震灾评估方面得到了广泛的应用[4-6]。震害影像分类方法中，面向对象分类方法以分割区域代替像元作为研究对象，避免了粒度过小的问题，同时能够更加充分地挖掘影像的光谱、纹理、形状和上下文等信息，在高空间分辨率遥感震害影像分类和目标地物提取中展现了独特的优势[5]。

面向对象分类中一个关键问题是影像分割对象的特征描述。针对高空间分辨率遥感影像纹理特征丰富这一特点，研究者提出了许多空间纹理特征描述方法，如RIU-LBP等[7-8]，在一般的高空间分辨率遥感影像分析中起到了良好的效果。但由于地表遭到严重破坏，高空间分辨率震害遥感影像纹理的随机性和不规则性更强，不同地物之间往往呈现很高的相似性，传统的纹理描述方法很难直接应用到高空间分辨率震害遥感影像。分形理论在探索空间结构、描述复杂问题及不规则现象方面展现了极大的优势[9-11]，已经在遥感影像纹理分析等方面得到了有效应用[12-13]，但将其运用到震害影像的研究中还比较少。本文针对震害地物的特点，利用分形理论对其进行特征描述，探索其在震害遥感影像分析中的应用效果。面向对象分类方法的另一个关键问题是分类方法的选取，常用的分类方法有最小距离分类、模糊分类及支持向量机(support vector machine，SVM)等监督分类方法，但是实际震害往往覆盖范围广，而且震害场景复杂多样，训练样本的选取不但费时费力，而且选取精度受主观因素的影响，不能满足实际的生产要求。自组织特征映射神经网络(self-organizing map，SOM)具有极强的非线性映射能力，能够通过自学习的方式从复杂数据中提取出一般规律，且不需要训练样本数据，在遥感影像地物分类中获得了广泛应用[14-16]。但是，SOM只能反映底层数据特征，并不能自动决策分类数目。Ilc等[17]根据引力原理，在此基础上对其进行了改进，提出了引力自组织神经网络(gravitational self-organizing map，gSOM)，从而提高了SOM自动处理的能力。

本文综合分形纹理和gSOM的优势，采用面向对象的思想，构建了一套高空间分辨率震害影像面向对象分类方法，以期在不建立特征规则的条件下自动、快速地完成震害影像地物分类。

1 震害影像面向对象分类

1.1 引力自组织神经网络

gSOM是Ilc等[17]结合SOM和引力算法提出的一种非监督神经网络。gSOM将聚类过程分成2个步骤：

1)SOM训练得到获胜神经元。SOM进行训练时，输入待分类数据的特征向量作为网络输入信号，通过网络中神经元竞争学习得到获胜神经元，实现对输入信号的响应，此时为了充分反映数据的内部关系，获胜神经元数要大于待分类数据的类别数。

2)获胜神经元被视为活动质量粒子并在邻近引力下聚类。SOM训练后，获胜神经元作为输入信号的代表，呈现出拓扑有序的特点，因此可根据获胜神经元之间已知的邻接关系，考虑相互之间的引力，最终完成聚类。

1.2 输入向量的构建

1.2.1 初始过分割

SOM神经网络的输入信号对分类结果起到至关重要的作用。震害影像范围广、数据量大，局部特征复杂，直接对SOM进行分类训练，不仅训练时间较长，而且分类结果可能出现严重的碎斑现象。从减少网络训练时间和保存震害目标的完整性考虑，本文采用面向对象的思想，首先对影像进行初始分割，得到均质的分割区域，然后将区域对象作为处理单元。这样，一方面可以减少神经网络输入的数据量，从而大大减少训练时间；另一方面还可以综合考虑区域对象的纹理和光谱特征，提高分类结果。均值漂移(mean shift，MS)[18]作为一种迭代的非参数聚类方法，对影像的初始分割具有良好的稳健性，在高空间分辨率影像分割中得到了广泛应用[19-20]。因此，本文首先利用MS方法对震害影像进行初始过分割，参数的设置根据文献[21]的建议，值域带宽设置为6，最小区域大小设置为20。

1.2.2 分割区域分形纹理特征的提取

得到分割区域之后，需要在此基础上提取区域的特征向量作为SOM的输入信号。在地震以及滑坡、泥石流等次生地质灾害发生后，地表区域呈现出明显的不规则、支离破碎的特征。分形维数[22](简称“分维”)是对非光滑、不规则、形态破碎等极其复杂的分形体进行定量刻画的有效参数，因此本文通过计算分维数来定量抽取出震害影像的纹理信息。

本文利用盒子维模型计算震害影像的分维数。对于一幅灰度图像M×N，像素点的平面坐标与其对应的灰度值I构成一个灰度曲面。利用一个尺度l将图像分成l×l×g的盒子，其中g表示按尺度l划分的盒子总数目，nl为g中包含像素点的盒子数目，改变l的大小得到不同的nl，则图像的分形维数FD为

(1)

在实验中，采用9像元×9像元大小的窗口，因此对应l值从9到3，间隔值为1进行变化，得到nl值计算的分形值。然而，利用上述分形维数计算方法，一幅影像只能得到一个分形维数值。为了得到每个像元的分形维数，本文采用滑动窗口，从左到右、从上到下遍历影像中所有的像元并计算其分形维数IFD。

影像的分形纹理可通过分数维加以度量。传统方法通过计算分割区域分形维数的均值或者方差判断区域的分形属性，其缺点在于自然界很多视觉上差别很大的纹理，其分数维近似相同[23]，仅以分数维为特征，很难达到良好的分类效果。考虑到影像的二阶统计特征能够从更精细的角度区分影像的2种不同的纹理[24]，因此为了增大震害地物的可分性，本文以得到的分形维数图像为基础，统计其在分割区域的二阶统计量作为区域的纹理特征。其中，二阶统计量共计8维特征，具体包括2类： ①描述分割区域对象反差性的特征，包括对比度(contrast, CON)、相异性(dissimilarity, DIS)和空隙度(lacunarity, L)； ②描述区域对象的有序性的特征，包括角二阶矩(angular second moment, ASM)、熵(entropy, ENT)、同质性(homogeneity, HOM)、偏斜度(skewness, S)和逆差距(inverse difference moment, IDM)。具体如表1所示。

表1 分形纹理特征公式及含义Tab.1 Formulas and meanings of fractal texture features

上述二阶纹理统计量较为全面地反映了过分割区域的全局空间特征，为了进一步反映震害对象的局部特征，本文进一步结合原始影像的光谱特征，构建了全局-局部特征描述子。其中，光谱特征采用原始影像R，G，B每一个波段的均值和方差共6维特征作为过分割区域的光谱特征向量。

1.3 SOM训练

SOM神经网络是一种基于聚类思想的无监督分类算法，包括输入层和竞争层2层结构。在对SOM进行训练时，输入层的各神经元通过权向量将外界信息汇集到输出层的各神经元，其节点数与输入数据的维数相同。竞争层的神经元节点通过竞争来获取对输入数据的响应机会，最后仅剩一个输出最大的神经元成为获胜神经元，并根据输入层样本特征之间的距离，动态调整与获胜神经元有关的各连接权值。

网络的训练过程为：

1)初始化。包括初始化p个输入节点到q个输出节点的权值及设置、初始邻域的大小等。

2)输入信号。

(2)

(3)

式中hi,i(x)(t)为t时刻高斯邻域函数，随着时间单调递减。

5)返回步骤2)。

1.4 引力聚类

(4)

(5)

SOM中获胜神经元在引力下聚类得到了初始聚类结果。经过分析可知，由于地物波谱辐射的复杂性和干扰因素的多样性，震害影像具有不规则和紊乱性的特征，很难获取先验知识，而gSOM不需要任何的先验知识，能够自适应的决定分类的数目，这给接下来的震害评估带来了极大的方便。并且如果达到预定的分类数，用户也可以利用gSOM聚类完成。

1.5 一致性函数聚类集成

gSOM算法中无监督训练过程以及引力下聚类中粒子自适应选择过程使得该算法产生的结果随机性比较强，每次聚类的结果对同种地物有不同的细节反映，集成学习则通过某种组合方式将不同的分类结果组合起来，获取单个分类算法更好的分类结果[25-27]。一致性函数[28]能够聚类集体中的多个聚类结果以最小代价进行结合(或称为集成)，以生成一个统一的聚类结果[29]。本文采用Strehl等[30]的聚类集成方法，包括聚类集成划分方法(cluster-based similarity partitioning algorithm，CSPA)、元启发式方法(meta-clustering algorithm，MCLA)和图形划分方法(hypergraph partition algorithm，HGPA)。基于gSOM获得的多种聚类结果，利用CSPA，MCLA和HGPA聚类集成，选择合并代价最小的结果作为最后的分类结果，进一步目视识别震害目标。分类总体流程图如图1所示。

图1 高空间分辨率震害影像分类流程Fig.1 General flowchart of the high resolutionseismic image classification

2 实验方法与分析

2.1 实验数据

本文实验中采用的数据是四川省汶川县震后的彩色航空影像的2个研究区域(T1和T2)，影像大小分别为400像元×400像元和510像元×404像元，空间分辨率均为1 m，合成波段为R，G，B，如图2(a)和(d)所示。其中，T1影像中震害区域为倒塌的居民地，部分房屋倒塌、破损极其严重、没有规整的几何外形；较为完好的房屋与完全倒塌、部分倒塌的房屋分布集中； T2影像中震害区域为倒塌的居民地，图中右上角为泥石流，场景也极其复杂。实验中，采用MS算法对2种典型震害影像进行初始分割，分割结果如图2(b)中所示。基于MS分割结果，提取区域的光谱和分形纹理特征，利用gSOM分类器进行非监督聚类，通过一致性函数聚类集成，得到最终的分类结果。为了验证本文所提出的算法在高分震害遥感影像分类中的有效性，本文进行了与面向对象算法的对比实验。面向对象的对比试验采用SVM算法，核函数选用径向基函数(radial basis function，RBF)，核函数中的Gamma系数设置为0.015，其他参数选择默认参数。实验中采用与本文算法相同的MS初始分割结果，然后根据MS过分割结果，选取感兴趣区域(region of interest，ROI)作为训练数据(如图2(c)和(f)所示)，进行面向对象的分类，最后选择较好的分类结果进行对比。在精度评价中，根据不同专家人工目视判读综合得到的分类地面参考数据，以总体精度和Kappa系数作为评价指标，定量评价分类精度。

(a) T1原始影像 (b) T1分割结果 (c) T1中ROI

(d) T2原始影像 (e) T2分割结果 (f) T2中ROI

图2 T1，T2原始影像、MS分割影像以及对应的ROI

Fig.2SeismicimagesT1andT2,MSsegmentationresultsandthecorrespondingROI

2.2 定性评价

应用本文所建立的高空间分辨率震害遥感影像分类模型，2种算法得到的震害影像分类结果如图3所示。

(a) T1本文算法分类 (b) T1 SVM算法分类 (c) T1参考数据

(d) T2本文算法分类 (e) T2 SVM算法分类 (f) T2参考数据

图3 T1和T2影像分类结果对比

Fig.3ComparisonoftheclassificationresultsofT1andT2

从图3中可以看出，虽然本文算法没有使用训练样本，但其分类效果仍优于或者相似于经典的SVM算法结果。整体上，本文算法对倒塌房屋、滑坡和泥石流3种场景与其环境背景均区分明显，且震害目标具有整体性，边界光滑； SVM效果与本文算法类似，但是部分区域存在一定的错分现象，部分震害目标破碎，小斑块较多，震害地物整体感相对较弱。

进一步分析两者的差异，可以得出：

1)从T1分类结果可以看出，2种方法在保留地物的完整性方面均取得了较好的效果。但是SVM的分类结果中遗漏了部分完整房屋(如图3(b)中椭圆中地物所示)，将其错分为倒塌房屋，说明SVM算法对于此类复杂地物分类问题具有一定的局限性。本文算法对影像整体与局部信息进行了综合考量，而且凭借分形对于复杂地物良好的空间描述能力，能够准确提取出不同背景下的不同大小的完整房屋(如图3(a)黄色椭圆和红色椭圆中地物所示)，分类结果更加接近于参考数据。

2)在T2场景中，本文算法与SVM均能将泥石流准确提取，但是SVM提取的地物细碎，局部地物分类有错分现象(如图3(e)黄色椭圆中地物所示)。相较于SVM算法，本文算法利用一致函数集成了不同gSOM分类结果的优势，提高了相邻地物之间的相关性，对于复杂边界的区分有着很好的抗噪性(如图3(d)黄色椭圆中地物所示)，还能将被倒塌房屋掩埋、不连续的小路作为一个整体区分出来(如图3(d)长方形中地物所示)，在居民区的倒塌房屋等区域的边界也更加平滑准确。

2.3 定量评价

利用前述ROI样本分别制作2幅影像的混淆矩阵，对本文提出的高空间分辨率震害影像分类方法的有效性进行评价和比较。T1影像分类精度评价如表2—3所示，T2影像分类精度评价如表4—5所示。

表2 SVM方法对T1影像的混淆矩阵和精度评价Tab.2 Confusion matrix and accuracy assessment of T1 using SVM

表3 本文算法对T1影像的混淆矩阵和精度评价Tab.3 Confusion matrix and accuracy assessment of T1 using the proposed algorithm

表4 SVM方法对T2影像的混淆矩阵和精度评价Tab.4 Confusion matrix and accuracy assessment of T2 using SVM

表5 本文算法对T2影像的混淆矩阵和精度评价Tab.5 Confusion matrix and accuracy assessment of T2 using the proposed algorithm

总体来说，由于分形二阶统计量对于局部特征量的有效度量，本文建立的分类模型在T1倒塌建筑物场景下的分类精度比经典的SVM分类精度提高了4.7%，Kappa系数提高了0.07；在T2泥石流、倒塌房屋场景的分类中，分类精度提高了13.68%，Kappa系数提高了0.20。从表2和表3中看出，由于完整房屋和倒塌房屋具有相似的光谱特征，SVM方法中完整房屋和倒塌房屋区域混分很严重，分类精度很低, 而本文算法利用分形纹理特征和对相邻地物的相关性的把握，对于光谱极其相似的地类有着较强的区分能力。从表4和表5中看出，完整房屋和草地在空间上的分布较为分散，SVM的方法很容易将其漏分或错分，而本文算法则利用一致函数，消除了分类结果噪声现象。相对于SVM，本文提出的算法具备明显的优势。

3 结论

本文针对震害目标自动识别的问题，构建了利用分形纹理特征结合gSOM方法对高空间分辨率震害影像进行面向对象分类的方法，以汶川县震后不同场景的航空彩色影像为测试数据，验证了该方法的有效性及应用潜力。主要结论如下：

1)选择分形纹理的二阶统计量作为影像的纹理描述方法，同时结合局部光谱特征，能够有效描述震害目标，在保持大面积地物分类均一性的同时，还能减少小型地物细节信息的丢失。

2)gSOM的应用能够解决震害场景复杂和训练样本难以选取的问题，而且自适应的学习能力大大减少复杂震害地物，特别是倒塌房屋与完整房屋的错分现象。

3)一致函数的集成可以将不同分类结果的优势相结合，增强了决策过程中不同分类结果的相关性。

与面向对象的SVM分类算法相比，本文算法的分类精度有了明显提高。同时，本文以MS初始分割产生的地理对象作为神经网络分类的基本单元，大大减少了神经网络的训练时间，提高了gSOM分类效率，展示了其在大范围灾害影像中的应用潜力。当然，本文算法尚存在不足，如gSOM算法得到分类结果之后，直接进行一致函数集成，并没有对结果进行筛选。下一步研究中，拟考虑先对分类结果进行筛选，在得到好的分类结果之后再进行集成。