基于ICA和FCM的多时相SAR图像变化检测
2012-06-06汤迎春覃亚丽
汤迎春,覃亚丽,温 浩,吴 刚
(浙江工业大学信息工程学院,浙江 杭州 310023)
利用SAR图像进行地面资源变化检测,在诸多领域都起到了关键作用,如森林监测、毁伤判定、灾害监测等[1-2]。SAR变化检测是SAR图像研究和应用的一大热点。通常,变化检测涉及到的已配准的遥感图像必须是不同时间同一区域内的。SAR图像的变化检测分析主要分为:分类后比较法(监督方法)和直接比较法(非监督方法)[3]。前者是基于监督分类的方法,它需要地表真实数据作为训练集来学习处理分类。后者是在无任何先验信息的条件下对两幅多时相图像直接进行比较,以二值图的形式给出变化结果,来定位变化发生的位置。对于监督分类法要得到地面参考数据是一件困难和代价高昂的任务,而且变化分析的精度依赖于图像分类的精度。因而,在缺乏地面参考数据的情况下,有效的非监督方法在许多实际应用方面受到青睐。
近年来,一些学者提出了许多非监督变化检测算法,不少算法受限于需要选择变化和非变化类分布的统计模型[4],采用非监督的、自由分布的、考虑上下文信息的模糊聚类变化检测方法能够克服此类缺陷。因此本文提出独立成分分析结合模糊C-均值聚类方法来检测多时相SAR图像的变化区域,独立成分分析可以解决合成孔径雷达(SAR)图像存在混合像元和相干斑噪声的问题,通过ICA和差值比较的方法来构造差异图像,为了克服需要选择差异图像统计模型的影响,采用FCM算法提取变化区域。在聚类分析中,加入了二阶邻域信息,可以有效抑制变化检测出现的虚警。
1 算法关键技术
1.1 基于ICA和核聚类的变化检测
提出的变化检测方法包括4个步骤:图像预处理(主要是图像配准),独立成分分析,图像直接比较及差异图像的模糊C均值聚类。其流程框图如图1所示。
图1 变化检测流程图
1.2 独立成分分析
独立成分分析是近年来盲源分离技术发展起来的一种多道信号处理方法,它可以较好地分离出隐含在混合信号中的独立信源信号。SAR图像和各类遥感图像一样存在混合像元问题,而且SAR图像中也存在着相干斑噪声,图像内目标检测出现误检和漏检的概率较大,从而使得图像解译不明确,图像分类精度降低[5]。
将独立成分分析应用到SAR数据进行混合像元分解和相干斑抑制,在有效抑制噪声的同时,边缘纹理信息都得到了较好地保持。独立成分分析的基本过程如下:
首先对待测信号X进行预处理,包括零均值化(可以通过减去向量均值实现)和单位方差化,即使变换后的变量具有单位方差。ICA的基本问题是通过待测数据X估计混合矩阵A或未知独立源s。即
目前存在不同的方法来寻找混合矩阵A和未知独立源s,比较流行的是使用对比函数,特别是峰度(kurtosis)kurt(v)作为其非高斯的量度,寻找未知值。对一随机变量v,峰度为
式中:E{·}表示期望,白化原始数据X,可以由经典PCA得到,即v=D-1/2ETx,E是原始数据的特征向量,D为特征值的对角矩阵。然后初始化一随机变量点v接着迭代处理以得到一变换矩阵W=[w1w2…wn],w可以这样迭代
1.3 构造独立主分量差异图像
前面对两时相图像分别做独立成分变换后,需要对独立分量图像进行差异分析。常用的算术运算方法有差值法、比值法、对数-比值法,这里采用应用最广的遥感变化检测方法——图像差值法,它是将两时相主成分图像逐像元相减,从而生成一幅新的代表两时相间变化的差值图像。由于图像中不仅包含这光谱信息,还包含着丰富的空间信息,表现在特某个特定的空间邻域内所有像元具有相似的光谱信息。在后面的聚类分析中考虑空间邻域信息,可以有效避免误检,一定程度上消除了多时相图像配准的影响。本文利用3×3邻域信息(如图2),使在聚类中原本仅用一个像素值I(I,j)来表示一个样本改由原始像素值和3×3邻域像素值组成的样本集合X(i,j)
图2 3×3邻域
1.4 模糊C均值聚类
聚类作为一种非监督的学习方法,在不知样本类别的情况下,通过构建两个聚类把独立成分差异图划分成变化和未变化区域。由独立分量差异图像的直方图可以看出这两个聚类之间在特征空间存在一定重叠,因而如果使用单一阈值划分图像会出现较大误差。模糊聚类对分离有重叠类较为可行,因此用它检测这类变化信息是合适的。
模糊聚类的最大特点是不再强制将每个样本归入到某个具体的聚类中,而是计算每个样本对各个聚类的隶属度(membership)。(0≤uij≤1)表示样本i对聚类j的隶属度,且uij越大,样本i隶属聚类k的程度越高。
模糊聚类算法众多,本文采用最为经典的模糊C-均值聚类(Fuzzy C-means,FCM)算法,其目标函数为
式中:N 为样本数目,Vi为第 i个聚类中心,i=1,2,…,C。
FCM在计算每个聚类的质心的时候要考虑隶属度,同时每个样本不是直接归入某一个聚类。主要步骤为:
1)设有n个样本及k个聚类,初始化样本i与聚类j的隶属度 uij(1≤i≤n,1≤j≤k,0≤uij≤1,uik(0≤uij≤1)),得到隶属度矩阵 U=[uij]n×k。
算法中模糊参数m的选取对FCM的性能有重要影响,于剑从理论上给出了选取模糊参数的规则,指出模糊参数的选取理论上依赖于数据本身[7]。令
λmax(CX)是矩阵CX的最大特征值,通过对目标函数的推导,有如下规则:当λmax(CX)<0.5时,模糊参数要满足m≤(-2λmax(CX))-1;当λmax(CX)≥0.5时,可以根据经验选择m>1的值。
2 实验数据与分析
实验数据是在2007年4月12日和2007年7月26日由ESA Envisat卫星获取的A国和B国部分区域的ASAR图像(7 503×4 371)。本仿真实验选取此图像的一小区域(300×300)如图3a和3b所示。地面真实变化掩模是基于图3a和3b的人工分析所得,如图3c所示。
首先,使用遥感商业软件ENVI对同一地区不同时相的两幅SAR图像进行几何配准。采用ICA分别对两时相ASAR图像进行特征提取,得到图3d,3e所示的两个独立成分图像,图3f是独立成分图像差值后的直方图。结合参考图记录了检测出的变化像元数(True Positive,TP)和误检数(False Positive,FP),检测出的非变化像元数(True Negative,TN)和漏报的像元数(False Negative,FN)。分别计算了正确检测率(Detection Accuracy,DA)、变化类的错检率(False Detection Rate of Change Class,FDRC)和非变化类的错检率(False Detection Rate of Unchanged,FDRU)
表1给出了对原始图像且未加入邻域的FCM变化检测实验结果和本文方法的比较,对于FCM,收敛阈值定为0.000 000 1,模糊指数m取m=2。从表1可以看出经独立成分分析且加入邻域信息后提高了正确检测率,减少了变化类的错检率。图4显示了原始图像且未加入邻域的FCM变化检测二值化图和本文的变化检测二值化图,可以看出采用本文方法孤立点和离散不连通区域较图4a均减少,检测效果较为理想。
表1 原始图像且未考虑邻域的FCM变化检测和本文方法的比较
3 结论
本文通过对多时相SAR进行独立成分分析获取独立成分图像,减少了混合像元和抑制了相干斑噪声。采用模糊聚类分析可以克服变化检测受统计模型的影响,而且为了避免误检和漏检,考虑了空间邻域信息,从而达到更为满意的检测结果。但也存在一些问题,如非变化像元检测率较原图和未考虑邻域时有所降低,有待进一步研究。
[1] BRUZZONE L,SERPICO S B.An iterative technique for the detection of land-cover transitions in multitemporal remote-sensing images[J].IEEE Trans.Geosci.Remote Sensing,1997,35(7):858-867.
[2] BOVOLO F,BRUZZONE L.A split-based approach to unsupervised change detection in large size multitemporal images:application to Tsunami-damage assessment[J].IEEE Trans.Geosci.Remote Sens.,2007,45(6):1658-1671.
[3]RADKE R J,ANDRA S,AL-KOFAHI O,et al.Image change detection algorithms:a systematic survey[J].IEEE Trans.Image Process.,2005,14(3):294-307.
[4]GHOSH S,MISHRA N S,GHOSH A.Unsupervised change detection of remotely sensed images using fuzzy clustering[C]//Seventh International Conference on Advances in Pattern Recognition. [S.l.]:IEEE Press,2009:385-388.
[5]曹恒智,余先川,张立保.基于SL-ICA算法的SAR图像混合像元分解[J]. 遥感学报,2009,2(7):217-223.
[7]于剑.论模糊C均值算法的模糊指标[J].计算机学报,2003,26(8):968-973.