基于SLIC的哨兵1号雷达数据水体信息提取
2020-06-09湛南渝,李小涛,路京选,许文波
湛 南 渝,李 小 涛,路 京 选,许 文 波
(1.电子科技大学 资源与环境学院,四川 成都 611731; 2.中国水利水电科学研究院,北京 100038)
星载合成孔径雷达(Synthetic Aperture Radar,SAR)因具有全天时、全天候、大覆盖面积、高分辨率、成像不受云雾影像等特点,被广泛应用于农业、海洋、灾害监测和军事领域。
在SAR图像中,由于镜面反射的物理特性,水体的后向散射系数较低。SAR图像固有的斑点噪声以及波浪和植被反射的影响,使得水体表面出现一定程度的明暗变化。山区阴影和城市建筑物阴影,呈现出跟水体一样的低后向散射系数,这些干扰信息给水体的精确提取造成了较大的困难[1]。
目前常用于SAR图像水体信息提取的方法是基于阈值的分割方法[2-3],其中Otsu阈值法[4-7]最为常见,该方法具有简单快速的优点,但对于复杂的影像,纯粹的单阈值法提取效果并不好,因此如何自动确定合适的阈值一直是一个难题。监督分类方法[8-9]是另外一种提取SAR图像水体信息的方法,但该方法需要手动选择训练样本、较复杂,提取精度与训练样本和分类算法密切相关。
SLIC(Simple Linear Iterative Cluster)[10]算法根据色彩和距离相似程度对图像进行分割,具有耗时短,生成的超像素块大小均匀、轮廓规则等特点,被广泛应用在彩色图像、光学遥感图像分割中。本文针对Sentinel-1 SAR图像的波段特征,简化了SLIC[11]应用于SAR图像分割,并对分割的后超像素块进行分层区域合并,然后通过二值化得到水体信息。
1 SAR图像SLIC超像素分割
1.1 SLIC超像素分割算法
SLIC以颜色和距离特征对图像进行聚类,首先将图像的颜色空间由RGB转为LAB,将LAB色彩空间的3个分量和距离x,y组成5维特征向量,然后使用K-Means按照一定的空间度量对图像进行聚类,生成一个个大小较为均匀的超像素,该算法时间复杂度为O(N)(N为图像的像素个数),计算效率较高。SLIC算法步骤如下[12]。
(2)调整种子点位置。为了避免将初始种子点定位落在物体边缘上,以及防止初始种子点落在噪声上,计算初始种子点n×n邻域(一般n=3)的梯度值,调整初始种子点的位置为其梯度最小值所处位置,并为每一个初始种子点赋上不同的标签。
(3)计算距离度量。计算每个像素点pi与距离其最近的种子点qk的距离,距离度量由颜色距离和空间距离组成,计算公式如下:
(1)
(2)
(3)
式中,dc为在LAB颜色空间的欧式距离;ds为在x,y空间上的欧式距离;D为像素点与种子点的总距离,D越小,说明像素点与该种子点之间越相似;m为紧凑度因子,用来调整颜色信息和距离信息的相对重要程度,对于LAB颜色空间来说,一般m=[1,40];S为种子点之间的距离。
(4)局部迭代聚类。为了增加算法的运算效率,SLIC在对每一个种子点聚类时,将算法的计算范围限制在了2S×2S的邻域范围内。在范围内计算所有种子点的距离,如果该点的距离小于之前计算的距离,则认为该点在这个超像素中,并对该点的标签值和距离值重新赋值。重复迭代(1)~(4)步骤,直到误差收敛到某一阈值或者最大的迭代次数后,停止计算。实验中发现,在多数情况下,10次迭代对于绝大多数影像都能取得比较好的分割效果。
(5)增强连通性。经过上述步骤后,会出现多连通、超像素尺寸过小、单个超像素被切割成多个不连续超像素等情况,需通过增强连通性来解决此问题。主要思路为:新建一张标记表,表内元素均为-1,按照“Z”型走向将面积小于理想超像素一半大小的超像素重新分配给邻近的超像素,同时赋予相应的标签,直到所有点遍历完成。
1.2 基于SAR的超像素分割算法
传统的SLIC超像素分割方法基于彩色图像RGB,虽然理论上可以把RGB 3个波段都赋值为灰度信息,但由于运算时将RGB颜色空间转LAB颜色空间并不适用,因此本文采用灰度信息替代彩色信息的[13]。简化后的算式如下:
(4)
(5)
式中,dgray为在灰度颜色空间的欧式距离;D为像素点与种子点的总距离。
1.3 区域合并
由于SLIC只是把相似的块进行了聚类,并不能直接将图像进行二分化,所以可以先根据一定合并规则逐步将相似度较高的块进行合并,从而只剩下相似度差值较大的区域,再使用阈值分割实现水体信息的提取。常采用的方法是层次区域合并(Hierarchical Stepwise Region Merging,HSRM)[14],它基于区域邻接图(Region Adjacency Graph,RAG)进行区域合并,用相似度来判断两个邻近区域是否融合。区域就是初始分割后,属于同一标记的像素集合。K个区域的RAG表示为G=(V,E),其中顶点集V=1,2,…,K,对应的边集合E⊂V×V。每个顶点节点代表一个区域,边表示和邻近区域相连,边权重就是两个区域之间的相似度,如图1所示。
相似度的计算公式为
(6)
计算所有区域之间的相似度,找到RAG的边集合中最相似的边(Cij最小),融合最相似边对应的两个区域的顶点,得到K-1的RAG,更新顶点和边集合,直到最小的相似度大于一个阈值,停止合并。
图1 区域邻接示意
2 实验结果与分析
2.1 数据源与研究区域
Sentinel-1号卫星是欧空局发射的第一个哥白尼计划卫星,由A、B两颗卫星组成,两个卫星的组合,可以达到每6 d对同一地点进行影像获取。其中C波段卫星,有4种成像模式:超精细模式(Strip Map Mode,SM)、干涉宽幅模式(Interferometric Wide Swath,IW)、超宽幅模式(Extra-Wide Swath Mode,EW)、微波模式(Wave-Mode,Wave)。对地球陆地进行覆盖的主要为IW模式,SM模式主要用于应急事件,EW和Wave模式主要用于海洋监测。Sentinel-1号卫星数据可以免费获取,IW模式的宽幅为250 km,分辨率为5m×20 m,从卫星拍摄到数据分发至数据库只要3~6 h左右,对地观测能够穿透云雾,不受天气影像,这些特性使其非常适合应用于洪涝灾害遥感监测。
为了验证方法的有效性,基于2018年7月29日Sentinel-1A GRDH的IW的影像,选择了湘江湖南省段的4个实验区域进行水体信息提取,这4个区域的水体占比依次降低。并用同一天的光学影像Landsat8提取的水体作为真实水体进行精度评估。
2.2 超像素分割参数分析
在超像素分割算法中,参数的设置对于超像素的分割效果起着十分重要的作用,参数主要有两个:超像素个数K和紧凑度因子m。紧凑度因子主要用于调节距离信息和颜色信息的相对重要程度,对于灰度值为0~255 RGB的影像而言,m一般取值为[1,40]。为探究紧凑度因子对分割的影响,采用固定超像素个数,改变紧凑度因子的方式。当m太小时,分割就会失败;当m太大时,颜色信息占比很小,距离基本由空间距离决定,图像会被分割成均匀的方块,结果如图2所示。
图2 不同紧凑度因子对于超像素分割的影响
根据超像素分割的原理,超像素的个数由超像素的边长N决定,通过分层区域合并,使用阈值二值化,得到最终水体提取结果。不同边长N对应的水体信息提取结果见图3。
图3 不同超像素边长提取结果
从图3中可以看出,分割出的水域面积主要取决于分割目标的大小,也就是超像素的数量。由于小于这个面积的超像素块在增强联通性的时候被合并,所以理论上能提出来的水域大于超像素大小一半以上的水体。即当边长较大时,可以提出大面积的水域,当边长较小时,可以提出细小的水体和河流,但分割时间会增加。所以对于不同分辨率的影像和不同的分割目标,应设置不同的超像素边长。
考虑sentinel-1中的水体显示特征和效率的因素,本文的参数设置为:超像素的边长N=10,m=10。
2.3 与Otsu阈值法对比
为了验证本方法的有效性,选择了4个水体占比依次减少的实验区域,将本方法的提取效果与Otsu阈值法的提取效果进行对比分析,结果如图4~7所示。
图4 区域1水体信息提取结果及灰度直方图
区域1为宽河道水体,水域面积占比约为12%,此时图像直方图显示为显著的双峰特性,两种方法在主河道的提取效果上均很好,Otsu方法提取出了细小的水体,本文提出的方法提取结果比较纯净,提取的准确率高于Otsu阈值法。
图5 区域2水体信息提取结果及灰度直方图
区域2为宽河道与细小河道并存,此时水体占比约为7%,此时直方图仍具有相对显著的双峰特性,两种方法在主要的河道的提取效果上均保持不错,但Otsu阈值法仍存在较多的误提区域,提取的准确率相对较低。
图6 区域3水体信息提取结果及灰度直方图
图7 区域4水体信息提取结果及灰度直方图
区域3和区域4均为蜿蜒的细小河道,水体占比约为3%和2%,此时直方图中双峰特性不显著,Otsu阈值法的提取效果非常差,误提现象十分严重,而本文方法则仍能提取出大部分水体,保证了河道的完整性。
综上所述,当图像水域面积占比较大时,图像具有明显双峰特性,两种方法的水体提取效果均不错,但当水体占比较少时,双峰特性不显著,甚至呈现单峰特性,Otsu水体提取效果很差。而本文提出的算法由于同时考虑了距离和色彩信息,在提取之前先对水域聚类,在合并时能使得联通的水体得到保留,所以仍能提取出大部分水体。因此本文方法在水体提取的稳定性上强于Otsu阈值法。
2.4 精度评估与分析
将本文方法和Otsu阈值法提取的水体范围和同一时间landsat8确定水体范围进行比较,采用查全率和查准率以及综合评价指标来评估其精度。查全率R、查准率P以及综合评价指标F1定义为
(7)
(8)
(9)
如表1所示,Otsu算法在4个区域中的查全率都比较高,但这源于它提取了大量的错误水体,尤其是在区域3和区域4水体占比较小的情况下,准确率相当的低。而本文算法则在查准率上全面优于Otsu算法,综合性能也强于Otsu算法。当图像中水体占比较少,河道较窄时,双峰特性不明显,此时Otsu基本不能识别水体,但本文的方法仍能识别出大部分河道,说明本文方法有很好的鲁棒性。
表1 不同方法水体提取精度对比
3 实例应用
洪水监测是水体提取的一个重要应用[15-16]。以2019年7月份株洲的洪水监测为例,验证本文提出方法的有效性。
基于Sentinel-1A雷达影像,对受灾较为严重的湘江和渌水的交汇地段进行动态监测数据如表2所示。
表2 监测数据情况
监测结果如图8~10所示。监测结果显示,2019年7月12日监测区域内湘江和渌水沿岸受灾严重,监测范围内,淹没面积达到10.06 km2;到7月19日,沿岸洪水基本全部退去,河道恢复正常。
图8 株洲洪水前后水体信息提取情况
图9 株洲灾前灾中对比
图10 株洲灾中灾后对比
4 结 语
本文基于Sentinel-1A SAR数据,提出了采用简化的超像素分割方法SLIC先对图像进行分割,再用分层区域合并准备对图像进行合并,最后进行二值化得到水体信息的方法。并与Otsu阈值法水体信息提取进行了对比,结果表明,在水域面积占比较高和较低的场景中,本文提出的方法在综合性能上都高于Otsu方法,能够较好地提取出水体信息。同时以2019年7月份株洲洪水为例进行了实例应用,得到了较好的监测结果,验证了本方法的适用性。