基于eCognition 的水体提取研究

2020-10-09林荣清王延正刘晓恒

科技与创新 2020年19期

林荣清，王延正，刘晓恒

（1.兴义市自然资源局，贵州黔西南布依族苗族自治州562400；2.北京图源科技有限公司，北京100082）

随着遥感技术的进步，遥感影像的分辨率已达到分米级，影像上的地物信息更加丰富，各种地物在影像上显示更加清晰，同物异谱[1]和同谱异物[2]的现象也更加明显。在高分辨率影像上，河流、湖泊、沟渠、建筑物阴影等光谱信息十分相似，属于同谱异物，采用基于像素的分类方法难以将其区分开，并且椒盐现象[3]严重，分类精度较低。

为了增强高分辨率影像的分类效果，一些研究者提出了基于面向对象[4-6]的分类方法，这种方法可以很好地结合地物的光谱信息、形状大小、纹理信息、上下文关系、空间信息进行分类提取，可以有效地避免椒盐现象，很大程度上提高了分类精度。赖俊玮[7]基于面向对象的思想对赣州市开发区城市道路进行了提取研究，周亦等人[8]基于GF-1 对内蒙古自治区包头市石拐区和江苏省徐州市贾汪区进行了土地利用现状解译，龚林松等人[9]利用SLIC 和OTSU 方法对水体进行了提取研究，龚文峰等人[10]基于国产GF-2 对界河水体进行了分类。以上研究都是基于面向对象的分类方法对道路、水体进行提取时，其分类精度都比较高，但是在水体的细分方面，相关研究较少，特别是针对河网纵横的江南水乡地区，如何准确地提取河流、湖泊、沟渠成为研究重点。

1 研究区概况与遥感数据来源

本文的实验数据为高分2 号遥感影像，其全色影像的分辨率为1 m，多光谱影像的分辨率为4 m，包括蓝、绿、红、近红外四个波段，成像时间为2018-05-03。选取的研究区域位于江苏省兴化市安丰镇，安丰镇位于江苏省中部，水资源丰富，塘港河、靖盐河、海沟河在境内纵横交汇，水网交错，该地区主要是以养殖水产品为生，境内池塘、沟渠众多，大小河流穿越其中。本文的主要目的是提取研究区的所有水体，并将其分类为河流、池塘、沟渠。研究区遥感影像数据（假彩色合成）如图1 所示。

2 研究方法及过程

面向对象的分类方法是在遥感技术不断进步的过程中衍生的，在影像数据的分析中具有强大的优势，它可以模拟人脑的认知对影像数据进行提取，充分利用地物的几何特征、纹理特征、颜色、光谱信息、空间信息以及上下文的关系[11]。本文选择eCognition 9.4 软件作为技术平台开展水体提取研究，eCognition[12]软件是全球所有商用遥感软件中第一款提出面向对象思想的软件，在eCognition Developer 界面中可以基于研究区中的一部分地物丰富的区域创建规则集，然后将规则集应用在整个研究区，对大面积的研究区可以采用批处理的方式，进而提高了工作效率。本文使用eCognition 软件中的阈值分类方法[13]对水体进行分类，主要流程包括影像分割和水体提取。

2.1 影像分割

面向对象分类中最重要的一步就是影像分割，需要将遥感影像分割为大小合适的对象，才可以进行分类，分割的效果会直接影响到后续的水体提取，因此需要根据研究区的特征以及提取的水体特征选择合适的分割参数进行分割；本文采用eCognition 软件中的多尺度分割[14]（multiresolution segmentation）方法进行分割，多尺度分割中的主要参数有尺度参数、形状因子、紧致度因子以及各波段参与分割的权重，分割参数的选取至关重要，直接影响分割对象的大小和形状。当分割尺度Scale为20 时，分割对象过于细致，不利于水体提取；当Scale=60 时，分割对象过大，没有将水体与其他地物分割开。经过多次试验后，得知当Scale=40，shape=0.2，compactness=0.7，近红外波段的权重设定为2，其余波段的权重设定为1 时，可以得到较好的分割效果。分割结果如图2 所示。

图2 不同分割尺度结果对比

2.2 水体提取

分割后的遥感影像中每一个对象都具有独特的光谱信息、几何形状特征、纹理特征、空间位置特征。对于水体的提取，可根据近红外波段的光谱信息或者使用归一化水体指数NDWI就可以将所有的水体提取出来，但是要将水体进行细分，单靠光谱信息和NDWI值是难以区分的。本文旨在提取河流、池塘、沟渠，需要依据对象的光谱信息、几何形状特征以及上下文关系特征进行分类。在水体的提取过程中，结合式（1），在layer arithmetics 算法中计算NDWI值，当NDWI≥0.33 时，可以将研究区内的所有的水体提取出来，局部结果如图3 所示。

研究区内河流纵横交汇，养殖水产的池塘众多，大小沟渠密布。通过仔细观察，发现河流的水体颜色比较均匀，整体面积较大，长度和宽度相差较大，池塘形状接近矩形，分布在田野之间，沟渠大多是环形，宽度较小，分布在农田的周围，将农田包裹其中。

图3 水体提取结果（局部）

根据以上特征，利用eCognition 中的Rel.border.to、Density、Shape index、Rectangular fit、Area 等特征，通过多次试验，选择合适的阈值创建了科学、合理、高效的分类规则集。

Rel.border.to 是用来确定对象与相邻的另外一个类的对象之间公共边占比的特征，它描述了图像对象的公共边长度与周长的比值，例如，当Rel.border.to water=1 时，则表示该对象被水体这个类别的对象完全包围，Rel.border.to water=0 时，则表示该对象与水体对象不相邻：

式（2）中：w为类别名称；L（v，u）为v对象与w类中的u对象的公共边长；Nv（d，m）是指v对象相邻的所有对象，bv是指v对象的周长。

Density 参数描述了对象的像素在空间中的分布情况。在eCognition Developer 中，最“密集”的形状是正方形，对象形状越细越长，其密度就越低，密度的计算公式如下：

式（3）中：#Pv为对象v中包含的像素；VarX为X方向的方差；VarY为Y方向的方差。

Shape index 形状指数是对整体形状复杂性的一种度量，对于紧凑的对象（如正方形或近似正方形），其形状指数值为1，对于形状不规则的对象，形状指数值则无限制地增加。

式（4）中：bv为对象v的周长。

Rectangular fit 矩形拟合度是指研究对象与形状大小相似的矩形的匹配情况，值为0 时说明不匹配，值为1 时说明完全匹配，计算公式如下：

式（5）中：ρv（x，y）为像素（x，y）处的椭圆距离。

水体提取结果如图4 所示。

图4 水体提取结果

3 与监督分类的对比

监督分类方法[15]是以创建统计识别函数为依据，选择具有代表性的样本训练，然后基于以上样本进行分类的方法。即根据选定的训练区中具有代表性的样本数据，选取特征函数，训练统计出特征参数作为分类依据，建立判别函数以对各待分类影像进行遥感解译。

本文使用ENVI5.3 中的最大似然法[16]对研究区进行监督分类，在研究区内对河流、池塘、沟渠等类别选取样本，在各类别的样本都满足可分离性[15]的情况，得到如图5 所示的分类结果。两种分类结果局部放大图如图6 所示。

图5 监督分类结果

图6 两种分类结果局部放大图

对比阈值分类和监督分类的结果可知，阈值分类的效果是最好的，总体精度为96.28%，满足基本分类要求，而监督分类的总体精度为73.67%，在水体细分上，不能满足基本分类要求。总体上来看，在水体的提取上，两种方法都可以满足精度要求，研究区内的水体几乎都被提取出来，但是在将水体细分为河流、池塘、沟渠的时候，监督分类明显不能满足精度要求，椒盐现象比较明显，三种类别相互交融在一起，比较细长的河流与沟渠没有区分开，只有比较宽阔的河流被提取为河流，其余的河流都被分为沟渠；在阈值分类中则不存在椒盐现象，河流、沟渠、池塘几乎都被依据其几何形状特征区分开了。

阈值分类结果的精度评价如表1 所示。

表1 阈值分类结果的精度评价

监督分类结果的精度评价如表2 所示。

表2 监督分类结果的精度评价

4 结果与分析

本文以江苏省泰州市安丰镇的部分区域为研究区，利用eCognition 9.4 软件中基于面向对象的阈值分类方法，对研究区内的高分二号影像数据进行了遥感解译，提取了河流、池塘和沟渠，并与传统的基于像元的监督分类进行对比，发现两种方法都可以将研究区内的水体提取出来，但在细分时，基于面向对象的分类方法明显比监督分类的分类效果好很多，其分类的总体精度为96.28%，kappa系数为0.93，整体上满足精度要求，并且不存在椒盐现象；而传统的监督分类方法的分类精度才73.67%，kappa系数为0.55，不能满足基本的分类精度要求。可见，面向对象的分类方法能够充分利用高分辨率遥感影像中的光谱信息、几何形状、空间信息等自动提取地物，随着遥感技术的发展，面向对象的分类方法将会逐渐取代基于像素的分类方法。