高分辨率遥感影像居民地提取方法研究
2022-08-19迟璐
迟 璐
(吉林水利电力职业学院 吉林 长春 130000)
0 引言
居民地通常由密集的建筑物群组成,具有明显的影像特征,对居民地进行提取,有利于对地区进行规划,进一步促进地区发展。
目前居民地的提取方法主要是利用影像的光谱特征构建各种建筑指数提取,或利用光谱特征进行样本的快速选取等方面[1-2]。然而单纯基于光谱特征的居民地信息提取易受混合像元、同物异谱和异物同谱现象的困扰,存在严重的“椒盐现象”[3]。随着面向对象方法的广泛应用,使综合应用遥感图像的光谱特征和几何特征进行居民地提取的方法成为可能[4-5]。
1 居民地相关概念
1.1 居民地
居民地是人类因生产和生活需要而集聚定居的场所。居民地主要分为城市居民地和农村居民地。居民地体现着人与自然关系,其规模不仅能够影响生产力的分布模式,也能影响区域经济发展[6]。居民地这一地物是随着时间发展逐步形成的,是人与自然相互作用的产物。居民地不仅涵盖房屋建筑物,还包括与居住直接相关的其他生活设施和生产设施。
1.2 居民地影像特点
高分辨率遥感影像中,居民地分布有其自身特点,主要表现在以下几个方面。
(1)城市居民地聚集,农村居民地分散。城市居民地往往较为集中,多为小区式分布。而农村面积较大,并且农村存在养殖、种植等需求,因此农村居民地分布比较分散,无固定结构,边界不明显。
(2)沿道路分布。居民地主要沿道路分布,分布在道路一侧或者末端,通常避开高山等地形险峻地区,随机分布在海拔较低的地方。这种分布规律既受历史发展影响,同时也是社会经济发展的结果。
(3)与道路等光谱特征相近。高分辨率遥感影像中,房屋建筑的颜色多为亮白色、蓝色、红色等。居民地建筑物大多为高亮地物,这就与道路有相近的光谱特征。
2 基于遥感影像的居民地提取方法
高分辨率遥感影像通常所含波段较少,光谱信息不足,但是空间特征信息丰富,因此影像提取时更多要依靠其丰富的纹理信息、颜色信息、形状信息以及地物间的相互关系等进行区分。传统的影像分类方法一般是将单个像元作为分类对象,根据像元的光谱特性进行分类。这种分类方式没有充分考虑像元与周围环境之间的关系,因此容易产生“椒盐现象”,分类效果不好,精度不高。面向对象的分类方法是把具有相同特征结构的多个像元视作一个对象,根据每一个对象特征再进行分类[7]。面向对象的分类方法可以有效提取影像信息,在分割过程中,通过产生新的影像信息快速提取不同类别地物,分类结果更合理,分类精度更好。本文基于eCognition 软件平台进行居民地提取工作,该平台就是采用面向对象的分类方法。
居民地提取主要分为影像分割以及影像分类两个步骤,两者间具有密不可分的关系。影像分割是影像分类的前提,影响影像信息提取与应用精度;影像分类则是影像分割的结果,可以评价影像分割好坏[8]。两者相辅相成,相互促进,协同配合完成居民地提取工作。
2.1 多尺度影像分割方法
影像分割是遥感影像处理中较为重要的环节,从影像处理过渡到图像分析。影像分割就是将整个图像分割成若干个小部分,并且这些部分彼此互不重叠,各个部分具有相同或相近的某种特征。影像分割算法准确与否直接影响后续分类工作,好的分割结果有助于后续工作,反之,不准确的分割结果则会影响后续分类效果[9]。
在eCognition 软件中,提供了3 种常用分割算法:多尺度分割算法、四叉树分割算法以及棋盘分割算法。图1 是以相同分割尺度大小进行的对比实验。通过3 种方法对比实验能够看出,四叉树分割算法(图1a)和棋盘分割算法(图1b)容易导致单个影像对象被割裂为多个对象,而多尺度分割算法(图1c)则具有明显优势,分割对象形状、大小不受限制。因此本文影像分割方法采用多尺度影像分割方法。
高分辨率遥感影像中,地物光谱信息十分丰富,具有丰富的结构、纹理、空间特征等信息。例如道路呈线状分布,而居民地往往呈片状分布。因此设置同一尺度分割不能同时满足各类地物的提取要求。多尺度分割算法就是根据一定的影像特征,如形状特征、光谱特征、纹理特征等,将具有相同或相似特征的像素合并,形成互不重叠的影像对象,通过改变分割尺寸参数改变分割结果。这种算法分割后影像对象大小不一,形状也各不相同,能够较好地分割和提取具有相同或相似特征的目标地物,提取准确度较高,分类结果也更加客观。
多尺度分割中有3 个重要参数,见图2,分别为波段权重、尺度因子以及异质性因子。异质性因子又包含光谱异质性因子和形状异质性因子两部分,形状异质性因子又分为紧实度因子和光滑度因子,紧实度因子是根据较小的差别把紧凑和不紧凑的目标分开,光滑度因子是用来完善具有光滑边界的地物。在进行多尺度影像分割时,要综合考虑不同因子间的关系,以便获得最佳分割效果。
波段权重以及尺度因子是通过软件平台进行设定,下面详细介绍异质性因子。
2.1.1 光谱异质性因子(hcolor)
式1 中,N为影像层数(即:光谱波段数);pi为第i影像层的权重;σi为第i层影像光谱值标准差。
2.1.2 形状异质性因子(hshape)
式2 中,ws为自定义光滑度因子hsmth权重,并且0 ≤ws≤1。
2.1.3 光滑度因子(hsmth)
式3 中,E为影像区域实际边界长度,即周长;L为影像区域最小外接矩形周长。
2.1.4 紧实度因子(hcmpt)
式4 中,S为影像区域像元面积。
2.2 多尺度分割算法参数设定
2.2.1 波段权重选择
影像分割过程中,应该根据影像分割目的、特点等合理地为波段数据设置权重,以便获得较理想的分割结果。波段权重设定主要取决于该波段对影像分析处理影响程度,如果影像波段易于识别目标地物,那该波段的权重就应较高。本文采用融合后的真彩色影像,3 个波段对目标地物贡献程度基本相同,所以3 个波段权重均为1。
2.2.2 分割尺度选择
遥感影像中地物多样性决定了影像分割需要的尺度也各不相同。影像分割中,分割终止条件是通过比较尺度参数与异质性的大小,进而决定了影像对象的大小及其特征。较大的分割尺度分解得到的影像对象数目较少,适用于连续分布的大面积同类地物分割;较小的分割尺度分解得到的影像对象数目较多,适用于提取小面积地物。影像分割过程中,并不是分割尺度越小分割效果一定越好,这是由于影像对象层的增加会使处理数据量大大增加,减慢影像处理速度。多尺度分割中所生成对象的数量取决于相关分割尺度参数选择,因此在进行影像分割时要根据提取地物特征多次进行尝试,在影像提取质量和影像提取速度间进行衡量对比,从而选择最佳的分割尺度。
首先选取一块居民地较多的影像作为参数试验区,试验区影像大小为1 400×1 400。基于eCognition 软件平台进行最佳分割尺度参数的选取,分割尺度分别设定为30、50、70、90、110 和130。通过图3 可以看出,随着分割尺度不断增加,分割后影像对象面积也在不断增大。
最佳分割尺度的确定方法主要分为定性分析法和定量分析法。定性分析法主要是凭借大量先验知识以及丰富的影像分割经验确定最佳分割尺度,具有一定主观性;定量分析法主要是将影像分割结果与通过其他方式获得的精确分类结果进行对比,从而确定最佳分割尺度。显然定量分析法结果更加精准,本文采用这种定量分析法确定最佳分割尺度。高分辨率遥感影像中使用频率最高的精度评价指标为正确率。具体计算方法如下:
分割算法分割出的目标地物面积获取方式需要将影像分割结果以矢量图层形式输出,并利用ArcGIS 软件计算不同分割尺度下获得的居民地数据面积;正确居民地面积则需要利用ArcGIS 软件以人机交互的方式获取。不同分割尺度正确率、总对象数以及居民地对象数等结果见表1。
表1 分割结果精度
将不同分割尺度下的正确率、总对象数以及居民地对象数以折线图的方式进行展示,关系见图4。
通过图4 可以看出,随着分割尺度不断增大,居民地分割正确率不断降低。分割尺度为30、50、70 和90 时,分割正确率都超过90%,此后分割尺度增大至110和130时,分割正确率较低且正确率下降较快。当分割尺度为30 时,分割正确率高达97.58%,分割尺度为50 和70 时,正确率相差不到0.1%。综合考虑本文最佳分割尺度设定为70,这个分割尺度既能保证影像分割正确性,又能产生较少分割对象,提高运算速度。
2.2.3 异质性因子选择
异质性因子中的光谱异质性因子和形状异质性因子是权重和为1 的两个因子,形状异质性因子中的紧实度因子和光滑度因子也是权重和为1 的两个因子。影像色彩是影像中最重要的信息,是表征影像的本质特征,是建立其他特征的基础,因此一般情况下将光谱异质性因子设置较大,通常大于0.8[10]。处理影像时一般需要多次尝试,将所生成的影像对象层与实际地物进行比较,力求能够真实客观地反映实际地物信息。经过多次实验以及参考相关资料,本文将光谱因子、形状因子、紧实度因子、光滑度因子分别设定为 0.9、0.1、0.5、0.5。
2.3 隶属度函数分类方法
实际影像中地物之间的过渡区域往往是渐变的,有限的影像分辨率使得地物之间出现类混合现象,因此往往不能准确地找到各类地物之间的特征值分界点,因此提出了隶属度函数的分类方法。
隶属函数分类法不是将影像对象直接划分至某个类别中,而是利用影像对象特征指标将其隶属到不同类别中去,同一影像对象可以被隶属至不止一个类别中,隶属度区间为0 到1,越接近1,说明隶属度越高,划分为该类的可能性就越大,反之接近0,则说明隶属度低,划分为该类的可能性就越小。eCognition 平台通过评估对象每个类的隶属度,也就是不同特征指标的隶属度,并通过逻辑运算组合进行类赋值计算,最终将影像对象划分到相应类别中。
2.4 隶属度函数分类法中常用特征指标
高分辨率遥感影像中居民地表现为面状地物,一般为规则形状的多边形,呈聚集分布。居民地周围通常有道路、水泥地及绿色植物分布,受到较高树木遮挡影响概率较小。但是居民地与道路的光谱值较为接近,均为高亮地物,仅仅根据其光谱特征很难将其与道路区分。居民地与道路的几何特征有较大差异,他们的长度、宽度等特征都呈现出不同特点。因此根据居民地特点,最终确定的特征指标有图层平均值、亮度、形状指数、长宽比、纹理特征等。
式6 中,ci为第i个像元的图层值;W为对象像元总数。
2.4.2 亮度(Bm)
式7 中,N为波段的总段数。
2.4.3 形状指数(Sm)
式8中,E为地物边界长度,在不考虑地理参考数据时,单个像素的边缘长度为1;Si为第i个像元的面积。形状指数用于描述影像对象边界的光滑程度,形状指数越大,地物对象越狭长,正方形地物的形状指数为1。
2.4.4 长宽比(Rm)
式9 中,l 影像对象的长度;w为影像对象的宽度;eig1(S)对象特征矩阵S中较大特征值;eig2(S)为对象特征矩阵S中较小特征值。
2.4.5 纹理特征(Hom)
式10 中,m表示灰度共生矩阵的行数;n表示灰度共生矩阵的列数;p(i,j)表示矩阵中位置(i,j)的规划值[11]。纹理特征主要是反映图像灰度分布平滑性的量度,纹理特征越大,在图像上表现为亮区,反之在图像上表现为暗区。
2.5 分类精度评价
本文选取彰武县兴隆山乡作为研究区域进行居民地数据的提取。影像数据为融合后的真彩色影像,影像来源为航空影像,分辨率为0.2 m。每个航空影像数据均为一景影像,因此需要进行影像预处理,包括:影像镶嵌、配准、裁剪。如图5 所示,为预处理后的影像。
影像预处理后,通过上文中介绍的相关参数设定方法进行研究区域影像分类。本文将研究区分类结果确定为两大类,居民地以及其他。其他类别中包括河流、道路、草地、林地等地物。样本选取过程中,要保证样本具有代表性,每一类地物都要有所涉及,尤其是其他类别中的不同地物都要进行选取。分类过后将分类结果以矢量数据格式导出进行可视化展示,图6 为分类后的结果。
影像分类过后的精度评价工作是至关重要的,通过精度评定能够进一步确定分类方法以及参数设定是否合理。在精度评价过程中,首先通过目视解译判断分类是否合理,其次通过混淆矩阵进行评价。从混淆矩阵中可以得到每个类别的精度和Kappa系数。从表2 中可看出,各类地物的生产精度和用户精度都较高,总体精度达到94.6%,kappa系数为0.892。
表2 精度评价
3 居民地提取后处理方法及成果展示
3.1 居民地提取后处理方法
通过遥感影像提取得到的居民地数据中仍然存在一些问题,例如个别居民地面积过小,居民地提取结果较为破碎,因此还需要进行数据后处理。居民地数据后处理主要分为两大步骤:一是制图综合,二是增加居民地区划属性字段。具体处理流程以及方法见图7。
制图综合是为了处理部分居民地过小以及居民地整体分布较为分散问题。其实在影像分类过程中,已经通过影像融合方法将相邻的同类对象进行融合操作,但是该方法无法处理有一定距离的同类地物,例如两个相邻居民地间有一块面积较小的草地,就无法将这两个居民地进行融合,因此需要进行制图综合处理。首先利用ArcGIS 中计算几何功能,删除掉面积小于500 m2的居民地,同时结合现有居民地点位数据,删除距离居民地点位过远并且明显不是居民地的数据。然后对居民地进行聚合面处理,聚合距离设定为20 m,以便将存在一定距离的居民地数据合并。图8 为制图综合前后对比图。
通过影像提取的居民地面状数据是没有属性信息的,不利于进行分析与识别。如图8 所示,采用空间连接方式获取,需要增加“所在乡镇”“所在行政村”及“所在村民组”字段,字段类型均为文本,以便用于后续相关分析。将居民地数据与区划面状区划数据进行空间连接,补充对应属性信息。
3.2 居民地提取成果展示
图9 为处理后的兴隆山乡居民地提取结果。从图中可以看出居民地大多分布在居民点附近,并且多为聚集分布,符合实际居民地分布规律。
4 结语
本文在分析了居民地的影像特点后介绍了基于高分影像数据进行居民地提取及后处理,充分展示了该方法应用于高分辨率遥感影像居民地提取的独特优势,为高精度专题信息的快速提取提供了新的思路。同时提取到的居民地数据可进一步结合相关数据进行统计、分析,为政府决策提供依据。