基于高光谱数据的黄河流域水体提取方法研究
2022-12-21杨娅婷王文龙
杨 阳,韩 芬,杨娅婷,王文龙
(1.宁夏回族自治区遥感调查院,宁夏 银川 750021;2.高分辨率对地观测系统宁夏数据与应用中心,宁夏 银川 750021)
1 引言
随着高光谱遥感信息技术的快速发展,利用高光谱影像对水资源信息实现精准的识别与提取,对水体保护、水利规划、灾后评估和水体流域治理等水资源合理开发利用有着重要的意义[1~4]。通过利用遥感技术准确快速地获取黄河水体动态信息[5],对黄河流域水环境健康进行诊断,可为黄河流域水环境综合治理与保护提供数据基础和科学依据。
目前,国内研究者在水体信息提取的研究上积累了大量经验,数据源的应用日趋多样,各类研究方法的运用也更加成熟。高光谱卫星影像具有较高的光谱分辨率,与多光谱遥感数据不同,高光谱遥感能够获取地表物体上百个连续谱段的信息,提供丰富的光谱信息来增强对地物的区分能力[6]。高光谱遥感实现了遥感数据图像维与光谱维信息的有机融合,在光谱分辨率上有着巨大的优势[7]。国内学者通过应用高光谱影像数据,多采用单波段阈值法、多波段谱间关系法、水体指数法对不同类型的水体信息进行提取试验和监测研究。文献[8]以珠海一号高光谱影像为数据源,通过设计一种新的水体提取指数—阴影建筑指数(SBI),更为准确地提取了洱海的水体信息;文献[9]基于高分五号影像数据,构建了单波段阈值法与阴影水体指数(SWI)相结合的决策树水体提取模型,有效抑制山体阴影和裸地影响提取完整水体,显著提升了山区水体提取精度;文献[10]基于直方图数据特征的阈值分割法,实现了高光谱航空遥感近岸水体的特征提取,实验结果表明,该方法总体信息提取精度达84%,Kappa系数为0.6862;文献[11]针对水体边界混合像元导致的精度损失问题,提出了一种基于高光谱混合像元分解的水体边界提取方法,通过混合像元的高精度分解及水体边界像元分割,进一步逼近水体的真实边界,能显著提高水体边界提取精度。
大量研究结果表明,基于单波段阈值法、多波段谱间关系法、水体指数法等水体提取方法已较为成熟,结合高光谱影像数据的应用,可以获得很好的水体信息提取效果。为进一步丰富高光谱影像在黄河流域水体提取的研究,本文以珠海一号高光谱影像为数据源,针对黄河流域宁夏吴忠段水体光谱特征,采用单波段阈值法、归一化差异水体指数法(NDWI)、改进阴影水体指数法(MSWI)以及单波段阈值法与改进阴影水体指数法(MSWI)相结合的决策树分类方法,研究总结适用于宁夏黄河流域的水体信息提取方法。
2 研究区与数据源
2.1 研究区
吴忠市位于宁夏回族自治区中部,引黄灌区的精华地段,地处东经104°17′~107°39′,北纬36°35′~38°32′之间。黄河是吴忠市最主要的河流,纵贯全境,自青铜峡市青铜峡镇入境,由利通区东塔寺乡出境,境内全长69 km,河面宽2.5~7.7 km,黄河沿岸地势平坦,沟渠纵横,农业发达,素有“塞上江南”的美誉。研究区水体类型多样,除黄河及其灌溉沟渠外,常见水体还有湖泊、水库、景观水系等;整体分布复杂,各类水体穿插分布于农田、城市建筑、山体、裸地之间。
2.2 数据源
研究数据采用珠海一号高光谱卫星数据,单次成像幅宽150 km,空间分辨率10 m,光谱分辨率2.5 nm,波长范围400~1000 nm,共32个波谱段,从可见光至近红外波段。覆盖研究区影像2景,为03组D星(OHS-3D)影像,成像时间为2022年3月,经过辐射定标、大气校正和正射校正等预处理,可用于水体的定量反演。图1为预处理后的研究区高光谱卫星影像灰度图像,黄河自西南角向北纵贯整幅影像。
图1 研究区预处理后高光谱卫星影像
3 研究方法
在可见光波段内水的反射率一般较小,通常为4%~5%,且与波长呈负相关[12,13],在750 nm波长之后,近红外波段处,水体几乎吸收全部的光波的入射能量,反射率很低[11],水体在近红外波段和短波红外波段具有强吸收、弱反射的光谱特征。另外,水体在蓝、绿波段的高反射、低吸收是它的另一大光谱特征,即水体在430~560 nm出现反射峰值,吸收性和透射性相对较弱。根据水体在不同波谱上的明显差异,可以很好地实现水体和其他地物的界限分离。
3.1 单波段阈值法
单波段阈值法是指选定某一特定波段,通过设置适当的阈值对水体进行提取[14]。在近红外波段和短波红外波段,水体反射率极低,而非水体反射率相对较高,明显区别于水体,单波段阈值法则是基于此选取近红外特定波段进行水体提取,具体公式为:
B28 (1) 式(1)中,B28为第28波段的反射率值,T为阈值;当第28波段反射率值小于T时为水体,否则为非水体,经多次试验以灰度直方图确定阈值T为1465。 归一化差异水体指数(NDWI,Normalized Difference Water Index)利用了水体在绿波段反射率较高,近红外波段反射率低的特性[15],通过对遥感影像特定波段进行归一化差值处理,以凸显影像中的水体信息,具体公式为: (2) 式(2)中,将第8波段和第22波段分别作为绿波段和近红外波段进行归一化差值运算,阈值设为0.02,大于该值为水体,否则为非水体。 改进阴影水体指数法(MSWI,Modified Shade Water Index)是在阴影水体指数法的基础上改进而来,以反射率最高的蓝波段与反射率最低的近红外波段灰度值之差,除以近红外波段,从而加大水体与阴影之间的区分[16],具体公式为: (3) 式(3)中,将第6波段和第22波段分别作为蓝波段和近红外波段进行运算,阈值设为0.2,大于该值为水体,否则为非水体。 通过对以上3种方法的试验结果进行分析,发现其均存在不足之处,主要表现在部分水体与阴影、裸地易混淆,从而影响了水体提取的准确性。730 nm波长之后,阴影的反射率略高于水体,变化趋势仍保持一致[17],阴影和水体光谱的相似性导致两者难以有效区分。基于此通过多种单一方法的组合研究提出了单波段阈值法与改进阴影水体指数法相结合的决策树分类方法,对水体作进一步提取试验。 水体提取实质上属于二元分类,而决策树是解决二元分类问题的有效手段,知识决策树模型特别适用于基于简单特征的地物提取问题[18]。通过将单波段阈值法和改进阴影水体指数法相结合构建决策树算法,对研究区进行水体提取。单波段阈值法在提取水体信息的同时,也提取了大量山体阴影、建筑阴影信息,而MSWI可以有效地将水体和阴影进行分离,进一步提高了水体信息提取精度。 决策树法水体信息提取模型如图2所示。 图2 决策树法水体信息提取模型 基于上述4种水体信息提取方法,通过应用珠海一号高光谱遥感影像数据,分别对研究区开展水体信息提取试验,以上方法特征波段选取均通过光谱特征分析获得,并以直方图法获取相应阈值[9],利用ENVI5.3中的Band Math将其转为二值图[19],提取结果如图3所示,白色为提取的水体信息,黑色为非水体信息。 通过直观观察发现,4种方法均能较好提取黄河、湖泊等开阔水体的主体轮廓,但在细节处存在明显差异: (1)单波段阈值法较完整地提取了影像中绝大部分水体信息,但同时也误提取了一定数量的影像阴影,包括山体阴影和建筑阴影。 (2)归一化水体指数法极大程度地抑制了植被信息,强化水体信息[20],同时对影像中的阴影抑制作用较差,影响了面积较大水域的轮廓完整性。 (3)改进阴影水体指数法对于影像中的阴影具有一定的抑制作用,但也丢失了一定面积较小的水体信息。 (4)决策树法能较好地区分水体和阴影,最大程度保留水体信息的同时,对影像中的阴影有着明显的抑制作用(图3(d)中红色区域)。尤其是基于单波段阈值法和改进阴影水体指数法组合的决策树法,对水体信息的提取效果明显优于其他3种方法。 图3 水体提取结果 以同时期高分二号卫星影像为底图,人工目视解译获取研究区水体矢量信息,通过野外调查分别采集50个水体和非水体样本,作为精度验证的真实参考值,在ENVI5.3软件下与4种水体信息提取试验结果通过计算混淆矩阵进行精度评价与分析,分析结果如表1所示。 表1 精度评价与分析结果 从表1可以看出,本次试验运用的4种水体提取方法中,基于单波段阈值法和改进阴影水体指数法组合的决策树法总体精度高于其他3种方法,其总体精度为92.49%,较单波段阈值法、NDWI法、MSWI法分别高出了2.56%、3.17%、1.05%;Kappa系数为0.84,较单波段阈值法、NDWI法、MSWI法分别高出了0.07、0.1、0.03。决策树法对于山体阴影和建筑阴影干扰下的水体信息有着较高的辨识度,克服了黄河流域宁夏吴忠段山体和裸地较多的不利影响,较适用于该区域水体提取。 本文基于常用的水体提取方法,通过应用珠海一号高光谱卫星影像,对黄河流域宁夏吴忠段范围内水体提取进行了研究试验,研究结果表明基于单波段阈值法和改进阴影水体指数法组合的决策树法在该区域水体提取试验中收获了更好的效果。高光谱卫星影像具有丰富的光谱信息优势,有效排除了水体含沙量、水深等因素对水体信息提取的干扰,针对研究区水体类型多样、分布复杂的特点,通过运用决策树法进一步排除了阴影对水体提取的干扰,该方法较适用于黄河流域宁夏段的水体信息提取。3.2 归一化差异水体指数法
3.3 改进阴影水体指数法
3.4 决策树法
4 结果与分析
4.1 提取结果
4.2 精度验证
5 结论