水库水体的最大类间方差迭代遥感提取方法
2021-05-19范亚洲刘林鑫晁丽君
范亚洲,张 珂,3,4,刘林鑫,晁丽君,姚 成
(1.河海大学水文水资源与水利工程科学国家重点实验室,江苏 南京 210098;2.河海大学水文水资源学院,江苏 南京 210098; 3.长江保护与绿色发展研究院,江苏 南京 210098;4.中国气象局-河海大学水文气象研究联合实验室,江苏 南京 210098)
水利工程设施是水资源管理与规划的重要设施[1]。随着遥感技术在水利工程领域的广泛应用,通过遥感影像提取水体信息已经成为水资源调查及宏观监测[2-6]、复核库容曲线等领域中的关键技术[7-8]。遥感影像提取水体信息的研究方法包括单波段阈值法[9]、多波段谱间关系法[10]、水体指数法以及决策树法[11]等。王国兴等[12]提取了新安江水库不同时相的水体面积,结合实测水位拟合了水位-面积关系曲线;曹明亮等[13]通过遥感影像提取水库库区的水体面积,提出了小水库拦洪计算方法;曹荣龙等[14]通过分析地物光谱特征构建了修订型水体指数,提取了密云水库水面面积的动态变化;张莉芳等[15]基于遥感技术提取了柘林水库库区内的水体面积,进而对库容曲线进行复核;戚晓明等[16]基于21景ETM+遥感影像提取了洪泽湖的水面变化序列数据,并推导了洪泽湖库容曲线。上述研究均使用人工判读或经验确定的阈值来提取库区水体信息,并没有对分割阈值做出客观的判断。
高分一号(GF-1)卫星于2013年4月26日发射成功,搭载了两台2 m分辨率全色和8 m分辨率多光谱相机(PMS)外,还搭载了4台16 m分辨率多光谱相机(WFV),具有寿命长、效能高等特点[17],提高了我国高分辨率影像数据的自给率[18],为遥感影像信息提取及特征识别带来了新的机遇[19]。本文开展了以GF-1卫星遥感影像为数据源的东方红水库库区水体信息优化提取研究,提出基于最大类间方差的库区水体迭代优化提取方法。
1 方法的提出
1.1 归一化差分水体指数法
归一化差分水体指数(normalized difference water index, NDWI)法由McFeeter[20]提出,根据水体在绿光波段上具有很强反射性、在近红外波段具有很强吸收性的特点,建立波段差异比值,从而增强水体信息,计算公式为
INDWI=(λ1-λ2)/(λ1+λ2)
(1)
式中:INDWI为归一化差分水体指数;λ1为GF-1卫星的绿光波段反射率;λ2为GF-1卫星近红外波段反射率。
通过地物光谱分析及水体提取实验,在突出库区主要水体信息的同时,为了较好地抑制植被等其他地物信息,本文将初始阈值设为T0=-0.2,即INDWI>T0得到的结果为初步提取的水体信息。
1.2 最大类间方差迭代法及形态学膨胀算法
最大类间方差法是由Otsu[21]1979年提出的一种无参数无监督的阈值分割算法[22]。该算法根据图像的灰度特性,分割阈值从最小灰度值遍历到最大灰度值,在某一灰度值下,将图像分成背景和前景两部分,当两者类间方差最大时,背景和前景这两部分被错分的概率是最小的[23],对应最大类间方差的阈值即为所求的自适应阈值。
本文在最大类间方差法基础上,提出了最大类间方差迭代法来提高水体提取的精度。首先通过边缘检测的方法得到初步提取的库区水体信息范围,以此基于形态学膨胀算法建立库区水体的缓冲区[24],再对缓冲区包围的区域应用最大类间方差法,自适应地确定库区水体与周边地物的分割阈值,最后通过多次迭代后计算得到优化提取的库区水体面积,水体优化提取流程见图1。
图1 水体优化提取流程
本文结构元素B是数值均为1的行列数相等且为奇数的矩阵,当其大小发生变化,经膨胀算法计算得到的缓冲区范围也会不一致,这导致了水体信息不断变化,尤其当结构元素太大时,会造成水体信息的误提。为了提取准确、稳定的库区水体信息,通过试验,本文对优化提取算法进行了6次迭代计算,迭代过程中结构元素的大小分别为3×3、5×5、…、13×13。通过本文提出的最大类间方差迭代法计算得到的相邻水体面积,当两者差值的绝对值最小时(公式(2)),那么这一水体面积即为最优提取的水体面积(公式(3)),相应得到的结构元素最优,缓冲区为最优缓冲区。
1.3 精度评价方法
采用决定系数(coefficient of determination,R2)和均方根误差(root mean square error, RMSE)来验证遥感提取水体面积与参考水体面积的一致性,同时为了验证水体信息的分类精度,各景影像均选取了水体和非水体各100个样本像元,由混淆矩阵计算了各次优化结果及最优结果的总体分类精度(overall accuracy, OA)和Kappa系数(Kappa coefficient, KC)。
为了统一4项基础评价指标,本文分别将各项指标归一化后取平均值建立综合指标,即平均归一化指数(average normalized index, ANI),RMSE是水体遥感提取面积与参考水体面积之间误差的度量,因此最大值归一化后为0,最小值归一化为1。
2 实例验证
2.1 研究区概况与数据处理
安徽省屯溪流域东方红水库(图2)地处新安江水系二级支流东亭河上,水库坝址以上的集水面积为60.0 km2,主河道长11.8 km,平均坡降为21.0‰,总库容为2 445万m3,设计灌溉面积 30 km2,多年平均发电量131万kW·h,是以防洪、灌溉为主,结合发电、城镇供水等综合利用功能的中型水利枢纽工程。
图2 研究区示意图
2020年2月陆面过程资料分布式数据存档中心(LP DAAC)公布了1弧秒分辨率NASADEM数据集产品(https://lpdaac.usgs.gov/news/release-nasadem-data-products/),本文以此数据提取了研究区流域。通过现场查勘,收集了东方红水库库容曲线及2015年的水库水文资料。2015年东方红水库集水流域平均降水量为2 411.6 mm,年平均降水频率为15.1%,其中1—2月降水量较少,5—6月降水量最大。为体现雨期前后库区水体信息的不同特征,选取了2015年10景卫星影像(表1),数据源于中国资源卫星应用中心(http://www.cresda.com/CN/index.shtml)提供的GF-1 WFV数据,影像空间分辨率为16 m。
本研究采用的数据为Level 1A遥感影像(预处理级辐射校正影像产品),在后续分析前需对数据进行预处理,包括辐射定标、大气校正[25]、正射校正、配准及研究区裁剪。由于数据较多,对遥感影像数据分别处理会受到较大的人为影响,因此对影像进行了批量预处理。
2.2 水体提取结果
首先根据东方红水库的水位-面积关系(图3)和每景影像对应日期的实测水位(表1)推导相应日期水库的参考水体面积A(表2)。
图3 东方红水库水位-面积关系曲线
表1 影像数据集及实测库水位
从表2看出,初步提取的水体信息与参考水体面积相比,在雨期前4景影像(1月和2月)水库缺水期有较大的误差,平均误差约为0.80 km2,这首先是因为错提了库区浅水区大部分的裸地,其次本文依据的水位-面积关系曲线是在289 m以上,在缺水期通过拟合得到的参考库区水体面积会有所偏小,但是在雨期(5月和8月)及雨期后(10月)水库蓄水期提取的效果较好,平均误差约为0.16 km2。在6次优化提取的结果中,仅20150513景影像的提取结果有所增大,其他影像的水体面积均有减小。根据本文对最优提取水体的定义,表2列出了各景影像的最优水体面积。
图4为初步提取的库区水体信息及最优缓冲区。从图4可以看出,NDWI法结合经验阈值初步提取的水体信息在20150207景影像中混淆了库区水体和库区周边干涸的裸地,在20150212景影像中有大面积的裸地及建筑地物误提为水体信息。
表2 库区参考水体面积及遥感提取水体面积
(a) GF-1_20150102
图5为最优提取的水体信息,提取结果有效消除了影像中建筑等非水体信息的干扰,较准确地提取了东方红水库在雨期前(1月、2月)、雨期(5月、8月)及雨期后(10月)的水体信息。1月和2月降水较少,库区水体也随着补给下游而逐渐减少;5月和8月降水量增大,库区的来水量大于出水量,水库开始蓄水,水体面积也随之增加,而且提取结果较好地保留了8月两景影像中细小河道的水体;10月水库水体的面积趋于稳定。
2.3 精度分析
基于上述水体初步提取、6次迭代提取以及最优提取的3类结果,表3为各类提取结果4项基础评价指标的计算结果,其中R2和RMSE分别为十景影像水体提取面积与参考水体面积的决定系数和均方根误差,OA和KC分别是十景影像总体分类精度和Kappa系数的均值。从表3可以看到,本文定义的最优水体提取结果一致性方面相较初步提取结果显著提高,R2从0.013 9提高到了0.972 0,RMSE从0.282 2 km2减小到了0.059 2 km2;总体分类精度与Kappa系数较初步提取分别提高了9.36%和24.09%。此外,第二次和第三次迭代中水体提取的R2分别为0.976 0和0.972 1,而最优提取结果为0.972 0,且RMSE也比最优提取的结果小,可见这两次计算的提取结果一致性要高于本文最优提取结果,但最优提取的总体分类精度为0.894 0,Kappa系数为0.788 0,分类精度比第二次和第三次都更加理想;同理,第六次迭代中的总体分类精度为 0.899 5,Kappa系数为0.799 0,虽然分类精度高于最优提取结果,但是一致性方面并不满意,最优水体提取结果的R2和RMSE分别为0.972 0和0.059 2 km2。
(a) GF-1_20150102
表3 各类水体提取结果精度评价
对比基础指标即可发现初步提取的结果较差,因此不参与ANI的计算,通过计算ANI发现,最优提取水体的整体精度最高,ANI为0.7378,相比第二次、第三次和第六次的迭代计算结果,精度分别提高了2.67%、13.02%和12.85%,平均提高了9.51%。
3 结 语
本文在最大类间方差法的基础上提出了水库水体的最大类间方差迭代遥感提取方法,并以东方红水库为研究区,对该方法进行了验证分析,结果表明,相较于通过经验阈值初步提取的水体面积信息,该方法较完整地提取了在不同时期库区水体的动态变化特征,在一致性方面水体提取精度显著提高;相较于各次迭代中的水体提取结果,本文提出的库区水体提取方法整体效果良好。但本文仅应用广泛的NDWI方法进行了水体提取试验,对于不同的水体提取方法,提取结果会有不同的精度,对此在未来的研究中仍需进一步深入探讨。