一种利用高光谱像元分解技术提取水体边界的方法
2019-04-03关洪军
周 炜,关洪军,童 俊
(陆军工程大学野战工程学院,江苏 南京 210007)
水体信息是地表覆盖物的重要组成部分[1],是工程保障的基础信息。水体边界信息的精确提取对于检测江河的流量流速动态变化、估算水库及池塘的蓄水量具有重要意义,可以为渡河保障及给水保障提供信息支持。遥感影像的水体信息提取是遥感应用技术方法研究的重要分支,在经济和军事等领域具有重要的应用价值。针对不同数据源,国内外学者提出了不同的水体信息提取方法,如多波段谱间关系法[2]、水体指数法[3]、光谱知识法、面向对象的水体信息提取方法[4]等。这些方法在进行水体提取时,将像元作为水体提取的基本单位,对混合像元的判定比较粗糙,会导致水体边界识别的精度损失。而混合像元分解技术可以对水体边界的混合像元进行定量分析,从而提高水体提取精度[5]。目前,国内针对混合像元分解研究的数据源主要为多光谱影像,而利用高光谱影像进行水体边界混合像元分解的研究目前还未见报道,算法研究还有进一步提升的空间。
本文针对水体边界易与周边地物产生混淆而界定困难的问题,提出一种基于高光谱混合像元分解的水体边界信息提取方法,流程如图1所示。
1 研究区域
研究区位于西藏阿里地区扎西岗乡,北纬约32°30′,东经约79°40′,属于高寒干旱气候,年平均气温-2~0℃,年平均降水量50~100 mm。该区域为夹在喜马拉雅山与冈底斯山脉间的山间谷地平原,山前冰雪融水形成大量冰水洪积扇,平原台地多由湿地发育,植被以高寒草原为主,土壤主要为高山寒漠土。
2 遥感影像处理
2.1 影像波段筛选
本文研究使用国产某卫星高光谱影像数据,摄影时段为2016年1月22日12时,影像分辨率为10 m,包含波段123个,画幅大小700×500像元。鉴于国产高光谱影像各波段质量参差不齐,根据图像灰度范围、图像灰度标准差、图像熵,对数据源进行质量评价和波段筛选。
灰度范围用整个图像灰度最大值与最小值的差值表示,记为D。图像灰度标准差代表图像灰度值的离散程度,记为S,计算公式如下
(1)
式中,M、N为影像的行列号;f(x,y)为目标影像;Mean为目标影像灰度均值。
图像熵表示为图像中灰度分布的聚集特征所包含的信息量,也描述了图像的平均信息量[6],计算公式为
(2)
式中,H表示图像一维熵;i表示灰度值;Pi表示目标图像中灰度值为i的像元占总像元的比例。
筛选阈值为D≥600、S≥100、H≥5.5。根据筛选结果,将波段1~8、31~33、82~83、88~123判断为不合格波段,使用74个质量合格波段作为试验对象。
2.2 预处理
影像预处理主要包括辐射校正、几何校正、滤波器降噪。辐射校正方法采用平场法,即选一块光谱均一的高反射区取其平均值,然后对每一个像元的光谱值除以该平均值。几何纠正通过图像配准实现,以高光谱数据作为标准图像,对高分辨率数据进行配准处理。再通过重采样,对图像亮度值进行插值计算,建立新的图像矩阵。滤波降噪通过中值滤波器实现,滤波窗口大小为5×5。中值滤波能够有效滤除椒盐噪声,尽量保护边缘信息的完整[7]。
2.3 水体指数法
水体对小于0.6 μm波长的光波吸收性和透射性相对弱,反射率相对较高。而在近红外、短红外波段,水体几乎吸收全部的光波的入射能量,反射率很低。水体指数能够代表水体在蓝光、绿光、近红外波段的典型特征,是水体信息提取的常用方法之一。
(1) 归一化差值水体指数[8](NDWI)是水体信息提取的常用指数,其表达式为
(3)
式中,B2表示影像的绿波段;B4表示影像的近红外波段。
(2) 阴影水体指数[9](SWI)能有效区分水体和阴影,弥补归一化差值水体指数的缺陷,其表达式为
SWI=B1+B2-B4
(4)
式中,B1、B2、B4分别表示影像的蓝波段、绿波段和近红外波段。
(3) 改进的阴影水体指数[10](MSWI)相比于SWI而言,水体于阴影的分离程度更高,区分更为明显,其表达式为
(5)
式中,B1、B4分别表示影像的蓝波段和近红外波段。
用0.486 μm波段代表蓝波段,波长0.559 μm波段代表绿光波段,波长0.837 μm波段代表近红外波段,计算水体指数并构建决策树。设定阈值NDWI≥0.1,SWI≥50,MSWI≥0.3,提取水体要素。
2.4 水体边界混合像元提取
水的反射光谱特征主要由水的物质组成决定,也受水体物理化学状态的影响。通常悬浮泥沙含量、水深及水体叶绿素含量会对水体的光谱特征造成一定的破坏。在使用多光谱影像进行水体提取时,这些因素会影响水体信息的判断,导致精度降低。而借助高光谱信息优势,构建水体边界混合像元光谱拟合曲线,可以通过光谱曲线丰富的变化判断水体边界信息,排除悬浮泥沙、水深等因素的影响。对水体及水体边界混合像元进行采样,拟合两者亮度值随波长的变化趋势,如图2所示。
图2中实线表示水体像元拟合曲线,虚线表示混合像元拟合曲线。由图可知,水体边界混合像元在蓝和绿波段光谱特征与水体像元大致相同,在红及近红外波段辐射亮度变化趋势与水体相近,但亮度值远远高于水体像元。采用多波段谱间关系法,凭借混合像元与水体像元相似的谱间关系提取水体及其边界混合像元,再通过混合像元与水体像元红、近红外波段的亮度差异,滤除水体像元,实现边界混合像元的提取。
2.5 混合像元分解
混合像元是指包含多种地物混合信息的单个像元,其记录的地面反射光谱信号是多种地物光谱信息综合而成的复合信号[11]。混合像元多分布于地形破碎之处和多种类型地物的交界地区。水体信息的边界像元几乎都属于混合像元。混合像元分解就是根据混合像元的光谱曲线,计算混合像元中各端元所占的百分比,即端元丰度[12]。
2.5.1 端元选取
端元是指仅包含一种地物信息的单个像元,其对应的光谱曲线可以代表该类地物的光谱曲线[13]。在遥感影像中同一种地物的光谱特征存在差异,难以做到直接提取纯地物端元。因此,对水体边界的不同地物进行采样,拟合地物端元光谱曲线。采集地物样本点时,空间分布要尽量均匀,且需避开多种地物交界区。在拟合端元光谱曲线时,对地物样本进行标准差计算,排除标准差大的波段,选择地物辐射亮度值稳定的波段作为混合像元分解的依据。其中,水体在不同波段的亮度均值与标准差如图3所示。
图3中实线表示样本像元亮度均值;虚线表示样本亮度值标准差。鉴于水体辐射亮度在0.891 μm以外均存在较大波动,不利于混合像元分解模型的计算。在混合像元分解时,仅将0.891 μm以内的拟合结果作为各地物端元的光谱曲线。
2.5.2 线性光谱混合模型
线性光谱混合模型[14]是目前应用最广泛的混合像元分解模型,其表达式为
(6)
式中,x∈Rl为混合像元光谱;i为波段数;A∈Rl×P为端元矩阵;P为图像中的端元数目;S∈RP为该混合像元的丰度向量;ε∈Rl为高斯随机噪声或模型误差。
2.6 水体边界提取算法
2.6.1 混合像元分解目标判定及分解
以水体指数法提取结果为基础,建立2像元的缓冲区。将缓冲区与混合像元的提取结果叠加,作为混合像元分解的目标区域。而线性光谱混合模型可以看做是一个不等式组的求解,不等式组如下
(7)
式中,x1、x2、x3、x4、x5、x6为各端元所占百分比;p1,p2,…,pn为植被端元各波段亮度值;w1,w2,…,wn为水体端元各波段亮度值;g1,g2,…,gn为草场端元各波段亮度值;f1,f2,…,fn为裸地类型一端元各波段亮度值;s1,s2,…,sn为裸地类型二端元各波段亮度值;i1,i2,…,in为滩涂端元各波段亮度值;m1,m2,…,mn为混合像元各波段亮度值。鉴于不等式求解结果不完全符合线性光谱混合模型,设置5相对亮度值为缓冲。
2.6.2 混合像元分割
将高光谱影像中的每个像元拆分成25个小像元,则混合像元分割的步骤如下:
(1) 建立一个与试验影像等大的空矩阵A。根据混合像元分解的结果,将水体端元所占百分比在25%以上的像元换算成小像元个数N,记录到矩阵A的相同位置。
(8)
式中,x1表示水体端元所占百分比;N表示拆分后纯水体像元的个数。
(2) 若在矩阵A中,一个非零值像元四邻域皆非零,则该像元为纯水体像元,赋值25。若一非零像元四邻域皆为零,则将该像元为非水体像元,赋值0。
(3) 判断水体在像元中的聚集方位。像元四邻域中,若仅有一个邻域非零,则聚集方位为该非零邻域方向;若有两个邻域非零且非零邻域相邻,如左邻域和上邻域,则聚集方位为值等于25的邻域方向;若有两个邻域非零且非零邻域相对,如左邻域和右邻域,则聚集方位为中央方向且连接非零邻域;若有3个邻域非零,则聚集方位位于零值邻域的相反方向。
2.6.3 边界提取
Laplacian算子对噪声敏感,对平滑后的图像边缘有良好的检测能力。以3×3窗口进行运算,获得连续的水体边界。
3 水体边界提取效果分析
选择影像中最复杂的河段作为对比区域,即区域中存在大量宽度小于10 m,表现为混合像元的河段。对比的方法分别为水体指数法、支持向量机法[15]及高光谱像元分解法,结果如图4所示。表1为通过混淆矩阵对3种方法的精度评价。
表1 不同水体提取方法的精度验证
从表1看出,在水体多为混合像元的前提下,高光谱像元分解法在精度上远优于水体指数法,略优于SVM法。由图4(a)可知,水体指数法对混合像元的区分度低,对于清澈浅水体像元难以确定合适的阈值进行区分,不能有效识别。由图4(b)、4(c)可知,SVM法与高光谱像元分解法提取效果相近,但高光谱像元分解法在支流连接及水体数学形态优化方面更具优势。由图4(d)可见,高光谱像元分解法能够根据混合像元分解结果预测滩涂区域是否位于水位以下,从而对滩涂区域地表覆盖属性作出有效判断。
4 结 论
本文以国产高光谱影像为数据源,提出了基于高光谱像元分解的水体边界提取方法,实现了扎西岗周边水体边界信息的精确提取。结果表明,该方法水体提取总精度为93.86%,Kappa系数为0.87,高于水体指数法和SVM法,能为基于中分影像的水资源储量评估以及滩涂水位的预测方面提供一定的科学参考。针对试验内容,得出的结论如下:
(1) 凭借高光谱信息优势,可以通过拟合光谱曲线,排除悬浮泥沙、水深等因素对水体提取的干扰,提高水体边界混合像元的解译精度。
(2) 水体指数对混合像元的区分度低。高光谱像元分解法和SVM法均能有效区分混合像元的主成分类别,高光谱像元分解法在水体面积估算以及水体形态优化方面要优于SVM法。