耦合最大熵模型的离散粒子群水体提取
2020-06-03张万昌李旺平高会然党星海
王 玉, 张万昌, 李旺平, 陈 豪,3, 高会然,3, 党星海
(1.兰州理工大学,兰州 730050; 2.中国科学院空天信息创新研究院,北京 100094;3.中国科学院大学,北京 100049)
水资源是人类社会生产发展的物质基础,明确水资源分布是维持社会可持续发展、合理调控水资源和生态系统平衡等领域的重要研究内容[1-2]. 传统人工监测水体方法耗时耗力,难以大范围监测[3]. 遥感技术的发展,使得低成本和大范围的水体监测成为可能. 目前为止,遥感技术已经成功应用于水体面积、水位、蓄水量和径流量等水体监测与研究之中[4-5]. 其中,Landsat卫星影像由于具有长达40多年的免费中高空间分辨率影像,被广泛应用于水体监测之中[6].
目前针对遥感影像的水体提取方法主要包括水体指数法、监督分类法、水体特征法等[7-8]. 水体指数法是以1996年McFeeters提出的归一化差异水体指数法(Normalized Difference Water Index,NDWI)和2005年徐涵秋提出的改进归一化差异水体指数法(Modified Normalized Difference Water Index,MNDWI)为代表的一类水体提取方法[9-10]. 因其简单易行,精度较高,已被广泛应用于各类水体提取研究中[11]. 但随着更精细的多光谱影像波段划分,水体指数法已经不能完全满足研究者的需求[12]. 因此许多研究者致力于研究高精度的水体提取方法,如Muller等使用180 000个分为26类的样本点,运用基于机器学习的监督分类法提取Landsat影像水体,取得了良好的精度[13]. Tulbure等利用水体指数法耦合监督分类,提取半干旱地区30年次大陆尺度的水体. 此方法在水体提取时考虑了凸显水体特征的水体指数,减少了样本需求,也获得了高精度的水体提取结果[14].
凸显水体特征可以提高水体提取精度,水体特征法被发展以期获得高精度的水体提取结果. 如Jia等针对Landsat 8_OLI(Operational Land Imager,OLI)影像,利用基于光谱匹配的离散粒子群优化方法(Spectral Matching Based Discrete Particle Swarm Optimization,SMDPSO)对全球典型区域水体进行提取. 该方法深度挖掘了OLI影像7个波段的水体特征信息,获得可以描述水体特征的水体概率分布. 在此基础上利用离散粒子群优化方法(Discrete Particle Swarm Optimization,DPSO)进行水体提取和优化,取得了较高的水体提取精度[15]. SMDPSO方法能提取小水坑和细小支流等水体,但也会将雪冰、机场、云及云阴影等地物错判为水体. 该方法提取水体主要依赖于水体概率,而水体概率的计算依据与水体光谱曲线的相似程度较高,因此会将与水体具有相似光谱曲线的地物如雪冰、机场、云及云阴影等误判为水体.
为了降低SMDPSO 方法对与水体光谱特征相似的非水体的误判率,本文利用最大熵模型(Maximum Entropy Model,MaxEnt)耦合DPSO 方法,构建耦合最大熵模型的离散粒子群方法(Maximum Entropy Model Based Discrete Particle Swarm Optimization,MEDPSO),提取了全球6个不同气候和水体类型的Landsat 8_OLI影像水体. 探讨MEDPSO方法的科学性和合理性,以期提高DPSO方法的水体提取精度以及该方法在遥感提取水体上的应用水平.
1 MEDPSO方法与精度验证方法设计
MEDPSO 方法利用MaxEnt 模型替换SMDPSO 中的光谱匹配方法(Spectral Matching,SM)计算水体概率,提取OLI影像水体. 该方法主要分为两步:①MaxEnt模型计算水体概率,参考AUC 指标选择熵最大水体概率分布图. ②通过DPSO方法进行水体优化和提取,得到最优的水体分布. 其方法流程设计如图1.
1.1 光谱匹配方法计算水体概率
SM方法通过计算参考光谱o 和地物光谱w 之间的相似度,定量衡量地物与参考地物的相似程度[16]. 最小距离法和光谱角匹配法是光谱匹配中常用的方法,Jia等计算水体概率式(1)结合考虑了距离相似度(dist)和光谱角相似度(cos)[15].
图1 MEDPSO方法水体提取流程图Fig.1 MEDPSO method water extraction flow chart
1.2 最大熵模型计算水体概率
最大熵可根据少量已知信息对未知信息的分布进行无偏推断,认为熵最大的事物最可能接近它的真实状态[17]. 2004年Phillips等依据最大熵原理开发了MaxEnt模型,只需少量水体样本点和环境变量,就能准确评估环境变量中水体概率的高低[18].
本文采用3.4.1版Maxent模型,需要输入以ASCII为格式的环境变量和以CSV为格式的样本点经纬度坐标. 环境变量包括:辐射定标的1~7波段影像,NDWI、MNDWI、NDVI(Normalized Difference Vegetation Index,NDVI)、AWEI(Automated Water Extraction Index,AWEI)等水体指数计算的影像[19]. 通过目视解译OLI水体影像,在该区域中随机选取样本点. MaxEnt模型参数设置,选择受试者工作特征ROC曲线(Create Response Curves,ROC)评价MaxEnt 模型挖掘水体特征建立预测模型的准确性[20-21]. 综合参考建模与测试的AUC 评价指标,选取最优的水体概率分布输入DPSO方法.
1.3 离散粒子群方法提取水体
DPSO方法已被广泛地应用于图像匹配、图像增强、数据挖掘、多目标优化等研究领域[22]. DPSO中的每一个D维粒子都代表适应度评价函数T的一个可行解,可行解具有位置向量Xi=[Xi1,Xi2,…,XiD]和改变速率向量Vi=[Vi1,Vi2,…,ViD]两个特征[23]. DPSO方法构建由0,1组成的离散粒子群XID,其中每一个Xi都表示一个4×4栅格的水体分布. 适应度评价函数结合了离散粒子群与最大熵概率分布,赋予粒子水体概率信息. 通过T值对携带水体概率信息的粒子群进行评价,寻找历史最优Pid和全局最优Pgd. DPSO方法具体优化步骤如:①初始化粒子群XID和VID;②计算适应度评价函数T,寻找Pid和Pgd;③通过Vid学习Pid和Pgd,更新Xid;④比较Xid与Pid和Pgd,更新Pid和Pgd;⑤判断是否满足终止条件,是则结束,否则继续③~④直至满足条件为止.
1.4 水体提取精度验证方法
本文通过目视解译验证区域制作水体验证数据集,统计SMDPSO方法和MEDPSO方法水体提取中与水体验证数据集分类一致(正确像元)、分类不一致(错误像元)及影像总像元(总像元)个数组成混淆矩阵[24]. 计算总体精度、Kappa系数、错分误差、漏分误差,定量评估SMDPSO方法和MEDPSO方法提取水体的精确度.
2 MEDPSO方法研究区与验证区
2.1 研究区与验证区选取
为了验证MEDPSO 水体提取方法的通用性,选取全球6个不同气候条件和水体类型的研究区(表1)进行水体提取. 参照Jia等(2018)SMDPSO方法的研究,选取A~D区域,其中SMDPSO方法在A~B区域具有较好的水体提取精度. 在此区域进行方法对比,可以验证Maxent 模型耦合DPSO 方法水体提取的可行性.SMDPSO 方法在提取C~D 区域水体时,某些地物处具有较高的错分误差,因此可以检验MEDPSO 对水体提取精度提高的有效性. SMDPSO 方法将雪冰、云及云阴影等完全误判为水体,因此选取E、F 区域验证MEDPSO方法在相同条件下水体提取的适用性.
表1 MEDPSO与SMDPSO方法水体提取研究区Tab.1 MEDPSO and SMDPSO method water extraction research areas
在A~D 研究区中,选取与SMDPSO 方法相同的验证区域a~d作为MEDPSO 方法的验证区域. E~F 区域分别选择具有云覆盖、冰雪等e~f区域,作为研究雪冰、云与云阴影对MEDPSO方法提取水体精度的影响.
2.2 研究区与验证区数据来源及预处理
本文使用的OLI影像共有9个波段,除波段8是空间分辨率为15 m的全色波段外,其余波段的分辨率均为30 m. 该影像来源于从美国地质调查局(https://earthexplor er.usgs.gov/),L1TP 影像通过地面控制点校正具有较高的精度.
利用IDL(Interactive Data Language,IDL)对OLI 影像1~7波段批量进行辐射定标处理,裁剪归一化处理后,研究区A~F 和验证区a~f 区域,按波段6(red)、波段5(green)及波段3(blue)假彩色显示(如图2). 基于PyCharm 平台编写代码调用ArcPy 模块,将影像转化成最大熵模型可读的ASCII格式. 使用ArcGIS 10.2,随机采取A~F水体区域样本点,以m为单位提取CSV格式的样本点经纬度坐标数据.
图2 研究区A~F与验证区域a~f假彩色显示Fig.2 Study area A-F and verification area a-f false color display
3 SMDPSO方法与MEDPSO方法水体提取结果与分析
3.1 水体提取结果
图3展示了SMDPSO方法与MEDPSO方法在A~F区域提取水体的结果. 总体来说,在A~D区域SMDPSO方法将水陆混合、水植混合等地物判别为水体,过高地估计了水体范围. 而MEDPSO 方法在该区域能精确地剔除混合像元,获得高精度的水体提取结果. E区域SMDPSO方法过多地将概率高的云及云阴影误判为水体,而MEDPSO方法抑制云及云阴影像元的水体概率,水体提取显示出相对更好的结果. F区域SMDPSO方法计算雪冰像元时,具有更高的概率值,导致很高的误判. 而MEDPSO方法由于概率区分明显,展示出较好的结果. 由此可见,水体概率对DPSO方法提取水体影响较大,而SM方法计算水体概率过度依赖地物光谱,导致SMDPSO方法存在较高的误判率. MEDPSO方法综合水体光谱以及水体纹理和结构等信息,充分挖掘水体特征,相对于SMDPSO方法提取水体有明显的改进.
图3 SMDPSO方法与MEDPSO方法水体提取分布对比Fig.3 Comparison of water extraction distributions between SMDPSO method and MEDPSO method
3.2 水体提取精度评估
在图4中,a~b区域SMDPSO方法比MEDPSO方法总体精度低9%左右,错分误差高20%左右,漏分误差低4%左右,Kappa系数低0.19. c~d区域SMDPSO方法与MEDPSO方法总体精度之间差值不高于3%,c区域SMDPSO 方法比MEDPSO 方法错分误差高38%左右,漏分误差低4%左右,kappa 系数低0.18 左右. d 区域SMDPSO 方法比MEDPSO 方法错分误差高13%左右,漏分误差低3%左右,kappa 系数低0.07 左右. e、f 区域SMDPSO 方法相比于MEDPSO 方法结果差别过大,SMDPSO 方法总体精度和Kappa 系数太低. 而MEDPSO方法相较于a~d区域没有太大的差别,证明MEDPSO方法提取水体具有更高的稳定性.
3.3 水体提取结果可视化分析
SMDPSO 方法过度地将水陆、水植混合像元误判为水体(如图5),导致较高的错分误差,而漏分误差趋近于0. 该方法在细小支流处能够完全提取水体支流,但也将其邻近的其他地物误判为水体. MEDPSO 方法不能够完全提取细支流,但也能在一定程度上提取水体支流且有较低的错分误差. 因此Maxent模型耦合DPSO方法能在水陆混合、水植混合区域,高精度提取水陆、水植处的水体.
图4 验证区a-f 水体提取结果精度对比 Fig 4 Comparison of precision of a-f water extraction results in verification area
图5 验证区a~b水体提取结果Fig.5 Water extraction results in verification area a-b
c区域是干旱季平谷地区影像(如图6),干涸河床在遥感影像上显示为黑色,与水体具有相似的光谱曲线. 导致SM方法计算得到高的概率值,经DPSO方法提取水体后错分误差较高. MaxEnt方法在计算干涸河床时得到趋于0的概率值,经DPSO方法提取水体后错分误差和漏分误差较低. 由此可知,DPSO方法将概率值高的地物判别为水体. d区域人工建筑较多,SMDPSO方法将建筑物尤其是黑色公路误判为水体,具有较高的错分误差. MEDPSO方法提取含有人工建筑的水体区域时,完全不受建筑物的影响. 对比发现,MEDPSO方法能够更精准有效地提取水体.
e区域含云量高(如图7),SMDPSO方法极易将云及其阴影误判为水体,导致高达61.6%的错分误差. 同样在冰川、积雪覆盖的F区域,SMDPSO方法在提取水体时,几乎将全部地物错分为水体,导致非常高的错分误差. MEDPSO方法明显剔除雪、冰、云及其阴影对水体提取的干扰,仅有7%左右的漏分误差,总体精度最低高达95.89%,Kappa系数最低高达0.9.
图6 验证区c~d水体提取结果Fig.6 Water extraction results in verification area c-d
图7 验证区e~f水体提取结果Fig.7 Water extraction results in verification area e-f
4 结语
本文针对SMDPSO方法易将与水体具有相似光谱曲线的其他地物误判为水体的缺点,提出了耦合最大熵模型和离散粒子群优化方法(MEDPSO),并通过在全球选取6个研究区域进行水体提取,对SMDPSO方法和MEDPSO方法在典型区域进行了定量和定性的比较.
研究表明SMDPSO方法过高估计水体分布范围,通常拥有很高错分误差和一定的漏分误差. MEDPSO方法错分误差与漏分误差一致较低,因此MESPDO提取水体稳定性较高. 一般情况下,MEDPSO方法相比于SMDPSO方法,总体精度提高7%,Kappa系数提高7%~20%左右. 在雪冰、云及其阴影区域SMDPSO方法将此类地物完全误判为水体,MEDPSO方法能剔除雪冰、云及其阴影,高精度提取水体. 综上所述,MEDPSO方法通过综合考虑水体特征,降低了SMDPSO方法提取水体时对光谱曲线的依赖,显著提高了DPSO方法在水体提取精度.