基于MODIS数据的淤泥质海岸水体指数比较与分析
——以黄河三角洲海岸为例
2019-09-12吴佳平张旸张杰范胜龙杨超张小芳
吴佳平, 张旸, 张杰, 范胜龙, 杨超, 张小芳
(1.福建农林大学资源与环境学院,福州 350002; 2.江西省科学院鄱阳湖研究中心,南昌 330096)
0 引言
国内外学者已应用水体指数提取各类地表水体,如Hui等[10]利用NDWI和MNDWI提取鄱阳湖水体,研究水体的时空变化; Li等[11]使用Landsat TM,ETM+和ALI数据提取长江水体,比较不同数据之间提取水体的准确性; 廖程浩等[12]应用MODIS数据,分析不同水体指数的水体识别效果,发现CIWI的水体识别效果最为理想; 车向红等[13]采用综合多种水体指数的方法,提取青藏高原湖泊水体,监测青藏高原湖泊水体的面积变化; 王净等[14]以太湖流域为研究区,比较5种水体指数的水体识别能力,结果表明CIWI的水体识别能力最优。
受海洋、河流等多种水动力因素的影响,淤泥质海岸水体变化的复杂性远高于内陆,因此大多数水体指数研究均避开该区域。此外,由于空间分辨率的限制,大多数水体指数都是基于Landsat数据开发,而基于MODIS数据的水体指数研究较少,但是对于淤泥质海岸水体的高度动态特性而言,MODIS的高时间分辨率又具有很强的吸引力。因此,在基于MODIS数据的淤泥质海岸水体指数及其性能特点方面,亟需开展深入研究。本文以典型的淤泥质海岸地区——黄河三角洲海岸为研究区,使用MODIS数据,分析不同地表覆盖类型的光谱特征,对比研究NDWI,MNDWI,AWEInsh,AWEIsh,TCW和WI2015这6种水体指数的水体提取精度和提取误差,分析地表覆盖因素对水体指数的水体提取性能的影响,为进一步开展淤泥质海岸水体变化监测与研究提供参考依据。
1 研究区概况及数据源
1.1 研究区概况
本文研究区为现代黄河三角洲海岸,西北至潮河口,东南到小清河口(图1)。黄河流经黄土高原所携带的大量泥沙,由于其下游和河口地段地形变缓,在沉积作用下形成了黄河冲积扇平原[15]。历史上,黄河河口尾闾经过多次改道, 最终发育形成了现代黄河三角洲[16]。该区域经过了150余a的自然发育和人类的填海造陆活动,成为了我国最大的新增大陆。在海洋和河流动力的双重影响下,三角洲海岸环境变化剧烈[17],并形成独特的潮汐特征[18]。区内植被结构简单,类型较为单一,人工湿地面积逐年增多[19]。土地利用/覆盖类型以旱地和未利用地为主,受人类活动影响较大,不同类型之间相互转化频繁[20]。
图1 研究区位置(2009年5月3日Landsat TM B5(R),B4(G), B3(B)合成影像)Fig.1 Location of the study area
1.2 数据源及预处理
MODIS是美国地球观测系统(earth observation system,EOS)用于地球整体观测的卫星传感器,MODIS数据具有高时间分辨率、高光谱分辨率和覆盖范围广的特点[21]。MOD09地表反射率数据由MODIS L1B数据经过大气校正获得(https: //ladsweb.modaps.eosdis.nasa.gov)。该数据集包含了3种空间分辨率的反射率数据,即空间分辨率为250 m(B1—B2),500 m(B1—B7)和1 km(B1—B16)的每日反射率数据[22]。本文应用MRT swath(MODIS reprojection tool swath)软件对MOD09数据集进行几何纠正和格式转换,提取空间分辨率为500 m的反射率数据。
以Landsat数据作为验证数据源(https: //earthexplorer.usgs.gov),其成像时间与MODIS/Terra最为接近,可以最大限度地保持研究数据与验证数据之间的一致性。研究选取两者的成像时间差小于20 min的数据(表1)。
表1 研究使用的遥感数据Tab.1 Description of remote sensing data used in the study
2 研究方法
2.1 样本分类与训练样本选择
1)样本分类。基于黄河三角洲海岸地表覆盖类型分布情况[19],将样本划分为水体和非水体2大类。淤泥质海岸地区的不同水体受水深、含沙量等因素的影响,各类水体的反射率存在差异[23]。将水体分为海水(海岸线向海延伸15 km范围内的水域)、潮滩水体(潮滩表面水体)和陆地水体(包括水库、养殖水面、水塘、河流等)。将非水体像元划分为建成区和非建成区; 其中,非建成区划分为土壤(NDVI<0.2)、稀疏植被(0.2≤NDVI<0.5)和茂盛植被(NDVI≥0.5)[7]; 土壤进一步划分为潮滩土壤和耕地土壤2类。
2)训练样本选择。根据影像的纹理、形状和区域特征等标志人工解译出每一期影像的海岸线,以海岸线15 km范围作样本选取区。使用ArcGIS10.2软件将MODIS数据转化为格网(500 m×500 m)矢量数据,以Landsat B5(R),B4(G),B3(B)合成影像作为参考影像,解译出样本选取区和城市集中区的所有地表覆盖类型。利用ArcGIS软件中的创建随机点工具,分别随机抽取4 000个水体像元和3 000个非水体像元作为训练样本(表2)。
表2 各种地表覆盖类型的样本数分布Tab.2 Distribution of sample numbers of various land cover types
2.2 水体指数的计算
本文基于MODIS数据计算6种基于Landsat反射率数据构建的水体指数,即TCW,NDWI,MNDWI,AWEInsh,AWEIsh和WI2015。这6种水体指数适用于多种水体(包括海水、河流、湖泊等)不同环境下(包括地形阴影、建筑物、云量等)的水体提取。根据Landsat和MODIS影像各波段的波长信息,得出MODIS数据水体指数的计算公式(表3),利用ENVI5.2软件中的Band Math工具计算水体指数。
职称评聘是人事管理的一项基础性工作,也是识别和发现人才的重要手段,直接关系着专业技术人员的切身利益,影响到企业人才队伍建设和事业长远发展。职称评审要树立正确导向,做到客观公正,体现公平竞争,不仅依赖于制定的科学的评审标准,更取决于对标准条件的准确掌握。建立职称量化评价体系,是提升职称评审公信度的重要途径。本文以胜利油田工程技术人员为研究对象,探索建立了工程技术职务量化评价体系,并在实践中运用,取得了较好的效果。
表3 水体指数计算公式Tab.3 Calculation formulas of water indexes
注:B1—B7分别为MODIS B1—B7波段的反射率。
2.3 精度评估方法
接受者操作特征曲线(receiver operating characteristics curve,ROC)用于衡量二分类问题的分类精度,表示某个阈值区间内真正率(true positive rate,TPR)和假正率(false positive rate,FPR)的一一对应关系。当TPR达到最大值且FPR为最小值时取得最佳阈值。计算公式为
TPR=TP/(TP+FN),
(1)
FPR=FP/(TN+FP),
(2)
式中:TPR为真正率,即水体的正确率;FPR为假正率,即水体指数将非水体错分为水体的概率;TP为真正类的数量,即水体的正确分类数;TN为真负类的数量,即非水体的正确分类数;FP为假正类的数量,即非水体错分为水体的数量;FN为假负类的数量,即水体错分为非水体的数量。ROC曲线下的面积(area under the ROC curve,AUC)用于衡量分类器的优劣,通常AUC的值介于[0.5,1],值越大表明分类器越好[24]。
R语言的pROC程序包可绘制ROC曲线,并能自动统计出AUC值和最佳阈值[25]。图2为2008年、2009年和2015年各水体指数的ROC曲线。
(a) 2008年10月7日 (b) 2009年5月3日 (c) 2009年5月19日
图2-1 不同水体指数的ROC曲线
Fig.2-1ROCcurvesofdifferentwaterindexes
(d) 2009年6月4日 (e) 2015年3月25日
图2-2 不同水体指数的ROC曲线
Fig.2-2ROCcurvesofdifferentwaterindexes
从图2中可见,水体指数在不同成像时间具有不同的最佳阈值、敏感性和特异性。2009年各水体指数之间的差异最明显,2008年各水体指数差异较明显,2015年各水体指数之间差异不大。通过最佳阈值统计每个成像时间各水体指数的总体精度(样本的正确分类数/样本总数)、制图精度(即TPR)、用户精度(水体的正确分类数/水体分类总数)、Kappa系数、错分误差(非水体样本错分为水体的数量/水体分类总数)和漏分误差(水体样本漏分的数量/水体分类总数),然后统计各水体指数的平均提取精度及平均提取误差。
3 结果与分析
3.1 潮滩区光谱特征分析
潮滩区的主要地表覆盖类型为水体、土壤和植被,本文通过各类型样本的反射率分析其光谱特征(图3(a))。在可见光波段,潮滩水体受水体含沙量的影响[26],从蓝光到红光的反射率略有增强; 在近红外和短波红外波段的反射率逐渐下降。潮滩土壤的反射率从可见光到短波红外2波段缓慢增强,短波红外3波段转为下降; 该分布特征主要与潮滩土壤的含水量状态有关[27]。潮滩植被多为稀疏植被,泥土对植被的光谱影响较大[28],因此其在红光的反射率略高于绿光; 从红光到近红外的反射率陡增,形成反射峰; 短波红外1波段之后逐渐下降。通过反射率箱线图和t检验方法分析潮滩水体与土壤、植被的波段差异性,如图3,其中×表示均值。可见光波段(图3(b)—(d))中,潮滩水体与土壤在绿光波段的差异不显著(t=1.4,p=0.17),在蓝光和红光波段的差异显著(t=15.8和14.7,p<0.001); 潮滩水体与植被的差异显著且稍大(t∈ [19.7,29.2],p<0.001)。在近红外波段(图3(e)),潮滩水体与土壤、植被的反射率差异显著且较大(t= 35.1和45.9,p<0.001)。在短波红外波段(图3(f)—(h)),潮滩水体与土壤、植被的反射率差异显著且均大于其他波段(t∈[52.2,87.3],p<0.001)。总体来看,短波红外波段对潮滩水体与土壤、植被的区分度最佳,近红外波段次之,蓝光和红光波段一般,绿光波段最差。
(a) 光谱特征曲线(b) 蓝光波段B3 (c) 绿光波段B4 (d) 红光波段B1
(e) 近红外波段B2 (f) 短波红外1波段B5 (g) 短波红外2波段B6 (h) 短波红外3波段B7
图3 潮滩区MODIS地表反射率特征(×表示均值)
Fig.3SurfacereflectancecharacteristicsofMODISinthetidalflats
3.2 水体提取精度分析
通过统计水体指数的平均水体提取精度(表4),可以更好地反映各水体指数的提取效果。
表4 各水体指数的平均水体提取精度Tab.4 The average water extraction accuraciesof different water indexes
整体上看,6种水体指数的AUC值均高于98%,Kappa系数均高于0.9,FPR均低于4%,说明水体提取效果均较好。综合多种指标分析,AWEInsh的水体提取效果最佳,AUC值达99.54%,总体精度达97.29%,Kappa系数达0.95,均高于其他水体指数; 同时具有较高的制图精度(96.84%)、较高的用户精度(97.69%)和最低的FPR(2.14%)。WI2015的提取效果次之,制图精度达97.22%,高于其他水体指数; Kappa系数达0.94,总体精度和用户精度分别达96.69%和97.39%。虽然TCW和NDWI具有较高的用户精度,但总体精度和制图精度相对较低,两者的总体精度分别为96.68%和96.59%,制图精度分别为96.63%和95.78%,表明整体上提取效果不如前者。水体提取效果最差的是MNDWI,AUC值为98.06%,Kappa系数为0.9,总体精度为93.48%,制图精度为93.39%,均低于其他水体指数。
图4为各水体指数对3类水体提取的平均制图精度。海水的制图精度均高于90%,表明6种水体指数的海水提取效果均较优。MNDWI,AWEInsh,TCW和WI2015对潮滩水体的提取效果较好,制图精度均高于90%; NDWI对潮滩水的提取效果较差,制图精度低于70%。各水体指数对陆地水体的提取效果较差,制图精度均低于80%。
图4 各水体指数的3种水体制图精度Fig.4 Mapping precisions of three water bodieswith different water indexes
3.3 水体提取误差分析
表5统计了各水体指数的平均水体提取误差分布情况。通过水体的错分误差分布情况,分析地表覆盖因素对水体提取效果的影响程度。各水体指数将潮滩土壤错分为水体的概率最高,均高于1.2%,说明潮滩土壤对各水体指数的提取效果影响较大。耕地土壤错分为水体的概率次之,均低于0.3%。稀疏植被、茂盛植被和建成区错分为水体的概率最小,均低于0.03%,说明这3种地表覆盖类型对水体指数的提取效果影响最小。
表5 不同水体指数的平均水体提取误差Tab.5 Average water extraction errors of different water indexes (%)
3种水体的漏分误差表明,陆地水体的漏分误差整体较高,最高可达3.1%。MNDWI的海水漏分误差较高,达2.88%。对MNDWI的水体提取结果(图5)进行分析,发现2009年的3景影像均存在海水漏分的现象,漏分的海水像元主要集中在孤东油田和小清河口附近的近海区域。原因是这些区域的海水在短波红外波段的反射率异常高于绿波段的反射率,导致像元的MNDWI值小于最佳阈值而被划分为非水体。其他水体指数的海水漏分误差较低,范围在0.18%~0.32%之间。潮滩水体漏分误差普遍较低,范围在0.06%~0.88%之间。
(a) 2009年5月3日 (b) 2009年5月19日 (c) 2009年6月4日
图5 MNDWI的水体提取结果
Fig.5WaterextractionresultdiagramsofMNDWI
4 讨论
本文使用MODIS数据提取黄河三角洲海岸地区水体,6种水体指数都达到较好的水体提取效果。AWEInsh的提取效果最佳,其次是WI2015,提取效果最差的是MNDWI,但整体差异并不明显。MNDWI的海水提取精度低于其他水体指数,漏分误差最高,这可能受海水含沙量的影响。水体在短波红外波段的反射率随着含沙量的增加而升高[26-27],黄河水携带大量的泥沙入海之后,其泥沙扩散范围限于离海岸20 km[29],本文选取的海水样本位于离海岸15 km范围内,恰好在泥沙的扩散范围内,造成部分海水像元在短波红外波段的反射率异常高于绿波段,导致MNDWI值小于最佳阈值,从而被划分为非水体。
各水体指数对潮滩水体的提取结果与Ryu等[30]的研究结果基本符合。Ryu等选取的研究区与黄河三角洲具有一定程度的相似性,其研究结果表明短波红外和近红外波段对于潮滩水体较为敏感。研究结果与Fisher等[7]的研究存在一定的差异。Fisher等的研究结果表明AWEIsh的提取效果优于AWEInsh,这可能是由于研究区和研究数据存在差异造成的: Fisher等的研究区地形起伏较为明显; 此外,使用的是Landsat数据,与验证数据的成像时间差为0~5 d。其考虑到潮汐的影响,未选择海岸带地区的样本。而本研究中,黄河三角洲海岸的地形平缓,地形因素对水体提取效果的影响可忽略; 其次,MODIS与Landsat数据在波长宽度和空间分辨率方面存在差异,MODIS波谱范围广且单波段波长宽度较窄,造成这2种数据对同一种地表覆盖类型的反射率出现一定的差异。
5 结论
本文以淤泥质海岸典型地区——黄河三角洲海岸为研究区,使用MODIS每日反射率数据,以Landsat数据为验证数据源,对比分析6种水体指数在淤泥质海岸地区及MODIS数据的适用性。主要结论如下:
1)综合分析多种精度指标得出,AWEInsh的水体提取效果最优; WI2015次之; NDWI,AWEIsh和TCW的水体提取效果较为接近; MNDWI的水体提取效果最差。
2)各水体指数提取海水的制图精度较高; 陆地水体的制图精度较低。NDWI提取潮滩水体的制图精度较低,MNDWI,AWEInsh,TCW和WI2015提取潮滩水体的制图精度较高。
3)各水体指数的水体漏分误差主要来源于陆地水体; 潮滩水体的漏分误差较低; MNDWI的海水漏分误差高于其他水体指数。
4)通过分析各水体指数的水体错分误差分布得出,潮滩土壤对各水体指数的提取效果影响较大; 耕地土壤的影响次之; 茂盛植被、稀疏植被和建成区的影响最小。
此外,潮滩区的光谱特征分析可为今后开发适用于MODIS数据和淤泥质海岸的水体指数提供参考依据。