基于多源遥感数据的淇澳岛红树林范围提取研究
2022-11-08孙玉超温玉波
孙玉超,董 迪,温玉波,艾 彬
(1.国家海洋局南海规划与环境研究院,广东 广州 510300;2.自然资源部海洋环境探测技术与应用重点实验室,广东 广州 510300;3.国家海洋局南海信息中心,广东 广州 510300;4.中山大学海洋科学学院,广东 珠海 519082)
红树林是生长于热带、亚热带海岸潮间带,受到海水周期性浸没的木本植物群落,是海岸重要的湿地生态系统,在净化沿海水质、维护生态平衡和生物多样性等方面发挥着重要作用[1]。淇澳岛位于珠海市东北,珠江口西岸,面积约24 km2,岛上属亚热带季风气候,雨热充足[2]。该区域红树林属于“珠海淇澳—担杆岛省级自然保护区”保护范围,保护区总面积51 km2,红树林面积约7 km2。根据已有调查结果[3],淇澳岛红树林群落外貌波状起伏,结构简单,大多为高大乔木状林,少数为小乔木或灌木状林,主要包括无瓣海桑、秋茄、卤蕨、老鼠簕、海桑、桐花树、银叶树、水黄皮、海芒果和海漆+杨叶肖槿10 个群落类型。其中,无瓣海桑群落、秋茄群落、卤蕨群落和老鼠簕群落等为主要群落,占红树林总面积的95%以上。无瓣海桑群落呈浅绿色,植株高大,林相相对整齐;秋茄群落为本地种群落,枝繁茂密长势良好,树冠连续;卤蕨群落呈密灌丛状,呈现出墨绿色;老鼠簕群落为连续灌木丛,呈现出黄绿色。淇澳岛红树林生长区域附近植被以高大乔木为主,且生长位置地势较高,与红树林群落有明显的高差起伏。
红树林范围提取和种群分类是红树林研究的两个基本问题,近年来,主要采用遥感手段开展红树林范围监测和种群分类[3]。目前,国内外对红树林范围提取主要是利用遥感影像的植被指数、光谱和纹理特征等分类属性,结合红树林野外调查和相关先验知识,采用监督分类或面向对象的分类方法提取红树林空间分布或进行动态变化监测研究[4]。贾明明[5]基于Landsat 影像采用面向对象和决策树分类方法,提取了1973—2013 年中国红树林面积和分布;董迪等[6]提出了一种联合Sentinel-1 和Sentinel-2 影像的红树林和互花米草的遥感监测方法,并提取了2016—2018 年漳江口红树林和互花米草范围;张威[7]基于Landsat 影像,采用目视解译、监督分类、面向对象分类和决策树分类等方法,对广西北部湾1978—2014 年的红树林进行了遥感监测。
上述研究主要采用Landsat 和Sentinel-2 等遥感影像对红树林范围进行遥感监测,采用的分类方法包括监督分类、面向对象分类和决策树分类等。不同的遥感数据源和红树林分类方法虽然可以满足相应的研究要求,但没有文章综合对比不同的遥感影像在红树林范围提取中的适用性,以及如何使用辅助数据有效提升红树林范围提取的精度。本文以珠海淇澳岛为例,重点探讨Landsat-8、Sentinel-2 和高分6 号等遥感影像在红树林范围提取中的效果,并对比上述影像分别增加数字高程模型(Digital Elevation Model,DEM)数据、波段指数和纹理信息后的精度提升,从而有效指导使用何种遥感影像及辅助数据可以更好地应用于大区域的红树林范围提取。
1 数据获取及预处理
1.1 Landsat-8 数据获取及预处理
Landsat-8 由美国航空航天局(National Aeronautics and Space Administration,NASA)与美国地质调查局(United States Geological Survey,USGS)合作开发,于2013 年2 月11 日在加利福尼亚范登堡空军基地发射成功。Landsat-8 上携带了陆地成像仪(Operational Land Imager,OLI) 和热红外传感器(Thermal Infrared Sensor,TIRS)。
Landsat-8 影像可以从USGS 网站上免费下载。本文下载的影像为1 景2019 年9 月27 日获取的L2SP 产品,该数据包含陆地成像仪OLI 的8 个多光谱波段(分辨率为30 m)和1 个全色波段(分辨率为15 m),并已经过地形校正、几何校正、辐射校正和大气校正等预处理,本文选取第1~7 个光谱波段用于监督分类(第8 波段为全色波段,第9 波段为卷云波段)。在ENVI 5.3 软件中对上述光谱波段进行波段合并后,得到研究区域分辨率为30 m、包含7 个光谱波段的Landsat-8 影像反射率数据。
1.2 ASTER GDEM 数据获取
ASTER GDEM(Advanced Spaceborne Thermal Emission and Reflection Radiometer Global Digital Elevation Model) 数据由NASA 和日本经济产业省(Ministry of Economy Trade and Industry,METI) 联合研制并免费面向公众分发,分别于2009 年6 月28 日、2011 年1 月和2019 年8 月5 日发布了V1、V2和V3 版本。ASTER GDEM 数据同样可以从USGS网站上下载,本文获取的ASTER GDEM 数据为V3版本,水平分辨率为30 m,垂直分辨率为1 m。ASTER GDEM 数据获取后,可直接在ENVI 5.3 软件中与Landsat-8 影像数据进行波段合并。
1.3 Sentinel-2 数据获取及预处理
Sentinel-2 卫星是欧洲哥白尼(Copernicus)计划发射的系列卫星之一,Sentinel-2 卫星搭载多光谱传感器,主要应用于水资源监测、土地覆被变化监测和灾害应急监测等领域[8]。Sentinel-2 影像也可以从USGS 网站上免费下载。本文下载的影像为1景2019 年9 月7 日获取的L1C 产品,该数据共包含13 个光谱波段,分辨率分别为10 m (Band2、Band3、Band4 和Band8)、20 m(Band5、Band6、Band7、 Band8A、 Band11 和 Band12) 和 60 m(Band1、Band9 和Band10),并已经过地形校正和几何校正等预处理。
利用欧洲航天局开发的SNAP 软件对上述数据进行辐射校正和大气校正。在SNAP 软件中采用Sen2cor 插件进行处理,得到经过辐射校正和大气校正后的L2A 数据,该数据共包含12 个波段数据(Band10 为卷云图层,未做处理)。将各波段采用最近邻法按10 m 分辨率重采样后,在ENVI 软件中进行波段合并,得到分辨率10 m 包含12 个光谱波段的Sentinel-2 反射率数据。
在ENVI 5.3 软件中,对上述影像进行波段指数(Band Index,BI) 计算,包括归一化植被指数[9](Normalized Difference Vegetation Index,NDVI)、归一化水体指数[10](Normalized Difference Water Index,NDWI)和红树林指数[11](Mangrove Vegetation Index,MVI),用于后续监督分类。
式中,NIR 表示近红外波段;RED 表示红色波段;GREEN 表示绿色波段;SWIR1 表示短波红外波段(Sentinel-2 影像中的第11 个波段)。
归一化植被指数是反映绿色活植被相对丰度和活性的辐射量化值,常被用于表征研究区域的植被生理状况、绿色生物量及植被生产力等,能较好地反映植被的分布范围及生长状况;归一化水体指数通过用特定的遥感影像波段进行归一化差值处理,可以凸显影像中的水体信息,较好地区分水体与其他地物;红树林指数基于Sentinel-2 影像计算,可以快速且准确地进行红树林范围提取。
1.4 高分6 号数据获取及预处理
高分6 号是我国于2018 年6 月2 日发射的首颗精准农业观测的高分卫星,具有高分辨率、宽覆盖、高质量和高效成像等特点,能有力支撑农业资源监测、林业资源调查、防灾减灾救灾等工作[12]。本文获取的高分6 号影像为2019 年9 月30 日获取的L1A 级产品,该数据包含4 个分辨率为8 m 的多光谱波段和1 个分辨率为2 m 的全色波段,该数据已经过初步几何校正等预处理。
在ENVI 5.3 软件中对高分6 号多光谱影像进行辐射定标后,采用FLAASH 方法进行大气校正,再使用影像自带的RPC 参数进行正射校正,得到研究区域分辨率为8 m、包含4 个光谱波段的高分6号反射率数据。
1.5 多源遥感数据统一处理
将上述多源遥感数据统一坐标系(WGS1984)和投影(UTM 投影6 度分带49 投影带)后,利用现场测量控制点采用多项式拟合进行几何精校正,并使用相同的矢量范围对处理后的影像进行裁剪(图1)。
图1 预处理后的多源遥感数据
2 基于多源影像的红树林范围提取
随机森林(Random Forest,RF) 算法由Leo Breiman 提出,是一种由多棵CART 决策树构成的新型机器学习算法[13]。随机森林算法具有较强的抗噪能力,分类性能显著,主要用于解决回归与分类的问题,并在植被分类中应用比较广泛[14-15],本文统一采用该分类方法对已处理的多源遥感数据进行红树林范围提取。
2.1 监督分类样本数据选取
红树林范围提取难点在于与周边陆生植被的准确区分,为方便提取结果的对比分析,将研究区域地物分成红树林(Mangroves)、陆生植被(Trees)、水体(Water),以及裸地和建筑(Buildings)四种类型。红树林以外,生长在陆域的植被均归到陆生植被一类;海水、陆域河流、湖泊和水塘等均归到水体一类;滩涂、裸地、道路、房屋和人工建筑等均归到裸地和建筑一类。
采用目视解译与现场调查相结合的技术手段,在高分6 号融合影像上(分辨率为2 m,4 个波段)选取用于监督分类和精度验证的样本数据。样本选取采用框选,训练样本和验证样本比例约2 ∶1(图2)。
图2 基于高分6 号融合影像进行样本数据选取
2.2 基于Landsat-8 影像和ASTER GDEM 数据的红树林范围提取
在ENVI 5.3 软件中使用随机森林监督分类方法对预处理的Landsat-8 影像(分辨率为30 m,7 个波段)进行监督分类,分类结果见图3。使用随机森林分类时,Number of Trees 参数设置为100;Number of Features 参数选择Square Root;Impurity Function 参数选择Gini Coefficient;Min Node Samples 参数设置为1;Min Impurity 参数设置为0。
图3 Landsat-8 影像监督分类结果
将Landsat-8 影像与ASTER GDEM 数据进行波段合并,得到新的影像数据(分辨率为30 m,8 个波段),采用上述分类方法和参数设置对该数据进行监督分类,分类结果见图4。
图4 Landsat-8 影像和ASTER GDEM 数据监督分类结果
2.3 基于Sentinel-2 影像的红树林范围提取
在ENVI 5.3 软件中使用随机森林监督分类工具对预处理的Sentinel-2 影像(分辨率为10 m,12 个波段)进行监督分类,参数设置参考2.2 节,分类结果见图5。
图5 Sentinel-2 影像监督分类结果
将Sentinel-2 影像与NDVI、NDWI 和MVI 波段指数进行波段合并,得到新的影像数据(分辨率为10 m,15 个波段),采用2.2 节的分类方法和参数设置对该数据进行监督分类,分类结果见图6。
图6 Sentinel-2 影像+波段指数监督分类结果
2.4 基于高分6 号影像的红树林范围提取
在ENVI 5.3 软件中使用随机森林监督分类工具对预处理的高分6 号影像(分辨率为8 m,4 个波段)进行监督分类,参数设置参考2.2 节,分类结果见图7。
图7 高分6 号影像监督分类结果
高分6 号影像分辨率高且光谱波段数少,这些特征都不利于红树林等植被信息提取,需要提取纹理信息辅助红树林范围提取[16]。影像纹理信息通常计算灰度矩阵(Gray Level Co-occurrence Matrix,GLCM)来提取,灰度共生矩阵是像素距离和角度的矩阵函数,它通过计算遥感影像中一定距离和一定方向的两点灰度之间的相关性,来反映影像在方向、间隔、变化幅度及快慢上的综合信息。在ENVI 5.3 软件中,将高分6 号影像全色波段采用最近邻法重采样到8 m 分辨率后,采用“二阶概率统计的滤波(Co-occurrence Measures)”工具计算灰度共生矩阵,参数设置如下:同时勾选Mean、Variance、Homogeneity、 Contrast、 Dissimilarity、 Entropy、 Second Moment 和Correlation 8 个参数;Co-occurence Shift参数X 和Y 均设置为1;Grayscale Quantization Levels 参数设置为64;Proce-ssing Window(处理窗口)设置为15×15(经对比,使用该设置得到的分类精度最高),计算的纹理数据共包含8 个波段。
将高分6 号影像与纹理数据进行波段合并,得到新的影像数据(分辨率为8 m,12 个波段),采用2.2 节的分类方法和参数设置对该数据进行监督分类,分类结果见图8。
图8 高分6 号影像+纹理信息监督分类结果
3 红树林范围提取结果对比分析
本研究采用混淆矩阵对分类结果进行评价。混淆矩阵评价指标包括总体精度、Kappa 系数、生产者精度和用户精度等,总体精度表示被正确分类的样本数占总样本数的比例;Kappa 系数反映分类结果与参考数据的一致性;生产者精度表示被正确分类的样本数占参考样本总数的比例;用户精度表示被正确分类的样本数占待评价样本总数的比例。上述多源遥感数据采用随机森林分类结果见表1。
表1 多源遥感影像红树林提取结果
3.1 Landsat-8 影像和ASTER GDEM 数据红树林提取结果分析
由Landsat-8 影像监督分类结果(表2)可知,由于红树林与陆生植被光谱信息差异较小,Landsat-8 影像中陆生植被容易错分成红树林,红树林生产者精度仅为74.34%。加入ASTER GDEM 数据后,红树林的生产者精度提升了20.58%,总体精度也提升了3.51%(表3),主要原因是红树林生长的潮间带高程较低,而陆生植被生长区域高程普遍较高,加入ASTER GDEM 数据后能够较好地区分红树林和陆生植被。
表2 Landsat-8 影像分类精度
表3 Landsat-8 影像+ASTER GDEM 数据分类精度
3.2 Sentinel-2 影像红树林范围提取结果分析
由于Sentinel-2 影像拥有更多的光谱波段,在区分红树林和陆生植被上比Landsat-8 影像更有优势(表4),红树林和陆生植被分类精度均在90%左右。通过计算Sentinel-2 影像NDVI、NDWI 和MVI 等波段指数,并加入Sentinel-2 影像后分类,红树林的生产者精度提升了4.75%,总体精度提升了1.3%(表5)。
表4 Sentinel-2 影像分类精度
表5 Sentinel-2 影像+波段指数分类精度
3.3 高分6 号影像红树林提取结果分析
相比于Landsat-8 和Sentinel-2 影像,高分6 号影像拥有更少的光谱波段和更高的空间分辨率,红树林与陆生植被相互错分情况严重(表6),红树林生产者精度为74.58%,用户精度仅60.61%。考虑到高分6 号全色波段拥有更高的空间分辨率和更丰富的纹理信息,而红树林与陆生植被在纹理特征上差异明显,加入纹理信息后,红树林生产者精度提升了8.84%,用户精度提升了13.37%,总体精度提升了12.03%(表7)。
表6 高分6 号影像分类精度
表7 高分6 号影像+纹理信息分类精度
4 结 论
本文主要对比多源遥感影像数据加入DEM 数据、波段指数和纹理数据后的红树林范围提取精度,分析不同遥感影像及辅助数据对红树林范围提取精度的影响。根据实验结果及进一步分析可知,Landsat-8 影像由于其相对较低的空间分辨率和较多的光谱波段,用于红树林范围提取精度适中,加入ASTER GDEM 数据后精度提升明显;Sentinel-2 影像拥有更多的光谱波段和适中的空间分辨率,用于红树林范围提取总体精度最高;高分6 号影像由于光谱波段较少而空间分辨率相对较高,用于红树林范围提取精度最低,但加入纹理信息后精度提升明显。综上所述,Sentinel-2 影像拥有最多的光谱波段和适中的影像分辨率,数据获取免费且卫星重访周期短,是红树林范围提取最合适的遥感数据源;ASTER GDEM 数据能较好地区分红树林和陆生植被,是比较好的辅助数据。
随着遥感技术的发展及图像信息提取算法的提升,以监督分类为代表的机器学习算法越来越难满足不断提高的精度要求及智能化的图像处理要求。近年来,深度学习分类方法在遥感影像信息提取中应用越来越广泛且精度更高,后续文章将研究使用Sentinel-2 影像和ASTER GDEM 数据,基于深度学习方法进行红树林范围提取。