APP下载

一种基于高斯拟合的水生植被遥感分类阈值确定方法

2018-10-18闫大鹏周兴东罗菊花汪政辉余悠然

西安科技大学学报 2018年5期
关键词:叶类洪泽湖样点

闫大鹏,周兴东,刘 伟,罗菊花,芮 佳,汪政辉,余悠然

(1.江苏师范大学 地理测绘与城乡规划学院,江苏 徐州 221000;2.中国科学院 南京地理与湖泊研究所,江苏 南京 210000)

0 引 言

水生植被具有抑制风浪、阻滞水流、促进沉降、抑制藻类、澄清水质等作用,并可为鱼类提供栖息场所[1],在维持湖泊生态系统和渔业生产方面发挥重要作用[2]。浅水湖泊稳态转换理论认为,在一定条件下,水生植被的丰度和盖度决定着湖泊稳态类型[3]。水生植被繁茂的湖泊水质清澈,为典型的“清水态”湖泊,其生态系统健康,生态功能多样[4]。因此,浅水湖泊水生植被的类群空间分布及动态信息是湖泊稳态研究和评价的关键和基础,也可为湖泊科学管理提供理论指导[5]。

卫星遥感技术具有宏观、低成本、快速、动态的优势,同时具有实时性和历史追溯性等特点,已成为浅水湖泊水生植物主要类群(挺水、浮叶和沉水植物)监测研究的有效手段[6]。国内外学者基于遥感数据的各种方法和算法开展了水生植被的自动识别研究,如无监督分类、监督分类[17]和缨帽分类[18]等,其中,监督分类和决策树方法具有简单、快速和易于表达等优点,成为目前最主流、最广泛的水生植被遥感监测算法[8],基于遥感光谱信息,国内外学者已经构建一系列水生植被分类特征,如FVSI(Floating-leaved Vegetation Sensitive Index)、MSI(Macrophytes Spectral Index)、AGI(Algae Glass Index)等[9-11]。而在分类光谱特征的阈值确定方面,大部分研究均是通过大量与影像同步的实测样点训练获取阈值[12-14],如Ma等(2008)提出了一种水体透明度辅助的水生植被决策树模型[15],Zhao等(2012)根据水生植被的光谱特征指数建立了太湖水生植被监测的决策树模型[16]。但由于影像特征值受水生植被自身生长、大气条件和水环境等影响,同一个分类特征阈值不能直接用于多个影像,为高精度水生植被动态监测研究带来难点。围绕这一问题,Luo等(2014)提出了一种基于光谱指数排序法的水生植被遥感分类阈值计算方法,用于对太湖水生植被时空分布动态监测[19],但该方法仍需要获取至少一景影像的同步实测样点,以及基于先验知识,目视识别影像上的水生植被区域建立感兴趣区(ROI:region of interest),在缺乏同步实测样点和影像上水生植被难以识别时,无法进行阈值确定,难以对湖泊的水生植被进行快速、动态的监测。

文中基于HJ-CCD影像数据,获取水生植被光谱特征图像的直方图,结合高斯模型,建立了一种基于三阶高斯拟合的水生植被遥感分类阈值计算方法。该方法可实现无同步实测样点时,水生植被分类特征阈值的准确、自动化计算,为浅水湖泊的水生植被空间分布数据历史重建提供了有力的方法支撑,对湖泊生态修复及植物的打捞等具有重要的现实意义。

1 研究区概况及数据搜集

1.1 研究区概况

文中选取洪泽湖为研究区,洪泽湖是我国第四大淡水湖,位于江苏省北部的淮安、宿迁境内,面积约1 576.9 km2,平均水深1.77 m[13].洪泽湖具有旱涝调节,航行运输、纳污净水、渔业养殖和调节气候等功能,同时也是南水北调东线工程最大的蓄水湖泊和过水通道,其水质状况与周边城市居民的生产生活息息相关。洪泽湖为草型湖泊,水生植被是洪泽湖的重要组成部分。据资料显示,洪泽湖现存有挺水、浮叶和沉水3大植被类群,共计15科25种:沉水类植被9种,优势种为马来眼子菜(优势度达33.07%,相对频率达54.73%);挺水类植被9种,优势种为芦苇(优势率达29.05%,相对频率达44.59%);浮叶类植被7种,优势种为荇菜(优势率达17.65%,相对频率达21.62%)[13]。考虑到遥感光谱对各类型的可分性,根据水生植被叶片是否在水体之上,本论文将水生植被分为2大类:(1)叶片在水面之上的浮叶类植被,包括挺水、浮叶植被;(2)叶片在水面之下的沉水植被。

1.2 数据获取及预处理

由于已获取2013年8月初的洪泽湖水生植被采样点,本研究采用2013年8月3日覆盖洪泽湖的HJ-CCD影像,并对影像进行预处理,包括辐射定标,大气校正和几何校正等。使用中国资源卫星应用中心提供的《2014年国产陆地观测卫星绝对辐射定标系数》将CCD影像DN值转换为辐射亮度数据;使用ENVI 5.3软件下的FLAASH大气校正模块进行了大气校正;选择已几何精校正的Landsat TM影像为基准影像(投影为UTM,椭球体为WGS84),利用最近邻像元重采样方法进行几何校正,再转换为Albers投影以计算面积;最后利用洪泽湖边界对预处理后的影像裁切。

在影像过境时间的前后2天(8月1日~8月5日)开展实测样点采集,共采集有效样点93个(30个浮叶类植被样点、32个沉水植被样点和31个水体样点)(图1),采集信息包括样点经纬度、水生植被类型、覆盖度、照片等。采集样点时,选择在60 m*60 m的水生植被区的中心位置定位,水生植被类型为该区域内的优势种群。

图1 研究区位置及采样点分布Fig.1 Location of the study area and distribution of sampling points

2 研究方法

文中利用主流的决策树遥感分类方法开展洪泽湖浮叶类植被、沉水植被和水体的分类。其中分类特征和其阈值的确定是决策树遥感分类方法的关键。

2.1 分类光谱特征选取

国内外学者已应用或构建了多个水生植被光谱指数作为决策树分类特征,如AGI,RVI,MSI,FVSI,SVSI等。本论文选取了Luo等(2014)提出的浮叶植被敏感光谱指数FVSI和沉水植被敏感光谱指数SVSI作为分类特征指数[19](式(1)、(2))。

FVSI=PC1-PC2

(1)

SVSI=BI-GVI

(2)

式中PC1,PC2指预处理后的影像进行主成分分析的第一主成分和第二主成分;BI和GVI指预处理后影像进行缨帽变换后的亮度指数和绿度指数[19]。

考虑到不同影像由于获取时间,大气条件以及水环境参数不同,会导致影像特征指数范围差异较大,为减少差异,本文使用离差标准化方法对FVSI和SVSI图像进行归一化,得到归一化的FVSI(ND_FVSI)和归一化的SVSI(ND_SVSI)(式(3)、(4)),ND_FVSI和ND_SVSI为本研究开展浮叶类和沉水植被的分类特征构建决策树。

(3)

(4)

式中FVSImin为FVSI指数的最小值;FVSImax为FVSI指数的最大值;SVSImin为SVSI指数的最小值;SVSImax为SVSI指数的最大值。

2.2 阈值确定方法

一般来说,如果一个变量受许多微小的独立随机因素影响,则该变量服从正态分布(中心极限定理)。正态分布是一种概率分布(高斯分布),若随机变量X服从正态分布,则可通过参数μ和σ2来表征其概率密度,记作N(μ,σ2)(式(5))。

(5)

式中 参数μ是服从正态分布的随机变量的均值,参数σ2是此随机变量的方差。

理论上,遥感光谱特征图像中,每类地物的概率密度分布均可通过正态分布表征,因此,特征值概率密度分布将呈现多个正态分布。假设该光谱特征对某地类敏感,那么在特征图像的概率密度分布中,该地类呈现明显的正态分布,与其他地类的正态分布交叠少,可分性强(图2)。那么,可通过多阶高斯模型来表征该敏感特征图像的概率密度函数(式(6))。

(6)

图2 高斯模拟示意Fig.2 Gaussian simulation diagram

式中ai为第i个高斯曲线的拟合系数;μi为第i个高斯曲线的均值即峰值(最大发生概率);σi为标准差。那么第i个曲线代表的地物特征指数分布范围则为相邻2个高斯曲线的置信区间交叠部分中值,即

(5)

(6)

3 结果与分析

3.1 水生植被分类特征图像

对研究区影像进行主成分变换和缨帽变换,得到第二主成分PC2以及亮度指数BI和绿度指数GVI,计算得到研究区影像的FVSI,SVSI指数图像,并使用离差标准化方法对FVSI指数和SVSI指数进行归一化,得到归一化浮叶类植被敏感光谱指数ND_FVSI图像和归一化沉水植被敏感光谱指数ND_SVSI图像,在ND_FVSI指数的灰度图像中,浮叶类植被所在像元值明显小于水体和沉水植被,ND_SVSI指数灰度图像中,沉水和浮叶类植被所在像元值明显小于水体,如图3所示。

(a)洪泽湖HJ-1B影像;(b)ND_FVSI图像;(c)ND_SVSI图像图3 水生植被分类特征图像Fig.3 Aquatic vegetation classification feature image

3.2 高斯模拟及阈值计算

图4((a),(b))为研究区ND_FVSI图像和ND_SVSI图像的频率直方图,结果显示,ND_FVSI和ND_SVSI频率直方图均符合三阶高斯分布(图4(c),(d)),拟合模型的R2分别为0.997 8和0.962 7.表1为ND_FVSI和ND_SVSI的高斯模型的参数。

根据ND_FVSI和ND_SVSI指数的三阶高斯模型拟合结果,得到拟合参数,见表1.

表1 ND_FVSI和ND_SVSI的高斯拟合参数

将ND_FVSI和ND_SVSI的高斯拟合参数代入式(6),得到ND_FVSI和ND_SVSI的分类阈值分别为m1=0.63和m2=0.29.

3.3 分类决策树构建及验证

考虑到浮叶类植被相比沉水植被,有较典型的光谱特征,在遥感图像上具有较强的可分性,故本研究先通过ND_FVSI和其分类阈值(m1=0.63)提取研究区的浮叶类植被,然后再利用ND_SVSI和其阈值(m2=0.29)区分水体和沉水植被。图5为本研究构建洪泽湖水生植被遥感分类决策树。

图4 洪泽湖光谱分类特征Fig.4 Histogram of spectral classification characteristics of Hongze Lake

图5 洪泽湖水生植被遥感分类决策树Fig.5 Hongze Lake aquatic vegetation remote sensing classification decision tree

将图5的决策树应用与洪泽湖影像开展分类,图6为2013年8月3日洪泽湖水生植被分类结果。分类结果显示,洪泽湖水生植被面积约为649.45 km2,占洪泽湖面积的39.08%,其中优势类群为浮叶类植被(面积约为357.04 km2,占洪泽湖面积的21.48%)。

图6 水生植被遥感分类Fig.6 Remote sensing classification of aquatic vegetation

利用实测样点对分类结果进行验证,表2为分类误差矩阵。结果显示,本研究提出的分类方法和阈值对洪泽湖水生植被的分类总体精度为84%,Kappa系数76%.其中,浮叶类植被和沉水植被的分类精度分别为86%和82%.

表2 高斯模型拟合确定阈值的水生植被分类精度

4 结 论

1)水生植被中浮叶类和沉水植被的概率密度分布符合正态分布的形态,在决策树模型中可以通过高斯拟合的方法计算出其阈值;

2)通过建立三阶高斯模型来确定水生植被的分类特征指数阈值,不需要实测样点的支持,并且分类精度较高,能够满足水生植被自动化分类的要求;

3)不足之处在于:本研究仅对洪泽湖进行了水生植被分类研究,考虑到不同湖泊的水环境参数差异很大,而本方法是否适用于所有浅水湖泊的水生植被分类,还有待于进一步研究。另外,洪泽湖中仅由水体、浮叶类植被和沉水植被3部分构成,而部分浅水湖泊中存在藻华,三阶高斯模型是否适用于含有藻华的湖泊也有待于进一步探讨。

猜你喜欢

叶类洪泽湖样点
小麦条锈病田间为害损失的初步分析
浅谈叶类蔬菜收获装备技术的现状及发展趋势
四川省叶类蔬菜机械化发展现状及对策
基于空间模拟退火算法的最优土壤采样尺度选择研究①
浩浩碧波润江淮——洪泽湖
洪泽湖绿
洪泽湖渔家
我国茎叶类蔬菜有序收获技术达国际领先水平
What a happy day!
切分及烹调对叶类蔬菜品质的影响