GF-1与GF-6 WFV影像在滇池悬浮物浓度反演中的对比分析
2023-01-31杨凤芸孟庆岩康育鹏郑佳媛胡新礼
赵 冉,杨凤芸*,孟庆岩,康育鹏,郑佳媛,胡新礼,杨 杭
1.辽宁科技大学土木工程学院,辽宁 鞍山 114051 2.中国科学院空天信息创新研究院,北京 100101 3.中国科学院大学资源与环境学院,北京 100049 4.河南理工大学测绘与国土信息工程学院,河南 焦作 454003
引 言
总悬浮物(total suspended matter, TSM)作为主要的水质参数之一,其含量直接影响着光在水中的传播进而决定了湖泊的初级生产力[1]。传统的水质监测方法费时费力,易受水文、天气等影响,遥感技术的发展和应用为水质监测带来了新的手段。目前,国内外学者多采用MODIS,Landsat-8和Sentinel-2等数据开展水体TSM监测研究,如Shi[2]等基于多年实测数据与MODIS影像构建了用于估算中国太湖TSM稳健的经验模型,并对太湖长时间序列的TSM进行分析。Kuhn[3]等采用Sentinel-2和Landsat-8数据分别对三条河流的叶绿素a与浑浊度进行反演并对比两种数据的反演结果。随着水环境遥感的不断发展,国内外学者对于水体TSM估算也提出了不同的思路,如Molkov[4]等提出的一种采用单一辐射计同时在现场测量遥感反射率和采用高速滑行摩托艇上的紫外荧光激光雷达测量水成分浓度的方法,并建立了波段比值模型反演了TSM。
TSM监测为后续悬浮物的估算提供支撑,当前遥感估算以建立星上行与实测点之间的相关关系为主,其中经验方法[5-6]作为水质参数反演中较为成熟的方法,模型构建较为简单且能在一定程度上削弱大气校正产生的误差影响,张毅博[7]等采用Landsat 8的蓝、绿和全色波段构建了TSM多元回归模型对新安江水库进行反演研究。Cao[8]等对Landsat多光谱数据构建了B5/B4的比值模型对于桥水库悬浮物浓度进行评估效果较好。Liu[9]等基于GOCI数据开发了一种基于光谱吸收指数的经验TSM检索算法,该算法以蓝、绿、近红外波段构建SAI指数建立与TSM之间的函数关系,估算TSM浓度,实验表明SAI算法对于TSM浓度较高的区域反演效果较好。李建鸿[10]等研究发现水体高光谱数据的B707/B536与TSM浓度的相关性最高。上述研究表明,经验模型的方法可以有效反演水体TSM浓度,500~900 nm波段为TSM反演的敏感波段,本工作选择经验方法对研究区进行TSM研究。
随着国产高分辨率卫星的推广应用,高分系列卫星在水质监测方面得到广泛应用,如Na[11]等采用GF-1/WFV卫星和水质监测数据,筛选了钦州湾近岸水体叶绿素a浓度的敏感波段和波段组合,利用逐步回归分析构建了叶绿素a反演模型。Chen等[12]采用GF-4卫星数据对杭州湾悬浮物浓度进行反演并分析了海底地形与潮汐过程对TSM的影响。作为我国首颗精准农业监测的高分卫星,GF-6/WFV已经开始应用于在水质参数反演方面,如李宏哲[13]等采用GF-6与Landsat-8对巢湖水质富营养化状态进行了差异性评价,Guo[14]等对GF-1/WFV和GF-6/WFV数据的一致性做了相关分析,但目前还未见对GF-1/WFV与GF-6/WFV卫星数据在水质参数反演中效果进行对比分析,本工作针对此问题在GF-1/WFV与GF-6/WFV相同波段具有一致性的研究基础上,采用经验方法对GF-6/WFV新增波段在水体TSM反演效果与GF-1/WFV进行对比分析,反演了2020年各月份TSM并对其时空分布进行分析,以期为GF-6/WFV在水质监测中的应用提供依据,为未来内陆水质监测传感器的波段设置提供参考和借鉴。
1 实验部分
1.1 研究区概况
滇池位于云南省昆明市南部(102°37′—102°48′E,24°40′—25°02′N),是云南省面积最大的高原湖泊,也是全国第六大淡水湖,素有“高原明珠”之称,湖泊水面面积约309 km2,蓄水量达15.6亿m3。随着城市化发展,位于昆明市城市下游的滇池水污染负荷日益严重,20世纪60年代,水体清澈见底,水生植物丰富,水质达到Ⅱ类标准;70年代水质降为Ⅲ类;80年代后水体富营养化严重,草海水质为Ⅴ类,外海水质为Ⅳ类;90年代整体水质为Ⅴ类;2000年后整个湖泊水质为劣Ⅴ类。滇池水质的恶化不仅对水生动植物的生存造成威胁也对当地的生态环境造成严重影响,因此研究滇池水域TSM的状况对滇池及周边环境的治理和保护十分重要。
1.2 实地采样数据
实地水体样本采集时间为2020年11月19日与2020年11月22日,采样当天天气晴朗无云、水面风浪较小,采用手持GPS进行定位并记录采样点经纬度,共采集21个样本如图1所示,基本覆盖整个湖面。在水样采集过程中,尽量保持船只与水面相对静止,收集水样的瓶子需用样点处水体冲洗2~3次,并做好标记存储在阴凉处,待采样完毕立即送往实验室采用过滤烘干法测量TSM。
图1 研究区域与采样点分布
1.3 遥感影像数据
使用的遥感影像数据为GF-1/WFV(以下简称GF-1)和GF-6/WFV(以下简称GF-6),两种影像数据的主要参数对比如表1所示,影像数据获取时间分别为2020年11月21日与2020年11月19日。研究区域在影像获取日期内基本无云层覆盖,平均云量均小于5%,GF-1与GF-6数据定标参数在中国资源卫星应用中心(http://www.cresda.com/CN/)获得。为了观察滇池TSM的时空变化情况,研究下载了2020年5月—12月共计6幅GF-6/WFV影像,成像日期分别为5月10日、7月27日、9月2日、10月13日、11月19日和12月26日。
表1 GF-1与GF-6影像的主要参数对比
2 实验部分
2.1 波段一致性分析方法
采用统计分析方法对GF-1和GF-6数据的蓝、绿、红和近红外波段进行一致性分析,将研究区地物分为4类包括为耕地、林地、水田和水体,每种地物选取20~30个感兴趣区,将GF-1与GF-6影像的不同地物感兴趣区对应的各波段地表反射率值形成散点图,并进行线性拟合计算决定系数,决定系数越高则表明两种传感器对应波段的一致性越强。
2.2 基于实测数据的反演建模
基于遥感的水质监测主要依据实测水体数据与遥感影像波段的相关性构建反演模型。常规的水质反演方法包括经验方法、半经验/半分析方法、分析方法和机器学习方法。本研究采用经验方法对水体TSM进行反演,经验方法是通过一定的数学方法或数据处理手段,选择最优波段或波段组合方式直接建立遥感数据与同步实测的水质参数间的经验统计关系,在统计学中常见的回归方法包括指数函数、线性函数、对数函数、多项式函数以及幂函数等,本研究通过对GF-1和GF-6的各波段与TSM进行相关性分析选取敏感波段,对敏感波段进行波段组合,选择最优方法建立基于高分六号数据的滇池TSM反演模型。
2.3 精度评价
由于研究区采样数据较少,为避免模型受建模和验证样本分离的影响,消除潜在异常值对算法精度的影响,本研究采用交叉检验的每次留一点法(leave-one-out cross validation, LOOCV)方法进行精度评价[15]。模型的精度评价同时也是衡量模型是否合理的一个标准,选用均方根误差(RMSE)、平均绝对百分比误差(MAPE)作为检验反演效果的评价指标, 其计算公式如式(1)和式(2)所示。
(1)
(2)
3 结果与讨论
3.1 实测样本数据与光谱分析
根据研究区内实测样本数据,在滇池北岸由于周围分布较多码头,人类活动频繁导致TSM较高(19~40 mg·L-1), 外海其他区域TSM分布较为均匀(10~15 mg·L-1),这与湖体其他区域离昆明市区较远及湖边周围用地多为耕地和林地有关,其中滇池草海TSM较低(4~10 mg·L-1),水质状况较好,得益于近年来的针对草海实施的牛栏江-草海应急补水工程、新老运粮河水体净化生态工程和海埂大堤水体置换通道工程,使得草海治理取得显著成效。
滇池实测水面光谱曲线如图2所示,每个采样点对应一条光谱曲线,水体光谱数据选用水面以上光谱测量法获得,一般来说,TSM的光谱特征会因水域不同而有所差异,但总体呈现“双峰”特性[16],在滇池区域悬浮物光谱呈现多峰特征,峰值波段范围主要集中在500~600和700~850 nm波谱范围,与GF-1多光谱数据的绿波段和近红外波段以及GF-6多光谱数据的绿波段、近红外波段、红边1波段(红边710)、红边2波段(红边750)波谱范围高度契合。本研究基于滇池TSM水体光谱特性,对绿、近红外和两个红边波段进行波段组合,在此基础上选择相关系数较高的回归模型开展GF-1与GF-6数据的TSM遥感反演研究。
图2 水体光谱数据
3.2 GF-1与GF-6相同波段的一致性分析
采用2020年11月21日(GF-1)和2020年11月19日(GF-6)影像相同波段范围及光谱响应函数进行分析,在这两天时间间隔内,土地覆盖状况相似,两个传感器之间的一致性分析合理,图3中虚线表示GF-1遥感影像的波谱响应函数,实线表示GF-6遥感影像的波谱响应函数,从图3中可以看出GF-1和GF-6的蓝、绿、红、近红外四个波段在波宽设置上比较一致,中心波长也几乎重合。
图3 GF-1和GF-6光谱响应函数
由于GF-1和GF-6传感器的空间分辨率相同,在对其进行相同波段对比时,通过统计分析法来对各个对应波段进行逐一对比,在经过几何精校正的GF-1和GF-6试验影像中选取水体、植被、水田和耕地四种地物共计100个感兴趣区(region of interest, ROI),以各样区的表观反射率进行相关性分析,样区总像元数为1 455个。根据提取ROI对两种数据的相同波段进行统计分析得到波段一致性结果(图4)。横轴为CF-6传感器不同地物波段反射率,纵轴为CF-1传感器不同地物波段反射率,对样区的不同波段表现反射率做线性分析,可以看出,GF-1和GF-6光谱反射率高度相关,蓝色、绿色、红色、近红外波段的相关系数分别为0.98,0.98,0.97和0.99。光谱反射率的一致性主要是由于两种传感器的相对光谱相似导致的,通过实验分析可以认为GF-1与GF-6相同波段具有一致性。
图4 4个波段GF-1与GF-6交互对比散点图
在GF-1与GF-6相同波段一致性的基础上,分别对两种数据与实测TSM构建经验模型,GF-6数据加入了新增波段,若GF-6构建的经验模型精度相较于GF-1更高,则说明GF-6新增波段对于TSM反演具有积极作用。
3.3 基于GF-1和GF-6的TSM最佳反演模型
GF-1卫星数据共有4个波段,在进行滇池悬浮物浓度反演时,采用各波段的真实地表反射率值与同步采样点的悬浮物浓度值进行Pearson相关性分析,分析结果如表2所示。
表2 GF-1单波段数据与悬浮物浓度相关性分析结果
从表2中可以看出,除了B3外,B1,B2和B4都与实测数据具有一定的相关性,但是相关程度并不高,为了得到更高精度的反演模型,对GF-1数据的B1,B2和B4波段进行波段组合,选择最优化模型与GF-6数据构建模型进行比较。
GF-6卫星数据共有8个波段,在进行滇池悬浮物浓度反演时,采用各波段的真实地表反射率值与同步采样点的悬浮物浓度值进行Pearson相关性分析,分析结果如表3所示。
从表3中可以看出,B2,B4,B5和B6波段与实测数据有一定的相关性,而B4,B5和B6波段与实测数据的相关性更高,对这三个波段进行波段组合,构建GF-6数据的最优模型。
表3 GF-6单波段数据与悬浮物浓度相关性分析结果
GF-1和GF-6卫星数据与实测TSM值的单波段和波段组合在五种函数形式下回归一共可产生130和270种反演模型,表4和表5中仅列出部分GF-1和GF-6在某一模型下最好的单波段或波段组合。通过对GF-1单波段进行分析可知近红外波段与TSM相关性最高,其次为蓝波段和绿波段,波段组合算法(模型“B2+B4-B1”,R2=0.78,RMSE=6.35 mg·L-1,MAPE=23.60%)优于单波段算法(模型“B4”,R2=0.75,RMSE=7.21 mg·L-1,MAPE=25.11%)。
表4 TSM与GF-1波段组合统计建模
表5 TSM与GF-6波段组合统计建模
从模型函数上看,GF-1卫星数据采用波段组合构建的指数函数和幂函数反演效果较好,B2+B4-B1模型的函数形式为式(1)
y=1.712 3e0.003x
x=Rrs(B2)+Rrs(B4)-Rrs(B1)
(1)
GF-6卫星与TSM相关性较高的波段为近红外、红边1和红边2波段,波段组合算法(模型“1/B5+B6”,R2=0.88,RMSE=3.07 mg·L-1,MAPE=20.65%)优于单波段算法(模型“B5”,R2=0.87,RMSE=4.05 mg·L-1,MAPE=20.01%)。
GF-6卫星数据构建的波段组合模型为1/B5+B6,函数形式为式(2)
y=0.000 3x2-0.135 7x+22.474
x=1/Rrs(B5)+Rrs(B6)
(2)
对GF-1构建的差值模型“B1-B4”与GF-6构建的“B5-B4”模型进行对比分析,在两种数据近红外波段具有一致性的基础上,发现GF-6构建的“B5-B4”模型与TSM的相关性更高(R2=0.85,RMSE=5.55 mg·L-1,MAPE=34.31%),实验构建的其他对比模型也得到了相同的结论,验证了红边波段在TSM反演中的适用性。红边波段对于估算植被叶绿素含量、森林冠层覆盖度和叶面积指数等生物物理变量有重要指示作用[17],在水体水质参数反演方面还未见相关研究,由于滇池是以蓝藻为优势类群的湖泊,因此在加入红边波段进行建模时,模型反演精度得到了提高。
3.4 基于GF-1与GF-6影像的TSM估算与验证
将构建的最佳模型分别应用于GF-1和GF-6卫星影像,获得了滇池水域TSM分布情况,对该模型进行验证如图5所示。GF-1卫星反演结果在TSM较大时,反演结果相对误差较大,如样本3和样本11的相对误差分别为62%和46%,可能是由于这两个样本靠近岸边,水体光谱和陆地光谱混合导致预测结果误差较大。如果去除两个误差较大的点,模型平均误差为20.60%,GF-6卫星构建TSM模型平均误差为23.60%,模型预测值均分布在1∶1直线附近,模型在TSM较小时,反演效果更好。
图5 GF-1(a)和GF-6(b)建模验证
对GF-1与GF-6模型预测值与实测值之间相关系数对比分析可知,GF-1模型预测值与实测值之间的相关系数为0.57,GF-6模型预测值与实测值之间的相关系数为0.92。相关系数越接近1,说明模型预测值与实测值之间的相关性越强。GF-6构建的波段组合模型加入两个红边波段后,模型反演精度较GF-1模型反演精度更好,说明红边波段对于TSM的反演具有积极作用,GF-6卫星数据在水质参数反演方面的适用性较好。
3.5 TSM时空分布特征
根据GF-1和GF-6模型对比结果,将GF-6最优化模型应用于2020年获得的5月、7月、9月、10月、11月、12月共计6幅影像得到各月份的TSM分布情况(图6),结果显示滇池区域外海北岸TSM较高(最大值为45 mg·L-1),湖心区及滇池南部TSM较低且分布较为均匀(平均值为12 mg·L-1),草海区域由于海埂大坝拦截和水体净化工程治理TSM较低(平均值为5 mg·L-1)。
图6 2020年滇池不同月份TSM时空分布图
从TSM时间分布来看,5月到12月份TSM具有先上升后下降的趋势,其中9月份全湖平均TSM达到最高为26.43 mg·L-1,12月份最低为10.67 mg·L-1。呈现这种时间分布的原因为云南地处低纬高原,属于亚热带湿润气候,存在明显的干湿两季,5到9月份处于雨季,雨水的增多加剧了湖泊水体的流动性使得水中TSM增加。从TSM空间分布来看,呈现北重南轻的分布态势,滇池TSM浓度较高的地区主要分布在滇池北岸的官渡区沿岸,滇池北岸分布着大量河流如盘龙江、宝象河、海河等有关,这些河流流经昆明市主城区携带大量生活废水和污染物汇入滇池,并且随着主城区人口的增加,生活污水的排放也随之增加,导致滇池北岸的TSM浓度一直偏高。此外,在海埂公园一带作为红嘴鸥的栖息地,其排泄物和其他污染物带入湖中,这也是导致湖泊岸边TSM浓度较高的原因。滇池南岸的晋宁区和东岸的呈贡区周边分布农田较多,农业面源污染严重,使得在植物生长期滇池南岸和东岸TSM浓度较其他月份偏高。滇池西岸的西山区远离昆明市区,山川林地较多并且是昆明公园最多的主城区,环境优美人为污染较少,沿岸水质TSM浓度较低。
4 结 论
以滇池水域的实测TSM数据为基础,建立了基于GF-1和GF-6经验模型,并对两种数据构建的TSM模型进行了对比分析,得到如下结论:
(1)通过对GF-1和GF-6的蓝、绿、红、近红外波段进行对比分析,发现两种数据的蓝、绿、红、近红外波段的相关性分别为0.98,0.98,0.97和0.99,具有较高的波段一致性。
(2)GF-1卫星影像的“B2+B4-B1”波段组合是滇池TSM反演建模的最佳波段组合,模型的决定系数为0.78,均方根误差为6.35 mg·L-1,平均绝对百分比误差为23.60%。
(3)GF-6卫星影像的“1/B5+B6”波段组合是滇池TSM反演建模的最佳波段组合,模型的决定系数为0.88,均方根误差为3.07 mg·L-1,平均绝对百分比为20.65%。与GF-1相比,加入红边波段建模反演精度更高,说明GF-6红边波段在水体TSM反演方面具有潜力。
(4)采用GF-6数据构建的最佳模型应用于遥感影像得到滇池TSM时空分布,该水域TSM时间分布呈现上升-下降趋势,与研究区域地理位置和气候特征有关,空间分布呈现北重南轻的分布态势,且滇池北岸受河流、季风等因素影响TSM较高。