基于OLI数据的信阳市境内淮河流域水质遥感反演
2021-01-16张宏建周健皇甫款
张宏建 周健 皇甫款
摘要:运用遥感影像进行连续、大范围的水质监测是目前研究水环境问题的热点之一。為探索更多可以利用遥感监测的水质指标,以快速获取水质指标时空分布情况,为水环境治理提供数据支持,以河南省信阳市境内淮河流域为研究对象,根据实测水文监测数据建立了OLI数据与水质指标(WQI)之间的统计模型,包括溶解氧(DO)、氟化物、氨氮(NH3-N)、总磷(TP)以及pH等,以探寻更多能够利用OLI数据进行监测的水质参数。结果表明:① OLI数据可以用于监测氨氮、总磷、pH值、氟化物、溶解氧的空间分布;② 研究区内整体水质偏碱性,氟化物含量较低,不存在过度氟污染;③ 干支流交汇处以及城区河段氨氮、总磷污染较重,溶解氧含量低,需加强水质管理。
关 键 词:OLI数据; 水质指标; Landsat8影像; 水质反演; 遥感反演; 信阳境内淮河流域
中图法分类号: X832;X87
文献标志码: A
DOI:10.16232/j.cnki.1001-4179.2021.12.008
0 引 言
“绿水青山就是金山银山”是习近平总书记关于生态文明建设最著名的科学论断之一,揭示了保护环境就是保护生产力,改善环境就是发展生产力的客观规律。据不完全统计,中国淮河、海河、松花江、黄河、辽河水系的水质都受到了不同程度的污染[1]。受到污染的河流由于汇流作用间接影响了湖泊、海洋等水体的水质情况[2-4]。促进水生态文明建设,必须加强内陆水体水质监测,改善内陆水环境问题。传统的水质监测方法即为布设监测断面对水体环境中存在的污染因素或者污染物进行监测,这种监测方式需投入大量人力、物力、财力[5-7]。除此之外中国水域面积较大,相对来讲目前全国所设置的固定监测断面或水文站的数量十分有限,这也使得传统的监测方法的局限性更加明显。
卫星遥感影像覆盖范围广、成像速度快、信息量丰富且性价比高,能有效弥补传统的水质监测方法费时、费力、难以同步反映整个区域的缺点,非常适合用于水体污染物浓度的监测。随着遥感空间技术的发展,利用遥感监测水质信息的工作也逐渐展开。利用遥感对水质信息进行监测的技术逐渐从定性监测发展到定量监测[8-9]。国内外应用遥感监测水质指标中大多研究区在水面较为宽广的湖泊或海岸[10-12]。水质监测中常用的遥感数据主要有HRV数据、Landsat系列数据、EO-1卫星数据、AVHRR数据、环境1号数据等。考虑到时间分辨率、空间分辨率、数据的易获得性及光谱分辨率等因素,目前内陆水体定量遥感中比较常用的是免费、易获得的中高分辨率影像数据[13]。Landsat8影像比之前的Landsat系列信噪比高,对于水质监测部门来说,是目前非常好用的数据源。
水污染受多种因素影响[12],常规监测的水质指标(WQI,Water Quality Index)有叶绿素a、浊度、总悬浮物浓度、溶解氧、氨氮、五日生化需氧量、高锰酸盐指数和化学需氧量等[14-16]。本文研究了Landsat8遥感卫星的OLI(Operational Land Imager)数据与水质指标(WQI)之间的统计模型,包括溶解氧(DO)、氟化物、氨氮(NH3-N)、总磷(TP)以及pH值,重点在于分析Landsat8影像各波段或波段组合与各类指标的相关性,以及各水质指标之间的相关性,旨在探索更多适合利用遥感进行监测的水质指标,丰富水质反演方面的研究。在此基础之上,寻找利用Landsat8影像监测WQI的最优波段组合,为Landsat8数据在水质遥感中的应用(尤其是不易直接进入或者采样和化学分析成本较高的偏远地区的应用)提供数据支撑。
1 材料与方法
1.1 Landsat8遥感数据介绍
本研究从地理空间数据云上面下载了2016年3月1日的 Landsat8卫星影像,云量1.21%,影像质量较高。Landsat8卫星携带有陆地成像仪(OLI)和热红外传感器[14](TIRS),将波段5,6,4进行假彩色合成,水体边界清晰,能有效区分陆地和水体,深浅的橙色和绿色是陆地,深浅蓝色是水体。表1列出了Landsat8卫星的波段信息。本文主要使用了0.450~2.300 μm的波段数据。
1.2 Landsat8数据预处理
首先利用envi5.3对获取的遥感影像进行预处理,包括辐射定标和大气校正。辐射定标可消除传感器本身的影响,它将记录的原始DN值(像元亮度值)转换为大气外层表面反射率L(或称为辐射亮度值)。
L=gain×DN+offset(1)
gain=Lmaxλ-LminλfullDNrange=Lmaxλ-LminλDNmaxλ-DNminλ(2)
offset=Lminλ(3)
式中:每个含有λ角标的参数表示不同波段影像取值不同,具体参数可以从卫星影像的头文件中得到;L是某个波段光谱辐射亮度;gain为增量校正系数;offset为校正偏差量;DN是图像灰度值;DNmax和DNmin为遥感器最大和最小灰度值;Lmax和Lmin分别为最大和最小灰度值所相应的辐射亮度。
大气校正是使用多光谱遥感数据进行地表参数定量分析的前提,主要用于减少或消除气溶胶和大气分子的吸收和散射对地物反射率的影响。本研究主要是用FLAASH大气校正方法对原始数据进行处理,处理结果如图1所示,预处理过程均在ENVI5.3环境下进行。为了减少岸边混合像元造成的偶然误差,在选取各波段图像上取样点的DN值的时候采取3×3的矩阵,选取掩模内灰度值最小的像元(与其他地物相比,水体的反射率相对较低)进行取样。
1.3 相关分析方法
相关分析常用的5种方法为图表相关分析、协方差及协方差矩阵、相关系数、一元或多元回归、信息熵和互信息。由于本文需要提炼模型进行预测,因此选用回归的方式进行相关分析。回归分析过程中主要采用单波段模型和波段组合模型。单波段模型即在单波段影像的水体反射率与各水质指标之间建立相关关系。波段组合模型中组合方式主要有差值模型、比值模型及一些水体指数模型[17-19],如公式(4)~(11)所示。
EWI=B3-B5-B6B3+B5+B6(4)
RNDWVI=3×B2+1.5×B3-B5-
2×B6+B7(5)
RNDWI=B6-B4/B6+B4(6)
AWEInsh=4×B3-B6-(0.25×B5+
2.75×B7)(7)
AWEIsh=B2+2.5×B3-1.5×
B5+B6-0.25×B7(8)
IWS=4×B6-B2B6-2×B6B2(9)
NDWI=(B3-B5)/(B3+B5)(10)
NWI=NDWI-RNDWVI+AWEInsh+AWEInshNDWI+RNDWVI+AWEInsh+AWEInsh(11)
式中:B2,B3,B5,B6,B7分别为Landsat8影像的Blue,Green,NIR,SWIR1,SWIR2的表观反射率;
EWI为增强型水体指数,RNDWVI为修订型归一化植被指数,RNDWI为修订型归一化水体指数,NDWI为归一化水体指数,NWI为新型水体指数,IWS、AWEInsh和AWEIsh为自动化水体提取指数。
水质反演模型有经验统计模型和机器学习模型。经验统计模型简单有效、准确性差些,但对样本数量无较高要求。人工神经网络等机器学习方法的准确性高,但需要大量样本数据进行预训练,且无法提供具体的定量表达式。因此,笔者所构建的反演模型主要考虑了5种经验统计模型,如表2所列。
1.4 遥感水质监测机理
一般来说清洁水体有固定的电磁强度,而一些污染指标如藻类、富营养化物质、有机污染物等的电磁强度与水体不同,一旦水体被污染,水体的表面特性就会发生变化,进而改变水表面对电磁波的反射强度,而这改变了的强度具体表现为遥感图像上不同的地物水体反射率值。理论上来讲,水体表面反射率与水体污染指标之间可能存在某种函数关系。
Rλ=F(x)(12)
式中:Rλ是λ波段的水体反射率,x是某污染指标的浓度。
遥感水质监测的方法主要有直接法和间接法。直接法通常是根据光学活性水质参数与遥感数据之间的内在联系直接建立反演模型进行水质参数的反演。间接法通常适用于非光学活性水质参数,基于遥感反演得到的光学活性水质参数,利用非光学活性水质参数与光学活性水质参数之间强相关性,建立模型,间接进行非光学活性水质参数的反演。由于水体类型差异、季节性差异和地域差异,某些非光学活性水质参数与光学活性水质参数的相关性不固定,这时一般根据经验关系利用直接法构建统计模型对非光学活性水质参数进行反演。
2 实验与分析
2.1 实验区概况
信阳市境内淮河流域属于亚热带季风气候,降雨多集中在5~10月份,年均降水量1 300 mm左右,自北向南递增,气候温暖湿润,相对湿度年均77%。淮河自西向东横贯信阳市,境内河长363.5 km,地面落差178 m,全境98.2%面积属于淮河流域。信阳市境内淮河流域的主要支流多位于淮河南岸,较大的支流有竹竿河、潢河、浉河、白露河等。市内建有5座大型水库,13座中型水库,866座小型水库。本实验选取了3座大型水库(南湾水库、石山口水库、泼河水库)、淮河干流及其3个主要支流(竹竿河、潢河、浉河)作为实验区域,研究区及监测断面位置示意如图2所示。
2.2 水质数据
从信阳市水文局获取到2016年淮河流域信阳市水功能区各监测断面的实地监测资料。数据显示整个研究区远未达到水功能区水质控制目标(Ⅱ类水或Ⅲ类水),尤其是枯水期期间,因此实时高效地掌握该区域的水体污染情况很有必要。这里以枯水期期间2016年3月1日的监测数据为例,选取主要污染指标DO、氟化物、NH3-N、TP以及pH为研究对象。本文选取20个监测断面的水质数据进行实验,随机选取16个监测断面作为训练集,其余断面数据作为测试集。
2.3 光谱分析
将各水质指标按不同浓度分为若干组进行光谱特征分析,結果如图3所示。随着TP、NH3-N、氟化物浓度的升高,遥感反射率逐渐升高。随着DO浓度的增加,遥感反射率逐渐减小,且这一特征在B4波段表现尤为明显,B5、B6和B7波段表现不太明显。以上现象均表明水体污染程度(水质指标的含量)可通过光谱反射率进行区分,初步认为利用遥感进行这几类水质指标的监测是可行的。
2.4 水质敏感波段选择
本文采用直接法对淮河流域信阳段水域进行监测。主要采用表2中的5种数学模型进行回归分析,通过回归分析的方法来确定水质参数的敏感波段,以影像数据作为自变量,水质数据作为因变量进行分析。最后将相关系数最高的数学模型作为该波段或波段组合与水质参数之间的相关系数,绘制相关矩阵(见图4)。自变量的显著性是根据曲线估计结果中各个自变量系数后面的Sig值判断:当Sig值大于0.05时,自变量的显著性较低,通常认为该自变量无法反演因变量的值并将其舍去;当Sig值小于0.05时,在95%的显著水平下显著;当Sig值小于0.01时,在99%的显著水平下显著。回归模型的决策系数(R2)越接近1,两者的拟合度就越高,决策系数越接近零,两者的拟合度就越低。这里规定相关系数在0~0.2之间为极弱相关或不相关;相关系数在0.2~0.4之间为弱相关;相关系数在0.4~0.6之间为中等强度相关;相关系数在0.6~0.8之间为强相关;相关系数在0.8以上为极强相关。
为了提高水质指标与影像数据之间的拟合度,将影像数据进行波段组合,重新进行相关分析。表3展示了决策系数在0.6以上且Sig值小于0.05的波段组合。实验发现NH3-N与B4/B2、(B2-B4)/(B2+B4)之间的相关系数均可达0.85;TP与(B3-B4)/(B3+B4)之间的决策系数最高,两者拟合度在0.93以上;DO与B4/B6之间的决策系数最高,两者之间的拟合度在0.79以上;氟化物与(B3-B5)/(B3+B5)之间的决策系数最高,两者之间的拟合度在0.88以上;与pH拟合效果比较好的波段组合是RNDWI,相关系数达0.70。实验表明利用波段组合的方法可明显提高部分水质指标与影像数据之间的拟合度。
对各水质指标进行相关分析,相关系数矩阵如图5所示。DO与TP、NH3-N之间均具有较强的相关性。理论上来讲,聚磷菌是好氧细菌,TP含量高的时候,水底的聚磷菌迅速繁殖,繁殖过程消耗水中氧气,从而降低DO含量。NH3-N是水体中的主要耗氧污染物之一,一定浓度下NH3-N含量过高会促进藻类等植物的生长,也会消耗水中的DO。因此,NH3-N和TP均与DO之间具有一定的负相关性,这与本实验分析结果相同。pH、NH3-N、TP两两之间均具有较强的相关性,其中NH3-N和TP之间存在较强的正相关性,而pH与NH3-N(或TP)之间具有明显的负相关关系,在进行数据审核时,可利用其相关关系判断数据的合理性。
3 水质指标的空间分布
3.1 反演模型的构建
在反演模型的构建过程中,一定情况下可能会出现过拟合现象,导致训练数据的拟合效果很好,而测试数据的拟合效果较差,为了避免这种情况,对表3中所列出的波段或波段组合分别进行反演模型的构建,并利用测试数据进行测试,从中选出测试结果精度较高的模型作为最优的反演模型对研究区进行反演。通过多次实验,本文确定了适用于该研究法的反演模型,如公式(13)~(17)所示。从最终确定的反演模型特征中可以看出,该研究区最适宜的数学模型为三次拟合模型和二次拟合模型。从各水质参数实测值和估计值对比结果(见图6)可以看出:本文所构建的模型能够对水质参数实现一定精度的估计。最后通过对测试集的验证,得出各模型平均绝对误差分别为0.42 mg/L,0.14(无量纲),0.87 mg/L,0.04 mg/L,0.02 mg/L,平均相对误差分别为36.37%,1.77%,10.65%,29.74%,8.90%。
INH3-N=-0.69+20.778×AWEIsh-109.27×
AWEIsh2+186.927×AWEIsh3(13)
IpH=3.134+61.862×B3-180.381×B32(14)
IDO=39.199-49.553×B4B6+
24.849×B4B62-3.936×B4B63(15)
I氟化物=0.259+1.19×NDWI-16.713×
NDWI2+47.438×NDWI3(16)
ITP=0.355-5.894×(B3-B4B3+B4)+19.437×
(B3-B4B3+B42+58.929×(B3-B4B3+B43(17)
3.2 水质指标空间格局特征
以淮河干流及其支流潢河为例,基于以上模型对水质进行反演,各水质参数的时空分布情况如图7所示。整体上看,研究区内水质良好,大体趋势为河岸水质略差于河心水质,入河口和流经城区居民点的河段水质略差。具体地,从空间分布上来看,pH在6.018~8.438之间波动,平均值为8.196,水体整体偏碱性。氟化物(以F计)最大值为0.864 mg/L,平均浓度为0.249 mg/L,均在地表水环境控制标准Ⅰ、Ⅱ、Ⅲ类水限值以内。NH3-N浓度在0.016~4.087 mg/L之间,均值为0.807 mg/L。
部分区域水体中的TP含量在0.400 mg/L以上,已经超过了Ⅴ类水的标准限值。NH3-N和TP在潢河入淮河口和流经居民区的河段水质较差,相对应地该区域内溶解氧含量较低,属于水质污染比较严重的区域。
4 结 语
Landsat8因其时空分辨率相对较高且免费易获取,在水质监测方面具有巨大的应用前景。通过以上实验,探索了利用OLI数据监测各水质指标的可行性并分析了反演各水质指标的最优波段组合。丰富了狭长的内陆河流水质反演方面的研究内容,实验结果对于监测站点少、采样和化学分析总体成本较高的地区具有重要的应用价值。
目前在水质反演过程中仍然存在许多问题。由于一些水体污染的参数(如水体重金属污染)无法通过远程遥感确定,目前遙感监测技术无法完全取代传统的监测方法。此外,对于水质遥感监测来说,季节性差异和区域性差异较大,同一水质指标的反演模型参数也很难统一,仍需根据不同季节、不同区域的实际情况有针对性地构建适合当地的相关模型,为相关机构的监测和水污染防治提供数据支撑。
参考文献:
[1] 张宝锋,陈峰,田晓庆,等.2005~2017年中国七大水系水质变化趋势分析[J].人民长江,2020,51(7):33-39.
[2] 丁梦娇,丘仲锋,张海龙,等.基于NPP-VIIRS卫星数据的渤黄海浊度反演算法研究[J].光学学报,2019,39(6):9-17.
[3] 王丽艳,史小红,孙标,等.基于MODIS数据遥感反演呼伦湖水体COD浓度的研究[J].环境工程,2014,32(12):103-108.
[4] 马荣华,戴锦芳.结合Landsat ETM与实测光谱估测太湖叶绿素及悬浮物含量[J].湖泊科学,2005,17(2):97-103.
[5] 王佳楠.基于BP神经网络的高锰酸盐指数预测研究[D].西安:长安大学,2017.
[6] 岳佳佳,庞博,张艳君,等.基于神经网络的宽浅型湖泊水质反演研究[J].南水北调与水利科技,2016,14(2):26-31.
[7] 黄妙芬,宋庆君,毛志华,等.应用CDOM光学特性估算水体COD:以辽宁省盘锦市双台子河和辽东湾为例[J].海洋学报(中文版),2011,33(3):47-54.
[8] 王皓,赵冬至,王林.水质遥感研究进展[J].海洋环境科学,2012,31(2):285-288.
[9] KOWN Y,BAEK S,LIM Y,et al.Monitoring coastal chlorophyll-a concentrations in coastal areas using machine learning models[J].Water,2018,10(8):1020.
[10] DRNHFER K,OPPELT N.Remote sensing for lake research and monitoring:recent advances[J].Ecological Indicators,2016,64:105-122.
[11] 于祥.渤海表面非光学活性水质参数MODIS遥感定量反演技术研究[D].烟台:中国科学院烟台海岸带研究所,2017.
[12] 彭保发,陈哲夫,李建辉,等.基于GF-1影像的洞庭湖区水体水质遥感监测[J].地理研究,2018,37(9):1683-1691.
[13] 张兵,申茜,李俊生,等.太湖水体3种典型水质参数的高光谱遥感反演[J].湖泊科学,2009,21(2):182-192.
[14] 袁金国,牛铮,王锡平.基于FLAASH的Hyperion高光谱影像大气校正[J].光谱学与光谱分析,2009,29(5):1181-1185.
[15] 闫大江.基于Landsat系列遥感影像的不同浑浊度内陆地表水体提取研究[D].西安:西北大学,2018.
[16] WANG Y,XIA H,FU J,et al.Water quality change in reservoirs of Shenzhen,China:detection using LANDSAT/TM data[J].Science of the Total Environment,2004,328(1-3):195-206.
[17] FEYISA G L,MEILBY H,FENSHOLT R,et al.,Automated water extraction index:a new technique for surface water mapping using landsat imagery[J].Remote Sensing of Environment,2014,140:23-35.
[18] 王小平,張飞,ABDUWASIT G,等.艾比湖流域地表水水质指标与水体指数关系研究[J].环境科学学报,2017,37(3):900-909.
[19] 万建鹏,官云兰,叶素倩,等.基于综合权重水体指数的水体提取研究:以鄱阳湖为例[J].东华理工大学学报(自然科学版),2015,38(2):206-210.
(编辑:刘 媛)
Analysis on water quality monitoring indicators by remote sensing based on OLI data:
case of Huaihe River Basin in Xinyang City
ZHANG Hongjian1,ZHOU Jian1,HUANGFU Kuan2
(1.Xinyang Water Conservancy Survey and Design Institute,Xinyang 464000,China; 2.School of Water Conservancy Science and Engineering,Zhengzhou University,Zhengzhou 450000,China)
Abstract:
Using satellite images for continuous and large-scale water quality monitoring is currently one of the hotspots in water environmental issue research.The purpose of this study is to explore the water quality indicators that can be monitored well by remote sensing images,so as to quickly obtain the temporal-spatial distribution of water quality indicators and provide data support for water environmental governance.Based on the measured hydrological monitoring data of Huaihe River in Xinyang territory in Henan Province,a statistical model of OLI data and water quality indicators (WQI) was established,including dissolved oxygen (DO),fluoride,ammonia nitrogen (NH3-N),total phosphorus (TP) and pH and so on,to explore all the water quality parameters that can be monitored with OLI data.The results show that the OLI data can be used to monitor the spatial distribution of ammonia nitrogen,total phosphorus,pH,fluoride and dissolved oxygen.The overall water quality in the study area was alkaline and the fluoride content is low,and there was no excessive fluorine pollution.The urban river sections and confluences of the main stream and the tributary rivers were heavily polluted by ammonia nitrogen and total phosphorus,and the dissolved oxygen contents of these two sections were low.The water quality management of the Xinyang City needs to be strengthened.
Key words:
OLI data;water quality indicators;Landsat8 image;water quality inversion;remote sensing;Huaihe River Basin in Xinyang City