基于GF-1 WFV影像与神经网络模型的水库水质多参数反演研究
2020-07-29郑炎辉张园波何艳虎
郑炎辉,张园波,何艳虎
(1.广州丰泽源水利科技有限公司,广东广州510663;2.广东工业大学环境生态工程研究院,广东广州510006;3. 南方海洋科学与工程广东省实验室(广州),广东广州511458)
水库是内陆重要的淡水资源。但随着城市经济的迅速发展和工业化程度的加剧以及人类活动的影响,使得水库富营养化问题日益严重,因此必须加强水库水质状况的监测和治理。传统的水质断面监测耗时耗力,难以快速反映水库整体的水质状况,而遥感技术可以从全空间领域、多时间序列快速、连续地体现整个水域的水质状况,具有监测范围广、成本低和长时间动态监测的特点。因此,在水库水质监测具有明显的优势,与常规水质监测数据结合,能全面正确反映研究区水质健康状况。
遥感技术应用于水质监测由来已久,但多数只是应用于单因子监测。例如叶绿素a浓度,国内相关学者对太湖的研究最为深入,佘丰宁等[1]经过统计分析,建立太湖TM影像各波段与Chl-a的回归拟合方程;马荣华等[2]从ETM数据中选择最佳波段及波段组合,建立了2002年7月太湖叶绿素a反演模型;在国内其他水域,李大千[3]成功建立了相关系数R2为0.92的鄱阳湖叶绿素a反演模型。而其他水质参数,解启蒙等[4]通过分析Landsat8-OLI单波段及波段组合与实测高锰酸盐指数(CODMn)的关系,建立了清河水库CODMn比值线性回归反演模型和比值非线性最小二乘支持向量机(LS-SVM)反演模型。对于N、P营养盐反演模型的研究,主要是基于经验的方法[5],刘征等[6]运用微分光谱技术,对黄壁庄水库水体反射光谱与水质同步实测数据进行分析,发现在595、873 nm处波段反射率的一阶微分均与总氮、总磷浓度有较好的相关性,赵旭阳等[7]对同一区域进行研究并得出相同的结论。徐良将等[8]基于高光谱数据,通过微分法和波段比值法,建立了太湖总氮、总磷遥感反演模型。马建行等[9]利用HJ1A-CCD与MODIS数据分别建立了石头口门水库、二龙湖等地的透明度线性反演模型,相关系数R2分别为0.639、0.894,发现利用2种数据源建立的透明度反演模型得到的平均透明度较为一致。
东风水库属于典型内陆二类水体,受人类影响强烈,水体的光学特性复杂多变,且富营养化评价因子较多,水库水质参数浓度与波段反射率的关系不能完全用线性经验模型来表示。对于内陆Ⅱ类水体,其组成成分复杂,单因子不能正确反映出水体营养状态,因此,宜选用叶绿素a(Chl-a)、高锰酸盐指数(CODMn)、总氮(TN)、总磷(TP)、透明度(SD)5个因子,利用指数法进行综合评价。在样本数据量充足的前提下,BP神经网络能够模拟复杂的非线性问题。目前,BP神经网络已经在国内外广泛应用,包括Ⅱ类水体水质参数浓度的反演,取得了良好的效果[10]。国外学者如Keiner等[11]将TM数据作为输入层,叶绿素a、悬浮物作为输出层,构建了具有2个隐含层节点的BP反演模型,结果显示,BP模型反演结果优于线性经验模型;Schiller等[12]利用MERIS数据,构建了反演悬浮物、叶绿素和可溶性有机物(CDOM)3个水质参数的BP神经网络模型;国内学者如祝令亚[13]利用水质实测数据和MODIS数据构建太湖水质参数BP反演模型;赵英等[14]构建了隐含层节点数为15的天津于桥水库高锰酸盐指数BP反演模型;侯君等[15]选用含三层网络结构的BP神经网络对湖泊叶绿素a浓度进行短期预测;吕恒等[16]利用MODIS数据建立了2层网络结构的太湖水质参数BP反演模型,结果表明,BP神经网络模型反演结果优于线性模型。杨柳等[17]利用BP神经网络对温榆河进行水质参数反演,其反演精度优于线性模型。
从目前研究的内容、方法以及深度等方面来看,遥感技术应用于水质监测研究较为丰富,但大多数都为大型水库湖泊或者海洋单因子监测,特别是叶绿素指标,多为国外的卫星遥感影像(美国Landsat8、美国Modis、欧洲Sential-2)。目前将国产卫星遥感影像应用于中型水库多因子水质反演研究较少,因此为探究国产卫星影像于水质遥感反演的可行性,并为湖长制和湖泊富营养化评估提供相应技术支持,基于GF-1 WFV影像与神经网络模型的水库水质多参数反演研究具有科学与实际意义。
1 研究区概况
东风水库地处南海区中北部狮山镇松岗,是南海区唯一一座中型水库。根据建库资料显示,该水库建于1958年,集雨面积10.85 km2,最大库容1 024万m3。集雨范围内有工业园区、住宅区、村庄、商场和市场等排污主体,水库边上有养禽场,集雨区内分布有工业区、房地产楼盘、农庄食店和8条主要村庄,工厂和生活区存在偷排污水的情况,水库库区面积较大,库中各处水体状况不一,库尾水体发黑,库中部岸边有垃圾漂浮,集雨区内的村庄、居民生活污水、工厂、养殖场、农田等是水库的主要污染源。
2 资料与研究方法
2.1 水质实测数据
本项目获取了佛山水文分局2015—2017年对东风水库每月一次的水质全面成果,根据SL 219—2013《水环境监测规范》,在东风水库库区共布设7个监测点。监测点名称为主坝、副坝、丽湖花园、205库区、浮岛、新源洞、塘联,在0.5 m水深处设置采样点,监测点分布见图1。监测项目包括叶绿素a浓度、高锰酸盐指数、总氮、总磷、透明度、气温、重金属含量等。
图1 采样点分布
2.2 卫星影像数据
高分辨率对地观测光学卫星高分一号(GF-1)是首颗国产民用卫星,于2013年顺利升空。该卫星搭载了一台2 m分辨率全色相机(PMS)、一台8 m分辨率多光谱相机(MMS)和4台16 m分辨率多光谱相机(WFV)。表1为GF-1 WFV传感器基本参数信息。
表1 GF-1 WFV传感器参数
通过对比水质实测日期与卫星过境日期,获取了9幅GF-1 WFV影像,满足东风水库上空无云层覆盖、影像清晰、大气能见度高的基础影像数据。
2.3 研究方法
a) 正射校正。正射校正是对图像空间和几何畸变进行校正生成多中心投影平面正射图像的处理过程。它除了能纠正一般系统因素产生的几何畸变外,还可以消除地形引起的几何畸变。GF-1 WFV数据因为没有进行几何校正,所以相对于实际位置有偏移,这种情况在GF-1 WFV的L1数据表现得尤为强烈。通过基于RPC参数结合经过全球控制点校正的Landsat影像(L1T数据)的正射校正方法可以获得正确的位置。
b) 辐射定标。DN值(Digital Number)是遥感影像中每个像元的亮度值,记录像元所承载地物的灰度信息,是一个无单位的整数值,值大小与传感器的辐射分辨率、地物发射率、大气透过率和散射率有关。辐射定标就是消除传感器本身误差,确定传感器入口处的准确辐射值,即将像元记录的原始DN值转换为大气外层表观反射率(辐射亮度值)的过程。辐射定标公式为:
L=DN×Gain
(1)
式中L——辐射亮度值;Gain——绝对辐射定标系数增益。
对于GF-1 WFV数据来说,可在中国资源卫星应用中心官网下载得到Gain值,见表2。
表2 GF-1 2015年WFV1定标参数
c) FLAASH大气校正。卫星在获取影像时会受到云离子、大气分子还有大气气溶胶等因素的影响,使影像中含有一些不必要的目标地物信息,这样会大大地影响遥感定量分析的精准度。为消除这些因素的影响,需要对影像进行大气校正处理。大气校正就是将辐射亮度或者表面反射率转换为地表真实反射率,它的目的在于消除大气散射、吸收、反射引起的误差。FLAASH大气校正是一种以MODTRAN4+为传输模型的代码,它可以调整包含不透明层和卷云的分类图,还可以调整人为因素引起的波谱平滑,可以对SPOT、Landsat等高光谱、多光谱等影像进行快速校正分析,并且不需要野外场地测量的辅助信息,具有算法精确度高的特点。从图2可以看出,大气校正后的植被光谱曲线与标准植被光谱曲线接近,在可见光波段有2个明显的叶绿素反射谷,近红外波段有明显的反射峰。通过大气校正之后,有效地消除了大气吸收、散射作用造成的误差,校正后影像准确反映真实地表光谱特性,影像质量有所提高。
a) 大气校正前
b) 大气校正后图2 大气校正前后植被光谱曲线
d) 水体提取。在水体提取之后,可利用研究区矢量文件对研究区进行裁剪,以减少计算机运算量。东风水库周边陆域表面覆盖了植被,容易影响反演结果的准确性,因此,有必要对东风水库进行水体提取,剔除水域周边的陆地区域。波段之间的比值运算能减少由于地形坡度、坡向、阴影等环境条件影响,从而提高水体识别准确性,选择绿光波段与近红外波段构建归一化水体指数模型(Normalized Difference Water Index,NDWI)可以最大程度地抑制植被信息,增强水体信息,因此本文采用此方法制作水体掩膜提取东风水库水体信息。
NDWI=(Green-NIR)/(Green+NIR)
(2)
式中 Green——绿波段;NIR——近红外波段。
e) BP神经网络。BP网络是非线性变换单元组成的最简单、最普遍、最通用的一种神经网络形式,BP神经网络是多层前馈神经网络,它采用误差反向传播学习算法,由输入层、隐含层和输出层组成。相邻层之间的神经元由权值相连接,同一层内神经元之间是平行的,无连接关系,神经元的传输函数为非线性函数,BP网络是一种监督式的学习网络。其主要思想为:对于q个输入学习样本P1、P2、P3、…、Pq,已知其对应的输出样本T1、T2、T3、…、Tq,学习的目的是用网络的实际输出A1、A2、A3、…、Aq与目标矢量T1、T2、T3、…、Tq之间的误差来修正其权值,使实际输出与目标输出尽可能地接近,使得网络输出层的误差平方和达到最小,它是通过连续不断地在相对于误差函数斜率下降的方向上计算网络权值和偏差变化而逐渐逼近目标,每一次权值和偏差的变化都与网络误差的影响成正比,并以反向传播的方式传递到每一层。其网络结构见图3。
图3 三层BP网络示意
3 结果分析
3.1 模型构建与检验
利用BP神经网络来反演水质参数浓度,对于本项目而言,应选取遥感影像各个波段反射率值作为输入层,对于不同的反演模型隐含层节点数不同,各个水质参数为输出层。因此,输入层节点数为4,隐含层节点数i,输出节点数1(各水质参数),确定了4-i-1的3层BP神经网络结构。BP神经网络设计中最为关键的步骤是隐含层神经元节点数的选择,它直接影响网络对复杂问题的映射能力。在隐含层节点数选取上,目前并没有一个统一的计算方法,但隐含层节点数过少,则网络收敛速度过慢达不到精度的要求,节点数过多,则增加了计算量,也会导致过拟合,降低网络的泛化能力。在具体设计中,比较实际的做法是通过采用“试错法”,通过多次试验来确定最佳节点数。对于不同的水质参数反演模型,其节点数也是不同的,见表3。
表3 BP反演模型隐含层最优节点数
通过验证数据的实测值和反演值的决定系数(Coefficient of determination,R2)、平均相对误差(Mean Relative Error,E)评价其精度。决定系数R2反映了反演值与实测值拟合程度,绝对值越接近1表示拟合性越好;平均相对误差反映了反演值偏离实测值的程度,其值越接近0代表反演精度越高。从表4可以看出,5种水质反演模型总体上都能达到要求,每种模型的决定系数R2均在0.8以上,其中Chl-a反演模型决定系数达到0.95。
表4 BP反演模型精度评价指标
3.2 水质参数变化监测
将水质参数BP反演模型应用到各个时期的影像中,得到每个像元的水质参数浓度,以全空间区域、多时间序列连续地监测东风水库水质变化情况,见图4。将水质参数反演结果用不同颜色输出,以直观展示水质参数的变化趋势,见图4a,可以看出,2016年5月16日东风水库整体上中部水体Chl-a浓度偏高,最大值为544.67 μg/L,均值为101.56 μg/L。对比GB 3838—2002《地面水环境质量标准》,对于CODMn指标,仅有2016年11月4日水质达到Ⅱ类水标准,2015年1月2日、2015年4月14日、2015年8月7日等5 d,东风水库CODMn浓度超出Ⅲ类水标准;对于TN指标,9幅影像中,有6幅影像的东风水库TN浓度超过Ⅴ类水标准;2015年4月14日东风水库平均透明度最差,仅有0.44 m,可能水中悬浮物较多,影响水质透明度;2016年5月16日透明度最好,达0.83 m。
a) 2015年5月16日东风水库Chl-a浓度分布
d) 东风水库TP浓度均值变化趋势
4 结论
a) 对遥感影像预处理的作用是消除大气气溶胶等对地物反射率的影响,凸显光谱信息,消除噪声,经辐射定标、大气校正后,能最大程度还原地物真实反射率。
b) 东风水库属于内陆Ⅱ类水体,光学性质复杂,将东风水库遥感影像经过预处理,通过分析与验证,能够模拟复杂非线性关系的BP神经网络模型更适用,本文利用BP神经网络模型较好地反演了东风水库水质参数浓度。
c) 遥感监测技术具有全面、直观等优点,为东风水库提供全空间领域、多时间序列连续水质监测,与常规监测点实测数据相结合能全面、正确地反映出东风水库水质状况,弥补常规监测的不足。
d) GF-1卫星是中国国产高空间分辨率卫星,在水质参数反演方面表现出了巨大的潜力,本文基于GF-1卫星建立的叶绿素a(Chl-a)、透明度(SD)、总磷(TP)、总氮(TN)、高锰酸盐指数(CODMn)5个水质参数反演模型,证实了中国国产高空间分辨率卫星在多水质参数反演方面的可行性与实用性,为中型水库的水华和富营养化监测提供了参考,可为湖长制和湖泊健康评估提供技术支持。