APP下载

清河水库水体高锰酸盐指数遥感反演模型研究

2017-03-22解启蒙林茂森杨国范夏晓芸阎孟冬

中国农村水利水电 2017年10期
关键词:清河库区波段

解启蒙,林茂森,杨国范,2,夏晓芸,张 曦,阎孟冬

(1. 沈阳农业大学水利学院,沈阳 110866;2. 沈阳工学院能源与水利学院,辽宁 抚顺 113122;3.朝阳市水务局,辽宁 朝阳 122000)

清河水库是辽河流域重要的水利枢纽工程之一,水库担负着防洪、灌溉、渔业、工业供水等任务,如果水库水体处于富营养化,不仅威胁水库的供水安全,也制约水库功能的正常运转。而高锰酸盐指数(CODMn)是综合评价水体污染程度的重要指标之一,也是水质监测的重要项目[1-4]。由于清河水库所在地交通和测量方面存在很大的不便,如果人工进行实地监测,需要耗费大量的人力、物力、财力,且在空间全局性、时效性等方面存在一定的局限性,而应用遥感技术很好地解决了这一问题。借助遥感技术,根据水体所含不同成分的光谱反射特征,寻找不同成分的敏感波段,分析其与实测CODMn的相关关系,通过单波段或波段组合作为自变量建立遥感监测模型,对水体CODMn进行定量遥感反演,这一技术具有速度快、效率高、数据同步性好、观测范围大、监测成本低等优势,已成为水质监测的重要手段之一[5-6]。目前CODMn反演技术常用的方法有经验法[7]、半经验法[8]、分析法[9],李旭文[10]等(1993)利用TM数据评价了苏州运河的有机污染,通过回归分析表明TM1、2、3与CODMn相关性最好;王学军(2000)[11]选取了太湖水质中CODMn等7个监测参数,利用TM数据的单波段或多波段组合与实测数据相关关系分析及主成分分析来监测太湖的水质污染,并建立了每种水质参数的预测模型;赵玉芹、汪西莉[12]利用SPOT-5遥感影像数据和现场水质监测数据建立BP和RBF两种神经网络反演模型,对水质参数CODMn进行反演,反演结果表明该模型的精度满足要求,反演结果比线性回归模型好;郝海森[13]以波段组合TM2/TM5为自变量建立高弗地区平原水库CODMn定量遥感反演模型;叶圆圆[14]以波段组合B1+B2为自变量建立的日顾桥沉陷水域CODMn定量遥感反演模型;赵旭阳[15]以HJ-1数据的B4波段为自变量建立的大洋河河口水域CODMn定量遥感反演模型;王建平[16]等在通过遥感技术对鄱阳湖环境监测的过程中,利用人工神经网络技术对湖泊水色进行了定量遥感反演研究,在同步实验的基础上构造了包含一个隐含层的BP神经网络模型,再利用TM卫星影像数据反演CODMn,反演精度较高,相对误差大多在25%以下。由此可见,现有模型大多数是针对湖泊、运河、沉陷区、河口等浑浊水体,以及平原地区,不具有普遍性,对北方内陆清洁水体会存在一定的局限性,可能会导致反演精度过低、误差偏大。

故本研究以清河水库为研究区,利用Landsat8卫星的OLI数据,分析其与清河水库高锰酸盐实测数据的相关性,通过单波段、波段组合等方法,建立最小二乘支持向量机(LS-SVM)模型清河水库水体CODMn反演监测,同时为清河水库及其他水库CODMn定量反演提供理论依据。

1 研究区概况及模型数据获取

1.1 研究区概况

清河水库位于辽宁省铁岭市清河区,东经124°10′~124°26′,北纬42°29′~42°36′,占地面积465.09 km2,控制流域面积为2 376 km2,设计总库容为9.71 亿m3,是辽河中游左侧一级支流(清河)上的一座大Ⅱ型水库。

1.2 影像数据的获取及预处理

研究选用由美国国家航天宇航局(NASA)和美国地质调查局(USGS)联合发射运行的空间分辨率为30 m、重访周期为16天的Landsat8卫星OLI数据,OLI包括了ETM+的所有波段,为了避免大气吸收部分特征,OLI对波段进行了重新调整,新增两个波段:海蓝波段 (band 1;0.433~0.453 μm)主要应用海岸带观测;短波红外波段,又称卷云波段(band 9;1.360~1.390 μm)包含水汽强吸收特征,可用于云检测,具体波段划分如表1所示。

本研究影像数据获取时间为2015年6月23日(云量显示为0.08 %,满足数据对云量的要求),利用ENVI软件对OLI数据进行辐射定标、大气校正、几何裁剪等预处理,得到清河水库卫星影像及库区采样点波普曲线(如图1-4所示)。

1.3 采样点数据的获取及处理

为获取清河水库采样点数据,本研究采用网格法将25个采样点均匀分布覆盖在整个库区,如图5所示。于2015年6月23日上午,天气晴朗,利用水库船只对库区水面以下0.5 m处进行实地水样采集,将采集的水样装入棕色瓶内并标号,同时用GPS记录采样点的经纬度。在实验室采用滴定法,向水样中加入定量且过量的高锰酸钾溶液,并在沸水浴中加热反应一定时间,剩余的高锰酸钾用过量的草酸钠还原,再用高锰酸钾溶液回滴过量的草酸钠,通过计算求出CODMn。

表1 Landsat8-OLI波段划分Tab.1 Landsat8-OLI Band division

图1 清河水库卫星影像数据辐射定标结果Fig.1 Radiometric calibration results of satellite image data in Qinghe Reservoir

图2 清河水库卫星影像数据大气校正结果Fig.2 Atmospheric correction results of satellite image data in Qinghe Reservoir

图3 清河水库库区采样点辐射亮度值Fig.3 The radiant intensity of sampling points in Qinghe Reservoir

图4 清河水库库区采样点真实反射率Fig.4 Real reflection of sampling points in Qinghe Reservoir

图5 研究区各采样点地理分布Fig.5 All sampling points in the study area distribution

2 清河水库水体高锰酸盐指数反演模型构建与讨论

2.1 高锰酸盐指数敏感性波段选择

本文的采样点为25个,通过ENVI对landsat8的OLI数据做辐射定标、大气校正、裁剪处理之后,得到每个波段在采样点的水体真实反射率,并分别将每个波段的水体真实反射率与实测值组成25组数据,从中随机选出17组数据进行建模,另外8组数据作为验证。利用SPSS对建模数据进行Perason相关性分析,结果发现蓝色波段(b2)、绿色波段(b3)、红色波段(b4)、近红外波段(b5)对CODMn较为敏感,如表2所示。

表2 波段敏感性Tab.2 Band sensitivity

从相关性系数来看,b4波段的敏感性最好为0.447,但系数相对来说过低,不能用于对清河水库CODMn进行遥感反演研究。因此,将landsat8的OLI数据的9个波段进行波段组合,发现S1=b4-b2、S2=(b4-b2)/(b3-b2)、S3=b2/b4、S4=b4/b2这4种波段组合与CODMn敏感性较高,系数分别为0.568、0.632、0.687、0.701。选取Pearson系数最高的波段组合S4=b4/b2作为自变量X,实测的高锰酸盐指数Y作为因变量,构建比值线性回归模型与比值非线性最小二乘支持向量机模型(LS-SVM),从中选取最适合清河水库CODMn反演的模型。

2.2 比值线性回归模型

对波段组合S4=b4/b2,其线性回归模型可分别用一元一次、指数及一元二次3种形式进行表达,如表3所示。

表3 比值线性回归模型Tab.3 Ratio linear regression model

但Williams[17]研究认为相关系数的大小可以评价模型的好坏,当R2在0.5~0.65之间为较差模型,R2在0.66~0.81之间为一般模型,R2在0.82~0.9之间为较好模型,R2在0.91~1之间为精准模型。则由表3可知,一元二次模型y=7.760 9x2-19.249x+14.921的相关系数最高,为0.711,但其模型标准为一般模型。

2.3 比值非线性最小二乘支持向量机模型

本方法基于Matlab领域,选用RBF函数作为LS-SVM的核函数,对25组数据中的17组数据通过最小二乘支持向量机算法建立清河水库CODMn的遥感反演监测模型。由于一元回归和多元回归的方法及原理相对简单,不能适应非线性的预测,但支持向量机(Support Vector Machines,SVM)模型的预测在非线性、样本小及高维模式识别问题中具有更大的优势[18]。支持向量机是由AT&Bell实验室的技术人员提出的,以统计学理论的VC维理论和最小结构风险为原则,由训练样本及核函数确定建立的。最小二乘支持向量机(Least square support vector machine,LS-SVM)是在标准的支持向量机的目标函数中增加了误差平方和,对标准的支持向量机回归方法进行优化,把非线性空间的问题转换到线性空间,减小其复杂程度,减低求解难度,提高求解速度[19]。其算法如下:

设训练样本集为:B={(xj,yj)|j=1,2,…,K},xj∈Rn,yj∈R,xj是输入数据,yj是输出数据。在ω空间中的函数问题可以描述为:

(1)

其中:误差变量ej∈R,b是偏差量,γ是正则化参数。

约束条件:

(2)

其对偶问题的lagrange多项式函数为:

(3)

式中:αj∈R,为lagrange乘子。对上式求最优解的KTT条件为:

(4)

首先,消去e和ω,再利用Mercer条件,得到如下方程:

(5)

其中:1=[1,…,1]T,Y=[y1,…,yN]T,a=[a1,…,aN]T。M为一个方阵,其第i行第j列的元素为Mij=φ(xi)Tφ(xj)=M(xi,xj);M(x,y)为核函数。用最小二乘法算出a和b,由此得到预测输出:

(6)

式中:y(x)为预测输出值;M(x,xj)为核函数;αj为拉格朗日乘子。

2.4 清河水库两种模型的验证

本文通过对landsat8的OLI影像数据的辐射定标、大气校正、几何裁剪预处理,并与实测数据构成25组数据,用其中17组数据建立两种不同遥感反演模型,把剩余8组数据的波段比值分别放入两种模型计算CODMn的预测值,将预测值与实际值进行相关性分析如图6所示,计算相对误差结果如表4所示。

图6 CODMn预测值与实际值的相关性Fig.6 Correlation between predicted value and actual value of CODMn

CODMn实测值/(mg·L-1)比值线性回归模型预测值/(mg·L-1)相对误差/%比值非线性LS-SVM模型预测值/(mg·L-1)相对误差/%3.403.513.203.7811.183.103.4812.423.213.543.703.2512.063.884.963.603.2310.283.743.843.403.196.043.739.723.203.375.223.385.863.303.009.093.516.403.003.144.833.144.55

2.5 讨 论

(1)本研究利用郝海森[13]以波段组合TM2/TM5为自变量建立高弗地区平原水库CODMn定量遥感反演模型、叶圆圆[14]以波段组合B1+B2为自变量建立的日顾桥沉陷水域CODMn定量遥感反演模型、赵旭阳[15]以HJ-1数据的B4波段为自变量建立的大洋河河口水域CODMn定量遥感反演模型分别对清河水库CODMn进行定量反演,其预测结果与实测值的平均相对误差分别为17.82%、22.56%、27.43%,模型的精度相对较低不能满足清河水库CODMn的预测要求,主要原因是以上学者所研究的区域是对平原地区水库、沉陷区水体及大河河口处,并不适用于内陆清洁水体的清河水库。

(2)本研究对清河水库这种内陆清洁水体选用landsat8-OLI数据的波段组合值与清河水库CODMn实测值进行相关性分析,并以相关性最高的S4=b4/b2为自变量分别建立比值线性回归模型与比值非线性LS-SVM模型对清河水库进行定量反演。从表4可看出以比值非线性LS-SVM模型反演结果的最大误差为11.18%、最小误差为3.54%、平均相对误差为6.26%,反演相对误差在10%以下的7个;以比值线性回归模型中相关性最高的一元二次多项式模型反演结果的最大误差为12.42%、最小误差为3.20%、平均相对误差为7.89%,反演相对误差在10%以下的5个;且比值非线性LS-SVM模型预测值与实测值的相关性R2=0.942 7大于比值线性一元二次多项式模型预测值与实测值的相关性R2=0.693 1,而比值非线性LS-SVM模型的误差算数平方根RMSE=2.71、平均相对误差6.26%也小于比值线性一元二次多项式模型的误差算数平方根RMSE=4.76、平均相对误差7.89%。

3 结 果

由此可知比值非线性LS-SVM模型的预测效果要远好于比值线性一元二次多项式模型,因此利用比值非线性LS-SVM模型对2015年6月23日的清河水库库区CODMn进行反演,其浓度分布如图7所示。

图7 清河水库CODMn分布Fig.7 The distribution map of Qinghe Reservoir of CODMn

从图7中可以清楚看出清河水库库区在坝前的CODMn大部分处于4~6 mg/L之间,对于二类水的清河水库来说相对较高;而在入库口处,CODMn也主要是出于2~3 mg/L;在库区的边缘个别部分的CODMn较高,不是很多;但在整个库区中CODMn大部分还是处于3~6 mg/L,这主要是由于反演时间为2015年6月23日,6月为铁岭气候干燥,降雨较少,水库库容较少的时候,再加上周边的工厂、养殖场及生活污水携带大量的有机物质进入库区,导致库区中有机腐殖含量较高,因此清河水库库区反演的CODMn相对较高。

4 结 语

本文用实时遥感影像数据与实测数据建立适用于清河水库CODMn反演监测的最小二乘支持向量机模型。但由于水体中存在多种复杂、相互影响的光学活性物质,在很大程度上影响了水质参数的反演精度,且本次所用的建模数据与检验数据相对较少,在今后的研究中应再加密采样点,加大训练数据量,同时增加采样周期,使模型的精度更高,反演效果更好。

[1] Ministry of Health,Labour and Welfare.Health Minisrty Ordinance 101

Guidelines for Japanese Drinking Water Quality[M].Tokyo: Act Press,2004.

[2] 邢 竹,朱德新.关于高锰酸钾指数测定中影响因素的初探[J].广东化工,2012,39(2):203.

[3] Merman Ministry of Health Regulation on the Quality of Water for Human Consumption[Z]. Hamburg :Felix Meiner Press,2001.

[4] 烟贯发,齐少群,张思冲,等.松花江哈尔滨江段高锰酸盐指数的遥感反演[J].环境化学,2013,32(9):1 798-1 804.

[5] 宋 瑜,宋晓东,江 洪,等.基于定量遥感反演的内陆水体藻类监测[J].光谱学与光谱分析,2010,30(4):1 075-1 079.

[6] 尹 改,王 桥,郑丙辉,等.国家环保总局对中国资源卫星的需求与分析(上)[J].中国航天,1999,(9):3-7.

[7] A.G.Dekker,S.W.M.Peter. The use of the Thematic Mapper for the analysis of eutorphic lakes: a case study in the Netherlands[J]. International Journal of Remote Sensing,1993,14(5):799-821.

[8] John M,Melack,Mary Gastil.Airborne remote sensing of chlorophyll distributions in Mono Lake[J].California Hydrobiologia,2001,466:31-38.

[9] Hoogenboom H J,Dekker A G,Dehaan J F.Retrieval of chlorophyll and suspended matter in inland waters from CASI data by matrix inversion[J].Canadian Journal of Remote Sensing, 1998,24(2):144-152.

[10] 祝令亚.湖泊水质遥感监测与评价方法研究[D].北京:中国科学院,2006.

[11] 蒋金雄.内陆水体水质遥感监测[D]. 北京:北京交通大学,2009.

[12] 赵玉芹,汪西莉,蒋 赛,等.渭河水质遥感反演的人工神经网络模型研究[J].遥感技术与应用,2009,(1):63-67.

[13] 郝海森,曹志勇,莫金平,等.高弗地区平原水库高锰酸钾指数的定量遥感研究[J].中国农村水利水电,2011,(6):44-48.

[14] 叶圆圆.基于RS淮南采煤沉陷水域水质实时监测技术研究[D]. 安徽淮南:安徽理工大学,2014.

[15] 王 皓.基于HJ_1星数据的大洋河河口水域水质参数反演研究[D]. 辽宁大连:辽宁师范大学,2012.

[16] 胡举波.黄浦江上游水域水质遥感监测模型的研究[D]. 上海:同济大学,2006.

[17] Williams A.N, Grabau W E. Sediment Concentration Mapping in Tidal Estuaries.Third Earth Resources Technology Satellite-1 Symposium[Z]. NASA SP-351,1973,1:1 347-1 386.

[18] 徐红敏.基于支持向量机理论的水环境质量预测与评价方法研究[D]. 长春:吉林大学,2007.

[19] 阎威武,邵惠鹤.支持向量机和最小二乘支持向量机的比较及应用研究[J]. 控制与决策,2003,18(3):358-360.

猜你喜欢

清河库区波段
江垭库区鱼类群落组成和资源量评估
最佳波段组合的典型地物信息提取
湖南省大中型水库库区管理工作实践与探索——以皂市水库为例
浅析库区移民集中安置点规划设计中需注意的问题
江城晚晴天
清河堡考略——明朝防御建州女真及后金的前沿堡城
承传统振百年清河 重实践育清正少年
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术