APP下载

基于进化建模方法的HJ-1 CCD黄海悬浮物和叶绿素α浓度遥感反演模型研究

2014-06-01秦平沈钺牟冰郝艳玲朱建华崔廷伟

海洋学报 2014年11期
关键词:水色悬浮物波段

秦平,沈钺,牟冰,郝艳玲,朱建华,崔廷伟

(1.中国海洋大学信息科学与工程学院,山东青岛 266100;2.国家海洋局第一海洋研究所,山东青岛 266061;3.内蒙古大学资源与环境学院,内蒙古呼和浩特 010021;4.国家海洋技术中心,天津 300112)

基于进化建模方法的HJ-1 CCD黄海悬浮物和叶绿素α浓度遥感反演模型研究

秦平1,沈钺1,牟冰1,郝艳玲2,3,朱建华4,崔廷伟2*

(1.中国海洋大学信息科学与工程学院,山东青岛 266100;2.国家海洋局第一海洋研究所,山东青岛 266061;3.内蒙古大学资源与环境学院,内蒙古呼和浩特 010021;4.国家海洋技术中心,天津 300112)

本文利用实测数据集,发展了基于进化建模方法的HJ-1 CCD黄海悬浮物(TSM)和叶绿素a浓度(Chl a)遥感反演模型,建模过程中有针对性地设计了适合水色反演的端点集和函数集,并利用转基因方法引入水色先验知识。经实测数据检验,TSM反演的平均相对误差约为31%(相关系数R2为0.96),Chl a反演误差约为33%(R2为0.88)。分析了模型对输入误差的敏感性,当输入端引入±5%的误差时,模型误差的波动在大多数情形下都可控制在±10%以内。与神经网络模型相比,本文发展的进化模型具有检验精度高、结构简单等优势。利用不同季节的黄、东海实测数据进行了模型精度的独立检验。本文的研究工作表明,进化建模方法适用于水色遥感反演建模问题,可由程序自动生成多个满足精度要求、结构形式多样的显式模型,为水色反演应用提供了多种选择,对于拥有数百个波段的高光谱数据水色反演具有更大的应用潜力。本文最后探讨了进化建模方法的改进方向。

HJ-1 CCD;悬浮物;叶绿素a;进化建模;黄海

1 引言

水色遥感以其大范围、同步、相对成本较低的优势,已成为海洋监测的主要技术手段。我国发射的环境一号卫星CCD相机(HJ-1 CCD)具有30 m的空间分辨率和2 d的重访周期[1],适合中国近海区域的动态变化监测。基于HJ-1 CCD数据,已开展了内陆水体如太湖、巢湖水质等的遥感监测研究[2—3],而它在中国近海水色遥感应用研究方面的工作尚未深入进行。

传统的水色遥感反演方法包括经验方法和半分析方法等。经验方法是在实测数据的基础上,选择最优波段或波段组合建立统计回归模型,实现水色组分浓度的反演[4—8]。半分析方法以水体光学辐射传输理论为基础,物理过程明确,但需要大量的实测水体光学数据进行模型参数调整,主要有Carder算法[9]、GSM算法[10]、多波段准分析算法[11]等。

智能方法的发展给水色反演模型研究提供了新的思路。神经网络模型[12]和支持向量机模型[13]具有非线性映射能力,在建立二类水体的水色遥感反演模型方面表现出了一定的优势,这类方法的缺点是无法给出简明直观的模型解析表达形式。而遗传编程[14]能够建立显式的水色遥感反演模型,有效地解决了这个问题。但是遗传编程方法[15]中的模型参数是随机产生的,使得较好的模型结构由于参数不合适而在进化过程中被淘汰。进化建模方法[16]在遗传编程方法的基础上,采用数值优化算法确定模型参数,显著地提高建模的质量。

本文基于黄海现场实测数据,针对HJ-1 CCD波段设置,利用进化建模方法开展悬浮物和叶绿素a含量遥感反演模型研究;利用独立的实测数据进行了模型精度检验,分析了模型的误差敏感性,并将其与常用的神经网络模型进行了对比。

2数据

模型建立所采用的实测数据来源于2006年7月、2007年1月和2008年7月3个航次的黄海生物光学实验(水深范围:14.8~97.0 m)。站位分布见图1。

图1 实测站位分布图Fig.1 in situ measuring locations in study area

取表层水样测量叶绿素a和悬浮物浓度,其中叶绿素a浓度采用荧光法测量,浓度范围:0.10~12.12 mg/m3,平均值为1.48 mg/m3;悬浮物浓度采用重量法测量,范围是2.00~202.90 g/m3,平均值为29.16 g/m3。

现场水体光谱数据采用水面以上测量法[6]获得的,测量几何和数据处理参照NASA海洋光学规范。根据我国近海水体光谱特征,对实测数据进行了质量控制,剔除了光谱曲线形状异常的数据。经质量控制后的水体遥感反射率光谱见图2,大部分光谱曲线在560~600 nm有一反射峰;当TSM浓度较高时该反射峰较宽,同时峰值波长向长波方向移动,并在近红外波段(800 nm)附近出现另一反射峰。

将经过质量控制的数据分为建模数据集和验证数据集,其中TSM建模和验证数据分别为21组和6组,Chla建模和验证数据分别为36组和12组。

另外,为了进一步验证所发展模型的适用性,利用2003年4月的实测数据[6](水深范围:9.5~65.0 m)进行反演模型的独立检验。其站位分布如图1所示,水体遥感反射率光谱见图2b。实测站位分布在黄海和东海两个海域,其中黄海海域的TSM范围是3.51~117.96 g/m3(平均值15.21 g/m3),Chl a范围是0.79~10.42 mg/m3(平均值为4.07 mg/m3);东海海域的TSM范围是0.63~1 752.10 g/m3(平均值119.04 g/m3),Chl a范围是0.50~8.06 mg/m3(平均值2.60 mg/m3)。

HJ-1 CCD相机有3个可见光波段(430~520 nm、520~600 nm、630~690 nm)和1个近红外波段(760~900 nm),针对该波段设置和波段响应函数[1],进行实测连续光谱数据的CCD相机波段等效处理。等效波段遥感反射率Rrs(i)计算公式为:

式中,Rrs(λ)为实测遥感反射率,Si(λ)为CCD第i个波段的响应函数,i=1,2,3,4。

HJ-1星上4个CCD相机的波段响应函数并不完全相同,但分析表明4个CCD相机的等效波段遥感反射率非常接近(相关系数为0.999 6~1.0),因此本文选择其中的一个相机(HJ-1B CCD2)开展研究。

3 进化建模方法

进化建模方法是在遗传编程基础上发展的,根据数据集,能够自动地生成精度较高的拟合模型。本文在传统的进化建模方法基础上,有针对性地设计了适合水色反演的端点集和函数集,并利用我们此前发展的转基因方法[16]将水色先验知识引入到进化过程中。进化建模方法[16]的主要步骤包括群体初始化、遗传操作、个体评价和终止判定等,技术流程如图3所示。

图2 实测遥感反射率光谱Fig.2 The measured remote sensing reflectance spectra

图3 进化建模方法技术流程Fig.3 Flowchart of the evolutionary modeling method

3.1 群体初始化

在进化建模方法中,进化过程是从群体初始化开始的。群体由模型个体的编码串构成的,图4以黄色物质吸收系数模型a(λ)=a0exp[-S(λλ0)]为例,给出其编码过程:首先将模型转换成二叉树,然后中序遍历,最后采用前缀表示形式得到编码串。

图4 模型个体的编码过程Fig.4 Encoding process of individual

编码串表示为I=[s1,s2,…,sl],其中si属于端点集或函数集。端点集包括输入变量和参数,函数集包括运算符和基本函数。通常卫星遥感数据波段比的精度高于单波段,因此本文选取波段比作为输入变量X,即

则端点集为T={r,X},r为参数。鉴于水色反演算法的模型结构通常为多项式、指数和对数函数等,本文将函数集设置为F={+,-,×,/,^2,^3,lg,sqrt,exp}。

在个体编码完成后,结合先验的水色反演模型(如多项式、对数等),实现群体初始化。先验知识的引入可以改善建模方法对模型空间的搜索能力,提高建模的效率。

3.2 遗传操作

在群体初始化后,通过遗传操作生成新的进化群体,主要的遗传操作方法为交叉和变异。交叉操作是将两个个体中的编码片段进行交换,可提高算法的全局搜索能力;变异操作是个体编码串中编码片段发生突变,可提高进化群体的多样性,防止出现未成熟先收敛的现象。

为了更有效地利用水色反演的先验知识,本文将我们此前发展的转基因操作方法应用于进化群体生成中。转基因操作是在个体中任选编码片段,并从水色反演知识库中选取先验模型作为外源基因,加入到操作点上替换原来的编码片段以形成新的个体,提高算法的收敛性。

3.3 个体评价

利用适应度函数来评价模型的优劣、决定进化的方向。考虑到进化群体中含有大量的参数,需要先进行参数优化,再计算进化个体的最优适应度:

式中,I为进化个体,f为个体I解码后的模型,r*为个体中参数的优化值,yTi为水色组分浓度的实测值。

进化终止的判定条件为最大进化代数Gmax和最大无改进代数Nmax。当进化代数达到Gmax时进化终止;若进化代数还没达到Gmax,但群体中最好个体的适应度连续保持Nmax代无显著变化时,即模型精度没有明显提高,进化进程也终止。

进化建模方法的若干关键参数设置[16]如下:群体规模为50,交叉、变异和转基因操作的概率分别为0.6、0.2和0.1,Gmax为500,Nmax为20。采用遗传算法进行参数优化。

4 黄海水色组分反演模型

本文选择以下指标评价反演模型的精度:相关系数R2、平均相对误差APD和均方根误差RMS,即:

式中,n为数据集的样本个数,yTi为水色组分浓度的实测值,yPi为反演值,i=1,2,…,n。

为了分析模型的误差敏感性,在输入数据中引入±5%的扰动,即(1±5%)Rrs(1)、(1±5%)Rrs(2)、(1 ±5%)Rrs(3)、(1±5%)Rrs(4),以此检验遥感反射率的微小扰动是否会导致反演结果大的偏差。

4.1 悬浮物浓度反演模型

根据HJ-1 CCD等效波段的遥感反射率和实测悬浮物浓度,采用进化建模方法,确定了最优适应度较高、结构较为简单的若干模型:

治疗前两组患者的HBN评分无明显差异,治疗后研究组显著高于对照组,差异有统计意义(P<0.05),如表1。

表1给出了4个模型的建模精度和验证精度。由表1可见,4个模型的精度相当(R2均大于0.95,APD均小于35%),都能满足水色反演的精度要求。上述结果表明:进化建模方法可自动生成多个满足精度要求、结构形式多样的显式模型,为水色反演应用提供了多种选择。

进一步分析4个反演模型的误差敏感性,分别向波段1,2和3引入±5%误差,共有8种情形,结果见图5,其中纵坐标分别为每种情形下模型反演结果的APD和RMS与未加扰动时的差值。由图5可见,在输入数据引入±5%扰动的情况下,4个模型反演结果的APD波动均在20%以内,其中模型T2对误差最不敏感,模型T2的RMS波动也在10 g/m3以内。

综合表1和图5的分析结果,模型T2在4个备选模型中总体表现最优,将其确定为黄海HJ-1 CCD悬浮物浓度反演模型。

表1 悬浮物浓度反演模型的精度评估Tab.1 Accuracy assessment of retrieval models for TSM

图5 悬浮物浓度反演模型的误差敏感性Fig.5 Error sensitivity of retrieval models for TSM

4.2 叶绿素α浓度反演模型

利用进化建模方法,得到以下4个结构简单、最优适应度较高的Chl a浓度反演模型:

上述模型的精度评估结果见表2,误差敏感性测试结果见图6。

表2 叶绿素α反演模型的精度分析Tab.2 Accuracy analysis of retrieval models for chlorophyllαconcentration

综合表2和图6,4个模型的反演精度相当,误差敏感性相近,模型C2的RMS波动最小,从中选择模型C2作为叶绿素a的反演模型。

反演时,实测数据分为建模数据集和验证数据集。图7给出悬浮物浓度反演模型T2、叶绿素a反演模型C2的反演值与实测值的散点图,图中大部分建模数据和验证数据点分布在1∶1线附近,最优的悬浮物浓度反演模型T2的APD约28%,叶绿素a反演模型C2的APD约35%,反演效果较为理想。

图6 叶绿素a反演模型的误差敏感性Fig.6 Error sensitivity of retrieval models for Chl a

图7 最优反演模型的反演结果Fig.7 Retrieval results of the optimal retrieval model

4.3 基于独立数据的模型评估

利用2003年4月的黄、东海实测数据,对悬浮物浓度反演模型T2和叶绿素a浓度反演模型C2进行独立检验,结果如图8所示。黄海海域TSM、Chl a浓度的反演值与实测值的一致性较好,APD约为40%,数据点基本上分布在1∶2和2∶1线以内;而东海海域的反演结果有一定程度的退化,其中Chl a反演值的低估现象尤为明显。建立模型所使用的数据获取自冬季和夏季的黄海海域,而独立检验数据获取自春季的黄海和东海海域,黄、东海海域水体光学性质的时空差异性,这可能是模型应用于东海海域精度退化的主要原因。

4.4 与神经网络方法的对比

将本文发展的反演模型和神经网络模型进行比较分析。采用3层BP神经网络建立黄海悬浮物和叶绿素a浓度反演模型[12],以遥感反射率及相应的水色组分浓度为网络的输入与输出,采用双曲正切函数作为神经元的激励函数,网络的训练采用Levenberg-Marquardt算法。分别计算不同隐层节点数(3-10)的神经网络模型的输出结果,通过比较反演模型的建模精度和验证精度,确定最佳的隐层节点数。

表3给出神经网络模型和进化模型的计算结果,其中NN_T1和NN_T2是TSM浓度反演模型,NN_ T1的输入为Rrs(1),Rrs(2),Rrs(3),Rrs(4),隐层节点数为8;NN_T2的输入为Rrs(3)/Rrs(1),Rrs(3)/Rrs(2)(参考进化模型T2确定),隐层节点数为6;NN _C1和NN_C2是Chla浓度反演模型,NN_C1的输入为Rrs(1),Rrs(2),Rrs(3),Rrs(4),隐层节点数为4;NN_C2的输入为Rrs(3)/Rrs(2),Rrs(2)/Rrs(1)(参考进化模型C2确定),隐层节点数为7。

由表3可知,尽管对于建模数据,神经网络方法能够取得较高的反演精度,但是应用于验证数据时,其反演能力显著退化;而进化建模方法对建模数据和验证数据可取得较高的反演精度。

图8 独立检验数据的反演结果Fig.8 Retrieval results of independent testing data

表3 神经网络与进化模型的精度对比Tab.3 Accuracy comparison between the neural network method and the evolutionary modeling method

5 结论与讨论

本文基于进化建模方法,建立了针对HJ-1 CCD宽波段的黄海悬浮物和叶绿素a浓度遥感反演模型。利用实测数据进行了模型精度检验,悬浮物浓度和叶绿素a浓度反演误差约为31%和33%。绝大多数情形下模型对输入误差不敏感。与神经网络模型相比,进化建模方法的优势在于对建模数据和验证数据均可取得较高的反演精度,且能够得到显式的模型表达形式。并利用独立数据进行了模型精度评估。

本文的研究工作表明,进化建模方法适用于水色遥感反演建模问题,可由程序自动生成多个满足精度要求、结构形式多样的显式模型,为水色反演应用提供了多种选择;建模过程减少了人为参与,提高了建模效率,对于拥有数百个波段的高光谱数据的水色反演具有更大的应用潜力。

下一步将进行进化建模方法的改进,使之更适合于水色反演问题,主要包括:(1)端点集的自动选择,利用交叉试验评估输入变量的相关性,以适应高维数据的建模;(2)设计新的遗传操作,包括多点交叉、并行变异、免疫操作等,以提高算法的全局搜索能力和反演精度;(3)尝试新的参数优化算法,如差分进化算法、并行进化算法等,提高建模的效率。

本文的悬浮物和叶绿素a浓度遥感反演模型是基于黄海现场实测数据集发展的,模型在黄海及其他海域的适用性还需现场实测数据进行进一步的检验和评估;当应用于HJ-1 CCD影像时,还需要考虑大气校正不完善可能引入的反演误差。

致谢:感谢参加现场实验以及为本文研究工作提供数据支持的研究机构和同仁,感谢中国资源卫星应用中心提供HJ-1 CCD的波段响应函数。

[1]http://www.cresda.com/n16/n1130/n1582/8384.html.

[2]朱利,姚延娟,吴传庆,等.基于环境一号卫星的内陆水体水质多光谱遥感监测[J].地理与地理信息科学,2010,26(2):81-84.

[3]王桥,吴传庆,厉青.环境一号卫星及其在环境监测中的应用[J].遥感学报,2010,14(1):104-121.

[4]Sathyend Ranath S.Remote Sensing of ocean color in coastal and other optically-complex waters[R].Dartmouth,Canada:IOCCG,2000.

[5]Tassan S.Local algorithms using SeaWiFS data for the retrieval of phytoplankton,pigments,suspended sediment,and yellow substance in coastal waters[J].Applied Optics,1994,33(12):2369-2378.

[6]唐军武,王晓梅,宋庆君,等.黄、东海二类水体水色要素的统计反演模式[J].海洋科学进展,2004,22(增刊):1-7.

[7]马超飞,蒋兴伟,唐军武,等.HY-1 CCD宽波段水色要素反演算法[J].海洋学报,2005,27(4):38-44.

[8]Gitelson A A,Schalles J F,Hladik C M.Remote chlorophyll-a retrieval in turbid,productive estuaries:Chesapeake Bay case study[J].Remote Sensing of Environment,2007,109(4):464-472.

[9]Carder K L,Chen F R,Cannizzaro J P,et al.Performance of the MODIS semi-analytical ocean color algorithm for chlorophyll-a[J].Adv Space Res,2004,33(7):1152-1159.

[10]Garver S A,Siegel D.Inherent optical property inversion of ocean color spectra and its biogeochemical interpretation:1.Time series from the Sargasso Sea[J].Journal of Geophysical Research:Oceans.1997,102(C8):18607-18625.

[11]Lee Z P,Carder K L,Arone R A.Deriving inherent optical properties from water color:a multiband quasi-analytical algorithm for optically deep waters[J].Applied Optics,2002,41(27):5755-5772.

[12]Buekton D,O'Mongain E,Danahe E.The use of neural networks for the estimation of oceanic constituents based on the MERISinstrument[J].International Journal of Remote Sensing,1999,20(9):1841-1851.

[13]Sun D,Li Y M,Wang Q.A unified model for remotely estimating chlorophyll a in Lake Taihu,China,based on SVM and in situ hyperspectral data[J].IEEE Transactions of Geoscience and Remote Sensing,2009,47(8):2957-2965.

[14]Chami M,Robilliard D.Inversion of oceanic constituents in case I and II waters with genetic programming algorithms[J].Applied Optics,2002,41(30):6260-6275.

[15]Koza J R.Genetic Programming II:Automatic Discovery of Reusable Programs[M].Cambridge:The MIT Press,1994:1-39.

[16]秦平.滑动轴承系统中智能建模技术的研究与实现[D].西安:西安交通大学,2003.

Retrieval models of total suspended matter and chlorophyllαconcentration in Yellow Sea based on HJ-1 CCD data and evolutionary modeling method

Qin Ping1,Shen Yue1,Mu Bing1,Hao Yanling2,3,Zhu Jianhua4,Cui Tingwei2
(1.Information Science and Engineering College,Ocean University of China,Qingdao 266100,China;2.First Institute of Oceanography,State Oceanic Administration,Qingdao 266061,China;3.College of Environment&Resources,Inner Mongolia University,Hohhot 010021,China;4.National Ocean Technology Center,Tianjin 300112,China)

By using the in-situ measuring data,this study developed retrieval models of chlorophyll a(Chl a)and total suspended matter(TSM)for HJ-1 CCD data in the Yellow Sea based on the evolutionary modeling method.The terminal and function set of the evolutionary modeling method were designed to be adapted to retrieval of water constituents,and the transgene operator was employed to insert and maintain the prior knowledge.The average percentage difference(APD)for TSM was 31%(the correlation coefficient R2=0.96),and that for Chla was 33% (R2=0.88).The error sensitivity of the retrieval models was analyzed,and the output errors were generally less than±10%when introducing±5%error of remote sensing reflectance.Compared with neural network method,the evolutionary models have higher accuracy and simpler structures.In addition,in-situ data with different seasons was employed to validate the accuracy of the retrieval models.This study shows that the evolutionary modeling method is applicable for retrieval of water constituents from ocean color remote sensed data.Many explicit models with well accuracy and different structures could be obtained automatically,and they are of potential applications for hyperspectral data.Finally,we discussed how to improve the method in the near future.

HJ-1 CCD;total suspended matter;chlorophyll a;evolutionary modeling;the Yellow Sea

TP79

A

0253-4193(2014)11-0142-08

2012-12-09;

2014-02-14。

国家自然科学基金项目(41476159);国家高技术研究发展计划(2013AA122803);中国科学院海洋研究所近海海洋科学考察开放航次。

秦平(1973-),女,河南省南阳市人,博士,从事海洋光学与水色遥感研究。E-mail:appletsin@ouc.edu.cn

*通信作者:崔廷伟,副研究员,主要从事海洋光学与水色遥感研究。E-mail:cuitingwei@fio.org.cn

秦平,沈钺,牟冰,等.基于进化建模方法的HJ-1 CCD黄海悬浮物和叶绿素a浓度遥感反演模型研究[J].海洋学报,2014,36 (11):142—149,doi.10.3969/j.issn.0253-4193.2014.11.016

Qin Ping,Shen Yue,Mu Bing,et al.Retrieval models of total suspended matter and chlorophyll a concentration in Yellow Sea based on HJ-1 CCD data and evolutionary modeling method[J].Acta Oceanologica Sinica(in chinese),2014,36(11):142—149,doi.10.3969/j.issn.0253-4193.2014.11.016

猜你喜欢

水色悬浮物波段
春日暖阳
悬浮物对水质氨氮测定的影响
水色
雨花·艺术 徐华翎作品
M87的多波段辐射过程及其能谱拟合
废水悬浮物国标检测方法的修改建议
压裂返排液中悬浮物去除的室内研究
雷州湾海域悬浮物浓度遥感监测研究
日常维护对L 波段雷达的重要性
鉴别鱼塘水质好坏有妙招