APP下载

太湖水体吸收分解(Ⅱ):浮游植物色素吸收分解*

2012-12-11赵晨露马荣华郝景燕段洪涛

湖泊科学 2012年6期
关键词:蓝藻藻类太湖

赵晨露,马荣华,郝景燕,段洪涛

(1:中国科学院南京地理与湖泊研究所,南京210008)

(2:中国科学院研究生院,北京100049)

太湖水体吸收分解(Ⅱ):浮游植物色素吸收分解*

赵晨露1,2,马荣华1**,郝景燕1,2,段洪涛1

(1:中国科学院南京地理与湖泊研究所,南京210008)

(2:中国科学院研究生院,北京100049)

蓝藻水华暴发前,浮游植物群类结构的变化可通过其指示型色素的浓度变化来反映.为了同时反演叶绿素a、叶绿素b(绿藻门指示型色素)、叶绿素c(硅藻门指示型色素)和藻蓝素(蓝藻门的指示型色素)的浓度,利用偏最小二乘回归构建线性模型,通过2011年太湖实测吸收数据,较为准确地反演了叶绿素a和藻蓝素的浓度;针对无明显优势藻的春季数据集较为准确地反演了叶绿素b和叶绿素c的浓度.相对于经典最小二乘算法,偏最小二乘法在多色素混合的吸收光谱分析上更为有效.通过反演指示性色素浓度来反映藻类的分布,为富营养化湖泊主要藻类时空分布变化的遥感监测提供了一定的理论与技术支持.

太湖;吸收分解;浮游植物色素;偏最小二乘

水体的富营养化水平影响着浮游植物的生物量及其群落结构[1].不同营养水平的湖泊,其浮游植物种类组成、优势种组成及个体数量变化等都表现出不同的特征.不少学者用浮游植物种类及其演替过程来评价水体污染状况和富营养化水平[2-4].作为富营养化湖泊,太湖水体中的浮游植物主要以蓝藻门、绿藻门和硅藻门为优势;藻类的季节演替规律为:从冬、春季的硅藻转变为夏季的绿藻,到夏末秋初则以蓝藻为优势,而硅藻的优势度则随着秋季的到来再次提高[5-10].藻类的色素构成不同,并在达到一定数量后表现在水色上.一般认为,绿藻的指示型色素是叶绿素b[11],硅藻的指示型色素是岩藻黄素[11]和叶绿素c(包括叶绿素c1和叶绿素c2),蓝藻的指示型色素是藻蓝素[12].对于富营养化湖泊,其浮游植物丰度基本由绿藻、硅藻与蓝藻贡献,而绿藻与蓝藻均不含叶绿素c,所以叶绿素c可以作为富营养化湖泊中硅藻的指示型色素.

浮游植物色素、非浮游植物色素(无机悬浮颗粒)和黄质决定了水体的固有光学特性(吸收与散射).吸收具备严格的可加性[13],可以用来研究藻类的构成.以浮游藻类各指示型色素为基础[14],建立吸收系数与四类主要色素之间的线性关系,将单一色素(叶绿素)的遥感定量反演扩展到多色素.偏最小二乘回归[15]作为第二代多元统计分析方法[16],已得到广泛应用.与经典最小二乘法或其它建模方法相比,偏最小二乘法具有简单稳健、计算量小、预测精度较高、无需剔除任何解释变量或样本点、所构造的因子较确定、易于定性解释等优点[17].在化学计量学领域内,常利用偏最小二乘回归从光学特征高度重叠的混合物质中测定各成分的浓度,如食用合成色素[18-19]、农药残留量[20]及钢样中微量元素[21]的测量等.

不同类型色素的特征吸收峰在吸收谱上占据着不同波段,且在不同介质中有着不同的表现.目前在藻类吸收谱及其光合作用的研究中,通常使用有机溶剂提取藻细胞中的色素,并测定各色素的吸收系数.本文针对太湖水体中的主要色素,研究其在水体中的吸收特征,并利用偏最小二乘回归进行由色素吸收到色素浓度的反演,以期通过指示型色素反映表层水体中浮游植物组成特征.

1 数据获取与处理

本文使用的太湖数据集采集于2011年4季(3月、5月、9月及11月),有效样点数据共100组(图1,表1).每个样品的测量数据包括浮游植物色素吸收谱,叶绿素a、叶绿素b、叶绿素c及藻蓝素(PC)的浓度.吸收系数的测量采用定量滤膜分光光度法[22],模拟吸收特性时,选用400~700 nm波段范围,该波段范围包含了影响浮游植物色素吸收的所有典型特征波段[23].叶绿素a、叶绿素b和叶绿素c的浓度采用分光光度法,根据美国环境保护部推荐的三色方程[24]测定,藻蓝素的浓度用荧光分光光度法测定[25].

由于藻蓝素在光合作用波段与叶绿素b、叶绿素c相比有着较强的竞争优势,在蓝藻复苏后绿藻和硅藻的生长受到抑制,且光学特征不明显.因此,本文选择各藻类混合较为均匀的春季数据(24组)同时反演叶绿素b及叶绿素c的浓度,随机选择其中18组用于建模,其余6组作为验证.叶绿素a和藻蓝素的浓度使用全部数据(100组)进行反演,其中随机选择75组作为模拟数据集,其余25组用于验证.

表1 色素浓度的范围和均值(μg/L)*Tab.1 Ranges and means of concentrations of pigments

2 研究方法

2.1 最小二乘分解

一般来说,浮游植物色素吸收光谱遵循如下关系[26]:

式中,aph(λ)为浮游植物色素吸收系数;(λ)为第i种色素的比吸收系数,ci为第i种色素的浓度;n表示色素种类.Purves等[27]给出了藻蓝素的比吸收谱.Bidigare等[28]将浮游植物中的色素分成Chl.a(叶绿素a)、Chl.b(叶绿素 b)、Chl.c(叶绿素 c)、PSC(光合类胡萝卜素)和 PPC(光保护类胡萝卜素)5类,测量了色素标准样的比吸收谱并对溶剂影响进行了校正(图2),其结果具有一定的普适性.对于各主要色素,不同学者在研究中发现了不同的吸收特征波段[29-35].由于细胞中的色素与蛋白相互作用后会发生红移现象[36],提取后的色素吸收光谱与活体藻类吸收光谱不完全吻合.

在太湖活体藻类色素吸收谱(图3)中,只有叶绿素a在650~700 nm区间内的吸收峰易与其它色素的吸收特征区分开.统计表明,太湖水体叶绿素a的红光区吸收峰出现在674 nm的频率最高(图4),峰值波长的平均值为674.6 nm.以吸收系数比色素浓度的最小二乘解作为比吸收系数,则叶绿素a在674 nm的比吸收系数为0.0202 L/(μg·m)(图5).这一结果与浮游植物色素中叶绿素a的经验比吸收系数(峰值在674 nm处,相应的比吸收系数为0.0203 L/(μg·m))[28]基本一致,在一定程度上可以说明经验比吸收的适用性.

由于活体藻类中单色素吸收特征较难获得,本文假设经验的比吸收系数适用于太湖,依照公式(1)以非负最小二乘回归进行浮游植物色素吸收谱的线性分解,获得ci的估计值,并讨论该分解模型的适用性.

2.2 偏最小二乘回归

偏最小二乘法的关键在于引入“因子”这一概念,其选取原则是解释变量和响应变量之间协方差的最大化.通过选择因子,应用偏最小二乘法既可以提取吸收信号和浓度数据两者中的信息,同时又可以削弱吸收信号的噪声和浓度数据的误差.本文采用SIMPLS[37]作为偏最小二乘回归的实务算法.

对于:

经线性变换:

式中,Aph_norm为解释变量,Cnorm为响应变量,s为样本个数,m为波段个数,n为色素种类,T=XW为因子得分矩阵,W为权重,X为解释变量Aph_norm,P为解释变量因子载荷矩阵,Q为响应变量因子载荷矩阵,E和F是误差.对于k个因子,需进行k次循环运算,调整权重阵W,以期因子得分阵T中可以尽量多地包含X和Y(响应变量Cnorm)中的有效信息.响应变量与解释变量的线性系数矩阵B=WQ'.

因子个数k太小则易导致拟合不完全,太大则易导致过度拟合.为了选择最佳的因子个数,本文采用留一交叉验证法(leave-one-out cross validation),对p的每个取值,每次从模型训练数据集中留下一组作验证,用剩下的数据训练模型,以预测均方根误差(PRMSE,Predict Root Mean Square Error)最小为标准.

因为吸收及浓度数据进行了标准化预处理,所以计算浓度估计值时,以训练数据集中第i种色素浓度的方差δ(i)均值μ(i)(表2)对这一处理还原:

表2 训练集色素浓度的均值和方差Tab.2 Means and variances of pigment concentrations in training data set

3 结果与讨论

3.1 最小二乘分解

太湖全年存在蓝藻[5-7],因此使用全部100组数据集研究叶绿素a和藻蓝素的浓度反演.经非负最小二乘模型分解,浓度估计值与实测值较为一致(图6),叶绿素a和藻蓝素的决定系数(R2)分别为0.7744和0.6502(图6),P 值皆远小于0.01.叶绿素 a浓度的估计值整体偏高,均方根误差(RMSE)为 7.1 μg/L,而藻蓝素在高浓度区间(15~40 μg/L)内浓度估计值偏低,低浓度区间(<15 μg/L)估计值偏高,RMSE为6.0 μg/L.色素浓度越高,其吸收谱特征越为明显,使得相对误差随着色素浓度的增高而减小.

太湖夏、秋季节蓝藻水华频繁暴发,蓝藻是绝对优势种,其它藻种较少或几乎没有;因此叶绿素b和叶绿素c等绿藻和硅藻指示型色素的浓度反演只利用春季数据进行.浮游植物采集光能的天然色素有叶绿素、类胡萝卜素和藻胆色素(藻蓝素属藻胆色素)三大类.不同类型色素的吸收峰在吸收谱上占据着不同的波段.类胡萝卜素共有100多种,但其吸收峰都在450~550 nm范围内[30],类胡萝卜素在550~700 nm的比吸收很小[28],基本可以忽略.本文假设550~700 nm的浮游植物色素吸收谱只包含叶绿素a、叶绿素b、叶绿素c和藻蓝素四种色素的吸收,以最小二乘分解反演叶绿素b和叶绿素c的浓度,以期消除类胡萝卜素对二者的影响.与叶绿素a的反演结果相似,叶绿素b(图7a)和叶绿素c浓度(图7b)的估计值系统性偏高,RMSE 分别为8.1 μg/L和1.8 μg/L.受色素打包效应的影响,比吸收系数会发生变化[38].一般浮游植物生物量越大,其粒径越大,打包效应越强,比吸收相对越小.对于太湖水体而言,春季藻密度较低,比吸收较大[39].由于叶绿素a、叶绿素b的经验比吸收系数可能偏低,使得其浓度的估计值偏高,且绝对误差随浓度升高而增大.叶绿素c浓度的绝对误差基本不随浓度变化,可能是由吸收信号的测量误差导致.

3.2 偏最小二乘回归

全部75组训练数据的预测均方根误差(PRMSE)分析表明(图8),因子个数在6~8之间比较合适,本文使用7个因子进行偏最小二乘回归.叶绿素b和叶绿素c的反演使用春季数据集,其中训练集含数据18组,测试集含数据6组,延用7个因子建模.通过训练模型得到的偏最小二乘回归系数是301×4的矩阵,表3是部分数据示例.

分别用全年测试数据集和春季测试数据集对上述偏最小二乘回归获得的模型进行验证(图9),结果显示叶绿素a与藻蓝素的浓度反演较为准确,与实测浓度的比值系数均近于1,分别为1.0145(图9a)和0.8020(图9b).叶绿素a浓度反演的RMSE为2.03 μg/L,与实测浓度的 R2=0.9781(P <0.01),高于最小二乘法的0.7744;藻蓝素浓度反演的 RMSE为2.71 μg/L,与实测浓度的 R2=0.93(P <0.01),高于最小二乘法的0.6502.与传统最小二乘分解的结果相比,叶绿素b与叶绿素c的浓度反演估计值与实测浓度的R2分别由0.7376和 0.9081 提高至 0.8719(图9c)和0.9750(图9d),RMSE 分别为0.60 μg/L 和0.93 μg/L,P 值均小于 0.01.

由于比吸收数值偏低引起的误差可以通过将经验比吸收乘以扩大系数来修正,但比吸收在不同波长的相对值的变化是否准确依然无法考证.变换思路,将色素浓度表达为浮游植物色素吸收的函数,建立线性模型.对藻类生物量无指示性作用的类胡萝卜素不参与模型的建立.该模型解释变量(吸收系数)个数远远大于响应变量(浓度)个数,且解释变量之间存在严重的多重共线性,而这正是偏最小二乘法善于解决的问题.但作为一种经验模型,偏最小二乘回归的模型精度不可避免地会受到训练数据集的影响,在数据范围基本涵盖了色素浓度全年变化的叶绿素a与藻蓝素反演上更为准确.但需要进一步积累野外实测数据,通过增加训练样本,扩大模型的适用范围,提高叶绿素b与叶绿素c的浓度反演精度.

4 结论

不同浮游植物色素在可见光区的吸收谱重叠较为严重,共同影响水体的光学性质.传统的以红光区吸收特征波段入手的光谱浓度分析方法只能对叶绿素a和藻蓝素的浓度进行反演.本文利用光学吸收的严格可加性以全光谱的吸收系数建立线性模型,同时反演叶绿素a以及绿藻、硅藻和蓝藻各自的指示性色素叶绿素b、叶绿素c和藻蓝素的浓度.

表3 指示型色素浓度对浮游植物色素吸收的偏最小二乘回归系数*Tab.3 Regression coefficients of concentrations of pigments vs.absorption of phytoplankton pigments in PLS

基于经验比吸收系数的经典最小二乘分解方法反演得到的色素浓度与实测值有较高的相关性,可以反映色素浓度的变化趋势.受比吸收系数适用性的影响,反演结果存在系统性误差.偏最小二乘回归可以充分利用色素吸收和浓度两类信息,并具有较好的容错性,适用于多组分混合体系的光谱分析.结果表明,偏最小二乘法对叶绿素a与藻蓝素浓度的反演更为准确;受春季实测数据样点个数(24个)有限的影响,叶绿素b、叶绿素c的浓度估计值与实测值的比值分别为0.50(<1)和1.65(>1).

相对于目前水色遥感半分析算法中多采用单一色素叶绿素a的信息,本文建立的模型有助于获取水体中藻类的分布,使得水体遥感可获取的信息量更为丰富,是推动水色遥感从单一色素叶绿素a向多色素遥感发展的有益尝试.

[1]Kilham P,Hecky RE.Comparative ecology of marine and freshwater phytoplankton.Limnol Oceanogr,1988,33:776-795.

[2]高玉荣.北京四海藻类群落结构特征与水体营养水平研究.生态学报,1992,12(2):173-180.

[3]Irina I,Luz,Cristina M.Comparative study of the planktonic communities of three lakes of contrasting trophic status at Hope Bay.Plankton Res,2003,25:1079-1097.

[4]贺筱蓉,李共国.杭州西溪湿地首期工程区浮游植物群落结构及与水质关系.湖泊科学,2009,21(6):795-800.

[5]钱奎梅,陈宇炜,宋晓兰.太湖浮游植物优势种长期演化与富营养化进程的关系.生态科学,2008,27(2):65-70.

[6]成 芳.太湖水体富营养化与水生生物群落结构的研究[学位论文].苏州:苏州大学,2010.

[7]陈家长,孟顺龙,尤 洋等.太湖五里湖浮游植物群落结构特征分析.生态环境学报,2009,18(4):1358-1367.

[8]原居林,尹文林,沈锦玉等.南太湖浮游植物特征及其富营养化评价.生态学杂志,2009,28(11):2197-2201.

[9]赵汉取,韦肖杭,姚伟忠等.蓝藻爆发后南太湖水域浮游生物及富营养化.浙江海洋学院学报:自然科学版,2009,28(1):21-24,35.

[10]梁兴飞.南太湖浮游植物种群季节变化及噬藻体的初步研究[学位论文].杭州:浙江大学,2010.

[11]Descy J,Métens A.Biomass-pigment relationships in potamoplankton.Journal of Plankton Research,1996,18(9):1557.

[12]Dekker A.Detection of optical water quality parameters for eutrophic waters by high resolution remote sensing[Dissertation].Amsterdam:Vrije Universiteit,1993.

[13]Mobley CD.Light and water:Radiative transfer in natural waters.San Diego:Academic Press,1994.

[14]郝景燕,马荣华,段洪涛等.太湖水体吸收分解(I):悬浮颗粒与浮游植物色素的分离.湖泊科学,2010,22(3):337-348.

[15]Wold H.Partial least squares.International Journal of Cardiology,1985,147(2):581-591.

[16]Fornell C,Bookstein FL.Two structural equation models:LISREL and PLS applied to consumer exit-voice theory.Journal of Marketing Research,1982,19(4):440-452.

[17]蒋红卫.偏最小二乘回归的扩展及其实用算法构建[学位论文].西安:中国人民解放军第四军医大学,2003.

[18]贾 燕,张克荣,郑 波.偏最小二乘法-分光光度法同时测定多种食用合成色素.重庆医科大学学报,2005,30(2):260-262.

[19]卓 婧,王 静,陈小霞等.食品中合成色素快速检测仪器的研制.分析化学,2011,39(2):283-287.

[20]张国文,潘军辉,阙青民.偏最小二乘-分光光度法同时测定福美锌和代森锰农药残留量.分析试验室,2006,25(11):27-33.

[21]吴庆生,丁亚平.高灵敏四阶导数光谱PLS法同时测定钨钼钛.光谱学与光谱分析,1995,15(4):119-124.

[22]张运林,秦伯强,杨龙元.太湖梅梁湾水体悬浮颗粒物和CDOM的吸收特性.生态学报,2006,26(12):3969-3979.

[23]马荣华,段洪涛,唐军武等.湖泊水环境遥感.北京:科学出版社,2010.

[24]Elizabeth JA.Method 446.0,in vitro determination of chlorophylls a,b,c1+c2 and pheopigments in marine and freshwater algae by visible spectrophotometry.US Environmental Protection Agency,1997:1-26.

[25]Lorenzen CJ.A method for the continuous measurement of in vivo chlorophyll concentration.Deep-Sea Res,1966,13:223-227.

[26]Sathyendranath S,Lazzara L.Variations in the spectral values of specific absorption of phytoplankton.Limnol Oceanogr,1987,32(2):403-415.

[27]Purves WK,Sadava D,Orians CH et al.Life:the science of biology,4th edition.SunderLand:Sinauer Associates,1995.

[28]Bidigare R,Ondrusek M,Morrow J et al.In-vivo absorption properties of algal pigments.SPIE,1990,1302(DOI:10.1117/12.21451).

[29]Menzl S,Stühler M,Benz R.A self-adaptive computer-based pH measurement and fuzzy-control system.Wat Res,1996,30(4):981-989.

[30]Silva RG,Reuben RL.Tool wear monitoring of turning operation by neural network and expert system classification of a feature set generated from multiple sensors.Mechanical Systems and Signal Processing,1998,12(2):319-332.

[31]王 勇,钱凯先,董 强.高纯度藻蓝蛋白分离纯化及光谱特性研究.生物化学与生物物理进展,1999,26(5):457-460.

[32]Luo Ren EM.Multisensor integration and fusion in intelligence system.IEEE Trans SMC,1989,19(5):224-232.

[33]Simis S,Peters S,Gons H.Remote sensing of the cyanobacterial pigment phycocyanin in turbid inland water.Limnol Oceanogr,2005,50(1):237-245.

[34]Gons H.Optical teledetection of chlorophyll a in turbid inland waters.Environ Sci Technol,1999,33(7):1127-1132.

[35]伍荣护,苏 佳.植物色素的光声光谱研究.光谱学与光谱分析,2002,22(3):378-380.

[36]韩博平,韩志国,付 祥.藻类光合作用机理与模型.北京:科学出版社,2003:6-18.

[37]de Jong S.SIMPLS:an alternative approach to partial least squares regression.Chemometrics and Intelligent Laboratory Systems,1993,18(3):251-263.

[38]Bricaud A,Babin M,Morel A et al.Variability in the chlorophyll-specific absorption coefficients of natural phytop lankton:Analysis and parameterization.Journal of Geophysical Research,1995,100(C7):13321-13332.

[39]孙德勇,李云梅,王 桥等.太湖水体中悬浮颗粒物的比吸收光谱特性及其参数化分析.环境科学学报,2009,(9):1820-1829.

The absorption spectral decomposition of water in Lake Taihu,China(Ⅱ):the decomposition of absorption due to phytoplankton pigments

ZHAO Chenlu1,2,MA Ronghua1,HAO Jingyan1,2& DUAN Hongtao1
(1:Nanjing Institute of Geography and Limnology,Chinese Academy of Sciences,Nanjing 210008,P.R.China)
(2:Graduate University of Chinese Academy of Science,Beijing 100049,P.R.China)

Concentrations of pigments could reflect the dominant phyla of algae.Investigations of algae in eutrophic lakes revealed that Chl.b,Chl.c and phycobilin(PC)are the critical pigments of chlorophyta,bacilliariphyta and cyanophyta,respectively.In this study,partial least square(PLS)regress was used on the retrieval of Chl.a,Chl.b,Chl.c and PC through absorption spectral of phytoplankton.Retrieve of Chl.a was based on the data collected in situ during 2011.Retrieve of Chl.b and Chl.c was based on the data collected in situ in March,since there is no significant dominant phyla of algae in spring.Result shows that PLS is a more effective method than the original least square regress and could be of help for remote sensing of multi-pigments and the distribution of main algae in eutrophic lakes.

Lake Taihu;absorption decomposition;phytoplankton pigment;partial least square

* 中国科学院知识创新工程重要方向性项目(KZCX2-YW-QN311、KZCX2-EW-QN308)和国家自然科学基金项目(41171273,41171271)联合资助.2012-03-30收稿;2012-04-04收修改稿.赵晨露,女,1986年生,硕士研究生;E-mail:zhaochenlu45@163.com.

** 通信作者;E-mail:mrhua2002@niglas.ac.cn.

猜你喜欢

蓝藻藻类太湖
藻类水华控制技术及应用
细菌和藻类先移民火星
南美白对虾养殖池塘蓝藻水华处理举措
南美白对虾养殖池塘蓝藻水华处理举措
吃蔬菜有个“321模式” 三两叶菜类,二两其他类,一两菌藻类
针对八月高温蓝藻爆发的有效处理方案
太湖思变2017
太湖揽春
太湖
浮游藻类在水体PAHs富集与降解中的研究