APP下载

基于主成分分析法的长三角地区某水库蓝藻生长影响因子分析

2020-11-04张会豪闫光辉焦鑫雅杨欢张思琦贾璐遥

环境保护与循环经济 2020年9期
关键词:高锰酸盐溶解性蓝藻

张会豪 闫光辉 焦鑫雅 杨欢 张思琦 贾璐遥

(华北水利水电大学水利学院,河南郑州 450046)

1 引言

藻类是具同化色素而能独立进行营养生活的水生低等植物的总称,是原生生物界一类真核生物。其生长和空间分布受到温度、溶解氧、营养盐、氨氮含量、光照强度、水动力学等环境因素的影响[1]。目前,国内对藻类生长的因素已有大量的研究,关于藻类影响因素分析的研究区域可分为河流和水库两种,研究区域不同及采用的研究方法不同都会对结果造成影响。关于藻类的影响因子分析方法,较多采用相关分析的方法。陈倩以贵阳市百花水库为研究对象,采用DCA 和RNA 分析方法,探究了影响浮游藻类生长分布主要的环境因子,结果表明,温度是影响水库浮游藻类时空分布的主要环境因子[2]。张存凯采用CCA(典型对应分析)对黄龙风景区内12 个典型样地的藻样和水样进行研究分析,得到水体pH 值和海拔是影响藻类群落分布的主要环境因子[3]。秦业海等利用SparkR 数据平台建立藻类生长模型,得出苦草组藻类生长主要影响因子为pH、溶解氧、浊度、总磷、总氮,并建立回归方程进行了验证[4]。郭敏丽等[5]通过数值模拟方法利用AQUATOX 模型模拟了藻类不同的生长环境,得出温度、水动力条件和总氮浓度是藻类生长的主要影响因子。以上学者关于藻类影响因子的分析均采用了相关分析的方法,该方法使用简单,计算结果易于分析,但藻类的生长受到多因素影响,仅采用相关性分析的方法得出的结果往往不具有代表性,还需采用其他方法进行修正。

主成分分析法用于多指标的综合影响分析,现广泛应用于农作物品种评估、电力系统综合评价、水资源保护和水土流失研究等多个方面[6-9]。其利用降维和矩阵运算的思想,分析各成分之间的相关性以及各成分对目标函数的影响程度,能够比较全面地分析各因素之间的关系。特别是近年来,随着计算机软件的应用,使得主成分分析法在医学和互联网技术等方面的应用也越来越广泛[10-11]。

基于此,以某水库为研究对象,通过对2018 年4—5 月和2019 年4—5 月水库环境因子分析,采用Pearson 相关分析探究温度、溶解氧、高锰酸盐、溶解性总磷、氨氮含量对藻类密度的影响,并利用主成分分析法确定各环境因素对藻类密度变化的贡献度,来探究蓝藻生长的主要影响因子,为水库水资源管理、抑制藻类水华提供重要的理论支撑。

2 材料与方法

2.1 研究区概况及数据来源

研究区位于长江三角洲,长江三角洲濒临黄海与东海,地处江海交汇之地,港口众多,河川纵横,湖荡棋布,水资源极其丰富。其气候主要为亚热带季风气候,夏季高温多雨,冬季温和少雨,1 月平均气温普遍在0 ℃以上,夏季较热,7,8 月份平均气温一般为25~35 ℃,年降水量一般在800~1 000 mm 以上,属于湿润区。

研究中用到的数据是水库内定点实时的监测数据。温度、溶解氧、高锰酸盐、溶解性总磷、氨氮含量和蓝藻密度每小时监测1 次。输水管道处平均温度为18.5 ℃,平均溶解氧含量为8.76 mg/L,平均高锰酸盐含量为2.51 mg/L,平均溶解性总磷含量为0.072 mg/L,平均氨氮含量为0.03 mg/L,平均蓝藻密度为269 万个/L;下游闸内处平均温度为18.8 ℃,平均溶解氧含量为9.73 mg/L,平均高锰酸盐含量为2.54 mg/L,平均溶解性总磷含量为0.041 mg/L,平均氨氮含量为0.02 mg/L,平均蓝藻密度为168 万个/L;下游闸外处平均温度为19.6 ℃,平均溶解氧含量为8.62 mg/L,平均高锰酸盐含量为2.33 mg/L,平均溶解性总磷含量为0.05 mg/L,平均氨氮含量为0.02 mg/L,平均蓝藻密度为9.2 万个/L。

2.2 研究方法

2.2.1 Pearson 相关分析理论

Pearson 相关分析用于研究定量数据之间的关系情况,包括是否有关系以及关系紧密程度等,在气象、水文和农业等领域有广泛的应用,其相关系数计算公式为:

式中,X(x1,x2,...,xn)和Y(y1,y2,...,yn)为2 个连续相关变量序列;r 为相关系数,其取值在-1.0 到1.0 之间,接近0 的变量被称为无相关性,接近1 或者-1被称为具有强相关性。

2.2.2 主成分分析理论

主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量尽可能地代表原来变量的信息量,而且彼此之间互不相关。对于一个样本资料,其样品的数据矩阵为:

式中,p 为观测变量数;n 为样品总数;xij为第i 个样品的第j 个观测值。

基于降维的思想,将原来众多具有一定相关性的变量x1,x2,...,xp经过线性组合和筛选,重新组合为一组新的相互无关的综合变量Z1,Z2,...,Zm(m≤p),则:

式中,aij表示原来变量x1,x2,...,xp在主成分Z1,Z2,...,Zm(m≤p)上的系数,也就是x1,x2,...,xp的相关系数矩阵中较大的m 个特征值所对应的单位特征向量。

根据计算的主成分求得其贡献率为:

式中,r 表示各主成分的贡献率;pi表示第i 个主成分的方差。

主成分个数的选取主要根据主成分的累积贡献率来决定,贡献率越大,说明该主成分所包含的原始变量的信息越强。一般要求累计贡献率达到70%以上,才能保证综合变量能包括原始变量的绝大多数信息。

3 结果与分析

3.1 空间位置对蓝藻密度的影响

对比2018 年水库不同位置蓝藻密度日均值统计结果分析可知,蓝藻密度均值在水库下游闸外处变化微弱,且密度均值小于其他位置处。分析原因可知,水库闸室外下游水流流动幅度大,水下空间较大,水中营养成分相对含量较少,并且会出现开闸放水的特殊情况;对比来看,输水管道处空间狭小,适合蓝藻繁殖生长,故此其蓝藻密度大于其他位置处。

对比2018 年和2019 年输水管道处蓝藻密度情况可知,2018 年蓝藻密度日均值稳定在50 万个/L,2019 年蓝藻密度日均值变化幅度较大,稳定在300 万个/L,两者相差较大。对比相应的温度、溶解氧、高锰酸盐、溶解性总磷、氨氮含量,发现两年总体差别不大,具体原因还需要从其他角度深入分析。

3.2 环境因子对蓝藻密度的影响

3.2.1 Pearson 相关性分析结果

分别以温度、溶解氧、高锰酸盐、溶解性总磷、氨氮含量为序列X(x1,x2,...,xn),以蓝藻密度为序列Y(y1,y2,...,yn),根据Pearson 相关分析公式计算其相应的相关系数r。表1 为2018 年和2019 年输水管道处蓝藻密度和各影响因子的Pearson 相关系数r值。

表1 Pearson 相关分析结果

从表1 结果来看,各影响因子与蓝藻密度的相关系数最大值在0.5 附近,表明其相关程度都不高,此时Pearson 相关性分析结果不能准确反映各影响因子和蓝藻密度的相关性。由此可见,蓝藻密度的影响因素不是单一的,蓝藻的繁殖和分布可能受营养因素、外界环境等多方面因素的共同影响。这种情况下应考虑采用主成分分析法,从几种影响因子中找出综合变量来替代。

3.2.2 主成分分析结果

为了进一步分析不同影响因子的贡献度,采取主成分分析法对各影响因子进行分析,选取2018 年和2019 年输水管道处蓝藻为研究对象,把温度、溶解氧、高锰酸盐、溶解性总磷、氨氮含量作为最初的观测变量x1,x2,x3,x4,x5,计算各变量之间的相关矩阵X,根据矩阵运算求出相关矩阵的特征值和特征向量。根据降维的思想,对原本的观测变量x1,x2,x3,x4,x5经过组合和筛选得到新的一组相互无关的综合变量z1,z2,z3,z4,z5,即各个计算后的主成分,根据主成分的方差计算得到相应主成分的特征值和贡献率,见表2。

表2 主成分特征值、贡献率及累计贡献率

由表2 可知,2018 年的前3 个主成分特征值大于1,累计贡献率达到77%,大于70%,说明前3 个主成分具有了表达整体的能力;2019 年的前2 个主成分特征值大于1,第三主成分特征值接近1,累计贡献率达到74.9%,大于70%,说明这3 个主成分也具有表达整体的能力。经过分析可初步证明计算结果的正确性,可以进行下一步分析。

选取前3 个主成分进行主成分荷载分析,利用协方差矩阵分别计算各主成分与温度、溶解氧、高锰酸盐、溶解性总磷、氨氮含量之间的相关性,计算结果见表3。

表3 主成分荷载分析计算结果

注:计算结果介于-1 和1 之间,其绝对值越接近1,代表该影响因子与主成分之间关系越密切。

由表2—3 可知,2018 年中,第一主成分贡献率为35.392%,温度和溶解氧的荷载分别系数为0.919和-0.926,说明温度和溶解氧与第一主成分的关系密切;第二主成分贡献率为21.540%,高锰酸盐和氨氮的荷载系数分别为0.783 和0.653,说明它们与第二主成分关系密切;第三主成分贡献率为20.076%,溶解性总磷的荷载系数为0.971,说明它和第三主成分关系密切。综合以上分析,可得到溶解氧与蓝藻密度关系最密切,温度次之。

2019 年中,第一主成分贡献率为34.638%,温度和溶解氧的荷载系数分别为0.811 和-0.881,说明温度和溶解氧与第一主成分的关系密切;第二主成分贡献率为21.210%,高锰酸盐的荷载系数为0.814,表明它与第二主成分关系密切;第三主成分贡献率为19.096%,高锰酸盐和氨氮的荷载系数分别为0.524 和0.799,表明它们与第三主成分关系密切。综合以上分析,可得到溶解氧与蓝藻密度关系最密切,温度次之,基本上和2018 年分析结果一致。

综合分析表3 数据可得,2018 年和2019 年水中温度和溶解氧对藻类影响最大,对比温度和溶解氧主成分荷载系数,可得温度的荷载系数为正,溶解氧的荷载系数为负。结合国内相关研究结果[2-3]分析可知,温度的荷载系数为正,表示温度与蓝藻密度成正相关;溶解氧的荷载系数为负,表明溶解氧与蓝藻密度成负相关;水体中温度和溶氧量成负相关。因此,水中温度和溶解氧可概化为一个影响因子。

3.3 蓝藻密度最大值结果分析

分析蓝藻密度在不同位置处日均值变化,选取2018 年5 月10—17 日输水管道处为最大值系列,对温度与溶解氧、高锰酸盐、溶解性总磷、氨氮含量及蓝藻密度分别求均值,计算各因素的增长率,并与整体数据进行比较,比较结果见表4。

表4 最大值系列均值与整体均值比较结果

由表4 可知,最大值系列温度均值比整体均值增长11.89%,表明温度与蓝藻密度成正相关,溶解氧降低9.93%,表明溶解氧与蓝藻密度成负相关,与Pearson 相关分析和主成分相关分析结果一致。许海选取不同的氮磷浓度,分析了藻类形成水华的效果,结果表明,蓝藻水华是湖泊富营养化发展到特定阶段的产物,水体氮、磷浓度过高或过低均不易产生蓝藻优势[12]。本次分析中溶解性总磷含量相比最大值系列均值降低30.56%,其结果与许海的研究结果相一致,可见溶解性总磷对蓝藻的生长繁殖起到一定的抑制作用。因此,在某范围氮、磷浓度中,增大水中溶解氧含量和溶解性总磷含量可能会抑制蓝藻的生长,防止水体出现水华现象。

4 结论

(1)研究采用主成分分析理论确定各环境因子对蓝藻密度变化的贡献度,能够比较全面地分析各因素之间的关系,研究结果更具代表性。

(2)输水管道处空间狭小,利于蓝藻生长,而下游闸室外水体空间较大且会出现开闸放水的特殊情况,不利于蓝藻生长。因此输水管道处蓝藻密度最高,下游闸内次之,下游闸外最低。

(3)Pearson 相关分析和主成分相关分析结果表明,温度和溶解氧含量与蓝藻密度相关程度最大,温度和蓝藻密度成正相关,溶解氧与蓝藻密度成负相关。

(4)对蓝藻密度最大值系列分析,在某种氮、磷浓度范围内,降低水中溶解氧含量和溶解性总磷含量,将有利于蓝藻的生长。

综上所述,蓝藻生长受空间位置、水体元素含量、温度等多方面因素影响,掌握影响蓝藻生长的具体原因和过程,对水资源管理和水环境保护有重要现实意义。

猜你喜欢

高锰酸盐溶解性蓝藻
共沉淀引发的溶解性有机质在水铁矿/水界面的分子分馏特性*
从多元函数角度探讨高锰酸盐指数准确度的影响因素
全自动高锰酸盐指数分析仪在水环境监测中的应用
垃圾渗滤液溶解性有机物的分子指纹特征
南美白对虾养殖池塘蓝藻水华处理举措
针对八月高温蓝藻爆发的有效处理方案
高锰酸盐指数测定中若干问题的探讨
镀锡板高锰酸盐体系钝化膜的制备及表征
溶解性有机质对水中重金属生物有效性的影响研究
碳质材料催化臭氧氧化去除水中溶解性有机物的研究进展