基于主成分分析的铁山港水质时空变化及驱动因素
2022-04-25申友利石洪源刘国强
孙 燕,申友利,石洪源,刘国强
(1.国家海洋局北海海洋环境监测中心站,广西 北海 536026;2.鲁东大学土木工程学院,山东 烟台 264025)
铁山港位于广西北海市东部,是广西重要的出海口,也是北海市的主要工业基地。铁山港湾是北海市面积最大、水体最深的内陆港湾,呈狭长的喇叭状,湾内有山口红树林和合浦儒艮两个国家级自然保护区,分布着红树林、海草床等重要生态系统[1],同时也是重要的养殖场所,对湾内的海水质量要求较高。随着铁山港沿岸港口码头建设、临海工业的迅速发展,大量的工业和生活污染物排入铁山港湾,造成湾内的海水质量状况自2003 年至2012年呈波动下降趋势[2-3],此后关于铁山港湾水质变化状况的研究很少报道。但此后的几年,铁山港大规模围填海及临港工业持续发展,是否造成海域水质的严重恶化,是一个值得研究的问题,分析铁山港湾的海水质量变化趋势具有重要意义。
目前,一些学者对铁山港湾水质的营养盐分布特征和富营养化状况进行了大量研究[4-6],但缺乏利用物理因子、营养盐和重金属等综合指标进行水质评价的研究。目前,常用的水质评价方法有单因子指数法、富营养化指数法、有机污染指数法、模糊综合评价法等[7-8],上述评价方法在站位或监测指标较多的情况下,计算工作量较大,有些在一定程度上受到主观因素影响,存在一定的局限性[9]。主成分分析法(Principal Component Analysis,PCA) 能够保证在原始数据变量信息损失最小的情况下,利用变量之间存在的相互关系,通过统计分析方法将众多变量转变为少数几个综合变量,并且能够客观地确定权重,避免了主观随意性[10]。目前PCA 方法已广泛应用在河流、湖泊及海湾的水质评价中[11-14],但应用于铁山港湾水质评价及主要驱动因子的研究尚未见报道。
本文根据2016—2018 年夏季铁山港湾海域环境调查数据,运用主成分分析法对铁山港湾的水质状况进行研究,分析影响该海域水质的主要因素,通过主成分综合得分研究铁山港湾水质时空变化格局,分析该海域水质污染的主要来源,可为铁山港湾海域环境保护和治理提供依据。
1 材料与方法
1.1 调查时间和区域
铁山港湾海域海水水质调查的时间为2016—2018 年的8 月(夏季),分为3 个航次,调查范围为109.52°E—109.65°E,21.36°N—21.64°N,共布设调查站位10 个,其中,内湾布设2 个(T1—T2),湾口布设4 个(T3—T6),湾外布设4 个(T7—T10)。
1.2 样品采集与分析方法
调查指标共17 项,分别为水温(T)、pH、盐度(S)、溶解氧(DO)、化学需氧量(CODMn)、悬浮物(SS)、石油类(Oil)、叶绿素a(Chl-a)、无机氮(DIN,为亚硝酸盐氮、硝酸盐氮和氨氮之和)、活性磷酸盐(PO4-P),以及汞(Hg)、砷(As)、铬(Cr)、铜(Cu)、铅(Pb)、锌(Zn)、镉(Cd)等重金属。水样采用有机玻璃采水器进行采集,采样层次按照《海洋监测规范》(GB 17378—2007) 的要求采集表层和底层;样品现场处理和分析方法按照《海洋监测规范》(GB 17378—2007)执行。
水温采用表层水温表测定;pH 采用pH 计测定;盐度采用盐度计测定;溶解氧采用碘量法测定;化学需氧量采用碱性高锰酸钾法测定;悬浮物采用万分之一电子天平测定;石油类采用紫外分光光度法测定;叶绿素a 采用荧光光度法测定;亚硝酸盐氮、硝酸盐氮和氨氮均采用流动分析法测定;活性磷酸盐采用磷钼蓝分光光度法测定;汞和砷采用原子荧光法测定;铬采用原子吸收分光光度法测定;铜、铅、锌、镉采用阳极溶出伏安法测定。各调查站位的指标值采用表层和底层的均值参与评价。
1.3 主成分分析
(1)用原数据建立样本矩阵如下。
式中,n 为样本个数,每个样本有p 项指标。本文中n 为30(10 个站位,3 个航次),p 为17。
(2)对原数据进行标准化处理,消除原数据间不同数量级和量纲的影响,标准化处理后数据如下。
(3)对标准化处理后的数据进行KMO(Kaiser-Meyer-Olkin-Measure of Sampling Adequacy) 检验和巴特莱特球形检验(Bartlett Test of Sphercity)。KMO 检验是对原始变量之间的简相关系数和偏相关系数的相对大小进行检验,KMO 值越接近于1,意味着变量间的相关性越强,原有变量越适合做因子分析。巴特莱特球形检验是通过判断相关阵是否为单位阵来验证各变量间的相关性,如果相关阵为单位阵,则各变量间相互独立,不适合做因子分析,反之则适合做因子分析。当KMO 检验值大于0.5,Bartlett 球形检验值小于0.001 时,表明该数据各变量存在相互关系,并非独立,可以进行主成分分析。
(4)根据标准化数据矩阵,建立变量的相关系数矩阵R=(rij)p×p,根据特征方程|R-λI| =0,计算R 的特征值λi(i=1,2,…,p),即为主成分的方差,将特征值从大到小排列为λ1≥λ2≥…≥λp,则方差贡献率为累计方差贡献率为Ek=不同特征值对应的特征向量为Ig=(Ig1,Ig2,…,Igp)T(g=1,2,…,p),通过特征向量将标准化数据转化为主成分F。
(5)根据主成分方差累积贡献率至少80%或者特征值大于1.0 的原则确定主成分个数m。
(6)计算主成分综合得分,先求每个站位i 前m 个主成分的值,即
然后对前m 个主成分进行加权求和,每个主成分的权重系数为该主成分的方差贡献率,因此每航次各个站位的综合得分计算公式如下。
此外,本文通过斯皮尔曼检验(Spearman′s test)对主成分和监测指标进行相关性分析,研究了该海域水质污染的主要驱动因子。主成分分析和相关性分析利用IBM SPSS Statistics 25 软件进行。
2 结果与讨论
2.1 铁山港水质调查结果
表1 为2016—2018 年夏季铁山港海域海水各监测指标的浓度范围和平均值的统计结果,由表可知,每年各监测指标在不同区域含量变化较大,一是由于陆源生活污水、工业废水和养殖业废水的排入导致部分海域污染物浓度较高;二是由于陆源径流作用,近岸海域水体被稀释而使各监测指标浓度发生变化;三是由于受潮汐作用和季风的影响,湾内和湾外水体交换强度的不同使污染物迁移扩散的能力不同。从年际变化上来看,水温呈略微上升趋势,这主要与调查时的气候条件有关;盐度不具有规律性,其大小主要与陆源径流多少有关;pH、溶解氧和叶绿素a 呈波动状态,主要与当时的生物活动息息相关;化学需氧量、悬浮物和石油类呈逐年下降趋势;无机氮含量变化为0.180~0.223 mg/L,活性磷酸盐含量变化为0.006 7~0.010 3 mg/L,蒋清华等[3]对铁山港湾营养盐的研究报道中显示,2012年无机氮的浓度为0.062 mg/L,活性磷酸盐的浓度为0.001 2 mg/L,可见近几年营养盐有了较为明显的升高;汞呈现先降低后升高的趋势但变化不显著;砷、铅和镉呈逐年下降趋势;2017—2018 年铜和锌的含量相差不大,且相较于2016 年含量显著降低;铬不同于其他重金属,呈现2017 年和2018年比2016 年含量高的状况。
表1 铁山港海域海水水质调查结果
2.2 铁山港湾水质主成分分析
本研究中的KMO 检验值为0.646,巴特莱特球形检验值小于0.001,说明变量间存在相互关系,不相互独立,主成分分析适用性好,可以进行主成分分析。根据特征值大于1 的原则筛选出5 种主成分,解释了原始变量75.74%的信息。筛选出的5种主成分的特征值、方差贡献率及累计方差贡献率如表2 所示。通过软件运行得出主成分的因子载荷见表3,该因子载荷反映了各监测指标在主成分中所占的权重,其值除以对应主成分特征值的平方根再乘以标准化后的数据即为各主成分得分。
表2 主成分的特征值、方差贡献率及累计方差贡献率
表3 主成分中各因子载荷
主成分1 对总方差的贡献率为31.27%,盐度和溶解氧占有较高权重,因子载荷分别为-0.879和-0.878;其次为pH 和活性磷酸盐,因子载荷分别为-0.803 和0.793,主成分1 既反映了与浮游植物生长相关的盐度、溶解氧、pH 等物理环境因子,也反映了浮游植物生长过程中受磷营养盐的制约作用。进一步研究发现,物理环境因子与主成分1 呈现的是负载荷,而磷酸盐和无机氮呈现的是正载荷,反映了两者之间存在一定的相关性,盐度低的海域主要是由于陆源淡水的注入所致,同时陆源径流携带大量的营养盐和有机物排放入海,导致该海域氮、磷营养盐含量上升;另外,该海域需要消耗大量的溶解氧分解有机物并释放出CO2,导致水体中溶解氧含量下降而pH 值降低。除此之外,叶绿素a 在主成分1 中的载荷相对较高(0.693),直接表征了浮游植物生物量的大小[15]。因此,主成分1可以概括为浮游植物生长理化环境指标。
主成分2 可以描述原始变量信息的20.71%,其中铜(0.823)、铅(0.799)、镉(0.763)占有较高权重,铁山港临海分布有冶炼、电镀等企业和重金属堆场等,还有金鲳鱼、大蚝等海产养殖业,工业废水和养殖业废水的排放为该海域重金属的污染防治带来一定的压力[16-17],因此,主成分2 可概括为重金属对铁山港水质质量的影响。
主成分3 对总方差贡献率为8.88%,主要代表为悬浮物和石油类,反映了沿岸工程项目以及船舶排污等对该海域水质质量的影响。主成分4 和主成分5 对总方差的贡献率分别为8.16%和6.72%,分别代表汞和砷。
2.3 铁山港湾水质时空变化特征
铁山港湾3 个航次各站位的主成分综合得分见表4,主成分综合得分越大,表明该站位的水质污染越严重。通过绘制箱线图分析铁山港湾水质的年际变化(图1),箱体的顶部、底部和中部的横线表示数据的上、下四分位数和中位数,箱体向上下延伸的垂直线表示非异常数据的最大值和最小值,图中的小方框表示数据的平均值。2016 年8 月、2017年8 月、2018 年8 月铁山港湾水质主成分综合得分中位数分别为1.22、-0.47 和-1.13,总体呈逐年下降趋势,表明铁山港湾夏季的水质污染程度有所下降,水质状况有所好转,反映了近年来铁山港海域的海洋环境保护工作取得了一定成效。
图1 各年主成分综合得分箱线图
表4 各站位主成分综合得分
铁山港湾各站位的主成分综合得分空间分布状况见图2,由图可知,铁山港湾各站位主成分综合得分总体呈由湾内向湾外递减的趋势。2016 年8月主成分综合得分最大值出现在湾内的T2 站位(2.08),最小值出现在湾外的T10 站位(-0.15),由于铁山港湾内水动力交换能力较弱导致湾内水质污染较重,而在湾外随着潮流和波浪等动力作用,水体中各水质因子迅速扩散,湾外水质污染状况普遍较轻;另外,处于湾口处的站位主成分综合得分呈现中部比两侧偏高的现象,主要是由于中部为航道,过往船只较多,监测数据显示T5 站位油类浓度为0.111 0 mg/L,明显高于其他站位(0.011 7~0.070 7 mg/L);再者,在湾外海域西侧呈现比东侧偏高的现象,主要由于营盘镇附近海域养殖业较多,养殖自身产生的污染对该区域水质产生一定的影响。2017 年8 月主成分综合得分最大值出现在湾内的T1 站位(0.76),最小值出现在湾外的T9 站位(-1.11),与2016 年相比,各监测站位的主成分综合得分均有所降低但分布状况与2016 年极为相似,其中,湾内的2 个站位主成分综合得分明显高于湾口和湾外;湾口处中部高于两侧,监测数据显示,无机氮的最高值出现在T5 站位(0.353 mg/L),其他站位的无机氮浓度分布于0.060 7~0.318 mg/L之间;湾外海域水质分布较为均匀。2018 年8 月湾内2 个站位主成分综合得分明显高于湾口和湾外站位,相比于2016 和2017 年,2018 年铁山港湾水质污染状况较轻,特别是湾口和湾外区域水质较为接近,有了较为明显的改善。
图2 不同年份主成分综合得分空间分布
2.3 水质污染的驱动因子
各监测指标与主成分之间的斯皮尔曼相关系数如表5 所示,盐度与主成分1 的相关系数最高(-0.871),且呈显著负相关,为影响该海域水质状况的主要驱动因子,这是由于陆源淡水注入导致铁山港湾近岸海域盐度降低,而陆源淡水一般会带来较为丰富的营养盐,使得铁山港湾湾内的水质污染程度较重。溶解氧与主成分1 的相关系数也较高,且呈负相关(-0.854),这是由于溶解氧的高低影响海洋生物的新陈代谢和生长[18],溶解氧含量低,有机物的分解速度被抑制,造成有机物含量在水体中累积增多,导致水环境质量下降;相反,溶解氧含量高,有利于浮游植物的繁殖生长,从而可以加快有机物的分解速度,调节生态系统中的物质循环,起到海水净化的功能。
表5 各监测指标与主成分之间的斯皮尔曼相关系数
铅与主成分2 的相关系数最大(0.859),其次为铜,其相关系数为0.832,为影响该海域水质污染程度的重要驱动因子,铁山港湾临海工业废水的排放为该海域水质重金属含量增加的主要原因,徐健淞等[17]早期对2011—2012 年铁山港工业排污的调查结果显示,铅为工业废水中的主要污染因子,本文的研究结果显示铅对铁山港湾水质仍具有较大的影响,需要加强对重金属排放总量的控制。
悬浮物与主成分3 的相关系数为0.769,表明悬浮物是驱动主成分3 的关键因子。另外,与主成分4 和主成分5 最为相关的环境指标分别为水温和砷,其相关系数分别为0.496 和0.492,进一步反映了物理因子和重金属类为影响该海域水质状况的重要驱动因子。
3 结 论
(1)2016—2018 年铁山港海域海水各监测指标含量分布较不均匀,受排污、径流和水动力等多种因素影响,17 项监测指标年际变化呈现不同的规律性,相较于2016 年,2017 年和2018 年大部分监测指标的含量均有所降低。
(2)本文运用主成分分析法将铁山港海域的17个水质综合指标转为5 种主成分,能够解释原始数据75.74%的结果,基本能够反映原指标信息。其中,主成分1 反映了铁山港海域水质与浮游植物生长的各项理化指标有关,主成分2 反映了铁山港海域水质受重金属的影响较大,两者的贡献率达51.98%。
(3)通过主成分分析法的综合得分,得出铁山港湾水质的时空变化状况,铁山港湾的水质总体呈现湾内比湾外污染严重的趋势,且不同于以往惯例,2016—2018 年夏季水质反而逐年变好。
(4) 铁山港湾水质污染的主要驱动因子为盐度、铅、悬浮物、水温和砷,陆源输入、临海工业和养殖业是影响该海域水质变化的主要因素,政府部门需重视对临海工业和养殖业废水排放的管控,避免铁山港湾水质的恶化。