基于主成分分析的近海水质评价模型及其应用研究
——以雷州半岛海域为例
2015-06-01付东洋刘大召丁又专梁晓军黄一平
付东洋,张 莹*,刘大召,丁又专,栾 虹,杨 锋,梁晓军,黄一平
(1.广东海洋大学 海洋遥感与信息技术实验室,广东 湛江 524088;2.湛江市海洋与渔业环境监测站,广东 湛江 524039)
基于主成分分析的近海水质评价模型及其应用研究
——以雷州半岛海域为例
付东洋1,张 莹*1,刘大召1,丁又专1,栾 虹1,杨 锋2,梁晓军2,黄一平2
(1.广东海洋大学 海洋遥感与信息技术实验室,广东 湛江 524088;2.湛江市海洋与渔业环境监测站,广东 湛江 524039)
为建立适用于近岸海域水质的评价模型,依照《国家海水水质标准》构建了1个包含13种水质指标信息、共计400个假设采样站位的数据样本。通过计算其KMO统计量、球形检验及相关矩阵发现,各水质指标间存在较大相关性,故可利用主成分分析方法进行分析。针对13个水质指标,仅前2个特征根大于1的主成分是有效的,且它们可以代表原假设数据81.25%的信息。利用前2个主成分建立了可完全区分四类水质的自动分类图版,即水质评价模型。根据上述水质评价模型绘制了2010年雷州半岛近岸海域的水质类型专题图。分析表明,雷州半岛的湛江港湾、鉴江口海域及铁山港区为第四类水质,东海岛西南、鉴江口外海、徐闻东北角海域、流沙湾及江洪港海域为三类水质,其它区域为一、二类水质。本研究较好地反应了雷州半岛近岸海域水质分布状况,可为该海域海洋环境综合治理及利用提供一定参考。
雷州半岛海域;近海水质;自动评价模型;主成分分析
0 引言
水质系统是一个多维因子组成的复杂系统[1]。依据《海水水质国家标准》,考虑海水水质分类问题所涉及到的指标多达35项,且这些指标间存在一定的相关性,如总磷和总氮的增加会引起藻类的大量繁殖,势必引起水体pH值的变化。水质监测指标的众多及指标间的相关性都给水质评价工作带来一定的困难。以往的水质评价方法主要有单因子指数法[2-4]、综合指数法[5-6]、分级评价法[7]、模糊理论、灰色系统理论、投影寻踪等方法[8-12]。然而上述方法都是尽可能利用较多的水质指标建立水质评价模型,在站位数据较多的情况下,不仅计算量大,而且由于水质指标间的相关性,影响了评价模型的效果。除此之外,对海洋水质状况的研究主要集中在渤海湾、长江口及珠江口海域[13-15],尚缺少对雷州半岛近岸海域水质状况的研究。
本文针对上述问题,建立了适用于近岸海域尤其是雷州半岛(约20°00′N~21°70′N, 109°20′E~111°00′E范围)的近海水体的水质评价模型:首先依据《海水水质国家标准》建立一个四类水质的假设样本(共400个站位组成,每个站位包含13个水质指标信息);继而利用KMO统计和球形检验对该样本中13个指标的相关性进行探讨;再基于正交变换思想,利用主成分分析(PCA)将相关的水质指标量化为少数不相关的主成分;最后利用得到的主成分建立水质评价模型,从而实现近岸海域水质状况的自动分析评价。
1 水质评价模型的建立
1.1 水质假设样本
根据研究区实测水质数据所涉及到的13个指标,这13个指标通常也是我国近海环境监测采用的指标,按照GB3097—1997《国家海水水质标准》[16](表1)建立包含400个数据点的假设样本,即以这13个水质指标各级的标准区间值作为样本值,每类水质100个数据点,共四类水质。
表1 海水水质标准[16]
1.2 水质指标间的相关性
表2为13个水质指标间的相关矩阵。从表中可以看出,13个水质指标之间的相关性较高,基本保持着0.7~0.8的相关度,因此如果直接使用这13个指标建立评价模型,会带来严重的共线性问题。
表2 13个水质指标的相关矩阵
同时,计算该样本各指标间的偏相关性KMO统计量(Kaiser-Meyer-Olkin)值为0.97,也说明了各水质指标间的相关度较大;而该样本的球形假设检验被拒绝,说明各水质指标并非独立,取值是有较大相关性的。
1.3 基于PCA的水质评价模型
通过计算相关矩阵、KMO统计量及球形检验可知,上述13个水质指标间存在较大的相关度。而主成分分析(PCA)恰是一种可以通过少数几个主成分来解释多个变量的方差-协方差结构的数学变换方法,因此可利用PCA建立近海水质评价模型。
1.3.1 主成分的提取
利用主成分分析方法,对水质假设样本中的13个指标进行提取,最多可以提取13个主成分。观察提取结果(表3)可知:第1个主成分的特征根为9.42,它解释了总变异的72.48%;第2个主成分的特征根为1.14,它解释了总变异的8.77%;再继续看第3个主成分,它的特征根为0.82,至此之后的各个主成分的特征值均小于1,说明该主成分的解释力度还不如直接引入原变量参数。因此,可见只提取前2个主成分即可,可解释总变异的81.25%。
表3 主成分分析表
为了更好地体现这种提取方式是否可以有效表征原始的水质参数,可以计算公因子方差比(表4),由此看出原始各水质指标中信息分别被提取出的比例。由表4可见,除pH的信息未能较充分地提取,其余12个水质指标的信息都被充分提取了,可达到71%~91%的提取程度。
表4 公因子方差比
1.3.2 水质评价图版
通过上述讨论可知,13个水质指标可以通过主成分分析方法转化为2个主成分。对于假设样本总体而言,这2个主成分可以代表原假设样本数据81.25%的信息。所提取的2个主成分与原13个水质指标间的关系式如下:
F1=0.1XN+0.094XP-0.098XDO+0.1XCOD-0.037XpH+0.096XOil+0.091XHg+0.091XCd+0.089XPd+0.097XCr+0.091XAs+0.084XCu+0.089XZn
(1)
F2=-0.104XN+0.111XP+0.132XDO-0.099XCOD+0.469XpH+0.196XOil+0.286XHg-0.285XCd+0.313XPd+0.159XCr-0.329XAs-0.255XCu+0.33XZn
(2)
其中,XN,XP,XDO,XCOD,XpH,XOil,XHg,XCd,XPd,XCr,XAs,XCu和XZn分别代表海水中无机氮、活性磷酸盐、溶解氧、化学需氧量、pH、石油类、汞、镉、铅、总铬、砷、铜和锌的含量。
由此,将这400个假设数据按照上述关系式进行转换,得到F1和F2值进行交会投点以建立水质类型自动分类图版(图1)。该图版对于依照《国家海水水质标准》所建立的400个假设数据点,四类水质能够完全正确地区分开,说明该图版具有良好的水质分类能力。
图1 水质自动分类图版
表5给出了各类水质F1和F2取值范围。对于待判站位水质类型的归属,即可以通过上述关系式将众多水质指标转化为F1和F2这2个主要成分,再根据表5中F1和F2的范围判断其所归属的水质类型,从而实现水质的自动判别。
表5 各类水质F1和F2取值范围
2 雷州半岛近岸海域水质状况应用研究
2.1 研究区概况
雷州半岛(约20°00′N~21°70′N, 109°20′E~111°00′E范围)位于中国大陆最南端,东临南海,西靠北部湾,南与海南省隔海相望,是我国第三大半岛,有东海岛、南三岛和硇洲等岛屿。该区域的湛江港不仅是我国大西南及东南亚地区重要的年吞吐能力近亿吨的出海大通道,同时也是国家级红树林、珊瑚礁的自然保护区,该区域生境多样,生物区系复杂,是多种经济鱼、虾、贝类的繁育所,因而也是我国尤其是广东省最重要的海产品养殖区。据广东省海洋环境质量公报报道,随着近几年湛江市(雷州半岛所辖行政区)经济社会的快速发展,特别是随着湛江港吞吐量的增加以及临港工业的高速发展,尤其是湛江石化产业、水产养殖业的进一步发展,湛江湾海水污染日趋明显,富营养化加重,赤潮时有发生。其中湛江港、流沙湾等海域富营养化异常严重,部分区域富营养化指数达到几十甚至超过100[17],湛江港湾内部分区域呈三类甚至四类水质[18-19],海洋水质环境呈明显下降趋势,因而加强该区域海洋水质环境调查与研究日益紧迫。
2.2 结果与分析
本文以雷州半岛近岸海域为示范研究区域,基于2010年夏季该海域55个采样站位,每站位13个水质要素指标为实验样本,利用本文建立的水质自动评价方法对雷州半岛近岸海域的水质状况进行了分析,绘制了2010年雷州半岛近岸海域水质分类专题图(图2)。结果表明,总体上2010年雷州半岛外海海域水质状况较好,主要呈一类和二类水质环境,但近岸海域尤其港湾内水质状况较差,不少区域呈三、四类水质,且半岛以东海域较以西海域水质状况更差一些。其中,湛江港口及邻近海域均为第四类水质,包括麻斜海、石龙海、鉴江出海口及东海岛跨海大桥西南浅滩海域,一方面,这些区域不仅受湛江市城市生活污染物排放的影响,同时也受湛江港及湛江石化企业等工业排放的影响;另一方面,湛江港口是一个半封闭状、港口处受特呈岛及东海岛的阻挡因而出海通道相对狭小的港口,港区内海水动力交换能力弱,这正是该区域水质状况呈四类水质的主要原因。另一四类水质区域主要集中在湛江与广西北海交界的区域,即铁山港区及山口红树林保护区,这一区域水质较差的主要原因可能是由于受港口排污的影响,同时由于湾口浅而狭长,水交换相对较弱所致。鉴江口外海、东海岛湾内海域、徐闻县东北角海域、流沙湾海域以及江洪港邻近海域均呈三类水体,其中鉴江口外海、东海岛附近及铁山港区外海可能主要受湾内四类水质扩散的影响;而流沙湾、江洪港及徐闻东北角海域均是重要的水产养殖区,尤其是流沙湾附近海域,是我国海水珍珠贝苗和海水珍珠的重要生产基地, 也是我国“南珠”的主要产区之一,水体悬浮泥沙及富营养化程度较高[20],这可能是这些区域水质较差的主要原因。从图2可见,流沙湾及邻近海域三类水质面积较大,并呈楔形向西南扩展,恶劣的水质环境对该区域珍珠贝养殖业会带来较大负面影响。
图2 2010年雷州半岛近岸海域水质类型专题图
除湛江与北海交界的海湾区域的水质研究鲜有报道外,其他学者研究表明,湛江港及邻近区域常呈三类、四类水质[17-19],与本文的分类结果较为一致,而流沙湾等区域一般呈二类水质状况[21]。根据我们获得的分类结果来看,湛江港附近海域三类、四类水质的面积较早期研究结果有明显的增大[22-23],且流沙湾附近海域也由二类水质下降为三类水质区域,山口红树林自然保护区近海水质状况更不容乐观,上述分析表明,雷州半岛近岸海域近年水质状况呈进一步恶化趋势。
3 结论
(1)本研究根据《国家海水水质标准》中各水质指标的标准区间值建立假设采样数据,研究共假设400个数据点,每类水质100个数据点,每个数据点包含13个水质指标信息。计算该假设数据的KMO统计量值为0.97,球形检验被拒绝。
(2)为了消除各水质指标间的相关性,基于正交变换的思想,引入主成分分析方法将13个水质指标转化为2个主要成分,继而利用这2个主成分制作交会图版,实现水质类型的自动评价,该评价方法可以完全正确地区分400个数据点水质类型。
(3)利用2010年雷州半岛近岸海域实测数据,对本文采用的方法进行了应用研究,该分类方法较好地反应了雷州半岛近岸海域水质环境实际情况。湛江港口、鉴江口海域及铁山港区附近海域均为第四类水质,而东海岛、雷州湾、流沙湾和江洪港附近海域呈三类水质,与早期研究结果相比,该区域水质环境有进一步恶化的趋势。
[1] LU Wen-xi, LI Jun, YU Fu-rong, et al. Application of stepwise discriminant analytical method in screening factor in the water quality evaluation[J]. Journal of Jilin University: Earth Science Edition,2009,39(1):126-130. 卢文喜,李俊,于福荣,等.逐步判别分析法在筛选水质评价因子中的应用[J].吉林大学学报:地球科学版,2009,39(1):126-130.
[2] LIU Cui-mei, WEN Wei-ying, HE Qing-xi. Actuality survey and assessment of marine environment in Qiongzhou Strait[J]. Marine Environmental Science,2002,21(4):24-28. 刘翠梅,温伟英,何清溪.琼州海峡海洋环境现状调查与评价[J].海洋环境科学,2002,21(4):24-28.
[3] LI Jian-jun, FENG Mu-hua. Assessment on the situation of water quality in Liaodong Bay shallow waters[J]. Marine Environmental Science,2001,20(3):42-45. 李建军,冯慕华.辽东湾浅水区水环境质量现状评价[J].海洋环境科学,2001,20(3):42-45.
[4] SONG Lun, ZHOU Zun-chun, WANG Nian-bin, et al. An appraisal of the environmental quality status and trend in Liaoning coastal area[J]. Fisheries Science,2007,26(11):613-618. 宋伦,周遵春,王年斌,等.辽宁省近岸海洋环境质量状况与趋势评价[J].水产科学,2007,26(11):613-618.
[5] WALSKI T M, PARKER F L. Consumers water quality index[J]. Journal of the Environmental Engineering Division,1974,100(3):593-611.
[6] SHANNON E E, BREZONIK P L. Euthrophication analysis: A multivariate approach[J]. Journal of the Sanitary Engineering Division,1972,98(1):37-57.
[7] WAN Xian-tao. Considerations on key problems of water quality assessment in China[J]. Advances in Water Science,1998,9(3):296-302. 万咸涛.我国水质评价几个关键性技术问题[J].水科学进展,1998,9(3):296-302.
[8] FU Hui, SUN Ying-lan, SUN Lei, et al. The application of grey relational analysis in assessment of marine environmental quality[J]. Transactions of Oceanology and Limnology,2007(3):127-131. 付会,孙英兰,孙磊,等.灰色关联分析法在海洋环境质量评价中的应用[J].海洋湖沼通报,2007(3):127-131.
[9] QIN Chang-bo, ZHENG Bing-hui, QIN Yan-wen, et al. Gray correlation assessment of water environment quality for Tianjin coastal zone in Bohai bay[J]. Research on Environmental Science,2006,19(6):94-99. 秦昌波,郑丙辉,秦延文,等.渤海湾天津段海岸带水环境质量灰色关联度评价[J].环境科学研究,2006,19(6):94-99.
[10] LIU Jin-ying, YANG Tian-xing, LI Ming, et al. A weight absolute grey correlation degree and it's application in evaluation of water quality Miyun reservoir[J]. Journal of Jilin University: Earth Science Edition,2005,35(1):54-58. 刘金英,杨天行,李明,等.一种加权绝对灰色关联度及其在密云水库水质评价中的应用[J].吉林大学学报:地球科学版,2005,35(1):54-58.
[11] WANG Bei-xin, YANG Lian-fang. Bioassessment of Qinhuai River using a river biological index[J]. Acta Ecologica Sinica,2002,23(10):2 080-2 091. 王备新,杨莲芳.用河流生物指数评价秦淮河上游水质的研究[J].生态学报,2003,23(10):2 082-2 091.
[12] CAI Ru-yu. Artificial neutral network predicting model of noctiluca scientillans density and physical and chemical parameters[J]. Environmental Monitoring in China,2001,17(3):52-55. 蔡如钰.基于人工神经网络的夜光藻密度预测模型[J].中国环境监测,2001,17(3):52-55.
[13] QUAN Wei-min, SHEN Xin-qiang, HAN Jin-di, et al. Analysis and assessment on eutrophication status and developing trend in Changjiang Estuary and adjacent sea[J]. Marine Environmental Science,2005,24(3):13-16. 全为民,沈新强,韩金娣,等.长江口及邻近水域富营养化现状及变化趋势的评价与分析[J].海洋环境科学,2005,24(3):13-16.
[14] YANG Mei-lan, LIN Qin, HUANG Hong-hui, et al. Distribution feature of COD in the waters of Pearl River estuary[J]. Marine Science Bulletin,2005,24(4):22-26. 杨美兰,林钦,黄洪辉,等.珠江口水域化学耗氧量(COD)的分布特征[J].海洋通报,2005,24(4):22-26.
[15] ZHANG Li-xu, ZHAO Min, SHI Jun. Classifying of surface seawater pollution factors and assessing of environmental comprehensive quality in Changjiang Estuary inshore [J]. Transactions of Oceanology and Limnology,2010(3):107-114. 张丽旭,赵敏,时俊.长江口近岸表层海水污染因子的分类判别与环境质量综合评价[J].海洋湖沼通报,2010(3):107-114.
[16] GB 3097—1997 Sea water quality standard[S].1998. GB 3097—1997海水水质标准[S].1998.
[17] CHENG Hai-ou, MA Qi-min, YANG Feng. Level of etrophication and phytoplankton diversity in Zhanjiang Bay[J]. Transactions of Oceanology and Limnolog,2009(3):121-126. 程海鸥,马启敏,杨锋.湛江湾海水富营养化水平和浮游植物多样性分析[J].海洋湖沼通报,2009(3):121-126.
[18] LU Jing, FANG He-ping, LI Kai-jun, et al. Water quality investigation and assessment on seawater in Zhanjiang Port-bay[J]. Environmental Protection in Transportation,2002,23(3):16-24. 路静,方和平,李开军,等.湛江港湾海域水质状况调查及其评价[J].交通环保,2002,23(3):16-24.
[19] ZHANG Cai-xue, SUN Sheng-li, CHEN Chun-liang. Heavy metals in seawater, surface sediment and shellfishes in tideland of Zhanjiang Harbor[J]. Journal of Guangdong Ocean University,2011,31(1):67-72. 张才学,孙省利,陈春亮.湛江港附近海域潮间带海水、沉积物和贝类体内的重金属[J].广东海洋大学学报,2011,31(1):67-72.
[20] ZHU Chun-hua, SHEN Yu-chun, XIE En-yi, et al. Aquaculture carrying capacity ofPinctadamartensiiin Liusha Bay of Zhanjiang[J]. Journal of Tropical Oceanography,2011,30(3):76-81. 朱春华,申玉春,谢恩义,等.湛江流沙湾马氏珠母贝的养殖容量[J].热带海洋学报,2011,30(3):76-81.
[21] XIE Qun, ZHANG Yu-bin, SUN Sheng-li. Seawater quality comprehensive evaluation and analysis in Liusha Bay[J]. Environmental Monitoring in China,2011,27(1):77-83. 谢群,张瑜斌,孙省利.流沙湾海域水质的综合评价与分析[J].中国环境监测,2011,27(1):77-83.
[22] ZHANG Ying, FU Dong-yang, PAN De-lu, et al. The application of a stepwise discriminant analysis method in a marine water quality evaluation[J]. Acta Oceanologica Sinica(in Chincsc),2013,35(6):204-208. 张莹,付东洋,潘德炉,等.逐步判别分析法在海洋水质评价中的应用[J].海洋学报,2013,35(6):204-208.
[23] ZHANG Ying, XIE Shi-yi, YANG Feng. Research and application of the method for water quality evaluation in the sea area off western Guangdong[J].Advances in Marine Science,2012,30(2):198-203. 张莹,谢仕义,杨峰.粤西海域水质评价方法的研究及应用[J].海洋科学进展,2012,30(2):198-203.
Evaluation model of coastal water quality and application research based on principal component analysis ——a case of Leizhou Peninsula waters
FU Dong-yang1, ZHANG Ying*1, LIU Da-zhao1, DING You-zhuan1, LUAN Hong1, YANG Feng2, LIANG Xiao-jun2, HUANG Yi-pin2
(1.LaboratoryofOceanRemoteSensing&InformationTechnology,GuangdongOceanUniversity,Zhanjiang524088,China; 2.ZhanjiangOceanicandFisheryEnvironmentalMonitoringStation,Zhanjiang524039,China)
In this study, a data sample has been established including 13 sorts of water quality indexes and 400 stations of hypothesis sampling according to the
Leizhou Peninsula; coastal water quality; automatic evaluation model; principal component analysis
10.3969/j.issn.1001-909X.2015.01.007.
2014-07-02
2014-12-30
国家海洋重大公益专项项目资助(201305019);浙江省博士后基金项目资助(BSH1301015);国家海洋局第二海洋研究所博士后基金项目资助(JG1319);卫星海洋环境动力学国家重点实验室开放基金项目资助(SOED1202);广东省社会科学规划项目资助(GD12YGL04);广东省高校优秀青年创新计划项目资助(2012WYM_0077);广东海洋大学博士启动基金项目资助(E11043, E11332, E11097)
付东洋(1969-),男,四川阆中市人,副教授,主要从事海洋遥感与环境方面的研究。E-mail:fdy163@163.com
*通讯作者:张莹(1982-),女,讲师,主要从事海洋遥感与环境方面的研究。E-mail: zhangying198206@126.com
X824
A
1001-909X(2015)01-0045-06
10.3969/j.issn.1001-909X.2015.01.007
付东洋,张莹,刘大召,等.基于主成分分析的近海水质评价模型及其应用研究——以雷州半岛海域为例[J].海洋学研究,2015,33(1):45-50,
FU Dong-yang, ZHANG Ying, LIU Da-zhao, et al. Evaluation model of coastal water quality and application research based on principal component analysis——a case of Leizhou Peninsula waters[J]. Journal of Marine Sciences,2015,33(1):45-50, doi:10.3969/j.issn.1001-909X.2015.01.007.