苏家屯地区地下水源地水质调查与聚类分析
2020-05-11侯纪荣
侯纪荣 葛 鹏 金 碧
(1.沈阳市苏家屯区水利局,辽宁 沈阳 110101;2.盘锦市河闸管理处,辽宁 盘锦 124000)
饮用水质量事关居民生活健康,客观进行水质评价是保障水源地供水安全的基础。目前饮用水水质评价方法主要分为单一指标定性评价法和综合指标定量评价法,这些评价方法不仅能明确水体质量等级,还能量化水质分数。目前大部分研究是基于年内测定的水质数据给出评价结果,未充分考虑到水循环过程的季节变异性与水质指标间的理化联系,未结合区域水质矿质特点。鉴于此,本文以辽河平原苏家屯地区为例,在季候水质采样基础上,利用营养状态指数与自组织神经网络方法,对该地20个水源地水质进行综合评估,以期为该区域水源保护提供依据。
1 区域概况
苏家屯区地处沈阳市中南部的辽河中游与浑河交汇带,是沈阳的副中心城区。属低缓丘陵、平原分布区,海拔介于0~330m之间,发育有北沙河、十里河、柳沟河等辽河一级支流,流程达149km,径流面积达759km2,占区域总面积的90%。由于位于中高纬度大陆东岸,受西太平洋信风与高纬度冷高压交替控制形成了温带季风性气候,冬冷夏热、季候分明,年均气温8℃,年均降水659.6mm,日照时数2500h。该区居民饮用水源主要为地表水与地下水。2017年,根据苏家屯区饮用水源功能特点设站调查,共设水质点20个。
2 取样调查与测定分析
3 研究方法
3.1 营养状态指数法
水体是多种矿质成分混合液体,国内外学者基于水体的该特征给出了多种水质评价方法,如特征法、综合指数法、模糊关联法、内梅罗指数法等,其中TSI(Trophic State Index)营养状态指数法通过显示方程定量描述水质综合特征,是淡水质量测定的典型方法之一。其计算公式如下:
TSIm(Chl-a)=10[2.46+ln(Chl-a)/ln2.5]
(1)
TSIm(SD)=10〔2.46+[3.69-1.53
ln(SD)]/ln2.5〕
(2)
TSIm(TP)=10[2.46+(6.71+1.15
ln(TP))/ln2.5]
(3)
TSIm=W(Chl.a)·TSIm(Chl-a)+W(SD)·
TSIm(SD)+W(TP)·TSIm(TP)
(4)
式中:Chl-a、TP、SD分别为水质中绿素a、总磷、透明度的数值,其中TSIm(Chl-a)、TSIm(SD)、TSIm(TP)分别为各指标单项营养指数,TSIm为综合影响指数,用于评定水质营养型状况。基于Carlson和Aizaki对于TSI方法的定义,W为权重状态,通过以上公式将水体多种矿质成分浓度与水体质量联系起来。通常TSI的计算结果介于0~100之间,TSI≤31表明水质洁净;31
3.2 主成分分析法
主成分分析(Principal Components Analysis,PCA)是一种从高阶数据集中提取低阶核心成分的一种简化数据集的技术,能够根据数据集中的方差贡献识别单一要素的影响程度。本文以获取的水质样品数据矩阵为基础,运用R语言中的vegan数据包进行主成分特征提取,从而解析区域水质的影响因素。
3.3 自组织神经网络
自组织神经网络(Self-Orhainzing Map,SOM)是一种无监督聚类分析法,无须事先设定聚类数量和学习训练[3-5],主要根据特征维数数据集特征进行逻辑分裂,从而划分样本的类别。本文以水质样品数据集为特征维数,在此基础上运用Matlab2018软件中的SOM-APP工具进行特征聚类,从而识别20个水质点水质综合特征。
4 数据处理与分析
运用Excel 2016软件对测定的水质参数进行统计分析,计算TSI相关指数,并采用极值标准化方法进行归一化处理。在此基础上运用Matlab2018软件进行主成分分析。另外为了综合评定20个水质点综合水质差异,运用自组织神经网络(Self-Orhainzing Map,SOM)方法进行聚类分析[3-5]。
5 结果分析
5.1 水质季候变化特征
表1 苏家屯饮用水水质指标测定值
5.2 水质营养性综合评定
基于前述调查数据与改进的TSI水质营养量化方法,对苏家屯区饮用水水质季节性综合特征进行综合评价,结果见表2。各季节中水质TSI值存在明显差异(P<0.05),其中以夏季水质的TSI值最高,为21.32,以31的贫营养型下限值计算,其偏离仅为9.68,属年内水质最差阶段。其次是冬季,TSI为16.76,偏离下限值14.24。春季、秋季水质较好,TSI分别为12.98、8.97,偏离下限分别为18.02、22.03。其年内水质平均TSI为15.75,约为限值水平的1/2,表明该地区水质基本安全。虽然各季节水质不尽相同,但依据TSI平均分级,均属于贫营养型等级,表明水质属于安全型,对人体健康无损。
表2 苏家屯饮用水水质综合评定值
5.3 水质影响因素主成分分析
通过Matlab数学平台对调查的水质样点进行矢量可视化(见图1)。由图1可知,主成分轴PCA1和PCA2分别解释了42.58%、27.63%的信息,其综合解释能力达到67.21%,残差为32.79%,表明能够较好阐释水质的环境表达。pH值在PCA2轴上的矢量投影最长,表明pH值是水质质量的基础,它对水体中其他矿质成分如金属盐离子等具有重要影响。PCA1还与EC密切相关,其表征了离子属性及其活跃程度。PCA2主要反映了TN、TP和COD情况,TN为水生生物提供必不可少的营养物质,其含量过高易引起水体营养化;COD是水体质量的关键指标之一,由图1可知,第S17号水质点的化学需氧量过低。各水质点与矢量箭头的偏离程度反映了水质各指标质量分数丰度,就全局来看,pH值、TN和TP是其控制因素。
图1 苏家屯区水质参数PCA分析
5.4 基于SOM的水质点聚类分析
通过SOM神经网络对20个水质参数含量值进行聚类,以便直观分析各水质点综合质量差异。在进行聚类过程中,其关键在于计算神经元系数,系数值的大小决定其与聚类目标接近程度。由于该聚类过程对聚类层级的设定是先验的,因而需要设计合理随机化过程,使得神经元系数值具有稳定性。通过50次抽样,得到其平均值,结果见图2。依据其系数区间来看,pH值最小主要由于各水质点pH值差异不大,具有较小的信息熵,因而其聚类分离过程中的作用较小,反之NO2-N、NO3-N等的神经元系数有负值且区间较大,这不仅与其熵值信息有关,还可能受到数据噪声影响。经聚类后得到图3所示结果。
图2 苏家屯20个水质参数SOM网络图
图3 苏家屯水质点SOM聚类结果
由图3可知,苏家屯20个水质点水质质量综合聚类存在一定差异,其中灰度(G)越深表明水质越差。聚类结果分6级,其中20号水质点属于G6,水质最差;8号和4号属于G5;9号、14号、15号、10号、11号、12号属于G4;7号、6号、16号属于G3;17号、19号、5号、1号属于G2;2号、3号、13号、18号属于G1。
6 结 论
饮用水安全是居民生活安全的基础保障,展开水质调查、综合测评水体质量是水务部门的重要工作内容。通过实际调查取样,测定了覆盖苏家屯区域的20个水质点质量参数,结果显示未有化学物质含量超标,水质量在安全范围内。本文运用了SOM神经网络对水质点进行聚类分析,该结果能够直观展示水体质量差异,这为水资源监测管理提供了可视化参考依据,该方案具有一定应用潜力。虽然本区饮用水基本达标,但考虑到水体的动态活性、易于污染的特征,加强水质监测与水环境管理依然不可松懈。