APP下载

三十六脚湖叶绿素a浓度人工神经网络模型演算研究

2020-03-04许阳春苏玉萍林晓萍苏金洙

渔业研究 2020年1期
关键词:水华实测值电导率

许阳春,覃 苗,苏玉萍*,林晓萍,苏金洙

(1.福建师范大学环境科学与工程学院,福建 福州 350007;2.福建省污染控制与资源循环重点实验室,福建 福州 350007)

近年来,随着我国经济的快速发展,生活及工业污水排放量增大,加重了水体的富营养化[1]。水华是一种或多种浮游植物暴发性增殖的生态失衡现象。在我国和世界其他国家的多数湖泊和水库中,常有关于淡水水华发生的报道[2-4],水体富营养化和水华暴发已成为全球性环境问题[5]。大量营养元素如氮和磷被认为是促进水华暴发的重要因素,研究表明,氮磷比值、水文和气象条件也是诱导水华发生的主要因素[6]。Ndong等[7]构建了基于风向、气温、风速的水华气象指数模型,结果表明,在湖泊氮磷比满足蓝藻增殖的条件下,气象条件对水华的发生产生较大的影响。水华发生机理的相关假说也表明,在一定的水文、气象条件下藻类会大量聚集[8-10],进一步说明营养盐、微量元素、水文、气象等条件都是影响水华发生的主要环境因子[11-14]。严重的水华会导致水体透明度降低,藻类死亡分解过程中还会消耗大量溶解氧,造成水体缺氧,影响水生生物的生活和生存。此外,部分有害水华藻类还会产生毒素和异味物质,对水生态系统和人类健康造成极大威胁[15]。因此,为了有效治理水华,探讨水华预警技术是当务之急。水华预警模型是利用数学模型来描述藻类生长与环境因子之间的关系,是研究水华变化过程较为有效的工具[16]。

国内外学者已开展了大量水华预警模型的研究。Dillon等根据湖泊中总磷和叶绿素浓度建立了第一个实证数据模型,对叶绿素浓度进行预测[17]。Muhammetoglu等建立三维动态水质模型,该模型已成为测试湖泊富营养化水平的重要工具[18]。随着研究手段的快速发展和大量历史数据的共享,更多的有效方法被用于建立数理模型,如多变量回归模型等[19-20]。Shen等利用长期观测数据和支持向量机(LS-SVM)模型来模拟藻类增殖过程,结果表明,数据驱动模型能够模拟藻类实际增殖情况,具有良好预测能力;LS-SVM在藻类繁殖模拟中的成功应用为有害藻华预测提供了新方法[21]。Recknagel等运用日本霞浦湖12年的数据,以6种环境因子为自变量,叶绿素a(Chl-a)浓度为因变量,建立时间序列模型模拟叶绿素a浓度的变化[22]。此外,刘云翔等改进CART决策树,利用Fayyad边界点判定定理,选出与水华发生相关性较大的影响因子,改进后的水华预警模型能提高水华预测的正确率[23]。孔繁翔等利用水文和气象监测,结合卫星遥感技术对太湖蓝藻水华发生进行预测,准确率达80%[24]。张娇等利用洱海蓝藻水华发生的时空分布特征,结合水质和气象数据推测洱海蓝藻水华暴发的主要影响因子,并探索基于多源遥感监测数据的水华预警方法,其准确率达89%[25]。

目前,神经网络已被广泛应用于水华的预测,在湖泊[26-27]、河流[28-29]和近海水域[30-31]中成效较好。BP(Back propagation)神经网络,是一种多层前馈型神经网络,主要特点是信号向前传递,误差反向传播,具有较高的构建模型和数据拟合能力,非常适合处理非线性关系间内部机制比较复杂的问题[32]。目前基于BP神经网络的水华预警模型也日趋成熟。张娣等收集1986—2007年苏州市吴县的气温、气压、日照、相对湿度等气象数据,选取其中8个年份的太湖蓝藻暴发案例,分析了太湖蓝藻暴发前一段时间的气象条件,得出太湖蓝藻水华暴发的主要限制因子为气温、降水、气压和相对湿度,以此为基础建立的BP神经网络模型在太湖蓝藻水华的模拟预测中取得较好的结果[32]。本研究以平潭三十六脚湖为研究对象,利用其2016年1月—2017年5月的历史监测数据进行模型的预测研究,以期为平潭三十六脚湖的水华预警预报工作提供新的思路和科学依据。

1 材料和方法

1.1 模型演算数据来源

本文收集了三十六脚湖(图1)自动监测站2016年1月至2017年5月期间记录的3 500组水质监测数据及相应时间的气象数据(https://rp5.ru)。水质参数包括水温(℃)、溶解氧(mg/L)、电导率(μs/cm)、pH(无量纲)、浊度(NTU)、总氮(mg/L)、总磷(mg/L)、氨氮(mg/L)和Chl-a(μg/L)。气象参数包括平均气温(℃)、日照时数(h)、降水量(mm)、平均风速(m/s)及风向(°)。

1.2 BP神经网络演算模型

以水质及气象指标的不同组合作为模型的输入因子,以Chl-a作为输出因子,对三十六脚湖2016年1月至2017年5月气象及水质历史数据进行模型的拟合演算及验证。

1.2.1 模型评价标准

为分析各种预测性能的优劣,需建立统一、公正合理的评价体系。目前尚没有比较完整的评价指标可以使用直观、统计的方法对预警演算模型的精度进行评价。根据文献[33]的研究,本文选取均方根误差(RMSE)、标准偏差比(RSR)、可决系数(R2)作为性能评价指标。

1)均方根误差RMSE

(1)

2)标准偏差比RSR

(2)

3)可决系数R2

(3)

式(1)~(3)中:n为样本数;Ti是第i个实测值;T′i是第i个预测值;RMSE反映了预测值与实测值的绝对偏离程度;RSR对数据的离散程度进行估算,进而评价模型精度;R2是对已制作好的演算模型进行检验,比较它们的预测结果与实际发生情况的吻合程度。

1.2.2 参数选取及模型演算

在模型演算之前,需对各个参数进行筛选。因氨氮数值为区间范围值,无法获取点对点数据进行模型演算,故将其剔除。作为营养盐参数代表的总氮、总磷与水华发生有着密切联系,但总氮、总磷受外源影响较大,并且综合前期研究结果发现,三十六脚湖湖区的总磷已经达到了满足湖区浮游植物生长的较高值,在湖区水华频发月份,该时间段的营养盐浓度不再是水华发生的主导因素,因而也将这两个参数剔除。经过筛选,最终选定6个水质参数:水温、溶解氧、电导率、pH、浊度、Chl-a,以及5个气象参数:平均气温、日照时数、降水量、平均风速、风向,进行模型运算。其中设Chl-a为模型的输出因子,即模型的预测结果,其余10个参数为输入因子。

1.3 三十六脚湖BP神经网络演算模型验证

1.3.1 模型验证数据来源

模型验证数据来自三十六脚湖野外采样数据,分别于2019年3月19日、4月3、13、18日及25日对三十六脚湖S1、S2、S3三个点位进行了5次采样(表1和图2)。Chl-a浓度的实测值采用分光光度法[34]测定。

表1 库区采样点位图情况

1.3.2 模型验证数据处理

为验证以水温、电导率、平均气温3个指标为输入因子的模型演算效果,于2019年3月13日至2019年4月26日对平潭三十六脚湖进行了5次野外采样,将实验室检测的Chl-a浓度与模型预测浓度进行比对。

首先,对各个参数进行归一化处理:

(4)

Ti是第i个历史数据样本值,T′i是第i个历史数据Ti的归一化值,Tmin是历史数据中的最小值,Tmax是历史数据中的最大值。

1.3.3 模型验证过程

经演算分析已经确定模型的输入因子组合为水温、电导率、平均气温。利用MATLAB 2016b软件进行预警模型的运行。将2016年1月至2017年5月这3个指标及对应的Chl-a的历史数据在系统外部进行归一化处理,进行拟合演算,获取学习经验,模拟输入因子和输出因子之间的关系。同样,将2019年3月13日至2019年4月26日的水温、电导率、平均气温组合作为输入因子,在系统外部进行归一化处理,根据历史数据的学习经验运行得到输出因子的归一化数据,即Chl-a浓度归一化预测值。再进行反向归一化计算得到2019年3月13日至2019年4月26日的Chl-a浓度,进而与野外水样的实际检测值进行比对,确定模型预测精度。

2 结果与讨论

2.1 模型演算与验证输出结果

以筛选出来的输入因子(5个水质参数和5个气象参数)为基础,变换不同参数组合作为输入因子,在软件MATLAB 2016b中进行演算。表2选取了可决系数R2>0.5,即预测结果与实测值具有一定吻合程度的参数组合。而与日照时数和降水量相关的参数组合由于吻合程度过低,此处仅讨论其余8个参数的参数组合作为输入因子的模型演算结果。

表2 基于不同输入因子组合的部分模型演算获得的RMSE、RSR、R2结果

续表2

根据表2,在列举出的误差较小、拟合度较高的演算结果中,首先剔除RMSE及RSR值较大的组合,再以拟合度对演算结果进行精度综合评价。综合所有演算结果,组合8与组合9的RMSE、RSR值几乎一致,R2同为0.97,拟合度较好。但在增加输入因子的条件下,模型的演算精度并未有大幅度的提高,再综合考虑模型实际应用的成本,应在保证预测精度的前提下,尽量减少输入因子,故最终确定水温、电导率、平均气温(组合8)为模型的输入因子。当水温、电导率、平均气温组合作为模型的输入因子时,模型演算输出的Chl-a结果如图3,结果显示实测值和预测值在所有数据点上十分接近,呈现很好的拟合结果。

利用BP神经网络预警模型演算获得的2019年3月13日至4月26日每日间隔3 h的Chl-a浓度(图4)。水样的采集时间分别为3月19日17时、4月3日11时、4月13日11时、4月18日17时及4月25日11时,对应的模型演算Chl-a浓度分别为13.31、13.81、14.96、16.70和20.12 μg/L。这5个模型预测的Chl-a浓度将与实测值的Chl-a浓度进行比对,以确定模型的预测精度。

2.2 叶绿素a实测值

图5为三个取样点位在不同时间点的Chl-a浓度实测值。由于模型演算使用的水温(℃)、电导率(μs/cm)和Chl-a(μg/L)浓度数据来源于2016年1月至2017年5月期间的三十六脚湖S3点位(在线监控点)。因此,选取实测的S3点位水样的Chl-a浓度与模型演算的Chl-a浓度进行比对。S3点位在这5日的Chl-a实测值分别为12.61、13.22、14.54、17.28和19.52 μg/L(图5)。

2.3 模型输出结果(预测值)与实测值误差分析

表3整理了Chl-a浓度的实测值和模型演算的预测值比较。除4月18日外,其余日期模型预测值虽高于实测值,但很接近,表明模型能较好地为水华暴发前期的应急工作提供一定的数据参考。模型使用的气象数据为每间隔3 h记录一次,即每日23时、2时、5时、8时、11时、14时、17时、20时,水质数据为每隔4 h记录一次,即每日0时、4时、8时、12时、16时、20时。时间点不完全一致,为使数据在时间点上尽量保持一致性,秉承时间点就近原则剔除了每日2时、14时的气象数据,这样每日有6个时间点的数据。因数据处理过程已有一定的偏差,故对模型预测结果的精度会产生一定的影响。

通过各评价指标公式对模型的预测精度进行判断,计算得到模型误差和拟合度。2019年5次野外水样的实测值与模型预测值的拟合度(R2)高达0.97,标准偏差比(RSR)为0.24。说明以气温、电导率、水温3个指标为输入因子的BP神经网络预测模型的Chl-a浓度预测值与实测值的拟合度较高,偏离程度较小,模型预测效果较好,达到了模型运算期望。

表3 Chl-a浓度实测值与模型预测值比较

3 结论

本文运用BP神经网络模型,通过组合不同水质和气象参数,比较模型的演算效果,确定水温、电导率、平均气温组合为最佳输入组合。进一步以水温、电导率、平均气温为输入因子演算Chl-a浓度预测值,同时,用Chl-a浓度的实测值验证了BP神经网络演算预测的效果。以拟合度(R2)、标准偏差比(RSR)、均方根误差(RMSE)三个指标对模型进行精度评价,发现模型拟合度(R2)高达0.97,标准偏差比(RSR)为0.24。因此,应用BP神经网络,以水温、电导率、平均气温为输入因子演算三十六脚湖叶绿素a浓度具有可行性,该方法有望进一步用于叶绿素a浓度和蓝藻水华的预警。

猜你喜欢

水华实测值电导率
容重及含水率对土壤电导率的影响研究
藻类水华控制技术及应用
考虑相关长度误差的含水层渗透系数反演研究
掺钙铬酸镧-氧化物复合材料的导电性能研究①
变电站集合式电容器故障分析和处理
电导率法在线检测碱洗液碱度的探讨
基于Ansys屋盖不同单元类型下的模态分析
解谜里约奥运会的“碧池”
浅析水华的防治研究现状
浅析比重瓶法实测土粒比重