APP下载

基于灰色马尔科夫模型的南四湖水质预测

2021-11-02武周虎邹艳均

水资源保护 2021年5期
关键词:马尔科夫平均值灰色

马 景,武周虎,邹艳均,任 鹏,李 琪

(青岛理工大学环境与市政工程学院,山东 青岛 266033)

南四湖是南水北调东线工程的必经之地,其水环境质量对受水区的供水安全保障至关重要。南四湖流域内人口众多,工业和农业生产结构特征复杂,水环境容量小,水体污染与水资源短缺等问题较为突出。自2002年南水北调东线工程开工以来,山东省全面推进“治用保”流域治污体系,实现输水干线水质基本达到规划的水质目标。2013年12月南水北调东线一期工程顺利通水后,山东省生态环境厅继续组织开展了每年两次的南四湖水质空间监测工作。本文以2010—2018年南四湖水质空间监测数据为基础,开展南四湖水质模型研究。

在湖泊水环境规划、评价和管理工作中,水质模型是重要的技术支撑[1-3]。由水质预测可以了解湖泊水环境质量的变化趋势,及时发现导致湖泊水质恶化的原因并采取必要的治理对策[4]。目前常用的水质预测方法有灰色系统理论预测法[5]、数理统计预测法[6-7]、水质模拟预测法[8-9]和神经网络模型法[10-11]等。相对而言,灰色系统理论预测法对水质实测数据的信息量要求较少,但存在灰色偏差和抗干扰能力弱的问题。因此,国内许多学者将灰色系统中的GM(1,1)模型应用于水质预测中,并通过不断改进灰色模型来提高预测精度。王海云等[12]采用残差修正处理技术后显著提高了GM(1,1)模型的预测精度,解决了三峡大坝与葛洲坝之间水质数据波动性大的问题;李娜等[13]基于GM(1,1)模型提出新陈代谢理论,在补充新信息的同时去除因时间推移使其影响降低的老信息,为传统模型的改进提供了新思路;颜廷文等[14]利用等维新息原理改进GM(1,1)模型,同时利用马尔科夫链理论来改进对太湖流域水质预测的结果;卢丹[15]基于灰色马尔科夫模型提出粒子优算法,快速求得了模型的最优化解,并将其应用于地下水水质预测中。

本文采用灰色马尔科夫模型改进传统GM(1,1)模型,再利用等维新息思想更新建模所需数据序列,构建一种等维新息灰色马尔科夫模型;在模型检验的基础上,对2019—2021年南四湖水质状况和水质演变趋势进行预测与分析,旨在诊断可能存在的水质问题,为南水北调南四湖水污染防治工作提供参考。

1 南四湖水质监测概况

南四湖位于鲁西南济宁市,自北向南由南阳湖、独山湖、昭阳湖和微山湖4个湖泊连接而成,南北长约126 km,湖面面积约1 266 km2,蓄水量为 20.08亿m3。南四湖流域面积为3.17万km2,承接53条河流的来水,湖内各区段受污染情况因各河流的污染状况不同而产生差异[16]。位于南四湖湖腰的二级坝枢纽工程将南四湖分为上级湖(北段)和下级湖(南段)[17]。在南水北调东线工程中,输水是由下级湖南端入湖,经二级坝泵站提水入上级湖,再由上级湖北端出湖,入梁济运河。

南四湖水质空间监测采用网格式布点法,在上级湖和下级湖共均匀布置90个监测点,其中上级湖51个,下级湖39个。监测时间为每年春末4—5月和秋末10—11月,主要水质监测指标为CODCr、pH值、温度、TP、TN、NH3-N、CODMn、悬浮物、电导率、叶绿素a等。对比GB 3838—2002《地表水环境质量标准》,选取CODCr、CODMn、TP、TN、NH3-N等5项水质指标作为研究对象,选用2010—2018年共16批次(其中2010年与2012年分别为春和秋未监测)南四湖水质空间监测数据分别建立南四湖平均值、上级湖平均值、下级湖平均值和调水出湖口4个特征值的灰色GM(1,1)模型。

以2010—2018年南四湖全湖每年春季的CODCr、CODMn、TP、TN、NH3-N数据平均值(表1)为例,建立灰色GM(1,1)模型的原始数据序列。

表1 2010—2018年南四湖春季水质监测数据平均值

2 南四湖水质预测模型

2.1 模型构建

南四湖水质预测模型的理论基础为灰色理论,灰色理论的核心是通过部分已知信息建立数学模型来预测事物的发展。其构建原理为:分别以5项水质指标为研究对象,首先对选定水质指标的原始数据进行一次累加处理,生成累加序列使其具有指数规律;其次对累加序列建立一阶微分方程并求解;第三将求解结果累减还原得到相应水质指标的预测值。南四湖灰色GM(1,1)模型构建的方法步骤如下:

a.选定水质指标的原始数据序列,记为X0={x0,1,x0,2,…,x0,n},生成X0的一次累加序列X1={x1,1,x1,2,…,x1,n}[18-19],其中:

(1)

式中n为样本数。

b.对原始数据进行级比检验。先计算原始数据的级比ρk序列:

(2)

再判断ρk是否均在可容性覆盖区间∂=(e-2/n+1,e2/n+1)内。若是,则相应数据序列可以建立灰色GM(1,1)模型;否则,应选取适当的常数b对该组数据进行平移转换处理,使处理后的数据序列Y0={y0,1,y0,2,…,y0,n}的级比落入可容性覆盖区间内,其平移转换过程为

y0,k=x0,k+b

(3)

c.通过一次累加序列X1,建立南四湖灰色GM(1,1)模型的一阶微分方程:

(4)

式中:α、q分别为发展系数和灰色作用量。

d.设a=(α,q)T,运用最小二乘法,求解α、q:

a=(α,q)T=(BTB)-1BTD

(5)

e.由式(4)和式(5)得到灰色GM(1,1)模型:

(6)

(7)

2.2 模型检验

为了检验模型的可信度,需对预测值进行后验差检验[20-21]。建立一阶残差序列:

E0={e0,1,e0,2,…,e0,n}=

(8)

令选定水质指标原始数据序列的方差为s1,残差序列E0的方差为s2,分别计算后验比c与小误差概率p:

(9)

(10)

其中p和c的大小共同决定模型精度等级。表2给出了4级好、合格、基本合格和不合格的模型精度等级。模型c越小,p越大,则模型精度高。c越小,则s1越大、s2越小,即原始数据序列离散程度大,残差序列离散程度小,由模型所得预测值与原始数据相差小,p值越大则表明预测值较为均匀。若检验精度等级符合要求,则建立的灰色GM(1,1)模型可直接预测数据;若精度等级不符合,则对预测数据进行修正。

2.3 模型的修正

对式(8)中的E0建立灰色GM(1,1)模型:

(11)

(12)

(13)

其中

引入灰色马尔科夫模型判断m0,k的正负。灰色马尔科夫模型根据状态转移之间的概率来进行预测[22-25],适用于预测随机变化无规律的数据,弥补了传统GM(1,1)模型对波动性和趋势性数据预测精度低的不足。其计算过程如下:

a.根据E(0)划分状态。本文划分两种状态,状态1表示残差为正,状态2表示残差为负。

b.求从状态i转移到状态j经过的次数所占的概率pij:

(14)

式中:Mij为状态i转移到状态j经过的次数;Mi为状态i出现的总次数。根据式(14)得到状态转移矩阵P:

(15)

c.选定残差序列最后一个值的状态作为初始状态向量μ0。设μ0=(μ0,1,μ0,2),其中μ0,1、μ0,2分别代表处于状态1和状态2时的概率。即最后一个残差值若为正,μ0=(1,0);若为负,μ0=(0,1)。

d.根据μt=μ0Pt,求出经过t次状态转移后,第t次的状态概率。选取概率最大的状态作为最终结果,若两种状态概率相等,取前一次计算的结果。

2.4 模型的等维新息预测

将南四湖水质指标预测值x0,n+1补充到原始数据序列X0={x0,1,x0,2,…,x0,n}中作为最后一个水质数据,同时删掉最早的一个水质数据,得到更新后的水质数据序列X0={x0,2,x0,3,…,x0,n+1}。对该水质数据序列重新进行计算、建模、预测,直至结果达到任务要求。在不断更新数据的过程中,建模序列更能反映水环境系统目前的特征。

3 结果与分析

3.1 两种模型精度对比

为对比分析灰色马尔科夫模型与传统GM(1,1)模型的预测精度,以2011—2019年春季水质监测TN指标为例,其实测值与两种模型的预测值见图1。由图1可以看出,灰色马尔科夫模型预测值与实测值拟合度更高,灰色马尔科夫模型、传统GM(1,1)模型预测值与实测值间的相关系数分别为0.95、0.44。通过统计数据可知传统GM(1,1)模型预测值的相对误差在-11.7%~30.6%之间,相对误差绝对值平均为10.3%;而灰色马尔科夫模型预测值的相对误差在-5.2%~5.5%之间,相对误差绝对值平均为3.3%,大大优于传统GM(1,1)模型。因此,灰色马尔科夫模型对具有波动性的数据预测更为准确。

图1 2011—2019年春季TN质量浓度实测值与预测值

3.2 TN、NH3-N和TP指标

表3为2019—2021年春秋季南四湖TN、NH3-N和TP质量浓度预测结果。由表3可见,2019—2021年TN质量浓度随年份和季节的推移呈现波动升高趋势,上级湖秋季和下级湖春季均出现超标现象(GB 3838—2002《地表水环境质量标准》),预计2021年秋季南四湖、上级湖、下级湖、调水出湖口TN质量浓度平均值分别达到1.147 mg/L、1.216 mg/L、1.054 mg/L和1.072 mg/L,均超过Ⅲ类水水质标准。

表3 2019—2021年南四湖TN、NH3-N和TP质量浓度预测结果

NH3-N质量浓度的变化规律呈现春季上升、秋季下降趋势,均达到Ⅲ类水水质标准要求,预计到2021年秋季,南四湖、上级湖、下级湖、调水出湖口NH3-N质量浓度平均值分别为0.116 mg/L、0.113 mg/L、0.304 mg/L、0.075 mg/L。

TP质量浓度随年份和季节的推移呈现类似的波动下降趋势,且在一定程度上趋于平缓。预计2021年秋季南四湖、上级湖、下级湖、调水出湖口TP质量浓度平均值分别达到0.051 mg/L、0.055 mg/L、0.041 mg/L和0.082 mg/L。调水出湖口、上级湖、下级湖水质TP指标存在超标现象。

由于湖区芦苇、水草等植物密度较高且湖泊换水率低,易形成水体富营养化[26],在每年秋季枯水期尤为显著。徐好等[27]研究了2006—2016年南四湖水质空间变化,发现10年间NH3-N下降最为显著,TP、TN则受季节影响有所起伏。流域内农村污水管网建设不健全,加之船舶航运废弃物以及工业面污染源导致氮磷污染呈逐年升高的趋势。总体来说,南四湖流域由于自然环境以及人类活动因素,短期内对氮磷污染的管控尚未取得显著成效。

3.3 CODCr和CODMn指标

表4为2019—2021年春秋季南四湖CODCr和CODMn质量浓度预测结果。由表4可见,2019—2021年南四湖4个特征值的CODCr和CODMn质量浓度随年份和季节的推移呈现波动下降的趋势,其规律均呈现秋季上升、春季下降趋势,未出现水质超标情况。预计到2021年秋季,南四湖、上级湖、下级湖、调水出湖口CODCr质量浓度平均值分别为13.13 mg/L、13.30 mg/L、13.18 mg/L和 15.11 mg/L,与2018年秋季相比,分别下降了19.6%、22.7%、12.6%、19.2%;CODMn质量浓度平均值分别为4.40 mg/L、4.47 mg/L、4.43 mg/L和4.24 mg/L,与2018年秋季相比,分别下降了14.2%、8.4%、5.3%、15.2%。CODMn、CODCr质量浓度总体上呈现上级湖大于下级湖、秋季大于春季的特征,张柳青等[28]的研究结果表明,湖区内有机物质量浓度受枯水期工农业等人为污染源影响较大,上游流域的养殖业、种植业对COD贡献较高。

表4 2019—2021年南四湖CODCr和CODMn质量浓度预测结果

综合南四湖历年水质监测数据与以上预测结果可得出:水质指标CODCr、NH3-N、CODMn质量浓度总体均呈现下降趋势,达到Ⅲ类水水质标准要求。南四湖流域水环境治理取得了一定的成效,但TN和TP指标质量浓度受季节影响显著,总体呈现上升趋势。南四湖平均值、上级湖平均值、下级湖平均值、调水出湖口水质随季节性的变化规律明显,且春季水质优于秋季,下级湖水质优于上级湖,说明水质由北向南逐渐变好。

4 结 论

a.利用灰色马尔科夫模型对传统GM(1,1)模型进行改进,通过对改进前、后两种模型精度的对比分析发现,改进后的灰色马尔科夫模型相对误差小、精度高,预测结果更为合理。

b.预测结果表明,2019—2021年南四湖CODCr、NH3-N、CODMn质量浓度呈下降趋势,均达到Ⅲ类水水质标准要求,水质自北向南逐渐变好;TN、TP质量浓度有上升现象,存在超标风险,应进一步加强对南四湖流域TN、TP的控制与监管力度。

c.自2010年以来,南四湖CODCr、NH3-N、CODMn治理效果明显,但TN、TP受流域内产业结构性污染的影响出现波动现象。建议进一步调整产业结构,推行科学施肥,以减少水体富营养化的风险。

猜你喜欢

马尔科夫平均值灰色
基于三维马尔科夫模型的5G物联网数据传输协议研究
平均值的一组新不等式
基于叠加马尔科夫链的边坡位移预测研究
基于改进的灰色-马尔科夫模型在风机沉降中的应用
浅灰色的小猪
马尔科夫链在企业沙盘模拟教学质量评价中的应用
马尔科夫链在企业沙盘模拟教学质量评价中的应用
灰色时代
她、它的灰色时髦观
感觉