基于优化后灰色模型的库玛拉克河年径流量预测分析
2021-10-12刘新华张桂林
刘新华,刘 斌,张桂林
(1.新疆塔里木河流域阿克苏管理局,新疆 阿克苏 843300;2.新疆农业大学水利与土木工程学院,乌鲁木齐 830052)
水资源是人类生存和发展不可缺少的自然资源,是维系干旱内陆河生态安全的关键要素。HADDELAND等[1]通过气候变化情景分析预测水循环变化,进而发现水资源在时间和空间上分配十分不均,研究径流量的变化特征与规律对流域水资源综合管理至关重要。径流量受自然因素和人为因素的影响,它的变化规律既有确定性,也有随机性[2]。
河川径流量的预测方法有很多,常用的有小波分析、遗传算法、BP神经网络、GM(1,1)等。各种方法均有优劣,要根据气候、环境、样本数据等情况选择适当的预测方法。本文采用优化的灰色模型对阿克苏河的主要支流库玛拉克河年径流量进行预测。早在1982年,灰色系统理论由学者邓聚龙在国际上第一次提出[3]。1992年,刘毅等[4]以灰色预测为基础,提出灰色拓扑模型,并将其应用在长江三峡水利工程科研工作中。欧建锋[5]针对水利现代化影响因素的复杂、可用信息相对单一的特点,运用灰色模型对江苏水利现代化进程进行预测,得到今后10年的江苏水利现代化发展水平。2019年,李强等[6]利用灰色分析法对我国水资源发展现状进行预测。传统的GM(1,1)是一种不严谨的预测模型,它忽略了系统结构分析,预测结果出现一次增大或减小的现象。灰色拓扑模型解决了传统GM(1,1)缺乏波动性的缺点,但其本身缺乏波峰、波谷的趋势性预测。
本文通过提出优化的GM(1,1),结合传统GM(1,1)对径流量波峰、波谷的趋势预测和灰色拓扑模型对时间的周期性预测特点,对库玛拉克河2020-2029年径流量进行预测。同时利用2017年、2018年、2019年的径流量数据(53.6亿m3、40.25亿m3、40.88亿m3)对优化后的GM(1,1)进行校核,得到更加可靠的预测结果,为阿克苏地区水资源的管理和调控提供数据基础。
1 优化的灰色预测模型
1.1 方法简介
灰色模型是一种研究贫信息、小样本和不确定性的方法[7]。但是,灰色预测模型是一种特定的指数曲线,它只能预测出径流量的变化趋势性,无法对径流量的波动性进行预测。同时,原始数据的波动性对灰色模型的预测精度有一定影响[8],在平均值上下浮动超过5%时,传统的GM(1,1)得到的预测结果出现一次增加或减少,对波动起伏大且不规则变化的样本来说,预测结果误差较大[9]。
灰色拓扑模型又称波型预测,是对一个变化不规律的样本数据进行预测,反映系统的起伏波动状况[10]。灰色拓扑模型的预测结果具有随机性,但它的预测结果缺乏趋势性,并且当选择阈值对应的样本数据太少时,预测结果出现缺漏,当阈值对应的样本数据过多时,一年内会出现多个径流量预测结果。
优化的GM(1,1)通过把传统的GM(1,1)与灰色拓扑模型相结合,使其拥有趋势性和波动性的预测特点,保证径流量的预测结果更加接近实际变化情况。
1.2 GM(1,1)模型
灰色模型具有微分、差分、指数兼容的性质,即灰色模型通过建立差分方程,推导出微分方程,得到具有指数性质的时间响应函数对原始数据进行拟合和预测[11]。一阶累加时,设变量为X(0)的原始数据序列为:
生成一阶累加数列,即
其中,x(1)(n)满足以下条件:
令矩阵Y和矩阵B满足以下条件:
由式(4)和式(5)可得,a的最小二乘法估计a^为:
参数b满足以下条件:
式(7)被称为灰微分方程的白化方程,则白化微分方程的解(时间响应函数)为:
累减还原预测公式为:
GM(1,1)的精度检验流程如下:求出GM(1,1)的原始序列方差、残差序列方差后验差比值C、小误差概率P,根据表1确定模型精度级别。模型精度级别=Max{C所处级别,P所处级别}[12]。
表1 模型精度等级
1.3 灰色拓扑模型
第一步,X(0)(k)为径流量原始序列,根据点(k,X(0)(k))在平面上描绘出一条曲线,X(0)(k)中最大值记为maxX(0),最小值记为minX(0),平面上给定一系列均匀的阈值λi,i=1,2,…,m,则有minX(0)≤λi≤maxX(0)。对于每一个阈值λi,有映射λi:{X(0)}→{t(0)i},其中,t(0)i(k)是水平线λi与曲线X(0)相交第k个点的横坐标值;有映射Q:{t(0)i,λi}→{t(0)i(k)},k=1,2,…,n,Q为横坐标的投影算子,即t(0)i(k)={t(0)i(1),t(0)i(2),…,t(0)i(ni)}。对每一个t(0)i建立优化的GM(1,1)模型[13]。
第二步,求出后验差比值C和小误差概率C,通过表1查C和P的值确定预测模型的精度。
第三步,利用GM(1,1)对时间数据进行预测,把预测时间与对应的阈值描绘在平面上,得到灰色拓扑模型曲线。
1.4 优化的GM(1,1)
步骤一,确定一个随时间变化的径流量样本数据。令X(0)满足以下条件:
式中:x(0)(n)为第n年的径流量。
步骤二,划分范围。若径流量样本中出现|X(0)-≥5%,则会导致灰色模型的预测结果出现指数上升或指数下降,这样得到的预测结果不具有参考意义,但是实际情况下,在几十年的径流量样本中基本都会出现|X(0)-X—|/X—≥5%这种状况。所以,要以样本平均值的10%进行范围划分,其分别为A1、B1、…、Z1。令三者满足以下条件:
步骤三,确定样本。寻找步骤二中得到的多个径流量样本和与之对应的时间样本。
阀域A1的径流量样本与时间样本分别为:
式中:La为径流量样本;Ta为时间样本;l(0)(a1)为在阀域A1里面最小的实测径流量数据,其他以此类推;t(0)(a1)为在阀域A1里面最小的实测径流量对应的年份,其他以此类推。
阀域B1的径流量样本与时间样本分别为:
式中:Lb为径流量样本;Tb为时间样本;l(0)(b1)为在阀域B1里面最小的实测径流量数据,其他以此类推;t(0)(b1)为在阀域B1里面最小的实测径流量对应的年份,其他以此类推。
阀域Z1的径流量样本与时间样本分别为:
式中:Lz为径流量样本;Tz为时间样本;l(0)(z1)为在阀域Z1里面最小的实测径流量数据,其他以此类推;t(0)(z1)为在阀域Z1里面最小的实测径流量对应的年份,其他以此类推。
步骤四,样本叠加。对时间样本中的原始数据进行叠加,从而削弱原始数据的随机性,发现样本的规律[14]。阀域Z1的叠加结果为:
步骤五,参数Z(1)(zk)满足以下条件:
令矩阵Y和矩阵B满足以下条件:
由式(26)和式(27)可得,a的最小二乘法估计为:
步骤六,把式(28)写成离散形式:
式(29)被称为GM(1,1)的时间函数模型,再经过累减运算可得到原始数列t(0)的预测模型:
步骤七,精度检验。求后验差比值C和小误差概率P,根据表1得到模型精度。
步骤八,对径流量样本A1、B1、…、Z1建立GM(1,1)函数。重复第四步到第七步的过程,得到径流量GM(1,1)函数。
步骤九,把不在样本数据中的已知径流量数据与通过模型得到的预测值做对比,分析模型精度。
步骤十,把时间模型和径流量模型预测结果一一对应,得到径流量预测结果。
2 模型应用
2.1 研究区概况
库玛拉克河位于新疆维吾尔自治区阿克苏地区,处于亚欧大陆腹地,降雨量少、日照强、蒸发量大,属于大陆性气候。该河流发源于天山西段中部的汗腾格里峰西北坡,流域流经吉尔吉斯斯坦和哈萨克斯坦进入我国境内,主要水文断面有协合拉渠首、土木秀克分水闸、多浪渠首。其中,协合拉引水枢纽位于库玛拉克河出山口,是库玛拉克河流入我国境内的水文站。根据协合拉水文站1958-2019年的监测数据,库玛拉克河的多年平均径流为48.48亿m3,其中1958-1977年属于显著的枯水阶段,1978-1994年属于平水阶段,1995-2008年属于显著的丰水段,2009-2017年属于平水阶段。枯水持续时间大于丰水持续时间。在年内变化中,一般8月径流量最大,平均达到500 m3/s,2月或3月径流量最小,一般仅为27 m3/s,其余月份一般在100 m3/s以上。库玛拉克河流域分布如图1所示。
图1 库玛拉克河流域分布
2.2 模型建模
把库玛拉克河1993-2016年的径流量数据作为样本,对未来库玛拉克河2020-2029年的径流量进行预测。总体样本径流量序列如式(1)所示。由原始径流量样本数据可得样本均值x—=52.15。为了防止|X(0)-≥5%这种情况的出现,把区间大小定为5.00<0.1=5.22。根据径流量样本数据的特征,把样本数据分为5个区间,即A1=[36.98,45]、B1=[45,50]、C1=[50,55]、D1=[55,60]、E1=[60,69.55]。同时,把径流量对应的时间作为样本,得到时间样本A2、B2、C2、D2、E2。径流量样本和时间样本如图2所示。
图2 实测数据区域划分
根据5个时间样本的周期性预测和径流量样本的趋势性预测,可以得到10个GM(1,1)函数,并进行模型精度检验,模型精度级别=Max{C所处级别,P所处级别}[12],检验结果如表2所示,10个GM(1,1)函数中,80%的预测模型精度达到优秀。优化后的GM(1,1)平均误差为0.98亿m3,相对误差为2.1%,传统GM(1,1)的平均误差为4.65亿m3,相对误差为9.1%。根据《水文情报预报规范》(SL 250—2000),误差在允许范围内[15]。
表2 预测模型及精度检验
3 结果与分析
3.1 预测结果
采用优化的GM(1,1)对库玛拉克河2020-2029年径流量进行预测,预测结果保留了原始数据的震荡性和趋势性。预测数据显示,丰水年出现在2025年(60.87亿m3),枯水年出现在2021年、2024年、2026、2029年(41.32亿m3、41.88亿m3、44.7亿m3、42.44亿m3)。库玛拉克河2020-2029年径流量预测结果如表3所示。
表3 库玛拉克河预测结果
3.2 模型结果对比分析
把优化GM(1,1)、传统GM(1,1)、灰色拓扑模型的1993-2016年预测数据与实测数据对比,优化后的GM(1,1)预测结果与实测径流量的拟合度高于传统GM(1,1)和灰色拓扑模型。传统GM(1,1)在1994年以后呈现减函数的趋势和灰色拓扑波形后移的现象。由此可得,优化后的GM(1,1)与传统的GM(1,1)和灰色拓扑模型相比更加适合径流量的预测。优化后的GM(1,1)、传统GM(1,1)、灰色拓扑模型的1993-2016年预测数据与径流量实测数据对比如图3所示。
图3 模型预测数据与实测数据对比
将2017年、2018年、2019年的优化GM(1,1)、传统GM(1,1)、灰色拓扑模型的预测结果与实测径流量做对比,对比结果如表4所示。优化后的GM(1,1)具有较好的模拟效果,相对误差为5%,远低于传统的GM(1,1)(相对误差10.3%)和灰色拓扑预测(相对误差20.7%)。2017-2019年的实测与预测径流量做对比,优化后的GM(1,1)精度高于传统的GM(1,1)和灰色拓扑预测。
表4 各模型预测结果对比
4 结论
本文以新疆库玛拉克河协合拉水文站1993-2016年实测径流量数据为基础,采用优化的GM(1,1)对该河流2020-2029年径流量进行预测。结果表明,优化的GM(1,1)预测结果平均误差为0.98亿m3,相对误差为2.1%,符合水文预报规范要求,且优于传统的GM(1,1)预测结果(平均误差4.65亿m3,相对误差9.1%)。同时,把2017年、2018年、2019年预测结果与实测结果做对比,优化后的GM(1,1)精度高于传统GM(1,1)和拓扑模型。库玛拉克河在未来10年中出现4个枯水年(2021年、2024年、2026年和2029年),丰水年出现在2025年,丰水年占比远低于枯水年,因此地区要提前做好水资源规划及相关政策应对未来10年可能出现的水资源短缺现象。试验证明,这种方法更适用于径流量预测,但是本次研究只考虑了径流量的多年变化规律,未在模型中考虑地形、环境、天气等因素对径流量的影响,要加强这方面的研究。