APP下载

水文时间序列高阶自相关性识别及其对水文分析的影响研究

2019-02-28,,2,,

人民珠江 2019年2期
关键词:水文站径流高阶

,,2,,

(1. 长安大学 环境科学与工程学院,陕西西安710054;2. 长安大学 旱区地下水文与生态效应教育部重点实验室,陕西西安710054;3. 陕西省江河水库管理局,陕西西安710018)

水文时间序列是指某种水文特征值随时间而变的一系列观测值,在社会水文学的视点下,它也可以被看作是由气候条件、下垫面条件和人类活动等因素综合作用结果的表征[1]。一般水文时间序列可分解为确定性和随机性两种成分,确定性成分主要表现为水文现象的趋势变化和周期变化等,其主要受人类活动、气候因素和下垫面因素的宏观尺度驱动,使水文时间序列产生缓慢的渐变或剧烈的突变,亦或有规律的波动;而随机性成分则表现为水文现象的相依性和纯随机变化,其主要受气候、下垫面等各种随机因素影响,并驱动水文时间序列的随机性变化和不确定性变化[2]。

近年来,受全球气候变化及高强度人类活动(如水库蓄水、淤地坝拦水、引水灌溉及城乡建设等)的影响,流域的水循环过程和水文物理形成机制都发生了显著的改变[3-4]。很多地区的实测年径流、降水、泥沙等水文时间序列都表现出相对较大的自相关性[5-6],使得一些检验结果的准确性受到一定影响。目前,关于水文序列自相关性的研究工作主要集中在序列的一阶自相关性上。如在国内外相关领域广泛应用的由Von Storch和NaVarra提出的预置白[7](Pre-whitening,PW)方法和Yue等提出的去趋势预置白[8](Trend-free pre-whitening,TFPW)方法等,其主要作用都是消除或降低序列中的一阶自相关性,以满足数据独立性的要求。然而,RazaVi和Vogel[9]的研究表明,在对树木年轮序列进行预置白(Pre-whitening,PW)处理后会使时间序列中包含的重要信息丢失,同时会导致对气候和水文极端条件的低估,并建议在使用预置白方法时需要考虑其在长期自相关性上的陷阱。但对于序列高阶自相关性的剔除方法或影响,这些文献均未有过多探讨。目前,水文领域有关高阶自相关问题的论述,并不多见。张洪波等[10]提出基于EMD的改进RBF方法来控制高频分量的预测误差,进而实现提高径流预测精度的方法。其中作者根据各分量的自相关分析结果,筛选存在显著自相关的时滞,完成选阶后构建神经网络的输入向量,尽管考虑了各显著阶数序列,但未说明其对径流预测效果产生的影响。Sen[11]提出的一种新的用于统计检验的自相关处理方法,即过白化处理法(over-whitening,OW),其通过在时间序列的标准化序列上添加一个白噪声,可实现一阶和高阶自相关性的综合去除,为高阶自相关移除提供了手段。此外,Julian[12]对德国1978—2009年17个观测站的降水序列中18O、2H稳定同位素进行趋势变化研究,结果表明在建模过程中考虑高阶自相关性的影响时,有3个站的序列表现出显著的趋势变化,而广泛应用的仅考虑一阶自相关性的趋势分析方法未能充分考虑到稳定同位素序列中高阶自相关性的存在。再者,张洪波等[13]在传统过白化处理法的基础上,提出了改进措施,采用分段过白化的处理手段实现了趋势低损情况下的高阶显著自相关剔除。综上所述,在对水文序列进行分析时,仅仅考虑序列的一阶自相关性是不够充分的。与此同时,尽管水文序列的高阶自相关议题在一些文献中出现过,但其并未引起广泛的关注或普遍的共识。因此,非常有必要对水文序列中高阶自相关性做以深入的解析并探讨其对现有技术手段的影响。

为此,本文分别选取了陕西境内汉江流域的2个水文站、渭河流域的6个水文站以及无定河流域的11个水文站的实测年径流序列为研究对象,通过分段去趋势方法,剔除序列中的趋势成分,再对去趋势序列进行自相关性分析,以确定序列高阶自相关性在不同流域的空间分布。同时,文章进一步以BP神经网络为基础,建立降水-径流预测模型,旨在探讨加入高阶降雨序列对径流预测效果的影响,进而提出水文时间序列分析中高阶自相关性的处理方法。

1 研究区概况与数据来源

1.1 研究区概况

1.1.1汉江流域

汉江是陕南地区最大的河流,也是长江较大的一级支流,发源于陕西省宁强县潘家山,由西向东流经汉中、安康两市进入湖北省境。汉江在陕西境内河长654 km,集水面积4.86万km2,多年平均径流量247亿m3。径流量地区分布不均匀,总的趋势是南岸多于北岸,即大巴山多,秦岭少。陕南地区降水充沛,时空分布不均,年均降水量1 050 mm,秦岭南坡年均降水量在600~800 mm之间,巴山北坡米仓山区年降水量最大,可达1 400 mm以上。流域内河川径流的补给主要以降雨形成的地表径流为主,地下水补给为次[16]。

汉江沿岸的地貌特征以丘陵、盆地为主,东西长约400 km,南北宽约3~60 km,汉江流贯中部,形成以汉中盆地和石泉-安康盆地为主的多个盆地区[17]。

1.1.2渭河流域

渭河是黄河的一级支流,起源于甘肃省渭源县,流经甘肃、宁夏、陕西,于潼关汇入黄河,流域总面积约13.43万km2,全长818 km,陕西境内河流总长约502 km,流域面积6.71万km2。渭河流域年平均气温12 ℃~14 ℃,年平均降雨量为400~800 mm,降雨主要集中在6—9月,降雨量占全年的60%左右[13-14]。

渭河流域地形总特点是西北高东南低,陡坡自西向东逐渐变缓,河谷自上游至下游逐渐变宽。渭河流域北岸支流多发源于黄土丘陵和黄土高原,相对源远流长,比降较小,含沙量大;南岸支流均发源于秦岭山区,源短流急,谷狭坡陡,径流较丰,含沙量小[15]。

1.1.3无定河流域

无定河是榆林地区最大的河流,它发源于定边县白于山北麓,流经米脂、绥德到清涧县川口以南20 km处注入黄河。全长491.0 km,流域面积30 260 km2,陕西境内河长442.8 km,流域面积21 049.3 km2,流域降水量从东南向西北递减,多年平均降雨量为409 mm[10]。

按地形地貌及水土流失特点,流域可分为风积沙丘沙盖区、黄土斜梁高山区和黄土丘陵沟壑梁峁区三大区域。流域西北部为风积沙丘沙盖区,约占全面积的54.3%,气候干燥,地面起伏平缓,水网稀少;西南部为黄土斜梁高山区,约占全面积的11.4%,地面呈梁峁状丘陵;东南部为黄土丘陵沟壑梁峁区,约占全面积的34.3%,地表支离破碎,梁峁起伏,沟壑纵横。3个流域的自然地理条件对比见表1。

注:表1相关统计数据出自于陕西省2016年水资源公报

1.2 数据来源

本研究采用的数据主要有汉江流域石泉、安康水文站,渭河流域华县、临潼、咸阳、魏家堡、林家村、北道水文站以及无定河流域韩家峁、横山、赵石窑、白家川、殿市、马湖峪、青阳岔、李家河、曹坪、丁家沟、绥德水文站等共19个水文站点的实测年径流及控制流域的面降雨数据。其中,年径流数据来源于黄委水文资料汇编,降水数据来源中国气象资料共享网,站点数据经加权平均后获得面降雨量数据。各流域站点分布见图1。

图1 各流域站点分布

2 研究方法

2.1 分段去趋势

受水文序列非一致性的影响,其本身表现出时域上的差异性特征,而非单调性的趋势变化。因此,在进行自相关性分析前,需要对水文序列进行去趋势处理。本文使用了一种基于回归变异的分段去趋势方法来去除径流序列的趋势成分。其具体步骤如下:①采用Tomé和Miranda[18]提出的分段线性拟合技术,对水文时间序列进行回归变异识别,得到该序列的多个回归变异点;②拟合各分段回归系数与回归方程,分段去除趋势,得到去趋势序列,即平稳序列;③对去趋势序列进行自相关性分析。

2.2 BP神经网络

BP(back propagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小[19-20]。

本文中,BP神经网络主要基于MATLAB软件中的NEWFF函数开展,构建多输入单输出的神经网络模型,其中训练误差GOAL设置为0.000 1;其他参数均采用默认值。经过反复迭代后,可确定各输入变量的BP神经网络模型,得到预测结果。

3 计算结果

3.1 高阶自相关识别

3.1.1汉江流域

通过分段去趋势方法对汉江流域的石泉和安康水文站的实测年径流序列进行处理,得到其去趋势序列,并采用偏自相关(PACF)函数对其进行自相关性检验。结果表明石泉、安康两站点的去趋势年径流序列的偏自相关系数值均未超出临界值,即不存在显著的高阶自相关性,见图2。

3.1.2渭河流域

利用分段去趋势方法对渭河干流6个水文站的年径流序列进行处理,得到其去趋势序列,并采用偏自相关(PACF)函数对其进行自相关性检验。结果与汉江流域类似,华县、临潼、咸阳、魏家堡、林家村、北道6个站点的去趋势年径流序列的偏自相关系数值均未超出临界值,即均不存在高阶自相关性,见图3。

a) 石泉

b) 安康图2 去趋势年径流序列PACF检验

a) 华县

b) 临潼

c) 咸阳

d) 魏家堡

e) 林家村

f) 北道图3 去趋势年径流序列PACF检验

3.1.3无定河流域

将分段去趋势方法应用于无定河流域11个水文站的年径流序列,得到去趋势序列,并采用偏自相关(PACF)函数对其进行自相关性检验。结果表明韩家峁站存在6阶显著高阶自相关性;横山站存在7阶显著高阶自相关性,6阶偏自相关系数值未超出临界值,但数值较大,在后续计算中应考虑6阶的影响;赵石窑站存在11阶显著高阶自相关性;白家川站存在2阶和5阶显著高阶自相关性;殿市存在一阶自相关;马湖峪、青阳岔、李家河、曹坪、丁家沟、绥德此6个站点偏自相关系数值均未超出临界值,即均不存在显著自相关性,具体结果见图4。

a) 韩家峁

b) 横山

c) 赵石窑

d) 白家川

e) 殿市

f) 马湖峪图4 去趋势年径流序列的PACF检验

g) 青阳岔

h) 李家河

i) 曹坪

3.2 高阶自相关的物理解析

从上节的高阶自相关识别结果来看,不同的流域检验的结果差异较大。汉江流域和渭河流域研究站点均未检测到高阶自相关,而位于陕北的无定河流域则在多站点出现了高阶自相关成分。一般高阶自相关性主要受水循环因子的周期变化以及地下水入渗到排泄的时差的影响。由于并不是3个流域的水文序列都表现为高阶自相关,因此,本节主要从地下水文循环的物理机制角度,分析产生这种空间差异的原因。

j) 丁家沟

k) 绥德续图4 去趋势年径流序列的PACF检验

3.2.1汉江流域

在汉江流域选取的石泉和安康2个站点均位于安康市,区域地貌单元为安康盆地汉阶地地层,其中浅层含水岩组的含水层岩性为粗砂、砾石、卵石等,深度在18~33 m以下,含水岩组受大气降水及区域地下水补给,承压性一般,水量较丰富;浅层承压水含水岩组的含水层岩性为粗砂砾石、卵砾石、漂卵石等,深度在70~80 m以下,含水岩组受地下水补给,承压性好,水量较丰富[21]。同时该区域雨量充沛,地表水丰富,为地下水形成提供了良好的补给条件,但地形破碎,河沟纵横,储水条件差,不利于地下水贮存[27]。因此,地下水补给地表径流量的部分较少,且由于地处山区补给过程所需的时间跨度也较短,故径流序列中产生高阶自相关性的物理机制并不显著存在,所以未能在序列中检测到高阶自相关性。

3.2.2渭河流域

渭河流域干流上、中、下游河水与地下水转化关系有所不同。在渭河干流,上游地区地下水补给河水;中游地区河水一侧补给地下水、另一侧地下水补给河水,丰、枯季节地下水与河水的转化关系也时常发生变化;下游地区如渭南至潼关段,河床淤积抬升,一般河水补给地下水[15]。但由于渭河径流量中地下水补给量有限,加之渭河流域地处关中平原区,受当地水文地质条件影响,流域地下水循环较快,从入渗到排泄至河流的时滞较短,因此,其反映到年际尺度的水文序列变化上并不显著。同时,近50 a来渭河流域降水量呈显著减少趋势[26],导致以降水为地下水主要补给源的渭河流域的地下水蓄水量补充有所削减,加之区内大量开采地下水,导致渭河基流量显著减少,河川径流中原有的地下水循环所蕴含的周期规律和相关关系在愈发弱化。由此可见,多因素的综合影响导致了渭河流域各水文站的年径流序列中未检测到高阶自相关性。

3.2.3无定河流域

无定河流域与汉江、渭河流域有较大不同,其河川径流中30%~80%来自地下水补给[29],因此,地下水循环中的典型规律会较为显著地体现在河川径流过程中。

从地貌类型来看,无定河流域风沙区的韩家峁、横山、赵石窑序列和黄土丘陵沟壑梁峁区的白家川序列检验出高阶自相关性;其余站序列均未检验出高阶自相关性。

无定河流域风沙区地势平坦,林草覆盖较好,土质为颗粒较大的沙土,地面渗漏强烈,下渗能力强[22],地下水埋深较浅,降水可补给到浅层地下水,而后再经由地下水径流途径,转化为基流汇入河道。风沙区地面渗漏强烈,地下水补给径流所占比重较大,一般达80%~90%以上[29],因此地下水循环特征可得到较好的表征。而黄土区植被条件差,地形起伏大、沟谷深切,黄土区地面下3.5 m处的恒湿层阻断了地表水与地下水之间的水力联系[25],使得地下水难以得到降水的有效补给,渗入土壤的水分通常无法到达饱和含水层,而以壤中流的方式补给到河流,因此在黄土区地下水循环路径一般较短,短时滞在年际尺度的河川径流变化中无法得到有效体现。黄土区地下水补给只占年径流的30%左右[28-29]。白家川水文站是无定河流域的出口水文站,年径流量远大于其余水文站,且基径比达71%[27];由于黄土区地下水补给量相对较小,因此其更趋向于表现上游主导地下水过程的相关或耦合特征。因此,上述因素可较为清楚地解释风沙区年径流序列呈现出高阶自相关性,而黄土区的年径流序列不存在高阶自相关性的现象。

除此之外,笔者在研究中发现,出现高阶自相关的站点所控制的流域都存在与其他流域存在侧向交换的情况,即在某一含水层与其他流域存在地下水连通或补给关系。因此笔者认为无定河流域存在水文序列的高阶自相关性可能与流域地下水分水岭不闭合存在一定的关系。但限于目前无相关成果,无法佐证。

3.3 验证分析

上文对韩家峁、横山、赵石窑、白家川4个站点显著高阶自相关性的物理成因进行了简单的定性分析,物理机制定量论证受观测资料限制目前尚无法开展。本文拟以BP神经网络为基础构建降水-径流模型,通过分析加入高阶降雨序列对径流预测效果的影响,从侧面论证高阶自相关的客观存在性以及影响。

以横山站实测年径流和降雨序列(1957—2010年)为例,检测结果显示去趋势年径流序列存在7阶显著高阶自相关性,同时6阶偏自相关系数较大,不可忽视,故选取当年降雨序列P0、1—7阶降雨序列(表示为P1…P7),当年去趋势年径流序列R0、进行BP神经网络计算分析,模型的构建过程见图5(P7+P0表示将两组序列进行组合,其余类似)。

横山站设置序列的训练期为1964—1998年,输入变量有5组,输出变量有一组,将训练期的输入和输出变量分别代入BP神经网络,构建多输入单输出的BP神经网络模型并得到5组训练期预测值;设置序列的验证期为1999—2010年,以构建的BP神经网络模型为基础,将5组输入变量代入其中,得到5组验证期预测值,并将其与5组训练期预测值进行组合,得到的5组预测序列分别记为R1—R5,其与当年去趋势年径流序列R0的对比,见图6。

图5 BP神经网络模型的构建过程(以横山站为例)

由图6和表2可以看出,当输入变量依次为P0、P7+P0、P6+P7+P0、P1+P6+P7+P0即加入了不同阶数的降雨序列时,预测序列R1—R4的预测效果逐渐变好,与R0的拟合度R2由0.336逐渐增加到0.769,表明当把不同阶数的降雨序列加入当年降水序列中进行预测时能有效提高预测的效果,从侧面验证了径流序列高阶自相关的存在。但当加入1—6阶的全部降雨序列时,预测序列R5的预测效果反而有所下降,与R0的拟合度降低至0.375。由此可见,在加入不同阶数计算时应该首要考虑的是显著阶数、偏自相关系数较大值对应的阶数,而把所有阶数均加入计算时则有可能因为各阶序列的重复叠加,使预测出现叠加误差,进而导致预测效果有所下降。

a)对比R1

b) 对比R2

c) 对比R3

d) 对比R4

表2 横山站5组预测序列与R0的拟合度

上文中所述的5组预测序列和R0均是不包含趋势成分的残余序列,并不存在实际的物理意义,遂将分段去趋势步骤中所剔除的趋势成分加回到预测序列与R0中,即得到重组序列RR1—RR5和实测年径流序列R。此时重组序列则对应于实测年径流序列的预测序列,重组序列与实测年径流序列的相关关系,见图7。与表2比较可知,将趋势成分加回后,5组重组序列与实测年径流序列的拟合度均有较大程度的提高。

a) RR1

b) RR2

c) RR3

d) RR4

e) RR5图7 横山站重组序列与实测年径流序列的相关关系

将同样的方法应用于韩家峁、白家川和赵石窑站,在构建BP神经网络模型时所涉及的变量见表3。 计算得到3个站的预测序列与当年去趋势年径流序列、重组序列与实测年径流序列的拟合度见表4。

由表4可知,当把显著阶数的降雨序列纳入预报因子并实施预测时,可有效提高相关的径流序列拟合度的大小;但当加入过多阶降雨序列时,拟合度反而有所下降。基于以上分析可知,径流序列中的高阶自相关性是序列蕴含的规律性成分,在预测模型中考虑该特征,可有效提高径流预测的效果。由此,在仅有短期实测径流资料情况下,需要展延年径流资料时,可利用序列的显著低阶与高阶自相关性,优化输入变量,构建多输入单输出的BP神经网络模型,可在一定程度上有效提高预测的效果,并不失为一种提高径流预测效果的新思路。

表3 BP神经网络模型中的变量

表4 韩家峁、白家川、赵石窑各序列拟合度R2对比

4 结论

在以往对水文时间序列自相关性的研究中,多聚焦于序列的一阶自相关性,认为一阶自相关成分剔除后,高阶自相关即随之消除或不再显著。然而目前已有高阶自相关的相关研究成果表明,其影响客观存在且不容忽视。由于国内外类似研究较少,水文序列中的高阶自相关性对水文分析是否有影响、有何种影响尚不明确,故本文对上述问题做了一些有益的尝试与分析。具体为使用分段去趋势方法对不同流域实测年径流序列进行处理,并对去趋势序列的高阶自相关性进行识别;以BP神经网络为基础,降水-径流模型为载体,探讨了加入低阶或(与)高阶降雨序列对径流预测效果的影响,得到了以下结论。

a) 高阶自相关性不同于一阶自相关性,其并不是一个普遍问题。不同流域径流序列中高阶自相关性的存在与否以及结构特征均有所差异。如本次研究中,汉江流域的石泉和安康站的实测年径流序列无高阶自相关性;渭河流域7个水文站的实测年径流序列亦无高阶自相关性;而无定河流域的韩家峁、横山、赵石窑、白家川4个水文站的实测年径流序列被检测到高阶自相关成分,其余7站则未发现高阶自相关性。

b) 径流高阶自相关性是否存在,受地貌类型、土壤特性、降水规律、地下水循环条件等多种因素的共同影响。被检测到高阶自相关性的无定河流域的韩家峁、横山、赵石窑水文站具有类似的影响特征,如:①均位于风沙区;②地下水补给径流所占比重较大,一般达80%~90%以上;③陕北地区的包气带厚度一般较大,地下水由入渗到补给河流这一过程所需的时间较长,因此在实测径流序列中呈现出了高阶自相关性。汉江与渭河流域河川径流主要来源于地表水,地下水基流比重较小,因而相关特征在水文站的实测年径流序列表现不强烈,即不能检测到显著高阶自相关性。

c) 水文序列中存在高阶自相关性可能会影响统计检测结果的准确性,进而得到不科学的结论。但高价自相关性并非只有劣势,在径流预测中如考虑水文序列高阶自相关性影响,实施预测模型输入变量优化,其可有效提高径流预测预报的精度和效果。除此之外,在仅有短期实测径流资料的情况下,高阶自相关性的有效利用,也可为展延年径流资料提供一种新思路。

猜你喜欢

水文站径流高阶
格陵兰岛积雪区地表径流增加研究
流域径流指标的构造与应用
基于SWAT模型的布尔哈通河流域径流模拟研究
雅鲁藏布江河川径流变化的季节性规律探索
基于高阶LADRC的V/STOL飞机悬停/平移模式鲁棒协调解耦控制
高阶思维介入的高中英语阅读教学
百年风霜雨雪路 再绘繁荣发展图
三个高阶微分方程的解法研究
高阶非线性惯性波模型的精确孤立波和周期波解
水运工程加固维护方案在水文站中的应用