基于最大熵原理的水文干旱指标计算方法研究
2018-07-05洪兴骏郭生练王乐
洪兴骏 郭生练 王乐
摘要:确定水文变量的概率分布,是计算各类标准化干旱指标的关键。提出了基于最大熵原理(POME)的月径流分布构建方法,采用多阶矩作为求解最大熵的约束条件,以拉格朗日乘子法估计分布参数,计算了不同时间尺度的标准化径流干旱指数SDI,评估了汉江30个子流域历史水文干旱情势。结果表明:与Normal、Gamma、Weibull、Pearson Type Ⅲ等常用概率分布相比,POME分布模型可以最大程度地利用实测水文数据中的信息,有效拟合不同时间尺度的累积月径流量,表现出良好的适用性;随着时间尺度的增大,采用不同分布拟合同一尺度的月径流量,差别逐渐减小,月径流量概率分布特征趋于正态化。成果可为推求干旱指标,研究干旱特征的统计规律,进行干旱频率分析等提供新的手段。
关键词:最大熵原理;水文干旱;标准化径流干旱指数;汉江流域
中图分类号:TV121文献标志码:A文章编号:
16721683(2018)02009307
Abstract:
Selecting the appropriate probability distribution function (PDF) for hydrological variables is of significant importance to calculating standardized drought indices.In this study,we used the Principle of Maximum Entropy (POME) method to model the PDFs of aggregated monthly streamflow on varying time scales for 30 subbasins of the Hanjiang River Basin.The first three original moments of the cumulative monthly streamflow data were chosen as the constraint functions for maximizing the entropy by the Lagrange Multiplier.The Streamflow Drought Index (SDI) was computed based on monthly streamflow records derived from several theoretical probability distributions such as POME, Normal,Gamma, Weibull,and Pearson Type Ⅲ.Results showed that the POMEbased PDFs could make the best use of the information from observed records while avoiding mistakenly introducing redundant information.They showed satisfying applicability.We found that the PDFs of cumulative monthly streamflow would trend towards normalization as the time scale increased.The proposed method can be a practical tool for calculating hydrological drought indices, analyzing drought characteristics,and performing drought frequency analysis.
Key words:POME;hydrological drought;Streamflow Drought Index (SDI);Hanjiang River basin
干旱是一種由水循环异常引起的水分持续性短缺现象,不仅会对生态环境造成严重破坏,同时对工农业生产和城市供水等也会产生负面影响,长期制约着经济社会和人类文明发展。干旱指标是研究干旱现象的基础,也是衡量干旱发生与否与量级大小最为直观的定量表达。天然状况下,翔实的实测水文资料是计算干旱指标,评估区域干旱演变特征的基础。将实测水文要素时间序列看作服从某种理论概率分布的随机变量,通过等概率转换原理将其标准化,以评估其偏离正常情形的程度,是最常见的干旱指标构建方法。
Mckee等采用Gamma分布来描述降水量的统计规律,提出了著名的标准化降水指数(Standardized Precipitation Index,SPI)[1]。此后,各类仿效SPI的标准化干旱指数如雨后春笋般被相继提出,用来描述水文循环各个环节要素的盈缺情势。考虑到生态系统与社会经济活动和地表-地下径流的直接联系和高度依赖性,众多学者依托实测或模拟的径流和地下水位,将SPI的计算框架移植到水文干旱研究之中,提出了许多标准化水文干旱指数,如标准化径流指数(Standardized Runoff Index,SRI)[2],径流干旱指数(Streamflow Drought Index,SDI)[3],标准化地下水位指数(Standardized Groundwater level Index,SGI)[4]等。
然而,由于水文气象变量的时空异质性,水文分布线型的选择对于标准化干旱指数的计算精度有着重要的影响。特别是受样本数量的限制,如果线型选择不当,可能给干旱评估带来较大的误差[5]。受降水时空分布不确定性和流域调蓄的影响,时段河川径流的概率分布相较降水往往表现出更为复杂的特征。VincenteSerrano等(2012)就指出由于分布线型各自的局限性,没有任何一个概率分布可以保证对各月份的实测径流量均有较好的拟合效果,因此他采用不同的分布拟合不同月份的径流量,择优确定理论分布,虽然在一定程度上提高了拟合的精度,但计算过程颇为繁杂[6]。因而,如果能以一个相对统一的分布形式描述径流的概率特征,将对快速且稳健的水文干旱评估产生有益影响。
Jaynes(1957)提出了著名的最大熵原理(Principle of Maximum Entropy,POME)[7,8],用于構建随机变量的概率分布。自其被引入到水文频率分析研究后[9],POME近几十年间在该领域已经得到了迅速的发展[1013],在干旱频率分析方面也得到了广泛的应用[1416],如吴孝情等(2014)[17]和Hong等(2015)[18]就通过POME构建了降水量的概率分布,计算了SPI指标,指出其在分布拟合方面具有令人满意的适用性。过往应用研究主要集中在以降水量为对象的气象干旱上,对表征河流生境及地表与地下水体间转化关系的地表-地下径流关注较少。本文拟以河川径流为对象,采用POME在不预先假设径流序列概率分布线型的前提下,根据实测径流资料的统计特征信息,推求其概率分布函数,用以计算标准化水文干旱指标。
1研究方法
1.1标准化径流干旱指数(SDI)
本研究采用标准化径流干旱指数(Streamflow Drought Index,SDI)表征一段时间内的流域水文干旱情况[2]。SDI的计算公式如下:
SDI=Φ-1[FX(x)][JY](1)
式中:Φ-1(·)为求高斯分布累积概率的逆函数。X为某一时间尺度[WTB1X]k(k[WTBX]=1,3,6,12个月等)下的累积月径流量;f(x)和FX(x)=∫x0f(x)dx分别为其概率密度和概率函数。当SDI>0时,表示流域处于较湿润的状态,反之当SDI<0时,表示流域处于相对干旱状态。
1.2基于最大熵原理的月径流分布计算方法
熵理论认为随机变量不确定性的大小可以用概率分布函数来描述,而信息量的大小则可以用被消除不确定性的多少来表示。Shannon于1948年将玻尔兹曼熵的概念引入到信息论中,作为量度一个随机变量不确定性或信息量的定量指标[19]。假设随机变量(本文中指累积月径流量)X的概率密度函数为f(x),则其信息熵H(x)的定义如下:
H(x)=-∫baf(x)lnf(x)dx[JY](2)
式中:a、b分别为随机变量的积分上、下界。
Jaynes进一步提出了POME的概念,认为在所有相容的分布中,如果挑选满足一定约束条件下能使信息熵达到极大值的分布作为随机变量的分布,就意味着对数据不足的人为添加信息最少,从而求得的分布有最小的偏差,最合乎自然。因此,可将寻找最适宜概率分布的过程转化为求解最大熵的过程,使得导出的理论分布与系统的已知信息相一致。在水文频率分析中,常选用样本各阶矩,作为求解最大熵的约束信息[20]。本文中,不假设各尺度累积月径流的频率分布线型,以保持理论分布与样本的前三阶原点矩的期望一致作为月径流分布的约束条件,可以将推求统一形式的月径流概率分布的过程归结为求解如下数学规划问题。
实际上,作为一种形式灵活的分布构建形式,通过设置不同的约束方程组,许多常用分布线型都可以通过POME导出。一些常用分布参数的POME估计可见文献[23]。
2研究区域与资料
汉江是长江中游最大的支流,位于东经106°15′-114°20′E,北纬30°10′-34°20′N,发源于秦岭南麓,干流流经陕西、湖北两省,于武汉市注入长江,干流全长1 577 km,流域面积约159 000 km2(见图1)。汉江流域地处北亚热带季风区,幅员辽阔,光、热和水资源空间差异大。加上区内垂直地带性十分显著,是我国降水变率较大、旱涝灾害多发的地区之一[24]。汉江流域在国家水资源安全战略布局中的地位举足轻重,其上游丹江口水库是南水北调中线工程的水源地,中下游的江汉平原则是湖北省重要的经济走廊,因而,研究汉江流域水文干旱演变特征,对于保障长江流域水安全具有重要的现实意义。
本文选取文献[25]所采用的汉江流域内30个子流域的长系列径流作为研究对象。我国自20世纪90年代以来进行了大规模的流域开发,可能在一定程度上破坏了天然水文序列的一致性[26],为保证资料一致性,本文径流资料序列基本上仅覆盖20世纪50年代至20世纪80年代,各子流域位置见图1。径流量数据资料由出口断面逐日流量资料经时段累积和单位换算而来。分别采用MannKendall[27,28]和Pettitt[29]方法对各子流域不同尺度逐月实测径流进行趋势和变点检验,采用自相关系数检验月径流序列的独立性,置信水平均取95%。经检验,所采用各月径流量数据均满足一致性假设。
3研究结果与分析
3.1月径流分布拟合效果
采用前述的POME方法,对汉江30个子流域不同时间尺度逐月累积径流量进行频率分析,拟合月径流分布。为对比所提POME分布的适用性,选取若干常用的统计分布函数,包括两参数Normal(NO)、Gamma(GM)、Weibull(WB)和三参数Pearson Type Ⅲ(PⅢ)[HJ1.91mm]分布,对汉江各子流域不同时间尺度月径流进行拟合,参数估计方法也采用文献[22]中的基于最大熵原理的拉格朗日乘子法,并与基于三阶矩POME分布计算的月径流分布进行比较,选用的尺度包括[WTB1X]k[WTBZ]=1,3,6,12个月。采用AndersonDarling(AD)检验方法[30]判断所选用分布是否可以作为不同尺度累积月径流的理论分布,置信度水平为95%。不同时间尺度下各分布通过AD检验的次数见表1。不同分布下每一个时间尺度最佳的拟合次数为:30个流域×12个月=360次,由表可知,在四个时间尺度中,POME分布通过检验的次数均为最高,与另一常用的三参数PⅢ分布效果相当。其它分布中,NO分布在较小时间尺度上拟合效果欠佳,而指数分布族的GM分布和极值分布族的WB分布效果尚可。
采用各流域由不同备选分布拟合的月径流量理论分位数与实测径流数据的经验分位数的确定性系数R2QQQ衡量拟合效果,统计箱形图见图2。从图中可以看出,POME分布和PⅢ分布对于不同尺度的月径流量均能取得较好的拟合效果,确定性系数基本都在0.97以上。由其是POME分布(即红色的“箱子”),有最高的平均表现和最小的分布范围,表现稳定。正态分布(NO)对于偏态的小尺度累积径流量拟合效果欠佳,随着时间尺度的延长,正态分布的适线效果逐步增强。而同为两参数的两个偏态分布效果[CM(22]居中。综上,对于各个累积时段,所提出的POME[CM)]
方法构建的理论分布均能较好地拟合相应时段的径流量。
为进一步在微观序列层面上展示所提分布对实测径流量样本的拟合能力,以汉江流域的挽鱼沟子流域为例,绘制各时间尺度代表月份累积径流量理论与经验分布拟合效果图如图3所示。由图3可以看出,各时间尺度月累积径流量的经验点据与理论曲线拟合良好,令人满意。
3.2干旱指标计算及干旱特征分析
由上一小节的分析结果,基于POME良好的拟合效果,可将它作为各尺度累积月径流量的理论分
布,计算相应的SDI指标。挽鱼沟流域各累积尺度SDI长序列见图4。由图可以看出,在各个时间尺度下,挽鱼沟流域在研究期内旱涝事件交替发生。从1个月尺度的SDI序列可以看出,该流域各月径流的年际变化较大,旱、涝等极端水文事件频发。随着累积时间尺度的增大,干旱事件数量减少。这主要是由于随着纳入累积的回溯月份增加,一些夹杂在连续干旱时期内略高于零值的SDI(可能由于突然的一场降雨)被抹去,而长期水量丰沛时期中间略小于零值的SDI则被剔除,使得原本被割裂的并不独立的两场干旱事件得以连续。
进一步地,按照通用的游程理论[31],以SDI=0为阈值,识别流域历史水文干旱事件,统计干旱特征如表2所示。從表中可以看出,随着累积尺度的增大,可以观测到的旱涝事件呈现频次(数量)、最大单[CM(22]月径流亏缺量(即最小SDI值的绝对值)减小,但平
3.3不同分布线型下水文干旱指标计算对比分析
从以上分析可以注意到,随着时间尺度的增大,累积月径流量的分布有逐渐趋于正态化的趋势。为验证这一假设,将各流域基于正态分布与其他备选分布拟合计算的各尺度SDI序列的确定性系数R2,SDIQQ的统计箱形图绘于图5中。可以看出,对于所有理论分布,随着径流量累积时段的增加,由不同理论分布计算得到的SDI指标之间的确定性系数逐渐增大,差异逐渐减小。这表明累积径流量的分布线型随着累积时段的增加,逐渐趋于正态化。
同样,以汉江流域挽鱼沟子流域出口断面1,3,6与12个月尺度POME、GM、WB与PⅢ分布与NO分布的SDI为例,绘制相关关系见图6。从图中不难看出,在时间尺度选得较小的情况下,基于不同分布计算得到的干旱指标相关点据较为分散,特别是在尾部两端,这表明此时由不同分布计算得到的SDI值差异较大,这对于稳健的干旱评估显然是不利的。随着径流累积时间尺度的增大,不同分布拟合结果的差异逐步缩小,基本上可以互相替代,这也表明径流量的理论分布趋于正态化。这与Angelidis等[32]的研究结果一致。这一性质可在随机变量的独立同分布假设适当放宽的条件下,由大数定律解释。
4结论与展望
为计算标准化径流干旱指数SDI,需要首先确定各时间尺度累积月径流量的理论概率分布。为使待求的理论分布在充分利用样本信息,反映变量统计特征的同时,人为假定最小,提出了基于最大熵原理(POME)的累积月径流量分布,并采用汉江流域30个子流域的历史资料进行验证,得到以下结论。
(1)基于三阶矩约束的最大熵原理求得的理论分布,可以有效拟合汉江各个子流域不同时间尺度的累积月径流量,表现出良好的时空适应性,为水文随机变量的频率分析提供了新的工具。
(2)随着时间尺度增大,采用不同分布拟合同一尺度的月径流量的差距有所减少,月径流量概率分布特征趋于正态化。这一性质在选用累积尺度较大的径流计算相应的SDI值时具有一定的应用前景,直接采用正态分布,能够大大简化计算过程。
(3)作为一种通用的概率分布参数估计方法,POME可以为推求干旱指标和干旱特征的统计规律,进行干旱频率分析提供拟合手段。[HJ2.2mm]
参考文献(References):
[1]MCKEE T B,DOESKEN N J,KLEIST J.The relationship of drought frequency and duration to time scales[A].In:Proceedings of the 8th Conference on Applied Climatology[C].Boston,MA:American Meteorological Society,1993:179183.
[2]SHUKLA S,WOOD A W.Use of a standardized runoff index for characterizing hydrologic drought[J].Geophysical Research Letters,2008,35(2):L02405.DOI:10.1029/2007GL032487.
[3]NALBANTIS I,TSAKIRIS G.Assessment of hydrological drought revisited[J].Water Resources Management,2009,23(5):881897.DOI:10.1007/s1126900893051.
[4]BLOOMFIELD J P,MARCHANT B P.Analysis of groundwater drought building on the standardised precipitation index approach[J].Hydrology and Earth System Sciences,2013,17:47694787.DOI:10.5194/hess1747692013.
[5]MISHRA A K,SINGH V P.A review of drought concepts[J].Journal of Hydrology,2010,391 (12):202216.DOI:10.1016/j.jhydrol.2010.07.012.
[6]VICENTESERRANO S M,L?PEZMORENO J I,BEGUER?A S,et al.Accurate computation of a streamflow drought index[J].Journal of Hydrologic Engineering,2012,17(2):318332.DOI:10.1061/(ASCE)HE.19435584.0000433.
[7]JAYNES E T.Information theory and statistical mechanics,Ⅰ[J].Physical Review,1957a,106(4):620630.DOI:10.1103/PhysRev.106.620.
[8]JAYNES E T.Information theory and statistical mechanics,Ⅱ[J].Physical Review,1957b,108(2):171190.DOI:10.1103/PhysRev.108.171.
[9]SONUGA J O.Principle of maximum entropy in hydrologic frequency analysis[J].Journal of Hydrology,1972,17(3):177191.DOI:10.1016/00221694(72)900030.
[10][ZK(#]SINGH V P.On application of the Weibull distribution in hydrology[J].Water Resources Management,1987,1(1):3343.DOI:10.1007/BF00421796.
[11]PAPALEXIOU S M,KOUTSOYIANNIS D.Entropy based derivation of probability distributions:A case study to daily rainfall[J].Advances in Water Resources,2012,45:5157.DOI:10.1016/j.advwatres.2011.11.007.
[12]刘登峰,王栋,王远坤.考虑矩阶数的最大熵方法及其在水文随机模拟中的应用[J].水力发电学报,2015,34(9):2028.(LIU D F,WANG D,WANG Y K.POME with constraints of moments and its application to hydrological stochastic simulations[J].Journal of Hydroelectric Engineering,2015,34(9):2028.(in Chinese))DOI:10.11660/slfdxb.20150903.
[13]孔祥铭,董艳艳,李薇,等.最大熵方法在香溪河流域径流分析中的应用[J].水电能源科学,2016,34(2):1720.(KONG X M,DONG [JP+1]Y Y,LI W,et al.Application of maximum entropy method in analysis of Xiangxihe Watershed streamflow[J].Water Resources and Power,2016,34(2):1720.(in Chinese))
[14]張明,金菊良,王国庆,等.基于最大熵分布模拟的干旱频率分析[J].水力发电学报,2013,32(1):101106.(ZHANG M,JIN JL,WANG G Q,et al.Drought frequency analysis using stochastic simulation with maximum entropy model[J].Journal of Hydroelectric Engineering,2013,32(1):101106.(in Chinese))
[15]陈海涛,黄鑫,邱林,等.基于最大熵原理的区域农业干旱度概率分布模型[J].水利学报,2013,44(2):221226.(CHEN H T,HUANG X,QIU L,et al.Probability distribution model of regional agricultural drought degree based on the maximum entropy principle[J].Journal of Hydraulic Engineering,2013,44(2):221226.(in Chinese))DOI:10.13243/j.cnki.slxb.2013.02.009.
[16]HAO Z,SINGH V P.Entropybased method for bivariate drought analysis[J].Journal of Hydrologic Engineering,2013a,18:780786.DOI:10.1061/(ASCE)HE.19435584.0000621.
[17]吴孝情,陈晓宏,何艳虎,等.基于最大熵理论的降雨SPI研究[J].水文,2014,34(6):1420.(WU X Q,CHEN X H,HE Y H,et al.Study on SPI index based on maximum entropy theory[J].Journal of China Hydrology,2014,34(6):1420.(in Chinese))DOI:10.3969/j.issn.10000852.2014.06.003.
[18]HONG X,GUO S,XIONG L,et al.Spatial and temporal analysis of drought using entropybased standardized precipitation index:a case study in Poyang Lake basin,China[J].Theoretical and Applied Climatology,2015,122(34):543556.DOI:10.1007/s007040141312y.
[19]SHANNON C E.A mathematical theory of communication[J].The Bell System Technical Journal,1948,27(3):379423,623656.DOI:10.1002/j.15387305.1948.tb01338.x.
[20]Hao Z,Singh V P.Entropybased method for extreme rainfall [JP+1]analysis in Texas[J].Journal of Geophysical Research:Atmosphere,2013b,118:263273.DOI:10.1029/2011JD017394.
[21]KAPUR J N.Maximum entropy models in science and engineering[M].New York:Wiley,1989.
[22]MEAD L R,Papanicolaou N.Maximum entropy in the problem of moments[J].Journal of Mathematical Physics,1984,25(8):24042417.DOI:10.1063/1.526446.
[23]肖可以,宋松柏.最大熵原理在水文頻率参数估计中的应用[J].西北农林科技大学学报(自然科学版),2010,38(2):197205.(XIAO K Y,SONG S B.Application of maximum entropy principle in the estimation of hydrological frequency parameter[J].Journal of Northwest A & F University (Natural Science Edition),2010,38(2):197205.(in Chinese))DOI:10.13207/j.cnki.jnwafu.2010.02.035.
[24]陈华,郭生练,柴晓玲,等.汉江丹江口以上流域降水特征及变化趋势分析[J].人民长江,2005,36(11):2931.(CHEN H,GUO S L,CHAI X L,et al.Characteristics and trends of precipitation in the upper Hanjiang basin[J].Yangtze River,2005,36(11):2931.(in Chinese))DOI:10.16232/j.cnki.10014179.2005.11.011.
[25]XIONG L,GUO S.A twoparameter monthly water balance model and its application[J].Journal of Hydrology,1999,216(1):111123.DOI:10.1016/S00221694(98)002972.
[26]XIONG L,YU K,GOTTSCHALK L.Estimation of the distribution of annual runoff from climatic variables using copulas[J].Water Resources Research,2014,50(9):71347152.DOI:10.1002/2013WR015159.
[27]MANN H B.Nonparametric tests against trend[J].Econometrica:Journal of the Econometric Society,1945,13:245259.DOI:10.2307/1907187.
[28]KENDALL M G.Rank correlation methods[M].London:Charles Griffin,1975.
[29]PETTITT A N.A nonparametric approach to the changepoint problem[J].Applied Statistics,1979,28:126135.DOI:10.2307/2346729.
[30]ANDERSON T W,DARLING D A.A test of goodness of fit[J].Journal of the American Statistical Association,1954,49(268):765769.DOI:10.2307/2281537.
[31]YEVJEVICH V.Hydrology paper[M].USA:Colorado State University Press,1967.
[32]ANGELIDIS P,MARIS F,KOTSOVINOS N,et al.Computation of drought index SPI with alternative distribution functions[J].Water Resources Management,2012,26(9):24532473.DOI:10.1007/s1126901200260.