APP下载

基于信息熵理论的大通水文站流量历时曲线计算

2019-09-10郭德俊王悦唐旭伟崔惠娟

水利水电快报 2019年8期
关键词:信息熵

郭德俊 王悦 唐旭伟 崔惠娟

摘要:基于信息熵理论,计算了大通水文站的流量历时曲线。利用两个简单约束方程对流量历时曲线进行建模,运用概率总和与平均流量以及约束方程推导最大熵获得曲线参数,最终确定了流量历时曲线。通过对大通控制站观测到的流量数据进行验证,发现基于信息熵理论得到的流量历时曲线与观测到的曲线一致。自2003年三峡工程建设投运以来,大通水文站观测到的均值流量和最大流量趋势发生了变化,却未发现均值与最大值的比值存在显著差异。在此期间,其表征分布形态的熵参数也并未发生显著变化。

关键词:流量历时曲线;信息熵;熵参数;大通水文站

中图法分类号:P337

文献标志码:A

DOI:10.15974/j .cnki.slsdkb.2019.08.001

1 研究背景

大通水文站位于安徽省池州市梅陇,为长江下游的控制水文站,距长江口约700 km,控制面积约170万km2。该站于1922年10月设立,1949年10月1日后由长江水利委员会管辖,观测资料包括水位、流量、泥沙、雨量等。

流量历时曲线代表水文控制站不同频率对应的流量由低到高排列,一般在某一时间尺度用0-100%的数值刻画。流量历时曲线可看作某一站点某一时段的流量累积频率曲线,而非时间序列。由于流量历时曲线是通过观测范围内所有观测到的流量判定的,考虑到流域的综合水文条件,可用来比对不同河流的情况,经常用来预测未来供水流量的分布[1]、水力发电量[2]、沉积物负荷[3]及污染指数[4]。

一般来说,可通过每日平均流量构建流量历时曲线,也可根据需要建立周、月和季步长上的流量历时曲线,但随着时间间隔增加,流量变化的细节变得模糊。对于多数河流,月流量的历时曲线并不能充分反映流量的变化情况,而基于年平均流量建立的流量历时曲线由于其变化范围较小,几乎没有价值。H.A. Foster[5]研究表明,基于日流量确定的流量历时曲线与基于月流量确定曲线的差异可能高达35%。对于不同的河道,时间间隔变化的影响也不尽相同。对于一些日流量几乎均匀的河道,周流量的历时曲线可能与日流量的历时曲线几乎相同。而对于突然发生洪水的河道,其日流量和周流量的历时曲线将存在较大差异。通常根据经验分布构建流量历时曲线。本文采用2014年V.P.Singh等[6]研发的信息熵模型,结合最大熵理论,确定大通水文站流量历时曲线,并与其观测值进行比较验证。

2 研究方法

为利用信息熵理论计算流量历时曲线,需假设大通站观测到的日流量Q为独立随机变量,服从未知概率分布f(Q)。

V.P.Singh等[6]基于信息熵理论的流量历时曲线计算步骤包括:①定义信息熵;②确定流量约束条件;③利用拉格朗日方程求最大熵并获得流量概率分布;④计算拉格朗日参数并求得流量历时曲线。

2.1 定义流量的Shannon熵

考虑观测到的流量Q服从未知分布f(Q),利用Shannon熵[7],流量的信息熵H(Q)可定义为式中,Qmax和Qmax分别为上下限,表征最大及最小流量。H表征流量概率分布f(Q)所包含的不确定性,代表样本Q所包含信息量的期望。通过式(1),根据最大熵理论求得最不偏的概率分布f(Q)。最大熵理论由E.T.Jaynes[8]的研究成果发展而来,只需明确流量约束条件即可求得。根据最大熵理論可知,对仅知部分信息的变量或关系,对其最不偏的判断满足熵最大的情况。

2.2 约束条件

首先,作为Q的概率分布f(Q)必须满足其总和等于1的条件:

能量守恒定律也能作为约束条件,然而D.E.Barbe等[9]的研究表明,对于河道流速的分布,利用信息熵理论时仅需上述两个约束条件就已足够。为不增加计算的复杂性,该研究中仅采用上述两个约束条件进行计算。

2.3最 大化

利用拉格朗日算子,可以将式(1)所定义的信息熵最大化,并求得熵最大时的概率分布:

2.4 流量历时曲线

流量历时曲线代表了流量和不小于该流量时长之间的关系,因此可假设观测到的时均流量为在其最大值Qmax与最小值Qmin之间的概率分布。这符合实际情况和Laplacian不充分原则。为此,流量的累积概率F(Q)可表示为

F(Q)=1-t/T=1-τ,τ=t/T

(6)式中,t为流量不小于Q的时长(天数),T为考虑的总时长(365 d)。值得注意的是,F(Q)为关于流量Q的函数,t/T是关于τ的函数。上述线性累积分布假设是对流量Q与时长百分比τ的线性假设,相似的假设已应用于不少研究[10-12]。相应地,也可假设流量与时长百分比间具有非线性关系。为简化计算步骤,本文采用上述线性假设关系。

参照文献[6],对通过最大化信息熵获得的概率分布,在Qmax和Qmax之间进行积分,即可得到流量历时曲线:

3 计算结果

3.1 大通站日流量

采用大通水文控制站1951-2013年日均流量进行计算,以2003年三峡工程建成投运为界,分为2003年前后两个序列。表1总结了2003年前后大通站年均流量、年最大流量、年最小流量的历史平均值(Qmax,Qmax,Qmax)及其观测到的历史最大流量Qpeak。由表1可以看出,三峡工程建设投运以来,年均流量变化幅度不显著,年最大流量减少,年最小流量增加,其流量变化范围减小,然而该变化并不显著。

为更准确地表明2003年前后的流量变化,图1显示了2003年前后两组观测流量的概率分布。由图1可以看出,2003年之后的流量概率分布相比2003年前更为集中,流量在12 000-20 000m3/s之间的情况明显增加,无流量小于9 000m3/s或大于65 000 m3/S的观测值。对2003年前后的概率进行配线并对比,发现两组序列所配的概率分布存在明显差异,通过t检验得知2003年前后的流量不服从同一分布。

3.2 熵参数变化

如式(8)所示,该研究方法中唯一的参数熵M取决于均值与最大值的比值。图2展示了大通站日均流量与最大日流量随时间的变化趋势,由图可知,2003年三峡工程建成投运对其最大流量带来了较显著影响,2003年为最大流量的显著拐点。2003年前,最大流量呈现增加趋势;而2003年后,不仅最大流量值明显小于历时平均,且具有下降趋势。相反地,大通站观测的日均流量2003年前后并未发生显著差异,其趋势也不明显。结合Mann-Kendall趋势检验方法来检验其变化趋势,结果如表2所示。只有2003年前的最大流量和最小流量的变化具有显著趋势(p<0.05),且2003年后这些变化也不再显著,与图2所展示的结果一致。

本研究分析了日均流量与最大流量的比值是否受三峡工程的影响。图3展示了2003年前后日均流量与最大流量的比值范围,图中蓝点展示2003年前后的均值与最大流量的比值,其范围在0.28-0.57之间,而2003年后其比值范围仅在0.32-0.43之间。利用式(8),求得各个时段对应的熵参数M值。相应地,2003年前绝大多数M值分布在2.1-3.2之间,1955年出现最大值3.55。2003年后M值范围缩小为2.3-3.2之间,这是由于三峡水库运行后流量范围明显减小。然而通过配线拟合发现,2003年前后所有点几乎都落到同一条曲线上,虽然参数略有差异,但差异并不显著。上述分析说明,虽然2003年三峡水库运行导致大通站的流量发生了變化,然而从信息熵的角度来讲,两组数据所包含的信息量并不存在显著差异,数据分布形态并无显著区别。

3.3 流量历时曲线

通过计算所得的熵参数M值,可根据式(7)确定大通站每年的流量历时曲线。图4展示了1960年的流量历时曲线,图中圆点代表观测值由大到小排序计算的流量历时曲线,红线代表利用信息熵理论算得的曲线。通过对比发现,两者十分接近,进一步说明由信息熵理论算得的流量历时曲线符合观测结果。

为比较三峡工程对流量历时曲线的影响,图5中将2003年前的流量历时曲线用灰色范围表示,用不同的颜色线代表2003年后的大通站的流量历时曲线。图5结果表明,虽然三峡工程运行导致其流量发生了显著变化,尤其是最大流量明显减小,但其流量历时曲线并没有超出历史范围,这一结论也与熵参数M没有发生显著变化一致。

4 结语

本文基于信息熵理论,确定了大通水文控制站的流量历时曲线。假设观测得到的流量为随机变量,利用概率总和与均值定理作为约束条件,对流量历时曲线进行建模。基于最大熵理论推导流量历时曲线过程中,采用线性累积分布假设,最终确定流量历时曲线。利用信息熵确定的流量历时曲线,由于无需提前确定流量具体服从何种分布,不需要拟合,简化了计算难度,仅需基于观测确定参数。本研究通过对大通控制站观测到的流量数据进行验证,发现基于信息熵理论得到的流量历时曲线与观测数据曲线一致。2003年三峡工程建成投运以来,大通水文站观测到的均值流量和最大流量的趋势发生了变化,然而均值对最大值的比值却未发现显著差异,其表征分布形态的熵参数在三峡工程建成投运前后也并未发生显著变化,因为三峡工程建成投运并未对大通水文站的流量历时曲线带来显著影响。

参考文献

[1] Mitchell W D. Flow-duration of Illinois Streams [M] . Illi- nois : Illinois Department of Public Works and Buildings ,Division of Waterways, 1957.

[2] Hickox G H, Wessenauer G0. Application of durationcurves to hydroelectric studies [Jl. Transactions ofASCE, 1933(98) : 1276-1308.

[3] Miller C R. Analysis of Flow Duration, Sediment-ratingCurve Method of Computing Sediment Yield [M] . Denver :Department of Interior, Bureau of Reclamation, Sedimen-tation Section, Hydrology Branch, 1951.

[4] Searcy J K. Flow-duration Curves [Ml. Washington, D.C.: USGS Water-Supply Paper, U.S. Govemment Print-ing Office, 1959.

[5] Foster H A. Duration curves [Jl. Transaction of ASCE,1934( 99) : 1213-1267.

[6] Singh V P, Byrd A , Cui H. Flow duration curve usingentropy theory [Jl. Journal of Hydrological Engineering,2014,19(7) :1340-1348.

[7] Shannon C E. A mathematical theory of communications ,I and II [Jl. Bell System Technical Journal, 1948 (27) :379-443.

[8] Jaynes E T. Information theory and statistical mechanics[J]. I. Physical Review, 1957(106) :620-630.

[9] Barbe D E, Cruise J F, Singh V P. Solution of 3-con-straint entropy-based velocity distribution [Jl. Hydraul.Eng. , 1991 ,117(10) : 1389-1396.

[10] Singh V P. Entropy theory for derivation of infiltration equations [Jl. Water Resources Research, 2010 (46) :1-20.

[11] Singh V P. Tsallis entropy theory for derivation of infil-tration equations [J]. Transactions of the ASABE, 2010(2) : 447-463.

[12]Al-Hamdan O Z, Cruise J F. Soil moisture profile de-velopment from surface observations by principle of max-imum entropy [J]. Joumal of Hydrologic Engineering,2010(5) :327-337.

猜你喜欢

信息熵
计及用户不满意度的家庭能量管理调度优化研究
近似边界精度信息熵的属性约简
基于信息熵的承运船舶短重风险度量与检验监管策略研究
基于信息熵的承运船舶短重风险度量与检验监管策略研究
信息熵及其在中医“证症”关联中的应用研究
论犯罪信息
基于改进灰关联度的雷达抗干扰能力评估算法
基于信息熵的信息系统内部控制评价指标研究
从信息熵论视角看特殊教育课堂教学
基于模糊集和信息熵理论的电网调度员培训评估方案