基于遗传算法的混合Copula函数的时段洪量估计
2019-10-21刘立燕解培中王颖
刘立燕 解培中 王颖
摘要:淮河流域下游入江水道,每年雨水充足,容易引发洪水,对人民生命及财产安全造成威胁,因此对洪水特征变量——洪峰流量与整个洪水过程洪量的估计以及防洪工程的建设提出更高的要求。利用混合Copula函数将洪峰流量与时段洪量进行联合分析,利用基于遗传算法的优化适线法计算出淮河下游入江口的中渡水文站洪峰流量与时段洪量离差平方和最小时的Frank Copula、Clayton Copula、Cumbel Hougaard Copula的函数组合,在此基础上根据洪峰值利用边缘分布与联合分布之间的关系推求出时段洪量,为防洪工程设计提供参考。对中渡水文站实测数据的分析结果表明:采用混合Copula函数比采用单- Copula函数更精确,并且混合Copula函数具有灵活性,能够较好地拟合两变量的相关关系。
关键词:水文学;遗传算法;混合Copula;联合分布;中渡水文站;淮河
中图分类号:TV122+.5
文献标志码:A
doi:10.3969/j .issn.1000- 1379.2019.03.012
1 研究背景
洪水是自然界中最危险的自然灾害之一.影响的范围非常大。据报道,每年洪水引起的损失占自然灾害总损失的40%左右。在世界范围内洪水预测已经逐渐成为广泛研究的课题,尤其对于洪水高发区的人民来说,准确预测洪水并且提前给予当地居民警告是非常有必要的。
传统的频率分析方法都是基于单一特征变量的频率分析对洪水发生的概率进行分析,即先假定某一特征变量符合某一分布线型,之后对分布线型中的参数进行估计[1-3].但单变量频率分析忽略了同一事件中其他特征变量的影响。为此,进一步提出了多变量频率分析方法,如Copula函数频率分析方法。最近几十年,Copula函数在金融、保险、财经风险等方面的应用较为广泛[4-5]。水文现象中的随机性与上述几个方面相似,因此Copula函数在水文研究中的应用应运而生。
Copula函数是将多个单变量概率分布函数连接起来的多变量分布函数,利用Copula分布函数无需考虑各个单变量的概率分布函数。首次将Copula函数应用在水文领域的是De Michele与Salvadoria[6],之后国内外相继利用Copula函数进行水文频率分析。文献[7]将Copula函数应用于降水概率的预测中,把年降水均值和年降水极值均值作为两个研究变量,利用Pearson -Ⅲ型分布推求各变量的边缘分布,然后通过Copula函数构建其联合分布,对降水情况进行分析;文献[8]研究了序列长度对Copula函数拟合效果与不确定度的影响;文献[9]将历史洪水考虑在内,然后利用Copula函数进行分析;文献[10]利用Copula函数将洪峰流量、洪量、历时分布进行联合,推求出RomaineRiver洪水发生情况;文献[II]采用不同类型的Copula函数对Save River的Litijia观测站58场洪水进行模拟,结果表明几种类型Copula函数的模拟结果差别不大;文献[12]将Copula函数应用于大坝设计,通过模拟大坝的不同洪水强度对应的回归周期,为大坝设计提供风险参考;文献[13]收集分析了加拿大不同气候区的21个流域的洪水特征值,并利用ClaytonCopula函数模拟这21组洪水特征值,分析了气候变化对洪水的影响。然而上述研究都是针对单- Copula函数进行分析,并没有考虑混合Copula函数的灵活性。在金融领域混合Copula函数得到广泛应用,文献[14]利用混合Copula函数将不同市场联合起来,并利用EM算法求出混合Copula函数的权重及其相关参数,结果表明混合Copula函数更能够描述两者之间的相依结构;文献[15]提出了M-Copula-EGARCH -M投资组合模型,结果表明混合Copula函数能够较好地捕捉两个市场间的关系。文献[16]首次将混合Copula函数应用在洪水遭遇问题分析中,利用优化适线法确定混合Copula函数的参数,分析了长江干流的设计洪峰流量,并验证了该方法的可行性。
本文在文献[14-16]的基础上提出了一种基于遗传算法的混合Copula函数的参数估计方法,并利用洪峰与时段洪量建立混合Copula函数模型,最后利用该模型以及洪峰边缘分布函数估计整个洪水过程的洪量。
2 混合Copula函数估计方法
2.1 Copula函数简介
二维Copula函数简述为[17]
2.3 基于遗传算法的混合Copula函数的参数估计
遗传算法是基于自然选择和遗传学概念的随机优化算法,首先产生一个种群,种群中的每个个体代表给定目标函数的初始解:其次通过适应度函数来评价各个个体的适应性,并通过适应度来决定当前种群个体遗传到下一代群体中的机会多少:然后对遗传到下一代的个体进行选择、交叉,产生新的种群;最后更新遗传代数,直至满足终止条件。具体步骤如下[19]。
(1)初始化种群。
(2)利用选择函数从种群中选择父辈。
(3)对所选择的父辈进行交叉,产生下一代个体。
(4)对个体进行突变。
(5)更新遗传代数。
(6)当不满足最大遗传代数时,重复执行(2)(3)(4)(5)操作。
(7)结束。
本文利用遗传算法计算出理论Copula函数与经验Copula函数离差平方和(O/S)最小时在式(5)的约束下式(4)中各个参数的值。具体计算步骤如下。
当选取的γ值较小时,可能不满足ω1+ω2+ω3=1,适应度函数已经达到极小值点,造成约束条件失去意义,因此γ要尽可能选择合理,避免不满足约束条件,且不影响目标函数的最值选择。
(3)确定最大遗传代数Gm以及交叉概率pc。确定惩罚因子γ后,通过描绘适应度函数取得最小值min (fs)时随着最大遗传代数改变的图像,选择合适的最大遗传代数:当最大遗传代数以及适应度函数确定之后,通过改变交叉頻率继续对所求函数进行优化,进一步描绘min (fs)与不同交叉概率之间的图像,选择合适的交叉概率,保证优化值为最小值。
(4)利用選定的遗传算法的参数计算出混合Copula函数的各个参数值。
2.4 混合Copula函数的估计步骤[22]
首先利用混合Copula函数将两变量X、Y的边缘分布函数连接起来,构建X、Y的联合分布函数:其次在已知t+l时Xt+1的条件下,基于混合Copula函数建立Y的边缘分布与联合分布的关系式:最后计算因变量Y在t+l时的值Yt+1。具体步骤如下。
3 实例分析
淮河流域下游人江水道,汛期雨水充足,容易引发洪水,对人民生命及财产安全造成威胁,因此对洪水特征变量——洪峰流量与整个洪水过程的洪量估计以及防洪工程建设提出更高的要求。以淮河流域下游中渡水文站1962-2014年的洪峰流量与整个洪水过程的3d洪量作为研究对象,令洪峰流量为自变量X,3d洪量为因变量y。选取1962-2010年的洪峰流量与时段洪量进行联合分析计算并建立模型,通过建立的模型,以2011-2014年洪峰流量为自变量,推求相对应的时段洪量,作为检验模型的依据。
首先依据1962-2010年的洪峰流量与时段洪量数据,利用核函数法估计出洪峰流量与时段洪量的边缘分布值,各个变量的边缘分布见图1、图2。
其次确定遗传算法的适应度函数的惩罚因子γ、最大遗传代数Gm以及交叉概率pc。
把估计的1962-2010年的洪峰流量与整个洪水过程的洪量的边缘分布值作为研究对象。当不考虑交叉频率时,选择最大遗传代数Gm分别为30 - 100、200和300时,不同的惩罚因子γ对应的ω1、ω2、ω3见表2。
由表2可知,当惩罚因子大于等于2 000时,ω1+ω2 +ω3=1恒成立,因此选择惩罚因子γ为2 000。当适应度函数确定后,图3描绘了适应度函数取最小值时与最大遗传代数之间的关系。
由图3可知当最大遗传代数为100时,适应度函数值较小,且随着最大遗传代数的增加,适应度函数的最小值基本保持不变,因此选择最大遗传代数为100。
当最大遗传代数以及适应度函数值确定之后,通过改变交叉频率继续对所求函数进行优化,保证优化值为最小值。图4为交叉概率与适应函数最小值的关系,根据图4,选择交叉概率为0.7。
利用选定的遗传算法参数进行混合Copula函数参数的确定。单一 Copula函数的参数与利用遗传算法估计的混合Copula函数的参数以及OLS拟合检验值见表3。
由表3可以得出混合Copula函数的拟合效果较好,另一方面可以观察出洪峰流量与时段洪量的上尾相关性较强。图5描绘了混合Copula函数概率密度。
由图5可知,混合Copula函数的形状具有明显的不对称性,呈现J形,具有上尾高、下尾低的特点,可以看出水文极值洪峰流量和洪量具有较好的上尾相关性。
最后利用2011-2014年的洪峰流量值,确定各个边缘分布的概率。以2011年洪峰流量为例,中渡水文站测得的洪峰流量X2011=2 510 m3/s,得F(X2011)=0.520 0.将其代人式(7)得
由图6可以看出两函数的交叉点为(x,y)=( 0.534 0,0.518 2),即此时V= 0.534 0。
此时利用MATLAB中的ginput()[],从图2中观察可知,当V=F(y)= 0.534 0时,对应的Y值为5.306。实际时段洪量为5.478亿m3,误差为-3. 1%。为了进一步分析混合Copula函数的性能与估计能力,利用单一的Copula函数进行估计,计算过程同理可得。2011-2014年的实测整个洪水过程的洪量与利用各模型估计出的整个洪水过程的洪量,相对误差与平均相对误差(历年误差的绝对值的平均值)见表4。
4 结语
混合Copula函数具有较好的灵活性,能够更好地描绘洪峰流量与整个洪水过程的洪量的相互关系:利用洪峰流量与时段洪量之间的相互关系,在已知洪峰流量的情况下利用混合Copula函数可以更好地估计整个洪水过程的洪量。但是本文利用遗传算法对混合Copula函数的参数进行估计时,由于遗传算法的特性,可能陷入局部最优,因此应该合理调整遗传代数以及选择概率。同时,对于惩罚参数的选择应该多次尝试,避免计算出来的值不满足约束条件。
参考文献:
[1]鲍振鑫,水文频率分析适线法参数估计研究[D].南京:南京水利科学研究院,2010:33-48.
[2]周川,陈元芳,魏琳,等,适线法在洪水超定量系列频率分析中的应用研究[J].水电能源科学,2011,29(3):48-50.
[3] 赵璧奎,王丽萍,李继清,等,不连续系列的P-m型曲线计算机适线法探讨[J].水电能源科学,2012,30(3):64-67.
[4]AAS K,CZADO C,FRICESSI A,et al.Pair-Copula Con-structions of Multiple Dependence [J]. InsuranceMathematics&Economics, 2009, 44(2):182-198.
[5] TSUKAHARA H.Semiparametric Estimation in Copula Models[J]. Canadian Journal of Statistics, 2005, 33(3):357-375.
[6]MICHACLE D C,SALVADORI G.A Ceneralized Pareto In-tensityduration Model of Storm Rainfallexploiting 2- Copulas[J]. Journal of G eophysical Research Atospheres, 2003, 108(D2):171-181.
[7] 倪增华,刘合香,罗彦丽,等.Copula函数在广西洪涝灾害的降水概率预测中的应用[J].气象研究与应用,2014,35(2):32-39.
[8] 童心.Copula函数与信息熵理论在洪水多元分析和径流随机模拟中的研究[D].南京:南京大学,2015:36.
[9] L1 T,GUO S,CHE N L,et aI.Bivariate Flood Frequency A—nalysis with Historical Information Based on Copula[J].Joumal of Hydrologic Engineering-ASCE, 2013, 18(8):1018-1030.
[10]PARENT E,FAVRE A C,BERNIER J,et aI.Copula Modelsfor Frequency Analysis What can be Leamed from a Bayes-ian Perspective[J].Advanced in Water Resources, 2014, 63(2):91-103.
[11]SRAJ M,BEZAK N,BRILLY M.Bivariate Flood FrequencyAnalysis Using the Copula Function:a Case Study of theLitija Station on the Sava River[J].Hydrological Processes,2015,29(2):225-238.
[12]REQUENA A I,MEDIERO L,GARROTE LA Bivariate RetumPeriod Based on Copulas for Hydrologic Dam Design Accountingfor Reservoir Routing in Risk Estimation[J].Hydrology andEarth System Sciences ,2013, 17(8):3023-3088.
[13] JEONC D, SUSHAMA L,KHALIQ M N, et al.A Copula-Based Multivariate Analysis of Canadian RCM ProjectedChanges to Flood Characteristics for Northeastem Canada[J] .Climate Dynamics, 2014, 42( 7-8):2045 - 2066.
[14] 马梅,卢俊香,杜艳丽,混合Copula模型选择及其应用[J].价值工程,2017,36(1):191-194.
[15] 申建平,基于M-Copula函数的投资组合和相关风险研究[D].重庆:重庆大学,2014:144-166.
[16] 王占海,陈元芳,黄琴,等.M-Copula函数在洪水遭遇中的应用研究[J].水电能源科学,2009, 27(1):69-73.
[17] NELSEN R B.An Introduction to Copulas[M].Cermany:Springer Publishing Company, Incorporated, 2010:315.
[18] 韦艳华,张世英,郭焱,金融市场相关程度与相关模式的研究[J].系统工程学报,2004, 19(4):355-362.
[19]BODENHOFER U.Cenetic Algorithms: Theory and Appli-cations[J].Lecture Notes, 1993: 1-3.
[20]Ozgur Yeniay. Penalty Function Methods for Constraint Op-timization with Cenetic Algorithms[J].Mathematical&Computational Applications, 2005,10(1):45 - 56.
[21]王文圣,水文学不确定性分析方法[M].北京:科学出版社,2011:110-125.
[22] 陈晶,王文圣.Copula預测方法及其在年径流预测中的应用[J].水力发电学报,2015, 34(4):16-21.