基于Fisher最优分割法的龙滩水库汛期分期研究
2021-04-06李东琴侯贵兵李媛媛
李东琴,黄 亚,易 灵,侯贵兵,李媛媛
(1.保定市水利水电勘测设计院,河北 保定 071000;2.中水珠江规划勘测设计有限公司,广东 广州 510610)
截至2018年,中国已建成各类水库9.8万座,水库作为重要供水水源,其运行调度在缓解中国水资源供需矛盾中起着重要作用[1-2]。为使水库以超汛限水位运行,实现洪水资源的安全利用,大量学者基于流域暴雨和洪水变化规律进行流域汛期分期和分期设计洪水的研究[3-4]。在确保水库大坝及下游防洪安全的前提下,如何科学合理地制定汛期分期,实现洪水资源安全、有效利用已成为当下发挥水库兴利效益,缓解防洪兴利矛盾成为近些年研究热点[5]。目前,汛期分期主要研究方法有定性分析法、统计分析法及聚类分析法三大类。其中定性分析法依靠丰富的实践经验与主观判断,一般仅定性分析使用,统计分析法原理简单,但是存在主观强、精度低等不足之处,聚类分析法具有较强的物理数学背景,理论依据较充分,计算量大,分期成果的精度较高。聚类分析法种类较多,如模糊集合分析法[6]、分形法、系统聚类法[7]、变点分析法[8]、灰色定权聚类法[9]及投影寻踪法[10]、Fisher最优分割法等。但以上方法均存在各自的缺陷。模糊集合法和分形法仅考虑单因子指标;变点分析法和系统聚类法虽可考虑多指标,但在变点数和指标阈值确定方面具有较强的主观性;投影寻踪法在构造指标函数时存在的差异会对分期计算结果产生较大影响;Fisher最优分割法考虑多因子影响,计算繁琐。鉴于此,Fisher 最优分割法在不改变汛期时序性的基础上,既能综合考虑汛期的多因子指标,又能确定最优的汛期分期数目,具有较强的综合性能。目前Fisher最优分割法已经广泛应用于农业、气象和地质灾害预报等领域[11-13]。本研究以龙滩水库1960—2015年降雨和径流的逐日资料为基础,采用Fisher最优分割法对龙滩水库汛期分期开展研究,研究结果可为水库分期汛限水位或动态汛限水位的调整提供依据。
1 Fisher最优分割法
1.1 具体分割步骤
a)数据归一化。由于不同类型的数据存在数据量级上的差异,为避免其对分期结果的影响,需要先将分割的样本数据进行归一化处理:
(1)
(2)
同时,根据各项指标对样本分类的重要程度赋予指标权重,加权计算后得到特征向量Y,以Y作为基础数据进行汛期分期,Y计算公式如下:
(3)
b)定义分段直径。分段直径是反映分段内部差异程度的指标,差异越大,则直径越大;反之亦然。设样本分段后的某一分段为Q={yi,yi+1,…,yj}(j>i),则有:
(4)
(5)
c)定义分类目标函数。将n个有序样本分为k类,则定义分类目标函数为:
(6)
d)求解最优分割。根据文献[12],有序样本的最优分割总是建立在截断末尾子段的最优k-1分割的基础上,且存在以下核心递推公式:
(7)
(8)
当分为k类时,找jk使递推公式(8)达到最小,从而求出k类。然后再推求ik-1分割点,以此类推所有分割点求出最优分期数。
e)确定最优分割数目k。通常取e[P(n,k)]-k曲线拐点处对应的k值即最优分类数,或者计算:
r(k)=|e[P(n,2)]-e[P(n,k-1)]|
(9)
然后与k绘制r(k)-k曲线,最大对应的k也是最优分类数。
2 实例分析
2.1 基本资料及指标选取
龙滩水库是红水河梯级开发的龙头水库,位于珠江干流红水河上游广西天峨县境内。水库集水区面积约98 500 km2,坝址下游14 km处天峨水文站集水面积为105 830 km2,占红水河流域面积的71.2%。库区汛期为每年4—10月,根据多年降水统计结果,汛期降水占全年降水总量的89%,径流占全年的84%。本研究基于龙滩水库1960—2015年共56年的逐日降水和径流系列,以旬为单位将汛期划分为21份。共选取了6个能够反映流域暴雨洪水变化特征指标:旬平均降雨量(P)、旬平均最大1日降雨量(P1)、旬平均最大3日降雨量(P3)、旬平均最大7日降雨量(P7)、旬内暴雨日数(N)、旬多年平均入库流量(Q)。
2.2 汛期分期计算步骤
步骤1:归一化数据。根据式(1)、(2)将选取的6个指标数据进行归一化处理,归一化后的数据见表1。
步骤2:计算特征向量Y。在使用Fisher最优分割法过程中,指标的合理选取及权重系数的确定是研究的关键[11]。本研究选取专家咨询权数法[14]、独立性权数法[15]、因子分析权数法[16]、信息量权数法[16]共4种权重系数计算方法进行特征向量计算。根据式(3)对表1中归一化后的指标特征值进行加权计算,表2为基于4种权重系数计算得到特征向量Y。
表1 汛期分期划分指标及归一化数据
表2 基于不同权重系数的特征向量值
步骤3:计算分段直径。根据式(4)、(5)计算特征向量Y的每一分段的直径D(i,j),其中i=1,2,…,20;j=i+1,…,21。
步骤4:计算分类目标函数。根据目标函数性质和式(7)、(8)可以计算出每一种分割情况下的目标函数值e[P(n,k)]。
步骤5:计算最优分割数。按照图1寻找最优k分割,并由式(9)确定r(k)值。
2.3 最优分割数确定及对比分析
图1所示,最小目标函数e[P(n,k)]随k值单调递减,曲线在k值为3、4、5处拐点最大,当k值超过5以后,k值再增加目标函数已变化不大,说明将汛期分为3、4、5期最好。由公式β(k)=e[P(n,k-1)]/e[P(n,k)],计算比值β(5)=2.99>β(3)=1.92>β(4)=1.52,因此5期为最优分割数,其次为3期。
图1 e[P(n,k)]-k关系曲线
表3比较了当k=3时龙滩水库汛期分期结果与其他学者成果。由表可知,当k=3时,Fisher最优分割法将汛期4—10月被分成3期,前汛期为4月上旬至5月中下旬,主汛期为5月中下旬至8月中下旬,后汛期为8月中下旬至10月下旬,基于不同权重系数的分期结果略相差1旬。而前人的研究结果中,前汛期主要为4月上旬至6月上旬,主汛期为6月上旬至8月下旬,后汛期为9月上旬至10月下旬。基于Fisher最优分割法的后汛期与前人结果基本一致,主汛期开始时间略有提前。
表3 Fisher分期成果与已有研究成果汇总
表4为k=5时,基于不同权重系数的Fisher最优分割法的龙滩水库汛期分期结果。基于最优分期结果可将汛期分为汛前过渡期(4月上旬至下旬)、前汛期(5月上旬至中旬)、主汛期(5月中旬至7月中旬)、后汛期(7月下旬至9月上旬)、汛后过渡期(9月中旬至10月下旬)。Fisher最优分割法基于4种不同权重系数的分期计算结果基本一致,在后汛期和汛后过渡期划分略有差异。基于Fisher最优分割法的汛期分期结果能较好地反映龙滩水库流域在汛期的暴雨洪水变化特征,且保持了汛期样本的时序性,在分期过程中综合考虑了汛期降水、径流的多种特征指标,同时还能根据数据时间尺度确定汛期最优分期数。
表4 基于最优分割数的汛期分期成果
3 结语
本研究选取反映龙滩水库流域暴雨洪水季节性变化规律的6项指标作为Fisher汛期分期计算样本。从主观、客观角度出发,采用4种不同的权重系数计算方法进行样本特征向量的计算。结果表明,汛期最优分期数为5期:汛前过渡期(4月上旬至下旬)、前汛期(5月上旬至中旬)、主汛期(5月中旬至7月中旬)、后汛期(7月下旬至9月上旬)和汛后过渡期(9月中旬至10月下旬)。在龙滩水库水情预报系统的预报成果基础上,在汛期不同分期实施不同的汛限水位,尤其对后汛期和汛后过渡期汛限水位的动态控制,可提高在汛末期的龙滩水库蓄满率。
Fisher最优分割法对龙滩水库汛期的分期结果能够较好地反映流域汛期的暴雨洪水变化特点。在以旬为计算单位的情况下,各权重系数对分期结果影响不大,究其原因可能是以旬为划分单位对于指标权重系数变化不敏感。未来可选取更多反映汛期暴雨洪水的特征指标,根据各指标对汛期分期的影响程度赋予不同的权重,以取得更为合理可靠的汛期分期结果。同时,也可将划分的时间尺度进一步缩小到日尺度,利用Fisher最优分割法获取更精准的分期时间,在实际工作中还需要结合实际的工程情况进行分析验证。