综合分期方法在陈家湾水库汛期分期中的应用
2019-09-10张霞武鹏林祝雪萍
张霞 武鹏林 祝雪萍
摘要:为消除指标相关性对聚类造成的影响,避免主观地选取汛期时间域,提出综合方法进行汛期分期。使用变异系数法和灰色关联法对所选指标进行筛选,利用集对分析法划分汛期时间域,最后利用Fisher最优分割法进行汛期分期。对陈家湾水库进行汛期分期,得出结果:汛期为6月1日-10月5日;前汛期为6月1日-6月25日,主汛期为6月26日-9月5日,后汛期为9月6日-10月5日。所得结果与前人分析结果较为一致,表明该方法符合实际,有一定的适用性。
关键词:灰色关联分析法;变异系数;集对分析法;Fisher最优分割法;汛期分期;陈家湾水库
中图分类号:TV697.1+3
文献标志码:A
doi:10.3969/j .issn. 1000- 13 79.2019.02.012
1 引言
在全球气候变化大背景下,对雨洪资源的有效利用提出了更高要求。水库对洪水资源的利用,通过动态控制汛限水位,既符合洪水变化统计规律,还能确保防洪安全的前提下尽可能多地利用洪水资源,提高雨洪资源的利用率。因此,汛期与非汛期的合理划分、汛期的精细划分意义重大。目前,主要的汛期分期方法有数理统计法[1]、模糊集合分析法[2]、分形理论法[3]、系统聚类法[4]等,这些方法主观性强,一般考虑指标单一,即便考虑多指标,也未对指标进行筛选。鉴于以上不足,本文以陈家湾水库为例尝试一种新的汛期分期方法。首先,以候(半旬)为时段选取①多年候平均总降雨量、②多年候平均最大1 d降雨量、③多年候平均最大3d降雨量、④多年候平均大雨日数、⑤多年候平均暴雨日数作为指标,并综合指标的信息与指标间的关联度对指标进行筛选,弥补指标间相关性对聚类结果有效性造成影响[5]的不足:其次,利用集对分析法确定汛期时间域,避免以往人为认定汛期时间域带来的误差:最后利用Fisher最优分割法,以候为单位划分,以期得到更加精确的分期结果,为流域内水库在汛期实行分期汛限水位控制、充分利用水资源提供依据[6]。
2 研究方法
2.1 灰色关联分析法
灰色关联度,用于衡量某一指标与其他指标之间关联程度的一种方法。关联度的具体计算步骤如下。
2.2 变异系数法
变异系数法认为,一个指标能够反映对象间的差异越大,说明这个指标的区分度就越好;反之,如果各对象同一指标的指标值差别不大,则这个指标区分度就不大[7]。计算步骤如下。
(1)设有t年资料,每年有72个候,每一个候对应v个指标,则可以得到样本矩阵X:
2.4 Fisher最优分割法
有序时间系列最优的分类应当符合“类内差别最小,类间差别最大”的原则,而汛期分期的过程属于有序时间聚类问题[9-10],故本次使用Fisher最优分割法进行汛期分期。具体分期步骤如下。
(1)对于n个时段,每个时段对应v个指标,则可以构成以下指标矩阵:
(4)汛期这一集合的类内距离(D)也可以通过式(10)求得。由于汛期的长度可以通过集对分析法求得,因此汛期这一集合的类内距离(D)是固定的。对于有序时间聚类问题,类间的距离与类内的距离之和等于B,所以当分类的数目一定时,对于某一种聚类方法,类内距离越小,类间距离就越大,这就说明这个分类的类内差别小,类间差别大,符合Fisher最优分割法的聚类原则。
将n个有序时间数据分为s类,定义P(n,k)为其中一种分法,可由下式进行计算:
3 实例分析
陈家湾水库位于山西省吕梁市中阳县城南约6.5km的南川河上。控制流域面积309 km,多年平均径流量1 616万m。水库总库容933万m.其中兴利库容375.5万m.防洪库容278.5万m,死库容327.0万m,重复库容48.0万m,是一座以防洪、灌溉、供水为主,兼顾发电、养殖的年调节中型水庫。
3.1 基本资料及指标选取
以陈家湾水库1957-2010年54 a的逐日降雨资料为基础,获取各指标时间序列。根据前述灰色关联分析法以及变异系数法,以其中一个指标各候为参考母序列,除去该指标的其余4个指标各候为子序列,求得指标关联度从小到大排序为③④②⑤①:对应的每个指标变异系数分别为2.29、1.61、0.94、0.95、0.98,以剔除关联度较大的指标为目标,同时根据主成分分析法累计贡献达到85 010时选取对应最少个数主成分进行分析[11]的原则进行筛选,得到指标③④②⑤。
3.2 汛期时间域的确定
按照集对分析法步骤将集合H符号化,并计算联系度,得到部分计算结果见表1。
由表1可知:汛期时间域为6月1日-10月5日,非汛期时间域为1月-5月、10月6日-12月。相比以往按照当地气候特点笼统确定的时间域,划分结果更加有据可循。
3.3 汛期分期
(1)以6月1日-10月5日为有序样本X,样本容量为25.每个样本均为4维向量,无量纲化后部分样本数据见表2,各类分段直径计算结果见表3。
(2)目标函数由式(14)、式(15)计算得出,计算结果见表4。f(s)由式(16)计算出,绘制f(s)-s曲线,见图1。
(3)汛期分期结果。由图1可得:s=3时,f(s)值最大,因此最优分类为3类。查表4可得,汛期为6月1日-10月5日;前汛期:6.1~6.5(即6月1日-6月25日)、主汛期:6.6~9.1(即6月26日-9月5日)、后汛期:9.2~ 10.1(即9月6日-10月5日)。
3.4 结果对比
为了分析验证结果的合理性,与文献[12]所用的改进的集对分析法以及模糊集分析法所得结果作比较,见表5。汛期多年平均日降雨量见图2,3种方法的分期时长见图3。
结果对比分析:依据汛期时间域的划分结果,本研究汛期总长127 d.较另两种方法汛期总长122 d多10月第一个候,本研究将其划人汛期,一方面是依据集对分析法划分结果,另一方面,如图2陈家湾6-10月多年平均日降雨数据显示,降雨量跟6月相当,故整个汛期的划分是更加合理的:改进集对分析法与模糊集分析法划分结果基本一致,前汛期时长30 d左右、主汛期时长60 d左右、后汛期30 d左右,与现行的方案基本一致。而本研究Fisher最优分割法结果与前两者相比,前汛期缩短到25 d,主汛期延长到72 d(延长了10—14 d),后汛期保持基本一致(30 d左右)。即本研究将6月最后一候、9月第一候划入主汛期,划入主汛期的这两个候分别相对其前、后的前汛期、后汛期平均降雨量更大一些,不仅验证了以候为划分单元的合理性、划分结果的精确性,同时主汛期的延长符合暴雨的季节性特征,对水库的安全更加有利,为科学确定水库开始蓄水时间提供了重要参考。
4 结论
利用灰色关联分析法以及变异系数法对所选指标进行筛选,弥补了指标单一的不足,消除了指标间关联度对聚类结果的影响:再利用集对分析法对汛期的时间域进行划分,代替以往主观性较强的人为认定的汛期时间域:最后利用Fisher最优分割法对汛期进行精细划分。将划分结果与改进的集对分析法以及模糊集分析法的结果进行比较,划分结果较为一致,都能很好地反映陈家湾水库的洪水变化特点。但是,模糊集分析分期结果比较依赖域值的选取,而域值的选取具有一定主观性,本研究的方法有效弥补了主观性强的缺陷。改进的集对分析法以旬为单位划分得出结果,而本研究以候为单位划分得出结果,故分期结果在趋于一致的基础上更加精确、更加符合实际。
参考文献:
[1] 王丽学,孙晓东,李学森,等,汛期分期定量分析方法在汤河水库中的应用研究[J].水电能源科学,2011,29(3):44-47.
[2] 郭金城,郭倩,武学毅,基于模糊集合分析法与圆形分布法的水库汛期分期研究[J].水电能源科学,2013,31(3): 50-53.
[3]侯玉,吴伯贤,郑国权,分形理论用于洪水分期的初步探讨[J].水科学进展,1999,10(2):140-143.
[4] 罗姗姗,宋星原,张艳军,等,汛期分期分析方法在佛子岭水库群的应用研究[J].水电能源科学,2012,30 (2):44-48.
[5]朱惠倩,聚类分析的一种改进方法[J].湖南文理学院学报(自然科学版),2005,17(3):7-9.
[6] 肖聪,顾圣平,崔巍,等.Fisher最优分割法在李仙江流域汛期分期中的应用[J].水电能源科学,2014,32(3):70-74.
[7]杨逾,郑志明,基于范例推理的软基处理评价方案研究[J].长江科学院院报,2015,32(12):93-97.
[8]王文圣,李跃清,金菊良,等,水文水资源集对分析[M].北京:科学出版社,2010:27 - 32.
[9]王贺佳,武鹏林,基于Fisher最优分割法的汛期分期[J].人民黄河,2015,37(8):30-34.
[10] 刘克琳,王银堂,胡四一,等.Fisher最优分割法在汛期分期中的应用[J].水利水电科技进展,2007,27(3):14-16.
[11] 李俊,武鵬林,改进的Fisher最优分割法在汛期分期中的应用[J].中国农村水利水电,2016(11):23-26.
[12]WU P L,LIJ,WANC J Y.Floods Season Division Basedon Improved Set Pair Analysis[J].Intemational Conferenceon Applied Mechanics and Materials, 2016( 10): 29-30.