APP下载

基于集对分析的不同分类方法对汛期分期的影响

2021-04-02慧,刘根,王姣,王文,彭军,胡

人民长江 2021年3期
关键词:距平百分率过渡期

虞 慧,刘 星 根,王 姣,王 永 文,彭 圣 军,胡 强

(1.江西省水利科学研究院,江西 南昌 330029; 2.江西省水工程安全工程技术中心,江西 南昌 330029;3.江西理工大学 土木与测绘工程学院,江西 赣州 341000; 4.中国科学院 南京地理与湖泊研究所,江苏 南京 210008; 5.南昌工程学院 水利与生态工程学院,江西 南昌 330099)

1 研究背景

利用分期汛限水位调控洪水资源,是处理水库防洪与兴利矛盾、实现洪水资源安全利用的重要途径,对缓解区域水资源短缺危机、改善生态环境和实现水资源可持续利用具有重要的现实意义[1-3]。水库控制流域汛期的合理划分(汛期分期)是确定分期汛限水位的基本前提。国外的汛期分期研究主要围绕洪水季节规律性和水库库容重新分配等问题,如Cunderlik等[4-5]提出矢量统计法和相对频率法,并采用年最大值取样法(AMM)和超定量取样法(POT)在英国洪水季节性规律上进行比较研究。总体而言,国外水库汛期分期的研究[6-8]开始时间较早,但近期研究相对较少。在我国,关于水库汛期分期的研究案例丰富,常见的研究方法有模糊统计法[9-11]、分形法[12-13]、Fisher分割法[14-16]和系统聚类法[17-19]等,然而,这些方法存在考虑指标单一(模糊统计法、分形法)、指标选取范围随意性较大(Fisher最优分割法)、难以判别最优分期范围(系统聚类法)等问题,在使用上仍存在一些局限性[20-21]。

集对分析法(Set Pair Analysis,SPA)由于原理简单,计算过程直观形象,使用方便等优势[22-23],许多研究者将其应用于水库汛期分期。在利用集对分析法进行汛期分期时,常见的集对分析分类方法有均值法、均值标准差法、距平百分率法等[24-26]。例如,谢飞等[24]利用均值分类分析了滦河潘家口水库的汛期分期;白桦等[21]使用距平百分率和水文特征值分类标准分析了赣江中上游流域的汛期和枯水期分期问题;孟彩侠等[25]采用均值标准差分类法探讨了长江上游流域的汛期分期;莫崇勋等[26]基于均值标准差分类法研究了澄碧河水库汛期分期。然而,将集对分析法用于汛期分期时,分期结果不仅与分类方法密切相关,还受分类方法的阈值选取影响。例如,均值标准差分类法的阈值选取存在明显的主观经验性。目前,大部分研究者在集对分析中仅使用一种分类方法,且在阈值选取时并未进行最优阈值分析,因此集对分析不同分类方法和不同阈值选取是否影响汛期分期结果不得而知。在上述背景下,本文基于集对分析法,通过综合比较均值标准差分类方法、距平百分率分类方法下的汛期分期结果,探讨不同分类方法对其影响程度和原因。同时,在此基础上,探究了均值标准差法、距平百分率法中k阈值和p阈值的最优取值,旨在揭示不同分类方法对汛期分期的影响,为今后将集对分析应用于水库汛期分期提供科学依据。

2 研究方法

2.1 集对分析法

集对分析法将研究对象看成一个确定性和不确定性系统,借助其相互依存、相互联系、相互渗透的属性[22],建立集对分析中的同、异、反联系度,从而揭示该系统的属性和特征。

假设有关联的两个集合A、B,即A=(a1,a2,…,am),B=(b1,b2,…,bm)。描述所构建集对H(A,B)间关系的联系度定义为[27]

(1)

式中:S为2个集合相同特性数;F为2个集合既不相同也不对立的特性数;P为2个集合相互对立的特性数;S/m、F/m和P/m分别为2个集合在具体问题下的同一度、差异度和对立度;I为差异度系数,在(-1,1)区间视不同情况取值,有时仅起差异标记作用;J为对立系数(恒等于-1),有时起对立标记作用。

简易表达式为三元联系度,可改写为

μ=a+bI+cJ

(2)

式中:a,b,c为联系度分量,分别称为集对H(A,B)的同一度、差异度和对立度,且满足归一化条件a+b+c=1。

如将三元联系度进一步拓展,可将式(2)的bI进一步拓展,得到多元联系度:

μA-B=a+b1I+b2I+…+bk-2Ik-2+cJ

(3)

式中:b1,b2,…bk-2代表差异度分量,即差异度的程度高低。

2.2 基于集对分析的水库汛期分期

(1) 指标集合的确定。根据流域特性,筛选出能反映汛期变化的影响因子,并考虑影响因子的可量化性,确定指标x1,x2,…,xj,其中j为指标数目,并对相关指标进行数据统计和分析。

(3) 标记归属区间(符号量化)。根据分类标准将落入该标准范围内的集合元素进行符号量化。分类标准可根据汛期的时长确定,如汛期历时长,若只将汛期划分为3期(K=2),期与期之间转换过于突然,可将分类标准数K=3。此时分类界限值有两个,定义界限值分别为sk,sj,当评价指标xj∈(0,sk)时为前后汛期,标记为集合B1=(1,1,…,1);当xj∈(sk,sj)为过渡期,标记为集合B2=(2,2,…,2);xj∈(sj,)时为主汛期,标记为集合B3=(3,3,…,3)。分类界限值sk,sj按照步骤(2)确定。

(4) 计算联系度。构建集对H=(Ai,Bd),计算集对H=(Ai,Bd)的联系度uAi-Bd。联系度计算式如下:

(4)

式中:S为集合Ai与Bd符号相同的个数(同一度);F为符号相差为1的个数(差异度);P是符号相差为2的个数(对立度)[28]。

(5) 确定分期结果。对I取值,根据前人研究结果,一般取0[24,26],由公式(4)求出联系数。根据分类判别准则:联系数越大,属于该类的可能性越大。比较μAi-B1,μAi-B2,μAi-B3的大小,确定集合Ai类别以及汛期分期结果。

(6) 分期结果的合理性检验。汛期分期结果是否最优需要经过合理性检验。本文使用陈璐和刘俐等[29-30]提出的基于自助法取样、相对频率、广义距离、模糊隶属度理论的汛期分期合理性检验方案。该方法采用非参数统计自助法对洪水样本进行抽样,然后计算不同汛期方案的洪水相对频率与置信区间的广义距离,最后运用模糊优属度函数对汛期的合理性进行检验。相对优属度等于1的分期方案为理想的最优方案,相对优属度等于0时的分期方案是设想的最差方案。该方法已在多个水库的汛期分期研究中得到应用[29-30]。汛期分期的合理性检验的详细介绍详见文献[30],此处不再赘述。

3 实例计算

3.1 七一水库分期计算

3.1.1研究区概况

七一水库位于江西省玉山县,坐落于信江上游的金沙溪中游,坝址以上控制流域面积324 km2,是一座以灌溉为主,兼有防洪、发电、供水等综合效益的大(2)型水库。水库所处流域属亚热带季风性气候,处赣东北暴雨中心边缘,在春夏季(3~7月)常有孟加拉海湾与南海的暖湿气流与自北南下的冷空气交汇从而形成的大量降雨,该阶段占全年降雨的65%;5~6月份降雨以亚热带锋面气旋雨为主,降雨历时长、雨区广、雨量大,该阶段占全年降雨的34%;7~9月份则以不稳定热气上升形成的雷阵雨为主,历时短、强度大。秋冬季(10月至次年2月)受来自内蒙古、贝加尔湖的南下寒流影响,气候寒冷干燥,降雨次数极少、强度小,该阶段仅仅占全年降雨的22%。因此流域降雨年内分配不均,3~9月占全年降雨的78%,其中4~6月降雨量最多,约占年降水的50%。近年来,江西省入汛时间较往年有所变化,以2019年为例,其比往年提前28 d入汛,即3月份提前进入汛期,为更好对水库所处流域进行全汛期周期分析,本文选取3~9月进行研究。

3.1.2数据资料

本文采用了七一水库站1979~2017年共39 a的逐日降雨资料和实测入库流量资料,以3月上旬至9月下旬作为样本时间段Ai(i=1,2,…,21)。通过对七一水库所处流域的分析,选取了4个特征指标(m=4):旬暴雨日数x1、旬平均雨量x2、旬多年平均流量x3、年最大洪峰出现次数x4,通过对基础数据进行统计分析(见表1),量化后得到各时段划分指标特征值。

表1 汛期划分指标统计值Tab.1 Indexes of floodperiod division

3.1.3分类标准的确定

考虑到汛期时间较长,为精细划分出流域的时程分配特点及更好进行水库汛限水位动态调整,设置分类标准数K=3,前后汛期可构建集合B1=(1,1,1,1),过渡期可构建集合B2=(2,2,2,2),主汛期构建集合B3=(3,3,3,3)。采用均值标准差法和距平百分率法确定分类标准,分别对应区间(0,sk),(sk,sj),(sj,),分类结果见表2。总体而言,两种方法划分的分类区间基本一致,比如旬暴雨日数x1的主汛期区间界限为[10.2,∞);过渡区间界限[8.3,10.2)。同时,不同k或p取值条件下旬暴雨日数的分类区间存在显著差异(见图1)。k或p取值越大,过渡期区间范围越宽,而前后汛期、主汛期的区间范围越窄。

表2 不同分类方法的分类区间Tab.2 Classification interval of different classification methods

图1 不同k或p取值条件下的分类区间(以旬暴雨日数为例)Fig.1 Classification interval under different K or P values(taking ten-day rainstorm days as an example)

3.1.4符号量化和联系度计算

根据2种不同分期标准将集合Ai=(1,2,…,21)中的元素进行符号量化处理。同时构建集对H=(Ai,Bd),计算集对H=(Ai,Bd)的联系度。将Ai与标准B1、B2、B3对应的符号元素进行对照,并统计符号相同的个数、符号相差为1的个数和符号相差为2的个数,其分别对应为S,F,P的值,根据公式(4)求出联系数,进而判别其所属分期。表3以均值标准差分类法(k=0.56~0.58)为例,结果显示A1~A3、A6(对应3月上旬至3月下旬、4月下旬)属于前汛期,A4,A5(4月上、中旬)、A7~A10(5月至6月上旬)属于前过渡期,A11,A12(对应6月中、下旬)属于主汛期,A13(7月上旬)属于后过渡期,A14~A21(对应7月中旬至9月下旬)属于后汛期。

表3 联系数及分期结果(均值标准差分类法,k=0.56~0.58)Tab.3 Contact number and stage results(meanstandard deviation classification,k=0.56~0.58)

3.2 分期结果

循环采用上述步骤即可得出均值标准差法(不同k取值)和距平百分率法(不同p取值)的汛期分期结果(见图2)。总体上,不同k(均值标准差法)和p(距平百分率法)取值条件下的汛期分期结果存在一定的差异。均值标准差法中k或距平百分率法p取值较小或较大时汛期划分结果与水库暴雨径流时程分配特征存在较大差异(见表4)。

图2 不同k或p取值条件下的汛期分期结果Fig.2 Results of flood season stages with different K or P values

表4 均值标准差和距平百分率法不同步长下的划分结果Tab.4 Division results of mean standard deviation method and anomaly percentage method under asynchronous length

均值标准差法中k取值较小(0.02~0.26)时,汛期划分大致为3月至4月上旬为前汛期,4月中旬至7月上旬为主汛期,7月中旬至9月下旬为后汛期,缺失后过渡期;当k取值较大(0.6~0.9)时,汛期划分结果大致为3~6月上旬为前过渡期,6月中、下旬为主汛期,7月上旬至7下旬为后过渡期,8月上旬至9月下旬为后汛期,缺失前汛期;在k取值(0.38~0.55)时,汛期划分结果大致为3月为前汛期,4月至5月下旬为前过渡期,6月上旬至6月下旬为主汛期,7月上旬为后过渡期,7月中旬至9月下旬为后汛期。

距平百分率法中p取值0.02~0.06时,汛期划分结果大致为3月至4月上旬为前汛期,4月中旬至7月上旬为主汛期,7月中旬至9月下旬为后汛期,缺失前、后过渡期;当p取值0.08~0.28时,汛期划分结果大致为3月至4月上旬为前汛期,4月中旬至5月下旬为前过渡期,6月上旬至7月上旬为主汛期,7月中旬至9月下旬为后汛期,缺失后过渡期;当p取值0.68~0.90时,划分缺乏前汛期;当p取值0.38~0.66时,汛期划分结果大致为3月至4月上旬为前汛期,4月中旬至6月上旬为汛前过渡期,6月中旬至6月下旬为主汛,7月上旬至7月下旬为汛后过渡期,8月上旬至9月下旬为后汛期。

3.3 分期结果合理性检验

根据集对分析划分的分期结果,选取分期数为5期时对应的分期方案,应用自助法取样、相对频率、广义距离、模糊数学的相对优属度等方法进行合理性检验。对表4中分期数为5期时的方案进行组合,得到8种待检验的分期方案。合理性检验的结果如下表5所示。检验结果显示,第7分期方案为最优分期结果(相对优属度最高0.90),对应的分期结果为:3月至4月上旬为前汛期,4月中旬至6月上旬为前过渡期,6月中下旬为主汛期,7月上旬为后过渡期,7月中旬至9月为后汛期。均值标准差法各分期方案的相对优属度约为0.87~0.89,其中方案3相对优属度最高(0.89),对应的分期方案3月为前汛期,4月至6月上旬为前过渡期,6月中下旬为主汛期,7月上旬为后过渡期,7月中旬至9月为后汛期。该方案与合理性检验的最优方案(方案7)最接近。距平百分率法各分期方案的相对优属度略低(0.72~0.78),其中方案8的相对优属度最大(0.78),对应的分期结果为:3月至4月上旬为前汛期,4月中旬至6月上旬为前过渡期,6月中下旬为主汛期,7月为后过渡期,8~9月为后汛期。该方案与合理性检验的最优方案(方案7)存在一定差异。

表5 汛期分期合理性检验结果Tab.5 Test results of flood season stage rationality

3.4 分期结果讨论

图3绘制了七一水库多个降雨和径流指标的时程分配。由图3可知:6月是降雨、径流最大的时期,尤其集中在6月中下旬。汛前的3~5月大致可分为2个阶段,3月降雨、径流量最小,宜为汛前期,4~5月降雨、径流量总体上比3月份的大,比6月份的小,因此可划分为汛前过渡期。汛后的7~9月存在明显的阶段特征,7月上旬的降雨、径流量明显比其他时期(7月中旬至9月)大,因此宜划分为汛后过渡期,而7月中旬至9月为后汛期。

图3 七一水库流域汛期的降雨径流时程分布Fig.3 Time history distribution of rainfall and runoff in flood season of Qiyi Reservoir Basin

为了进一步印证汛期分期结果的合理性,采用Fisher最优分割方法对汛期进行分期。分期结果显示分类数为5时,最优分割结果为3~4月上旬为前汛期,4月中旬至6月上旬为前过渡期,6月中下旬为主汛期,7月上旬为后过渡期,7月中旬至9月下旬为后汛期。

综合对比数理统计、Fisher分割法与集对分析法进行检验后的最优结果(见表6)可知,Fisher分割法与集对分析法检验后得到的最优方案一致。均值标准差的最优方案与最佳方案的优属度十分接近,而距平百分率的最优方案的优属度与最佳方案存在一定的差距。2种方法与数理统计法的结果略有差别,但与总体方案基本一致。从检验最优结果角度分析,各方案下均值标准差法的相对优属度整体均高于距平百分率,因此,就集对分析法进行分期来说,均值标准差法更适用于集对分析法。

表6 分期结果比较Tab.6 Comparison of staging results (月-日)

进一步分析k和p值的影响,发现k取值过小(小于0.36),则前后汛期、主汛期的区间范围过大,分期结果缺乏前、后汛过渡期;k取值过大(大于0.60),则前后汛期和主汛期的区间范围过小,导致汛期分期结果中缺乏前汛期。同理分析可知,p的取值小于0.36时,过渡期的区间范围较窄,最终导致分期结果中缺乏前、后汛过渡期;而p取值大于0.68,则前后汛期和主汛期的区间范围过小,导致汛期分期结果中前后汛过渡期较长,缺乏前汛期。因此,就各自方法的最优p和k而言:集对分析中均值标准差法的最优k宜为0.56~0.58,而集对分析中距平百分率法的最优p宜为0.42~0.44。

4 结 论

动态汛限水位调控是水库洪水资源利用的重要方式,而精确合理的汛期分期可以为动态汛限水位调控提供重要参考。集对分析是水库汛期分期的主要方法之一,集对分析中分类区间的确定直接影响符号量化过程和汛期分期结果。

(1) 在不同的k取值(均值标准差法)或p取值(距平百分率法)条件下,汛期分期结果呈现显著的差异,k或p取值越大,过渡期区间范围越宽,而前后汛期、主汛期的区间范围越窄;反之亦如此。综合对比数理统计、集对分析、Fisher最优分割以及合理性检验结果发现,适用于集对分析汛期分期的均值标准差法的最优k值宜为0.56~0.58,适用于集对分析的汛期分期的距平百分率法的最优p值宜为0.42~0.44。

(2) 通过汛期结果的合理性检验,可以筛选出最优方案。七一水库的最优分割结果为:3月至4月上旬为前汛期,4月中旬至6月上旬为前过渡期,6月中下旬为主汛期,7月上旬为后过渡期,7月中旬至9月下旬为后汛期。根据合理性检验分析,相对于距平百分率法,均值标准差法的最优分期方案更为合理。因此建议今后应用集对分析划分水库汛期时应该进行k和p取值筛选和分期结果比较分析。

猜你喜欢

距平百分率过渡期
飓风Edouard(2014)暖心结构的多资料对比分析
求百分率的实际问题(部级优课)
求百分率的实际问题(部级优课)
10%+10%为什么等于0.11
农业农村部延长宠物饲料标签转换过渡期6个月
盐改过渡期有效依法开展盐政执法监管工作的探讨
近40年阿里地区云量和气温的年际变化
甘肃省降水和冰雹天气气候分析
基于距平百分率的万源市气象干旱灰色预测