基于模糊聚类预报与序贯决策的水资源开发利用总量动态管理模式
2017-07-25严子奇桑学锋褚俊英
严子奇,王 浩,桑学锋,褚俊英,刘 扬
(中国水利水电科学研究院流域水循环模拟与调控国家重点实验室,北京 100038)
基于模糊聚类预报与序贯决策的水资源开发利用总量动态管理模式
严子奇,王 浩,桑学锋,褚俊英,刘 扬
(中国水利水电科学研究院流域水循环模拟与调控国家重点实验室,北京 100038)
针对水资源开发利用总量控制红线在不同来水频率年的适应性管理问题,在模糊聚类理论以及水文预报的基础上,结合不确定性动态系统优化决策方法,提出基于径流聚类预报与用水量复核双向约束的时程滚动修正的序贯决策方法。通过对建立月来水频率预报模型,结合实际用水量对逐月指标进行滚动修正,实现“预报-复核”双向约束下逐月用水总量控制指标的动态决策。通过在我国南方地区的应用表明,该方法可以实现逐月来水的预判并制定控制指标,实现逐月用水的弹性管理,具有很好的实用价值。
序贯决策;模糊聚类z;逐月用水指标;不同来水频率
1 研究背景
水资源开发利用总量控制红线是最严格水资源管理制度的重要组成,目前的水资源开发利用总量控制红线反映了在多年平均条件下对用水总量的约束,针对的是多年平均来水频率情景[1-4]。在目前实践当中,对于不同来水频率年份总量红线的执行和考核过程中,采取的主要措施是对用水总量控制红线根据当年实际的来水情况进行调整,用调整后的总量指标对当年的取用水量进行考核[5-9]。然而,从对人类取用水行为的约束性上来说,即使设定了不同来水频率下的年总量控制指标,如果没有预报作为支撑,则只能在年底开展用水总量考核,对当年实际发生的取用水过程约束性极为有限,红线的约束性大打折扣。因此,不同来水频率年份中水资源开发利用总量红线的适应性管理,以及用水总量控制指标核算研究,逐渐成为当前水资源管理中的研究热点,是实行最严格水资源管理制度的重要科技需求[10]。
已有不少研究提出水资源开发利用动态管理的基本框架应包含监控、预报、不同来水频率的用水指标、动态的管理策略等一系列理论和技术。笔者认为,稳定而精细的监控网络是实现动态管理的前提,可靠的预报是开展动态管理的重要技术手段,不同来水频率的总量控制指标是动态情境下的策略集合,可滚动修正的管理策略则是动态管理的落实途径。为了能够有效的提高用水总量控制红线在管理中的适应性,一方面,需要在更小的时间尺度(季、月)制定分行业的水资源开发利用总量控制指标,以逐月指标为例,要从月用水行为开展总量控制指标的确定,制定每个月份的指标,并在月末进行考核;一方面又要考虑到月用水过程决策的很多不确定性,如逐月来水过程的随机性,逐月用水情况的不确定性等。因此,对于月尺度用水总量的动态管理,既要开展逐月来水丰枯频率的预判,又要利用水资源配置的等方法获取更小时间尺度的总量控制初始指标,并引入序贯决策的动态管理模式将这两种技术有机结合,形成实时动态的总量控制管理策略。
所谓序贯决策(Sequential Decision),就是用于随机性或不确定性动态系统最优化的决策方法[11-12]。序贯决策的特点是:①所研究的系统是动态的,即系统所处的状态与时间有关,可周期(或连续)地对它观察;②决策是序贯地进行的,即每个时刻根据所观察到的状态和以前状态的记录,从一组可行方案中选用一个最优方案(即作最优决策),使当前状态的目标函数取最优值(极大或极小值);③系统下一步(或未来)可能出现的状态是随机的或不确定的。序贯决策的过程是:从初始状态开始,每个时刻做出最优决策后,接着观察下一步实际出现的状态,即收集新的信息,然后再做出新的最优决策,反复进行直至最后时段。目前,已有不少研究利用序贯决策解决复杂水资源系统的优化决策问题。马建琴等[13-14]建立了灌溉序贯多指标模糊决策理论,提出考虑时段指标变权重的井渠灌区灌溉方式选择的多指标模糊关系优选模型,为井渠灌区复杂系统灌溉方式的选择与联合调度的实施提供了一条有效的途径。朱承军等[15]针对梯级水电站自身入库径流随机性,采用序贯决策把梯级水电站的在电力市场中的交易过程描述为多时间尺度的动态决策,并构建梯级水电站在市场中交易的序贯决策模型,实现梯级水电站期望收益最大目标。
对于逐月取水总量控制指标来说,系统下一步(下一个月的用水指标)的状态是不确定性的,需要根据当月实际用水数据和对下个月的来水预报来确定。年内逐月取用水指标的确定是一种需要即时收集信息、即时做出决策的反复滚动决策过程,可以看作是典型的序贯决策过程。
为了能够将红线在不同来水频率年份进行适应性调整,以及在年内进行总量控制约束,本文将结合逐月来水频率预报模型,以不同来水频率的水资源配置方案为基础,考虑各月实际发生取水量,提出基于模糊聚类预报与用水盈余双控的用水总量逐月序贯决策方法,以实现红线在不同来水频率下的适应性动态管理,并在广西南宁市进行应用,以验证方法的可行性和适应性。
2 来水频率的模糊聚类预报
来水频率预报是水资源开发利用总量控制动态管理的重要基础,通过对未来时段来水频率的预判,确定未来时段所采取的取用水总量控制指标。模糊聚类预报就是对历史径流序列进行模糊聚类,找到不同典型来水年份的聚类中心,之后再根据实测序列与各聚类中心的相关性来判断未来时段的来水频率。
对于水文序列来说,通常属于基于目标的聚类,即聚类结果反映的是水文序列的丰、平、枯特征,而不是长系列数据挖掘中其他方面的属性。对于这种基于目标函数的聚类分析,本文采用目前理论最为完善、应用最为广泛的模糊C均值(FCM,Fuzzy C-means)类型算法[16-21]开展聚类计算。
2.1 C均值聚类算法C均值聚类算法的基础是误差平方和最小准则。设为n年的月评价流量样本集合,其中,xiRm×1(i=1,2,…,n)为第i年的月评价流量向量,m是所评价的月份数,首先需考虑第i年内的12个月,其次还要考虑动态管理中用于预报一月份来水频率所参考的上一年相邻历史月份数。设Ni是第i聚类Γi中的样本数目,xji为Γi中的样本,yi是Γi中样本的均值,即
其中,c为聚类数。Γi中各样本与均值yi间的误差平方和对所有类相加后为
J1度量了用c个聚类中心代表从各样本子集所产生的总的误差平方。对于不同的聚类,J1会不同。C均值聚类算法就是使J1极小的聚类结果。
2.2 模糊C均值聚类算法设第j个样本对于第i类的隶属度函数为μi(xj) ,用隶属度函数定义聚类误差函数:
其中,b>1是一个可控制聚类结果的模糊常数。在不同的隶属度定义方法下最小化式(3)的误差函数,就得到不同的模数聚类方法。模糊C均值方法要求一个样本对于各个聚类的隶属度之和为1,即
在条件式(4)下求式(3)的极小值,最优化的一阶必要条件为:
用迭代算法求解公式(5)和公式(6),算法步骤如下:
(1)设定聚类数目c和参数b;
(2)按照上一节的方法初始化各个聚类中心yi;
(3)重复下面的运算,直到各个样本的隶属度值稳定:
①用当前的聚类中心根据公式(5)计算隶属度函数;
②用当前的隶属度函数根据公式(6)计算各类的聚类中心。
当算法收敛时,就得到了各类的聚类中心和各个样本对于各类的隶属度值,从而完成了模糊聚类划分。
如图1所示的径流聚类中心,将会作为判断未来月份的径流所属的水文频率的依据。考虑到资料的可获取程度和计算量,为在不增加计算量的情况下获取较为可靠的径流预报结果,假设预报需要从上个年度的最后四个月开始,则聚类后的过程线时间尺度是从上一年度的9月至当年的12月,此时前文公式中m=16。
图1 径流模糊聚类示意图
2.3 基于相关性分析的月径流频率预报在径流聚类的基础上,采用逐月相关系数分析的方法,来确定所预报的月份,其径流所属的水文频率。其中,X是实测历史径流过程,Y是每一个径流聚类中心过程。对于本研究,由于是采用历史上的前4个月份对下一个月份进行预报,所以式(7)中的u=4。通过计算历史径流过程与各类聚类中心的相关系数,根据相关系数最大的聚类来确定预报月份所属的频率。
3 不同来水频率年的逐月用水总量控制指标库
不同来水频率的水资源开发利用总量控制指标是对红线指标进行动态化管理的重要基础。通常根据各地区水文气象特征及用水规律,会有“丰增枯减”、“丰减枯增”及其他多种“来水-需水”关系组合。因此,从年尺度上来说,需要根据当地实际水文节律、分行业需水预测及耗用水规律等多因素确定不同来水频率下的年度用水总量控制指标。
对于年内指标的分配,需考虑不同行业年内的用水规律。一般来讲,工业用水和生活用水年内过程较为平稳,农业用水量的年内分配则要根据种植作物的耗水规律以及区域水资源情况来确定。
在考虑上述的原则下,利用水资源配置模型通过需水分析、供水分析、长序列优化计算,确定不同来水频率年份下逐月用水量的配额。该配额将以逐月用水指标库(表1)的形式作为本文中序贯决策方法的重要组成。
表1 不同来水频率下逐月用水指标库示意表
目前,水资源配置方法已经较为成熟,面向不同目标的水资源配置模型都得到了较好的应用[22-23]。在实际应用中,需根据需要选取适合当地水循环特征和用水管理红线的配置模型。
4 水资源开发利用总量控制的序贯决策模式
针对前文所述逐月取水行为的实时收集信息、滚动决策的特征,本文提出水资源开发利用总量序贯决策管理模式,即是在序贯决策方法基础上,集合预报成果和不同来水频率指标:结合对历史来水序列进行“丰-平-枯”聚类划分,实现来水频率逐月预报(第2节),从不同来水频率用水指标库(第3节)中确定逐月用水指标,并利用逐月实际用水量对逐月指标进行滚动修正,实现“预报-复核”双向约束下逐月用水总量控制指标的动态决策过程。图2展示了如何结合径流聚类预报和水资源配置结果,建立水资源开发利用滚动修正的序贯决策,其基本决策过程如下:
第一步:对研究区历史来水系列进行“丰-平-枯”聚类划分,分别得到各来水频率的聚类中心(式6);
第二步:利用水资源配置模型,结合水资源综合规划、水量分配方案等规划资料,确定研究区不同来水频率年下各月用水总量控制指标库;
第三步:在当年1月初,通过历史回归分析,以上一年度年9月、10月、11月、12月径流资料为初始数据,根据其与四个聚类中心的相关系数(式7)判断当年1月份的来水频率;
第四步:根据1月份来水频率预测结果,在不同来水频率逐月总量指标库中,选取相应来水频率年份下1月份的用水指标,作为1月份用水预报指标;
第五步:在1月份结束后,根据1月份的实际来水情况,结合上一年度10、11、12月份,滚动预报2月份来水频率;
第六步:在不同来水频率逐月总量指标库中,选取相应来水频率年份下2月份的用水指标,作为2月份初始指标;
第七步:根据1月份实际用水量与1月份预报指标之间的差值,将盈余量顺延至2月份,并与2月初始指标相加,形成2月份的预报指标。
之后,以此类推,重复第五步和第七步,当每个月份结束后,确定下一个月份的总量控制预报指标,得到3月—12月的用水总量预报指标。1月份由于是起始预报月份,其初始指标=预报指标。
图2 序贯决策技术流程图
5 方法应用
本研究以广西南宁市2014年为例,采用序贯序贯决策方法对当年逐月用水指标进行滚动确定,分析本方法在广西北部湾经济区的适用性。考虑到来水过程对南宁市代表性,本研究选取位于南宁市境内邕江干流的南宁站(图3)进行径流聚类预报。
利用南宁站1956—2012年径流观测资料,采用R统计语言编程实现模糊C均值聚类算法,并对南宁站径流序列进行聚类。将历史长系列逐月径流过程划分为4类,分别为丰水年、平水年、偏枯年及特枯年份的径流过程。算法收敛后,得到如下表的4个聚类中心(表2)。
之后,利用公式(7)判定2014年实测径流与各聚类中心的相关关系(图4),得到当年内各月份所属的来水频率(表3),作为当月用水指标选择的依据。
为了获取不同来水频率下逐月用水指标库,本文采用面向用户的分布式水资源合理配置模型(WAS)[24]对南宁市不同来水频率下逐月用水量进行分配。计算得到现状年不同来水频率的逐月用水指标(表4),用于确定现状用水条件下特定来水频率年份的逐月用水指标。考虑取水总量控制红线是一种约束性控制指标,所以在丰水年份,水资源充足的情况下,不在单独设定丰水年的用水总量控制指标,而统一采用平水年的用水总量控制指标作为约束。
图3 研究区示意图
表2 不同来水频率下南宁站径流聚类中心 (单位:亿m3)
图4 南宁市2014实测径流过程与聚类中心
在径流聚类预报和用水指标配置结果基础上,采用序贯决策的方式,按照计算流程(图2),以2013年9月、10月、11月、12月径流资料为初始数据,逐月确定2014年月用水指标。
可以看出,至2014年12月结束,随着2014年逐月实测径流过程的产生、逐月实际用水量的产生,根据序贯决策模式,在每个月末根据径流聚类预报和水资源配置得到的用水指标库,确定下个月份的月用水总量控制指标(表5)。所有确定的指标均是逐月径流过程预测与实际取用水过程的综合反映。
表3 南宁市2014实测径流过程与聚类中心
表4 南宁市不同来水频率下用水总量指标库 (单位:亿m3)
表5 南宁市2014年逐月频率预报、初始指标、指标结果 (单位:亿m3)
从结果(图5)中可以看出,2014年随着时间的推进,南宁市逐月的初始指标随着来水预报序贯产生,实际用水量也在随着人类的用水行为逐月发生,于此同时,基于这两个要素的月用水总量预报指标也在逐月产生,并且与初始指标相比发生了适应性调整。图中,7月之前实际用水量总体小于初始指标,所以7月之前各月的预报指标不断与盈余量相加而增加;于是7月之后虽然用水量较大并超过初始指标,但由于有不断根据前期盈余修正的预报指标,7月之后用水量较大的月份取用水量也在控制指标范围内,从而也保障了当年用水量总体上处于取水总量控制指标的范围内。
6 结语
利用基于径流聚类预报与实际用水复核双向约束的时程滚动修正的序贯决策方法,可以根据历史径流观测资料,以及实际用水量的监测数据,滚动确定年内逐月的取用水总量控制指标,径流聚类预报可以在一定可信度上对当月的来水频率做出预判,是实现不同来水频率下用水总量控制的基础,水资源配置技术则可以对典型频率年进行指标分解,形成不同来水频率下月的指标库,将其与预报相结合,则提升了红线指标的适应性,使其不止局限于年末的指标考核,而是在每个月实时用水行为的约束中发挥了作用。
图5 南宁市2014年逐月实际用水量、初始指标、预报指标过程
年内逐月动态指标的滚动确定,一方面需要有历史径流资料作为基础,另一方面,当月实际用水量的测算也是关键,本研究中所采用的是统计得到的实际用水量,实际操作中,还需要完善用水监控体系,形成水资源开发利用全过程的监测系统,才能在每个月用水发生后,第一时间核算出实际用水量,来进行逐月的用水考核,并进行下一个月份的指标计算。
逐月用水过程的红线约束机制,一方面需要文中所说的指标确定方法,另一方面还需要将取水许可与计划用水管理制度结合起来,建立逐月考核的水管理机制,对于超计划用水的行为,一方面要通过指标计算压减其后续取水量,另一方面也要采用管理手段对其进行适当处罚,以对用水行为进行约束。
根据本文方法确定的用水指标,最终全年的用水总量控制指标不一定等于多年平均年份下的用水总量控制红线,而是会受到逐月来水频率的影响。但这并不代表弱化了用水总量控制红线的约束性,需要在区域层面研究建立多年复核的机制,即其中B0是区域用水总量控制红线,Bi是根据序贯决策滚动修正的方法,根据来水频率预报所确定的第i年用水总量控制初始指标。其含义就是对于多年用水过程来说,尽管各个年份的控制指标存在差异,但在多年平均的情况下,序贯决策得到的各年度指标的均值仍然需要满足用水总量控制红线的约束。
[1] 国务院办公厅.国务院办公厅关于印发实行最严格水资源管理制度考核办法的通知[Z].2013.
[2] 陈进,朱延龙.长江流域用水总量控制探讨[J].中国水利,2011(5):42-44.
[3] 汪党献,郦建强,刘金华.用水总量控制指标制定与制度建设[J].中国水利,2012(7):12-14.
[4] 汪党献,王建生,王晶.水资源合理开发和用水总量控制[J].中国水利,2011(23):59-63.
[5] 刘志仁.最严格水资源管理制度在西北内陆河流域的践行研究——水资源管理责任和考核制度的视角[J].西安交通大学学报:社会科学版,2013,33(5):50-61.
[6] 陈远鸣.上海:建设水资源管理系统支撑最严格水资源管理制度实施与考核[J].中国水利,2014(15):12-25
[7] 褚俊英,桑学锋,严子奇,等.水资源开发利用总量控制的理论、模式与路径探索[J].节水灌溉,2016(6):85-89.
[8] 刘扬,褚俊英,桑学锋,等.广西北部湾经济区用水总量控制指标体系构建研究[J].中国水利,2015,15:37-40.
[ 9] 姚俊强,刘志辉,郑江华,等.内陆干旱区最严格水资源管理关键技术体系研究[J].中国水利,2014(17):5-7.
[10] 王浩.实行最严格水资源管理制度关键技术支撑探析[J].中国水利,2011(6):28-32.
[11] 刘国全,冯尚友.一类序贯决策问题的线性动态规划(LDP)算法[J].水电能源科学,1991,9(2):75-82.
[12] 王玉民,周立华,张荣.序贯决策方法的应用[J].技术经济,1996(11):57-59.
[13] 马建琴,陈守煜.渠井灌区配水序贯多指标模糊决策模型与方法[J].水电能源科学,2004,22(2):16-29.
[14] 马建琴.水资源序贯多指标系统动态权重模糊决策模型及其应用[J].内蒙古农业大学学报,2005,26(1):69-74.
[15] 朱承军,周建中.电力市场中梯级水电站组合交易策略研究[J].华东电力,2006,34(7):10-14.
[16] DUNN J C.Well-separated clusters and the optimal fuzzy Partitions[J].Journal ofCybernetics,1974,4(l):95-104.
[17] RUSPINIH E.A graph theoretic analysis ofpattern classification via Tamura’s fuzzy relation[J].IEEE Trans SMC,1974,4(3):310.
[18] BEZDEK JC.Pattem Recognition with Fuzzy Objective Function Algorithms[M].NewYork:Plenum Press,1981.
[19] 陈守煜,李敏.基于可变集聚类理论的年径流聚类新方法[J].人民长江,2012,43(5):8-12.
[20] 邓红霞,汤成友,李存军,等.基于模糊模式识别的径流特性分析[J].四川大学学报:工程科学版,2006,38(3):29-33.
[21] 张军良,马光文,张志刚.模糊聚类法在径流丰枯特性分析中的应用[J].人民长江,2009,40(7):11-13.
[22] 王浩,游进军.水资源合理配置研究历程与进展[J].水利学报,2008,39(10):1168-1175.
[23] 游进军,甘泓,王浩.水资源配置模型研究现状与展望[J].水资源与水工程学报,2005,16(3):1-5.
[24] 王建华,赵勇,桑学锋,等.苦咸水高含沙水利用与能源基地水资源配置关键技术及示范[M].北京:中国水利水电出版社,2014.
Dynamical management for total amount control of water resources utilization based on fuzzy cluster analysis and sequential decision
YAN Ziqi,WANG Hao,SANG Xuefeng,CHU Junying,LIU Yang
(State Key Laboratory ofSimulation and Regulation ofWaterCycle in RiverBasin,China InstituteofWaterResourcesand HydropowerResearch,Beijing 100038,China)
In order to improve the adaptive management for total amount control red line of water resources utilization in different water frequency year,this paper proposes a rolling modified Sequential Decision method which combines the clustering forecast of runoff with the water use constraint.The new method is based on the fuzzy clustering theory,hydrological forecasting and optimization in dynamic decision-making system. By establishing the month runoff frequency forecast model while at the same time considering the actual water consumption,it can make dynamic decision for monthly water quota under“forecast-review”bidirectional constraints.The result shows that the method can be used to make pre-judgment of monthly inflow,set the monthly water use quota,and realize the flexible management for monthly water use.
Sequential Decision;Fuzzy Cluster Analysis;monthly water use quota;different water frequencies
TV213.4
A
10.13244/j.cnki.jiwhr.2017.03.001
1672-3031(2017)03-0161-09
(责任编辑:祁 伟)
2017-04-18
国家自然科学基金(51309248);广西水利科技项目(201313,201506);中国水科院科研专项(ZJ1224);云南水利科技项目(YSZD-2014-001,YNWRM-2012-01);江西水利科技项目(KT201501,KT201508,KT201411)
严子奇(1983-),男,河北深州人,高级工程师,主要从事水文及水资源领域研究。E-mail:yanzq@iwhr.com