基于多目标文化鲸鱼算法的水库防洪调度

2022-12-05王万良董建杭赵燕伟张仁贡李国庆胡明志

计算机集成制造系统 2022年11期

王万良，董建杭，王铮，赵燕伟，张仁贡，李国庆，胡明志

(1.浙江工业大学计算机科学与技术学院, 浙江杭州 310000; 2.浙大城市学院计算机与计算科学学院，浙江杭州 310015；3.浙大城市学院机械工程系，浙江杭州 310015；4.浙江禹贡信息科技有限公司，浙江杭州 310000)

0 引言

洪水是人类一直面对的最严重、最频繁、最广泛的自然灾害之一，对人类的生命财产构成了严重的威胁，尤其是在中国[1]。近年来，受全球气候变化影响，洪水发生得越来越频繁和极端，而我国60%～80%的降雨集中在汛期，加重了我国受洪水影响的程度[2]。如长江流域1954年、1998年2次特大洪水[3]。此外，还有大小沿海洪灾，1989年～2014年，我国由于沿海洪灾造成的直接经济损失超过770亿美元[4-5]。

水库在汛期洪水管理中起重要作用，它有助于减小洪峰，减少洪水破坏，储备洪水，是调控洪水的重要防洪工程措施[6-7]，因此水库防洪调度问题(Reservoir Flood Control Operation，RFCO)一直以来都是研究的热门领域。RFCO问题是复杂的多目标优化问题，存在众多相互依存的决策变量，涉及相互冲突的优化目标，RFCO问题优化目标的冲突主要集中在上游坝体安全和下游堤防安全的冲突上[8]，要保证上游坝体安全，则要求水库尽可能多地泄洪，保证水位维持在安全线，而要保证下游河道安全，减少分洪区压力则要求水库尽可能储水，以减少下游的风险。显然，在一次防洪调度决策中，要同时兼顾二者，决策者需要一种“平衡”的解决方案。为了求解上述问题，早期学者多采用诸如线性规划(Linear Programming，LP)[9]，动态规划(Dynamic Programming，DP)[10-11]的方法进行求解，这些方法一般采用对各个目标进行加权，或者将次要目标转化为约束的方法进行求解，加权法需要一些人为的先验经验，而约束法得到的一般不是真实的帕累托前沿，在实际应用中受到一定的限制。受生物智能启发，计算智能迅速发展，一些启发式的智能优化算法为防洪调度的决策提供了一些新思路，诸如遗传算法(Genetic Algorithm，GA)之类的智能优化算法逐渐被应用于RFCO问题[12-13]，随后又有学者陆续将蚁群算法(Ant Colony Optimization，ACO)，差分进化(Differential Evolution，DE)算法和粒子群算法(Particle Swarm Optimization，PSO)等应用于RFCO[14-15]。

RFCO问题是多目标优化问题，各个目标相互冲突，因此不可能找到单个优化方案同时优化各个优化目标。相反，RFCO问题的解决方案应为各个目标的良好权衡，这种良好权衡的集合称为帕累托最优解(PS)，帕累托最优解中任一目标都不能在不损害其他目标的情况下进一步改进，帕累托最优解在目标空间的图像称为帕累托前沿(PF)。上述针对RFCO的单目标优化方法都有一个共同的缺点，即对RFCO的PF的形状或者连续性比较敏感。而多目标优化方法，可以在一次运算中得到一组优化方案，为决策者提供更多的信息。

近年来，各种多目标进化算法相继提出，这些多目标算法主要集中在对启发式单目标算法的改进。DEB[16]等通过引入快速非支配排序、拥挤距离排序以及精英保留策略提出的基于帕累托支配的多目标优化算法NSGA-Ⅱ，是对单目标优化算法GA的改进，NSGA-Ⅱ目前是最流行的多目标优化算法之一。PSO是最流行的模仿鸟类社会行为的群智能算法，该算法优秀的收敛速度促使众多学者尝试将其扩展用以解决多目标优化问题(Multiple-objective Optimization Problems,MOPs)，比如COELLO等[17]基于改进PSO提出的多目标粒子群算法(Multi-objective Particle Swarm Optimization，MOPSO)。DE由于其优秀的收敛速度且易于操作，也被多次改进，且应用于RFCO问题，如覃晖等[18]将外部档案引入多目标差分进化算法，并加入自适应柯西变异的防止算法早熟收敛的机制，成功应用于三峡水利枢纽的防洪调度问题。此外，改进粒子群算法、改进蚁群算法等改进的多目标群智能算法均为RFCO问题提供了有效的解决方案[19-20]。

鲸鱼优化算法(Whale Optimization Algorith,WOA)是学者MIRJALILI等[21]受座头鲸捕食行为启发提出的一种群智能算法,并被证明在29个数学优化问题和6个结构设计问题上的有效性和竞争力。从被提出以来，WOA被成功应用于许多研究和应用领域。与众多优化算法相比，WOA可以以更小的代价更快的速度收敛于最优结果。近年来，一些学者开始着手于将WOA进行拓展，用以处理MOPs,如NSMOWOA(new non-dominated sorting based on multi-objective WOA)，采用了一种全新的非支配排序，根据适应度的值来选择最优解，并用标准的WOA算子来更新鲸鱼的位置[22]。GOT等[23]提出一种引导种群档案的多目标鲸鱼算法(Guided Population Archive WOA,GPAWOA)，引入了外部档案并采用了一种新的引导者选择策略。

本文提出一种针对水库防洪调度的改进鲸鱼算法，多目标文化鲸鱼算法(Multi-objective Culture WOA,MOCWOA)。WOA虽然有收敛速度快且操作简单的优点，但是也有容易陷入局部最优的缺点，且在处理MOPs上仍有较大的改进空间。本文将WOA与文化算法(Cultural Algorithm,CA)相结合，文化算法是REYNOLDS等[24]基于自然界文化加速生物进化的原理提出的一种双层进化模型。该双层模型包含种群空间和信度空间，以及两个空间进行协调的通信协议，种群空间实现种群的进化，信度空间实现知识的更新。这种双层进化机制能更充分地利用进化信息，提高进化效率。文化框架最早与遗传算法相结合[25],后续学者将文化框架与粒子群算法和差分进化算法等基于种群的算法相结合[26-27]，并证明了文化算法在提高基于种群的进化算法效率上具有一定普适性。本文提出的MOCWOA以CA为框架，在种群空间采用WOA，在信度空间对框架中原有的 3 种知识结构进行改进，使其能够有效引导鲸鱼种群的搜索，并以此来提高算法得到的解的多样性和收敛精度。

1 水库防洪调度问题

本章主要介绍MOPs的相关模型，以及水库防洪调度问题相关背景和模型。

1.1 多目标优化问题模型

一个具有n维决策向量和m个目标的多目标优化问题(MOPs)可以通过以下数学模型表示

minF(x)={f1(x),f2(x),…,fm(x)};

s.t.

x∈Ω。

(1)

其中Ω为决策空间,x={x1,x2,…,xn}∈Ω是n维决策向量。F(x)由m个目标f1(x),f2(x),…,fm(x)组成。

上文已经提到过，在MOPs问题中没有单一的最优解，取而代之的是一组良好权衡的集合，该集合称为帕累托最优解集(PS)，帕累托最优解集在目标空间的图像称为帕累托前沿(PF)，下面给出帕累托最优解的相关数学定义：

定义1帕累托支配。解u支配解v(记uv)，当且仅当：

(2)

定义2帕累托最优解。在可行搜索空间内，给定解u不受其他任何解支配，则称定解u为帕累托最优解，也称非支配解：

(3)

定义3帕累托最优解集。所有帕累托最优解的集合称为帕累托最优解集(PS)，定义为：

(4)

定义4帕累托前沿。帕累托最优解集在目标空间的投影称为帕累托前沿(PF)，定义为：

PF={F(x)|x∈PS}。

(5)

1.2 双目标水库防洪调度模型

在处理防洪调度问题的过程中，决策者需要考虑的防洪目标一般有3类[28]：水库坝体自身安全要求、库区淹没损失和下游淹没损失。前两类包含了上游坝体安全和上游淹没损失等与上游水库蓄洪量相关的防洪要求，这些防洪要求一般由防洪过程中的上游最高水位、汛期末水库水位和上游高水位历时表征；而下游淹没损失则一般包括下游堤防、下游淹没损失以分洪区流量等多方面的防洪目标，一般以防洪期间最大下泄流量和分洪区淹没损失表征。

双目标优化问题是多目标优化问题中的一个特例，考虑到在处理防洪调度问题过程中，决策者主要要解决的是上游防洪目标和下游防洪目标两个相互冲突的目标，本文将水库防洪调度模型建立为双目标优化问题模型，并用提出的多目标文化鲸鱼算法来解决该双目标水库调度问题[29]。

在该双目标水库防洪调度模型中，上游的防洪目标以防洪调度过程中水库坝前最高水位表示：

f1(Q)=max(Zt)，t=1,2,…,T。

(6)

式中：Zt表示第t时段的水库坝前水位，Q=(Q1,Q2,…,QT)为决策变量，Qt,t=1,2,…,T为t时段的决策者控制的水库下泄流量，影响Zt的主要因素为入库流量I和下泄流量Q。

下游的防洪目标以防洪调度过程中最大下泄流量表示为：

f2(Q)=max(Qt)，t=1,2,…,T。

(7)

约束条件为以下3项：

(1)水库水位的上下限约束：Zmin≤Zt≤Zmax。在调度过程中，为保证水库坝体的安全，各个调度期的水位Zt必须介于水库允许的最高水位Zmax和最低水位Zmin之间，若在整个调度期中出现水位高于水库工程信息中规定的最高水位的情况，则可能会造成严重的后果[30]。

(2)最大下泄流量约束：0≤Qt≤Qmax。其中Qmax表示下游能承受的最大下泄流量，该约束表示调度期内各个时段的下泄流量不得高于下游最大能承载的下泄流量。

(3)水量平衡方程[31]：Vt=Vt-1+It-Qt。水量平衡方程表示库容和入库流量、出库流量之间的关系，式中：Vt和Vt-1分别表示调度期t和调度期t-1时的库容，It和Qt分别表示调度期t的入库流量和下泄流量。

根据上文所述，本文所提出的多目标文化鲸鱼算法主要针对以下泄流量为决策变量，并满足水库防洪调度过程中水库最高水位和下游最大下泄流量2个目标要求的RFCO问题，该RFCO问题模型表示如下：

(8)

上述模型考虑了防洪调度过程中坝前最高水位f1和枢纽最大下泄流量f2两方面的防洪目标。其中：f1表示水库上游的防洪要求，它需要水库尽可能多地泄洪以保证坝体的安全；f2表示下游地区的防洪要求，它需要水库尽可能的储水以防止下游成灾，两个目标相互冲突；Q=(Q1,Q2,…,QT)为决策变量；Qt(t=1,2,…,T)为t时段的下泄流量；T为调度时段总数；Zt为t时段的水库水位；Zmax和Zmin分别表示水库允许的最低水位和最高水位；Qmax为最大允许下泄流量，表示下游河道的最大承载能力；Vt为t时段的水库库容；It为t时段的入库流量。

该RFCO模型的3个约束分别为：约束(1)水库水位Zt(t=1,2,…,T)必须是介于Zmax和Zmin之间的值；约束(2)下泄流量Qt(t=1,2,…,T)必须不得大于下游承载能力Qmax的非负数；约束(3)库容平衡方程，利用库容平衡方程，根据t时段的进出水量，计算t时段的库容。

2 多目标优化算法

本章主要介绍WOA的工作流程和文化算法框架。

2.1 鲸鱼优化算法

鲸鱼在捕食过程中体现出一种独特的社会行为，这种行为使其捕食更高效，澳大利亚学者MIRJALILI等[21]受这种行为启发，开发了一种新的基于群体的元启发式算法——鲸鱼优化算法。该算法模拟座头鲸气泡网狩猎策略(bubble-net attacking method)，相比一些其他优化算法，WOA操作更简单，且收敛速度更快。WOA共设计了2种方法——缩圈包围(shrinking encircling)和螺旋更新(spiraling updating)对座头鲸独特的气泡网狩猎策略进行建模，除此之外，座头鲸还会随机搜寻猎物(searching for prey)，下面将简单介绍WOA的数学模型。

2.1.1 包围捕食与搜寻猎物

座头鲸能够识别猎物的位置并将其包围。由于真实的最优解在目标空间的位置不是先验的，WOA假定当前种群的最优解为猎物所在位置，用X*表示，在X*确定之后，其他个体以以下方式运动达到向X*运动的效果：

D=|C·X*-X(t)|，

(9)

X(t+1)=X*-A·D，

(10)

A=2α·r1-α，

(11)

C=2·r2。

(12)

其中：X*为当前的最优解，即猎物所在，t为当前迭代代数，α为一个从2到0线性随迭代代数递减的系数，r1和r2为[0,1]间的随机向量。

WOA除了模拟座头鲸群向猎物靠近的行为之外，还模拟了座头鲸群搜寻猎物位置的行为，通过以下公式表示：

D=|C·Xrand-X(t)|，

(13)

X(t+1)=Xrand-A·D。

(14)

其中Xrand是随机选择的当前种群中的个体，在该运动方式下，座头鲸会根据彼此的位置进行随机搜索。

WOA通过|A|的数值大小来判断鲸鱼群进行缩圈包围或搜寻猎物，当|A|<1时，种群进行缩圈包围，当|A|≥1时，种群进行搜寻猎物。

2.1.2 气泡网狩猎策略

WOA设计了两种运动机制来模拟座头鲸群的气泡网狩猎策略。第一种是通过线性降低式(11)中α的值来实现的缩圈包围机制；另一种是螺旋更新机制，其数学建模如下：

B=|X*-X(t)|，

(15)

X(t+1)=X*+B·ebk·cos(2π·k)。

(16)

其中：b为一个用以控制对数螺旋线形状的常数，k为[-1,1]间的随机数。

值得注意的是，缩圈包围和螺旋更新在种群的运动过程中同时存在，通过一个随机产生的[0,1]间的数p来控制：

(17)

2.2 文化算法框架

前文已经提到过，文化算法是一种双层进化模型，由种群空间和信度空间构成，并通过特定的通信协议协调种群空间和信度空间的相互影响。

隐含在进化过程中的各类信息以知识结构的形式存储在信度空间中，用以指导种群的进化。种群空间则用于实现基于种群的进化算法，它可以实现群智能算法的各种算子操作，对个体进行评价，并使种群进化，同时种群空间需要将进化过程中隐含的有利于进化的信息和优良个体样本提供给信度空间。信度空间通过接受函数接受种群空间提供的优秀个体样本以及各类隐含信息，以知识结构的形式加以概括、描述和储存。同时通过影响函数影响种群空间进化，提高种群空间的进化效率，种群空间和信度空间相互影响的整个过程如图1所示。

信度空间的核心在于知识如何描述和更新。信度空间的知识结构一般被划分为5类：状况知识、规范知识、拓扑知识、领域知识和历史知识。下面将详细介绍信度空间知识结构及其如何影响种群空间。

3 多目标文化鲸鱼算法

本文所提的多目标文化鲸鱼算法是在文化算法的框架下对鲸鱼算法的改进，它基于帕累托支配，使用文化算法框架中的信度空间存储进化过程中发现的知识，以帮助种群收敛。在迭代过程中，随着非支配解的数量迅速增加，信度空间的大小也会增加，在一定程度上增加了算法的计算复杂度。为避免该问题，采用一种截断方法保证信度空间的大小不超过一定的阈值。同时，为了保证算法迅速收敛并保证前沿多样性，选择合适的领导个体(X*)至关重要，设计算法时，本文考虑了两个重要的策略：①采用一种有效的信度空间更新策略，以提高所获得前沿的收敛性和多样性；②采用一种有效的领导者选择策略。下面介绍信度空间的知识结构、信度空间的更新策略以及信度空间对种群进化过程的影响。

3.1 信度空间知识结构

3.1.1 状况知识

状况知识是CHUNG[32]于1997年在解决静态环境实值函数优化问题时提出的，用于记录进化过程中的较优个体。可以理解为状况知识存储着进化过程中发现的精英解，这与很多优化算法使用的外部档案或外部种群类似。一般来说，状况知识存储的优秀个体数量都会有阈值，即状况知识内存大小为Smax,状况知识的结构描述为：

〈E1,E2,…,Es〉。

(18)

式中Ei(i=1,2,…,s)表示第i个较优个体，在MOCWOA中本文采用以下方法更新状况知识：创建一个集合，在算法每次迭代结束时，将现有状况知识中存储个体和迭代进化之后的种群加入该集合中，根据帕累托支配原则确定集合中所有非支配解，将其中的非支配解作为新的状况知识，同时清空集合内存。当状况知识的内存超过阈值Smax时，对状况知识进行截断操作：

(1)计算状况知识中各个个体的拥挤距离；

(2)根据拥挤距离对个体进行排序；

(3)删去状况知识中拥挤距离较小的个体使状况知识的内存等于Smax。

拥挤距离排序策略是一种能有效保证种群多样性的方法，在MOPs中被广泛采用，通过计算一个特定解到相邻解的空间距离来表示这个解的密度，在目标空间具有最大和最小目标值的边界上的解被定义为具有∞的拥挤距离。

3.1.2 规范知识

规范用于描述问题的可行解空间。针对具有n维变量的优化问题，规范知识结构描述为

〈V1,V2,…,Vn〉。

(19)

式中：Vi=[(li,ui),(Li,Ui)](i≤n),ui和ui分别表示第i维变量的上限和下限；Ui和Li分别表示对应于上下限的适应度。这种知识结构可以提高种群的搜索效率，主要表现在使搜索空间保持在优良个体被发现的搜索范围内。鲸鱼算子操作可能会导致新的向量超出变量的边界，大多数处理这种情况的最初方法是使它们等于边界。本文用规范知识结构来代替原来的变量边界。由于规范知识结构中的区间比原始变量边界更强，这些区间是发现优良个体的空间，在这些空间中搜索可以提高算法的收敛速度。

规范知识的更新基于状况知识，当状况知识更新之后，将状况知识中每一维的最小值和最大值作为新的区间来更新规范知识。

3.1.3 历史知识

历史知识最早是针对动态优化问题提出的，用于记录进化过程中发生的重要事件[31]。本文引入历史知识主要用于避免算法早熟收敛。进化算法早熟收敛的根本原因在于种群的多样性随着进化过程急剧下降。本文将种群的多样性信息以式(20)的形式存储：

〈D1,D2,…,Dn〉。

(20)

式中Di(i≤n)表示当前种群第i维的多样性，

(21)

式中Qi,max和Qi,min分别表示种群中第i维的最大值和最小值，当式(21)中分母为0时，Di=1。

若Di<ε(本文中ε=0.1)对种群中的第i维进行以下操作：

Qi=Qi·(1+η·C(0,1))。

(22)

式中：η为变异比例系数，η=0.5;C(0，1)为服从(0，1)柯西分布的随机变量。

历史知识的更新主要发生在每次迭代完成后，根据新种群更新历史知识，若每代都计算历史知识，将导致算法的运算速度缓慢，本文选取每迭代10次进行一次历史知识更新。

3.2 领导个体选择策略

领导个体即前文所提的X*，是引导种群走向更逼近帕累托前沿和更良好分布的关键，在原始的WOA算法中，仅需选择种群中适应度最高的个体作为X*，但对于多目标问题而言，若简单地选择单个个体作为X*,将导致解在目标空间的分布在X*附近集结，种群的多样性被破坏。

本文采用以下领导个体选择策略：

(1)计算状况知识中个体的拥挤距离；

(2)将状况知识中个体按拥挤距离降序排序；

(3)将状况知识中前Smax×10%个体作为领导个体候选部分；

(4)每个个体进行更新时，随机从候选部分选择一个个体作为领导个体(X*)。

实际上，在状况知识更新时，已经对状况知识中的个体进行过拥挤距离排序，因此在选择领导个体时只需进行上述的第(3)和第(4)步。

3.3 多目标鲸鱼算法流程

MOCWOA算法流程如图2所示，从随机生成种群中个体开始，随后根据式(17)计算种群中每个个体的适应度，根据非支配排序以及拥挤距离排序更新状况知识以及状况知识候选部分。根据状况知识更新规范知识。在完成以上知识结构的准备之后，算法进入主循环。更新随机数p，若p<0.5，则通过式(9)和式(10)更新变量A、C，若|A|>1,则通过式(12)和式(13)对种群中的每个个体进行更新，其中Xrand是从当前种群中随机选择的个体；如果|A|≤1，则通过式(9)和式(10)更新种群中的每个个体，其中X*是从状况知识候选部分随机挑选的个体。若p≥0.5，则通过式(15)和式(16)更新种群，与上述相同，在更新每个个体时，随机从状况知识候选部分选择X*。以上主要是种群空间的更新方式，在完成种群空间的更新后，若当前迭代次数为10的倍数，则更新历史知识，随后使用种群空间的种群更新信度空间状况知识结构(若超出最大存储量，则进行截断操作)和规范知识结构，进入下一代循环，直至达到跳出循环条件，输出状况知识作为最终结果。

4 实验研究

本文各实验均在64-bit Windows 10的MATLAB2018b编译环境下运行，测试实验在同一台计算机上进行：Intel Core i7-4900 CPU @3.60 GHZ 12.0 GB RAM。

4.1 标准测试集和性能指标

为证明MOCWOA的有效性，本文选择典型的广泛使用的测试函数——专门用于测试优化算法在双目标优化问题上性能的ZDT标准测试函数来测试算法。

一般来说，多目标优化有2个目标：①让算法得到的帕累托前沿尽可能接近真实的帕累托前沿，即收敛性；②找到尽可能多的非支配解，即多样性。本文引用以下指标来度量各个多目标优化算法得到帕累托前沿的收敛性和多样性

(1)IGD(Inverted Generational Distance)

IGD以真实的帕累托前沿作为参考，并计算帕累托前沿中每个参考点到最近的非支配解的距离：

(23)

其中：n表示真实帕累托前沿参考点的数量，di表示真实帕累托前沿与优化算法得到的最近的解的欧氏距离。IGD指标可以用于评价算法得到的近似前沿的收敛性。

(2)Sp(Spacing)

为了定量比较算法所得结果的多样性，引用Sp指标来评估算法得到的近似前沿的均匀分布程度，Sp指标定义为：

(24)

式中：

(25)

(3)HV(Hyper Volume)

HV指标表示算法获得的非支配解集与真实帕累托前沿参考点围成的目标空间中的区域体积，可以评价算法的综合性能，即同时评价收敛性和多样性：

(26)

式中：δ表示Lebesgue测度，用来测量体积；|S|表示非支配解集的数目；vi表示参照点与解集中第i个解构成的超体积。

上述3个指标中，IGD和SP的值越小表示算法的性能越好，而HV的值越大表示算法的性能越好。

4.2 信度空间知识结构对算法的影响

4.2.1 状况知识结构以及候选部分选择对算法效率的影响

在算法不引入状况知识的情况下，每次进化结束之后，将子种群和父种群放在一个集合中，通过非支配排序的方式，选择排序较前的N个个体(N表示种群大小)作为新种群。而候选部分只有采用状况知识结构才会存在，这里主要对比采用状况知识结构后不同百分比的候选部分对算法的影响，选择10%、20%、50%和100%四种不同的百分比。HV指标可以作为判断算法结果收敛性和多样性的依据，为了比较不同状况知识以及不同百分比候选部分对多目标文化鲸鱼算法的影响，本节统计了不同候选部分选择下的算法，在ZDT测试集实验结果中，HV指标随进化数量变化的数据如图3所示。算法种群选择N=100,迭代次数500次，除状况知识结构外保持算法其他参数设置不变，每组实验重复30次，图3为不同候选部分百分比选择下最优结果所绘制的对比图。

在实验过程中，可以明显发现在不引入状况知识或是将所有状况知识都作为领导个体的方法，很难找到或逼近真实的帕累托前沿，引入状况知识后并在每个个体进化时，从状况知识的前10%、20%或50%的个体中随机选择一个个体作为进化个体的领导个体的策略，能有效提高算法的收敛性。从实验结果来看，除了ZDT4测试集上，10%的选择策略略逊于20%和50%的选择策略，其余情况下，10%的选择策略要优于20%和50%的选择策略，而不引入状况知识或不引入候选部分的结果几乎都是几种选择策略里最差的。上述实验说明状况知识可以提高WOA算子寻找帕累托前沿的能力，且取10%的候选部分作为领导个体的选择集合将会更容易得到接近前沿的解。

4.2.2 规范知识结构对算法效率的影响

规范知识的使用在状况知识的基础之上，上一节已经介绍了状况知识的有效性，在使用规范知识时，本节引入状况知识，并将状况知识前10%作为候选部分。下面主要对比使用规范知识和不使用规范知识时，算法在ZDT测试集上,HV指标随种群进化的变化情况。在使用规范知识的实验中，当某个个体在进化过程中某维超出了该维的上下界后，该维度的值将用存储在规范知识中的界限来代替，而在不使用规范知识的实验中，对待这样的个体将直接赋予原上限或下限的值。算法种群选择N=100,迭代次数200次，除使用规范知识与否保持算法其他参数设置不变，每组实验重复30次，图4为2种组别最优结果所绘制的对比图。

从图4中可以看出，除了在ZDT4的对比实验中使用规范知识与不使用规范知识对比不明显，其余实验中使用规范知识都优于不使用规范知识的结果，且在ZDT6实验中，使用规范知识比不使用规范知识有明显优势。实验结果表明，使用规范知识后，能提高多目标文化鲸鱼算法得到结果的多样性和收敛性，提高算法求解多目标问题的效率。

4.3 标准测试集实验

本节主要对比MOCWOA与5种多目标优化算法在ZDT标准测试集上的性能。设置MOCWOA的候选部分为状况知识的前10%，即当每个个体需要领导个体进行进化操作时，随机从状况知识的前10%个个体中挑选一个个体作为领导个体。状况知识和规范知识的更新为每代进化结束之后，而历史知识的更新为每10代进行一次更新。此外，MOCWOA的其他参数，如控制算法进行缩圈包围或者搜寻猎物仍采用原WOA中参数|A|是否小于1来进行判断，参数A的计算公式已经在式(11)中详细给出，参数α的初始值为2。选取的5种多目标优化算法包括带精英策略的快速非支配排序遗传算法(fast elitist Non-dominated Sorting Genetic Algorithm，NSGA-Ⅱ)、基于分解的多目标进化算法(Multi-Objective Evolutionary Algorithm based on Decomposition，MOEA/D)、MOPSO、GPAWOA和多目标海鸥算法(Multi-objective Optimization Seabird Algorithm,MOSOA)[33-34]，其中：NSGA-Ⅱ是目前最流行的多目标优化算法；MOEA/D是一种基于分解的算法，该算法将多目标问题转换为一系列单目标子问题处理；MOPSO是最流行的基于粒子的算法之一；GPAWOA是一种基于引导种群的多目标鲸鱼算法；MOSOA中加入了归档概念。算法种群选择N=100,迭代次数500次。表1统计了几种不同算法30次测试的平均值，最佳结果以粗体显示。

表1 六种算法在ZDT标准测试集性能统计结果

从表1中可以看出，在双目标问题上，采用IGD指标作为评价标准时，MOCWOA表现良好，在ZDT3、ZDT4以及ZDT6上MOCWOA取得了全部最优值。值得注意的是，虽然在ZDT1上的IGD指标测试结果，MOCWOA略逊于MOEA/D，但结果无明显差异，而在ZDT2上的IGD指标测试结果，MOCWOA劣于NSGAⅡ，但是与其余几个算法的结果相比较，MOCWOA的结果仍然有较大优势。此外，虽然在ZDT1的IGD评价指标上，MOCWOA略逊于MOEA/D，但是MOCWOA在ZDT1的HV指标测试结果优于MOEA/D，是几个算法中最优秀的。MOCWOA在ZDT标准测试集上的IGD指标测试结果可以说明MOCWOA在解决双目标优化问题的结果的收敛性好，同时，图5～图9显示了几种算法在ZDT标准测试集上的帕累托前沿(红色)，在与真实的帕累托前沿(黑色)相比较可以看出，MOCWOA得到的帕累托前沿基本能覆盖真实的帕累托前沿，这也在一定程度上说明了算法的收敛性能。从表中的Sp测试结果来看，MOCWOA取得了在ZDT1和ZDT3上的最优值,在ZDT2、ZDT4都排到了几个算法中的第2位，且与最优的相比较，没有明显差距，实验结果可以说明MOCWOA在处理双目标优化问题上，获得的解具有良好的多样性。此外，本文还引入了HV指标。HV指标可以同时评价算法得到的结果的收敛性和多样性，可以在IGD和Sp指标测试结果基础上，补充说明算法的性能。从表1的测试结果统计数据可以看到，MOCWOA在ZDT1和ZDT3的HV指标测试结果取得了最优值，ZDT1具有凸帕累托前沿，ZDT3具有非连通的帕累托前沿，说明MOCWOA在解决具有这两类帕累托前沿的双目标优化问题时，相较其余几种算法具有一定优势。而在其他几个测试函数上的HV测试结果，几个表现较优秀的算法并没有太大差距，MOCWOA分别在ZDT2、ZDT4和ZDT6的HV指标测试结果上排到了几种算法的第3，第2和第2名。从HV指标的测试结果可以得出结论，MOCWOA在处理双目标优化问题时，具有良好的综合性能。此外，通过图5～图9可以更直观地比较MOCWOA在ZDT测试集上的收敛性和多样性，从图中可以看出MOCWOA得到的帕累托前沿对真实前沿的拟合度和覆盖程度都较好。实验说明了MOCWOA在解决双目标优化问题上，在几个算法中具有一定的竞争力。

4.4 社上水库多目标防洪实验

本节主要研究MOCWOA算法在实际RFCO上的应用。位于赣江水系禾水支流泸水河岸的社上水电站[36]，是一座兼灌溉、发电、防洪、养殖等综合效益为一体的大型水利枢纽工程，建成于1974年，水面面积11.7 km2,最大水位172 m，对应库容1.4094亿立方米，死水位153 m，对应库容1.136亿立方米，水库的汛限水位为162 m，同时汛限水位也是汛期的起调水位，下游能承受的最大下泄流量为800 m3s-1。

国家于2000年发布了《水利水电工程等级划分及洪水标准》[37]，该标准适用于防洪、灌溉、发电和治涝等水利水电工程，该标准指出洪水频率指某洪水特征值(一般指洪峰流量)出现的累计频率，即在多年时期内，该特征值等于或超过某定量的可能次数，并以百分比表示，例如20年一遇洪水即该特征值的洪水20年内可能重现一次，累计频率为5%。按照自然的规律，特大洪水出现的次数较少，一般洪水出现的次数较多。

小水电智能调度系统针对泸水河岸的社上水电站长期实测资料及数理统计方法可以生成该水库不同级别的洪水过程曲线，本文选取了20年一遇洪水和50年一遇洪水进行测试，洪水过程图如图10所示，图10左侧为20年一遇洪水，洪水过程中存在2个波峰，图10右侧为50年一遇洪水洪水过程中仅一次波峰，持续时间均为60 h，取每个调度期为3 h，可分为20个调度期。

实验选取了NAGA-Ⅱ以及几种已经应用于RFCO的算法进行对比：自适应柯西变异多目标差分进化算法(Multi-objective Differential Evolution algorithm—Adaptive Cauchy Mutmion,MODE-ACM)、混合粒子群算法(hybrid Multi-objective PSO-EDA algorithm，MO-PSO-EDA)以及反向学习多目标鲸鱼算法(Multi-objective Whale Optimization Algorithm—Opposition-based Learning, MOWOA-OBL)。MODE-ACM是一种基于自适应柯西变异的多目标差分进化算法，应用于三峡水库的多目标防洪优化调度，MO-PSO-EDA是一种改进的多目标粒子群算法，应用于安康水库的防洪调度,MOWOA-OBL是一种基于网格排序机制的多目标鲸鱼算法，是李伟琨等[38]提出的将鲸鱼算法应用于防洪调度优化的先例。图11～图12为几种算法对社上水库防洪优化调度的结果图,表2为30次独立实验的Sp指标的均值。Sp指标主要体现了算法在实际的防洪调度问题中为决策者提供多样性的解决方案的能力。此外，为了比较几个算法的收敛性性能，本文将几种算法求得的非支配解作为真实的前沿，来计算得到的结果的HV值，实验参数设置与相关文献相同，取种群大小为50，迭代500代，取30次实验的最佳结果图。

表2 社上水库防洪调度优化结果Sp值

由表2可以看出，当遇到较小的洪水，如20年一遇的洪水时，几种算法调度的结果，差距并不大，MOCOWOA算法在20年一遇洪水调度优化中，获得了和NSGA-Ⅱ相近的结果，而MO-PSO-EDA获得了最优的结果，但是在处理较大洪水，如50年一遇的洪水时，MOCWOA在几种算法中处于领先地位，此时，MOCWOA可以为决策者提供更多合理的决策方案。表3显示了各个算法在处理防洪调度问题时的综合性能，MOCWOA在处理50年一遇洪水和20年一遇洪水时，均能取得最好或是接近最好的结果。

表3 社上水库防洪调度优化结果HV值

5 结束语

水库防洪作业是一个诸多约束的复杂多目标优化问题。为了有效地解决该问题，本文提出一种新的多目标优化算法，即多目标文化鲸鱼算法(MOCWOA)，该算法结合WOA和CA的优势。MOCWOA使用文化算法作为其框架，并在其种群空间采用多目标鲸鱼算法。WOA收敛速度快，但在处理多目标局部优化的问题时存在过早收敛问题。为了克服这一问题，提高算法的收敛速度，根据WOA和多目标优化的特征，在信度空间中定义了3种知识结构。MOCWOA通过接受不断进化的种群空间中的优秀个体来更新这3种知识结构，并使用这些知识结构来提高其搜索效率。通过几个典型的基准问题的测试，MOCWOA证明了它在解决多目标优化问题方面的效率和鲁棒性，特别是避免过早收敛的能力。然后将MOCWOA应用于社上水库多目标防洪的案例研究，结果证明，对比其他一些针对RFCO问题的算法，MOCWOA可以生成大量分布均匀且分布范围广的非劣调度方供水库调度决策者选择，特别是在水库遭遇较大洪水时。考虑到MOCWOA在多目标问题的处理上的优势，可以尝试将该算法延申到其他应用上，如水库群防洪调度问题。