基于混合策略改进鲸鱼优化算法的模糊时间序列模型

2023-07-25郭生伟

电子设计工程 2023年15期

汪涛，林川，郭生伟

（1.华北计算技术研究所，北京 100083；2.中电太极（集团）有限公司国际部，北京 100083）

随着社会科学技术水平的飞速发展，很多领域都需要有预测工具来辅助人们进行相关决策，比如天气变化[1]、股票市场[2-4]、学校招生[4-7]等。1993年，Qiang和Chissom[8]将模糊集理论应用到时间序列分析中，并分别研究了时不变模糊时间序列模型和时变模糊时间序列模型对Alabama 大学入学人数的预测情况。提出了四步骤的预测框架：1）定义和划分论域区间。2）定义模糊集，对时间序列模糊化。3）建立模糊推理规则。4）预测和去模糊化得到推理结果。使用最大最小组合来处理模糊规则，当模糊规则矩阵很大时，需要大量的计算时间。随着研究的不断深入，研究者们发现影响模型预测精确度和效率的主要有以下两个因素。1）论域的定义和划分：Huarng[9]研究了论域区间长度和预测精度的关系，并提出了基于分布和基于平均值的启发式方法对区间进行非等分划分。Huarng 的研究打破了早期对区间均分的束缚，此后不少研究者基于遗传算法[10]、粒子群优化算法[4,6-7]、人工鱼群算法[11]对论域进行非等分划分。2）去模糊化预测方法：Kuo[6]开发了一种将全局模糊逻辑关系和最新的模糊波动LFF 的局部信息相聚合的方法来寻找预测值，使用均方误差MSE 来衡量预测精度。Guan[2]和Alyousifi[12]提出了基于模糊集理论和马尔可夫链的模糊时间序列预测模型，在预测股票指数变化中都取得了较好的效果。

基于混合策略改进鲸鱼优化算法的高阶模糊时间序列分析混合预测模型，在针对鲸鱼优化算法[13](Whale Optimization Algorithm,WOA)求解高维多目标优化等复杂问题时，存在收敛速度较慢、求解精度低、容易陷入局部最优解等问题，引入混沌初始化[14]、非线性参数变化、莱维飞行[15]、记忆行为和贪婪策略进行优化算法，用混合策略改进的鲸鱼优化算法(Mix-Improved Whale Optimization Algorithm,MWOA)在论域空间中寻优，从而优化模糊区间的划分。模糊逻辑推理规则定义参考Chen[4-5,10]提出的模糊关系和模糊逻辑关系组。混合模型在训练过程中使用Kuo 提出的基于下一状态EBN[7]（Estimating Based On Next State）方法；在测试过程使用一种改进的基于有序加权平均的OWA[16](Ordered Weighted Averaging)方法。为验证混合模糊时间序列模型的有效性，通过Alabama 大学入学人数数据集进行仿真实验，并与国内外现有模型进行对比分析，采用评估指标均方根误差RMSE 和平均绝对百分比误差MAPE 作为评价指标，在训练和预测阶段，混合模型获得了最小的RMSE 和MAPE 值。

1 混合策略改进鲸鱼优化算法

1.1 传统鲸鱼优化算法

鲸鱼优化算法WOA 是由Mirjalili 和Lewis[13]在观测座头鲸的狩猎行为后，提出的启发式优化算法，其寻优过程主要分为包围猎物、泡泡网捕食和随机捕食三部分。

1.1.1 包围猎物

WOA 算法假定目标猎物位置或附近就是当前的最优解，其他鲸鱼都会尝试游动靠近最优解，鲸鱼个体位置移动更新的数学表达式为：

1.1.2 泡泡网捕食

WOA 算法假定收缩包围和螺旋运动两种概率均等，各为0.5。在螺旋运动向猎物靠近时，位置关系更新公式为：

1.1.3 随机捕食

1.2 混合策略改进鲸鱼优化算法

1.2.1 混沌初始化和透镜反向学习

在智能优化算法中，初始化种群的多样性、普适性程度对算法收敛速度有一定影响：种群初始化分布越均匀，越具有普适性，越有利于算法寻优过程，减少迭代次数。常规算法中通常用随机数生成初始种群，这样不够充分均匀的种群分布，在寻优中难以覆盖整个搜索空间，容易陷入局部最优解，部分解可能远离最优解，影响算法收敛速度。

低差异的Sobol[17]序列和混沌映射[18]都具有分布均匀、收敛速度快的特点。Tent 混沌映射较常用的Logistic 映射具有更优越的混沌特性，在解空间分布更具有混沌特性，Tent混沌映射表达式为：

其中，α∈[0,1]。假设鲸鱼种群规模为POP_NUM，搜索空间为DIM 维欧式空间。

Tizhoosh[19]提出了反向学习，其中的透镜成像反向学习可以基于当前解，寻找基于透镜成像过程对应的反向解，综合评估当前解种群和反向解种群，筛选出适宜度更高的POP_NUM 只个体，组成初始种群，可更好地脱离局部最优解。

混合策略改进鲸鱼优化MWOA 算法中，抛弃了传统随机初始化方法，采用一种混合初始化策略:生成POP_NUM 维度的Sobol 序列s={si,i=1,2,3,…,POP_NUM}，再利用具有优越混沌特性的Tent 混沌映射将Sobol 序列生成POP_NUM·DIM 维的混沌映射t={ti,i=1,2,3,…,POP_NUM}，ti={tij,j=1,2,3,…,DIM}。将混沌映射t映射到解空间得到混沌解空间，使用透镜成像反向学习得出反向解空间，采用精英策略联立混沌解空间和反向解空间，建立初始解空间。在扩大了可行解范围的同时，保留了优质解方法，提高了种群适宜度的质量，可更好引导个体寻找最优解，降低了迭代次数。

1.2.2 非线性收敛因子

在WOA 算法中，收敛因子a→随着迭代次数线性递减至0，决定是全局探索还是局部开发。但是收敛因子的线性变换并不能够很好地模拟座头鲸的捕猎策略，可能导致算法全局搜索不够彻底，局部开发收敛较慢。MWOA 算法采用一种非线性变化收敛因子，更新公式为：

其中，ITER 为最大迭代次数。

图1 改进收敛因子对比

1.2.3 莱维飞行

莱维飞行[20]是基于数学家莱维(Levy)提出的莱维概率分布实现的一个随机移动过程，在大概率短距离游走的同时，可能有较大步长的跳跃，不仅能够增强深入局部搜索的能力，还有利于跳出局部最优。由于传统WOA 算法易陷入局部最优，MWOA给最优个体引入莱维飞行机制：小步长可以加快对最优解的探索过程，大步长能够帮助脱离局部最优解。莱维飞行步长L(λ) 服从Levy 分布，数学模型为：标准Gamma 函数。给当前迭代中最优个体引入莱维飞行，位置更新关系为：

1.2.4 记忆行为

MWOA 在传统WOA 算法基础上，增加一种记忆寻优移动行为，在位置关系中引入历史全局最优个体，可有效利用之前迭代获得的信息用于之后的搜索过程，记忆行为位置更新关系为：

其中，rand 为-1 到1 之间的随机数，值得注意的是，式（13）和式（14）得到新种群个体位置后，计算适应度后采用贪婪策略，如果优于原位置，就更新该个体坐标，若全局最优个体发生了变化，也应该实时更新全局最优个体位置及其适应度。

2 模糊时间序列

模糊时间序列最早由Qiang 和Chissom[8]于1993 年提出，与传统时间序列的差异主要在于模糊时间序列值是基于对论域进行模糊区间划分后定义的，定义U为论域，U由有限个互斥元素构成，即U={u1,u2,…,un}，则论域U上的模糊集合A可表示为：

其中，fA是关于U上定义模糊集A的隶属函数，xi是A中元素，fA(xi)表征xi对模糊集A的隶属程度，并且满足fA(ui)∈[0,1]。

定义1：设定论域U(t)(t=0,1,2…)为R上一任意子集，fi(t)(t=0,1,2…)为论域U(t)上的模糊集，且若有F(t)={f0(t),f1(t)…}，称F(t) 为U(t) 上的模糊时间序列[8]，其中F(t)表示t时刻的语言变量，fi(t)是所有可能的语言变量取值。

定义2：设有模糊时间序列F(t)(t=0,1,2…)，若满足F(t)由其前n(n≥1)个模糊序列确定，即：

则称其为n阶模糊时间序列模型。若F(t-n)=Ai,F(t-n+1)=Aj,…,F(t-1)=Am,F(t)=Ak，则称Ai,Aj,…,Am→Ak为一个n阶模糊逻辑关系。Ai,Aj,…,Am称为前件，Ak称为后件，当前件相同，后件不同时，可用模糊逻辑关系组合并表示[8]。

3 混合策略改进鲸鱼优化算法的模糊时间序列模型

影响模糊时间序列预测模型准确度的主要因素之一是论域的划分问题，混合模型将MWOA 算法用于论域划分，为寻得更合理的模糊区间分割点。以Alabama 大学1971—1992 年的入学人数数据集为例，建立三阶模糊时间序列预测模型，图2 为具体算法流程。

图2 混合策略改进鲸鱼优化算法的模糊时间序列模型预测流程

步骤1：划分数据集和初始化参数

混合模型分为训练阶段和测试阶段，以Alabama大学1971—1992 年入学人数作为样本数据说明。首先要确定论域U的上下界，在以前的工作中，都是适当扩大实际数据集的上下界作为论域区间，这样并不能真实反映数据的变化范围。混合模型使用MWOA 算法寻找更合理的论域上下界，因此当决定把论域U划分为n个模糊区间时，划分点的个数D=n+1。设置鲸鱼个体数为POP_NUM，算法最大迭代次数为ITER，其中参数设置为D=8,POP_NUM=100,ITER=100 。采用真实观测值和模糊预测值的均方根误差RMSE 作为鲸鱼个体的适应度，计算公式为式（17），并用RMSE 和平均绝对百分比误差MAPE 作为评价指标，MAPE 计算公式为式（18）。

依靠MWOA 算法把论域非等分划分为t个区间，分别为：

步骤2：建立模糊集和模糊逻辑关系

混合模型沿用Chen[4]提出的方法和隶属度函数确定对应模糊集，表1 为将实际观测值模糊化得到的模糊数据序列和建立的三阶模糊逻辑关系。

步骤3：去模糊化并求预测值

表1 中每个模糊逻辑关系都可以创建其对应模糊预测规则，该规则为去模糊化预测方法，在训练阶段采用Kuo[7]提出的基于下一状态的EBN 预测方法。由于模糊时间序列中，预测值的确定与过去的观测值呈强相关关系，离预测值时间越近的观测值对预测值影响越大[6]。

在测试阶段，对有序加权平均(Orderd Weighted Averaging，OWA)[16]算子进行改进，提出一种基于次序和时序的混合非线性加权平均(Mixed Nonlinear Orderd Weighted Averaging，MN_OWA)算子来计算历史观测值对应权重，以此计算t时刻的预测值F(t) 。

1）EBN 方法

据式（20）计算预测值F(t)，其中，n为该模糊逻辑关系组中模糊逻辑关系个数，midk为模糊逻辑关系后件对应模糊区间的中点，submidk是对应模糊区间均分为三个小区间后，模糊逻辑关系后件实际观测值对应小区间的中点值。

2）MN_OWA 算子

混合模型定义了一种基于次序和时序的平均加权MN_OWA 算子，其计算方法为：

①创建评估矩阵

统计F(t)之前的所有历史数据模糊化后对应模糊集Ai重要性：将模糊集Ai按出现频率升序排列，若出现频率一致时，按时间先后排列，并给每个模糊集赋予非线性变化的评估系数μ(Ai)。如某模糊时间序列每个模糊集出现频率升序排列为Ai,Aj,Ak,…Ap,Aq，以非线性变化加权确定模糊集的评估系数，表2 为其相关评估系数矩阵，n为历史数据中所有出现过的模糊集种数。

表2 评估系数矩阵

②计算MN_OWA 算子权重

为集结尽可能多的语言量词，获得较好的鲁棒性，定义MN_OWA 算子的权重计算公式为：

③去模糊化计算预测结果

为求t时刻的预测值F(t)，前两步可计算MN_OWA 算子权重ω=[ω1,ω2,…,ωn]，计算t时刻之前n个观测值模糊化对应的模糊集中点向量mid=[mid1,mid2,…,midn]，通过式（22）去模糊化得到data 值，则t时刻预测值F(t)为data 所在模糊区间的中点值。

以三阶模型中预测F(t) 需要集结三个观测值F(t-3)、F(t-2)、F(t-1)为例，演示MN_OWA 算子的预测流程。当t=1 990 时，由表1 可知，t-3、t-2、t-1时刻对应模糊集分别为A4、A5、A6，按出现频率和时间先后对1990 年之前的模糊集进行升序排序有A5、A6、A3、A0、A1、A4、A2，据表2 计算各模糊集的评估系数，可得A4、A5、A6的评估系数分别为μ(A4)=0.975、μ(A5)=0.223、μ(A6)=0.434，据式（21）计算模糊集A4、A5、A6对应权重向量ω=[0.076 1,0.137 0,0.786 9]。

据式（19）可知，模糊集A4、A5、A6中点向量mid=[16 622.5,17 899.0,19 139.0]，据式（22）可计算data=mid×ωT=16 622.5×0.076 1+17 899.0×0.137 0+19 139.0×0.786 9=18 697.0。据式（19）和Chen[4]的模糊集隶属函数可知，data 隶属于A6模糊集，则预测值，即采用MN_OWA 算子预测1990 年入学人数为19 144，真实观测值为19 328，此时的均方根误差RMSE 为184，平均绝对百分比误差MAPE为0.95%。

4 模型用例分析

4.1 训练阶段

Alabama 大学入学人数数据集在Qiang 等[8]研究者首次提出模糊时间序列分析模型就被使用，有较多的基线实验。混合模型使用Python3.7 编写仿真程序，操作系统为Windows11，处理器为Intel i7-9750H 2.60 GHz，内存16 GB。使用式（17）定义的均方根误差RMSE 为种群适应度，将论域空间划分七个区间，建立三阶模糊逻辑关系。为比较MWOA优化效果，与传统鲸鱼算法WOA[13]、遗传算法GA[10]、粒子群算法PSO[6,21]、精英反向黄金正弦鲸鱼算法EGolden_SWOA[22]、混合改进鲸鱼优化算法LGWOA[23]就论域划分进行比较。表3 为各算法的参数设置和独立运行20 次的仿真结果，其中各算法的种群数和迭代次数均为100，图3 为各算法结果平均值的收敛曲线。

表3 各算法参数设置及仿真结果

图3 算法收敛过程对比

从表3 中可观察出，MWOA 算法具有良好的寻优能力和鲁棒性，其最小最优解、最大最优解、平均最优解和最优解方差四项指标均优于其他算法。虽然平均运行时间略高于LGWOA 算法，但也获得了更高的优化精度，并且从图3 可看出，MOWA 算法平均10 次迭代左右就到达了最优解，实际寻优搜索耗时并不高。

MWOA 算法种群初始适应度远低于WOA、GA、PSO、EGolden_SWOA 和LGWOA 算法的种群初始适应度，说明改进的初始化方法取得了较好的作用；迭代过程中MWOA 算法种群适应度下降速率较快，率先迭代至最优解，表明引入的非线性收敛因子、莱维飞行机制和记忆行为具有较好增强全局搜索的能力，避免陷入局部最优解，具有优异的全局寻优能力、优化精度和高效的迭代速率，明显优于GA、PSO、传统鲸鱼算法WOA 和改进的EGolden_SWOA和LGWOA 算法。

图4 为Alabama 大学入学人数数据集上的训练阶段预测结果。为对比MWOA 算法建立的模糊时间序列模型在训练阶段预测效果，选取了通过质心法预测的加权累积概率分布模型WCPDA[24]、加权最小化熵模型WMEPA[24]，模糊聚类CMeans 划分论域建立的马尔可夫加权模糊时间序列模型MWFTS[12]，以及分别使用改进人工鱼群算法、改进粒子群算法、改进狼群算法划分论域，都采用式(19)的EBN 方法预测的HAFSA[11]、HPSO[6]和IWPA[25]模型。所有基线模型与混合模型论域都被划分为七个子区间，并与采用EBN 方法预测的训练阶段仿真结果对比，表4 是与基线工作的对比，以验证混合模型的实际预测能力。可观察出混合模型获得了最小的RMSE 和MAPE，在训练阶段有着优质的表现效果。训练阶段的目的是得到一个高效划分的论域空间，随后在测试阶段检验该论域空间的表征能力。

表4 训练阶段预测结果对比

图4 训练阶段预测值和真实值对比

4.2 测试阶段

HPSO[6]、AFPSO[21]、HAFSA[11]和IWPA[25]基线模型虽在训练阶段采用不同的方法划分论域空间，但在测试阶段去模糊化预测都是如下处理：将论域空间划分为七个子区间，Alabama 大学1971 年至1989 年的数据建立三阶模糊关系，创建模糊逻辑关系和推理规则，采用MV(Master Voting)[6]方法对1990 年至1992 年入学人数进行预测，计算公式为式（23），其中mti(i=1,…,λ)为预测时刻前第i个观测数据对应模糊区间的中点值，λ为预测时所需的与预测时刻相邻的前面时刻数据的个数，即模型阶数，Wh表示邻近时刻数据对预测数据的影响程度，其中λ=3,Wh=15。

为验证MWOA 算法对论域空间的高效划分效果，以及MN_OWA 算子对未来数据的预测能力，在测试阶段与基线实验做相同处理，分别采用MV 方法和MN_OWA 算子对1990 年至1992 年的数据预测，表5 为测试阶段预测结果对比。

表5 测试阶段预测结果对比

从表5 可知，使用MWOA 算法划分论域，采用 MV 方法预测的结果仅优于HPSO 模型，逊色于HAFSA 和IWPA 模型，且有一定差距，但是使用MN_OWA 算子得到预测值最为精准，预测效果较现有模型有了较大的提升，对照基线最优模型指标，RMSE 减少了21.1%，MAPE 降低了0.28%，有效论证了MN_OWA 在模糊时间序列预测中的有效性。

5 结论

较国内外相关研究对比，基于混合策略改进鲸鱼优化算法的高阶模糊时间序列预测模型具有以下特点：

1）改进的混合策略改进鲸鱼优化算法，提高了寻优能力。首先，使用Sobol 序列和混沌初始化获得分布均匀普适的初始种群；其次，引入非线性变化的收敛因子和莱维飞行变异，帮助种群增强全局搜索能力，还能提高局部搜索寻优的效率；最后，通过全局信息和贪婪策略保持种群多样性的同时有效减少了迭代次数，成功应用于解决模糊时间序列论域划分问题。

2）基于次序和时序的混合线性平均加权算子MN_OWA 可在去模糊化过程中对权重参数进行重新优化分配。在Alabama 大学入学人数数据集上，混合模型与其他现有模型相比，获得了最小的均方根误差RMSE 和平均绝对百分比误差MAPE 值。

实验结果表明，混合模型针对模糊时间序列分析中影响预测精度两大因素——论域划分和去模糊化预测方法，均提供了一种可行高效的思路，在合理划分论域的同时，还可以集结历史数据信息用于提高预测精度，更好地表示模糊逻辑关系，对比基线工作，还具有算法所需参数少、迭代速率快、预测精度高等优点。但是模糊集理论可以描述元素对某集合的隶属程度，但不能表示对集合的中立程度，对客观世界的模糊性本质刻画还不够；在MN_OWA 算子建立评估矩阵时，非线性赋权方法只能表示离预测值越近的观测值对预测值影响越大，不能保证在所有场景都可以获得出色的预测性能。因此接下来有两个重点研究方向：1）引入犹豫度因子建立直觉模糊时间序列。2）采用基于博弈论的混合策略为MN_OWA算子赋权，进一步改进算子预测流程，提升去模糊化预测能力，提高模型预测精度。