改进鲸鱼算法在认知无线电频谱分配中的应用

2021-11-17张达敏王依柔宋婷婷

计算机仿真 2021年4期

徐航，张达敏，王依柔，宋婷婷

(贵州大学大数据与信息工程学院，贵州贵阳 550025)

1 引言

随着当前无线业务的快速发展，无线通信将面临着新业务可用资源日益稀缺和授权频谱利用率不高共存的局面。为了解决频谱资源的现状，Mitola首次提出认知无线电的概念[1]，在认知无线电网络中，动态频谱分配是认知无线技术中的焦点问题，它既关系到次用户的需求是否能够得到满足，又关系到主用户的收益情况[2]。文献[3]在冲突图和物理干扰模型中并用贪婪算法解决频谱分配问题，但贪婪算法容易陷入局部最优解，不能解决频谱分配问题。文献[4]提出了基于遗传算法的频谱分配，这种算法能获得更高的效率，不仅容易陷入局部最优，而且收敛速度较慢。文献[5]提出了基于粒子群算法的认知无线电频谱分配，虽然有较理想的网络效益，但仍然易陷入局部最优解，不能确保每次都可以得到最佳的频谱分配方案。

许多学者提出采用智能优化算法来解决上述问题，智能优化算法搜索能力强，容易与多种算法结合，比如布谷鸟搜索算法(Cuckoo Search，CS)[6]、乌鸦算法(Crow search algorithm，CSA)[7]和鲸鱼算法优化算法(whale optimization algorithm，WOA)[8]等。其中WOA算法原理更简单，在寻优能力方面也比传统的优化算法强。最近WOA的许多改进算法都应用到工程应用当中，如文献[9]提出了一种改进鲸鱼算法，通过协调全局探索阶段和局部开发阶段，改善了算法收敛速度等问题，并用于优化同步串联补偿器，提高电力系统的稳定性。因此本文提出了一种改进鲸鱼优化算法(Improved whale optimization algorithm，IWOA)来解决传统算法在频谱分配上的缺陷。实验表明，IWOA算法在性能上都优于对比的算法，这对提高系统的效益有重要的意义。

2 认知无线电频谱分配模型

在认知无线电系统中，分为授权用户(Primary User，PU)和认知用户(Second User，SU)，PU表示已经获得特定频谱使用权的用户，SU表示没有获得授权，但在感知到频段空闲时，可以在不影响主用户的前提下使用该频段的用户。本文频谱分配时主要考虑整个通信系统的系统效益和公平性等问题。由于频谱资源有限，系统需要将空闲频谱进行合理分配，当前的频谱分配模型包括图论着色模型[10，11]，议价机制模型[12，13]和博弈论模型[14，15]等，本文将认知无线网络频谱分配问题建模为图论着色问题。图论着色中频谱分配问题可用信道矩阵、效益矩阵、干扰约束矩阵和分配矩阵描述。它们的定义如下[16]：

定义1：空闲矩阵L。L={ln，m|ln，m∈{0，1}}N×M式中，为认知用户使用信道的信息，ln，m=1则表示认知用户n可以使用信道m。

定义2：效益矩阵B。由于不同认知用户所处环境不同，使用的发射功率和编码速率也不同，从而获得的带宽和收益也不一样。B={bn，m}N×M，B为一个N×M的实数矩阵，矩阵中每个元素表示每个认知用户在信道上获得的效益。bn，m表示认知用户n在使用信道m能获得的最大效益。只有空闲矩阵才能获得效益，即当ln，m=0时，必有bn，m=0。

定义3：干扰约束矩阵C。由于认知用户之间的距离和调制等因素，导致认知用户使用同一频谱时会产生干扰，其中C={Cn，k，m|Cn，k，m|∈{0，1}}N×K×M，Cn，k，m=1表示次用户n和k同时使用频谱m时会产生干扰，相反Cn，k，m=0表示不会产生干扰。另外定义n=k且频谱m对n可用时，Cn，k，m=0。

定义4：无干扰分配矩阵A。在进行频谱分配时，将可用频谱分配给认知用户时，得到无干扰分配矩阵：A={an，m|an，m∈{0，1}}N×M，式中an，m=1表示信道分配的可行性，即认知用户n分配到频谱m，为了确保通信过程的稳定，分配矩阵A和干扰矩阵C之间不能有冲突，即必须满足条件an.m+ak.m≤1ifcn，k，m=1，∀0

定义5：用户效益R。R={βn}N×1，其中βn表示在无干扰分配矩阵A下，次用户n在所有信道上所获得的收益，计算公式为

(1)

则系统总效益U(R)表示为

(2)

定义6：最大系统效益Umax。认知无线网络频谱分配的目标即为最大化U(R)，则频谱分配可表示为优化问题表示如下

(3)

(4)

定义7：认知用户接入公平性Ufair。其目标是确保频谱分配过程认知用户的公平性。其公式定义为

(5)

本文将上述定义的最大系统效益Umax，平均效益Umean和认知用户接入公平性Ufair作为衡量频谱分配系统的性能的标准，即把式(3)、(4)、(5)作为本文算法的目标函数。

3 算法描述

3.1 WOA 算法

WOA算法是一种Mirjalili等人受座头鲸泡泡网捕食方式启发而衍生的智能算法，包括三个阶段：

第一阶段：座头鲸寻找猎物并包围它们，由于猎物初始的位置是未知的，所以WOA假设当前最优为目标猎物，其它鲸鱼根据该位置来更新自己的位置，这个阶段的数学模型如下

X(t+1)=X(t)-A·|C·X*(t)-X(t)|

(6)

其中X(t)为当前位置，X*(t)为当前最优位置向量，t为当前迭代次数其中A，C定义如下

A=2ar1-a

(7)

C=2r2

(8)

a=2-2t/max_iter

(9)

其中r1和r2为[0，1]的随机数，max_iter为最大迭代次数。a为随迭代次数增加由2递减到0的参数。

第二阶段：鲸鱼按螺旋路径朝猎物移动，同时按泡泡网捕食方式狩猎。在数学模型中，当A是[-1，1]区间的随机取值时，可得更新位置的鲸鱼在原位置与猎物之间，这样所有鲸鱼都朝着猎物移动，实现对猎物的包围。鲸鱼与猎物之间建立螺旋方程，如下所示

X(t+1)=D′·ebl·cos(2πl)+X*(t)

(10)

其中D=|X*(t)-X(t)|表示鲸鱼与猎物之间的距离，b为定义螺旋方程的常量，l为[-1，1]之间的随机数。

为了使座头鲸收缩包围时还沿着螺旋形路径向猎物游动，WOA算法假设在狩猎过程中选择两种方式的概率都为0.5，数学模型表示为

(11)

第三阶段：在搜索猎物阶段，当A满足|A|≥1时，鲸鱼通过彼此的位置来更新自身位置。数学模型如下

D=|C·Xrand(t)-X(t)|

(12)

X(t+1)=Xrand(t)-A·D

(13)

其中：Xrand表示从群体中随机选择鲸鱼的位置量。

3.2 改进WOA算法

WOA和大多数智能算法一样，都是基于群体的智能算法，但是原始鲸鱼算法中加入了大量的随机数，这种随机机制导致算法存在收敛性差，容易陷入局部最优等问题。具体改进步骤如下。

3.2.1 混合反向学习机制

1) 透镜成像反向学习策略

当前解决局部最优问题主要有两种方案，一是在当前最优位置上向其它区域进行寻优，二是放弃当前最优位置，转而向新的区域进行搜索。本文选择第一种手段，引入透镜成像原理来帮助算法跳出局部最优区域。示意图如图1所示。

图1 透镜成像反向学习示意图

(14)

设H/H*=n，通过变换得到X*，表达式如下

(15)

由(16)式可以看出，当n=1时，此时的透镜成像反向学习就是一般反向学习策略，通过调整n值，可以得到位置更好的个体，本文设置n=12000。考虑到精英个体比普通个体拥有更好的搜索区域，所以当WOA算法陷入局部最优解时，对其采用上述透镜成像反向学习机制，从而提高算法的全局搜索能力。

2) 最优最差反向学习策略

为了增加种群中鲸鱼位置的多样性，提高算法的全局搜索能力，对全局最差位置的鲸鱼采用随机反向学习的策略，公式如下

Xworst(t+1)=aj+rand·(bj-Xworst(t))

(16)

其中，Xworst为全局最差位置向量，rand时[0，1]上的随机数。算法每迭代一次，都通过(16)、(17)式进行位置筛选，通过判断反向学习前后的适应度值大小，对全局最优解进行更新。

3.2.2 非线性收敛因子

在原始WOA算法中，参数A∈[-a，a]用来平衡算法的全局搜索能力和局部开发能力，而a随着迭代次数的增加呈线性递减，这种线性递减的因子不能准确反映实际的迭代过程，为了平衡算法的全局和局部搜索能力，本文引进了一个非线性收敛因子，公式如下

(17)

其中，t为迭代次数，max_iter为最大迭代次数，随着迭代次数的增加，a从2非线性递减至0。在迭代初期a减小比较缓慢，此时a>1所占迭代次数比例更大，从而优化了算法的全局搜索能力。

3.2.3 自适应阈值和权重

为了同步包围和螺旋行进过程，原始算法通过随机生成的p值与0.5作比较来选择狩猎策略，随着迭代次数增加，这种等概率的捕食方式会导致算法陷入局部最优等问题，因此本文提出了一个自适应概率阈值p′来平衡全局搜索和局部开发的能力。表达式如下

(18)

其中max_iter为最大迭代次数，t为当前迭代次数。

在迭代前期，自适应阈值较大，此时p≤p′，算法以大概率且较快的速度完成全局搜索阶段；到迭代后期，随着概率阈值以缓慢的速度减小至0，由于p>p′，此时算法将大概率选择螺旋行进策略更新位置，从而提高算法的局部搜索能力，IWO算法通过不断更新的自适应概率阈值，使鲸鱼不断向最优解靠近，从而提升算法的寻优精度。

原始WOA算法在后期进行局部开发时，权重为固定值，所以算法只能停留在最优解附近，不能精确的找到最优解，同时在WOA算法中没有考虑算法迭代过程中向量Xrand的随机性，受文献[17]启发，因此本文将自适应权重ω与收敛因子a相结合，经多次实验得到当ω=0.5a时，频谱分配的系统效益最佳。IWOA算法的公式表示如下

(19)

X(t+1)=ω·X*(t)-A·D|A|<1,p

(20)

X(t+1)=ω·Xrand-A·D|A|≥1,p

(21)

X(t+1)=D*·ebl·cos(2πl)+(1-ω)X*(t)p≥p′

(22)

在迭代前期，权重系数ω较大，此时鲸鱼可以准确地找到猎物，提高了算法的收敛速度；随着迭代的进行，算法进入局部开发阶段，鲸鱼以螺旋行进方式搜索猎物，此时权重系数ω随着迭代次数增加而减小，由(18)式得，此时鲸鱼在更新位置的同时可以搜索猎物的附近是否存在最优解，防止陷入局部最优解，从而提高了算法的局部开发能力。

3.2.4 更新位置的二进制转换

WOA算法是求解连续问题的最优解，在本文基于图论着色模型的频谱分配矩阵A是一个0、1矩阵(二进制)，所以需要建立位置向量从连续到离散的规则。本文使用常用的Sigmoid函数来实现十进制到二进制的转换，函数表达式如下：

(23)

(24)

3.2.5 算法步骤

步骤1：初始化种群，并根据适应度值记录当前最优解和X(t)，更新参数A、C、l。

步骤2：按照(17)(18)(19)式更新参数a，p′，ω，若p

步骤3：若p≥p′，鲸鱼选择螺旋行进方式搜索移动，同时根据(22)式更新当前位置和个体。

步骤4：选出当前种群中一个精英个体和一个位置最差个体，按(15)、(16)进行位置更新。

步骤5：参照(23)(24)式实现对更新位置的离散化，计算每个种群个体的适应度并更新全局最优个体和位置X(t)。

步骤6：重复步骤2～4的更迭过程，如果达到设置的最大迭代次数则终止算法，输出全局最优解。

3.2.6 算法性能测试

为了验证IWOA算法的性能，通过表1所示的6个基准测试函数进行测试并与WOA算法进行比较，将两种算法所求最优均值和标准差作为评价指标，并引用文献[8]的数据进行比较。本文设置种群数为30，维度为30，最大迭代次数为500次，为保证试验结果的有效性的准确性，6个测试函数经过50次连续求解后得到优化均值和标准差，试验结果如表2所示。

表1 基准测试函数

分析表2结果可知，IWOA算法在6个测试函数中寻优能力比WOA算法好。其中F5为一个多峰函数，一般算法很难找到全局最优解，而IWOA 算法不仅短时间内找到最优解，并且达到了理论值，其它测试函数也到接近了理论值。从优化均值和标准差来看，IWOA算法的优化均值和标准差要优于WOA算法，因此IWOA算法有更高的收敛精度和更好的寻优能力。

表2 实验结果对比

4 仿真与分析

4.1 参数设置

为了验证本文提出的IWOA算法在认知无线电频谱分配中的性能，分别从系统效益、认知用户接入公平性、收敛速度等方面着手，与原始鲸鱼算法(WOA)、遗传算法(GA)、粒子群算法(PSO)进行对比试验。各种算法的参数设置为：认知用户N=20，可用信道数M=10，种群大小为40，最大迭代次数为500次。

4.2 不同环境下的仿真

为了验证四种不同网络环境下的性能，分别在30种不同环境下进行试验，得到不同环境下的最大系统效益和认知用户接入公平性。从图2和图3可以看出，在不同信道环境下，IWOA算法获得的系统总效益和用户接入公平性的效果都比另外三种算法要好，这是由于IWOA算法具有较强的寻优能力，可以准确地求得最优解，从而IWOA算法在不同信道环境下都可以获得较大的网络效益和公平性，而且相对稳定。

图2 不同信道的系统效益

图3 不同信道的公平性

图4为在随机一次试验中，迭代次数与系统总效益之间的关系，由图可知系统效益随着迭代次数增加而增加，同时本文算法得到的系统效益高于其余三种算法。并且可以得到IWOA算法收敛代数比其它三种算法小，这是因为其余三种算法容易陷入局部最优解，IWOA算法在迭代第50代就到达全局最优解，WOA算法在迭代到300次达到最优解，GA算法在350代达到最优解，而PSO算法在迭代400代才达到最优解，进一步验证了对原始WOA算法改进的有效性。

图4 系统效益和迭代次数的关系

4.3 不同用户数与平均系统效益的关系

系统平均效益受很多因素影响，为了验证不同用户数量对系统效益的影响，本文设置环境中可用信道数M=10保持不变，认知用户数N从10递增到30，得到用户数量和平均效益的关系，由图5可知，随着认知用户数的增加，认知无线电系统的平均效益在逐渐减小，这是由于可用信道数一定，随着认知用户数的增加，信道资源紧缺，导致系统平均效益逐渐减小，但是IWOA算法得到的平均系统效益值仍然比WOA、PSO和GA都要高，说明本文所提算法相比其它算法有更高的性能，进一步验证了IWOA算法在认知无线电频谱分配中的有效性。

图5 平均效益与用户数的关系

4.4 不同信道数与平均系统效益的关系

为了证明算法在不同信道数下的性能，本文设置用户数N=20保持不变，可用频谱数M从10递增到30，从图6可知，随着区域内可用信道数的增多，信道平均效益的数值也逐渐增大，这是因为环境中可使用信道数值多，认知用户取得的效益也随变大，同时IWOA算法的平均效益也高于其它算法，这也进一步说明本文所提算法在频谱分配当中的有效性。

图6 平均效益与可用信道的关系

5 结束语

认知无线电中频谱分配问题是一个必须解决的优化难题，由于经典PSO算法和GA算法收敛速度慢，容易陷入局部最优解，本文在标准WOA算法基础上提出了改进WOA算法，并将其用到认知无线电频谱分配中，仿真结果表明：改进算法在解决认知无线电频谱分配问题时，可以获得更高的系统效益和较高的认知用户接入公平性，达到了频谱分配的最终目的，同时表明IWOA算法在收敛精度、寻优能力和收敛速度等方面都优于其它算法，从而证明了对算法改进的有效性。