基于博弈论的认知无线网络中继策略优化算法
2021-09-29韦杨雄陈卉蕊吴呈瑜
王 卉,韦杨雄,陈卉蕊,吴呈瑜,占 敖
(浙江理工大学信息学院,浙江 杭州 310018)
0 引 言
认知无线电是无线通信网络的频谱智能技术,能有效提高频谱利用率,而协同通信技术能够为认知无线网络带来意想不到的增益,可大幅度提高频谱利用率及系统可实现性。中继节点的选择及资源分配算法(中继策略优化算法)是协同通信系统的一个很严肃的问题,能够给系统带来不同的性能改善,需要针对实际应用场景进行针对性的优化更新[1]。在认知无线网络中,中继策略优化算法需要结合次用户的功率控制,同时要满足对主用户的服务质量(Quality of Service,QoS)及干扰约束需求,在此基础上进一步提高系统容量[2]。目前,认知无线网络中对中继优化策略的研究,有采用除噪转发(Denoise-and-Forward,DAF)中继策略来满足干扰约束需求,也有基于博弈论提出中继优化策略[3]。本文主要研究认知无线网络中继节点的信道选择和功率分配问题,提出了一种基于协商反馈机制[4]和注水算法的自适应资源分配中继优化策略,使得中继节点能够根据已知信息实现收益最大化。在收益优化过程中,通过采用极大极小法、基于协商反馈机制的博弈算法、注水算法来优化中继策略,提升认知无线网络系统容量。
1 系统模型
认知无线网络联合中继节点信道选择和功率控制的应用场景如图1所示,包括1个认知基站、2个主用户发射机、4个次用户接收机和多个中继节点,其中认知基站负责对中继节点的资源分配管理。设定中继节点集Λ={i|i∈N},次用户能获得下行链路反馈的总信道状态信息,次用户与中继节点根据总信道状态信息协商并反馈,且次用户和中继节点必须满足对主用户的干扰约束,中继节点与次用户进行信息交互时受到主用户信号的干扰[5]。为了更好地对模型进行分析,本文首先对模型进行简化,针对只有单一主次用户的场景分析中继策略模型,然后进一步推广到在多个主次用户场景下的中继策略模型。
图1 系统模型
1.1 单一主次用户场景
单一主次用户场景下,次用户s从中继节点集Λ反馈得到的信道信息ys为:
(1)
(2)
中继节点k的数据通信要满足次用户的QoS需求,设定一个最小值Lk,则有cSINRk≥Lk。进一步设定量化信道噪声干扰下的传输门限,先假设瑞利衰落信道衰落时间T(单位为s),信道数为Nt,n表示量化比特范围,中继节点和次用户必须在T内根据信道状态信息完成信息交互,则交互速率Rf表示为:
(3)
因为主用户给中继节点集反馈信道状态信息,且中继节点要降低对主用户的干扰,使得主用户的传输速率要大于中继节点的反馈速率,即表示为:
(4)
式中,It-n表示主用户给中继节点集反馈信道的状态信息限制n量化比特的控制阈值[7],It-0表示无限制的控制阈值,pp表示主用户p的传输功率,则有:
(5)
信道之间的信道分配矢量存在极大极小情况,一种是利己矢量分配(极小)fk -me,另一种是利他矢量分配(极大)fk -oth。λ表信道变化步长,由此对式(2)中fk提出一种核心分配策略,遍历极大极小,将信道分配矢量表示为:
(6)
设定hp,k表示主用户到中继节点k的信道增益系数,在量化信道状态信息条件下的信道传输功率表示为:
(7)
从极小到极大量化博弈完成功率分配的算法流程如下。
(1)模拟所有信道信息以及信道增益情况,考虑干扰,提取矢量信息。(2)设置λ,此阶段为外部循环,极大极小分配完成矢量优化,遍历信道。(3)设置迭代次数m,此阶段为内部循环,完成矢量条件的功率分配。(4)在步骤3的前提下,完成信号干扰噪声比计算和效用函数计算。(5)对功率分配、信号干扰噪声比、效用函数进行迭代输出,设置目标函数 max uk ∀k∈Λ s.t. ∑k∈Λpk|hp,kfk|2≤It-n∑k∈Λpk≤PtcSINRk≥Lkpk=|hkfk|22|hpfk|2 ∑ki=1pi|hkfi|2+σ20 ;否则,功率减半重新筛选,直到达到终止条件p(m)k-p(m-1)k≤l(l为迭代平稳值),输出平稳的p(m)k=p(m-1)k2。(6)计算uk(p(m)k,flk),输出效用函数。
1.2 多个主次用户场景
在多个主次用户场景中,次用户m接收到的信号传输反馈信道信息y′m可以写成:
(8)
式中,Ns表示次用户数量。考虑误差量化多径信道状态信息[8],中继节点集到次用户m之间的信道增益系数h′m表示为:
(9)
2 博弈问题归纳
(10)
(11)
式中,V表示斜向量,Rtotol表示中继节点总交互反馈约束。
多用户算法博弈流程如下:
(1)得到考虑误差的参数h'm。设定中继节点总交互反馈约束Rtotol并发送给次用户。(2)次用户在rm=RtotolNs和量化信道状态信息h'm=1-2-r*mhm+2-r*mΔ时计算交互速率,并提交给中继节点。(3)中继管理次用户总信道信息并获取一组fm进行转置,并再次广播给次用户。(4)次用户根据信道状态信息对Rtotol速率进行分配,得到rtempm,设置迭代次数L=100,随后计算r*m=max[rminm,min(rtempm,rmaxm)],h'm=1-2-r*mhm+2-r*mΔ。(5)当r*m(L)-r*m(L-1)<0.01时,完成迭代。否则重新回到步骤3。
采取文献[10]容量计算算法:
(12)
3 仿真实验与分析
单一主次用户设置参数如下:信道变化最终步长λ=1,迭代次数M=100,交互的干扰门限It-0=1.5w,衰落时间T=1.5 s,当前交互组中继提供功率Pt=2 W,白噪声N0为1 dB。多用户组设置参数如下:基于单一主次用户参数条件,主用户数Np=2,次用户数Ns=4。
令m=1,2,3,采用博弈论的条件筛选方法进行信道1、信道2、信道3仿真,得到信道的传输功率如图2所示。从图2可以看出,在量化信道条件下,随着功率分配的迭代,传输功率逐渐达到稳定状态,这是因为效用函数分子是关于功率积的平方,且功率博弈不满足条件时会减半重新进行逐层筛选。
采用极大极小算法进行效用函数的验证实验,分别使用接近利己分配方法、极大极小算法(中庸分配)、接近利他分配进行效用值仿真,不同分配方法的效用值如图3所示。从图3可以看出,3种分配方法中,中庸分配达到的效用值最大,因为中庸分配考虑自身利益的同时也将其他信道状况考虑在内,最大化自身效用的同时也最大化其他信道利益,得到的系统效用值最高,展现出博弈算法的优越性;其次,因接近利己分配考虑的是对其他信道干扰达到最小,没有考虑本信道效用,从而不能使系统效用达到最优;同样地,接近利它分配也无法达到系统效用最大,相对而言,对其他信道干扰更大,可能导致信道传输信息功能不能正常运作。
图2 量化信道传输功率
图3 量化信道效用值分析
采用同相正交统计的方法进行信道性能预估,得到信道性能曲线如图4所示,信道性能反映的是当前信号增益经过分配后所能达到的峰值。从图4可以看出,信道3信道性能最好,同时,图2中,信道3的传输功率最高,说明极大极小算法在追求更好的传输效率的同时,使得信道性能达到了最优。因为在功率分配时,极大极小算法将各自效用考虑在内,所以当信道3的传输功率最高时,信道传输性能也达到最佳。
本文所提出的基于协商反馈机制和注水算法的自适应分配中继优化策略、平均资源分配中继策略、不考虑信道状态信息的基于博弈论的中继策略的信道系统容量如图5所示。从图5可以看出,自适应分配中继策略获得的系统容量明显高于其他2种算法,这是因为自适应分配中继策略采用信道统计及协商反馈信息及注水算法,在此基础上进一步进行博弈速率分配,能够自适应选择信道状态相对完美的中继节点,从而有效提升了系统容量。
图4 信道性能估计曲线图
图5 不同算法的信道系统容量对比分析
4 结束语
研究认知无线网络中继策略优化算法过程中,不仅需要考虑用户QoS和干扰约束,还需要考虑由支持主次用户和中继节点之间的信息交互情况引起的大量开销。因此,中继节点的选择需要综合考虑各方面的性能折中。针对中继节点的信道选择和功率分配问题,本文提出一种基于协商反馈机制和注水算法的自适应资源分配中继优化策略,在协商反馈机制基础上,采用注水算法进行自适应功率分配,优化并提升了认知无线系统的容量。但是,本文研究是在共享信道下进行的,从概率论的角度出发,当前信号传输用户不占用此信道时,其他认知用户会考虑占用空闲信道。下一步将从概率论角度出发,研究认知无线系统的信道占用问题。