基于动态价格调整的博弈论频谱分配算法∗
2019-12-26宇胡
程 宇胡 诗
(1.海军驻武汉地区第五军事代表室 武汉 430205)(2.武汉数字工程研究所 武汉 430205)
1 引言
海上编队通信环境下用频需求数量多,编队内各通信设备用频需求相互之间存在冲突。另外,电磁兼容设计也是需要考虑的问题之一,但是受到狭小的舱外空间以及拓扑动态特性的限制,通过设计布置等手段仍然无法完全解决,必须采用动态频谱管理手段弥补电磁兼容设计的不足[1]。
认知无线电动态频谱分配技术的实现使得系统能够通过有效地利用频谱资源,满足不同用户对频谱资源的灵活需求,从而提高了系统频谱利用率和抗干扰能力[2]。博弈论作为一种有效的资源分配方法[3],得到了较多研究人员的关注。文献[4]设计了基于收益和花费的认知用户效用函数,并结合多主多从Stackelberg模型提出了一种分布式迭代频谱分配算法。文献[5]讨论了非合作博弈、合作博弈以及随机博弈在认知无线电网络频谱分配中的应用。文献[6]考虑了认知网络中存在多个授权用户和认知用户之间发生频谱竞争博弈的问题。文献[7]通过建立认知用户同时接入多个主用户没有使用的频谱、把拥塞程度考虑到目标函数中的干扰感知频谱接入博弈模型,从而研究了非合作频谱接入博弈。Niyato等分析了集中式频谱会大大增加控制信道信令传输开销,提出了基于Cournot博弈的分布式频谱分配算法,减小了控制信道信令开销[8]。授权用户空闲频谱资源数量影响其共享频谱的意愿,文献[9]通过在授权用户的效用函数中引入动态边际成本参数,实现了授权用户和认知用户之间的供需平衡。为了使频谱分配更加合理,最大化空闲频谱利用率和授权用户收益,文献[10]采用二次边际成本函数建立授权用户的效用函数,通过薄利多销的策略刺激授权用户申请到更多的频谱资源,从而达到系统利益最大化。但这些算法均未考虑因频谱感知不准确造成的频谱分配过程中有失公平的问题。
针对频谱分配过程中如何惩罚影响授权用户的正常通信服务质量的认知用户的问题,本文提出了一种基于动态价格调整机制的认知用户间博弈论频谱分配算法。通过在博弈论效用函数中引入置信度和优先级参数,允许频谱管理中心动态调整对各认知用户的频谱要价,改进的效用函数受认知用户优先级和置信度的共同影响,可以更灵活地保障认知用户多样化的业务传输需求,体现了频谱分配的公平性和对授权用户合法权益的保护。
2 认知用户间博弈频谱分配模型
在编队动态频谱管理系统中,通常包含一个频谱管理中心和N个认知用频装备。所有授权用户的空闲频段聚合成频谱池统一由频谱管理中心分配。认知用户i通过博弈,以价格ci获取频谱bi的共享使用权,随后可自主在此频段上使用自适应调制编码技术进行通信传输。在动态频谱分配过程中,频管中心采用认知用户间博弈的方式决定频谱分配方案,同时为了实现编队频谱资源的统一管理和合理分配,认知用户需在频管中心制定的规则和监督下完成博弈,即将无中心的博弈过程和有中心的分配方式相结合。图1中频谱池中灰色部分表示授权用户已占用的频谱,白色部分bi(i=1,…,N)表示分配给认知用户i的频谱。
频谱共享的博弈模型可以表示为
式中N为参加博弈的用户数目;bi∈Bi为认知用户i可选择的有限的策略,即认知用户向频谱管理中心申请的频谱带宽;Ui,i∈N为认知用户在博弈中的效用函数,其收益与授权用户要价、自身的博弈策略和其它用户的策略有关。
图1 频谱分配系统模型
3 置信度加权的效用函数
根据古诺博弈模型[11],建立认知用户的效用函数如下:
式中ri为认知用户i单位传输速率所获得的收益;ki为认知用户i通信的频带利用率;bi为认知用户i申请的频谱数量;P为频谱管理中心对每单位频谱带宽的定价;c为价格调控因子。该公式表明,认知用户并不是申请越多的频谱资源越好,最优的策略是提高自身通信效率,申请满足业务传输需求的最小频谱资源。
在传统的博弈论频谱分配过程中,授权用户对每单位频谱带宽的定价通常有如下形式的定义[12]:
授权用户定价的主要依据是认知用户申请的共享频谱带宽,对不同的认知用户无差别对待。然而在实际应用中,各用频设备所承载的业务具有不同的传输优先级,动态频谱管理系统需要保证高优先级业务的通信传输的频谱需求。具有高优先级业务通信传输任务的认知用户在博弈过程中应该获得低价竞买权,即在相同出价的情况下可以给予更多的频谱资源。改进的价格函数有如下表达式:
式中ω为优先级加权值,αi∈[0,1]为引入的优先级参数,当αi=1时表示该认知用户业务优先级最高,此时价格函数蜕变为式(3)所述的传统价格函数;随着认知用户业务优先级降低,参数αi值逐渐减小。通过优先级参数的调整,优先级高的认知用户可以以更低的价格竞争到更多的频谱资源,充分利用空闲频谱实现高效、可靠传输。
动态频谱管理系统应用的前提是认知用户具有快速、准确的频谱感知能力,然而在实际的认知无线电系统中,由于电磁环境的复杂性、时变性,以及船体的遮挡等非理想因素,每个认知用户的频谱感知结果准确率不同。认知用户只能在授权用户不使用其授权频段时才被准许接入该频段进行数据传输,一旦检测到授权用户的回归,必须立刻退出该频段,避免对授权用户的合法、正常通信造成干扰。若认知用户未能及时、准确感知到授权用户的出现,必然会干扰授权用户的通信,成为该频段非法用户。另外每个认知用户均是自私的,动态频谱管理系统必须维持整个无线通信网的用频秩序,保障用户间的频谱博弈合理、高效和公平。对于不遵守动态频谱共享规则,且实际已影响授权用户的正常通信服务质量的认知用户,动态频谱管理系统惩罚其违规行为,提高下次频谱要价。所以,在式(4)所述的价格函数基础上,增加置信度参数βi。改进后的价格函数表达式为
式中βi∈(0,1)代表动态频谱管理中心对认知用户i设置的置信度,不同置信度的设置使得认知用户i在博弈过程对频谱的出价不同,置信度越低,竞争获得同等频谱资源时所付出的成本就越高,体现了动态频谱分配的公平性原则。为了直观体现优先级和置信度与频谱价格之间的关系,图2仿真了动态价格函数的三维图。仿真参数设置如下:bi=1,bj≠i=1 ,N=10 ,ω=1 ,αi=[0.05,0.1,…,1] ,βi=[0.05,0.1,…,1]。
如图2所示,频谱价格受认知用户优先级和置信度的影响程度不同。根据传输业务的重要性设定若干不同等级的认知用户优先级,其对频谱价格的影响呈线性变化,即优先级越高(越接近1),动态频谱管理中心对该认知用户的频谱要价越低。置信度体现了对干扰授权用户通信的认知用户的惩罚程度,随着置信度的降低(趋向于0),动态频谱管理中心对该认知用户的频谱要价越高,且增加速度呈指数增加,这是因为具有过低置信度的认知用户将严重影响授权用户的通信,严重扰乱动态频谱管理的频谱共享秩序。总之,改进后的频谱要价函数更加符合动态频谱管理的需求,提供更加灵活、高效、公平的频谱分配策略。
图2 动态价格函数三维图
4 基于动态价格调整机制的博弈论频谱分配算法
4.1 动态价格调整机制流程
图3为动态价格调整机制的流程图。
图3 动态价格调整机制流程图
动态频谱管理系统上线运行时初始化所有认知用户的置信度为βi=1,i=1,2,…,N,同时感知认知用户业务优先级。在频谱共享接入过程中,若授权用户重新接入信道i,系统首先根据业务智能感知结果刷新当前认知用户优先级,然后判断认知用户i是否及时退出信道i。如果认知用户未能及时退出信道i,并对授权用户的通信造成了干扰,则降低认知用户i的置信度,令=βi-λβi,其中λ∈(0,1)为置信度调整因子,控制着系统对认知用户违规行为的敏感度;当接受惩罚的认知用户通过提高频谱感知和切换能力,避免了对授权用户的干扰,系统则提高认知用户i的置信度,令=β+λβ,此处类似股票涨停与跌停之间的关ii系,若想恢复到原置信度水平,认知用户需要经过多于被降低置信度的次数来提高置信度。通过频谱动态价格调整机制,保证了授权用户的用频安全和认知用户的用频需求,体现了用户间频谱博弈的公平性。
整理可得到新的认知用户i的效用函数:
其中第一项表示认知用户i利用申请的带宽为bi的频谱进行通信传输的预期收益;第二项表示认知用户i租借频谱所要支付的成本费用。所有的认知用户只能通过调节自身的策略,并与频谱管理中心交互来进行博弈,从而得到认知用户的纳什均衡解[13],即系统频谱分配进入了稳态。
4.2 基于动态价格调整机制的博弈论频谱分配算法描述
动态博弈频谱分配算法如下所示。
表1 动态博弈频谱分配算法
5 实验仿真与分析
本节采用Matlab软件对所提博弈论频谱分配算法进行数值仿真。为了方便分析,不失一般性,假设海上编队动态频谱管理系统中某一超短波频段内有两个用频设备需要通过博弈获取动态频谱资源,即N=2。该频段可用于共享的最大频谱带宽为W=40MHz。所有认知用户的单位传输速率的 收 益 为ri=10,i∈[1,…,N],目 标 误 比 特 率=10-5,优先级加权值ω=1,认知用户业务优先级αi和置信度βi根据不同的对比条件在仿真中进行设定。另外,认知用户申请的频谱带宽初始值设定为bi(0)=1,i∈[1,…,N]。
图4给出了在不同的收敛速度调整因子设置下两个认知用户的动态博弈过程。设认知用户1的SNR1=12,优先级α1=1,置信度β1=0.8,认知用户2的SNR2=10,优先级α2=1,置信度β2=0.8,并分别取a1=a2=0.1和a1=a2=0.14两组不同的收敛速度调整因子进行对比。
图4 不同情况下认知用户动态博弈过程
从图4可以看出,两个认知用户在每次博弈过程中分别调整自身申请的频谱带宽。当认知用户经过多次调整自己申请的频谱带宽后,系统达到纳什均衡,即收敛到使自身收益最大的频谱带宽。两组调整因子下的认知用户1最终分配的频谱带宽均大于认知用户2,表明信道质量好的认知用户具有竞争到更多频谱资源的优势。另外对比两组调整因子的仿真结果可以看出,调整因子越大,虽然认知用户可以更快的从初始带宽接近到最终分配的频谱带宽,但是显然博弈过程曲线波动更大,收敛时间也更长。若调整因子设置过小,博弈达到稳定点需要更多的迭代次数;若调整因子设置过大,博弈过程将一直在收敛点附近抖动,无法收敛。
接下来,将采用控制变量法来进行仿真,分别分析认知用户优先级和置信度对频谱分配结果的影响。首先假设认知用户1的SNR1=10,置信度β1=0.8,认 知 用 户 2的SNR2=10,置 信 度β2=0.8。图5呈现了在认知用户1的优先级α1不变时,两个认知用户申请的频谱带宽随认知用户2的优先级α2变化的曲线。
图5 优先级对认知用户申请带宽的影响
由图5可见,当认知用户1固定为某一优先级时,随着认知用户2的优先级提高,其申请到的频谱带宽不断增加,而对于认知用户1来说,由于其竞争优势被抑制,申请到的频谱带宽不断减少。当两个认知用户的优先级相同时,两条曲线存在一个交点,此时两用户竞争优势相同,竞争到的频谱带宽也相同,符合市场规律。对比认知用户1的优先级分别为α1=0.5和α1=0.8时的两组仿真结果可以发现,当α1=0.8时的两曲线交点对应的申请到的频谱带宽大于当α1=0.5时申请到的频谱带宽,这说明在总共享频谱带宽内,提高认知用户的优先级,系统总的收益也会增加。另外,仿真结果也验证了认知用户优先级的线性影响特性。同样,当α2不变,α1变化时,仿真结果类似。
图6讨论了认知用户的置信度参数对频谱博弈结果的影响。仿真中假设认知用户1的SNR1=10,优先级α1=1,认知用户2的SNR2=10,优先级α2=1。如图6所示,随着置信度β2的提高,认知用户2申请到的频谱带宽不断增加。当两个用户置信度βi相等时,认知用户之间的竞争力完全相同,最终申请到的频谱带宽也相同,所以两条曲线此时相交。当把认知用户1的置信度由β1=0.2提高到β1=0.6时,认知用户1申请到的频谱带宽曲线明显上移,表明其在频谱博弈过程中的竞争优势得到提高。从图6还可以看出,当认知用户的置信度较小时,取值的改变对申请的频谱带宽的影响要大于置信度较大时,即动态频谱管理系统对置信度较小的用户惩罚力度更大,进而可以更好地维护授权用户合法的用频权益,体现了高效、公平的原则。
图6 置信度对认知用户申请带宽的影响
6 结语
针对频谱分配过程中如何惩罚影响授权用户的正常通信服务质量的认知用户的问题,本文提出了一种基于动态价格调整机制的认知用户间博弈论频谱分配算法。该博弈过程的效用函数引入了认知用户业务优先级和置信度两个参数,联合控制动态频谱管理中心对认知用户的频谱要价。考虑实际场景,设置优先级对频谱价格的影响呈线性变化,而置信度对频谱价格的影响呈指数变化。仿真和实验结果表明,所提算法设置的效用函数更加合理,不仅能够保护授权用户的合法用频权益,更保证了认知用户多样化的用频需求。