APP下载

一种基于Stackelberg博弈的动态频谱接入策略*

2016-07-01廖云峰鲍丽娜

通信技术 2016年2期
关键词:纳什均衡博弈论

廖云峰,陈 勇,聂 勇,鲍丽娜

(1.解放军理工大学 通信工程学院,江苏 南京 210007;2.南京电讯技术研究所,江苏 南京 210007;3.中国人民解放军75494部队,广西 北海 536004;4.中国联通江苏分公司,江苏 南京 210019)



一种基于Stackelberg博弈的动态频谱接入策略*

廖云峰1,2,陈勇2,聂勇3,鲍丽娜4

(1.解放军理工大学 通信工程学院,江苏 南京 210007;2.南京电讯技术研究所,江苏 南京 210007;3.中国人民解放军75494部队,广西 北海 536004;4.中国联通江苏分公司,江苏 南京 210019)

摘要:频谱地图能向用户提供频谱信息,快速实现频谱接入。针对异构网络中主用户的活动性对次用户购买频谱积极性的影响,在频谱地图的协助下次用户获得主用户的活动概率,并将次用户,频谱运营商构建成三阶段Stackelberg博弈模型,提出了价格补偿方案,实现动态的频谱接入。仿真结果表明,价格补偿方案能有效弥补次用户因信道条件恶化而造成的损失。同时,主用户的活动性会影响次用户的经济行为,运营商根据用户购买需求的变化动态调整频谱售价,使双方收益均达到纳什均衡。最终使得次用户,运营商和频谱授权用户三方同时获得最佳收益。

关键词:频谱地图;动态频谱接入;博弈论;纳什均衡

0引言

随着无线服务和网络的爆炸式发展,无线频谱变得越来越拥挤和稀缺。近年来,以认识无线电为基础的动态频谱接入[1-2]已成为有效利用频谱的重要手段。在一个动态频谱接入网络中,次用户(Secondary Users,SUs)能够伺机地探测空闲的频谱资源,并利用其传输数据。但前提条件是不能对主用户(Primary Users,PUs)造成有害干扰。然而,现在最主要的问题是次用户如何以尽可能低的代价快速有效地检测到空闲频谱。

以前的研究工作主要集中于频谱感知和信道估计[3]。然而,最近的研究表明感知并不是一种有效的途径,因为现在的感知技术还不能达到令人满意的效果。另一方面,美国联邦通信委员会(Federal Communications Commission)出台了一项政策,允许非授权设备通过接入频谱地图数据库获得诸如空闲电视频谱等频谱的信息[4]。在数据库的支撑下,非授权设备不需要感知无线环境,可直接从数据库获得信息。文献[5]研究了空闲电视频谱系统中次级运营商在收益达到均衡时的行为。文献[6]针对如何协调多个认知用户择机接入多段空闲频谱的问题,提出了一种基于无休止多臂赌博机模型的动态频谱接入机制。根据空闲电视频谱的视频变化特性,文献[7]提出了双阶段拍卖模型满足次用户多变的QoS要求。由于频谱的可用性由主用户的活动性和变化的无线环境决定,文献[8]提出了联合本地感知和数据库协助机制来确定信道条件,提高了探测结果的可靠性。考虑到次用户的需求的随机性和异构性的本质,文献[9]提出了联合频谱价格接入允许控制机制,解决了频谱运营商收益最大化问题。次级频谱市场可以有效地为变化的QoS需求提供不同的频谱,文献[10]研究了单个频谱授权用户和多个非授权用户的关系,并设计一种最优合约同时提高双方的收益。在频谱地图数据库的协助下,频谱运营商设计出合理的定价方案为非授权用户(例如次用户SUs)提供共享频谱。考虑到无线环境的多变性,并没有足够的可用频谱能够出租给次用户。因此,运营商需要以相对较高的价格向授权用户(例如主用户PUs)租用授权频谱。

之前的工作很少考虑到主用户的活动性给网络系统带来的影响[11-13]。且对主用户授权网络中的次级频谱市场的场景研究较少。Stackelberg博弈[10,14]是研究这种多级结构模型的主要方法。基于此,本文通过Stackelberg博弈模型研究了异构网络中频谱运营商和次用户的关系,运营商将不同类型的频谱出租给次用户,通过频谱地图获得频谱中主用户的出现概率,并以此动态调整价格吸引用户购买,提出了价格补偿机制,当信道条件因为主用户的出现而恶化时,该机制能有效减少次用户的损失。

1系统模型

在频谱地图数据库的协助下,频谱运营商可以获得频谱空闲概率等相关信息,因此本文主要考虑在频谱地图数据库协助下的异构动态频谱接入网络,频谱运营商可以向次用户提供授权频谱和共享频谱。授权频谱由主用户持有,这种类型的主用户希望将自己的部分频谱出租出去从而获得额外的收益,且这种频谱的信道条件是可以得到保证的。共享频谱同样由主用户持有,但这种主用户不会出租自己的频谱,共享频谱在没有被主用户占用的情况下可以被次用户使用,一旦主用户开始使用共享频谱,次用户就得释放这段频谱。而频谱地图数据库会实时地更新共享频谱的信息并提供给运营商,运营商根据共享信道被主用户占用的概率制定出相应的授权频谱价格策略,吸引更多的用户购买授权频谱从而获得最大的收益。

图1 系统模型

2问题建模和分析

为了求解运营商和次用户的最佳收益,将他们建模成三阶段的Stackelberg博弈模型。在接下来的分析中,首先对提出的价格补偿机制进行描述,然后通过逆推回溯法分析他们各自的最佳收益以及主用户对次用户经济行为的影响。

2.1价格补偿机制

次用户SUi的效用函数应该是随着其需求Di增加而增加的,当授权频谱比例θi增加时,表示更多的次用户选择购买授权频谱,因为此时共享频谱的服务质量要求QoS不能满足用户们的需求。

次用户SUi的效用函数定义成如下形式[14]:

ui=Di[α-φeβ(1-θi)]-[(1-φ)ρs(1-θi)Di+ρlθiDi]

(1)

2.2第三阶段最佳比例

在第三阶段中,次用户需要决定购买多少授权频谱,其效用函数为等式(1)。能够使运营商获得最大利润的最佳授权频谱比例为:

(2)

将优化问题表示如下:

s.t.0≤θi≤θ

(3)

证明:(P1)的效用函数的Hessian矩阵是正定的,且约束都是仿射函数,因此问题(P1)是凸优化问题[16]。

将约束带入目标函数中,通过引入拉格朗日乘子,目标函数表示如下:

(4)

根据KKT条件[16],可以求解出最佳比例:

(5)

(6)

2.3第二阶段最佳定价

在第二阶段中,运营商将根据第一阶段用户的需求制定最佳定价策略使自己能够获得最大收益。通过第三阶段的分析,运营商的效用函数可以表示为:

(7)

当ρl≥ρH时,主用户的收益为0,因此这种情况不用再考虑。

当ρL≤ρl<ρH时,优化问题表示为:

ρlD-ρ0B

s.t.ρL≤ρl<ρH

(8)

与求解等式(1)的方法相同,令拉格朗日乘子等于0,得到最佳授权频谱价格为:

(9)

当ρl<ρL时,优化问题可以表示为

s.t.ρl<ρL

(10)

同样可以求得该问题的最佳授权频谱价格为:

(11)

(12)

(13)

2.4第一阶段最佳出租带宽

在第一阶段中,运营商将决定自己租得的带宽B,但是可以租得的最大带宽Bmax是由主用户决定的。根据第二阶段的分析,运营商的效用函数可以表示为:

(14)

(15)

s.t.0≤B≤Bmax

(16)

问题3同样是凸优化问题,引入拉格朗日函数

(17)

根据KKT条件,

(18)

如果λ=0,将其代入式(18),可以得到

(19)

(20)

根据Lambert函数[17],

(21)

(22)

如果λ≠0

B*=Bmax

(23)

因此,最佳出租带宽为:

(24)

(25)

3仿真结果分析

在本节中,通过数值结果分析系统的性能。在仿真中,可以发现次用户和运营商能够获得纳什均衡解,同时主用户的活动性能够影响次用户对授权频谱的购买积极性。

在整个网络中,假设有4个次用户,总的流量需求分别为D1=80,D2=80,D3=100,D4=150。当次用户接入共享频谱,信道占用概率分别为φ1=0.3,φ2=0.4,φ3=0.5,φ4=0.5。其他参数设置如下,α=22,β=3,主用户出租授权频谱价格为ρ0=1。

图2表示授权频谱比例θ在异构网络中的变化,当共享频谱的信道条件恶化,为了获得高质量的服务要求,更多的次用户选择授权频谱,θ将随着φ递增。同时,从曲线D1和D2可以看出,随着授权频谱需求的增加,运营商需要从主用户租得更多的授权频谱。与曲线D3和D4相比,当流量需求增加,授权频谱的需求量同样增大。

在图3中,随着Bmax增加,为了让更多的用户接入频谱,运营商将降低授权频谱价格,吸引更多用户购买授权频谱,从而使自己收益最大。如果信道条件良好,即φ较低,则ρl较低。因为共享频谱能够满足次用户需求时,运营商必须调整ρl才能吸引更多用户。值得注意的是曲线D3的下降速度明显快于D4,因为运营商根据用户对授权频谱的需求调整价格。例如,D3中的需求是100,D4中则是150,用户组4必须购买更多的授权频谱才能满足自己的通信需求,所以运营商降价较慢。

图2 授权频谱购买比例变化

图3 授权频谱最佳授权价格变化

图4中的4条曲线表明运营商降低价格能获得更大的收益,即更多的用户接入了频谱。当共享频谱信道条件恶化时,授权频谱价格降低,使得授权频谱成为次用户的最佳选择,信道条件良好的情况下降低售价,能吸引更多的用户。同时,运营商也会向主用户购买更多授权频谱,增加了主用户的收益,使得次用户,运营商和主用户的收益均增加。

在图5中,租得的带宽B随着流量需求的增加以及共享频谱的恶化而增加。当次用户达到自己的QoS时,运营商不会从主用户租得更多频谱,因为没有更多的用户需要使用频谱,因此租得的带宽将达到一个均衡值,同时运营商的收入也不会再增加,如图4所示。

图4 运营商收益变化

图5 租得的带宽变化

在提出的价格补偿机制下,购买信道条件较差的共享频谱的次用户能得到更多的补偿以此减少自己的损失。当φ=0.9时,信道条件非常不利于通信,但是在该机制下,用户的收益能提高27.75%。而φ=0.3时,用户的收益仅提高3.05%。此外,信道条件越差,次用户的收益随着出租最大带宽Bmax增加越快,同时,运营商也会向主用户租更多的频谱。见图6。

图6 次用户收益变化比较

4结语

本文研究了主用户出现在共享频谱时次用户的经济行为,并通过Stackelberg博弈模型研究了运营商和次用户的博弈过程,实现了动态的频谱接入,次用户和运营商均获得最大收益。数值仿真结果表明,在共享频谱信道条件恶化时,提出的价格补偿机制减少了次用户的损失并提高了次用户的收益。主用户的频繁出现会刺激次用户购买更多的授权频谱,增加运营商和主用户(授权频谱拥有者)的收益。为了增大自己的收益,有效利用信道条件更好的授权频谱,运营商根据用户的需求动态调整价格,进过多次博弈后,双方的收益值均达到最大,即得到了纳什均衡解。但是,本文只研究了单个运营商的情况。考虑到实际情况,对于多个运营商相互竞争的场景将作为接下来的主要研究工作。

参考文献:

[1]ZHAO Q,Sadler B.A Survey of Dynamic Spectrum Access: Signal Processing,Network,and Regulatory Policy [J].IEEE Signal Processing,2005,24(3):201-220.

[2]徐迪.动态频谱接入综述[J].电子科技,2015,28(03):161-164.XU D.Review of Dynamic Spectrum Access [J].Electronic Science and Technology,2015,28(03):161-164.

[3]兰昆伟,赵杭生,李湘洋等.认知无线电中基于感知门限的频谱预测研究[J].通信技术,2015,48(02):165-170.

LAN Kun-wei,ZHAO Hang-sheng,Li Xiang-yang et al.Spectrum Prediction based on Sensing Threshold in Cognitive Radio Networks[J].Communications Technology,2015,48(02):165-170.

[4]LUO Y,GAO L,HUANG J.White Space Ecosystem: A Secondary Network Operator's Perspective[C]//IEEE GLOBECOM,2013:925-930.

[5]朱江,韩超,杨浩磊等.认知无线网络中基于无休止多臂赌博机模型的多用户频谱接入机制[J].计算机科学,2014,34(10):2782-2786.ZHU J,HAN C,YANG H L,et al.Dynamic Spectrum Access Mechanism of Multi-Users based on Restless Multi-Armed bandit Model in Cognitive Networks [J].Journal of Computer Applications,2014,34(10):2782-2786.

[6]ZHOU H,LIU B,HOU F,et al.A QoS Supported Spectrum Allocation Scheme for Database-Assisted Secondary Access Networks [C]//IEEE ICCC,China,2014:835-839.

[7]LIU Y,YU R,PAN M,et al.Adaptive Channel Access in Spectrum Database-Driven Cognitive Radio Networks [C]//IEEE ICC,2014:4933-4938.

[8]JIANG C,DUAN L,HUANG J.Joint Spectrum Pricing and Admission Control for Heterogeneous Secondary Users [J].In Modeling and Optimization in Mobile,Ad Hoc,and Wireless Networks (WiOpt),2014:497-504.

[9]YIN J,SUN G,WANG X.Spectrum Trading in Cognitive Radio Network: A Two-Stage Market based on Contract and Stackelberg Game [C]//IEEE WCNC,2013:1679-1684.

[10]DUAN L,HUANG J,SHOU B.Duopoly Competition in Dynamic Spectrum Leasing and Pricing [J].IEEE Transactions on Mobile Computing,2012,11(11):1706-1719.

[11]CAO X,CHEN Y,LIU K.Cognitive Radio Networks with Heterogeneous Users How to Procure and Price the Spectrum [J].IEEE Transactions on Wireless Communicaions,2015,14(3): 1676-1688.

[12]LIU Y,TAO M,HUANG J.An Auction Approach to Distributed Power Allocation for Multiuser Cooperative Networks [J].IEEE Transactions on Mobile Computing,2013,12(1):237-247.

[13]YI C,CAI J.Two-Stage Spectrum Sharing With Combinatorial Auction and Stackelberg Game in Recall-based Cognitive Radio Networks [J].IEEE Transactions on Communications,2014,62(11):3740-3752.

[14]FENG X,ZHANG Q,ZHANG J.Dynamic Spectrum Leasing with Users-Determined Traffic Segmentation [C]//IEEE ICC,2013: 6069-6100.

[15]Boyd S,Vandenberghe L.Convex Optimization [M].Cambridge University Press,2004.

[16]Corless R M,Gonnet G H,Hare D E,et al.On the Lambert W Function [J].Adv.Computational Math,1996,5.

A Dynamic Spectrum-Access Scheme based on Stackelberg Game

LIAO Yun-feng1,2,CHEN Yong2,NIE Yong3,BAO Li-na4

(1.Institute of Communications Engineering,PLA University of Science & Technology,Nanjing Jiangsu 210007,China;2.Nanjing Telecommunication Technology Institute,Nanjing Jiangsu 210007,China;3.Unit 75494 of PLA,Beihai Guangxi 536004,China;4.Jiangsu Branch,China Unicom Corporation Limited,Nanjing Jiangsu 210019,China)

Abstract:Spectrum map could provide the users with spectrum information and quickly realize dynamic spectrum access.Considering the impact of primary-user's activities on secondary-user's interest in spectrum trade in a heterogeneous network,the secondary users,with the help of spectrum map,could acquire activity probability of the primary users with spectrum map.The interaction of between the users and spectrum operators is investigated with a three-stage Stackelberg game,and a price compensation scheme (PCS) proposed,thus to realize dynamic spectrum access.Simulation indicates that the PCS could efficiently remedy the secondary-user's loss resulted from the worsened channel condition.Meanwhile,the primary-user's activities could exercise an impact on the economic behavior of secondary users.Operators could dynamically adjust spectrum price in accordance with the secondary user's demands,and thus both of them could reach Nash Equilibrium (NE).Finally,the secondary users,operators and primary users are guaranteed to achieve an optimal profit.

Key words:spectrum map; dynamic spectrum access; game theory; Nash Equilibrium

doi:10.3969/j.issn.1002-0802.2016.02.010

* 收稿日期:2015-09-06;修回日期:2015-12-26Received date:2015-09-06;Revised date:2015-12-26

基金项目:国家自然科学基金(No.61301161,No.61471395);江苏省自然科学基金(No.BK20141070)

Foundation Item:National Natural Science Foundation of China(No.61301161,No.61471395);Natural Science Foundation of Jiangsu Province(No.BK20141070)

中图分类号:TN929.5

文献标志码:A

文章编号:1002-0802(2016)02-0168-06

作者简介:

廖云峰(1989—),男,硕士研究生,主要研究方向为动态频谱管理;

陈勇(1975—),男,硕士,高级工程师,主要研究方向为无线网络,频谱管理;

聂勇(1986—),男,硕士,工程师,主要研究方向为无线电通信;

鲍丽娜(1987—),女,硕士,工程师,主要研究方向为认知无线电,网络管理。

猜你喜欢

纳什均衡博弈论
科学史上十大革命性理论
——博弈论
去产能政策的激励相容安排与系统风险防范
基于纳什均衡的充电桩建设博弈分析
囚徒困境、契约和惩罚
基于纳什均衡的中小企业融资问题探讨
无知之幕与博弈:从“黄灯规则”看博弈论的一种实践方案
樊畿不等式及其在博弈论中的应用
博弈论视角下的建筑工程外包道德风险
博弈论视角下医疗纠纷解决方式选择
评博弈论在反垄断中的应用