认知网络中基于博弈论的联合功率控制与速率分配算法
2017-09-03巴少为杜清敏
朱 江,巴少为,杜清敏
(重庆邮电大学 重庆市移动通信重点实验室,重庆 400065)
认知网络中基于博弈论的联合功率控制与速率分配算法
朱 江,巴少为*,杜清敏
(重庆邮电大学 重庆市移动通信重点实验室,重庆 400065)
(*通信作者电子邮箱Kammybaba@163.com)
针对认知无线网络上行链路中的资源分配问题,提出了一种适应于多小区认知无线网络的基于功率控制与速率分配的博弈算法。为了更加合理地控制用户的功率和速率,减小各次用户间的干扰,首先,在效用函数中分别给功率和速率设置了不同的代价因子,使其能够更加合理地控制用户,避免用户过度增加发射功率。其次,从理论上证明了该算法纳什均衡的存在性、唯一性以及算法的收敛性。最后,为了解决发射功率和传输速率的最优化问题,给出了联合功率控制和速率分配的迭代更新算法流程图。理论分析及仿真结果表明,与同类博弈算法相比,在保证通信质量的前提下,所提算法可以使得用户以较小的发射功率获得较大的传输速率和较高的信干噪比(SINR),并且减小了用户间的干扰,提高了次用户系统容量。
认知无线电; 博弈论; 多小区; 功率控制; 速率控制
0 引言
认知无线网络中,功率控制技术是解决主、次用户共存网络中的干扰问题的关键技术。近年来,博弈论被广泛地应用到功率控制的研究中。文献[1]是经典的分布式功率控制算法,该算法比较简单容易实现,但是该算法下的次用户的发射功率较大,导致用户间的干扰较大。文献[2]提出的K-G算法由于过于强调降低能量的消耗而使得自私用户付出的代价较大,部分次用户的信干噪比(Signal to Interference plus Noise Ratio, SINR)值达不到信干噪比阈值而影响通信质量。文献[3]在K-G算法的基础上将信道增益因子引入到效用函数中,提出了一种自适应的功率控制算法,有效地降低了用户的发射功率,并提高了收敛速度。文献[4]提出了基于斯坦克伯格博弈的功率控制算法,该算法考虑了宏基站的效益,但是其纳什均衡点不是唯一的。文献[5]提出了一种新的功率控制算法,将用户间的公平性纳入算法内,系统公平性得到一定的改善。文献[6]提出了一种新的非合作博弈模型下的功率控制算法。算法主要通过构造基于信干噪比(SINR)的正切型代价函数来减少迭代次数,从而提高收敛速度。文献[7]提出了一种有效的功率控制算法提高了收敛速率和系统容量。
以上文献都是在用户传输速率固定的前提下对功率进行优化的,只考虑了单个资源的优化情况。然而现代无线通信系统是支持多媒体业务的综合性平台,不同的媒体业务对传输速率和服务质量(Quality of Service, QoS)的需求不同,为了满足多业务的服务,不仅要对用户进行功率控制,还要对用户的传输速率进行控制。文献[8]提出了一种基于干扰管理的功率速率联合控制算法,加强了主用户在干扰控制中的主观能动性。文献[9]提出了一种基于分层博弈的联合功率速率控制算法,先设定一个关于速率的效用函数,求出达到均衡时的速率值,再将该速率值固定输入到功率控制层中,该模型减少了网络的功率消耗,提升了节点间的数据传输速率,但是这种分层的联合功率速率博弈模型不仅过程复杂而且过程不太合理。文献[10]研究了联合功率控制和频谱检测算法,达到了最大化系统吞吐量的效果。文献[11]分别为速率和功率设置了代价因子,但是功率和速率的代价因子相同,没有考虑到功率和速率的差异性,不够合理。文献[12]提出的联合控制算法采用了经典的效用函数,但是该模型中对于功率和速率的代价因子的设定过于简单,没有考虑对主用户的保护和公平性。文献[13]在代价函数中设计了基于传输速率公平性的惩罚因子,同时还考虑了认知用户受到的干扰,但效用函数的设计过于简单,没有考虑到功率和速率的资源差异性。
本文在考虑到功率和速率资源差异的基础上分别为功率和速率设置了不同的代价因子,优化后的效用函数对博弈中自私用户的惩罚更为合理,并证明了该算法纳什均衡的存在性和唯一性。仿真结果表明,相对于文献[11]算法,本文算法下的次用户在不干扰主用户正常通信的前提下发射功率有所下降,次用户的传输速率有所提高,信干噪比也较大,提高了系统容量,获得了较好的性能。
1 功率速率联合控制系统模型
(1)
(2)
那么,第i个次用户的信干噪比重新定义为:
(3)
图1 频谱共享认知网络模型
max{ui(pi,ri)}
(4)
每一个用户在其速率功率的策略空间内最大化其效用。
通常认为,当以下三个条件均满足时,该效用函数是可行的:
1)每个次用户可以得到较大的信干噪比;
2)每个次用户得到较大的传输速率;
3)当信道条件差或者干扰较大时,每个次用户通过增大发射功率或者减小数据传输速率来保证自身的通信质量。
为此,本文提出了一个分别为功率和速率设置了不同代价因子的效用函数:
(5)
1.1 纳什均衡的存在性和唯一性的证明
纳什均衡是一种使得每个网络用户对其他网络用户最优反应的策略组合,当没有用户单独行动而增加自身收益时,就达到纳什均衡。但是,在分布式网络中,每个认知用户都是自私的,都想通过最佳功率和速率水平来实现自身利益的最大化,这样就可能导致纳什均衡发射功率和速率可能不存在,或者纳什均衡点不唯一,所以在求解纳什均衡发射功率和速率时要证明纳什均衡的存在性和唯一性。
1.1.1 纳什均衡的存在性
根据文献[13-14]博弈论的相关知识可知,当博弈模型满足下面的两个条件时,那么这个博弈模型肯定存在纳什均衡:
1)所有参与者的策略空间在欧几里得空间中是非空、闭的有界凸集。
2)ui是连续的拟凹函数。
式(5)的效用函数对pi求偏导得:
(6)
对式(6)再求pi的偏导:
(7)
同理:
(8)
1.1.2 纳什均衡的唯一性
(9)
(10)
2 联合速率和功率更新算法
2.1 算法描述
由博弈论知识可知,任何一个用户单方面改变自身策略所得到的系统收益不会比在纳什均衡点的系统收益高。根据以上分析下面将给出联合速率和功率更新算法。
(11)
(12)
由式(12)可以求得传输速率的最优解。综合式(11)~(12)整理可以得到:
(13)
由式(13)求解得:
(14)
(15)
从式(14)~(15)可以看出,当次用户的信道状态很差或者信道增益比较小,或者其他用户对该次用户的干扰过大时,该次用户会增大发射功率或者减小它的传输速率。
根据式(14),本文给出了功率和速率的迭代公式:
(pn+1,rn+1)=(Ip(pn,rn),Ir(pn,rn))
(16)
其中:
(17)
(18)
求解式(18)得:
(19)
综上所述,此时功率的更新公式为:
(20)
(21)
由式(21)解得:
(22)
综上所述,此时速率的更新公式为:
(23)
经过上面的分析,下面将给出分布式的联合功率控制和速率分配算法,该算法收敛到博弈G的纳什均衡点(ri,pi)。算法描述如下:
1)置初始迭代次数t=0,k=1,并置初始功率p(0)=(p1(0),p2(0),…,pM(0))。
2) 在每次迭代tk时,根据式(16)更新功率值和速率值:
3)当max(|pi(tk)-pi(tk-1)|+|ri(tk)-ri(tk-1)|)≤ξ成立,那么该算法结束。
4) 宣称得到纳什均衡。
5) 否则,置k=k+1,返回第2)步重新开始迭代过程,ξ是精度误差。
根据上面所述的功率速率联合控制公式,本文设计了功率和速率联合迭代算法。
2.2 算法收敛性的证明
功率迭代式可以记为:pk+1=φ(pk)。根据微分中值定理有:
(24)
(25)
存在常数0 (26) 结合微分中值定理得: {|pk+1-pk|≤L|pk-pk-1|}= {|pk+1-p*|≤L|pk-p*|}=L|pk+1-p*-(pk+1-pk)|≤L|pk+1-p*|+L|pk+1-pk| (27) 整理式(27)得: (1-L)|pk+1-pk|≤L|pk+1-pk| (28) 将(1-L)右移得: (29) 同理可知: (30) 图2~4分别显示了3个小区内各次用户的发射功率、信干噪比、传输速率随迭代次数的增加逐步收敛的过程。从图2可以看出,各个小区内次用户的功率和速率达到均衡后其值均在各自的策略空间内,其中距离次用户基站较近的用户由于信道条件较好,其发射功率更低,速率也更高,而小区1内用户数最少,用户间的彼此干扰也相对最小,小区3内用户最多,次用户彼此间干扰较大,其用户的发射功率也相对较大,小区1内的用户在较低发射功率的前提下就可以获得较大的信干噪比和较高的传输速率。同时由图2可以看出,在迭代大概7到8次后算法达到收敛,收敛速度较快符合实时通信的要求。 下面将讨论文献[11]算法和本文算法的对比下次用户的发射功率、传输速率以及信干噪比的性能比较。为了与文献[11]算法比较性能,将两种算法下用户的基本参数设置成一样的,图5~7是在小区1内本文算法与文献[11]算法下各次用户的性能结果对比。 图2 不同小区次用户发射功率收敛曲线 图3 不同小区次用户信干噪比收敛曲线 图4 不同小区次用户传输速率收敛曲线 图5 不同算法次用户发射功率对比 由图5~7可以看出:两种方案下次用户的收敛速度相当,大概迭代7到8次后均能达到均衡。本文算法下次用户的发射功率要远低于文献[11]算法,且在该多小区环境下,文献[11]算法下3个次用户的信干噪比收敛到一个相近的值,这不能满足不同用户对信干噪比需求不同的状况。一般距离基站较近的用户由于信道条件较好,用户的发射功率较低,信干噪比也较高,而距离基站较远的用户信道条件相对较差因而发射功率较大,信干噪比也较小。本文算法下次用户的传输速率要高于文献[11]算法下次用户的传输速率,本文算法下的信干噪比值略低于文献[11]算法下次用户的信干噪比,但均远远满足通信的需求。相比文献[11]算法,本文算法下的次用户在较低的发射功率的前提下获得了较高的传输速率和相当的信干噪比值。这是因为本文算法分别为次用户的发射功率和传输速率设置了不同的代价因子,使得系统对于自私用户的惩罚更为合理,这样各次用户不会为了获得高的传输速率或信干噪比而盲目地提高自己的发射功率,减小了主用户受到的干扰。 图8给出了在不同次用户个数下,两种博弈算法关于次用户吞吐量的比较。从图8中可以看出,两种算法吞吐量性能都随着次用户数目的增多而提升,而本文算法的性能明显优于文献[11]算法,这是因为文献[11]算法下的次用户间干扰较大,明显降低了系统的QoS。 图6 不同算法次用户SINR对比 图7 不同算法次用户传输速率对比 图8 次用户吞吐量比较 本文提出了一个联合功率和速率的分布式博弈算法,在效用函数中根据功率和速率的不同特性分别为二者设置了不同的代价惩罚因子,并结合实际情况在多小区认知无线网络进行了仿真和数值分析。通过仿真结果可以发现,相比文献[11]算法,本文所提算法在较低的发射功率下能获得较高的传输速率,且所获得的信干噪比值也较高,满足通信的需求,并且降低了对主用户的干扰,提高了系统的吞吐量,获得了较高的效用值。由于中断概率[15-16]和干扰门限对认知无线电网络中资源分配具有重要影响,在下一步的工作中,将考虑在干扰门限和中断概率等约束条件下,提出基于斯坦克尔伯格博弈[17]的资源分配算法。 ) [1]GOODMAND,MANDAYAMN.Powercontrolforwirelessdata[J].IEEEPersonalCommunications, 2000, 7(2): 48-54. [2]KOSKIES,GAJICZ.ANashgamealgorithmforSIR-basedpowercontrolin3GwirelessCDMAnetworks[J].IEEE/ACMTransactionsonNetworking, 2005, 13(5): 1017-1026. [3] 罗荣华,杨震.认知无线电系统中一种新的自适应功率控制算法[J].信号处理,2010,26(8):1257-1262.(LUORH,YANGZ.Anoveladaptivepowercontrolalgorithmincognitiveradiosystem[J].SignalProcessing, 2010, 26(8): 1257-1262.) [4]KANFX,ZHANGR,MOTANIM.Price-basedresourceallocationforspectrum-sharingfemtocellnetworks:aStackelberggameapproach[J].IEEEJournalonSelectedAreasinCommunications, 2012, 30(3): 538 - 549. [5]XIEXZ,YANGHL,VASILAKOSAV,etal.Fairpowercontrolusinggametheorywithpricingschemeincognitiveradionetworks[J].JournalofCommunicationsandNetworks, 2014, 16(2): 183-192. [6]YANGHL,XIEXZ,VASILAKOSAV.Stackelberggamebasedpowercontrolwithoutageprobabilityconstraintsforcognitiveradionetworks[J/OL].InternationalJournalofDistributedSensorNetworks, 2015:ArticleID604915. [2016- 10- 09].http://or.nsfc.gov.cn/bitstream/00001903-5/327951/1/1000013968317.pdf. [7]TREUSTML,LASAULCES.Arepeatedgameformulationofenergy-efficientdecentralizedpowercontrol[J].IEEETransactionsonWirelessCommunications, 2010, 9(9): 2860-2869. [8] 马良,朱琦.基于干扰管理的功率速率联合控制博弈方法[J].信号处理,2012,28(1):26-32.(MAL,ZHUQ.Agame-theoreticjointrateandpowercontrolbasedoninterferencemanagement[J].SignalProcessing, 2012, 28(1): 26-32) [9] 贺刚,柏鹏,彭卫东,等.数据链中基于动态博弈的联合功率与速率控制[J].西南交通大学学报,2013,48(3):473-480.(HEG,BAIP,PENGWD,etal.Jointrateandpowercontrolbasedondynamicgametheoryindatalinksystem[J].JournalofSouthwestJiaotongUniversity, 2013, 48(3): 473-480) [10]BAGAYOKOA,FIJALKOWI,TORTELIERP.Powercontrolofspectrum-sharinginfadingenvironmentwithpartialchannelstateinformation[J].IEEETransactionsonSignalProcessing, 2011, 59(5): 2244-2256. [11]JAVANMR,SHARAFATAR.EfficientanddistributedSINR-basedjointresourceallocationandbasestationassignmentinwirelessCDMAnetworks[J].IEEETransactionsonCommunications, 2011, 59(12): 3388-3399. [12]SHASHIKAMANOSHAKB,RAJATHEVAN.Jointpowerandratecontrolforspectrumunderlayincognitiveradionetworkswithanovelpricingscheme[C]//Proceedingsofthe2010IEEE72ndVehicularTechnologyConferenceFall.Piscataway,NJ:IEEE, 2010: 1-5. [13] 余翔,张小银.非合作博弈下功率与速率联合控制算法研究[J].重庆邮电大学学报(自然科学版),2016,28(3):349-353.(YU X, ZHANG X Y. Non-cooperative game of joint power and rate control algorithm [J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2016, 28(3): 349-353.) [14] FUDENBERG D, TIROEL J. Game Theory [M]. Cambridge, MA: MIT Press, 1991: 841-846. [15] YATES R D. A framework for uplink power control in cellular radio systems [J]. IEEE Journal on Selected Areas in Communications, 2006, 13(7): 1341-1347. [16] 郭艳艳,昌厚峰,贾鹤萍.基于公共DF中继的认知无线电中继选择和功率分配[J].测试技术学报,2015,29(2):105-110.(GUO Y Y, CHANG H F, JIA H P. Optimal relay selection and power allocation of cognitive networks based on public DF relay [J]. Journal of Test and Measurement Technology, 2015, 29(2): 105-110.) [17] 李鹏,朱宇.一种异构网络中的斯坦克尔伯格功率控制方法[J].太赫兹科学与电子信息学报,2013,11(3):368-376.(LI P, ZHU Y. A Stackelberg approach on power control in heterogeneous networks [J]. Journal of Terahertz Science and Electronic Information Technology, 2013,11(3): 368-376) This work is partially supported by the National Natural Science Foundation of China (61102062), the Natural Science Foundation of Chongqing Science and Technology Commission (cstc2015jcyjA40050), the Key Science and Technology Research Project of the Education Ministry (212145), the Science and Technology Research Project of Chongqing Municipal Education Commission (KJ120530). ZHU Jiang, born in 1977, Ph. D., associate professor. His research interests include communication theory and technology, information security technology. BA Shaowei, born in 1991, M. S. candidate. Her research interests include cognitive radio technology. DU Qingmin, born in 1990, M. S. candidate. Her research interests include cognitive radio technology. Game-theoretic algorithm for joint power control and rate allocation in cognitive networks ZHU Jiang, BA Shaowei*, DU Qingmin (1.ChongqingKeyLaboratoryofMobileCommunicationsTechnology,ChongqingUniversityofPostsandTelecommunications,Chongqing400065,China) Aiming at the resource allocation problem for the uplink in cognitive radio networks, a game-theoretic algorithm for joint power control and rate allocation adapted to multi-cell cognitive radio networks was proposed. To control user’s power and rate more reasonably and reduce interference among Secondary Users (SUs), firstly, the different cost factors for power and rate were set respectively, so as to control user more reasonably and avoid user excessively increasing transmission power. Then, the existence and uniqueness of the Nash Equilibrium (NE) for the proposed algorithm were proved, the convergence demonstration of the proposed algorithm was given. Finally, for solving the optimization problem of the transmission power and transmission rate, the iterative updating flowchart of the proposed algorithm for the joint power control and rate allocation was presented. The theoretical analysis and simulation results show that, compared with the similar game algorithms, on the premise of guaranteeing the quality of communication, the proposed algorithm can make user acquire higher transmission rate and higher Signal to Interference plus Noise Ratio (SINR) at lower transmission power, reduce the interference among users, and improve the system capacity of SUs. Cognitive Radio (CR); game theory; multi-cell; power control; rate control 2016- 11- 03; 2016- 12- 16 。 基金项目:国家自然科学基金资助项目(61102062);重庆市科委自然科学基金资助项目(cstc2015jcyjA40050);教育部科学技术研究重点项目(212145);重庆市教委科学技术研究项目(KJ120530)。 朱江(1977—),男,湖北荆州人,副教授,博士,主要研究方向:通信理论与技术、信息安全技术; 巴少为(1991—),女,湖北天门人,硕士研究生,主要研究方向:认知无线电技术; 杜清敏(1990—),女,河北石家庄人,硕士研究生,主要研究方向为:认知无线电技术。 1001- 9081(2017)06- 1521- 06 10.11772/j.issn.1001- 9081.2017.06.1521 TN929.5 A3 仿真及结果分析
4 结语