认知无线网络基于信号博弈的分布式功率控制算法
2012-07-25钟晓峰邹仕洪
桂 丽 钟晓峰 邹仕洪
①(北京邮电大学网络与交换国家重点实验室 北京 100876)
②(清华大学电子工程系 北京 100084)
1 引言
随着无线网络应用和需求的不断增长,无线频谱资源已出现利用率失衡问题[1,2]。动态频谱接入技术的引入,能通过动态调节认知无线网络传输策略,为提高频谱利用率提供有效途径[3]。同时,在认知无线网络中多个非授权用户之间如何合理分配频谱资源成为提高频谱利用率的重点和难点。现有认知无线网络资源分配方法可分为集中式[4,5]和分布式。集中式通过中心控制实现资源分配最优化控制,虽实现简便但灵活性不足;与之相对的分布式资源分配则可根据本地通信状况,用户间协调进行功率分配,该策略更适合认知自组织网络场景。考虑到用户间的竞争关系,基于博弈论的功率分配方式成为研究热点[6-13]。经典的Stackelberg模型被广泛应用于描述认知网络主次用户资源分配的关系[6-8]。但以上研究缺乏对分布式用户信道信息不对称特性的考虑,大多数研究假设用户通过控制信道共享信息,而控制信道在认知无线网络中实现具有较大难度。
本文对认知无线网络环境下分布式功率分配进行深入研究,提出基于信号博弈的分布式功率控制协议Decentralized Power Control protocol based on Signaling Games, DPC-SG)。本文考虑两对次用户同时进行能量分配,首先在能量预分配阶段通过信号机制共享信道状态信息,该信息能有效避免次用户选择相同信道导致功率分配冲突,在此基础上,次用户达到吞吐量最大化。仿真结果验证了信道信息估算的可行性以及该算法性能的提升。
2 系统建模
2.1 网络模型
网络模型为主用户与次用户共存的网络。主用户为蜂窝网络,包含一个发送端和两个接收端;次用户网络为自组织网络模式,本文仅考虑两对次用户。如图1所示,PUt和PUr分别为主用户收发端,SUt和 SUr分别为次用户收发端,其中gij表示次用户i到次用户j的信道增益(如g12表示次用户1到次用户2信道增益)。文中主用户和次用户发送功率固定为Pp和Ps。主用户与次用户共享多个正交信道,表示为C={C1,…,CK},这里K为信道数目。文中信道为高斯白噪声信道。
图1 网络结构
2.2 功率分配的博弈模型
认知无线网络中,主用户相对于次用户对授权频谱享有优先使用的权利,在授权允许下,主用户可任意切换信道。由于主用户享有的优先权,次用户只能伺机接入主用户暂时不使用的空闲频谱空洞。同时,当主用户重新占用该频谱空洞时,次用户面临能量重新分配的问题。本文主要研究次用户能量在分布式环境下重新分配能量的博弈过程。博弈过程中,假设次用户为博弈者,策略空间为次用户在各信道上的能量分配,表示为
为次用户i功率分配策略,为次用户i在信道k上分配功率值,信道功率之和为Ps。次用户i的吞吐量为博弈的效用函数为
其中gij为次用户i发送端到次用户j接收端的信道增益,这里使用“-i”表示除开用户i的其他用户。这里假设信道增益不随时间改变。
在缺少控制信道的环境下,不同次用户对之间信道增益为非对称信息。如gij对于次用户j的接收端已知,但对于次用户发送端i未知,即不完全信息。进而次用户发送端无法估计对于其他用户的干扰,因此在次用户以增加功率以提高效用函数的同时也增加对其他次用户的干扰。次用户博弈时需在最大化效用函数和减少用户间干扰中找到均衡点。
为了保证次用户正常传输,每对次用户之间需保证信噪干扰比高于一定阈值:
3 基于信号博弈的分布式功率控制算法
本节主要介绍DPC-SG算法。次用户功率重分配主要包含3个阶段,如图2所示。
图2 DPC-SG流程图
如图2所示,主用户切换至信道κ,正在使用κ信道进行传输的次用户 1,次用户 2为保证主用户正常传输,在探测到主用户信号后,在下一时隙开始进行功率重分配。次用户功率重分配主要包括 3个阶段。下面详细介绍DPC-SG的详细设计,并对该算法均衡性质进行分析。
3.1 DPC-SG功率分配信号博弈算法
第1阶段:功率预分配
首先次用户检测到信道κ被主用户占用,停止在该信道上的传输并进行初始化。次用户探测各信道能量,表示为Pc={Pc,1, …,Pc,K}。算法1(表1)表示第i个次用户对功率分布的计算。其中表示第i个次用户在信道k上分配功率,该量对于用户i已知,因此将该信道上探测到的能量Pc,k与已分配功率相减即为次用户-i在该信道分配功率;否则该信道被主用户暂用,则次用户分配功率为 0。如此循环,在K个信道上分别求出次用户-i分配功率。综上,次用户i,-i分配功率的余量分别表示为α,β,即为次用户1,次用户2待分配功率量。
功率预分配之前,次用户发送端首先等待一个随机时延值。等待过程中监听信道上能量分配状态。如果能量发生变化,则表明另一用户时钟到时,已经开始能量预分配,此时该节点则停留在监听状态,获取能量预分配结果;如果在时钟到时前,各信道没有进行能量预分配,则该节点进行预分配。本文假设次用户1时钟先到时,开始进行功率预分配。此时信道增益g21对于SU2未知,且范围在(0,1)。具体预分配步骤如下:
表1 功率分布计算
步骤 1 引入布尔值指示向量V1={V1,1,…,V1,K}表示次用户1可用来分配功率的信道,初始化为1表示可以分配,信道挑选准则如下:
(1)排除被主用户占用的信道:V1κ← 0;
(2)排除主用户1无法达到信噪干扰比阈值的信道,对于k=1,…,K:
满足式(4)则:V1k← 0 。
步骤 2 次用户 1计算在各信道上分配功率α对应效用函数值:
次用户1根据式(5)效用函数,按比例决定功率预分配策略:
第2阶段:次用户2功率重分配
此阶段次用户2通过估计信道增益来重分配功率。观察到次用户1功率预分配之后,次用户2虽无法精确获知信道增益g21值,但可以此估算信道增益范围,并确定功率分配策略。具体步骤如下:
步骤1 如第1阶段步骤1,确定可选信道布尔指示向量,准则如下:
(1)排除被主用户占用的信道:V2κ← 0;
(2)排除主用户2无法达到信噪干扰比阈值的信道,对于k=1,…,K:
满足式(7)则:V2k← 0 。
步骤 2 次用户 2计算各信道上分配功率β后效用函数值。由于信道被占用状况不同,如果只被次用户2占用,仅需考虑效用值的大小;如果同时被次用户1占用,则需考虑次用户2对于次用户1的干扰。因此次用户2需要估计g21值,以避免对次用户1的干扰。记
第3阶段:次用户1功率重分配
最终次用户1只需要选择预分配时能量分配最多的信道进行传输,此时次用户1能保证不干扰主用户,同时由于次用户2在上述阶段中的能量分配已经排除次用户之间的干扰,因此次用户1无需考虑任何干扰问题,直接将能量P1分配至最偏好的信道即可。
3.2 均衡分析
式(11)表示如果两对次用户同时分配能量在该信道时,次用户2的信噪干扰比;
式(12)表示如果两对次用户同时分配能量在该信道时,次用户1的信噪干扰比最小值。
如果式(11),式(12)值均大于信噪干扰比阈值则次用户1,次用户2策略同(1),否则策略为
即次用户2将能量分配至吞吐量次高的信道。
4 仿真与性能比较
本文在MATLAB上仿真DPC-SG算法,对信道增益估计算法的性能进行了衡量,同时与现有类似算法进行比较。进一步体现本文算法的可行性以及高效性。
4.1 仿真设置
假设范围为200×200的区域,每个PU和SU的传输功率为43 dBm和20 dBm。主用户传输仅占用一个信道进行传输。所有用户随机分布在区域范围内。次用户之间的信道增益设为(10/d2),这里d为发送端到接收端的距离。文中假设次用户对在能量预分配之前,能量在各信道中随机分配。仿真设定次用户和主用户可维持传输的最低信噪干扰比为10 dB。后续仿真过程衡量了信道增益估计的准确性,同时和文献[15]中已有算法进行性能比较。
4.2 信道增益估计性能
本节中主要衡量DPC-SG算法中关于信道增益估计的可行性和性能。通过该增益估计发送端能对传输带来的干扰有大致估计,当其他 SU的 SINR值很有可能低于正常传输SINR阈值时,可以避免由此造成的冲突,因此该步骤对于后续决定至关重要。
本节仿真中,设定从次用户2发送端到次用户1接收端的信道增益为 10-2,信道总数分别设为 5,10, 15,并将信道增益过程在不同信道个数的情况下运行1000次。结果如图3中所示。其中横轴表示信道增益估计值,纵轴为信道增益估计的积累分布函数值Cumulative Distributed Function, CDF)。图中可见,当信道数目增加时,算法对于信道增益估计值收敛速度加快,信道数目为15和10的场景在10-2时就已经收敛到90%以上,与真实值较接近。上述现象是由于信道数目多时,信道增益估计会有更多效用函数大小比较的参考值,因此准确性随比较次数增加。
4.3 性能比较
在文献[15]中采用贝叶斯高斯干扰(Bayesian Gaussian Interference, BGI)博弈算法来进行分布式功率分配控制。该博弈最终能达到贝叶斯纳什均衡。同时该算法证明当每个用户都选择将能量平均分配至每个信道时,则该策略能达到唯一单纯策略贝叶斯完美均衡。
本节仿真将DPC-SG算法与BGI算法进行比较。该仿真运行20000次,横轴为信道数从5增至15,纵轴为效用函数的平均值。仿真结果如图4所示,DPC-SG算法中SU的平均效用函数值明显高于BGI算法中对应SU平均效用函数值。原因在于,BGI中缺乏对信道干扰和信道增益的估计,导致在功率分配之后,干扰冲突的存在明显降低了成功传输的概率。而DPC-SG算法在该方面的估计机制有效增加了总体性能。根据数据显示在DPC-SG算法中,次用户 1,次用户 2的平均效用函数值相对于BGI算法分别提升了 29%和 23%。由此可见,DPC-SG算法由于信道干扰估计能在维持较稳定且较优的性能。
图3 信道增益估计性能
图4 次用户吞吐量比较
5 结束语
本文介绍了认知无线网络环境下在授权频谱上基于信号博弈的分布式功率分配算法。信号博弈为分布式环境下能量预分配提供理论基础,在信息不对称情况下,博弈者无需中心控制,通过信息交换完善信道增益信息集。基于以上机制,本算法能有效降低分布式功率分配可能产生的冲突,同时本算法对于信道增益的估计值在信道数目增至10-15个时能达到理想效果。同时在与现有分布式功率分配算法的比较中可以得出,DPC-SG算法效用函数要明显高于已有算法BGI,该优势得益于对于干扰的估计以及冲突的避免。
[1]Federal communication commission spectrum policy task force[R]. Report of the Spectrum Efficiency Working Group,2002.
[2]Marinho J and Monteiro E. Cognitive radio: survey on communication protocols, spectrum decision issues, and future research directions[J].Wireless Networks, 2012, 18(2):147-164.
[3]Zhao Q and Swami A. A survey of dynamic spectrum access:signal processing and networking perspectives[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, Honolulu, HI, United States, April 15-20, 2007:IV1349-IV1352.
[4]Ngo D T, Tellambura C, and Nguyen H H. Resource allocation for OFDMA-based cognitive radio multicast networks with primary user activity consideration[J].IEEE Transactions on Vehicular Technology, 2010, 59(4):1668-1679.
[5]Hoang A T and Liang Y C. Power control and channel allocation in cognitive radio networks with primary users’cooperation[J].IEEE Transactions on Mobile Computing,2010, 9(3): 348-360.
[6]Bloem M, Alpcan T, and Basar T. A stackelberg game for power control and channel allocation in cognitive radio networks[C]. Proceedings of the 2nd International Conference on Performance Evaluation Methodologies and Tools,Brussels, Belgium, 2007: 1-9.
[7]Omidvar N and Khalaj B H. A game theoretic approach for power allocation in the downlink of cognitive radio networks[C]. 2011 IEEE 16th International Workshop on Computer Aided Modeling and Design of Communication Links and Networks, Kyoto, Japan, June 10-11, 2011:158-162.
[8]He Gao-ning, Samson L, and Yezekael H. Stackelberg games for energy-efficient power control in wireless networks[C].IEEE International Conference on Computer Communications, Shanghai, China, April 10-15, 2011:591-595.
[9]Lorenza G and Christina I. Bayesian potential games to model cooperation for cognitive radio with incomplete information[C]. IEEE International Conference on Communications, Dresden, Germany, June 14-18, 2009: 1-6.
[10]Lin Y E, Liu K H, and Hsieh H Y. Design of power control protocols for spectrum sharing in cognitive radio networks: a game-theoretic perspective[C]. IEEE International Conference on Communications, Cape Town, South Africa,May 23-27, 2010: 1-6.
[11]Yang C, Li J, and Tian Z. Optimal power control for cognitive radio networks under coupled interference constraints: a cooperative game-theoretic perspective[J].IEEE Transactions on Vehicular Technology, 2010, 59(4):1696-1706.
[12]Shashika M K B and Nandan R. Joint power and rate control for spectrum underlay in cognitive radio networks with a novel pricing scheme[C]. IEEE Vehicular Technology Conference, Ottawa, ON, Canada, September 6-9, 2010: 1-5.
[13]Yu H, Gao L, Li Z,et al.. Pricing for uplink power control in cognitive radio networks[J].IEEE Transactions on Vehicular Technology, 2010, 59(4): 1769-1778.
[14]Gibbons R. Game Theory for Applied Economists,Princeton[M]. New Jersey: Princeton University Press, 1992:183-210.
[15]Adlakha S, Johari R, and Goldsmith A. Competition in wireless systems via Bayesian interference games[OL].http://arxiv.org/abs/0709.0516, 2007, 9.