APP下载

基于频谱数据库的分布式动态频谱接入算法*

2016-07-05廖云峰田家强鲍丽娜

通信技术 2016年4期
关键词:纳什均衡

廖云峰,陈 勇,田家强,鲍丽娜

(1.解放军理工大学 通信工程学院,江苏 南京 210007;2.南京电讯技术研究所,江苏 南京 210007;3.中国联通江苏分公司,江苏 南京 210019)



基于频谱数据库的分布式动态频谱接入算法*

廖云峰1,2,陈勇2,田家强1,2,鲍丽娜3

(1.解放军理工大学 通信工程学院,江苏 南京 210007;2.南京电讯技术研究所,江苏 南京 210007;3.中国联通江苏分公司,江苏 南京 210019)

摘要:频谱数据库是一种直接获得频谱信息的方式,针对在复杂多变的网络环境中用户之间缺少信息交互,研究了数据库协助和没有数据库情况下的动态频谱接入算法。一方面,次用户通过历史感知数据估计信道的可用性而进行信道选择,另一方面,次用户通过数据库获得更加可靠的频谱信息从而做出策略。证明了用户之间的博弈是一个超模博弈,通过提出的分布式学习算法能收敛到一个纯策略纳什均衡点。仿真结果表明,提出的联合数据库感知算法和数据库协助算法比依靠感知的结果收敛更快,获得的系统吞吐量接近最大,减少了用户决策的时延,提高了频谱利用率。

关键词:频谱数据库;动态频谱接入;学习算法;纳什均衡

0引言

随着无线技术的飞速发展,可用的电磁频谱变得日益拥挤。而一系列报告和频谱测量结果[1-2]却表明一些授权频谱(如电视广播频段)的利用率很低。近年来,以认识无线电为基础的动态频谱接入技术[3-4]已成为研究热点,为提高频谱利用率开辟了一条新的途径。

动态频谱接入通过获得频谱空洞为次用户提供信息传输,即在主用户不使用信道时让次用户接入信道,当主用户重新占用信道时次用户必须让出信道。为了避免对主用户造成干扰,次用户接入信道时首先需要获得频谱信息,方法包括频谱感知和接入频谱数据库。频谱感知技术是一种可以直接获取频谱信息的方法,在国内外已经有很多研究成果[5-7], 文献[7]对信道可用性的历史感知数据进行学习,选择可用性较好的信道,结合多臂赌博机模型和随机机器学习算法,降低了用户冲突,减少了用户的丢包率。但是频谱感知技术对于用户节点来说开销大且感知的性能有限,而通过接入频谱数据库的方式可以获得可靠的频谱信息,为动态频谱接入提供有力的外部支持[8]。文献[9]提出了联合本地感知和数据库协助机制来确定信道条件,提高了探测结果的可靠性。面对多用户接入信道,博弈论是解决多用户相互竞争的有效方法,文献[10]根据次用户的不同偏好和各自对信道的感知建立了二分图匹配,提出了加权冲突博弈,相比于随机接入的方法能获得更高的系统吞吐量。考虑到网络中的用户之间没有信息交互,而数据库能提供可靠的频谱信息,在次用户知道自己可用信道集而不知道其他用户是否使用信道的情况下,文献[11]提出的分布式学习算法能使每个用户获得较好的纳什均衡解,系统吞吐量接近最大值。

频谱数据库存储了包含信道条件,地理位置,干扰等级,用频政策等频谱信息。但之前的工作对基于数据库的频谱接入方式研究较少,由于网络拓扑的复杂性和多变性,用户自己获取电磁频谱信息的方式必然增大用户端设备的复杂性,并且考虑到动态网络环境中次用户之间没有信息交互。为了解决用户端开销大以及用户在接入信道时的冲突问题。本文研究了基于数据库的动态频谱接入方式,用户之间的竞争构成一个惯序浅博弈,并提出了基于数据库的分布式学习算法和联合频谱感知与数据库的分布式学习算法,并与文献[7]中的频谱接入方法做比较。结果表明所提出的算法均能达到一个纳什均衡解,在数据库的支持下算法收敛速率更快,在加快用户决策的同时增大了系吞吐量,且获得的系统吞吐量接近网络的最大值,即得到的信道选择方案接近最优纳什均衡解。

1系统模型和问题建模

1.1系统模型

图1 系统模型

1.2问题建模

假设信道j的带宽为bj。在t时刻,用户i根据从数据库获得的频谱信息,选择信道j接入。由于用户之间没有信息交互,用户i不知道其他用户的信道选择。因此用户i获得的收益可表示为:

(1)

(2)

2博弈分析

由于次用户只选择对自己有利的信道接入策略,且相互之间并不知道别人的选择,因此式(2)可以构建成一个博弈,通过分布式学习算法可以得到纳什均衡解。

(3)

式中,ai∈Ai表示用户i的策略,a-i∈A1×…×An-1×An+1…×AN表示除去用户i以外的用户的策略,×表示笛卡尔乘积。

(4)

当用户的策略组合达到纳什均衡时,意味着如果一个用户单方面的改变策略,其收益不会增加。

定义2:一个博弈是超模博弈当:

(5)

如果一个博弈是超模博弈,则至少存在一个纯策略纳什均衡[13]。

定理1:博弈G是一个超模博弈。

证明:为了表示方便,用户i的收益函数表示为

(6)

3算法设计

在第2节的分析中,博弈G是超模博弈,至少存在一个纯策略纳什均衡,因此本节将提出接入数据库和联合数据库感知的分布式学习算法分别求解博弈的纳什均衡解,其结果将在第4节中展开分析。

3.1联合数据库感知算法

(7)

引入排序指针对信道进行排序:

(8)

(9)

算法1:

(10)

感知并接入:根据式(10)选出前N个信道,根据式(9)选择第r条信道感知,可用则接入并保持r不变,否则不传输数据,并在下一时刻更新r。

更新信道选择概率:

(11)

(12)

3.2数据库协助算法

不同于算法1,在不需要感知的情况下,用户直接从数据库获得信道条件排在前N的信道,算法描述如下。

算法2:

选择并接入:根据式(9)选择第r条信道感知,可用则接入并保持r不变,否则不传输数据,并在下一时刻更新r

更新信道选择概率:根据式(10)、式(11)感知信道选择概率

4仿真结果分析

在本节中,通过数值结果分析系统的性能。在仿真中,可以发现在数据库的协助下用户能更快找到纳什均衡解,如果直接依靠数据库进行信道选择,得到的均衡解更接近最优解。

在一个有3个用户和4条信道的环境中,用户的发射功率为P={350,400,200},单位mW。用户坐标为{(72,70)(76,370)(165,218)},信道可用概率分别为{0.85 0.85 0.8 0.75},带宽分别为{20,24,21,16},单位MHz。学习步长b=0.1,d=10,α=4,σ=10-10,通过算法1得到图2所示的结果。经过100次迭代,用户1选择4条信道的概率分别为(0 0 1 0),用户2为(1 0 0 0),用户3为(0 1 0 0)。最终用户1选择信道3,用户2选择信道1,用户3选择信道2,没有一个用户会改变自己的接入策略。

图2 算法2的收敛性

下面考虑10个用户和12条信道的分布式网络场景。用户的发射功率分别为{350, 400,200, 50, 330, 100, 300, 280, 250, 120, },单位mW。用户坐标为{(72,70)(76,370)(165,218)(182,450)(242,340)(321,72)(396,422)(405,450)(200,250(175,325)}。信道可用概率分别为{ 0.85 0.85 0.8 0.75 0.7 0.65 0.6 0.55 0.63 0.58 0.78 0.9},带宽分别为{ 20,24,21,16,17,28,23,27,26,30,28,18},单位MHz。其他参数同上。

图3和图4是重复了600次试验后取平均数的结果。最佳纳什均衡通过匈牙利算法[14]得到。图3表明了3种算法在各自达到纳什均衡时所需的平均迭代次数,提出的算法1和算法2的平均迭代次数要少于文献[7]中的算法。因为在获得了频谱信息的情况下,用户能更快做出对自己有利的选择,使自己能获得最大的收益。

图3 比较3种算法在不同用户数量时收敛的迭代速度

图4 比较3种算法在不同用户数量时

在收敛速度更快的同时,所获得的平均网络吞吐量也增大了。从图4可以看出,算法1和算法2所获得的平均吞吐量较文献[7]中的算法较好。而算法1 所获得的平均吞吐量几乎等于最大值。这表明,通过数据库用户排除了感知带来的误差干扰,不仅能更快获知频谱信息,做出决策,在用户没有信息交互的情况下,能使用户更快做出最好的选择,减少了感知带来的时延,提高了频谱的利用率。

5结语

本文研究了次用户在没有信息交互情况下的频谱接入过程,比较了在有数据库协助的情况和没有数据库情况下不同算法的区别。仿真结果表明,相比于一般的频谱感知过程,在接入数据库获得频谱信息,用户之间没有信息交互的情况,用户能更快做出接入策略,而本文提出的算法1能使用户更快收敛到接近最优值的纳什均衡点,使系统吞吐量近似最大。其意义在于减少了用户因感知带来的时延,增加了用户的传输时间,提高了频谱的利用率。而在未来更加复杂多变的环境中,数据库的信息也可能是变化的,在这种环境下如何更加精准地做出接入策略还有待研究。

参考文献:

[1]Federal Communications Commission. Spectrum Policy Task Force Report[R]. ET Docket No. 02-135, November 2002.

[2]Shared Spectrum Company. www.sharedspectrum.com.

[3]ZHAO Q, Sadler B. A Survey of Dynamic Spectrum Access: Signal Processing, Network, and Regulatory Policy[J]. IEEE Signal Processing,2005,24(3):201-220.

[4]徐迪.动态频谱接入综述[J].电子科技,2015,28(03):161-164.XU D. Review of Dynamic Spectrum Access[J]. Electronic Science and Technology, 2015,28(03):161-164.

[5]兰昆伟,赵杭生,李湘洋等. 认知无线电中基于感知门限的频谱预测研究[J]. 通信技术,2015,48(02):165-170.

[6]Yasin Y, GUO Z, WANG X. Sequential Joint Spectrum Sensing and Channel Estimation for Dynamic Spectrum Access[J]. IEEE Journal on Selected Areas in Communications,2014,32(11): 2000-2012.

[7]Marjan Z, Min D, Ali G. Distributed Stochastic Learning for Dynamic Spectrum Access Adaptive to Primary Network Conditions[C]// IEEE SPAWC,2014:449-4533.

[8]Murty R, Chandra R, Moscibroda T. Senseless: A Database-Driven White Space Network[J]. IEEE Transactions on Mobile Computing, 2012,11(2): 189-203.

[9]LIU Y, YU R, PAN M, et al. Adaptive Channel Access in Spectrum Database-Driven Cognitive Radio Networks[C]//IEEE ICC, 2014:4933-4938.

[10]ZHANG N, LIANG H, CHENG Nan, et al. Dynamic Spectrum Access in Multi-Channel Cognitive Radio Networks[J]. IEEE Journal on Selected Areas in Communications,2014,32(11):2053-2064.

[11]XU Y, XU Y, Anpalagan A. Database-Assisted Spectrum Access in Dynamic Networks: A Distributed Learning Solution[J]. IEEE Access, 2015,3:1071-1078.

[12]HAN Z, Niyato D, Saad W and Basar T, Game Theory in Wireless and Communication Networks[M]. Cambridge University Press: 2012.

[13]HUANG J, Randall A, Michael L. Distributed Interference Compensation for Wireless Networks[J]. IEEE Journal on Selected Areas in Communications, 2006,24(5):1074-1084.

[14]Papadimitriou C and Steiglitz K. Combinatorial Optimization: Algorithms and Complexity[M]. Dover, 1998.

A Distributed Dynamic Spectrum Access Algorithm based on Spectrum Database

LIAO Yun-feng1,2, CHEN Yong2, TIAN Jia-qiang1,2, BAO Li-na3

(1.Institute of Communications Engineering, PLA University of Science & Technology, Nanjing Jiangsu 210007,China;2.Nanjing Telecommunication Technology Institute, Nanjing Jiangsu 210007,China;3.China Unicom Corporation Limited Jiangsu Branch, Nanjing Jiangsu 210019,China)

Abstract:Spectrum database could directly acquire spectrum information, and in view of the complex network environment Which is lacking information exchange of between the users, dynamic spectrum access algorithm with and without the aid of database is discussed in this paper. On the one hand, secondary users estimate the availability probability and select channels with historically sensed data, on the other, they acquire farly reliable spectrum information from spectrum database and make proper decision.The game of between the users proves to be a supermodular game, and two distributed leaning algorithms are proposed to achieve the pure strategic NE (Nash Equilibrium). Simulation results show that the proposed database-jointed and database-aided perception algorithms could enjoy fairly fast convergence, nearly maximum throughput, and thus decrease the decision time-delay of decision and improve the spectrum utilization.

Key words:spectrum database; dynamic spectrum access; learning algorithm;NE

doi:10.3969/j.issn.1002-0802.2016.04.009

*收稿日期:2015-11-18;修回日期:2016-02-25Received date:2015-11-19;Revised date:2016-02-25

基金项目:国家自然科学基金(No.61301161,No.61471395);江苏省自然科学基金(No. BK20141070)

Foundation Item:National Natural Science Foundation of China(No.61301161,No.61471395);Natural Science Foundation of Jiangsu Province(No.BK20141070)

中图分类号:TN929.5

文献标志码:A

文章编号:1002-0802(2016)04-0426-05

作者简介:

廖云峰(1989—),男,硕士研究生,主要研究方向为动态频谱管理;

陈勇(1975—),男,硕士,高级工程师,主要研究方向为无线网络,频谱管理;

田家强(1991—),男,硕士研究生,主要研究方向为动态频谱管理;

鲍丽娜(1987—),女,硕士,工程师,主要研究方向为认知无线电,网络管理。

猜你喜欢

纳什均衡
煤矿安全投资博弈模型研究
去产能政策的激励相容安排与系统风险防范
基于纳什均衡的充电桩建设博弈分析
动力学研究
囚徒困境、契约和惩罚
基于纳什均衡的中小企业融资问题探讨
绿色产品质量监管的三方博弈关系研究
非均衡市场下房地产寡头产量竞争研究