APP下载

认知无线网络中基于代理的动态频谱交易算法

2013-10-29张士兵张国栋包志华

通信学报 2013年3期
关键词:纳什服务提供商最大化

张士兵,张国栋,包志华

(南通大学 电子信息学院,江苏 南通 226009)

1 引言

认知无线电网络(CRN, cognitive radio network)能够感知自身周围频谱环境,选择合适的传输参数进行通信,提高频谱资源的利用率,是解决频谱资源短缺的有效途径,已成为当前无线通信领域研究的热点[1~3]。认知无线电的概念是在软件无线电的基础上由Joseph Mitola于1999年提出的[4,5],随后受到了学术界的高度关注。

频谱管理技术是实现认知无线网络的关键技术。频谱管理最简单也是最主要的问题就是如何设计一个有效的频谱利用自适应策略[6]。频谱管理包括频谱分析、频谱判决、频谱共享、频谱接入等技术,需要考虑的技术层面有信道分配、功率控制和经济利益因素(频谱价格、频谱交易)等。经济因素对具有高级使用权的频谱接入模型下的认知无线网络有着重要的意义,因为它可以刺激主用户出售部分频谱给次用户,提高频谱使用率[7]。

一般来说,主用户的频谱使用是由政府固定分配的。当主用户的频谱未能充分使用时,主用户可以出售频谱给次用户使其具有暂时的使用权并完成其特定的传输服务。在频谱交易过程中,主用户的目标是在不影响自身系统服务质量要求的情况下最大化自身的利益,而次用户的目标则是最大化频谱使用的效用。通常,这 2个目标是相互冲突的。当主用户为了获取更高的利益而提高价格时,次用户的效用就会因为更高的代价而降低;当主用户分配给次用户的频谱量增加时次用户的效用也就相应得到了提高,但是同时主用户的性能却下降了。因此,频谱交易就需要有一个最佳的、稳定的结果,使得买卖双方的利益和效用得到最大化[8]。

在基于保险(insurance)协议[9]的频谱交易算法中,笔者引入了保险协议,所有次用户在购买空闲频谱的同时需要向主用户购买相应的保险协议来防止或降低诸如由于极低的信噪比导致传输失败的潜在可能性。基于库尔诺(Cournot)博弈[10]的频谱交易算法研究了一个主用户服务提供商与多个次用户之间的频谱共享问题,其中,多个次用户相互竞争获得主用户服务提供商的授权频谱。但是该方案没有考虑主用户在频谱交易过程中的利益得失情况,也就无法从根本上保证主用户共享频谱的意愿。而贝特朗(Bertrand)博弈[11]的频谱交易算法研究了多个主用户服务提供商与一个次用户服务提供商之间的频谱共享问题,其中,多个主用户服务提供商竞相出售空闲频谱给次用户服务提供商以使自身利益最大化。但是该方案并没有考虑次用户服务提供商所获得的频谱在各次用户之间的分配问题。在一个主用户服务提供商与一个次用户服务提供商之间基于市场均衡的频谱共享方案中,文献[12]研究了基于次用户的频谱需求与主用户服务提供商频谱供应之间的等价关系,得出了最终的市场均衡交易价格;文献[13]又把这样一个两市场的频谱交易模型推广到了多个市场的频谱交易模型,最终给出了多个市场相关的市场均衡价格。但在以上2个模型中,文中笔者既没有提及次用户之间的频谱分配问题也没有考虑各主用户利益得失的最优情况,继而也就无法保证各主用户出售频谱的意愿。在多个主用户与多个次用户之间的频谱共享中,作者分别使用了进化博弈与和非合作博弈来分别模型化主用户与次用户之间的竞争[14]。但是在这样一个系统模型下,多主用户与多次用户之间频繁的信息交换和博弈策略互动造成了巨大的系统开销(控制信道的带宽)。

本文在多主用户与多次用户之间建立一个代理商,用于信息的融合与中转,这样就大大降低了控制信道所占用的带宽,同时也提高了频谱共享的实时性。

2 系统模型

本文考虑这样一个认知无线网络,其中,有N个主用户服务提供商、M个次用户和一个代理商,系统模型如图1所示。每个主用户服务提供商i(i =1, 2, …, N),都有一段用于服务的大小为Wi的授权频谱,记作Fi,主用户服务提供商i服务区域内的主用户数量假设为Ni。假设所有的次用户均采用自适应调制进行数据传输,数据传输率可以根据信道的质量动态地调整;频谱效率k表示为k=lb(1+Kr),其中,K=1.5/ln (0.2/BERtar),r是次用户的接收信噪比(SNR),BERtar是目标误比特率[15]。

图1 系统模型

3 频谱交易算法与博弈均衡解

3.1 主用户服务提供商与代理商之间的频谱交易

在主用户服务提供商与代理商之间的交易市场上,各个主用户服务提供商通过某种行为(相互竞争或合作)出售频谱给代理商,代理商向各主用户服务提供商购买频谱的量依赖于它们的出售价格。实际交易中,主用户服务提供商i(i = 1, 2, …, N)的利益函数可表示为[16]

其中,bi是主用户服务提供商 i出售的频谱量,pi是其出售价格,ki是其进行无线传输的频谱效率,c是主用户服务提供商i利益损失的常数权重因子,是每个主用户的额定频谱需求,假设同一个服务提供商服务区域内的主用户频谱需求是相同的。

定义 1 代理商对主用户服务提供商 i的频谱需求函数 Di是各主用户服务提供商出售频谱的价格pi(i = 1, 2, …, N)的函数可表示为

其中,ai, cj( j∈[1,N])都是正常数,ai表示主用户服务提供商i的频谱价格对代理商向其购买频谱量的影响程度(自影响系数);cj( j∈[1,N]) 表示其他主用户服务提供商 j(j≠i)的频谱价格对代理商向主用户服务提供商i购买频谱量的影响程度(互影响系数)。

1) 主用户服务提供商之间相互竞争

各主用户服务提供商为了获得最佳的频谱出售价格以使自身利益最大化。将利益函数Prospi关于pi求偏导数并令其等于0,即在这种情况下,笔者发现其中一个主用户服务提供商的最佳出售价格依赖于其他所有主用户服务提供商的出售价格。因此,笔者考虑纳什均衡作为这种博弈过程的解答,因为纳什均衡可以确保所有的主用户服务提供商都对这个结果感到满意。纳什均衡实际就是一个策略组合,是所有参与者的价格组合。它拥有这样的特性:在给定其他参与者价格的情况下,没有一个策略参与者可以通过改变自身的价格而获得更高的利益。纳什均衡可以通过解下面的方程组就获得。

如果一个主用户服务提供商不能观测到其他主用户服务提供商的价格信息,它们只能使用自身的价格信息和来自代理商的频谱需求信息来动态地调整自身的策略(频谱出售价格)。当前策略和下一步策略的迭代关系可表示为

其中,iα是主用户服务提供商i的学习速率参数。

2) 主用户服务提供商之间相互合作

在这种情况下,所有主用户服务提供商相互合作以实现总体利益的最大化,这个最大值可以通过以下优化问题的最佳价格获得。

此优化问题的最佳价格可以通过迭代算法获得。在这种情况下,每个主用户服务提供商可以观测到代理商的频谱需求信息并且相互之间可以交换各自获得的利益信息,则当前策略和下一步策略的迭代关系可表示为

其中,iβ是主用户服务提供商i的学习速率。

3.2 代理商与次用户之间的频谱拍卖

在代理商与次用户之间的频谱拍卖市场上,代理商把从主用户服务提供商处购得的频谱聚合在一起然后在次用户之间进行拍卖。对于一段拍卖频谱,所有次用户竞相投标(例如:频谱量或价格),代理商根据各次用户的投标确定频谱拍卖的价格并根据一定的规则分配给次用户相应的频谱量,各次用户动态地调整标的大小以实现自身效用的最大化。

1) 基于频谱量的拍卖

定义2 代理商拍卖从主用户服务提供商i购得频谱价格函数记为ci(q),它是次用户支付给代理商的单位频谱价格,表示如下其中,ql(l = 1, 2, …, M)是各次用户竞拍频谱的标,是各主用户服务提供商出售频谱价格的均值,d是常数。从这个价格函数可以看出代理商向各次用户收取的价格是相同的。

代理商分配给各次用户l(l = 1, 2, …, M)的频谱供应函数为

其中,bi(i=1, 2, …, N)是代理商从主用户服务提供商i购得的频谱。

而次用户l使用主用户服务提供商i的频谱bi的效用函数Ul表示为

其中, rl是次用户 l单位传输速率所获得的福利,kl是次用户l进行无线传输的频谱效率。

各次用户竞标的目标都是使得自身的效用函数最大化,所以把效用函数 Ul关于 ql求偏导数并令结果为0,即同样可以发现这个拍卖过程的最终结果可以由纳什均衡获得。在实际情况下,一个次用户并不知道其他次用户竞标的信息,次用户只能根据代理商的价格信息和自身竞标的信息来动态地调整标的大小,则当前标与下一次标的迭代关系为

其中,αl是次用户l的学习速率。

2) 基于价格的拍卖

对于一段拍卖频谱,各次用户给出竞标频谱的单位价格p(ll=1,…, M),代理商基于此确定最终的拍卖价格与分配的频谱量。

定义 3 代理商出售给次用户 l频谱的价格记为pal,它是代理商出售给次用户l的单位频谱价格,即

代理商分配给次用户l的频谱量s2l表示为

其中,bi(i=1, 2, …, N)是代理商从主用户服务提供商i购得的频谱。

次用户l的效用函数可表示为

其中,rl是次用户 l单位传输速率所获得的福利,kl是次用户l进行无线传输的频谱效率。

同样,各次用户竞标的目标都是使自身的效用最大化,所以笔者可以采用与基于频谱量拍卖模式中相同的处理方法来获得最佳的拍卖价格。在实际情况下,一个次用户并不知道其他次用户竞标的价格信息,次用户只能根据代理商反馈的频谱供应量信息和自身竞标的价格信息来动态地调整标的大小,则当前标价与下一次标价的迭代关系表示为

其中,lβ是次用户l的学习速率。

从上文所提算法中可以看出,所有主用户服务提供商与代理商之间只需要一次对话,各主用户服务提供商就可以获得其利益最大化的纳什均衡解,在代理商与所有次用户之间也只需要一次对话,各次用户就可以获得其利益最大化的纳什均衡解,整个系统通过代理商这个中介仅需2次对话就可以实现整个交易过程。而在前人所建立的无代理商的模型如参考文献[14]中,多主用户与多次用户之间频繁的信息交换和博弈策略互动才能达成最终的交易。相比之下,本文所提方案简单、有效、快速地实现了交易过程,其仅有的2次对话不仅大大降低了控制信道的带宽,同时也提高了频谱交易的实时性。

4 仿真结果与分析

1) 参数设置

考虑这样一个仿真环境,认知无线网络中拥有2个主用户服务提供商、2个次用户和1个代理商,其中,2个主用户服务提供商拥有的主用户的数量分别为2和3个(N1=2,N2=3),各主用户服务提供商拥有的授权频谱分别为 8MHz和 9MHz(W1=8MHz,W2=9MHz),假设各主用户的额定频谱需求均为2MHz(Breq=2MHz)。次用户的传输误比特率BERtar=1×10-4,信道质量(次用户的接收信噪比)分别为10dB和12dB。代理商对主用户服务提供商的频谱需求函数中的自影响系数 a1=4, a2=5; 互影响系数c1=0.1, c2=0.2;初始价格分别为p1(0)=1.5,p2(0)=2。次用户单位传输速率所获得的福利为5(r1=r2=5)。

2) 性能分析

图2给出了竞争与合作模式下各主用户服务提供商出售频谱价格的迭代过程和最终的纳什均衡价格。从图2中可以看出,当各主用户服务提供商相互合作以实现总利益的最大化时比相互竞争以实现自身利益最大化时提高了出售频谱的价格。从图3可以看出相互合作的模式较相互竞争模式下主用户服务提供商的总利益有所提高。

图2 竞争与合作模式下主用户服务提供商价格的迭代过程与纳什均衡

图3 竞争与合作模式下主用户服务提供商总利益的迭代过程与纳什均衡

图4表示了不同breq下,各主用户服务提供商纳什均衡价格的调整过程。从图4中可以看出,不管是相互合作还是相互竞争的模式,随着主用户额定频谱需求breq值的升高,各主用户服务提供商为了维护自身的利益或总体的利益都会相应提高频谱出售的价格;另外,相互合作的模式与相互竞争的模式相比,随着breq值的增加,各主用户服务提供商出售频谱的价格增长的幅度更大。

图5给出了竞争与合作模式下,主用户服务提供商频谱供应量的迭代过程与纳什均衡值。从图 5中可以看出,相互合作模式下,各主用户服务提供商为了维护总体利益的最大化降低了频谱供应量,这一结果也可以从定义1的价格函数中得到体现。图6显示了无论是相互合作还是相互竞争的模式,随着主用户额定频谱需求breq的升高,主用户服务提供商的频谱量都会随之下降,而且由于在相互合作的模式下,各主用户服务提供商提高了价格,所以频谱供应量也较相互竞争模式要低些。

图4 不同breq下,各主用户服务提供商纳什均衡价格的调整

图5 竞争与合作模式下,主用户服务提供商频谱供应量的迭代过程与纳什均衡

图6 不同breq下,各主用户服务提供商频谱供应量的调整

图7给出了不同的主用户额定频谱需求下,主用户服务提供商总体利益的变化情况。从图7中可以看出,相互合作模式下主用户服务提供商的总利益总是大于竞争模式下的总利益,并且随着breq的升高,2种模式下的总利益都有所下降,这也说明了随着主用户频谱需求的增大,主用户服务提供商更倾向于为自身的主用户提供服务而不倾向于出售频谱。

图7 不同breq下,主用户服务提供商总利益的变化

从以上的仿真结果分析可以看出,在相互合作的模式下,虽然主用户服务提供商的总体利益略有提高,但是该模式下主用户服务提供商抬高了价格且愿意出售的频谱量相比较而言减少了很多,这不利于为次用户提供更好的服务。综合以上分析,笔者采用相互竞争的模式出售频谱给代理商,然后代理商就交易得来的频谱在所有次用户中进行拍卖,下面就2种拍卖方式(基于频谱量和基于价格)进行了仿真分析与比较。

图8显示了2种拍卖模式下,代理商出售频谱价格的变化以及最终稳态时纳什均衡价格。显然基于价格的拍卖成交价格比基于频谱量的拍卖成交价格低,较低的购买价格有利于次用户的获益。图9显示了2种拍卖模式下次用户所获得的频谱分配,从图9中可以看出基于价格的拍卖方式收敛速度较快且次用户获得的频谱分配也更为平均。图10显示了2种拍卖模式下次用户的获益情况,很明显由于购买价格较低,基于价格的拍卖模式中次用户的获益明显较基于频谱量的拍卖模式要高。

图11显示了随着次用户2接收信噪比的提高,在2种拍卖模式下,次用户2获得的频谱分配都相应地提高了,与此同时次用户 1(S1)所获得的频谱分配就随之减少。其中,基于价格的拍卖模式与基于频谱量的拍卖模式相比较,前者次用户获得的频谱分配更加平均。从图 11和图12中可以看出,由于次用户 2分配到的频谱量比次用户 1要大,从而次用户 2获得的利益(Profit2)也较次用户 1(Profit1)要高,并且基于价格拍卖模式下,次用户所获得的利益较基于频谱量拍卖方式下获得的利益提高了不少。

图8 拍卖价格的变化以及纳什均衡价格

图9 频谱分配的变化以及纳什均衡处的频谱分配

图10 次用户利益的变化以及纳什均衡处的利益

图11 不同r2下,2种拍卖方式中次用户获得的频谱分配

图12 不同r2下,2种拍卖方式中次用户获得的利益

5 结束语

本文提出了一种认知无线网络中基于代理的频谱交易算法。仿真结果表明在主用户服务提供商与代理商之间的频谱交易中,虽然主用户服务提供商相互合作可以提高它们的总体利益,但是从整个系统(包括次用户在内)的利益出发,当主用户服务提供商相互竞争时,可以更好地刺激其出售更多频谱给代理商,这样有利于为次用户提供更好的服务。在代理商与次用户的拍卖市场上,通过仿真证明了采用基于价格的拍卖模式次用户可以获得更高的利益。

[1] DEMESTICHAS P, DIMITRAKOPULOS G, STRASSNER J. Introducing reconfigurability and cognitive networks concepts in the wireless world[J].IEEE Vehicular Technology Magazine, 2006, 11(2):32-99.

[2] FRANK H P F, MARCOS D K. Cognitive Wireless Networks: Concepts, Methodologies and Visions Inspiring the Age of Enlightenment of Wireless Communications[D]. The Netherlands: Springer, 2008.

[3] NIYATO D, HOSSAIN E, ZHU H. Dynamic spectrum access in IEEE 802.22-based cognitive wireless networks: a game theoretic model for competitive spectrum biding and pricing[J]. IEEE Wireless Communication, 2009, 16(2):16-23.

[4] MITOLA J, MAGUIRE G Q. Cognitive radio: making software radios more personal[J]. IEEE Personal Communications, 1999, 6(4):13-18.

[5] Federal Communications Commission Notice of Proposed Rule Making and Order: Facilitating Opportunities for Flexible, Efficient, and Reliable Spectrum Use Employing Cognitive Radio Technologies[S]. 2005.

[6] 周小飞, 张宏纲. 认知无线电原理与应用—IEEE 802无线通信新技术[M]. 北京: 北京邮电大学出版社, 2006.ZHOU X F, ZHANG H G. The Principle and Application of Cognitive Radio[M]. Beijing: Beijing University of Posts and Telecommunications Press, 2006.

[7] NIYATO D, HOSSAIN E, ZHU H. Dynamic Spectrum Access and Management in Cognitive Radio Networks[D]. Cambridge University, 2009.

[8] NIYATO D, HOSSAIN E. Competitive pricing for spectrum sharing in cognitive radio networks: dynamic game, inefficiency of Nash equilibrium and collusion[J]. IEEE Journal on Selected Areas in Communications, 2008, 26(1):192-202.

[9] JIN H, SON G F, WANG X B. Spectrum trading with insurance in cognitive radio network[J]. IEEE Conference on Computer Communications, 2012, 2041-2049.

[10] NIYATO D, HOSSAIN E. A game-theoretic approach to competitive spectrum sharing in cognitive radio networks[J]. IEEE Wireless Communications and Networking Conference, 2007, 16-20.

[11] NIYATO D, HOSSAIN E. Market-equilibrium, competitive, and cooperative pricing for spectrum sharing in cognitive radio networks:analysis and comparison[J]. IEEE Transactions on Wireless Communications, 2008, 7(11):4273-4283.

[12] NIYATO D, HOSSAIN E. Spectrum trading in cognitive radio networks: a market-equilibrium based approach[J]. IEEE Wireless Communications, 2008, 15(6):71-80.

[13] NIYATO D, HOSSAIN E A microeconomic model for hierarchical bandwidth sharing in dynamic spectrum access networks[J]. IEEE Transactions on Computers, 2010, 59(7):865-877.

[14] NIYATO D, HOSSAIN E. Dynamics of multiple-seller and multiple-buyer spectrum trading in cognitive radio networks: a game theoretic modeling approach[J]. IEEE Transactions on Mobile Computing, 2009, 8(8):1009-1022.

[15] GOLDSMITH A J, CHUA S G. Variable rate variable power MQAM for fading channels[J]. IEEE Transactions on Communications, 1997,45(10):1218-1230.

[16] NIYATO D, HOSSAIN E. Competitive spectrum sharing in cognitive radio networks: a dynamic game approach[J]. IEEE Transactions on Wireless Communication, 2008, 7(7):2651-2660.

猜你喜欢

纳什服务提供商最大化
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
勉县:力求党建“引领力”的最大化
Advantages and Disadvantages of Studying Abroad
论品牌出海服务型跨境电商运营模式
刘佳炎:回国创业让人生价值最大化
最新调查:约三成云服务提供商正迅速改变其业务模式
网络非中立下内容提供商与服务提供商合作策略研究
戴夫:我更愿意把公益性做到最大化
爱,纳什博弈人生的真理