改进的基于合作博弈的资源分配和接入控制策略✴

2012-03-31高丽赵海峰穆晓敏

电讯技术 2012年7期

高丽，赵海峰，穆晓敏

高丽，赵海峰，穆晓敏

（郑州大学信息工程学院，郑州450001）

为了提高频谱共享的有效性和公平性，提出了一个基于合作博弈的认知网络频谱共享模型和接入控制策略。博弈规则为在满足各用户最小收益的前提下，认知用户进行相互合作，并最大化总体收益；接入控制策略以满足服务质量需求为约束条件，并引入惩罚函数，迫使认知用户按照其实际需求竞争频谱资源。仿真结果表明：提出的合作博弈模型和接入策略提高了认知用户的总体收益和公平性，改善了系统中认知用户的满意度。

认知无线电；资源分配；合作博弈；接入控制

1 引言

动态频谱分配技术［1］是认知无线电网络中的关键技术之一，如何把空闲频谱公平、有效地分配给认知用户是研究的热点问题。博弈论［2］是认知无线电系统中分析和解决认知用户频谱共享的有效方法，因此，基于博弈论的频谱共享成为研究的热点。

近年来，许多文献讨论了认知无线电中基于博弈论的动态频谱分配方法。根据系统中认知用户之间是否达成一致的协议，可以分为合作博弈和非合作博弈。在合作博弈认知网络模型中，认知用户考虑自身策略对其他用户的影响，相互之间达成一定的协议，最大化总体效用。文献［3］提出了在宽带网络中基于合作博弈论框架的带宽分配和定价方法，把博弈过程类比为一个讨价还价的问题，用纳什议价解作为博弈的解。在非合作博弈认知网络模型中，认知用户是自私的、理性的，即只考虑最大化自己的效用。文献［4-6］均采用非合作博弈模拟资源分配过程，每个认知用户只考虑如何使自己的效益最大化，而没有考虑自己对其他用户的影响，用纳什均衡点作为博弈过程的解；文献［4-5］没有考虑用户的服务质量需求，文献［6］考虑了认知用户的服务质量需求，提出了一个改进的非合作博弈频谱共享算法，进一步提高了频谱利用率，但是没有考虑当系统中的频谱资源不能满足用户的最小速率需求及一些用户为了获得更多的收益而夸大自己的需求时，如何控制接入系统的认知用户个数和允许哪些用户接入的问题。

本文在文献［6］的基础上，考虑认知用户自身策略对其他用户的影响，彼此之间达成具有约束力的协议，以最大化总体收益为目标，提出了基于合作博弈的改进的效用函数；此外，当系统中的频谱资源不能满足用户最小速率需求时，加入了接入控制机制，提高了系统内认知用户的满意度，考虑到用户为了获得更多的频谱资源可能夸大自己的实际速率需求，本文引入了惩罚函数，根据惩罚函数来剔除用户，在博弈过程中，用户意识到惩罚函数的存在后，会按照自己的实际需求去竞争频谱。

2 系统模型和改进的效用函数

2.1 本文提出的合作频谱共享模型

提出的合作频谱共享模型如图1所示。在认知无线电系统中，包含一个主用户和N个认知用户，主用户把空闲的频谱资源交由一个频谱代理商管理，频谱代理商是一个非盈利的机制，一方面促进交易的进行，另一方面控制接入系统中认知用户的个数，保证满足认知用户的最小速率需求。在图1所示的频谱中，灰色部分表示主用户使用的频谱，黑色部分表示不同用户之间的保护带宽，白色部分表示认知用户共享的频谱。

频谱代理商和认知用户之间的信息交换情况如图2所示。首先，频谱代理商宣布单位带宽的定价函数c，认知用户按照一定的博弈规则，向频谱代理商提交博弈策略（即请求的频谱宽度）集合B（B=｛b1，b2，…，bN｝）和最小速率需求Q（Q=｛Q1，Q2，…，QN｝）。为了迫使认知用户如实地告之其最小速率需求，频谱代理商计算每个认知用户的惩罚函数值θ，并给出接入矩阵A（A=｛a1，a2，…，aN｝），ai=1（i=1，2，…，N）表示准许接入，ai=0表示不允许接入。

单位带宽的定价函数［4］为

惩罚函数θ定义为

式中，πi表示认知用户i的收益；Bopt表示认知用户j不存在时，N-1个用户的带宽分配集合，所以第一项表示认知用户j不存在时N-1个用户的总收益；B*表示N个用户的带宽分配集合，第二项表示认知用户j存在时，其余N-1个用户的总收益。由惩罚函数的定义可知，用户j的惩罚函数表示由于用户j的存在而给其他用户带来的总收益的减少量。

定义第i个认知用户的收益函数［6］πi（B）：

式中，Qi是满足服务质量要求所需要的最小传输速率，bi为向主用户请求的频谱宽度，ri是单位传输速率获得的收益；式（4）中SNRi是信噪比，式（5）中是第i个用户的目标误码率。

2.2 改进的效用函数

在合作博弈模型中，认知用户考虑自身策略对其他用户收益的影响，达成一定的合作协议，即在满足各用户最小收益的前提下进行相互合作，以最大化总体收益为目标。基于此认知用户之间的合作博弈问题可以描述为

3 频谱分配和接入控制策略

若分配给认知用户的频谱资源不能满足其服务质量需求，则是对系统中频谱资源的浪费，因此，在频谱分配过程中应考虑控制接入系统中的认知用户的个数。本文提议的接入策略是以满足服务质量需求为约束条件，为了迫使认知用户按照其实际需求竞争频谱，文中引入了惩罚函数的概念，根据惩罚函数来选择剔除哪些用户。

定义频谱满意度函数［6］

其中，Si＜1表示分配的带宽不能满足最小速率需求，Si≥1表示满足了用户最小速率需求。

频谱分配算法步骤如下：

（1）初始化每一个认知用户的博弈策略b0=｛b1，b2，…bN｝和接入矩阵A=ones（1，N）；

（3）判断是否存在Si＜1，∀i，若存在，转步骤4；若不存在，结束；

（4）按照公式（2）计算每一个用户的惩罚函数值，对θ进行从高到低的排序，剔除θ值最大的用户，并置相应的ai=0，更新接入矩阵A，再转步骤2重新分配频谱。

4 计算机仿真结果与分析

为了验证本文提出的效用函数和接入策略的有效性，基于Matlab平台进行仿真分析，设定主用户拥有20 MHz的空闲带宽，所有认知用户在任何传输模式下的目标BER为BERtari=10-4，每单位传输速率的收益为ri=10。

4.1 合作博弈的性能分析

对文中的合作博弈和文献［6］中的非合作博弈情况进行仿真分析。为了简化分析，仿真过程中假设认知无线电系统中存在一个主用户和两个认知用户，认知用户的信噪比分别为12 dB、11 dB，分配频谱的初始值b1=b2=3 MHz，πmini=3，∀i，认知用户2的最小速率需求固定为4，仿真结果如图3所示。

由图3可以看出，随着认知用户1的最小速率需求的增加，认知用户1和2的总收益在增大，合作博弈的总收益大于非合作博弈的总收益。这是因为在非合作博弈过程中，认知用户只最大化自己的收益，而没考虑自己的竞争策略给其它用户收益带来的影响；认知用户进行合作博弈时，在满足其最小速率需求后，以最大化总体收益为目标。

为了比较两种方法的公平性，文中选用文献［10］中的公平指数来进行评价，考虑N个认知用户，每一个认知用户获得的收益为πi，本文公平指数的定义为

式中，β越接近于1，说明公平性较高；反之，则说明公平性较差。

图4显示了随着认知用户1的最小速率需求的增加，两种方法的公平指数变化情况，可以看出合作博弈的公平性高于非合作博弈。

4.2 惩罚函数的性能

为了评估惩罚函数的性能，比较两种情形下各认知用户的θ值：一是所有认知用户都按照其实际最小速率需求竞争频谱资源；二是有一个认知用户夸大其速率需求，其他用户仍按照实际需求竞争频谱资源。仿真过程中设定有5个认知用户，在第一种情况下，所有用户的最小速率需求设为4，即Q1= Q2=…=Q5=4；在第二种情况下，认知用户1夸大其最小速率需求Q1=6，其他认知用户最小速率需求仍为4。

由表1可知，当认知用户1夸大其需求后，其得到的带宽资源有所增加，但同时其惩罚函数值θ也增大了，且成为5个用户中最大的，根据本文中的频谱分配算法可知，如果系统中存在Si＜1，∀i，用户1将被首先剔除。

4.3 加入接入控制机制后系统性能分析

仿真过程中，设定系统中存在一个主用户和8个认知用户，认知用户的信噪比在［10，14］上服从均匀分布，最小速率需求服从［Qi，Qi+4］的均匀分布，Qi是随机变量。由图5可以看出，系统中无接入控制机制时［6］，认知用户的平均满意度小于1；加入接入控制机制后，认知用户的平均满意度大于1。

图6表示随着认知用户最小速率需求的增大，系统中允许接入的用户个数在减小。因此可以根据认知用户的需求，确定系统中允许接入的最大的认知用户个数，满足系统内认知用户的服务质量需求，提高系统中认知用户的满意度。

5 结论

本文针对在认知无线网络中，认知用户为了获得更多的收益，在竞争频谱资源时可能存在欺骗行为，夸大自己的实际资源需求，建立了基于合作博弈的认知网络频谱共享模型和接入控制机制，从而提高了频谱分配的有效性和公平性。仿真结果显示，相对于非合作博弈，改进的效用函数提高了认知用户的总体收益，且公平性较高；接入控制机制改善了系统中用户的满意度，有效地阻止了用户的欺骗行为，适用于实际的无线认知网络。另外，本文模型中只考虑了一个主用户和多个认知用户的情形，当扩展到多个主用户和多个认知用户时，有关主用户之间的频谱定价博弈、主用户和认知用户之间的频谱交易规则的设定等问题，有待进一步研究。

［1］Akyildiz I F，Lee W Y，Vuran M C，et al.Next generation／dynamic spectrum access／cognitive radio wireless networks：A survey［J］.Computer Networks（Elsevier），2006，50（13）：2127-2159.

［2］Fudenberg D，Tirole J.Game Theory［M］.Cambridge，MA：MIT Press，1991.

［3］Yaiche H，Mazumdar R R，Rosenberg C.A Game Theoretic Framework for Bandwidth Allocation and Pricing in Broadband Networks［J］.IEEE／ACM Transactions on Networking，2000，8（5）：667-678.

［4］Niyato D，Hossain E.Competitive Spectrum Sharing in Cognitive Radio Networks：A Dynamic Game Approach［J］.IEEE Transactions on Wireless Communications，2008，7（7）：2651-2660.

［5］Lin P，Jia J，Zhang Q，et al.Dynamic Spectrum Sharing With Multiple Primary and Secondary Users［J］.IEEE Transactions on Vehicular Technology，2011，60（4）：1756-1765.

［6］Li Y B，Wang L，Li Y.An improved game-theoretic spectrum sharing algorithm in cognitive radio networks［C］／／Proceedings of IEEE International Conference on Computer Research and Development.Shanghai，China：IEEE，2011：499-503.

［7］Han Z，Ji Z，Liu K J R.Fair multiuser channel allocation for OFDMA networks using Nash bargaining solutions and coalitions［J］.IEEE Transactions on Communications，2005，53（8）：1366-1376.

［8］Zhang Z Y，Shi J，Chen H H，et al.A Cooperation Strategy Based on Nash Bargaining Solution in Cooperative Relay Networks［J］.IEEE Transactions on Vehicular Technology，2008，57（4）：2570-2577.

［9］Boyd S，Vandenberghe L.Convex Optimization［M］.Cambridge，UK：Cambridge University Press，2004.

［10］Jain R，Chiu D M，Hawe W.A Quantitative Measure of Fairness and Discrimination for Resource Allocation in Shared Computer System［R］.［S.l.］：DEC Research Report，1984.

GAO Li was born in Nanyang，Henan Province，in 1985.She received the B.S.degree from Tianjin Polytechnic University in 2010.She is now a graduate student.Her research concerns resource allocation based on game theory in cognitive radio networks.

Email：dz061gaoli＠sina.com

赵海峰（1984—），男，河南扶沟人，2006年于郑州大学获工学学士学位，现为博士研究生，主要研究方向为认知无线电协作感知；

ZHAO Hai-feng was born in Fugou，Henan Province，in 1984.He received the B.S.degree from Zhengzhou University in 2006.He is currently working toward the Ph.D.degree.His research concerns spectrum sensing in cognitive radio networks.

Email：zhf198769＠163.com

穆晓敏（1955—），女，河南郑州人，教授、博士生导师，主要研究方向为通信信号处理、图像信号处理、数字水印技术、认知无线电技术等。

MU Xiao-min was born in Zhengzhou，Henan Province，in 1955.She is now a professor and also the Ph.D.supervisor.Her research interests include communication signal processing，image signal processing，digital watermarking technology，cognitive radio，etc.

Email：iexmmu＠zzu.edu.cn

Improved Resource Allocation Based on Cooperative Game and Access Control Policy

GAO Li，ZHAO Hai-feng，MU Xiao-min
（Information Engineering School，Zhengzhou University，Zhengzhou 450001，China）

In order to improve the efficiency and fairness of spectrum sharing，a spectrum sharing model based on cooperative game and an access control policy are proposed.Cognitive users cooperate with each other to maximize overall benefits on the premise of meeting users′minimum income.The access control policy takes the satisfaction of service quality requirements as the constraint condition.A penalty function is introduced to force the secondary users to compete spectrum according to their actual requirements.The simulation results show that the cooperative game model and the access policy proposed in this paper enhance the overall benefits and fairness of cognitive users and improve the cognitive users′satisfaction in the system.

cognitive radio；resource allocation；game theory；access control

The National Natural Science Foundation of China（No.60702020）

TN92；TN915

10.3969／j.issn.1001-893x.2012.07.028

高丽（1985—），女，河南南阳人，2010年于天津工业大学获工学学士学位，现为硕士研究生，主要研究方向为认知无线电中基于博弈论的资源分配；

1001-893X（2012）07-1183-05

2011-12-02；

2012-02-22

国家自然科学基金资助项目（60702020）