基于信誉与权重机制的WSNs 信道资源分配算法*
2015-03-30张彦波吕浩杰
王 韬,张彦波,张 宇,吕浩杰,刘 勇
(河南大学 物理与电子学院,河南 开封475004)
0 引 言
无线传感器网络(WSNs)由许多微小的传感器节点组成[1],大量节点间的通信使得无线信道变得拥挤不堪。无线信道资源高效公平的使用能够减少不必要的数据拥塞[2]。近年来,博弈论被广泛应用于信号处理与通信的各个领域,特别是在信道资源分配方面[3~7]。林晓鹏等人提出一种基于进化博弈的网格资源分配方法对资源分配策略进行调整[6]。Brandt H 等人在博弈机制中增加声誉和惩罚机制来实现个体间的高度合作和公平性[7]。本文以博弈论中的抓钱博弈模型为基础,设计一种加入信誉与权重机制的算法,通过实验分析,该算法能够保证信道资源的高效公平使用,减少数据拥塞。
1 系统模型
在抓钱博弈模型里,有两个用户A 和B,每个用户都有一套策略,策略集合有两种策略:抓钱或者忽略。在无线通信场景中,1 表示用户试图占用信道;0 表示放弃。用C 表示信道,如果信道被占用,C 的状态记为1;如果信道没有被占用,C 的状态记为0。具体如表1 所示。
表1 用户A,B 和C 的策略选择情况Tab 1 Strategy selection situation of user A,B and C
在每次博弈中,用户A 和B 只能有一种策略。A 和B博弈的增益矩阵下如表2 所示。
表2 用户A,B 的收益选择情况Tab 2 Profit selection situation of user A and B
在本文中,研究两个用户A 和B 对一条信道的占用情况。首先,对系统进行初始化。前m 次博弈用户A 和B 的策略随机生成后,用户根据前m 次博弈中获得最大增益的策略来选择第m+1 次的策略[9]。例如:对用户A 来说,如果e0>e1(e0,e1分别表示最近m 次博弈中A 选择0 策略或者1 策略的增益之和(earnings,e)),则第m+1 次A 选0策略;如果e0≤e1,则第m+1 次A 会选择1 策略。这样A和B 每次策略的选取都是根据自身前m 次博弈获得的增益情况来进行策略的选取。
为了保证用户使用信道的公平性,引入信誉机制[7]。信誉值(reputation value,rv)是一个可调节的阈值,若用户在m 次的博弈中选择某一策略的次数(strategy,s)高于阈值,则第m+1 次强制该用户选择另一策略。对于用户A,当e0>e1时:若s0≥rv,则第m+1 次A 选1 策略;若s0<rv,则第m+1 次A 选策略1。s0的值由式(1)得出
sm0表示第m 次用户A 是否选择0 策略的策略值。如果选择策略0,则sm0=1;如果选择策略1,则sm0=0。
人的记忆会随着时间的推移而逐渐衰退,越早策略的作用在整个策略集合中所占比重越低。为了增加算法的真实性,又加入权重(weight value,wv)机制。权重值与策略值一一对应,m 个权重值组成了一个权重值数列。对于用户A,e0>e1:假定权重值数列的每一项分别是wv1,wv2,wv3…wvm。如果s0≥rv,则第m+1 次A 选1 策略;如果s0<rv,则第m+1 次用户A 选策略1。此时s0的表达式如式(2)所示
式(3)为权重值数列为等权重时的特例
2 模拟与分析
2.1 参数设置
本文使用Matlab 2012a 作为工具来模拟实验场景,一些模拟参数:
m=20 为初始化阶段的循环次数,L=1000 为除去初始化阶段每轮总的循环次数,n=50 为总轮数,为了更好地描述不同的增益值与信道利用率的关系,本文使用P=g/h表示不同的增益值,g∈[0.01,0.99],h=1-g。
2.2 仿真结果
当rv=10,在不同P 值下随机赋值和加入信誉机制的程序的对比图。用户的信道使用情况如图1 所示,P 值用对数形式表示。
图1 不同P 值对A,B 的信道利用率的影响Fig 1 Influence of different P on utilization of channel of A and B
通过图1 可以发现:不同的P 值对用户A,B 的信道的使用量影响不大。加入信誉值机制以后,A,B 的信道占用量在相同P 值的情况下基本一致,并且远高于随机赋值的情况,这就保证了用户的公平性。
图2 为取P=0.45,不同的信誉值(rv∈[0,20]) 对用户A,B 及总的信道利用率的影响。
图2 不同的信誉值对A,B 及总的信道利用率的影响Fig 2 Influence of different RV on A and B and total utilization of channel
图2 中,mva,mvb,mvc分别表示用户A,B 及信道C 在50 轮里每轮信道占用量的平均值(mean value,mv),其表达式分别如下
式中 ai,bi,ci分别为用户A,B 及信道C 在第i 轮的信道使用量。
从图2 中可以看出:rv 与mva,mvb,mvc的关系可以用分段函数来表达,rv 与mvc的关系表达式式(7)
图3 描述了加入权重值机制后,取rv=10,不同的权重值数列对用户A,B 和信道C 的信道利用率的影响,P 值用对数形式表示。
图3 不同权重值数列对信道C 利用率的影响Fig 3 Influence of different series of weight values on utilization ratio of channel C
图3 中,用“.”,“。”,“*”标记的曲线分别代表采用等差数列、等权重值数列及斐波那契数列的算法在不同的P 值下的信道使用情况。采用等权重值数列和斐波那契数列的算法在相同的P 值处信道占用量相差不大,使用等差数列的算法与前两者相比,其信道占用量有了很大程度的提高,其最高处的信道利用率为92.6%,最低处为58.4%,平均的信道利用率达到了71.4%。信道利用率由信道占用量除以L 得到。
以上所有图形表明:加入信誉和权重机制的算法不仅能够保证用户使用信道的公平性,而且大大提高了信道的利用率。
3 结 论
无线信道资源是一种不可再生资源,如何更好地分配无线信道资源是一个非常重要的问题。本文引入基于抓钱游戏的信誉和权重机制来进行无线信道资源配置的原理研究。信誉机制用于保证用户的公平性,权重机制用于提高信道利用率。仿真结果表明:这两种机制不仅能够保证用户的公平性,也大大提高信道的利用率。
[1] 戴菲菲,彭 力,董国勇.改进K-ACO 无线传感器网络的分簇路由算法[J].传感器与微系统,2013,32(8):135-139.
[2] 孙利民,周新运.无线传感器网络的拥塞控制技术[J].计算机研究与发展,2008,45(1):3-72.
[3] 曾 轲.基于博弈论的认知无线电频谱分配技术研究[D].成都:成都电子科技大学,2007:20-21.
[4] 丛 犁.基于博弈论的无线网络资源分配策略研究[D].西安:西安电子科技大学,2011:3.
[5] 林晓鹏,郭东辉.基于进化博弈的网格资源分配方法的研究[J].计算机仿真,2011,28(3):155-158.
[6] 许 力,陈志德,黄 川.博弈理论在无线网中的应用[M].北京:科学出版社,2012:109.
[7] Brandt H,Hauert C,Sigmund K.Punishment and reputation in spatial public goods games[C]∥Proceedings of the Royal Society B—Biological Sciences,2003,270(1519):1099-1104.