浅析基于博弈论的动态频谱接入
2015-05-30张秘
张秘
【摘要】 博弈论(Game theory)是一种依靠严谨的数学模型,来解决现实世界中决策主体之间相互利益竞争的工具。博弈的目的,就是为了寻求一个能实现整体最优的最佳策略组合(即所谓的纳什均衡),从而使每个参与者的策略都是对其他参与者策略的最优反应。论文分析了一种基于代价函数的动态频谱接入方法,主要考虑了认知无线电场景中多个次用户欲共享授权用户的频谱时的问题,该问题可视为垄断的市场竞争的问题,论文建立了相应的博弈模型以寻求次用户的最优频谱分配结果,即纳什均衡。
【关键词】 无线电 博弈论 纳什均衡
一、博弈论的概述
1.1概念
博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论[20]。也就是说,博弈论研究当一个主体,譬如说一个人或一个企业的选择受到其他人(其他企业)的选择的影响,而且反过来影响到其他人(其他企业)选择时的决策问题和均衡问题。所以在这个意义上说,博弈论又称为“对策论”。博弈论是一种使用严谨数学模型来解决现实中利害冲突的理论,由于冲突、合作、竞争等行为是现实中常见的现象,因此很多领域都能应用博弈论,如军事领域、经济领域、政治外交等。
1.2博弈论模型简介
博弈论自产生到发展至今已形成了较成熟的理论体系,它并不是经济学的一个分支,它是一种方法,应用范围不仅包括经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学等都涉及到博弈论。不过博弈论也具有自身的基本模型,可以对一个博弈过程用5个方面来描述,G={P,A,O,I,U}
① P(player):博弈的参与方。
② A(action):博弈方可选择的全部行为或策略的集合
③ O(orders):博弈的次序。
④ I(information):博弈的信息。
⑤ U(utility):博弈方的收益。
以上五个方面是定义一个博弈时必须首先设定的,确定了上述五个方面就是确定了一个博弈。博弈论就是系统研究用上述方法定义的各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,也既是均衡。
1.3博弈论的分类
现实中各种博弈可以按照不同的办法进行分类。根据参与人的多少,可以将博弈分为两人博弈和多人博弈;根据参与人是否合作,可以将博弈分为合作博弈和非合作博弈;根据博弈结果的不同,又可以将博弈分为零和博弈、常和博弈和变和博弈。
1.4纳什均衡
1.4.1纳什均衡的定义
纳什均衡(Nash Equilibrium)[20]是一种策略组合,它能够使得每个参与者的策略都是对其他参与者策略的最优反应。“最优反应”指的是该策略带给采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能带来的利益。博弈的目的,就是为了寻求这样的一个最佳的策略组合。
1.5 一些特殊的博弈模型
1.5.1重复博弈模型
重复博弈是目前人们了解的最为透彻的一类动态博弈,参与人每一期都面对同样的“阶段博弈”或“选民博弈”,而且参与人的全部收益是每阶段所得收益的加权平均。参与者基于对博弈过程的认知,例如对过去行为的了解,对未来的预期和对当前情况的观察,在每一个阶段的博弈中选择自身的策略。这些策略可以是固定的,也可以随其它参与者行动的改变而变化,甚至可以是自适应的。
1.5.2潜在博弈模型
潜在博弈是一般形式博弈中的一种特殊类型,存在函数u:S→R当单方面的背离发生时,u的变化Δu将被反映到单方面背离博弈者的效用上。
二、在无线通信系统资源分配问题中应用博弈论的可行性分析
随着无线通信系统的飞速发展,许多概念和技术与现有系统相比都有很大的变化。通信系统将具有智能的资源管理,采用大量动态的、分布式的、自适应式的资源管理方式。
三、基于博弈论的动态频谱接入方法
如何利用博弈论方法对认知无线电技术的研究进行分析,其中的关键是如何将博弈论引入到相应算法的设计和分析中,找到算法的纳什均衡点。在开始具体的算法研究之前,需要将所研究的问题抽象成博弈论问题模型。
3.1 分布式自适应频谱接入方法
博弈论模型适用于分析认知无线电系统各用户竞争频谱的分布式行为,各用户根据自己获得的信息单独进行决策。
3.2基于代价函数的动态频谱接入方法
由于非合作的关系导致每个用户都致力于通过选择合适的频谱传输以实现自身效用函数的最大化,但是却忽视了对系统中其它用户产生的干扰,以及对主用户的干扰,这种终端用户的个人利益最大化的行为将严重影响到系统的整体通信性能,因此需要引入代价机制[23]。引入了代价机制之后,不仅能给系统增加利润,同时也能敦促系统中的用户合理利用资源。价格函数反应了用户使用网络资源所要付出的代价(cost),同时也是通信服务供应商的实际需求。