博弈困境问题研究
2019-10-08徐欣
徐欣
【摘要】在现实生活中,总是需要做大量的决策,而个人的决策收益往往不是孤立的,会受其他决策者的选择影响。在完全理性的假设下,虽然每个决策者绝对理性地选择对自己最优的策略,但是最终却陷入博弈困境,从群体角度看并不是最优决策。本文从博弈论基础出发,介绍了博弈标准式、严格劣策略、纳什均衡的概念,推导了纳什均衡点求解,最后通过案例进行实际的分析。
【关键词】博弈 博弈标准式 纳什均衡
【中图分类号】O29 【文献标识码】A 【文章编号】2095-3089(2019)27-0015-02
一、引言
在现实社会生活中,个体的决策总是受群体决策的影响,或者说给定个体的决策,该决策的收益会随着其他个体决策的变化而变化。但是在其他个体不可控的情况下,个体理性的选择往往不是群体最有利的选择。
比如,有两个商户(商户A、商户B)销售类似商品,属于竞争关系。每个商户都有两种可选择的策略:促销或者不促销。当商户A选择促销,若商户B选择不促销,则商户A收益为10,而商户B因为没有任何优惠活动收益为0;若商户B同样选择促销,则商户A和商户B的收益都是2。当商户A选择不促销;若商户B选择促销,则商户A和商户B的收益分别是0、10;若商户B同样选择不促销,则商户A和商户B都会收益9。具体博弈矩阵如表1所示,从表中可以看出,商户A和商户B都不促销是群体最优的决策。但是,在现实情况下,在每个商户都是理性人的情况下,最终的结局一般都是商户A和商户B都选择促销[1]。
上述例子是一个典型的博弈困境,是博弈论中最经典的博弈模型之一。对决策主体如何做出决策进行建模,研究当其行为在直接相互产生作用的时候,决策主题最终选择的策略如何达到均衡。博弈论是应用数学的一个分支,也是运筹学的一个重要学科,也是西方经济学理论的重要组成部分。博弈论通过严谨的数学语言,标准化定义博弈的关键要素,考虑博弈过程中的个体的预测行为和实际行为,并研究他们的优化策略。下面通过介绍博弈论的基本概念,定义博弈的标准表达式,引入纳什均衡的概念来解释现实生活中的博弈困境。
二、博弈论基础
1.博弈的标准表达式
一个博弈问题需要明确该问题的参与者、每个参与者可以选择的策略,以及当确定所有参与者的决策后每个参与者的收益函数。所以,博弈的标准表达式由三个元素构成:参与者、每人的可选择战略合集、每人可选择战略集合的收益[2]。
若有n个参与者,记每一个参与者为其序号{1,2,…,n},其中参与者i的战略集合为Si,?襓Si?襓=mi,mi为参与者i的所有可能决策数,收益为ui(S1,S2,…,Sn)。所以,一个完整的博弈表达式可列为:
G={S1,S2,…,Sn;u1,u2,…,un}
以上文商家促销为例,在该博弈问题中,参与者共2人(商户A、商户B);二人的战略合集S1=S2={促销,不促销},收益函数u1,u2可以用双变量矩阵来表式,表1即为博弈矩阵。
表1 商户促销博弈矩阵
博弈标准表达式概括论博弈问题中的三要素,已知博弈标准表达式就已知了博弈问题中的所有信息,博弈标准表达式是我们科学研究博弈问题的第一步。
2.严格劣战略
当我们通过博弈标准表达式明确了我们的决策环境之后,如何合理地在现有条件下做最有利于自己的合理决策呢?
在博弈标准式中,令Si'和Si"为决策者i的兩个可行策略,即Si',Si"∈Si,如果对其他所有参与者的每一个可能的战略组合,决策者i选择Si'的收益都小于选择Si"的收益,
ui(S1,…,Si-1,S'i,Si+1,…,Sn) 那么战略Si'相对与战略Si"为严格劣策略。 如定义,严格劣策略是一个相对的概念,是和另一个可行策略相比是劣的。理性的参与者会主动抛弃严格劣策略,因为虽然无法知道其他参与者的决策,但是不管其他参与者选择什么决策,即不管在任何情况下,严格劣策略都不如另一个可行策略,所以理性参与者会提出这个策略。 以此类推,我们可以通过重复删除不同参与者的严格劣策略,找到最终博弈问题的解,即所有参与者的最终决策。 3.纳什均衡 在博弈问题中,若所有参与者自发通过理性选择,最终得到一个唯一的状态,由于是自动实施的所以也是战略稳定的,这一状态成为纳什均衡。 由纳什均衡的定义可知,我们可以通过重复删除严格劣策略求得博弈问题的纳什均衡点。 三、博弈问题求解 仍以上文商家促销为例,站在商家B的角度考虑,无论商家A促销还是不促销,商家B选择促销的收益都要高于不促销,故不促销是此博弈问题的严格劣战略。排除商家B的不促销战略,对于商家A而言,不促销相对于促销是严格劣策略。所以,通过两次删除严格劣策略,可以求得战略组合{促销,促销}为该博弈问题的纳什均衡点[3]。 四、实例分析 博弈困境模型虽然简单抽象,但是现实中存在很多的应用,比如最近很活跃的互联网公司之间的竞争比拼:滴滴和快的两家公司对打车市场的争抢;美团和饿了么之间补贴竞赛,等等。 在这些博弈问题中,博弈双方都使用的最简单粗暴的竞争策略——低价补贴。低价补贴是一个恶性竞争,一旦开始,就会像装备大战一样陷入胶着,也就是所谓的博弈困境。在博弈问题中,任何博弈方一旦停止补贴,而竞争对手如果继续采取补贴策略,那么用户就会选择有补贴优惠的平台,这就势必导致提前结束补贴的一方陷入被动局面,甚至被竞争对手给彻底甩开。 所以,博弈中存在竞争关系的双方不得不选择低价补贴的策略,进入僵持局面,陷入博弈困境。面对此困境,寻求合并线下商议,博弈参与者通过交流获取更多信息,是一个比较好的打破僵局的方法。通过资本的撮合和双方的协商,制定对双方都有利的规则,从而获得垄断优势,走出困境,取得长远发展。但是,在不加入外界影响和干扰的情况下,就会自发地陷入博弈困境,无法达到对多方博弈者都有利的点。 五、总结 博弈论把现实问题进行抽象,通过对博弈标准式、严格劣策略、纳什均衡等概念的介绍,以一个简单案例为例对其进行求解,最后对实际问题进行分析。通过对博弈困境的分析得出,个人的理性结果并不能导出团体的最优决策,是非合作的竞争[4],只有通过博弈参与者以外的第三方制定规则和限制才能使合作下的良性竞争出现。 参考文献: [1]李元栋,刘慎军,陈晓航.基于囚徒困境模型的高校员工帮助计划实施策略博弈研究[J].黑龙江高教研究, 2017(7). [2]吉本斯,峰.博弈论基础:A primer in game theory[M].中国社会科学出版社,1999. [3]张峰.论博弈逻辑的分析方法——纳什均衡分析法[J].北京理工大学学报(社会科学版),2008(2):95-99. [4]陶锋,杨积成,刘金红.“囚徒困境”视角下的企业间信息共享博弈分析[J].技术经济与管理研究,2013(7):22-26.