讨价还价博弈及其子博弈精炼纳什均衡

2018-03-12

福建质量管理 2018年4期

(武汉大学经济与管理学院湖北武汉 430072)

一、引言

在现实生活中，资源往往是稀缺的，因此经济个体的利益常常会产生冲突。就像一群人分一块蛋糕，一个参与者得到更多的蛋糕就必然意味着其他参与者的收益减少。而博弈论的一个经典假设就是所有的参与者都是理性的，这就意味着他们在进行博弈时都会追求个人利益最大化。因此，为了可能得到的更多的利益，他们往往不会就这种博弈的最优结果达成共识。

在这种情况下，博弈参与者企图采取对所有参与者而言都有利的决策来缓解这种冲突。如果存在多个决策最终能使每个参与者获得比一无所获更好的收益，并且不同的参与者对各种决策都有不同的偏好时，他们往往会达成某种协议(通常情况下如果参与者们没能达成协议，那么他们不会获得任何收益)。博弈论作为一种有助于分析决策主体相互作用的工具，可以用来分析协议形成的过程。

根据博弈进行的次数不同，模型主要分为两种情况，分别为有限期和无限期模型。有限期的情况可以通过逆向归纳来得出博弈的最优结果。无限期的情况则比较复杂。博弈终点的缺失使得我们不能用研究有限期的方法来得出博弈的均衡，因此我们必须考虑“一次偏离性质”。

二、模型的基本前提

两个参与者就1美元进行分配。设xi是参与者i(i=1,2)所得到的美元(0≤xi≤1).两个参与者可能得到的结果可以由如下集合表示

X={(x1,x2)|x1,x2≥0,x1+x2=1}

如果没能达成协议，在第3期，参与者1是出价者。在第4期，参与者2.以此类推。

博弈持续到其中一方接受对方的提议或者期末(第T期)。

如果这场博弈在第t期结束(1

如果直到第T期，双方还没有达成共识，那么博弈过程结束。最终他们的收入为(s1,s2)，其中s1+s2≤1。可以假设s1=s2=0。在现实生活中，谈判的不欢而散往往不会给双方带来任何利益，因此这是一个合理的假设。

三、有限期限的情况

(一)简单模型——三期的模型。下面来考虑T为有限值的情况。考虑T=3的情况，如图3.1.1所示。

现在给出纳什均衡的定义。

定义3.1.1：在一个多期拓展博弈中，如果一个策略s*使得对于每个参与者i的所有策略si，都有

那么称这个策略为纳什均衡(Nash equilibrium)。

因此纳什均衡可以理解为，在均衡中，不改变其他人的策略，某个参与者的策略时最优的。由于讨价还价博弈可以看成是一个完全信息的拓展博弈，所以它的子博弈可以看成是从某个博弈节点开始重新进行的博弈。子博弈均衡也由此定义。

采用逆向归纳法。

图3.1.1

参与者1在第1期出价

出价被接受。

(二)推广的模型——任意有限期的情况

现在考虑T=2n+1的情况。当T=5时，情况如图3.2.1所示。

且被接受。当T=2n+1时，在子博弈精炼纳什均衡中，参与者1的收入是

用数学归纳法证明这个结论。

即当T=2n+3时原式也成立。

下面考虑T为偶数，即T=2n+2的情况。此情况相当于将第2期作为博弈起点而两个参与者角色互换的博弈。运用上面的结论可得，当博弈过程进行到第2期的时候，参与者2所得到的美元为

因此消费者1的均衡出价为

四、无限期限的情况

(一)模型的基本前提

下面考虑T=∞的情况。如图4.1.1所示。

首先假设d=(0,0)，由于贴现因子δi会使得下一期的收益总比当期小，当T→∞时可以认为两个参与者的收益都趋近于0，这个假设变得十分合理。纳什均衡的定义没有排除不可信威胁的可能性。所以，纳什均衡的个数非常多。几乎所有的方案都是均衡。

(二)Rubinstein定理

图4.1.1

取T→∞得

现在我们将两个参与者的角色互换，即参与者2在第1期出价，同理可得他的出价为

上面的极限即是无限期的均衡结果。证明如下(Rubinstein 1982)。

首先证明子博弈精炼性。只需考虑参与者在某一期偏离这个策略但在其后遵守均衡情况的策略的情况。从收益最大化的角度考虑，在出价中，参与者尽可能的增加自己的收益，因此在偏离的策略中，出价人的份额只可能比均衡策略中的大，所以其他的情况都可以归纳为这种情况。

在偶数期的情况与此类似。

下面证明此均衡的唯一性。

将这两个不等式联立，得

因此，均衡结果中参与者仅可能有唯一一种收益。均衡的唯一性得证。

综上所述，Rubinstein定理得证。

五、有成本的讨价还价博弈

(一)模型的改动

在Rubinstein的模型中，参与者的收益会随时间减小，这与参与者对美元收入的时间偏好有关。当期1美元给参与者带来的效用必然会比未来的1美元大。在在现实生活中，协商或者谈判之类的活动都会涉及到成本。除了时间偏好以外，该成本还涉及到场地、设备等因素。

将模型的其他条件不变，但每次出价的过程都会产生成本，参与者的收益函数中不再有贴现率(也可以理解为，贴现率作为一个因素包含在成本系数中)，并且对于不同的参与者来说这个成本也是不同的。设参与者i的成本为ci。也就是说，收益函数变为xi-cit。

(二)模型的均衡结果

一个重要的结论如下所述：在有成本的两人讨价还价博弈中，如果c1

在奇数期，参与者1出价(1,0)，参与者2接受任何满足x2≥0的出价；

在偶数期，参与者2出价(1-c1,c1)，参与者1接受任何满足y1≥1-c1的出价。

证明：子博弈精炼性：与Rubinstein定理证明类似。同样只需考虑，参与者在某一期偏离这个策略但在其后遵守均衡情况的策略的情况。

设参与者1的出价为(x1,x2)。

如果x1<1，参与者1的收益会减少。

参与者2如果不接受均衡出价，下一期会得到c1。而在均衡策略中，当期收益为0。因此在当期接受x2≥c1-c2是最优选择。而c1

对应的，设参与者2的出价为(y1,y2)。

如果y2

如果y2>c1，参与者1会拒绝他的出价，而在下一期遵守均衡策略。因此在下一期，参与者1的收益为1，相当于在当期获得1-c1的收益。这与接受出价时的收益相等。而根据假设，他应该接受出价。所以这个策略组合是子博弈精炼的。

现在证明唯一性。

综上所述，均衡结果中两人收益唯一。均衡也是唯一的。

综上所述，结论得证。

六、总结

本文的主要分析方法均来自于博弈论.在本文的模型中，参与者们的利益会产生冲突。博弈论作为一种研究参与者策略的工具，在这种情况下显得十分有效。诚然，与经济学有关的内容由于一些看起来不切实际(有时也可称为过多)的假设而显得与现实生活相去甚远。但在处理实际问题时，以这种理性的思维方式思考对策也往往会使我们处于有利地位。

[1]Osborne,M.J.,and A.Rubinstein(1990),Bargaining and Markets[M].San Diego:Academic Press.

[2]Reny,P.J.(1992),Backward Induction,Normal Form Perfection and Explicable Equilibria,[J]Econometrica60,627-649.

[3]Rubinstein,A.(1991),Comments on the Interpretation of Game Theory[J],Econometrica59,909-924.

[4]Binmore,K.G.(1985),Bargaining and Coalitions[A],inGame-TheoreticModelsofBargaining[C],269-304 Cambridge University Press.