基于N维非合作博弈
2015-07-05卢丰周会红
卢丰 周会红
一、绪论
1.目的
本文从二维非合作博弈①出发,推广至N维,人为地改变影响博弈的量,改变原博弈均衡②,使结果朝着有利于资源利用的方向变化,解决社会中存在的资源在众人中合理分配问题。
二、理论基础
1.n维非合作博弈均衡点存在性
由角谷静夫定理可推断有均衡点存在。基于角谷静夫不动点定理而对存在性定理给出的证明(发表在:Proc.Nat.Acad.Sci.U.S.A.pp.48-49),该方法直接由布劳维尔不动点定理得出。证明的是在n维空间里构建一个连续变换的T,使得T的不动点就是博弈的均衡点。由于n维混合策略空间是一个胞腔,且由布劳维尔不动点定理可知映射T至少有一个不动点ε,该点一定是一个均衡点。③
三、乘车博弈
1.乘车问题
AB两理性人住在两个房间(信息不对称④),居住处仅有1辆车仅能容纳1人(资源稀缺性⑤),明天为假日,AB都想出行,由于无法交流,他们只能在有限的时间里,进行博弈。假定效用⑥最大值为1,最小值为0,中间值为0.5。
第一种情况:AB都选择明天去,车无法满足需求,资源配置不足。效用和为1.5(最大值为2)。
第二种情况:A认为B选择明天去,所以A不准备明天前往,而B没有考虑到这种情况,从而选择了明天前往,AB中一人明天前往,一人后天前往,资源合理配置⑦,此时效用和为1+1=2,为最大效用和。
第三种情况:AB都认为彼此明天前往会给对方带来威胁,于是都选择了后天前往,这种情况就造成了明天空车现象与后天超载现象,带来的效用和为1.5。
第四种情况:A若考虑到“B若认为A明天前往从而B选择后天前往”的情况,也许A就选择明天前往,但同时,若B也考虑到“A若认为B明天前往从而A选择后天前往”的情况下,B就会选择明天前往,这样,明天又会造成超载的情况,此时的效用和为1.5。
第五种情况:考虑到彼此的三步潜在决定从而做出的决定。
第n中情况:考虑到彼此的N步潜在决定从而做出的决定。
双方会陷于无尽的博弈循环中。不交流则不了解,只有靠判断做出决定。考虑的潜在决定步数决定了是否能达到效用和最大的情况。双方出现相差为奇数的情况,如A考虑一步,B考虑了两步,就会出现效用和最大的情况,但出现偶数的情况,如A考虑一步,B考虑三步,那么,资源仍然分配不均,不能帶来效用最大化的情况。所以,只要他们分开前往,所得到的总效用为最大2。
四、二维博弈模型分析
1.总效用的模型表示
将以上效用表达如下:
任何有限的非合作博弈至少存在有一个均衡点,而且非合作博弈均有可解性与强可解性⑧,证明来自John F. Nash,Jr论文。
2.博弈斗争性模型
基于以上的分析,可以得出以下结果:
(1)A考虑1+X步,B考虑2+X步,那么所得的博弈结果是一个明日前往,一个明日不前往,这时候所得的效用是最大的。
(2)A考虑1+X步,B考虑3+X步,那么所得的博弈结果是一个明日前往(不前往),一个明日前往(不前往),这时候所得的效用是最小的。
另外:无论X为多少,它不影响博弈的结果,“A考虑1+X步,B考虑2+X步”这种情况与“A考虑1步,B考虑2步”的结果是一样的。“A考虑1+X步,B考虑3+X步”与“A考虑1步,B考虑3步”所得的结果也是一样的。
X在这里只不过是一个循环数,本研究将其称为“循环因子”。
把A的博弈动态转化在圆上,把B的博弈过程转化在另一平面的圆上。相切于a、b两点。
假定前提:
(1)两个圆都只是AB各自的博弈过程,AB两人是两个质点。
(2)A循着大圆作博弈结果,而B则循着“椭圆”作博弈结果,他们在环上所做的半个循环步数(每半圆)即为前面说过的考虑潜在决定的步数。
(3)a、b都只能容纳下一个质点,a表示明天不前往,b表示明天前往。同时,椭圆可围绕a、b转动,即a、b是“椭圆”的轴。我们以θ来表示“椭圆”的偏转角度,0≤θ≤π2,θ受理性人的心理偏好与外界因素的影响,θ越大,表示对“前往”的心理偏好越大,反之亦然。
(4)A、B只有a、b两个停靠点,也就是博弈的决定点。
(5)心理偏好是相对的,我们固定大圆固定不变,“椭圆”进行旋转。
描述AB博弈过程:
(1)AB同时停留在a点,这就导致资源未达到合理分配,表示A、B两人都做出了明日不前往的决定。
(2)AB同时停留在b点,这也导致资源未达到合理分配,表示AB都做出了明日前往的决定。
(3)A停留在a点,B停留在b点,或者A停留在b点,B停留在a点,资源都能达到合理的分配,表示一个明日前往,一个明日不前往(后天前往)。
(4)该模型也符合循环因子X的假设,即只要A选择其中一个停靠点,那么B是经过几个循环才选择到停靠点都跟X无关。
θ的意义:
1、
θ取值为π2,“椭圆”已经围绕ab两点旋转至与大圆重合,极端情况,表示AB两人都具有极强的明天前往的心理偏好,只会做出前往的决定,阴影面积为圆面积,它为大圆面积的100%,即表示,AB明日同往的概率为100%。
2、
θ取值为0,“椭圆”已经围绕a、b两点旋转与大圆垂直,极端情况,表示AB两人是互相完全排斥的,他们都做出不前往的决定,而且一直不前往。阴影面积为0,也就表示AB明日同去的可能性为0。
3、
AB对明天“前往”具有不同心理偏好,θ取值在0与π2之间。将θ作为常量处理,即不受其他因素影响,考虑AB共同前往的可能性。“椭圆”偏转角度θ越大,AB的心理偏好越强,同去的可能性越高。
阴影部分占大圆面积比例m:
m=阴影面积大圆面积=πr2sinθπrr=sinθ
阴影占大圆面积的比例m仅仅与θ有关。
3.假设前提
m=sinθ,反映的是AB两人在非合作博弈中最终一同前往的可能性,这也间接地反映了AB两人的心理偏好与预期效用⑨。
效用函数,就是赋予个体的每一预期一个实数。效用函数并不唯一,如果U是这样一个函数,那么a>0时,au+b也是这样一个函数。如果用大写字母表示预期,小写字母表示实数,这样的效用函数满足下列性质:
(1)uA>uB等价于A优于B,以此类推。
(2)若0≤p≤1,则u[pA+(1-p)B]=pu(A)+(1-p)u(B)⑩
对一人单独分析,引入“潜在前往因子”和“非排斥因子”。
用m=sinθ来间接表示这种预期效用与偏好的动态过程。θ增大,AB两人共同前往可能性越大。用sinθ曲线间接表示预期效用,则沿着sinθ所作的切线即为预期边际效用MU,切点处与原点所围成的图形面积即为预期效用。随着所作决定时考虑的潜在决定的步数的不断增加,预期边际效用MU逐渐递减,符合边际效用递减规律。等同于 “非排斥因子”的概念,即随着A前往的概率越来越大。同时,A也总会考虑B的前往决定从而对自己的决定产生犹豫,而对B的犹豫又会与自己想得到最大的预期效用相违背,于是产生了这种博弈。这时候两人相互的排斥力也越来越大,即“非排斥因子”越来越小。我们可以用sin′θθ = t 来表示“非排斥因子”。
另一方面,由于理性人都想让自己的满足程度达到最大,所以A前往的潜在决定越来越大,即A前往的可能性也越来越高,∫t0sinθdθ 在0≤θ≤π2时它的值在0-1之间呈概率分布。θ偏转角度越大,∫t0sinθdθ 的值也就越大,前往的可能性也就越高,把它看做“潜在前往因子”。
4.博弈均衡
(1)非排斥因子>潜在前往因子,A的预期效用很大,因为他觉得B与他之间的“排斥力”很小,所以A前往的可能性极高,在原点时达到最大,他会有很强的心理偏好来引导他做出“前往”的这一决定,直到他的非排斥因子不能承担为止。
(2)非排斥因子”<“潜在前往因子”时,A的预期总效用已经很大,同时,由于他的非排斥因子已经小于潜在前往因子,那么,由于对B的决策的犹豫,他们之间的“排斥力”很大,A作为一个理性人不会再产生“前往”的心理偏好,这时候,A的决定就会停留在一个自己能接受的点上。
(3)所以,理性人会把决策均衡点放在非排斥因子=潜在前往因子的时候,只有在这个时候,没有任何其他的“排斥力”会使得决定人的心理偏好发生改变从而做出重新选择前往的决定,这时候,决定人的心理趋向于一种既安全又满足的状态。
假设存在t,使得“潜在前往因子”=“非排斥因子”成立。
∫t0sinθdθ =sinθ′θ = t
∵∫t0sinθdθ =sinθ′θ = t
∴ -cost-1=cost
∴ cost=12
得t=π3,均衡点的角度为θ=π3,m=sinπ3=32
在AB博弈过程中,最终有cosπ3=12的预期边际效用,使得AB在明天共同前往的可能性为sinπ3=32≈0.866。在二维非合作博弈中,如果两人都将对方的潜在决定作为自己下决定的依据,想得到最大效用,则做出共同“前往”的可能性约为0.866。但均衡解未必是最優解。
五、二维到N维非合作博弈
1.N维非合作博弈模型
多维博弈的模型图表示的是不同人的彼此之间的非合作博弈过程。此时,均衡角度依然是θ=π3,事件之间相互独立,但他们要一同做出“前往”的可能性就被影响因子缩小了,小于0.866。当维数趋于非常多的时候,阴影部分共同区域的图形就越可测量。
2.模型讨论
θ对实验的影响:
当θ=π2 时,所有平面的圆都旋转与大圆重合,这时候n = 1,表明在所有人都具有相同的极端强烈的心理偏好的情况下,N人都将会选择第二天“前往”。这是一种极端情况。
2、
维数等于圆个数,它们彼此相切相互影响。维数越趋向于正无穷,其结果越接近真实值。强调两个前提:(1)凡是在一个模型中,所有参与非合作博弈的人具有相同的心理偏好B11;(2)旋转角度θ是基于对某特定事件的心理偏好B12。
3、
如果每个人都具有相同的“不前往”的心理偏好,那么此时,旋转角度θ=0,同时n = 0,即明天将不会有任何人前往。
3.N维非合作博弈模型的总结
表述:
(1)宏观上,同心理偏好群体(N维)一定前往的话,他们同去的可能性为sin2θ=1。微观层面上,两个人的博弈,一同前往的可能性也为100%。此时旋转角度θ=π2。
(2)宏观上,同心理偏好群体非常想去的话,他们同去的可能性为sin2θ=34。微观层面上,两个人的博弈,一同前往的可能性为sinθ=32,此时旋转角度θ=π3。
(3)宏观上,同心理偏好群体都可能前往的话,他们同去的可能性为sin2θ=12。微观层面上,两个人的博弈,一同前往的可能性为sinθ=22。此时旋转角度为θ=π4。
(4)宏观上,同心理偏好群体都无所谓前往不前往的话,他们同去的可能性为sin2θ==14。微观层面上,两个人的博弈,一同前往的可能性为sinθ=12。此时旋转角度为θ=π6。
(5)宏观上,同心理偏好的群体都不前往的话,他们同去的可能性为sin2θ=0。微观层面上,两个人的博弈,一同前往的可能性为sin2θ=0。此时旋转角度为θ=0。
六、應用
1.二维博弈
AB分别为此次假设中的乘客,他们彼此将对方的想法作为自己做出决策的基础,由第四章可知,若AB一定前往,则两人有100%的概率相撞;若AB可能去,则会有22的概率相撞;若AB都无所谓,则有0.5的概率相撞。若事先得知二人的偏好程度,可以调整公交车数量。
2.多维应用
国庆前,抽样得知,国庆节将有4000人去华山,他们彼此间都担心对方的前往会不会给自己造成不便,且他们只对具有相同心理偏好的人产生博弈。抽样显示,一定前往1000人,非常想去1000人,可能去1000人,无所谓1000人,那么,国庆那天,预计会去的人数为:
1000+1000×34+1000×12+1000×14=2500
若华山承载上限为2000人,则应及时考虑降低群体的偏好即θ,如提高票价,或者安排部分去泰山游玩等来降低他们的预期效用,使资源达到最佳配置;若华山的承载上限为3000人,则应及时考虑提高群体的偏好即θ,如降低票价,提供更多的宣传和服务以及开放华山其他游玩项目等,从而使资源达到最佳配置状态。
注解:
① 该词摘自:Robert S.Pindyck,Daniel L.Rubinfeld. 微观经济学[M].北京:中国人民大学出版社,2009:467
② 博弈均衡指n个参与人的一组策略(纯策略或者混合策略)选择,在其他人策略选择不变的情况下,任何人都不能通过改变策略来使其期望支付得到改善。
③ 引自:John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012:33-34
④ 信息不对称:不同经济主体缺乏信息的程度往往是不一样的。
⑤ 资源的稀缺性:一些资源的数量是有限的,具有排他性或竞争性。
⑥ 引自:Robert S.Pindyck,Daniel L.Rubinfeld.微观经济学[M].北京:中国人民大学出版社,2009:76
⑦ 合理配置:即帕累托最优状态。
⑧ 强可解性:具有特殊性质的解。
⑨ 预期效用:心理上所认为会得到的效用,是一种计划效用,非实际效用。
⑩ 引自:John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012:4
B11 前提(1)来源于阿罗不可能定理。该定理是这样表述的:如果众多的社会成员具有不同的偏好,而社会又有多种备选方案,那么在民主的制度下不可能得到令所有的人都满意的结果,即博弈无解。所以必须要有这样的假设前提。
B12 为了方便计算所给出的一种标准,也可以以“事件的反面”来进行计算。
参考文献:
[1] John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012
[2] Robert S.Pindyck,Daniel L.Rubinfeld. 微观经济学[M].北京:中国人民大学出版社,2009:467
[3] Kakutani S.Duke Math.[J].8,457-459(1941)
[4] Von Neumann J,Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton:Princeton University Press,1941
[5] Nash J F.,Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press,1950