基于纳什均衡模型对贸易政策的研究
2019-08-15陈瑞华
陈瑞华
摘要:博弈论是一个古老而有趣的内容,纳什均衡是博弈论中非常著名的一个理论。本文首先介绍了纳什均衡相关的理论,其次利用该理论探讨了不同博弈模型下各个国家贸易政策的选择,并由此解释了在世界贸易中各个国家实施贸易保护政策的原因。
关键词:纳什均衡 贸易自由 贸易保护
一、博弈论与纳什均衡理论简介
博弈论亦称对策论,隶属于应用数学的一个分支,是主要基于数学模型研究在不同条件下的最优决策问题的理论。近代博弈论理论主要由Zermelor、Borel和vonNeumann提出。1928年von Neumann证明了博弈论理论的基本原理,进而宣告了博弈论的诞生。1950-1951年,John ForbesNash,Jr证明了均衡点的存在,为博弈论的一般化奠定了基础,随后又给出了现在广为流传的纳什均衡的概念,将博弈论的研究推向高潮。
博弈论中的纳什均衡指的是每个博弈者的平衡策略都是为了达到自己期望收益的最大值的策略组合。其中一个经典的纳什均衡案例是“囚徒困境”问题,该案例大意为,有两个犯罪嫌疑人作案被警察逮捕,分别被带到不同的审讯室去审讯,对于每个犯罪嫌疑人,警方给出的刑罚政策是:如果两个犯罪嫌疑人都坦白,那么证据确凿,每个人都被判刑8年;如果两个人都抵赖,因证据不足,每个犯罪嫌疑人按妨碍公务罪各判刑1年:如果其中一个犯罪嫌疑人抵赖而另外一个犯罪嫌疑人坦白的话,那么抵赖的将被判刑10年,而坦白的将被释放。假设两个犯罪嫌疑人分别为A和B,那么根据他们各自的策略不同,他们的收益矩阵如表1.1所示,其中(x,y)代表A和B分别获刑x年和y年。
在“囚徒困境”的案例中,A和B最优的策略就是两个人都抵赖,这种情况下两个人判刑年数之和是最少的。但由于两个人处于隔离状态,因此两个人在做决策时无法进行讨论,而每个人都会选择对于自己最优的策略。对A来说如果他要选择对于自己最优的策略,那么在做决定之前就要考虑B的选择:在B选择坦白的情况下,若A坦白将被判刑8年,若A抵赖将被判刑10年;在B选择抵赖的情况下,若A坦白则可获释,若A抵赖则获刑1年。綜合来看,无论B怎么选择,对于A最优的策略是坦白,同样地无论A如何选择,对于B最优的策略也是坦白,因此A和B会选择表1.1收益矩阵中左上角的策略组合,即A和B都会选择坦白被判刑8年,但这种组合对于整体来说不是最优的选择。
二、博弈论在贸易政策选择中的应用
在世界贸易发展历史中,贸易保护和贸易自由政策相伴而生。尽管现代经济学中有共识,贸易自由会提高参与国的福利水平,但由于各种原因,贸易保护政策还是时有发生的,尤其在经济危机发生时。本小节主要通过构建博弈模型,对贸易保护和贸易自由政策进行分析,探讨贸易保护政策盛行的原因。
首先给出博弈模型的假设条件。为了简化模型和方便分析,假定如下,1)假设仅有两个国家c和D参与博弈;2)每个国家都从自身利益最大化的角度考虑;3)两个国家只有两种策略:贸易保护和贸易自由;4)两个国家的沟通自由,无信息约束;5)两个国家的任何策略的满意度可以用数值来衡量。
假设c国与D国同一时间选择贸易政策,此时c国和D国的博弈属于完全静态博弈模型。他们的不同策略情况下的收益矩阵由表2.1给出。
因为是进行了多次博弈,所以在博弈的过程中会存在合作的可能,但是由于博弈次数是有限的,最终发现最优的博弈策略每次都是(贸易保护,贸易保护)的组合,即每次都会陷入“囚徒困境”。其实这在博弈论中也有相应的理论,即有限次博弈唯一的均衡策略是每次博弈都沿用原博弈均衡的策略。
本文研究的贸易政策选择模型都假设进行有限次博弈,那么不管是博弈一次,还是博弈有限多次,最终两个国家都会陷入(贸易保护,贸易保护)的“囚徒困境”,即该贸易策略从每个国家来看对于本国都是最优策略,但从两个国家的整体效益来看却不是最优的。