基于纳什均衡模型对贸易政策的研究
2019-07-18陈瑞华广东广雅中学
陈瑞华 广东广雅中学
一、博弈论与纳什均衡理论简介
博弈论亦称对策论,隶属于应用数学的一个分支,是主要基于数学模型研究在不同条件下的最优决策问题的理论。近代博弈论理论主要由Zermelor、Borel和von Neumann提出。1928年von Neumann证明了博弈论理论的基本原理,进而宣告了博弈论的诞生。1950~1951年,John Forbes Nash, Jr证明了均衡点的存在,为博弈论的一般化奠定了基础,随后又给出了现在广为流传的纳什均衡的概念,将博弈论的研究推向高潮。
博弈论中的纳什均衡指的是每个博弈者的平衡策略都是为了达到自己期望收益的最大值的策略组合。其中一个经典的纳什均衡案例是“囚徒困境”问题,该案例大意为,有两个犯罪嫌疑人作案被警察逮捕,分别被带到不同的审讯室去审讯,对于每个犯罪嫌疑人,警方给出的刑罚政策是:如果两个犯罪嫌疑人都坦白,那么证据确凿,每个人都被判刑8年;如果两个人都抵赖,因证据不足,每个犯罪嫌疑人按妨碍公务罪各判刑1年;如果其中一个犯罪嫌疑人抵赖而另外一个犯罪嫌疑人坦白的话,那么抵赖的将被判刑10年,而坦白的将被释放。假设两个犯罪嫌疑人分别为A和B,那么根据他们各自的策略不同,他们的收益矩阵如表1.1所示,其
AB 坦白 抵赖坦白images/BZ_175_476_2402_540_2442.pngimages/BZ_175_687_2402_768_2442.png抵赖images/BZ_175_468_2470_548_2509.pngimages/BZ_175_696_2470_760_2509.png
表1.1:A和B不同策略的获刑年数
在“囚徒困境”的案例中,A和B最优的策略就是两个人都抵赖,这种情况下两个人判刑年数之和是最少的。但由于两个人处于隔离状态,因此两个人在做决策时无法进行讨论,而每个人都会选择对于自己最优的策略。对A来说如果他要选择对于自己最优的策略,那么在做决定之前就要考虑B的选择:在B选择坦白的情况下,若A坦白将被判刑8年,若A抵赖将被判刑10年;在B选择抵赖的情况下,若A坦白则可获释,若A抵赖则获刑1年。综合来看,无论B怎么选择,对于A最优的策略是坦白,同样地无论A如何选择,对于B最优的策略也是坦白,因此A和B会选择表1.1收益矩阵中左上角的策略组合,即A和B都会选择坦白被判刑8年,但这种组合对于整体来说不是最优的选择。
二、博弈论在贸易政策选择中的应用
在世界贸易发展历史中,贸易保护和贸易自由政策相伴而生。尽管现代经济学中有共识,贸易自由会提高参与国的福利水平,但由于各种原因,贸易保护政策还是时有发生的,尤其在经济危机发生时。本小节主要通过构建博弈模型,对贸易保护和贸易自由政策进行分析,探讨贸易保护政策盛行的原因。
首先给出博弈模型的假设条件。为了简化模型和方便分析,假定如下,1)假设仅有两个国家C和D参与博弈;2)每个国家都从自身利益最大化的角度考虑;3)两个国家只有两种策略:贸易保护和贸易自由;4)两个国家的沟通自由,无信息约束;5)两个国家的任何策略的满意度可以用数值来衡量。
假设C国与D国同一时间选择贸易政策,此时C国和D国的博弈属于完全静态博弈模型。他们的不同策略情况下的收益矩阵由表2.1给出。
CD 贸易自由 贸易保护贸易自由images/BZ_175_1167_2361_1292_2400.pngimages/BZ_175_1387_2361_1513_2400.png贸易保护images/BZ_175_1167_2428_1292_2467.pngimages/BZ_175_1387_2428_1513_2467.png
表2.1:C国和D国同时选择贸易政策时的收益矩阵
由国际贸易理论可以得到,当一国实行“贸易自由”的政策,而另一国实施“贸易保护”的政策时,实施“贸易自由”政策的国家会蒙受损失,而实施“贸易保护”的国家会从另外一个国家获得好处;两个国家都采取“贸易自由”的政策要比两个国家都采取“贸易保护”的策略的收益好的多。因此关于表2.1的收益排序为,
(一)一次博弈模型分析。
考虑C国和D国进行一次的博弈模型,我们需要找到对于两个国家都最优的策略组合。以C国为例进行分析,C国在做贸易政策制定时会考虑D国的贸易政策,可以分为两种情况来讨论。情形一,在D国选择贸易保护的假设下,如果C国选择贸易自由,则C国的收益为, 如果C国选择贸易保护,则C国的收益为,由于,因此在这种情况下C国选择贸易保护;情形二,在D国选择贸易自由的假设下,若C国选择贸易自由,则C国的收益为,若C国选择贸易保护,则C国的收益为,由于,在这种情况下C国也选择贸易保护。综合两种情形来看,无论D国选择什么样的贸易政策,对于C国来说最优的策略都是贸易保护,同样地对于D国来说无论C国选择什么样的贸易政策,D国最优的政策也是贸易保护。所以一次博弈的结果是纳什均衡策略即对于每个成员国来说是最优的策略,但对于整体来说最优的策略应该是,一次博弈的结构陷入“囚徒困境”。
(二)有限多次博弈
在一次博弈模型中,对于两国来说最优的策略组合是纳什均衡策略。接下来,我们着重探讨在有限次博弈模型中的策略组合。假设C国和D国一共进行次博弈,那么对于C国和D国来说最优的博弈结果是每次都选择纳什均衡策略,即.下面我们利用归纳法给出证明。
因为是进行了多次博弈,所以在博弈的过程中会存在合作的可能,但是由于博弈次数是有限的,最终发现最优的博弈策略每次都是(贸易保护,贸易保护)的组合,即每次都会陷入“囚徒困境”。其实这在博弈论中也有相应的理论,即有限次博弈唯一的均衡策略是每次博弈都沿用原博弈均衡的策略。
三、小结
本文研究的贸易政策选择模型都假设进行有限次博弈,那么不管是博弈一次,还是博弈有限多次,最终两个国家都会陷入(贸易保护,贸易保护)的“囚徒困境”,即该贸易策略从每个国家来看对于本国都是最优策略,但从两个国家的整体效益来看却不是最优的。