真实制度均衡过程与博弈分析
2013-07-31关越
关 越
(吉林大学经济学院,吉林 长春 130012)
在制度起源和演变过程的研究中,传统制度理论或博弈论往往假定博弈双方具有对等的谈判地位、博弈空间和支付结构,也就是说,基于同等社会经济地位、制度中性,探讨在资源禀赋对等条件下的契约缔结问题。[1]理论界对于制度均衡有着两种截然不同的理解,其一认为制度均衡是分散的个体为了谋求最大的个人利益而进行的有计划的实施,是社会群体实现各自利益最大化过程中达成的均衡结果。现实社会中,为了实现群体利益的均衡,多数制度往往通过谈判的方式进行一对一的缔结,是一种显性而非隐形的方式。其二认为制度均衡是市场竞争中各经济个体在追求利益最大化过程中自然而然形成的结果。也就是说,个体在从事行为选择时并不以能够最终形成均衡制度为追求目标,制度是在无数个体的重复数次博弈中自然而然形成的固定模式,是一种随机出现的结果。
由于传统制度均衡过程是在博弈双方经济资源禀赋对等、制度无分配效应、信息完全和零交易成本的假设中进行的,与现实世界中的制度形成过程相差甚远。现实世界中经济资源禀赋差异、信息偏在、制度非中性等问题的广泛存在,使得制度均衡问题分析变得异常复杂。资源禀赋的不对等问题似乎对制度均衡更具有解释力。为此,本文从博弈论的角度探析资源禀赋非对等状况下的制度均衡过程。
一、制度均衡和制度变迁的博弈概述
制度的出现不论是人为设计还是自然演进,都不仅为了解决一次性的问题。一旦制度成立并运行,会在一段时间内、一定范围内对相关个体行为形成重复性约束。并且,对于每一种特定且重复性的问题,都以一定的制度保障或约束实现生产、交易和分配过程中的最高效率。在纷繁复杂的现实世界中,各种不同性质的经济活动要求制度具有多元性与创新性,通过减少信息不对称和交易成本等问题,在人类社会的生产和分配过程中实现有限资源的最优配置。
制度的产生、发展和演进使经济个体对问题的解决形成路径依赖,即制度产生和发展的实质是为了社会经济个体对在生产与生活中反复出现的问题提出统一解决方案。制度均衡与制度变迁的过程可以从以下几个问题开始探讨。一是在既定的自然状态、个人偏好和技术条件下,制度安排与制度结构均衡形成的时间;二是在均衡制度假设下,经济个体打破制度均衡进行制度创新与改革的原因。在制度均衡与制度变迁过程中,博弈双方在不同解决问题思路下会对经济问题进行不同的制度安排,但双方都以追求利润最大化或成本最小化为原则。所以,不论经济主体之间的博弈属于何种性质,为解决何种问题,终极目标都是为了实现自身的利益最大化。行为经济学和制度博弈论认为,个体行为在一个制度约束日益变化的经济体中必然有着深刻的制度特征。[2]换言之,制度均衡与制度变迁的形成不过是个体之间利益的分配与再分配问题。从本质上讲,制度问题即是收入分配问题。
依据资源禀赋决定论的逻辑,制度变迁的根源在于当事人拥有的资源禀赋差异。在信息与技术优势下,拥有较多资源禀赋的经济人对制度的设计与选择具有更强的竞争力和控制力,并使之遵循自己的利益最大化原则进行制度安排。一个经济个体较之博弈对方拥有越多的资源禀赋(如财富、职权、威望、自然资源等),对制度的选择和控制权也就越大,最终形成的制度安排与制度结构就越会向实现其利益最大化的方向倾斜。制度的资源禀赋决定论正是现实世界中进行的生产、交易和分配制度的真实写照。本文利用博弈研究方法分析制度博弈双方的合作问题,并将确定均衡问题转化为收入分配问题。
二、制度均衡和制度变迁的博弈分析
博弈模型中假定,经济个体M和N是具备完全理性和充足信息的市场交易个体,且交易成本为零。博弈双方满足(2×2)维博弈空间和支付结构;M、N双方拥有非对称资源禀赋,M为资源优势方。博弈双方静态一次性博弈支付矩阵如表1。
在一次或无限次重复博弈的情况下,M和N在博弈中会如何依据利润最大化原则进行行动方案选择?为此,本文将M、N两人的博弈问题分成三种不同情况分析均衡制度和制度结构的形成过程,分别是利益一致的合作问题、利益非一致的合作问题和利益非一致的不合作问题。
1.利益一致的合作问题
假设 M11>M12,N11>N12,M21>M22,N22>N21,且 Mij>0,Nij>0,i和j取值1或2。那么,该双人博弈就为利益一致的合作博弈问题,支付矩阵如表2。
从表1和表2中发现,在博弈双方利益一致的情况下,静态一次性博弈和无限次重复博弈问题几乎同解。为了让分析更简便和清晰,将M、N双方利益一致的博弈问题简化为静态一次性博弈问题,得到的(M11,N11)和(M22,N22)都是博弈均衡解。根据M11和M22、N11和N22的大小关系,可以得到:如果M11>M22>0,N11>N22>0,则博弈唯一均衡解为(M11,N11);如果 0 从上述合作博弈的均衡解中发现,一旦一方选择了某行动策略,那么另一方的行动策略也将是固定的。博弈双方都不希望对方改变策略,并且也没有改变自己行动策略的足够激励。因此,在对方没有改变策略的情况下,自己轻易改变策略只会使双方的支付都小于或等于零,即出现至少为M11和M22或 N11和 N22的损失。至于最终选择(M11,N11)还是(M22,N22)作为确定性的制度均衡并无差异。 但是,究竟选择哪一种均衡策略,在M和N是对等资源禀赋的假设前提下,传统的制度演化论和制度设计论存在不同的观点。一方面,制度演化论认为,当一方意识到对方将会选择某种策略时,对方也只能进行此种选择。双方一次性静态博弈的完成将恰好印证博弈双方在策略选择前对彼此的判断,即形成一个制度安排。在重复博弈过程中,博弈双方依赖于行为预期和行为惯例,将在以后的每次重复博弈中都重复第一次的策略选择,最终形成均衡制度安排。换言之,如果一个国家或社会中每个个体在进行类似策略选择时都遵循最初的行为规则,那么,一般化的社会习俗、惯例或制度便因此形成且实现均衡。因此,制度演化论认为,经济个体在面对同一问题时进行重复博弈,遵循同一行为规则,形成制度并进行传承与延续,再经由其他经济个体的遵循与模仿,从而形成惯例习俗或制度安排。也就是说,制度均衡是经济个体在追求个人私利过程中自然而然形成的制度安排,属于随机且偶然的事件。另一方面,制度设计论认为,社会经济个体在进行行动时是基于完全理性、信息充足与策略空间判断,对于博弈双方的利益最大化选择都有所了解。在博弈过程中,为了降低自身利益的损失,博弈双方会通过直接谈判或相互承诺的方式选择可以使双方利益优化的均衡策略组合。当重复面对同一经济问题时会遵循初次形成的策略方案或行为规则,按照双方之前有意协商与设计的规则来解决,即制度均衡是社会经济个体有意设计出来用以解决重复性经济问题而形成的结果。 表1 制度博弈均衡的支付矩阵 表2 利益一致的合作博弈均衡矩阵 当然,如果取消M和N双方具有对等资源禀赋的假设,上述均衡解则不再是随机性而是唯一确定的。资源禀赋决定论认为,在M拥有资源禀赋优势的假设下,最终均衡结果完全取决于M的利益和目标,M会绝对性地选择有利于实现自身利益最大化的行动策略而完全不用顾忌N的行动策略,即只要存在M11>M22,M就一定会选择行动1。但是,从合作博弈均衡矩阵中可以发现,不论M采取何种行动策略,N的利益与M是一致的。 2.利益不一致的合作问题 现实世界中并非仅存在利益一致的合作,更多时候是 M11>M22>0、0 在利益非均衡的合作博弈中,(M11,N11)或者(M22,N22)中的某一个策略组合将成为每个参与者的占有策略均衡。在无限次重复的博弈中,博弈双方在无数次面对同一问题时,理性行为人的选择将是遵循最初的行为惯例并建立统一的行为规则,目的在于减少交易成本和增加收益。但最终博弈双方会选择(M11,N11)还是(M22,N22)作为均衡制度安排,制度演化论和制度博弈论对此仍有不同的理解与认识。制度演化论认为,经济个体对于(M11,N11)或(M22,N22)的选择是偶然和随机事件。因为如果N预期M会选择行动1,即M11>M22>0,那么N也会选择行动1,即0 依据传统制度均衡理论的逻辑,制度博弈当事人的谈判力或控制力从何而来?或者说,是什么因素决定了经济个体的谈判力和权力结构?显然,制度演化论和制度博弈论是建立在博弈双方资源禀赋对等且权力结构对应基础上的。因此,不论制度博弈论还是制度演化论,都假定制度均衡是外生因素,没有切实回答真实制度均衡问题。 如果引入资源禀赋决定论,即还原经济个体间存在非对等的资源禀赋的现实,则可以更好地回答此问题。根据模型最初的假设,经济个体M和N之间存在资源禀赋的差异,M是资源优势者。显然,M会利用其因资源优势形成的影响力和控制力使最终策略组合向自身利益倾斜。资源劣势个体N完全可以预期到,M可以承受支付为零的非合作均衡结果。也就是说,M很有可能完全不顾及N的策略选择,只要最终的策略组合可以实现自身的利益最大化即可。如果M11>M22>0,M会忽略N的行动而直接选择有利于自身利益的行动1,而个体N即使存在0 3.利益非一致的不合作问题 利益非一致的不合作问题虽然引入资源禀赋决定论,但模型的设计和假设条件的安排都过于简单。首先,模型假设资源劣势个体N对于M的行动选择一定会选择跟从,即N一定会与M合作,没有考虑资源优势者M可能采取非合作的惩罚行动。在真实的经济活动与市场交易中,资源优势者M很有可能会对N的不合作行为进行惩罚,迫使资源劣势者N即便不愿意合作也不得不跟随M的行动选择。为了加深对此类问题的理解,本文将重新设计博弈支付矩阵,将简化的支付矩阵的策略组合由2个扩展为4个,并且,在这4组策略组合中,不存在绝对量上优于其他策略组合的组合,即M11>M12,M11 按照利益非一致的合作问题的分析逻辑,经济个体M和N都依据自己与对方的资源禀赋进行博弈,但不同的是,博弈一方采取某一行动时另一方可以选择合作或不合作,那么,采取不合作策略的博弈方得到的支付不再为零,也有可能得到更高的短期收益。从博弈矩阵可以看出,可以实现利润最大化的行动组合有(行动1,行动1)、(行动1,行动 2)、(行动 2,行动 1)或(行动 2,行动 2)。在存在非合作选择的博弈中,如果想实现重复多次的选择,实现稳定的均衡策略,博弈行为人必须制定可置信的威胁和可实施的惩罚机制。 表3 利益非一致且资源优势者可采取惩罚行动的支付矩阵 假设1:经济个体的等待需要支付成本,使得未来每次收益都存在一个折扣。为此,设定个体M和 N 的贴现因子为 δm和 δn,并有 δm>0,δn<1。 假设2:博弈双方即M和N拥有对等的信息,了解对方的策略空间和成本收益函数,并且有。个体M为资源优势者会优先选择行动1。在长期的无限次重复博弈中,资源优势者M在财力和时间等方面承受损失的能力会优于资源劣势者N。 假设3:博弈双方共同约定,存在某策略组合如(M11,N11),即(行动 1,行动 1)可以成为解决双方在生产、交换或分配过程中存在问题的一致性方案,[3]该方案是依据双方资源禀赋情况决定的。一旦一方不遵守此共同约定,另一方将拥有永不与对方合作的权力作为惩罚。博弈双方不进行合作的策略组合为(M22,N22),即(M11-m⊿M,N11-n⊿N)。 博弈双方M和N的最优化问题可以简化为:经济个体M: 其中,πM表示当个体N不遵守事先达成的共同约定时,个体M为惩罚个体N所愿意付出的最大损失。那么,当∑δMt-1⊿M>πM,个体M对个体N的惩罚行为是不可信的。式中λ取值1或0。当个体N采取行动1时,λ取值1;当个体N采取行动2时,λ取值0。 经济个体N: 满足约束条件:⊿N+ΣδNt-1(-n⊿N)≥0 当存在⊿N+ΣδNt-1(-n⊿N)≥0时,个体N将采取行动2。 在个体M和N的博弈过程中,资源优势者M将采取行动1,而资源劣势者N是否选择跟从M的行动则取决于个体N的约束条件。个体N的约束条件可以简化为: 当个体N满足δN≤1/(1+n)时,资源劣势者N将选择行动2,即不再跟从M的行动1。 此时,可以将博弈双方的策略选择具体分为以下几种情况。 第一种情况:当M满足δM≤πM/(πM+m⊿M),N满足δN≤1/(1+n)时,博弈双方的最终支付组合为(M11-m⊿M,N11-n⊿N),即选择行动组合(行动2,行动2)。在此约束条件下,M承受的损失越大,N选择不合作策略时受到惩罚的可能性就越大。但如果M完全预期到个体N会采取不合作的行为策略,M会同样采取不合作的行动,此时M的惩罚机制不会对N造成太大损失,因为当δN≤1/(1+n)时,不合作收益的增量大于零。在M和N都采取不合作策略作为最终策略组合时,该不合作均衡策略组合即为双方博弈的均衡解。在经济社会中,当双方重复经历此种情况时,将遵循同样的行为规则,并形成一般社会行动惯例,最终演化成为正式的制度安排。个体M和N的不合作组合(M11-m⊿M,N11-n⊿N)成为均衡制度安排和制度结构。 然而,现实世界中资源劣势者N的支付函数要复杂得多,并且资源优势者M对个体N进行的惩罚力度与N获得的支付呈正向变动趋势。在这种情况下,博弈双方的均衡策略组合将成为个体M所期望的策略组合。 为此,假设资源优势者M对个体N的惩罚机制将影响个体N的支付函数,πM表示个体M对个体N施加惩罚时所耗费的损失,即惩罚支出;⊿C表示个体N因个体M实施的惩罚机制所耗费的支出;πM和⊿C正相关,即⊿C=f(πM),且f'(πM)>0。个体N因不遵守事先与个体M达成的共同约定获得的收益为ΣδNt-1⊿C。只要个体M对个体N的惩罚使其付出足够多的支出,即满足δN≥时,个体N将选择遵守合同约定。随着πM的逐渐增加,由于存在⊿C'πM=f'(πM)>0,个体N的贴现因子更容易满足合作的约束条件,双方将达成事先约定的支付策略(M11,N11),即(行动 1,行动1)。该策略组合在长期内经过重复多次的运用,将逐渐演化为行动惯例即制度。并且,随着该制度的建立与日趋完善,大量具有相同性质的经济个体会联合成为利益同盟组织或集团,将个体的利益与集团的利益联系在一起。并且,具有资源禀赋优势的经济个体之间即类似于M之间更容易结成利益同盟。那么,资源劣势者因采取不合作策略行动受到的惩罚会越来越大。因为由资源优势者结成的利益联盟会将因惩罚资源劣势者带来的支付均摊,从而降低单独个体在实施惩罚机制过程中遭受的损失。也就是说,结成利益同盟后的资源优势者将具有更强的损失承受能力,继而强化和巩固了对(行动1,行动1)策略组合的选择。最终,这种由资源优势者掌握博弈话语权的社会制度得以形成并长期持续。 第二种情况:假设资源优势者M存在δM>πM/(πM+m⊿M),当资源劣势者N选择行动2时,M将对N的行动保持克制,不采取任何惩罚措施。在个体理性预期和信息完全的假设条件下,博弈双方完全有理由相信,如果资源优势者M采取行动1,资源劣势者N将采取行动2。这是由于在一般情况下M12 第三种情况:当δN>1/(1+n)时,博弈双方根本不存在不合作的可能性,M和N的行动会绝对地保持一致,选择策略组合(M11,N11),即(行动 1,行动1),并最终演化为行动惯例即均衡制度。 1.制度安排和制度结构均衡取决于行为人的资源禀赋。 如果当事人之间存在不对等的资源禀赋结构,那么,资源优势者对博弈的最终均衡策略有绝对的影响权和决定权。资源优势者会以实现自身利益最大化为目标进行行为选择,并通过对资源劣势者行为选择的影响,形成有利于资源优势方的均衡策略。此种策略组合在社会经济中经历多次重复后,最终演化为一般社会行为规范,形成均衡的制度安排与制度结构。也就是说,制度均衡和制度结构是资源优势者有意设计和选择的结果。均衡制度和制度结构的形成过程为:资源禀赋(t)→策略选择控制权(t)→制度安排和制度结构(t)→收入分配结构(t)→资源禀赋(t+1)。依次循环往复,资源优势者凭借其在博弈中占据的优势形成有利于自身的制度安排与制度结构,并在下一轮的博弈中赢得更多的资源,获得更多的博弈话语权。 2.在经济发展和制度均衡的形成过程中,博弈双方资源禀赋的非对等性决定了制度的不平等性。 帕累托最优效率标准的实现存在一个前提假设,即市场交易中的经济个体拥有对等的经济地位。在边际效用等于边际成本的水平进行产品生产与市场交易,如果经济个体自身实现效用最大化,那么整个社会就实现了社会福利最大化和社会资源的最优配置。在存在两个经济个体的合作与制度设计过程中,处于平等经济地位的双方拥有对等的资源禀赋,两者通过讨价还价、博弈等方面选择均衡策略,并实现最终的均衡制度安排。制度演化论也同样认为,制度安排是社会中每个经济个体实现效用最大化的结果,制度形成的目的在于约束所有经济个体的行为,均衡制度安排是中性和平等的,不存在偏袒与故意。 然而,现实经济社会的发展历程表明,由于经济个体间资源禀赋的差异,彼此在博弈过程中处于不对等的地位。资源优势者显然在均衡策略的形成和均衡制度安排中占有绝对的优势和控制权,并因此得到更多的利益分配。可见,均衡制度是一种非中性和不平等的设计,可以表现为:初始资源禀赋差异(t)→不对等控制权结构(t)→制度安排和制度均衡的非中性和不平等(t)→资源禀赋差距扩大(t+1)。例如,资本主义制度的建立就是以牺牲社会福利、最大限度地榨取工人劳动剩余价值为目的的一种非中性的、不对等的制度安排。再如目前国际经济贸易制度的设计,该制度的形成并不在于实现帕累托改进,最优化配置世界范围内的经济资源,而是具有优势资源的发达国家对资源劣势的发展中国家的资源榨取与利益剥夺,本质上是一种非中立的且明显偏袒发达国家的人为制度安排。一方面,资源劣势者如发展中国家面对利益的趋势和惩罚机制的威慑不得不跟从发达国家的策略选择;但另一方面,随着发展中国家经济发展水平的不断提高和国际地位的不断改善,其在与发达国家的博弈过程中也在积极为本国争取更多的利益分配和话语权。当今世界普遍存在的自由贸易摩擦和日益频繁的南北贸易摩擦正是制度的非中立性和不平等性的具体表现。 随着经济发展和技术进步以及信息获得能力的提高和交易成本的下降,资源禀赋结构的非对等性会在激烈的市场竞争中有所改变。当市场经济个体之间的资源禀赋差异逐渐缩小,个体间权力结构逐渐平衡时,均衡制度的中性和平等程度将越来越高。 3.由于资源禀赋的非对等性,最终均衡制度的形成受到资源优势者的控制或影响并非必然有利于实现社会利益最大化,即不一定存在效率。均衡制度是否有效率取决于资源优势者的利益与社会效益最大化的方向是否一致,如果方向一致,此种均衡制度安排就是有效率的。 一项新的制度设计是否有效率的最主要判定标准是其是否有利于社会权力分配的分散化和平等化。资源禀赋结构和权力决定论认为,均衡制度安排和制度结构的设计取决于在社会经济中拥有绝对控制权的经济个体的行为选择。一个在市场交易中拥有优势地位的经济个体,会在与其他经济个体的博弈过程中选择最有利于实现其利益最大化的行为策略,并因此形成有利于其自身利益的均衡制度,至于是否存在效率,则取决于具有优势地位的经济个体的利益与社会利益的方向是否一致。在现实世界中,经济个体往往不会选择具有明显优势的策略组合,尤其是不会选择能够提高所有参与者利益的策略组合,而是更多地选择次优的策略组合。阿西莫格鲁运用不可信承诺和不对称信息对此进行了解释。首先,博弈双方具有不可信承诺。一方面,资源优势者承诺对方选择最优选择行为。如果合作成功,资源优势者很有可能不兑现承诺。而资源劣势者完全可以预测到对方的此种机会主义行为。另一方面,如果资源劣势者承诺对方选择最优行为,而资源优势者完全可以预测到因对方资源价值增长对自身权力的影响,并且,随着资源劣势者获取权力的增加,其很有可能不再跟从资源优势者的策略选择而主动违背承诺,并最终损害资源优势者的利益。均衡制度的形成是对最初均衡组合策略的多次重复,只有博弈双方在长期博弈中始终采取相同的策略组合才有可能形成。因此,资源优势者不仅关注博弈对方当下的策略选择,同时也关注对方下次以及日后每次的策略选择行为。如果资源优势者预期到新的制度设计会提高对方或其他当事人的相对权力,他就会保护或维系原有经济制度安排,以保证自身对均衡策略组合的长期控制权。其次,博弈双方受信息不完全和信息不对称的约束。一方面,信息获取需要高昂的成本,经济个体往往得不偿失;[4]另一方面,信息不对称下的博弈结果具有更强的不确定性和不可观测性。同时,由于信息的严重不对称,具有有限理性的经济个体无法准确预测最优均衡策略组合。 制度安排和制度结构是否有效率不仅取决于资源优势者的利益倾向,同时还应关注以下几方面。 1.制度供求双方资源禀赋的产权界定程度 在社会经济中,经济个体之间能否进行合作的基础是双方的合作资源是否得到有效界定。科斯定理认为,如果资源产权得到清晰界定,将对经济效率产生影响,即产权是交易进行的前提基础。资源产权有效界定的基础条件应包括:(1)清晰的资源界定,明确的资源主体及性质;(2)资源产权边界的可测性;(3)信息获取成本小于因此获得的收益;(4)产权界定以可获取和可确定的信息为基础。 2.资源产权的有效保护程度 资源产权的有效性取决于三方面,分别是经济个体对这项权力的保护程度、其他个体为获取该项权力付出的努力程度以及第三方对该项权力有效性的保护程度。一项产权能否有效实施,一方面由制度内容的可确认程度决定,另一方面也决定于经济个体对制度内容的有效实施情况。也就是说,产权有效性不仅要求制度安排的内容是可确认的,同时还要求博弈当事人有实施制度包括奖惩机制的能力。 [1]阿兰·斯密德.制度与行为经济学[M].北京:中国人民大学出版社,2004:35. [2]钟昌标,李富强,王林辉.经济制度和我国经济增长效率的实证研究[J].数量经济技术经济研究,2006(11):14. [3]李富强,张屹山,董直庆.企业剩余分配:一种以经济权利为状态依存特征的动态均衡:兼论控制权控制和完善上市公司治理结构[J].数量经济技术经济研究,2005(12):23. [4]张屹山,董直庆,王林辉.股权价值决定:一种基于经济权利的证券资产定价模型[J].财贸经济,2007(9):30.三、对制度均衡和制度变迁的评析
四、优化制度安排和结构的措施