基于有限理性的西藏农牧民行为的演化分析

2014-07-20孙前路龚红梅彭岳林

黑龙江工业学院学报(综合版) 2014年8期

孙前路，龚红梅，彭岳林

(西藏大学农牧学院，西藏林芝 860000)

中共中央西藏第五次座谈会指出，西藏正在从加快发展转向跨越式发展，从相对封闭转向全面开放，从单一农牧业转向多元经济共同发展，从自然保护为主转向全面加强生态环境建设，从解决温饱转向全面建设小康社会。然而，由于地理、气候、政治、历史与文化等原因，使西藏在我国的发展中已经处于一个特定的、相对落后的经济区域。缩小区域间差异，促进区域经济协调发展，尤其是中西部经济协调发展问题，是我国现阶段经济工作的重要内容。

就协调区域差异而言，国内外学者从不同的角度进行了研究。Jian 等、Lee、［2］陆大道等、［3］陈良文等、［4］［5］饶勇等、［6］吕燕萍等、［7］万广华等研究分别从地理条件、［1］制度因素、外商投资、中央财政、中央财政援助、人力资源与风俗习惯等方面进行了考察与研究、这对我们的理解和分析区域经济协调发展提供了丰富的视角与方法。当然，上述研究涉及到的方面是协调区域经济差异的部分因素，但要使这些因素在协调区域经济中发挥作用，必须满足各自的条件，如中央财政援助是有限的，并且以中央财政拨付为前提的;风俗习惯的迁移也不是一朝一夕能做到的。鉴于此，本文以西藏农牧民为研究对象，以演化博弈分析的方法，从农牧民自身行为入手，为协调区域经济差异提供一个新的微观视角。

一模型1:农民、牧民行为的演化

对于博弈而言，有限理性意味着博弈方往往不会一开始就找到最优策略，博弈方会在博弈过程中学习博弈，必须通过试错寻找较好的策略。同时，有限理性也意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略，均衡是不断调整和改进的过程。［8］下面将以具体的演化博弈模型，分析农牧区农牧民行为，以及农牧民的行为是如何影响农牧区区域竞争能力的，进而阻碍区域协调发展的。

假设在西藏农牧区有农民、牧民两方，这两方分别代表着农牧区的所有农牧民，即两博弈方是不同农户、牧户组成的集合体。在此博弈中，农牧双方均具有有限信息并进行着不完全理性的思考。在耕地面积与草地资源可以转化的假设前提下，为了简单，我们假设农、牧民均有两种策略:一种是合作策略，即农、牧双方就土地资源在最有效利用上的一种合作;一种是侵占策略。即农、牧双方就土地资源进行竞争，以取得自身利益最大化。因此以上两个博弈主体的策略空间均为:{C，E}，其中C表示“合作”策略，E表示“侵占”策略。

双方收益如表1所示，其中a，a分别表示农民、牧民都采取策略E时各自的收益。当农民采取策略C、牧民采取策略E时，牧民抢占了一部分耕地，获得额外收益f1，相应地，农民失去一部分耕地，收益减少f1;①当农民采取策略E、牧民采取策略C时，农民抢占了一部分耕地，获得额外收益f1，相应地，牧民失去一部分耕地，收益减少f1;当农、牧民均采取策略C时，农、牧民的收益均增加f2，并且我们令f2＞f1。根据博弈得益情况，很容易得出两个纯策略纳什均衡:(C，C)和(E，E)，并且前者纳什均衡帕累托优于后者(如图1)。

图1 农、牧民完全理性博弈

然而，农牧民并不是完全理性的，甚至理性层次很低，并且由大群体成员组成的农牧民集合的行动带有很大的随机性。我们假定有占比例x的博弈方选择了策略C，则1－x的博弈方选择了策略E。则采用两种策略的博弈方的期望得益和群体平均期望得益分别为:

由上可知该博弈的复制动态方程为:

因此，该博弈最多有三个稳定状态，分别为x*=0、x*=1和x*=f2/(2f2=f1)。根据微分方程的“稳定性定理”，②dx/dt在稳定状态处的导数须小于0。因此x*=f2/(2f2－f1)不是进化稳定策略，x*=0、x*=1为该博弈的进化稳定策略(ESS)。即，当初始的x水平落在区间(0，f2/(2f2－f1))时，复制动态会趋向于x*=0，即所有博弈方都采取策略E。而当初始的x水平落在区间(f2/(2f2－f1)，1)时，复制动态会趋向于x*=1，即所有博弈方都采取策略C。由于 f2/(2f2－f1)0.5，③实现(E，E)均衡的概率较大(如图2)，这与我们的希望是相违背的。

图2 复制动态方程相位图

二模型2:牧民之间行为的演化

在完全理性的假设下，牧民将选择自己的饲养羊的数量，以求得利益最大化，公共地的悲剧现象也就在所难免。［9］而事实上，牧民不是完全理性的，他们会根据上一年其他人饲养羊的数量来决定今年自己饲养羊的数量，并且在做决策时会有失误。

为方便讨论，我们假定在一定区域内，根据家庭劳动力数量和草地可承受羊的总体数目，每户都有饲养羊的最优数量，用gi表示，则Σgi表示该草地可承受羊的总体数目。现在对于牧民来说就是选择自己饲养羊的数量问题。根据牧户实际，他不可能事先知道自己饲养羊的最优数量gi，也不可能知道其他人的饲养决策，因而他的饲养决策会出现两种情况:④大于gi，或小于gi，这样就有了如下博弈矩阵(图3)。我们用牧民的性格划分各自的策略:冒险A谨慎C。

我们直接分析该非对称博弈的两个博弈位置博弈群体各自的复制动态和进化稳定策略。首先，我们假设在牧民1的博弈群体中，有占x的采用A策略，则采用C策略的比例为1－x;同样，我们假设在牧民2的博弈群体中，有占y的采用A策略，则采用C策略的比例为1－y。令牧民1采用A策略与C策略的期望得益分别为u1A、u1C，该群体平均得益为u1，则其值分别为:

因而，dx/dt=x(u1A－)=xt(1－x)(0.5－y)

同理，dy/dt=yt(1－y)(0.5－x)。

图3 牧民之间非对称博弈

首先我们对牧民1群体的复制动态方程进行分析。很明显，当y=0.5时，dx/dt=0，即所有的x处于稳定状态;当y0.5时，x*=0、x*=1为x的两个稳定状态，并且x*=1是进化稳定策略;当y 0.5时，x*=0是进化稳定策略。同样的方法我们可以分析牧民2群体的复制动态方程。不难看出，在此博弈中x*=0、y*=1和x*=1、y*=0是该博弈的进化稳定策略(如图4)，显然，在有限理性的演化博弈中，没有出现公共地的悲剧，但仍不能达到我们希望的帕累托最优的结果。

图4 博弈群体的复制动态与稳定性

三模型3:单一农户种植行为的演化

由于农民生产行为的模仿性、脆弱性、盲目性，以及信息不全造成的对市场反应的滞后性，导致农民的种植行为在不断地选择，不断地对比种植效果，所以他们的种植活动具有种植—对比—种植的反复过程。因而，在这一难以抉择的过程中，他们面临两种策略:同质性生产策略H(如同时种植青稞)和差异性生产策略V(如农民1种植青稞，农民2种植油菜)。在双方采取策略时，双方的得益如图5所示。

图5 农民的种植策略选择

现在我们来分析博弈群体各自的复制动态和进化稳定策略。首先，我们假设在农民1的博弈群体中，有占x的采用H策略，则采用V策略的比例为1－x;同样，我们假设在农民2的博弈群体中，有占y的采用H策略，则采用V策略的比例为1－y。令农民1采用H策略与V策略的期望得益分别为u1H、u1V，该群体平均得益为珔u1，则其值分别为:

对于农民群体1，很明显，当 y=0.5时，dx/dt=0，即所有的x处于稳定状态;当时y0.5时，x*=0、x*=1为x的两个稳定状态，并且x*=1是进化稳定策略;当y 0.5时，x*=0，x*=1为x的两个稳定状态，但x*=0是进化稳定策略。同样的方法我们可以分析农民2群体的复制动态方程。不难看出，在此博弈中x*=0、y*=1和x*=1、y*=0是该博弈的进化稳定策略(如图4)。因而，在微观视角下，农民内部的“学习—种植—学习—种植”模式在有限理性下是可以达到帕累托最优的。但宏观来讲，由于不同地域信息的不完全性以及不同地域的农民之间学习的频率较少，仍需要政府的宏观调控。

四结论与建议

内因是事物变化的根据，外因是变化的条件。缩小区域间差异，促进区域经济协调发展，从根本上说还必须从地区内部入手。结合前文分析，得出结论如下。

1.农牧民对土地利用效果不高。

在没有政府介入的前提下，农民与牧民之间就土地使用上难以达到帕累托最优。就西藏而言，一方面牧民放牧的草地资源不足，牲畜对草地植被的破坏严重，这样带来严重的资源植被破坏、环境恶化等问题;另一方面，农民人均拥有的土地较多，相对土地而言，由于其管理能力(如每亩施肥量、每亩工作小时数、灌溉等)不足，因而广大农民采取“广种薄收”的经营模式，而这种现象很难通过农牧民之间的协调改善。因而要求政府在土地分配中不但要强调公平，还要考虑包含帕累托效率和总体效用(利益)最大化的效率要求。

2.牧民之间竞争激烈。

由于牧民生产方式的特殊性，政府对牧民的放牧行为与饲养牲畜的数量管制较少，牧民在有限理性条件下，依靠观察其他牧民上一年的饲养牲畜的数量和对整个牧业产品的预期决定自身饲养牲畜的数量。由于其他牧民下一年饲养行为的未知性及牧民对市场的反应具有时滞性，牧民的饲养行为经常会引导牧民进入“蛛网模型”之中，从而造成牧民收入的不稳定和牧业产品市场的波动加大。因而政府要加大对牧民的放牧行为与饲养牲畜的数量的管理与指导，引导牧民有计划、合理地进行放牧。

3.农民自身种植理念不合理。

在自家劳动力一定的情况下，面对超出自家耕作能力的土地，农民选择了“广种薄收”而不是“精耕细作”，重视了种植面积，忽略了亩单产量。因而农民陷入了“广种—薄收”的困惑之中。再加上农民生产行为的脆弱性、盲目性以及信息不全造成的对市场反应的滞后性，“薄收”现象变得更加严重。在农民与农民之间的博弈中，有限理性的农民过多注重其他农民的种植行为，以决定自身的种植决策，从而希望取得自身利益的最大化。在追求差异化的过程中，忽视了作物本身价值的不同，“薄收”出现的概率也较大。因而，政府首先应核定每位农民在现有的耕作技术条件下可以管理的土地数目，引导农民将多余的、不肥沃的土地种草，以供牧民使用，从中获取利益。其次，对农民微观的种植行为应尽少地使用行政指令，而应从宏观的角度诱使农民行为向健康、稳定方向发展。

注释

①一般认为，在土地肥力相等的前提下，每亩土地对农民、牧民经济效益的影响是不同的，为研究简单，本文假设其影响程度相同。

②在数学上，要求当干扰使x出现低于x*时，dx/dt=F(x)必须大于0，当干扰使x出现高于x*时，dx/dt=F(x)必须小于0。参见谢识予:《经济博弈论》，上海.复旦大学出版社，2008年版。

③f2/(2f2－f1)0.5可以简化为0.5+f2/2(2f2－f1)，由于 f2f1，故 f2/(2f2－f1)0.5。

④由于牧民的有限理性以及牧民对饲养羊的数量的连续性，可以认为，牧民在博弈开始时选择正好是最优数量为小概率事件。

［1］Jan TL，Sach s J D，WamerAM.Trends in regional inequality in China［J］.China Economy Review，1996，7(1):1－21.

［2］Lee J C.Regional income inequality variations in China［J］.Joumal of Economic Development，1995，20(2):99 －118.

［3］陆大道，薛凤旋.中国区域发展报告(1997)［M］.北京:商务印书馆，1997.

［4］陈良文，杨开忠.集聚经济的六种类型:一个研究综述［J］.经济科学，2006(6):107－117.

［5］陈良文，杨开忠.我国区域经济差异变动的原因:一个要素流动和集聚经济的视角［J］.经济科学，2007(5):35－42.

［6］饶勇，黄福才，魏敏.演化博弈论视角下的区域经济协调发展研究［J］.贵州社会科学，2008(5).

［7］吕燕萍，王丽华.浙江区域经济差异成因及对策研究［J］.特区经济，2007(9):48－49.