非合作博弈与社会经济网络的形成

2010-01-07李峰沈惠璋李莉

现代管理科学 2009年11期

李峰沈惠璋李莉

摘要:作为着力于研究“理性人的互动行为”的一门学科,博弈论几乎可以被运用于经济学和其它社会科学的各个领域。近些年来随着复杂网络和计算机科学的发展,更是能够将博弈论工具应用到复杂的多博弈主体系统中。鉴于国内对该领域的研究成果尚未形成系统的梳理,文章先是按照竞争博弈和协调博弈的脉络来对非合作博弈与复杂网络的形成领域内的研究成果进行了论述,之后对近些年涌现的外部性和不完全信息的问题进行了探讨,文章的最后部分给予了研究的展望。

关键词:复杂网络;竞争博弈;协调博弈;不完全信息

一、背景

作为着力于研究“理性人的互动行为”(Aumann,1985,p35)的一门学科,博弈论几乎可以被运用于经济学和其它社会科学的各个领域。近些年来随着复杂网络和计算机科学的发展,更是能够将博弈论工具应用到复杂的多博弈个体系统中。在经济学和其它社会科学中,不同主体(Agents)间的交互对于产出是十分重要的。在网络结构中,主体用顶点(Node)表示,主体之间的特定关系用边(Edge)来表示。边的连接对个体和整体都有影响。用复杂网络来研究经济学或社会学关系时,一个比较公认的逻辑是:网络由N个顶点组成,每两个顶点之间可以有边连接,考虑有向图时,一共有N×(N-1)条边,可能形成的网络有2N(N-1)种,考虑无向图,就有N(N-1)/2条边,可能形成的网络有2N(N-1)/2种不同结构。对于每一条边,相当于两个社会经济主体之间的一种合作或交互作用,不但会影响两个主体的收益,而且还会通过间接连接扩散到其他的主体。所以理性的主体会根据收益的动力学特征(收益函数、最优反应原则)决定应该与哪一个主体建立连接,建立什么样的连接(策略)。

按照现有文献,网络形成采用的博弈主要分为合作博弈和非合作博弈两大类。非合作博弈用于复杂网络研究有两种模式,一是在给定网络结构的条件下,参与人对每一连接均按照最优反应原则进行策略选择,讨论的问题是经过多次重复的博弈,这些策略能否演化到均衡状态,如Stanley et al.(1994)、Smucker et al.(1994)、Ashlock et al. (1996)、Tesfatsion(1997a)、Tesfatsion(1998)等人的研究成果都是基于上述的研究模式。另一种模式是网络结构通过博弈产生,如在Bala & Goyal(2000)、Harrison & Mu?觡oz(2004)等人的研究中,先由静态博弈生成的纳什均衡构成的网络有完全图、空图和部分连接网络等,然后主体再选择连接策略。在非合作博弈中,常用的方法主要有二人重复囚徒困境、二人协调博弈等,其中有些思想如稳定性、学习等概念是与演化博弈有关的。在非合作博弈中,Tesfatsion与Goyal是两位有代表性的研究者。其中Iowa州立大学经济和数学教授Tesfatsion对经济网络的演化和内生网络的形成研究颇多,还提出了基于主体计算的经济学(ACE),她在网络形成的研究中主要采用基于主体的计算机仿真方法研究重复的二人囚徒困境博弈。英国Essex大学的经济学教授Goyal对协调问题研究较多,近年来主要研究网络经济中的一些问题,其对社会经济网络的研究主要是二人协调博弈,以数理分析为主要手段。

本文对非合作博弈的讨论首先将参照Goyal(2003)分为竞争博弈和协调博弈来进行,之后再对近些年兴起的外部性问题和不完全信息问题进行阐述。

二、竞争博弈

Stanley et al.(1994)首先对二人囚徒困境重复博弈进行了研究(IPD),Smucker et al.(1994)、Ashlock et al. (1996)、Hauk(1996)将二人囚徒困境的重复博弈行为用到了社会经济网络中,Tesfatsion(1997a)则在Stanley et al.(1994)的基础上用演化的重复二人囚徒困境博弈研究了选择与拒绝策略,经过上述一系列研究发现加入是否连接的选择后,相互合作的涌现比标准的重复博弈快了许多。但下层参与者之间的交互变得更为复杂和高度的路径依赖,即使表现出了很大比例的合作行为,也很难从参数配置概括出演化产出的特征。Hauk(1996)对这类研究进行了综述,其它的博弈研究也允许参与者通过自己的行为来改变与其它主体连接的概率。Tesfatsion(1997a)对TNG(Ttr-ade Network Game)提出研究交易网络市场结构形成和演化的模型,并于1998研究了在Gale & Shapley(1962)提出的匹配机制下贸交易网络的性能问题。Tesfatsion在对TNG问题的研究中考虑了三种市场结构:仅包括单纯买方和卖方的双边市场、由单纯买卖双方和买卖双重角色参与的部分流动性市场,以及由完全买卖参与者构成的内生市场。每一种市场下,参与者在竞争环境下进行重复的二人囚徒困境博弈,利用Gale-Shapley匹配选择和拒绝同伴,使用McFadzean & Tesfatsion(1997)开发的TNG程序库进行仿真。谈论的主要问题包括:外生结构特征与交易网络的形成和演化,交易网络的形成与交易行为,及其在网络中的社会福利产出之间的关系。

Goyal(1993)提出了单边连接形成的非合作博弈静态模型,得到一些基础结论。Bala & Goyal(2000)讨论了非竞争情况(如消费者的信息共享、贸易网络中产生的机会、社会救助带来的巨大好处等)。他们通过研究发现纳什网络通常是完全连接的或空的,并提出强均衡的概念——多个均衡引发了强均衡的概念。如果一个主体在均衡时有多个最优策略,当主体改变到等价策略时,网络将变得不稳定,这要求研究强的纳什均衡。在单向网络中,只有轮和空图是强均衡的;在双向网络中,只有星型结构和空图是强均衡的。

另一个例子是Goyal(2003)关于利己主义和利他主义的竞争博弈,该博弈中参与人在两个策略A(利他主义)和E(利已主义)中进行选择。Wynne-Edwards(1986)、 Eshel & Cavalli-Sforza(1982)指出在演化生物学中不同物种涌现和坚持利他主义特征的,利他主义有利于更多的复制,这种好处使得利他主义被坚持和溢出到邻近区域,这反过来进一步导致了这种特征的增加。Nowak & May(1992)也做出了基于仿真的类似研究,认为如果没有改变,利他主义就会在大量的交互场合存在。Goyal(2003)根据Eshel, Samuelson and Shaked(1998)等人的研究得到定理1和2:

定理1 吸收集合有两种类型:一是所有参与者都选择A或E;二是如果由平均不超过2个连续选E的参与者隔开的长度为三以上的选择A的链,则保持原有状态,此时平均至少60%的参与者选择A。

定理2 如果参与者的初始策略选择是独立同分布有变量决定的,且概率都为正时,当参与者人数增大时,收敛到的吸收集有选A超过60%的概率就趋进于1。

而在Goyal & Vega-Redondo(2003)研究中,假设连接和选择是同时发生的,由于采用了单边连接,得到了与Jackson & Wolinsky(1996)不同的结果,在整个参数范围内都能生成星型结构。他们与Feri(2004)、Hojman & Szeidl (2004)的研究不同之处在于商品之间存在竞争,且收益在初始化时就形成,在均衡时可以涌现出大量星型结构。Galeotti & Melendez(2004)让主体重复无穷多次囚徒困境博弈以决定连接的成本分摊,也得到了一个星型的均衡结果。

同时,Goyal & Vega-Redondo(2004)通过直接连接和间接连接以获得收益和中介租的网络研究发现:纳什均衡是空的和全连接的网络。如果网络要求最少连接且没有圈,长的路径是不稳定的:对于轮状的网络,有顶点会离开轮而形成线,从而形成星型的网络。Davis & Maschler(1965)指出,任意两个顶点的任意两条边按照Bertrand思想完来全竞争所有的剩余的这种分配是相应合作博弈的唯一的核。

Goyal(2000b)研究了交流是有成本的和不完全可靠的信息网络,讨论了纳什网络与有效网络之间的关系,发现结果与完全可靠时是不一样的。Haller & Sarangi(2005)在Goyal(2000b)的基础上对异质顶点(不同顶点连接的可靠性不同)网络中的均衡与有效性进行了讨论,发现结果包括了完全可靠与同质不完全可靠的情况。

Navarro & Perea(2005)研究了非合作博弈在生成森林上形成的子博弈精炼纳什均衡与合作博弈均衡的关系,在一定条件下,顶点通过这一唯一均衡获得的收益与合作博弈下的收益是一致的(Myerson值)。

Baron et al.(2006)建立了一个允许不可靠连接和组织成本的网络形成的策略模型。该模型中连接的建立是有成本的,并证明了纳什均衡的存在性与找到它是两大难题(实际上是NP-问题)。该文提出的一个随机演化模型,通过解决全局优化问题,选出具有随机稳定性的纳什网络的子集。

三、协调博弈

在多个纳什均衡中进行选择称为协调博弈。Cooper(2001)和Yang(2004)对协调博弈(Coordination Games)进行了详细的讨论,这种协调往往是在风险占优和Pareto有效的均衡中进行协调,理想状态是协调到Pareto优的均衡而非风险占优的均衡。但Cooper et al.(1992)的实验表明,协调的结果是风险占优的,这与参与人对另一方选择有效策略的可能性的估计有关。

Hojman & Szeidl(2002)扩展了Bala & Goyal(2000a)的结果,使用的协调博弈讨论了主体在选择行为的同时也选择同伴,发现纳什均衡是最少连接的,并呈现轮状结构,均衡行为接近于下层博弈的对称均衡。

Jackson & Watts(2002a)利用协调博弈研究主体根据过去的结果来选择策略的网络稳定结构的内生形成过程,发现随机稳定均衡是多重的,有时均衡会出现在协调博弈的既不有效又不风险占优的均衡上。

Goyal(2003)在定理4中表明:固定一些交互网络,从任意的初始策略配置开始,动态过程在有限时间内以概率1收敛于一个吸收的策略集合。吸收策略集合与静态社会博弈的纳什均衡集合是等价的。而Mailath, Samuelson & Shaked(1997)证明了2×2静态社会博弈的纳什均衡集合与该博弈的相关均衡集合是等价的。Ianni(2001)研究了在短期最优反应动力下收敛到相关均衡集合。Anderlini & Ianni(1996)研究了关于噪声情况下动态收敛到纳什均衡正规网络(每个参与者只与同样多的邻居连接),这一结论与Goyal(2003)不同,后者是依赖于惯性和博弈的协调特征,对所有网络都成立。Goyal(2003)在定理4.3中提出,在任意连接的网络中,假定在每个周期一个主体被选中采用对数线性反应规则来修改选择,那么随机稳定性产出就是每个参与者都选择风险占优行动。

Goyal & Vega-Redondo(2003,2005)用协作博弈方式进行伙伴选择,每个顶点在选择连接对象时采取单方面连接,并考虑连接成本。个体在成本与收益之间进行权衡就会形成唯一的均衡交互结构。网络形成的动力学对个体的行为有很大的影响,如果形成边的成本低于一定的阈值,参与者会协调于风险占优行为,如果高于一定的阈值,就会协调于有效的行为。这个结论对于修改边的形成过程、不同的形成成本定义、模型的变化以及在间接联接者之间不同的连接概率都是鲁棒的。

Kandori et al.(1993)和Young(1993)发现在微小的干扰下群体的选择长期会协调于Harsanyi & Selten(1988)提出的风险占优策略。按照Foster & Young(1990)的定义,风险占优的策略是随机稳定的惯例。而Ellison(1993)、Young (1998)对个体与固定数目的邻居交互时也得到了这样的结论。Jackson & Watts(2002a)假定参与人有辨别是否与其他人建立和去除连接的能力,通过社会协调博弈动态地形成网络,在这样一种内生的形成过程中,参与人成对进行的协调博弈,发现了随机演化稳定结构的出现,有些结构既不是风险占优的,也不具有效性。

四、不完全信息

在2004年以后的文献中,开始出现明确提及不完全信息条件下网络的形成问题。标准的博弈理论和纳什均衡是建立在完全理性人和完全信息基础上的,有限理性理论认为由于时间和空间有限,不可能完全达到目标,在信息不完全和不对称的情况下,是否还会形成均衡的结构,网络的整体收益特征会受什么样的影响等问题近年来受到了研究者们的关注。Kandori et al.(1993)和Young(1993)曾经考虑到参与人的选择受到轻微扰动后的均衡情况(见3.3),Haller & Sarangi(1990)、Bala & Goyal(2000b网络可靠性)研究了不具有完美可靠性的纳什网络及其结构,但并没有从不完全信息的角度更多地加以讨论。

Galeotti & Vega-Redondo(2005)讨论了有正外部效应的局部交互情况下异质顶点组成的复杂随机网络,对总体度分布为Poisson、指数和无标度(幂律)时的均衡特征,并对网络结构与收益情况进行了分析。在这一模型中,参与者对自己属于哪种分布的信息是不完全的。Galeotti et al.(2006)则研究了了解固定网络的位置后整个网络的变化对个体行为和社会产出的影响。研究中采用一类普遍的收益函数并允许网络结构的不完全信息。在网络博弈中,由于对自己行为边际收益的影响,个体激励依赖于邻居的行为。邻居的影响有两个方面:一方面是策略是互补还是替代的,这将决定邻居行为对自己行为的激励的影响。另一方面是与邻居行动大小相关的期望。实际上,邻居的行为又依赖于邻居的邻居。因而网络的信息结构在形成个人最优策略时扮演了重要的角色。网络是复杂的对象,只能提供给个体有关结构细节的不完美的知识。这一发现引发了对网络博弈中不完全信息的作用。支持这一说法的经验文献有Kumbasar, Romney & Batchelder(1994),Bondonio (1998)以及Casciaro(1998)。

五、评述与展望

经济学家一般假定组织结构是规范的,参与的主体是完全理性的。在经济学中研究网络有两个极端的方法,一种是个体之间相互独立的标准模型,他们独立行动,其行为由市场信号协调;另一种是完全的博弈方法,主体之间是完全依赖的,被赋予巨大的推理能力。Sanjeev & Goyal(2003)定义了非策略交互和策略交互指出:非策略交互是指行为获得的收益不受其他人行为的影响,而策略交互是指不同行为获得的收益受到其他人行为的影响,目前用博弈论来研究的比较多。对于社会经济系统,往往由于外部效应的存在,主体之间的行为会影响到其他直接相关和间接相关的主体,因而采用博弈论工具研究主体之间策略交互对网络结构与整个网络产出结果的影响是十分重要的。

目前在经济网络中应用非合作博弈研究主要采取的是二人博弈的方法,一条边两端顶点是否连接,选择何种策略连接一般是用最优反应原则加以确定,一定的收益函数与选择机制可以导致不同的网络结构与收益状态。但社会经济网络中顶点之间的相互作用远比二人博弈更为复杂,可视为多人博弈甚至更为复杂的緾绕关系,如赋予边一定的权数和性质,顶点不仅定量地选择权数,还将定性地选择性质,而且异质性不再只是处于不同的主体和拥有不同的概率这么简单,将人工智能或人工生命的方式引入网络博弈作定量或定性的研究,可以研究更为复杂的问题,也是基于主体计算的经济学正在努力的方向。

博弈论的不少研究和结论都是基于实验的基础之上的,如囚徒困境、协调博弈等。正是这些实验推动理论的进展,目前关于社会经济网的研究中,大多数是实证研究、计算机仿真和理论推导。随着实验经济学的逐步推广和深入,用实验的方法对网络进行研究也应能发现一定的新结论,从而为博弈论在网络形成及其特征方面的研究展开新的一页。

参考文献:

1. Bala, V. and S. Goyal, A Non-Cooperative Model of Network Formation, Econometrica,2000,68(5):1181-1231.

2. Bala, V. and S. Goyal, A Non-Cooperative Model of Network Formation, Econometrica,1999,(68):1181-1230.

3. Bondonio, D, Predictors of accuracy in perceiving informal socal networks, Social Networks,1998,(20):301-330.

4. Davis, M. and M. Maschler, The Kernel of a cooperative game, Naval Research Logistics Quarterly,1965,(12):223-259.

5. Ellison, G., Learning, Local Interaction, and Coordination. Econometrica,1993,(61):1047- 1071.

6. Feri, F., Stochastic stability in networks with decay, mimeo, University of Venice,2004.

基金项目:国家自然科学基金项目(70671066);博士点基金项目(20070248054)。

作者简介:沈惠璋,上海交通大学安泰经济与管理学院教授、博士生导师;李峰,上海交通大学安泰经济与管理学院博士生;李莉,上海交通大学安泰经济与管理学院博士生。

收稿日期:2009-09-04。

猜你喜欢

复杂网络

基于复杂网络节点重要性的链路预测算法

基于复杂网络视角的海关物流监控网络风险管理探索

对实验室搭建复杂网络环境下的DHCP 服务及安全防护的思考

基于蚁群优化的多目标社区检测算法

基于复杂网络构建面向主题的在线评论挖掘模型

现代管理科学

2009年11期

非合作博弈与社会经济网络的形成

猜你喜欢

杂志排行

现代管理科学的其它文章