供应链联盟企业间信任行为博弈分析

2014-11-16朱文娟福州海峡职业技术学院福建福州350014

物流科技 2014年8期

朱文娟（福州海峡职业技术学院，福建福州 350014）

0 引言

市场环境的多变化、复杂化使得企业想获取市场份额、占领市场，就必须转变观念——企业间的竞争转变为供应链之间的竞争。供应链管理强调供应链上所有节点企业间的相互合作与共赢，但由于供应链节点企业为追求自身利益最大化，以及供应链企业交叉性特征易导致信息泄密，使供应链中企业在面向未来的不确定性时易发生不信任的行为策略，因此研究供应链联盟企业间的信任尤为重要。

目前，不少国内外学者对供应链企业信任行为关系进行研究。国外学者对供应链节点企业间信任行为的影响因素及其与供应链信任行为度量指标之间的关系研究的比较透彻[1－2]。国内学者主要从信息共享、信任产生机理与治理机制、信任关系、信任评估模型、声誉效应和信任行为博弈等方面进行研究[3－7]。在上述学者研究的基础上，提出了完全信息情况下基于奖惩策略的无限次重复博弈，并对得出的均衡结果的影响因素进行分析，但现实中市场环境的多变、信息的非完全性以及决策问题本身的复杂性，使得供应链企业在博弈过程中很难做到完全理性，因此在无限重复博弈的基础上，构建一个动态进化博弈模型，对信任产生的条件、影响因素及动态特征进行探讨。

1 基于奖惩策略的无限次重复博弈分析

在无限次重复博弈中，企业考虑的更多是合作的长期利益，而非短期投机的一次性收益，企业之间更加信任，“囚徒”才能走出“困境”。为方便分析，假定供应商和制造商博弈双方的实力相等，相互信任下均获取利益A，相互不信任下均获取利益D（A＞D），一方信任一方不信任下，信任方获取利益B，不信任方获取利益C（C＞B）。为使供应链上参与的所有节点企业都相互信息共享、相互合作，提出了相应的奖惩措施，对采取信任行为的企业给予Y的奖励，对采取不信任行为的企业给予W的惩罚。他们之间博弈收益情况如表1所示，其中C＞A＞D＞B。

在重复博弈中，供应商和制造商每期都得到一定的收益，为了比较不同的策略的收益大小，必须把各期的收益加总起来。考虑到货币的时间价值，设r为贴现因子即资产在时间上的贴现，且0＜r＜1，则从现在开始，这两个企业如果一直选择信任，那么每个企业获得的总收益为：

表1 供应商与制造商信任博弈的收益矩阵

如果两个企业从现在起再也不信任，则每个企业得到的总收益为：

比较公式（1）和（2），发现：

在无限次重复博弈过程中，只要对方欺骗一次，在以后的合作过程中，本企业再也不相信对方，选择不信任的企业最多只占一次便宜，即得到C－W，这是短期收益。但这一次的不信任行为却带来长期的损失，不信任方再也得不到收益A+Y，而只能获取D－W。用E0表示供应商首先采取不信任行为获取的总收益，用E1表示供应商永远采取信任行为获取的总收益，则：

只要 E1＞E0，即：

下面进一步分析均衡结果的影响因素（由于C和D难以控制，这里不再分析）。

（1）信任合作收益A，A越大，公式（6）中的右边计算结果就越小，对r的要求就越低，博弈双方选择信任策略就越容易实现。因此，提高供应链联盟企业间的合作收益可降低机会主义的发生，更有效率地促成均衡结果。

（2）惩罚成本W和奖励Y，在不等式（6）中右边的分子中包含W和Y，因此惩罚W和奖励Y的数值越大，对r的要求就越低，均衡越容易实现。在现实中，可由供应链中的核心企业带头建立一个奖惩基金，这个基金收益来源可有供应链企业共同商讨。对供应链联盟企业合作过程中，某些企业采取不信任、欺骗行为的话，那么核心企业就对该欺诈企业给予惩罚，惩罚所得的收益放入奖惩基金里，而对采取信任合作的企业就给予一定的奖励。这可大大降低某些企业的机会主义，提高整个供应链的竞争力。

（3）贴现因子r，r不仅表现了供应链中企业收益的时间价值，而且还包含了供应链成员企业对未来发展合作的信心。r越大，均衡就越容易实现。r越高，说明企业对当前收益的偏好越低，越容易激发企业采取信任的行为策略；相反，r越小，说明企业越容易受到短期利益的诱惑，做出欺诈不信任的行为。

2 基于进化博弈的奖惩策略信任行为分析

市场环境的多变、信息的非完全性以及决策问题本身的复杂性，使得供应链联盟企业在博弈过程中很难做到完全理性，因此在上文博弈的基础上，引入了进化博弈论观点，目的在于对博弈方的企业在长期反复的博弈过程中所采用的策略的发展趋势与稳定性进行研究。供应商和制造商的博弈收益矩阵如表1所示，供应商选择信任行为的概率为p，选择不信任行为的概率则为1－p；制造商选择信任行为的概率为q，制造商选择不信任行为的概率为1－q。其中概率p、q也可以理解为群体博弈中选择信任行为的企业的比例或者企业群体决策中支持信任行为群体的比例（0≤p、q≤1）。

供应商选择“信任”、“不信任”行为的期望收益uT、uN和平均收益分别为：

假设采用“信任”行为类型博弈方比例的动态变化速度为：

求得：

制造商选择“信任”、“不信任”行为的期望收益vT、vN和平均收益分别为：

采用“信任”行为类型博弈方比例的动态变化速度为：

求得：

对供应商信任类型比例的动态变化速度进行分析，当q=q*时始终等于0，即所有的p都是稳定状态；当q＞q*时，p*=0和p*=1是p两个稳定状态，其中p*=1是进化稳定策略；当q＜q*时，p*=0和p*=1仍是p两个稳定状态，其中p*=0是进化稳定策略。

对制造商信任类型比例的动态变化速度进行分析，当p=p*时始终等于0，即所有的q都是稳定状态；当p＞p*时，q*=0和q*=1是q两个稳定状态，其中q*=1是进化稳定策略；当p＜p*时，q*=0和q*=1仍是q两个稳定状态，其中q*=0是进化稳定策略。

对供应商和制造商信任类型比例的动态变化进行综合对比分析，发现在这个博弈中，p=0、q=0和p=1、q=1是这个博弈的进化稳定策略，即供应商和制造商的行为策略分别是｛不信任、不信任｝和｛信任、信任｝。为使供应商和制造商群体的进化稳定策略为｛信任、信任｝可能性增大，就尽量使p*和q*处取一个比较小的值，才可以使两博弈方群体的最终策略选择为｛信任、信任｝。根据公式（7）和（8），则需要（D－B）取值较小，（A－C）取值较大，（Y+W）取值较大，A、B尽可能大，C、D尽可能小。

3 结论

根据奖惩策略的无限次重复博弈及动态进化博弈分析结果，得出提高博弈双方的合作收益，能增加双方的合作信心。同时为防止某些企业为了短期利益而采取不信任行为，给予相应的惩罚，并对采取信任行为的企业给予一定的奖励。对采取过欺诈行为的企业，降低其声誉，并把其欺诈行为在供应链条内和行业之间进行传播，考虑到其低声誉带来的一系列不好的影响，企业在合作过程中都会慎重选择。根据公式（6），只要贴现因子就可以使博弈双方都采取信任行为策略。同时由公式（7）和（8）可得，尽量使数值比较少，也可以使两博弈方群体的最终策略选择为｛信任、信任｝。虽然本文的计算结果是提高奖励和惩罚，但如何设计奖励和惩罚才是合理的，以及如何把声誉定量化加入博弈模型中，这些都是下一步需要研究的。

[1] Hand fielda R B,Bechtelb C.The role of trust and relationship structure in improving supply chain responsiveness[J].Industrial Marketing Management,2002(31):367-382.

[2] Johnston D A,M Cutcheon D M,Stuard F I.Effects of supplier trust on performance of cooperative supplier relationships[J].Journal of Operations Management,2004,22(1):23-38.

[3] 肖爽，李北平.基于信息共享的供应链节点企业信任关系的研究[J].湖北经济学院学报，2007(9):62-63.

[4] 王玲.基于博弈论的供应链信任产生机理与治理机制[J].管理科学，2010(2):56-59.

[5] 李晓明，包清华，杨贵峰.供应链联盟企业间信任关系的博弈分析[J].长春理工大学学报，2009(12):699-700.

[6] 卓翔芝，王旭，代应.供应链联盟伙伴企业间的信任评估模型[J].计算机集成制造系统，2009(10):1947-1948.

[7] 李状阔.供应链节点企业间信任行为的进化博弈[J].工业工程，2008(3):38-39.