市场竞争与企业竞合关系

2020-03-11

福建质量管理 2020年5期

(海南大学管理学院海南海口 570228)

一、综述

市场竞争下，企业通过竞争可以实现企业的优胜劣汰，进而优化生产要素配置[1]。然而，随着市场不确定性的增强和风险的提高，为了规避风险，实现长期稳定发展的目标，企业之间相互合作以形成资源互补和互利共赢，便成为一种必然的选择。

竞争合作作为一种不以击败对方为目的的博弈，其最终目的在于使博弈双方实现双赢[2]。企业竞争合作博弈可以由囚徒困境博弈来描述。在囚徒困境博弈中，两个博弈者均有合作(C)、不合作(D)两个策略。当博弈者都选择合作时，双方收益均为R；当博弈者都选择不合作时，双方收益均为P；当双方策略不同，即出现(C,D)或(D,C)策略组合时，选择合作的一方收益为S，不合作的一方收益为T。收益参数设定满足T>R>P>S，2R>T+S。因此，理性的博弈者总是会选择不合作策略作为自己的最佳策略，但只有双方都选择合作策略才能使双方收益达到最大。从而模型中出现了个体理性与集体理性的对抗。同时，企业竞合是一个长期的、不断重复的过程，为了更好地模拟这一博弈过程，本文基于重复囚徒困境博弈模型进行研究[3]。此外，为了关注博弈个体行为的自主性对合作演化的影响，模型中引入了多agent系统。通过观察行业内微观企业个体交互作用所涌现出的宏观全局，可以模拟现实中企业竞合行为的演化过程[4]。

本文将以现有理论为基础，通过多agents演化IPD博弈模型进行实验模拟，分析基于收益、基于收益增长率两种不同机制下，博弈者追求长期稳定发展的目标对博弈群体的合作演化的影响，从而探究不同的竞争机制对企业竞合行为的影响。其中，企业追求长期稳定发展目标通过博弈者的风险规避来体现。

二、模型描述

本文的演化博弈模型主要分为三个部分：基于收益或收益增长率变化的博弈者的风险态度调整，用于描述企业的收益或收益增长率的变化引起的企业对长期稳定发展目标的重视程度的变化；社会学习方式下基于效用的博弈策略调整，用于描述企业学习行业内的优秀企业以调整自身发展策略的过程；以及基于收益或收益增长率的博弈个体的淘汰及更新过程，用于描述不同行业导向下，行业内企业优胜劣汰的过程。

实验中，博弈者面临来自于博弈收益不确定性的风险，以及来自于竞争机制的淘汰压力。由于个体的风险偏好对于个体决策有重要影响，因此本文将IPD博弈中的风险定义为博弈者在所有阶段PD博弈中收益的标准差；通过风险的引入，将个体对长期稳定发展目标的考虑结合到对其竞合行为的研究中。特别地，本文中的演化模型引入了基于收益、基于收益增长率这两种不同的竞争机制。因此，设计了实验E1和E2，分别对应agents以收益和收益增长率作为博弈目标收益的情况。下述主要以E1实验为例，描述演化博弈过程。E2实验过程类似，区别主要在于博弈者基于历史收益增长率调整其风险态度，群体基于历史收益增长率进行博弈个体淘汰更新。

(一)博弈过程与风险态度调整

在实验E1中，设定博弈群体规模为N=200，每个agent标记为agenti(i=1,2,…,N)。首先，在演化的初始阶段，每个agent将给定一个初始风险态度和一个初始策略。风险态度值为[0,1]中的某一个具体数值，数值越大则博弈者越风险规避，即博弈者对长期稳定发展的目标越重视，将越倾向于与其对手在IPD中进行长期稳定合作。每一个agent在每代博弈中与博弈群体中随机选定的其余10个agents进行博弈。当10组博弈完成时，计算agent在这一代博弈中的平均收益。每代博弈中，若agent的实际收益比其目标收益高γ(γ≥0,γ={0,0.05,0.1,0.15,0.2,0.25,0.3,0.4,0.5})百分点，就认为其在该轮博弈中对收益比较满意，就会上调其在IPD博弈中的风险规避程度；若agent的实际收益比其目标收益低γ百分点，可认为agent在该轮博弈中对其收益不满意，它将下调其在IPD博弈中的风险规避程度。特别地，考虑到个体期望往往受到自身历史表现的影响，博弈者的目标收益将设定为自身历史收益。

(二)博弈策略的调整

博弈者的博弈策略编码采用二进制的编码方式，由博弈者的前三次历史PD博弈的结果给出当前PD博弈中所采取的策略。当完成风险态度的调整后，agents将对自身的博弈策略进行调整。博弈者将从博弈群体中收益较高的前N/2个优秀个体中随机选择两个个体的策略作为自身策略学习的参照对象，生成一个候选策略。若候选策略的效用值大于等于原自身策略的效用值，则候选策略成为agent的新策略，否则保持原策略不变。

(三)博弈个体的淘汰与更新

最后，根据agents的收益进行高低排序，淘汰末位的N×p个个体。p(p={0，0.05，0.1，0.15，0.2，0.25，0.3，0.4，0.5})代表淘汰率，用以描述现实中的行业竞争强度。行业竞争强度衡量的是行业内一家企业对其他企业生存机会的影响程度。模型中较高的淘汰率，对应较高的行业竞争强度，意味着行业内企业处面临激烈的竞争。淘汰掉末位企业后，有N×95%的新个体来自博弈群体内未被淘汰的优秀个体，即在剩余的收益较高的前N(1-p)/2个个体中选择一个个体作为父代，生成一个相同的子代个体直接替换被淘汰的个体，该过程体现了现实中行业内优秀在位企业的规模扩张。另外，有N×p×5%的个体随机生成,用于体现行业外部的潜在企业的涌入。

三、结果分析

(一)E1实验结果

本文中，假定博弈收益矩阵(T,R,P,S)=(5,3,1,0),因此，我们以博弈者的平均收益达到2.6作为IPD合作均衡出现的标准。当博弈者以自身历史收益作为目标收益时(E1),图1给出了群体的平均收益值(Population average payoff,PAP)和群体的平均风险态度值(Population averageattitude,PAA)在10000演化代中的平均结果。PAP值随参数γ的增加呈现“倒U形”变化，这一结果在p取0至0.5均成立。当p=0，即博弈群体的淘汰率为0时，PAP随参数γ的增加呈现倒“U”形变化，即当γ取适中值时能够最大化博弈群体的平均收益。类似地，PAA随着参数γ的增加亦呈现出倒“U”形变化趋势。此时，博弈者的平均收益稳定在2.62，体现了博弈者的风险规避与合作的正相关关系。该结论与现有研究结果一致，验证了风险规避可以促进博弈者在IPD中进行相互合作[5]。

(a) (b)

此外，p值的增大，会使令PAP值取到极大值的γ值变小，即使得倒“U”形逐渐左移。特别地，当p>0时，只有在γ<0.2的情况下，PAP值才有可能达到2.6。即当γ<0.2时，群体中才可能形成高度稳定合作；当γ>0.2时，群体中只能出现中度合作。因此，一旦环境中存在竞争强度带来的淘汰压力，博弈者需要加快风险态度的调整速度，才能实现合作的均衡。竞争强度增大，策略调整速度要更快才能保证策略学习的有效性，才能适应环境。

如图1(b)所示，当p>0时，博弈群体的平均风险态度随p的增大而增大。即群体中淘汰率越高，博弈者越风险规避。当p较大时(p≥0.4)，PAA值均保持在大于等于0.8的水平，说明此时博弈者的平均风险态度较高，群体中多为风险规避者。然而，对应的PAP值却没有达到2.6，意味着群体中却不能形成高度的合作。说明当行业中竞争较为激烈时，即使企业倾向于规避风险而与其他企业进行合作，稳定的合作也不会形成。

表1 当γ=0.05时agents在不同博弈历史下的合作比例(E1)

为了比较博弈者在不同竞争强度下的博弈策略，将策略编码上的64个基因位按其所代表的不同的博弈历史分成16组。在博弈者以自身历史收益作为目标收益的情形下，我们以γ=0.05为例进行分析。通过统计每一个agent在每一个策略基因组内采用合作策略的比例，得到以下结论：

不同博弈历史下，均有博弈者合作水平随着p的增大先增后减，在p取适中值(0.1≤p≤0.3)时合作水平最高，取较小(p<0.1)或较大值(p>0.3)时合作水平下降。此外，(1)随着前三步博弈历史中博弈局势C-C的增加，博弈者的合作水平将增加。特别地，当前三步博弈局势均为C-C时，博弈者均选择继续保持合作。(2)C-D局势的增加会导致博弈者合作水平的降低；特别地，当前三步历史博弈均为C-D时，几乎所有的博弈者将采取不合作策略以惩罚对手的不合作行为。(3)在D-C局势增加的时候，博弈者会降低自己的合作水平。当竞争强度较低或较高时，且历史中有3次D-C局面时，博弈者会利用博弈对手的愚笨，继续采用不合作的策略。但是当竞争强度适中时，博弈者仍然保有一定比例的合作；说明此时，适度的竞争强度下，博弈者会更多地对剥削行为产生悔悟心理，即使在博弈对手愚笨的情况下。因此，适中的竞争强度能够加强agents对不合作行为的忏悔。(4)考虑博弈历史中存在“D-D”局势的情形。随着历史中的“D-D”局势增多，博弈者越合作。当两个博弈者在前三步的PD博弈中均不合作时，其在下一步博弈中反而都会选择合作。这种对于不合作行为的宽恕，可以避免博弈者在IPD博弈中出现双输局面。此情况在竞争强度较小或较大时并不成立，说明适中的竞争强度更能促使博弈者宽恕不合作行为。

(二)E2实验结果

(a) (b)

实验E2对应的agents在不同博弈历史下的合作比例如图2所示。PAP值随着参数p的增大呈现倒“U”形变化，在p=0.2处PAP取得极大值。PAA值随着p(0≤p≤0.5)的增大而逐步增大。当p<0.15，PAP值不能稳定在2.6以上。Agents在演化过程中表现出了较明显的风险偏好行为，此时博弈群体中只能出现中度合作。当0.15≤p≤0.4时，PAP值均保持在2.6以上，此时群体中出现高度稳定合作。当p>0.4时，PAP值<2.6，但此时PAA值均大于0.9。这一情况与E1中p≥0.4时所对应情况类似，验证了较高的竞争强度会阻碍博弈者风险规避对其合作行为的促进这一结论。与E1不同的是，E2中γ的变化对于PAP及PAA没有显著影响，因为γ表征了博弈者对收益变化的敏感程度，而这一因素已经被纳入对收益增长率的考虑。

以γ=0.05为例对agents在不同博弈历史下的合作比例进行分析，其结果与E1所得结论类似，即不同博弈历史下适中的竞争强度能够促进博弈者合作水平的提高。

四、结语

本文研究了基于收益、基于收益增长率两种不同的竞争机制下，IPD博弈群体的agents的风险态度演化对合作行为演化的影响。在两种竞争机制下，均得到了适中的竞争强度可以促使博弈者进行高度合作的结论。适当的竞争强度有利于激发企业对自身长期稳定发展目标的追求，从而促进竞争企业的相互合作。根据本文的实验结果，一方面，行业监督者需要优化市场规则和秩序，以适当的政策协调竞合基础上的产业利益分享，合理干预市场竞争；另一方面，企业也需要不断调整自身的目标和策略以适应市场环境的快速变化；才能够出现企业优势互补、竞相合作的演化趋势。