基于序列稳定性的冲突当局者行为分析模型

2022-02-08徐海燕赵士南

运筹与管理 2022年12期

韩瑜, 徐海燕, 陈璐, 赵士南

(1.南京航空航天大学经济与管理学院,江苏南京 210016; 2.江苏科技大学经济管理学院,江苏镇江 212100)

0 引言

冲突决策反映的是当局者之间的交互行为，考虑当局者的有限理性行为可以突破对“理性人”假设的局限。在现实冲突决策中，当局者普遍表现出过度自信的倾向[1,2]。依据最新冲突分析理论，研究当局者不同程度的过度自信对冲突决策的影响，并探索其与传统决策之间的偏差，不仅能够更合理地改进冲突决策模型，而且能够更高效地处理我国现阶段存在的复杂矛盾关系。

过度自信是有限理性中表现最强的认识行为之一[3]。Gervaris等[3]将过度自信定义为：自己知识的准确性比事实中的程度更高的一种信念。运用指标识别等方法可以确定当局者的过度自信[4]。过度自信通常作为描述当局者行为特征的一个关键变量，基于此学者们研究了采购量、银行质押率确定等冲突决策问题[1,2]。然而，上述研究多是定量分析；仅掌握当局者相对偏好时，鲜有研究考虑当局者的过度自信进行冲突分析。

目前，众多学者提出多种方法以解决冲突，主要包括博弈论[5]、F-H方法[6]和冲突分析图模型理论(简称冲突分析)[7,8]。冲突分析基于少量相对偏好信息，能处理军事争端[8]、供应链管理[9,10]、环境治理[11]、复杂装备研制[12]等现实冲突问题。为了描述当局者的不同行为类型，冲突分析给出了四种基本稳定性概念：纳什稳定(Nash)[5]、一般超理性稳定(GMR)[8]、对称超理性稳定(SMR)[8]和序列稳定(SEQ)[13]，并以此获取冲突解决方案。冲突分析的行为特征研究主要分为两个方面：偏好构建[10～13]和稳定性概念。在稳定性方面，基于异质对手的不同可置信等制裁行为，Zhao等[14]提出了混合稳定性。考虑当局者权力不对称行为，孔杨等[15]给出了相关稳定性分析方法。针对当局者的攻击型、保守型或兼顾型行为，赵金帅等[16]研究了不同步数下的冲突结局。为了区分当局者的不同行为类型，Wang等[17]构建了行为稳定性函数。

综上，目前关于冲突分析在行为特征方面已取得多项优秀的研究成果，但仍存在以下不足。首先，相对偏好信息下没有考虑当局者的过度自信，但实际上，当局者在认知对手下一步行动上容易产生某种程度的偏差。其次，四种基本稳定性概念依据预见力和风险态度能表征当局者行为(表1)，然而这样的描述过于宽泛，很难全面刻画实际当局者复杂的决策行为。再次，在理解SEQ稳定时忽略了过度自信，其应该作为评价当局者行为类型的要素之一。SEQ稳定性下，当局者坚信自己理解对手的心思，不考虑对手有其他选择的可能性而作出判断，其对自己的能力、知识和对未来的预测表现出过分的自信和乐观。最后，根据传统冲突分析理论，无法为具有过度自信的当局者选择匹配的稳定性概念来进行决策，也无法表征当局者不同强度的过度自信。在四种基本稳定性中，只有SEQ能够反映当局者的过度自信。SEQ稳定在刻画对手反击时并不全面，仅仅考虑了有利于对手的那一部分反击行为。此外，在四种基本稳定性中，只有SEQ考虑对手做出的反击是理性的，即有利于对手，这在现实冲突中普遍存在[10～13]；而GMR和SMR考虑的是对手全面的(利己的+利他的)反击可能，这两种稳定基本不适用于表征过度自信行为。

表1 基本稳定性概念行为说明

基于上述分析，本文认为过度自信当局者做出的决策和一般决策之间存在偏差，且偏差并不都会产生负面影响。因此从当局者认知对手的反击情况出发，在相对偏好信息下，定义新的稳定性概念，首次揭露冲突分析SEQ稳定性反映的当局者过度自信行为，验证当局者的过度自信行为往往会影响其他成员的决策与收益，且有利于现实决策系统的整体效益。其创新性主要体现在：(1)分别定义强、弱SEQ稳定的逻辑概念，以此表征当局者具有不同程度的过度自信，将现有四种基本稳定性拓展至六种。(2)从代数化角度，提出强、弱SEQ稳定性的矩阵表达式，以此快速地处理状态较多的冲突问题，优化稳定解的计算过程，并推动冲突分析理论以及借助计算机运行的决策支持系统的发展和应用。

1 理论基础与问题描述

1.1 理论基础

在冲突分析图模型理论框架下，五元素集合V={N,S,G,P,F}可以用来描述一个冲突分析系统[8]。其中，集合N包含全部冲突当局者；可行状态集S={s1,s2,…,sm}表示由当局者可选方案组合而成的状态点集合；状态转移图G=(S,{Ai}i∈N)，Ai⊆S×S表示当局者i在各状态点之间一步转移形成的有向弧集合;Pi{≻i,～i}代表当局者对待不同状态的偏好信息集，s,q∈S，对于当局者i，s≻iq表示状态s优于q，s～iq表示s与q等价；F={fkh},k1=Nash,k2=GMR,k3=SMR,k4=SEQ,h={1,2,3,4}代表稳定性函数集合，在选择不同稳定性概念进行冲突分析时，需要获取对应的函数。各项符号的具体含义可参考徐海燕等[18]撰写的冲突分析专著。

稳定性概念描述了一个特定的当局者选择是留在一个状态，亦或是单方面离开。在特定的稳定性定义下，当局者不愿意从当前状态向其它状态移动，则当前状态为一个稳定解；如果所有当局者在某一状态都是稳定的，则该状态是冲突的一个均衡解或冲突可能的解决方案。

1.2 问题描述

从集合角度出发，四种基本稳定性概念之间存在相互包含关系[8]，即SNash⊆SSEQ⊆GMR,SNash⊆SSMR⊆GMR。从上述关系可知，稳定性概念能够反映的当局者行为类型应多于现有的四种，且有部分行为描述缺失。例如，若对SEQ和SMR相交的部分进行描述，其既保守又冒险，但这一行为特征显然并没有现有的稳定性概念与之相匹配。更进一步地，现有的稳定性概念无法对当局者更复杂的决策行为进行描述，即无法对SEQ反映的过度自信行为进行准确地表达。

现考虑部分冒险SEQ稳定性概念，分析其能够反映的当局者过度自信行为。根据定义4可知，当局者倾向于转移到更优状态，其追求自身利益最大化，对手的反击情况为只做出有利于自身的反击。当局者在模拟冲突情境进行分析时，没有将对手不利于自身的反击纳入到分析中，往往会过低估计自己将面对的实际风险，即SEQ稳定性下的当局者在认知对手信息时存在过度自信行为。因此，基于SEQ定义新的稳定性概念，能够较恰当地反应当局者的过度自信决策行为。

如果在某个冲突系统中，当局者的行为特征不只是通过预见力和风险认知所体现，还会考虑当局者的过度自信行为对冲突分析的影响，称基于SEQ稳定性定义新概念而来的冲突系统为考虑过度自信行为的冲突分析系统。

定义5假设冲突系统需要考虑当局者的过度自信行为特征，基于SEQ稳定性概念将当局者的过度自信行为引入到冲突分析中，此时的FOC被称为考虑当局者过度自信行为的稳定性函数集合，V={N,S,G,P,FOC}被称作考虑当局者过度自信行为的冲突分析系统。

下一步的任务是考虑当局者过度自信行为，依据基本稳定概念间的集合包含关系，对SEQ稳定性集合的子集进行新的逻辑和矩阵定义，使其匹配过度自信行为在冲突分析中的表征情况。

2 当局者过度自信行为的稳定概念逻辑表达

以SEQ稳定概念为例，对其拓展出更全面的定义，用以反映当局者的过度自信行为特征。从预见力、风险态度、过度自信三个指标，描述新稳定性概念所反映的当局者的行为特征。

2.1 强弱序列稳定性的逻辑定义

由图1可知，SEQ稳定状态集合由三部分组成：Nash稳定(中间圆点包围区域)，SMR稳定和SEQ稳定相交的部分(点与虚线包围区域)，独立的SEQ稳定部分(虚线与黑粗线包围区域)。本文对上述除Nash稳定以外的两部分进行定义。

图1 新稳定状态集合之间的包含关系

WSS稳定行为下，当局者i从状态点s出发，一定存在i可以转移到的改良状态，且改良的状态都遭受对手j的反击，同时i过度自信地认为j会考虑有利于自身的反击，使i未能逃脱j的制裁。进一步，i不考虑自身的转移优劣，继续对j的反击进行回击，但仍未能逃脱j的制裁。由于当局者在回击对手时，分析了所有转移情况，此时当局者的过度自信行为并不是很强烈，则s是i的一个弱对称序列稳定状态。

SSS稳定行为类似于WSS稳定行为，两者唯一的区别是当局者回击后能否逃脱对手的制裁。在SSS稳定下，当局者i考虑对j的反击进行回击时，回击后i能够逃脱j对手的制裁，即至少存在一个可达到的改良状态，但i并未转移到改良状态，且i选择稳定在状态s处。进一步分析发现，i考虑对j反击, 此时的状态s已经稳定，可以停留。当i考虑自身回击的下一步时，无论对手如何打击，都有比i现在状态更优的状态，所以i都有对自身有利的反击，而SSS行为下i却选择在s处稳定。此时，i的过度自信体现在其会高估自己的想法，自信地把状态停留或转移的主动权交给对手，相信对手会按照自己所想而行动，低估了对手不按照自己设想行动的可能。

通过对比分析SSS和WSS两种稳定性可知，SSS稳定代表的当局者具有更强烈的过度自信。从定义6、7及图1可以发现，WSS稳定涵盖了SMR理性与SEQ有限理性下的稳定状态，而SSS稳定是在SEQ有限理性的稳定中去除了SMR理性状态的稳定情况，只剩下非理性稳定部分，因此表现的过度自信更强。表2给出三种适用于选择SEQ相关稳定性做冲突分析的当局者行为特征，从左到右当局者的过度自信程度依次增强。

表2 SEQ稳定和新稳定下当局者的行为特征

现给出基于SEQ稳定相关概念的使用规则：当获取的信息可以精确地表达当局者的过度自信行为时，选择强或者弱SEQ稳定做冲突分析；当获取的信息是模糊地表达当局者的过度自信行为时，则选择标准SEQ稳定做冲突分析。

2.2 逻辑表达的强弱SEQ稳定求解步骤

强弱SEQ稳定性逻辑表达下的冲突分析可分为如下3步：

步骤1运用适合的指标识别方法[4]，统计各个当局者的行为特征，主要包括其过度自信水平、预见力水平、风险认知水平。基于SEQ稳定构建考虑当局者过度自信行为的冲突分析系统，确定适用于该系统的函数表达FOC={fkh},k1=Nash,k2=GMR,k3=SMR,k4=SEQ,k5=WSS,k6=SSS。

步骤2收集冲突背景信息，构建基础模型。明确冲突问题的决策焦点，识别决策问题的关键因素，其中包括当局者、当局者的策略、当局者的偏好等信息，构建冲突图模型。

步骤3构建并运用匹配的稳定函数分析冲突。分别依据定义6和7，计算并分析冲突的SSS和WSS稳定，即获取考虑当局者过度自信行为的冲突系统稳定解。

上述步骤按照强序列SSS和弱序列WSS稳定的逻辑定义来计算冲突稳定解和均衡解，可以准确地解决状态较少的冲突事件，但当冲突中的状态个数较多时，会使得计算过程复杂、难度大。

3 当局者过度自信行为的稳定概念代数表达

虽然强序列SSS和弱序列稳定WSS的逻辑表达能表征当局者具有不同强度的过度自信行为，但其逻辑形式不利于实现计算机编程，难以处理状态点较多时的冲突问题。本部分通过向量、矩阵易于编程的代数形式定义这两个新概念，便于使用者高效地判断和表达冲突结局，也为冲突决策支持系统的改进提供理论基础。

3.1 强弱SEQ稳定性的矩阵表达

推导强弱SEQ稳定性概念的矩阵表达式是冲突分析的一项重要工作。文献[18,19]通过矩阵和图模型状态集之间的关系、状态间的偏好关系矩阵以及状态转移的可达关系矩阵定义了基本稳定性的矩阵表达。矩阵表达可以快速处理多状态的复杂冲突系统的求解问题，建立决策当局者判断和推导冲突问题的模仿学习模式，夯实图模型在人工智能领域应用的基础。因此本部分基于SMR和SEQ稳定性的矩阵表达，将强序列稳定SSS和弱序列稳定WSS的逻辑概念矩阵化。

设当局者i∈N，状态s,q∈S。i的改良和非改良偏好关系矩阵[19]在第s行q列的元素分别为

(1)

(2)

当局者的单方移动可达矩阵的第s行q列元素和单方改进可达矩阵的每个元素分别为[19]

(3)

(4)

符号方阵sign(M)中的第s行q列的元素为

(5)

(6)

定义当局者i的SEQ稳定性的m阶方阵

(7)

sign(Jj·B)]

(8)

(9)

定理1对于当局者i，状态s为WSS稳定当且仅当稳定性函数

(10)

定理2对于当局者i，状态s为SSS稳定当且仅当稳定性函数

(11)

3.2 矩阵表达的强弱SEQ稳定求解步骤

强弱SEQ稳定矩阵冲突分析为3步，前两步与其逻辑表达求解的前两步相同，详述步骤3。

步骤3依据定理1和2提出的强序列稳定SSS和弱序列稳定WSS的矩阵表达，计算并分析冲突的稳定情况，即基于SEQ稳定性矩阵获取考虑当局者过度自信行为的冲突系统稳定解。

强序列稳定SSS和弱序列稳定WSS的逻辑描述和矩阵代数运算，有利于帮助分析者解决一些更符合特定现实情境下的冲突问题。

4 案例分析

随着经济的发展，供应链内部的竞争愈发激烈，制造商与零售商之间存在相互制约的竞争关系。一方面，制造商认为自己在供应链中始终处于主导地位，且认为零售商会按照自己的想法进行策略调整，此时，需要考虑制造商的过度自信行为。另一方面，零售商企图依靠规模优势影响制造商的决策，如压低制造商的批发价格，从而将系统利润向零售商转移，并借着市场终端的垄断势力，对制造商进行纵向控制。在这一供应链冲突事件中双方均处于中型规模、稳步上升发展期。下面分析考虑制造商过度自信的冲突系统。

4.1 “制造商与零售商渠道价格”冲突建模

当局者及其策略。从冲突背景中提炼出两个决策当局者：制造商(DM1)和零售商(DM2)。考虑制造商的三个策略：1)接受少量降价。制造商考虑到零售商的需求规模，可以接受少量降价供货，以留住客户。2)低价竞争。针对零售商的打压行为，制造商降低给其它零售商的批发或零售价格，刺激其它零售商提高订货量。3)开通直销渠道。当零售商不接受制造商制定的供货价和零售定价时，制造商通过网络营销、电视购物、自有特卖店等形式，开通直销渠道，与零售商抢占市场份额。零售商有三个策略：4)实施价格战。零售商直接压低制造商的批发价格以便增加订货量，加价销售来获得更多利润。5)协商降价。与制造商沟通，通过少量降低价格来得到供应商的货物。6)提供自有品牌。为获取在供应链竞争中的优势地位，零售商引入自有品牌产品，并积极与制造商在供应链上游进行产品质量竞争。

可行状态。冲突共有6个策略，理论上共有26=64个状态。考虑到制造商在策略1、策略2和策略3中最多只会选择一个策略，则有接受少量降价、实施价格战和开通直销渠道不能同时发生。剔除所有不可行状态后，该冲突事件共有16种可行状态，详见表3。其中，“N”表示当局者不选择该策略，“Y”表示当局者选择该策略。

表3 “制造商与零售商渠道价格”冲突事件的可行状态

状态转移图。根据可行状态表，绘制出状态转移图(图2)。其中，黑色圆点表示状态，带箭头的虚线和实线分别表示制造商(DM1)和零售商(DM2)的状态转移情况，双向箭头表示两个状态可以互相转移。

图2 “制造商与零售商渠道价格”冲突的状态转移图

4.2 构建制造商强SEQ稳定性分析系统

假设可以确定制造商的行为类型为强烈过度自信冒险型，则构建SSS稳定性概念下的冲突分析系统，并可以确定适用于该系统的函数表达为FOC={fk1≠0,fk2=0,fk3≠3,fk4=0,fk5≠0,fk6=-1},k1=Nash,k2=GMR,k3=SMR,k4=SEQ,k5=WSS,k6=SSS。

4.3 制造商强SEQ稳定性分析

获取供应链冲突的强弱SEQ解，详见表4。其中，“√”所对应的状态表示该当局者的一个稳定点，“▲”所对应的状态表示冲突的一个均衡解或可能的解决方案(Equilibrium,“E”)。

表4 “制造商与零售商渠道价格”冲突的强弱SEQ稳定解

s6为强序列稳定(SSS)，表示制造商采取开通直销策略，零售商投入自有品牌，双方积极增加各自市场份额。s6为冲突的一个解决方案，这符合现实情况，即制造商开通直销渠道和零售商引入自有品牌同时发生的现象普遍存在。下面详细分析制造商在s6强烈过度自信的具体表现。

根据4.1小节中可达矩阵和改良偏好矩阵可知，对于制造商R1(s6)={s2,s4,s10}，当零售商反击制造商时有R2(s2)={s1,s3,s4}，存在s4≻1s6，相比于s6，出现了更优状态s4，但是制造商却愿意留在s6。这是由于制造商考虑了零售商的偏好，且相信自己对零售商的了解，才使得s6趋向稳定。而当制造商考虑零售商的反击时，s6已经稳定，可以停留；再考虑自身下一步的回击时，无论对手如何打击，制造商有更优的状态，此时制造商都有对自身有利的反击。

由表4可知，虽然零售商在s6是Nash稳定，但由于制造商强烈的过度自信，导致s6的Nash均衡并不成立，从而说明制造商的过度自信会影响冲突结局。根据对双方行为类型的了解，最终能够得到该冲突的一个确定结果为s6。这说明在该冲突情境下，强序列稳定SSS对应的具有过度自信的当局者之间更易达成良性竞争，冲突更有可能得到解决且有利于集体利益。

4.4 强弱SEQ稳定与一般稳定性对比分析

若当局者具有弱稳定性，则s12会成为冲突均衡解，此时双方实行价格战，这损害了双方的整体利益，相比于s12，s6的过度自信程度更强。

冲突的一般均衡解为s15，这是Nash、GMR、SMR和SEQ四种稳定性下的均衡解，其表示零售商与制造商协商以一个降价后较低的价格进行商品批发，制造商同意以降低后价格供货给零售商。此时，制造商不想损失客户，零售商想获得更多利润，两者都认为没有其它更好的状态想要转移，都接受s15。综上，未考虑当局者过度自信的解是s15，而考虑当局者过度自信的解为s6，两种情境下冲突结局是不同的，相对于s15，s6能反映当局者的过度自信行为。

进一步地分析表4可知，制造商和零售商在SEQ下的冲突均衡解包括s6,s12,s15，过度自信下的解s6就在其中，这说明新概念符合实际冲突情况。然而，仅仅依据原有稳定性概念并不能说明当局者为什么锁定某一个除了s15的稳定解作为冲突最终结局。为了对其进行说明，来看其它一般均衡解。表4中存在GMR、SMR和SEQ均衡解s6，GMR均衡解s7表示制造商开通渠道、零售商协商降价，这是一个过渡均衡状态。GMR和SEQ均衡解s12。在传统冲突分析中，这三个状态一般并不会被分析者看作是冲突最终结局。在考虑过度自信后，冲突均衡解被锁定在s6，这使得冲突均衡解的范围变小。

5 总结

本文将现有四种基本稳定性拓展至六种，构建考虑当局者不同程度过度自信的冲突分析系统，该系统具有如下特点：

(1)不仅容纳经典博弈的内省和推理形式，而且突破经典博弈论对理性人假设的局限。在定性偏好信息下，定义强、弱序列稳定性概念，其能够更好地刻画冲突当局者的过度自信行为，并区分其强弱程度。

(2)强、弱序列稳定的矩阵表达式有利于分析者运用决策支持系统更直观地获得冲突解，协助其高效地制定冲突解决方案。

(3)冲突的满意方案范围缩小，更易于锁定冲突结局，有利于冲突更优结果选择。

本文研究给予现实应用一些启发：(1)S15作为一般均衡解，能够解释“价格战”在制造商与零售商竞争中的存在性，但其忽视了当局者的过度自信，而且从供应链可持续发展来看，“价格战”并不是解决该冲突的良策；(2)过度自信并不都会产生负面影响，制造商的过度自信有助于上下游之间的良性竞争和供应链的可持续发展，均衡解表示开通直销渠道与自有品牌共存现象，为了促进供应链系统争取更大的集体利益，市场更倾向于选择过度自信的制造商。

在管理冲突决策领域，考虑当局者过度自信的冲突分析系统具有普遍适用性。除了供应链管理方面，在库存管理、项目管理、金融投资管理等现实冲突中，也可以用本文所提的研究思路和方法，为现实案例提供决策支撑。

本文提出的思想同样适用于探索冲突中当局者的其它有限理性行为，比如损失规避，相应地，可以对SMR和GMR等稳定性概念做更全面的行为分析。此外，本研究基于两个当局者的简单偏好进行，未来的研究可以考虑将其推广到多个当局者带有强度偏好的冲突分析中。