基于云平台的闭环供应链信息共享演化博弈分析
2021-12-29钱鑫阳
钱鑫阳, 李 芳
(上海理工大学 管理学院,上海 200093)
随着人口、资源和环境之间的矛盾日益增长,循环经济的发展越来越重视废旧资源回收再利用。规模巨大的回收、再制造工作需要可持续的闭环供应链(CLSC)予以支持[1],传统的废旧资源回收体系上下游之间耦合协调程度较低。相关企业在技术、产品、信息上的互补性欠缺[2],未能形成协同发展。因此,造成废旧资源回收利用效率不高的关键在于回收商、再制造商之间存在信息壁垒。解决信息不对称、提高废旧资源回收效率,是一个值得关注的问题。
当前已有众多学者对CLSC开展了深入研究,但各成员间的信息不对称问题仍是难点。云制造作为一种新型制造模式,使分散的资源被迅速调度利用[3-5],为解决信息不对称问题提供了新的思路。由于在云平台中存在自身核心资源被窃取的风险[6],CLSC成员将基于理性的收益分析选择是否参与到云平台信息共享中。为研究CLSC成员的信息共享积极性,本文构建了政府部门、回收商、再制造商之间的三方演化博弈模型,探究CLSC成员是否利用云平台进行信息共享的策略选择及其影响因素。
1 文献综述
与本文相关的文献主要集中在CLSC回收决策研究、信息不对称和云制造在供应链中的研究这两个方面。
a.CLSC 回收决策研究。
CLSC回收决策的研究主要包括以下几个方面:第一,回收渠道的选择。Savaskan等[7-8]对不同回收渠道进行比较,发现零售商的回收效率和供应链整体利润最优,并分析零售商价格竞争的影响。曹柬等[9]考虑再制造成本,从消费者剩余出发,通过比较回收量和再制品产量,以求最优的回收渠道。孙浩等[10]研究三种双渠道回收模式的供应链利润受竞争性供应链的竞争强度的影响。公彦德等[11]对比双渠道和三渠道混合回收模式,得出最优回收策略。随着信息技术的发展,范定祥等[12]比较包括线上回收商在内的四种混合回收渠道,发现由线上和线下回收商、零售商、制造商构成的供应链整体利润最优。第二,从回收策略来看。王道平等[13]考虑拆解商回收努力等因素,研究CLSC成员不同合作方式的最优策略和利润。兰龙辉等[14]考虑分销商和零售商的互惠偏好,应用合作博弈模型协调供应链的利润。缪朝炜等[15]基于以旧换新政策对比研究3种CLSC的最优定价与回收策略。
b.信息不对称和云制造在供应链中的研究。
非对称信息在CLSC中的研究,一是关于信息不对称条件下的激励合同设计,研究如何设计契约合同以获取不对称信息,提升供应链成员的利润[16-17]。Biswas等[18]发现线性的关税和数量折扣契约可以协调供应链的利润。二是研究政策因素下的最优回收再制造策略。李芳等[19]发现,政府最优规制水平下信息不对称仅对单个成员收益有利,影响CLSC系统利润。张盼等[20]在零售商的回收成本信息是不对称时,探究制造商最优激励合同设计问题。Wang等[21]运用委托代理理论研究双渠道CLSC模型,设计信息筛选契约使制造商获得真实信息。
尽管众多研究提出针对信息不对称的策略,但信息不对称仍存在于供应链中。有学者提出在供应链成员间实施基于云平台的供应链集成[22-23]。Kochan等[24]发现基于云平台的信息共享提升医疗供应链的响应能力。Novais等[25]发现云平台可以提高物流业务绩效,达到精益生产的目的。
以上研究大多关注信息不对称对供应链利润的影响,对于如何解决信息不对称以及信息共享积极性的讨论较少。本文在以往研究的基础上,在政府规制下,考虑由单个回收商和单个再制造商组成的供应链。政府将回收和拆解工作转移给回收商负责,自身仅承担监管作用[26],再制造商则负责制造再制品。基于云平台的思想,产品的全生命周期与CLSC全过程紧密联系起来,形成有价值的从产品制造到末端资源回收再利用的全过程回收管理模式(见图1),为实现废旧资源的有序、可控、可再生和资源化利用提供决策依据。
图1 云环境下的信息、资源流图Fig.1 Information and resource flow diagram in cloud environment
2 模型构建
2.1 问题描述
在CLSC中,回收商拥有回收、拆解的能力和回收价格信息,再制造商拥有产品制造、市场产品数量、分布等资源。双方利用云平台获取互补信息和高效率的超额收益,但也面临核心技术外泄的风险。基于自身利益考虑,回收商和再制造商的策略空间为{积极共享,消极共享}。政府将自身公共责任转移,为确保废旧资源回收再制造工作高效开展,政府可选择监管,考虑到监管成本,也可能选择消极监管。因此,政府的策略空间为{积极监管,消极监管}。三方之间信息不对称且均为有限理性人,在博弈中通过了解其他主体的策略以调整自身策略,最终达到稳定均衡状态。
2.2 参数设定
PG:政府积极监管下的社会公共收益(如:利用云平台共享后,回收再制造产业趋于规范,效率得到提升,环境变好);
CG:政府积极监管的成本;
FG:政府积极监管下对回收商消极共享的惩罚所得;
Ar,AR:双方利用云平台积极共享时,回收商/再制造商获得的收益;
Cr,CR:回收商/再制造商利用云平台积极共享的设备成本;
∆Ar, ∆AR:回收商/再制造商长期积极共享的额外收益(如:业内声誉得到提升);
Nr:回收商消极共享、再制造商积极共享时,回收商的收益;
NR:再制造商消极共享、回收商积极共享时,再制造商的收益;
Fr:回收商消极共享受到政府的惩罚;
FR:再制造商消极共享的行业损失(如:获得回收品的成本增加);
Ir:回收商积极共享的设备信息化收益;
LR:再制造商积极共享的技术泄露损失;
fR:再制造商单方积极共享的技术泄露风险;
:双方积极共享,签订协同制造合约后,再制造商的技术泄露风险;
SG,Sr,SR:三方均为消极策略的产业损失。SG表示行业不规范带来的社会公共损失,Sr表示回收商由于缺乏再制造信息造成回收品拆解不当、拆解件无法取得高售价的损失;SR表示再制造难以获得优质回收品的损失。
2.3 基本假设
H1:政府积极监管的概率为 α,消极监管的概率为1 −α。回收商、再制造商的策略概率分别以含β,γ的式子表示,且 α ,β,γ ∈ [0,1];
H2:接入云平台需耗费设备成本,回收商需购置设备、建立信息系统,再制造商由于本身多生产性业务,信息化程度较高,设备投入较少,即Cr>CR;
H3:共享制造资源还需承担制造资料被窃取的风险。再制造商单方积极共享的技术泄露风险大于双方积极共享签订协同制造合约后的技术泄露风险,即 0 H4:双方积极共享的收益大于单方积极共享的收益,即Ar>Nr,AR>NR; H5:Sr>Cr−∆Ar−Ir>Cr−∆Ar−Ir−Ar+Nr,即回收商在发生市场秩序混乱时受到的损失Sr大于消极共享与积极共享相比所获得的收益增量Cr−∆Ar−Ir。 当政府积极监管或消极监管时,三方收益矩阵如表1和表2所示。 表1 政府积极监管时的三方收益矩阵Tab.1 Tripartite payoff matrix under active government supervision 表2 政府消极监管时的三方收益矩阵Tab.2 Tripartite payoff matrix under passive government supervision 由此,根据演化博弈的复制动态方程理论构建三方博弈复杂动态非线性系统: 为研究三方演化稳定策略,本文利用Lyapunov间接法和赫尔维兹稳定判据对该非线性系统的平衡点稳定性进行分析。 a.Lyapunov间接法:雅可比矩阵所有特征根都为负实部,则对应的均衡点渐进稳定;至少有一个特征根实部大于0,则均衡点不稳定;有一个特征根实部等于0,则均衡点稳定性不能判定。 b.赫尔维兹稳定判据:对三阶雅可比矩阵H来说,其特征根均为负实部的充要条件为:T r(H)<0,其中: T r(H)为矩阵H的迹; Je t(H)为矩阵H的行列式;为矩阵H的所有二阶主子式的行列式之和。 由F1(α,β,γ)=0, 可 得 α1=0,α2=1 或 β1=由F(α,β,γ)=0, 可 得 β=0,22β3=1或 γ(Ar−Nr)−α(Sr−Fr)+Ir+∆Ar−Cr+Sr=0。 由F3(α,β,γ)=0, 可 得 γ1=0,γ2=1或 β4=由此求得政府、回收商、再制造商的演化稳定策略。各方策略相互组合,形成该演化博弈的平衡点。 a.对平衡点进行讨论,得到以下3种情形: (a) 情形 1。 −CR+∆AR−fRLR+FR>0,即FR>CR−∆AR+fRLR。 面对回收商消极共享的策略,此时,再制造商积极共享与消极共享的收益之差大于0,自身损失FR大于收益增量,即再制造商消极共享的损失力 度 足 够 。 有 β1>1(因 为PG>CG), β4<0。 因此,此情形下的平衡点为: (b)情形 2。(FR−CR+∆AR−fRLR)−(−AR+NR+fR∗LR−fRLR)>0,即FR>CR−∆AR−AR+NR+fR∗LR。 面对回收商积极共享的策略,再制造商消极共享的损失力度足够。有 β1>1, β4>1。因此,此情形下的平衡点与情形1相同。 面对回收商积极共享的策略,再制造商消极共享与积极共享的收益之差小于0;面对回收商消极共享的策略,再制造商积极共享与消极共享的收益之差小于0,自身损失FR介于两者之间,说明再制造商消极共享的损失力度温和。 b.对情形 3 的讨论。 由情形3可知,有 0 <β4<1。当平衡点选择β=β4时,可再分以下两种情形: (a)情形3.1: α =α1=0,由F2(α,β,γ)=0可知,γ=Cr−Ir−∆Ar−Sr。由假设条件H5可知,S>1Ar−Nrr Cr−∆Ar−Ir,则有 γ1<0。 (b)情形3.2: α =α1=1,由F2(α,β,γ)=0可知,γ=Cr−Ir−∆Ar−Fr。由于F的大小未知,需作进1Ar−Nrr 一步讨论。 c.对情形 3.2 的讨论。 (a)情形 3.2.1:Fr 再制造商积极共享时,回收商消极共享与积极共享的收益之差大于0,表示回收商受到的监管惩罚小于消极共享与积极共享的收益增量,即政府对回收商的惩罚力度不够。此情形下, γ1>1,平衡点与情形1相同。 (b)情形 3.2.2:Fr>Cr−Ir−∆Ar。 再制造商消极共享时,同理可得,在此情形下, γ1<0,平衡点与情形1相同。 (c) 情 形 3.2.3:Cr−Ir−∆Ar−Ar+Nr 此时,回收商受到的惩罚介于两者之间,政府对回收商的惩罚力度温和。此情形下,0<γ1<1,新增一个平衡点x9。 由此,得到9个平衡点,但只是静态的均衡,没有考虑到动态演化过程。若某一主体的策略突变,静态均衡将有可能被破坏。因此,利用Lyapunov间接法和赫尔维兹稳定判据对动态演化方程的局部渐进稳定的均衡点进行判定。 根据三方复制动态非线性系统以及Lyapunov间接法,对平衡点进行稳定性分析,结果如表3所示。 表3 各平衡点稳定性分析Tab.3 Stability analysis of equilibrium point 结合平衡点分析和稳定性分析,对各情形的平衡点稳定性进行讨论。 a.情形 1。FR>CR−∆AR+fRLR。 此情形下,x5,x7为不稳定点,可能的演化平衡点是x6和x8。由此可得推论1。 推论1当Fr b.情形 2。FR>CR−∆AR−AR+NR+fR∗LR。 此情形下,x7为不稳定点,可能的演化平衡点是x8。x5和x6的稳定性待定。 推论2当Fr>Cr−Ir−∆Ar−Ar+Nr时,x8是稳定点。说明再制造商消极共享的损失力度足够,政府对回收商的惩罚力度足够,政府会选择积极监管,再制造商、回收商会选择积极共享。反之,Fr c.情形 3.2.1。CR−∆AR−AR+NR+fR∗LR 此情形下,x5是稳定点,其他均不为稳定点。 推论3当满足情形3.2.1时,三方博弈系统将收敛于x5。说明再制造商消极共享的损失力度温和,政府对回收商的惩罚力度不足,政府会选择积极监管,再制造商、回收商会选择消极共享。 d.情形 3.2.2。CR−∆AR−AR+NR+fR∗LR 此情形下,x8是稳定点,其他均不为稳定点。 推论4当满足情形3.2.2时,三方博弈系统将收敛于x8。说明再制造商消极共享的损失力度温和,政府对回收商的惩罚力度足够,政府会选择积极监管,再制造商、回收商会选择积极共享。 e.情形 3.2.3。CR−∆AR−AR+NR+fR∗LR 首先由Lyapunov法可得:x5和x8是稳定点,其他均不为稳定点。其次,此情形下会增加一个平衡点x9。根据赫尔维兹稳定判据,平衡点x9的雅可比矩阵 Je t(H)<0,故x9不是渐进稳定点。 推论5当满足情形3.2.3时,三方博弈系统将收敛于x5或x8,说明再制造商消极共享的损失力度温和,政府对回收商的惩罚力度温和,政府一定会选择积极监管,再制造商、回收商则会同时选择积极共享或消极共享。 通过上述分析,可以发现: a.比较推论1和推论2,发现两种情形下,再制造商的损失、政府对回收商的惩罚力度相同时,只需提高惩罚力度FR,即可使得三方博弈系统获得演化稳定。 b.比较推论2和推论4,在提高政府对回收商的惩罚力度的情况下,再制造商损失温和,即可让三方博弈系统处于(1,1,1)的稳定状态。 c.比较推论3和推论5,发现政府提高对回收商的惩罚力度的情况下,再制造商和回收商不一定会采取共享策略,他们仍有可能采取不共享策略,且双方最终的策略状态保持一致。 为了使演化稳定分析更直观,本文利用MATLAB进行数值仿真。根据对上海市废旧资源回收情况的调研,结合假设条件3.3,对参数初值进行合理设置,限定参数初值在假设条件内,设置数组 1:PG=20,CG=5,FG=9,SG=80,Ar= 80,Cr=70, ∆Ar=4,Nr=35,Fr=15,Ir=11,Sr=60,AR=100,CR=20, ∆AR=4,NR=40,FR=25,LR=20,fR= 0.4,fR∗= 0.15。 a.初始仿真分析。 在博弈系统中,若某一主体的策略突变,系统将失去均衡状态。通过对三方初始状态突变的仿真分析,可以发现: (a)如图2所示,政府策略从0或1突变,其最终都会达到1的均衡状态。由此说明,政府对于其转移的公共职能有必要积极监管。 图2 政府策略从0或1突变的演化趋势Fig.2 Evolution trend of government strategy from 0 or 1 (b)如图3所示,在政府积极监管的情况下,回收商从0开始突变,无论再制造商采取何种策略,回收商最终稳定状态是0。回收商从1开始突变,当再制造商积极共享时,回收商最终稳定状态是1,当再制造商消极共享时,回收商最终稳定状态是0。由此可见,当回收商共享意愿弱时,无论再制造商的影响,最终都将选择消极共享,而当回收商共享意愿强烈时,将受再制造商的影响采取与之相同的策略。 图3 回收商策略从0或1突变的演化趋势Fig.3 The evolution trend of recycler strategy from 0 or 1 (c)如图4所示,在政府积极监管的情况下,再制造商从0开始突变,当回收商积极共享时,再制造商最终稳定状态是1,当回收商消极共享时,再制造商最终稳定状态是0。再制造商从1开始突变,无论回收商采取何种策略,再制造商最终稳定状态是1。由此可见,当再制造商共享意愿弱时,将受到回收商共享意愿的影响,采取与之相同的策略,而当再制造商共享意愿强烈时,不受回收商的影响,都将选择积极共享。 图4 再制造商策略从0或1突变的演化趋势Fig.4 Evolution trend of remanufacturer strategy from 0 or 1 初始仿真结果表明,政府的最优选择是对其转移的公共职能积极监管,回收商相较于再制造商的机会主义倾向更加明显,再制造商更倾向于积极共享。 b.初始意愿对演化的影响。 在数组1的基础上,探讨三方初始意愿对演化的影响。假设三方的初始意愿相同,研究初始意愿在较弱、一般、较强3种情况下对演化结果的影响。由图5和图6可知,不论初始意愿如何,最终三方均会到达(1,1,1)的状态,这是因为回收商受到的惩罚满足情形1的条件,演化平衡点符合上述分析。其次,当初始概率值足够小时,回收商倾向于消极共享,随着政府和再制造商的意愿上升,回收商改变策略,逐渐趋向于共享。三方初始意愿越高,回收商策略转变得越快。对再制造商来说,初始参与意愿较低时,受回收商消极共享趋势的影响,倾向于共享策略的速度突然变慢,但此时政府已选择积极监管,再制造商最终选择积极共享。对政府来说,随着三方初始意愿增大,由于高收益的可能性减小,其演化至积极监管策略的速度减慢。仿真结果表明,政府在博弈系统中主导作用显著,适当的监管力度即可引导参与主体积极共享。其次,再制造商较回收商的积极性更高。最后,三方参与主体初始参与意愿越高,演化至稳定状态的速度越快。 图5 初始意愿对演化的影响Fig.5 Impact of initial intention on evolution 图6 回收商初始意愿对演化的影响Fig.6 Impact of recycler's initial intention on evolution c.外部变量对策略选择的影响。 (a)政府策略选择的影响因素。 以(0,0,1)的策略组合为例,假设政府的初始状态由消极监管开始突变。改变数组1,分别设置CG=5,25,60,110,研究政府的监管成本对策略选择和演化趋势的影响。由图7可知,在政府的监管成本较低时,验证了政府对于自身转移的公共职能积极履行监管职责。当政府的监管成本逐渐升高时,政府的演化速率变缓,演化至稳定的积极监管策略时间加长。当政府的监管成本超过收益时,积极监管转向消极监管的阈值在CG=110左右,小于该阈值时,政府将采取积极监管的策略。 图7 政府的监管成本对演化的影响Fig.7 Impact of government regulation cost on evolution 比较图8和图9可以发现,PG和SG对政府策略的演化影响类似,随着社会公共收益和社会公共损失的增大,政府越倾向于积极监管且演化速度加快。由此可见,作为政府部门,在推进废旧资源回收再利用的过程中,不仅对比自身的成本与收益,社会效益也是其考虑的一方面。 图8 社会公共收益对政府演化的影响Fig.8 Impact of public benefits on government evolution 图9 社会公共损失对政府演化的影响Fig.9 Impact of public loss on government evolution (b)回收商策略的影响因素。 以(1,1,0)的策略组合为例,假设回收商的初始状态由积极共享开始突变。改变数组1,分别设置Fr=15,35,55,研究回收商受到的惩罚力度对策略选择和演化趋势的影响。由图10可知,在惩罚力度较小时,验证了在政府积极监管的情况下,当回收商共享意愿强烈时,将受再制造商的影响采取与之相同的策略,且随着惩罚力度加大,回收商消极共享的趋势变缓并逐渐倾向于共享策略。再次说明,政府对于回收商的策略选择具有引导作用。 经仿真,信息化收益Ir对模型有相似的影响,设备成本Cr对模型有相反的影响,其演化趋势与图10相似。这说明,对信息化程度较低的回收商来说,提升信息共享的效率有利于引导其采取共享策略。由于再制造商的策略选择影响因素与回收商相似,因此不再赘述。 图10 惩罚力度对回收商演化的影响Fig.10 The impact of punishment on the evolution of recycler d.对演化稳定策略分析的仿真。 (a)FR对演化的影响。 改变数组1,设置Fr=9, α =β=γ=0.5,分别设置FR=50,24,10。由图11可知,演化结果符合上述演化稳定策略分析。首先,再制造商消极共享策略造成的自身损失较小,再制造商将会消极共享;损失温和或较大,再制造商将会积极共享。其次,再制造商仅需在温和的损失刺激下即会选择积极共享。最后,当回收商受政府的监管力度不足时,无论再制造商的策略选择,回收商最终都会趋向消极共享,仅有演化速度的不同。 图11 FR对演化的影响Fig.11 Impact of FR on evolution (b)Fr对演化的影响。 改变数组1,设置FR=10, α =β=γ=0.5,分别设置Fr=8,30,60。由图12可知,演化结果符合演化稳定策略分析。首先,回收商的演化稳定策略受政府的惩罚力度的影响,惩罚力度越大,回收商演化至积极共享的速度越快。其次,当再制造商的损失温和时,再制造商积极共享的趋势更明显,这会导致政府对回收商的惩罚力度仅保持温和,即可使其选择共享策略。最后,再制造商的策略受回收商的影响,与回收商的策略保持一致。通过对比FR和Fr对演化的影响可以发现,再制造商和回收商对彼此的影响不同,再制造商对回收商的策略更敏感,保持跟随态度。 图12 F r对演化的影响Fig.12 Impact of F r on evolution (c)对情形3.2.3的讨论。 改变数组1,设置Fr=30,分别设置每组α,β,γ概率为0.5,0.3,0.1。由图13可知,当Fr较为温和时,回收商和再制造将会选择相同策略。研究发现,当初始共享意愿强烈时,双方将会共同选择积极共享。反之,则双方共同选择消极共享。结合前述仿真分析可知,提高初始共享意愿并利用再制造商受回收商策略的影响这一条件可促使双方积极共享。 图13 对情形3.2.3不确定稳定情况的讨论Fig.13 Discussion on uncertain stability of scenario 3.2.3 为探究基于云平台的CLSC回收再制造信息共享的积极性及其影响因素,本文通过构建政府、回收商、再制造商之间的三方演化博弈模型,分析各方策略选择的演化稳定性以及各要素的影响关系,最后通过数值仿真验证了分析的有效性,得出的结论如下: a.在各方是否选择云平台共享回收再制造信息时,政府的主导作用显著。作为公共职能部门,综合对社会效益的考虑,其最优决策为积极监管。政府监管力度适当增大,促使回收商、再制造商积极共享以避免损失,演化速度也与监管力度正相关。因此,政府应该发挥导向作用,采取适当的监管力度,提升废旧资源回收再制造效率。 b.在政府积极监管的前提下,再制造商倾向于积极共享,而回收商则根据监管力度持有机会主义。因此,在推进CLSC回收再制造信息共享工作中,政府监管力度主要针对回收商来调整,以此达到促进信息共享的目的。 c.回收再制造信息共享受初始意愿的影响显著。初始意愿越高,回收商、再制造商积极共享的概率越大,演化趋势越快。由于单个企业的策略选择概率与同类企业的整体策略选择比例相同,因此,行业内的企业可以形成联盟,共同选择使用云平台进行信息共享,形成行业标杆,将会带动更多企业参与到利用云平台进行信息共享中来。 d.回收商、再制造商对彼此的影响是不对称的,再制造商受回收商的影响更明显。当再制造商自身损失增大趋向于积极共享时,回收商根据监管力度的情况不一定会积极共享;但当回收商受监管趋于积极共享时,再制造商的策略会保持同步。因此,为推进云平台信息共享,应主要关注对回收商的监管,使得回收商和再制造商均采取共享策略。 e.当政府监管力度温和时,回收商、再制造商的策略会保持一致。当初始意愿较高时,双方会演化稳定至积极共享策略,反之,则双方采取消极共享策略。因此,政府可以采取宣传等手段鼓励更多的行业内的企业参加云平台共享以提高其初始意愿,促使其演化稳定至积极共享。 本文将演化博弈论和云制造的思想运用到解决CLSC回收再制造信息不对称中,但现实情况比研究假设更复杂。因此,需要更贴合实际的模型来讨论。此外,基于云平台信息共享的CLSC相较于传统CLSC的优越性也是未来研究的方向。2.4 复制动态方程
3 三方演化稳定性分析
3.1 理论基础
3.2 平衡点分析
3.3 演化稳定策略分析
4 仿真分析
5 结束语