政府奖惩机制下零售商主导的闭环供应链微分博弈策略
2022-09-13王道平
王道平, 张 可, 周 玉
(北京科技大学 经济管理学院,北京 100083)
0 引言
随着科技的进步和人们生活水平的提高,我国的家电制造企业不断推出绿色健康、智能型的家电产品,在提高消费者生活水平的同时,也导致了废弃电器电子产品数量的急剧增加[1]。如果这些产品得不到及时合理的处理,将严重污染环境。在社会责任和利润驱使下,回收再制造企业越来越意识到逆向供应链所带来的战略价值,据相关研究表明,废弃电器电子产品经过集中无害化加工处理后,99%的资源可以进行再利用,为企业带来了极大的经济效益。由于回收具有一定的外部经济性,回收率也因受到各种不确定因素的影响而呈现不稳定性,所以政府有必要采取相应的奖惩机制对闭环供应链成员进行引导。因此,如何进行有效的回收处理成为政府和企业亟待解决的重要课题。
随着对供应链中逆向物流研究的不断深入,回收行为作为企业的重要一环愈加具有战略价值,不少学者基于不同视角对企业回收再制造行为进行了深入的研究。Chen Jun等[2]考虑了回收品管理成本和再制造成本,探究直接和间接两种回收模式对企业收益的影响。李晓静等[3]以竞争性供应链为背景对回收渠道进行研究,从回收率和共赢角度分析了最优回收渠道的选择。黄少辉等[4]通过构建四种回收渠道模型,发现零售商、第三方和制造商共同承担回收责任时系统效益最大。曹柬等[5]基于企业收益、消费者剩余和回收率等视角对回收渠道偏好进行研究,结果表明制造商回收渠道下的回收率最高。此外,王忠伟等[6]就回收模式/渠道的选择、回收策略的比较和制定等方面对回收问题的研究现状进行分析综述,并提出复杂环境下多主体混合渠道的选择问题,多群体不同策略下补贴方式的判定和选择问题将是未来闭环供应链回收问题的研究重点。
以上研究大多以制造商主导的闭环供应链为背景,然而近年来,我国家电行业中,国美、苏宁等大型电器零售商在供应链中的地位不断上升,零售商主导的供应链受到国内外学者的广泛关注。王竟竟等[7]在三种不同渠道权力结构下,分析了联盟策略下闭环供应链的决策问题,发现制造商和零售商势力均衡时供应链期望收益最大。姚锋敏等[8]研究了双回收渠道下零售商主导的闭环供应链的最优决策问题,结果表明零售商回收更有利于提高系统的整体利润。王婷婷等[9]运用纳什均衡博弈的方法,分别构建了四种供应链形态下的逆向物流产品回收决策模型,发现零售商主导时可实现供应链共同利润最大化。Giri等[10]从集中式和分散式的角度研究制造商和第三方共同回收的闭环供应链定价和退货产品收集决策,结果表明零售商主导的分散化情形更有利于供应链获利。
上述文献并未考虑政府的因素,随着供应链回收模式研究的深入,部分学者开始考虑政府对渠道成员回收的引导作用。Liu等[11]通过构建双渠道回收竞争模型研究政府补贴对回收的影响,研究表明政府补贴力度越大,对回收量的刺激越弱。张汉江等[12]发现政府补贴政策降低废旧品处理成本的同时还能有效提高再制造品竞争优势。孙浩等[13]通过建立制造商回收模式下的多期闭环供应链网络均衡模型,发现政府实施补贴机制有助于促进渠道成员合作进而改善网络绩效。除了上述考虑政府补贴的研究外,为提高政府参与的有效性,有关政府奖惩机制的研究也愈加深入。石纯来等[14]进一步研究了规模不经济情形下,政府奖惩机制对制造商合作策略的影响,发现制造商合作动机大小与政府的奖惩力度相关,合作行为能增加回收量。王文宾等[15]从回收责任分担的角度建立了四个博弈模型,研究了零售商主导的闭环供应链中政府对不同主体实施奖惩机制对回收率的影响,但其研究侧重于静态博弈,并未考虑回收率的动态特征。马德青等[16,17]利用伊藤过程来刻画回收率的随机演进过程,构建微分博弈模型研究具公平行为的供应链成员动态均衡决策问题,鲁馨蔓等[18]考虑时间因素对产品技术先进度的影响,研究云服务供应链技术创新和产品的动态定价问题。但利用微分博弈理论研究政府奖惩对闭环供应链成员策略影响的成果较少。
综上所述,学者们的研究主要集中于回收渠道的选择和策略的制定对于渠道成员绩效的影响以及政府奖惩对降低回收成本和提高回收率的作用,取得了一定的成果。然而大部分研究均是从静态角度进行分析,但回收行为具有一定的外部经济性,动态研究更能描述供应链成员的持续博弈和均衡策略。因此,本文在已有研究成果的基础上,以零售商主导的闭环供应链为背景,考虑了时间因素对回收率的影响,引入动态回收过程和HJB阶段控制,分别构建了政府对不同主体实施奖惩机制的三种微分博弈模型,并对三种模式下系统达到稳定状态和未达到稳定状态时的决策均衡解进行了比较分析,使研究更具实际意义。
1 模型描述与假设
1.1 模型符号说明
本文研究零售商主导、制造商回收的闭环供应链中成员的动态均衡策略。假设新品和再制品同质,消费者购买两种产品的价格无差别[19]。制造商负责新产品的制造和废弃电器电子产品的回收再制造,并以同一批发价格w(t)批发给零售商,零售商以同一零售价格p(t)销售给消费者。两者均为风险中性的理性决策者,均以计划期内的利润最大化为决策目标,采取Stackelberg微分博弈。政府分别对供应链不同成员实施奖惩机制,并设置奖惩力度b和目标回收率τ0,当实际回收率τ>τ0时,政府对相应成员进行奖励,反之则进行惩罚。假设单位再制品仅由单位回收产品制造而成。为了激励再制造商进行回收,还需满足废弃电器电子产品的残值Δ大于制造商回收努力投入成本。符号及其含义见表1。
表1 模型符号及其含义
1.2 回收的动力学模型
本文在已有研究的基础上细化了对回收率的描述,认为回收率不仅受到制造商自身回收努力的影响,还受到市场竞争、回收设施老化等各种不可控因素的影响,因此回收率的变化本质上是一种动态随机过程,参考马德青[16,17]对回收过程内在动态特性的刻画,本文认为回收努力对回收率有正向影响,不可控因素对回收率有负向影响,回收率的演化规律可表述如下:
(1)
假设制造商回收投入成本函数为kA2(t)/2(k>0),零售商除批发产品外不产生其他成本,则制造商和零售商的利润可分别表述如下:
πM(t)=(w(t)-(cn+Δτ(t))·
(2)
πR(t)=(p(t)-w(t))(a-βp(t)+ητ(t))
(3)
其中,w(t)-cn和Δτ(t)分别表示正向和逆向供应链为制造商带来的边际利润;a-βp(t)+ητ(t)表示市场需求;p(t)-w(t)表示正向供应链为零售商带来的边际利润。
2 随机微分博弈模型的建立
本文从回收责任分担的角度引入政府奖惩力度,分别构建了三种奖惩机制模式:即政府不对制造商和零售商实施奖惩机制(模式N)、政府只对制造商实施奖惩机制(模式M)以及政府同时对制造商和零售商实施奖惩机制(模式C)。
2.1 政府不对制造商和零售商实施奖惩机制
为了保证模型的完整性和可参考性,本节不考虑政府奖惩机制对闭环供应链的影响,作为基准模型与其他模型进行对比。模式N下,以零售商主导的闭环供应链系统均衡决策的Stackelberg微分博弈模型表述如下:
(4)
命题1模式N下,制造商最优批发价格、最优回收努力投入、零售商最优零售价格、制造商和零售商最优利润以及系统回收率分别为:
wN(τN)=((η-3Δβ)τN(t)+a+3βcn)/4β
(5)
AN(τN)=(2f1τN(t)+f2)ρ/k
(6)
pN(τN)=((3η-Δβ)τN(t)+3a+βcn)/4β
(7)
(8)
(9)
(10)
由命题1可知,模式N下制造商和零售商的最优利润都与τN正相关,这表明提高回收率同时有助于两者获利。模式N下制造商的最优回收努力投入与τN正相关,这是因为回收率的提高有利于制造商获利,进而促使制造商付出更多的回收努力投入。当时间趋于无穷时,回收率趋于一个稳态值,所以制造商回收努力投入并非越多越好,有必要引入政府奖惩机制对供应链成员进行引导。
2.2 政府只对制造商实施奖惩机制
从我国实施生产者延伸责任制的影响中可以看出,制造商在回收过程中起着至关重要的作用,存在政府只对制造商进行引导的情形。假设制造商得到政府的奖励(惩罚)为b|τ-τ0|[20],闭环供应链的Stackelberg微分博弈模型表述如下:
(11)
命题2模式M下,制造商最优批发价格、最优回收努力投入、零售商最优零售价格、制造商和零售商最优利润以及系统回收率分别为:
wM(τM)=((η-3Δβ)τM(t)+a+3βcn)/4β
(12)
AM(τM)=(2s1τM(t)+s2)ρ/k
(13)
pM(τM)=((3η-Δβ)τM(t)+3a+βcn)/4β
(14)
(15)
(16)
(17)
由命题2可知,模式M下制造商和零售商的最优利润都与τN正相关。这表明该模式下回收率的提升可同时给两者带来更高的利润。模式M下制造商的最优回收努力投入和稳态回收率都与b正相关。这表明随着政府奖惩力度的增大,制造商会投入更高的回收努力,进而提高回收率和环保效益。因此,模式M能够进一步挖掘废弃电器电子产品的残值,减少对环境的破坏。
2.3 政府同时对制造商和零售商实施奖惩机制
随着管理决策权力逐渐由制造商向零售商转移,零售商成为供应链的主导者,其在销售过程中环保观念的渗透有助于提高回收率,而回收行为又间接作用于零售商,所以制造商和零售商同时承担回收责任具有一定的合理性。模式C下,假设零售商承担的奖励(惩罚)为ub|τ-τ0|,则制造商承担的奖励(惩罚)为(1-u)b|τ-τ0|,闭环供应链的Stackelberg微分博弈模型表述如下:
(18)
命题3模式C下,制造商最优批发价格、最优回收努力投入、零售商最优零售价格、制造商和零售商最优利润以及系统回收率分别为:
wC(τC)=((η-3Δβ)τC(t)+a+3βcn)/4β
(19)
AC(τC)=(2x1τC(t)+x2)ρ/k
(20)
pC(τC)=((3η-Δβ)τC(t)+3a+βcn)/4β
(21)
(22)
(23)
(24)
由命题3可知,模式C下制造商和零售商的最优利润都与τN正相关,结合命题1和2可知,三种模式下回收率的提升都可以同时为两者带来更高的利润,因此,积极开展回收活动增强消费者环保意识以提高回收率对供应链双方成员都有利。模式C下制造商的最优回收努力投入和回收率都与b正相关。结合命题2可知,政府只要对制造商实施奖惩机制,就能激励制造商投入更高的回收努力,进而提高回收率,但两种模式下奖惩机制的促进效果不同,具体分析见第3节。结合命题1~3可知,最优批发价格和最优零售价格与τN的关系取决于废弃电器电子产品再制造所带来的利润残值,具体分析见第3节。
3 模型比较与分析
推论1表明,模式M下回收率最大,模式C次之,模式N下最小。说明政府对供应链成员实施奖惩机制有利于提高回收率,但在模式M和模式C下,奖惩力度对回收率的影响程度不同,这是因为制造商直接参与回收再制造过程,相比于双方共同承担回收责任,制造商单独承担更容易提高回收率。
推论2表明,模式M下制造商回收努力投入最大,模式C次之,模式N下最小。结合推论1,模式M和模式C之所以能提高回收率,是因为政府对供应链成员实施奖惩机制可以促使制造商投入更多的回收努力,但奖惩力度对制造商回收努力投入的影响程度不同,这说明虽然零售商是闭环供应链的领导者,但其并没有直接参与回收再制造的过程,所以当两者同时承担回收责任时,削减了政府只对制造商实施奖惩机制的激励作用,因此导致模式M下稳态回收率和制造商回收努力投入都高于模式C下的对应值。
推论3表明,废弃电器电子产品的残值对批发价格和零售价格都有重要影响。同一种模式,随着残值的增加,零售价格和批发价格都先增加后减小,且零售价格的变化趋势缓于批发价格,即零售价格减去批发价格的差值都增加。这表明残值越大,消费者剩余价值越大,越有助于降低双重边际效应。
推论4表明,当消费者对产品的边际支付意愿一定时,模式M下消费者剩余价值最大、模式C次之、模式N下最小。这说明模式M能够最大程度的减缓分散决策给闭环供应链带来的双重边际效应。相较于模式N,模式C也有助于减缓双重边际效应,进而从消费者剩余角度证明了政府实施奖惩机制的重要性。
推论5模式N、M和C下的制造商最优利润稳态值比较:
由于零售商最优利润的比较过于繁琐,因此在第4节算例分析中进行说明。
4 算例分析
本节通过算例对闭环供应链成员均衡策略进行了稳态和非稳态分析。稳态分析研究当系统达到稳定状态时,政府奖惩力度对系统回收率、制造商和零售商稳态策略以及最优利润的影响。非稳态分析研究当政府奖惩力度一定时,系统回收率和供应链成员均衡策略在不同模式下随时间变化的对比情况。
4.1 稳态分析
为了分析政府奖惩机制实施主体不同对系统回收率、成员稳态策略和最优利润的影响,参数赋值如下:ɑ=1,β=0.5,η=0.01,r=0.05,Δ=0.3,ρ=1,k=1,σ=0.3,cn=0.5,τ0=0.4,μ=0.4,为了保证各稳态策略值有意义,分别计算政府奖惩力度b=0,0.1,0.2,0.3下三种模式的策略,结果如表2所示。
表2 政府奖惩力度敏感性分析
表2将模式N作为基准模式与其他模式进行对比,分析结果如下:(1)就稳态回收率而言,模式N下稳态回收率始终低于目标回收率,不利于制造商和零售商获利,证实了政府实施奖惩机制的重要性。随着政府奖惩力度的增大,模式M和模式C都有助于提高系统回收率,但相比模式C,模式M更有利于提高系统回收率。结合两种模式下制造商的回收努力投入变化情况可知,制造商单独承担回收责任有助于直接激励制造商投入更高的回收努力进而提高系统回收率,进一步证实了推论1和2。(2)就成员定价策略而言,随着政府奖惩力度的增加,模式M和模式C都能降低批发价格和零售价格。相比于模式C,模式M下批发价格和零售价格降低更为明显,两者的差值增加的也更明显,假设消费者对产品的边际支付意愿为定值,则政府只对制造商实施奖惩机制时,消费者剩余价值更高,更能缓解闭环供应链中的双重边际效应,进一步证实了推论3和4。
图1~图3分析了当时间趋于无穷即闭环供应链系统达到稳定状态时,三种不同奖惩模式下政府奖惩力度b对闭环供应链成员获利水平的影响。
图1~图3表明,(1)随着b的增大,模式M和模式C下,制造商的最优利润都是先减小后增大的,进一步证实了推论5,但其数值变动过于微小,因此不予考虑。整体变化主体趋势是增大,且模式M下制造商最优利润的增长速度快于模式C,两种模式下制造商的最优利润都大于模式N下对应值。因此,就制造商利润的整体变化趋势而言,模式M最有利于提高制造商的获利水平。(2)随着b的增大,模式M和模式C下零售商的最优利润持续增加,相比于模式N,模式M和模式C都有助于提高零售商的获利水平。且在政府奖惩力度的合理区间(0~0.3)内,模式M下零售商的最优利润大于模式C下的对应值,由此可见,当零售商分担回收责任时,会降低自身利润。(3)随着b的增大,模式M和模式C下供应链的最优总利润持续增加,且模式M下供应链总利润更大。结合图1和图2可知,当零售商分担回收责任时,不仅不利于自身获利,还会降低制造商的获利水平,进而降低整个供应链的总利润。
4.2 非稳态分析
为了突出时间特性,本文在给定政府奖惩力度为0.05时,分别绘制了三种奖惩模式下系统回收率随时间变化特性(图4)、制造商回收努力投入随时间变化特性(图5)、闭环供应链成员价格随时间变化特性(图6、图7)以及闭环供应链成员最优利润随时间变化特性(图8~图10),分析结果如下。
图4和图5表明,随着时间的推移,三种模式下回收率和制造商的回收努力投入均趋于各自的稳态值。相较于其他模式,模式N下回收率低于目标回收率且制造商回收努力投入最低。结合上节稳态分析可知,模式M下,无论是否达到稳态,回收率和制造商回收努力投入都始终高于其他模式。因此,政府可适当加大对制造商的奖惩力度以激励制造商积极回收。三种模式下的回收努力投入均无明显变化,这是因为回收率具有饱和效应,过高的回收努力投入并不能带来同等程度的回收率的提升。
图6和图7表明,模式N下批发价格和零售价格都会随着时间的推移而增加,模式M和模式C则恰好相反,且批发价格随时间变化的敏感度更大,这说明模式M可有效降低制造商的批发价格,零售商得到让利后也会相应降低零售价格,由此降低闭环供应链的双重边际效应以提高消费者剩余,进而使消费者增强回收意识,促使回收率的进一步提高以形成良性循环。
图8~图10表明,政府奖惩力度一定时,模式N下制造商利润、零售商利润以及闭环供应链总利润随着时间的推移都有轻微下降的趋势,这说明政府参与下的闭环供应链运营才更加有效。模式M和模式C都会提高制造商利润、零售商利润以及闭环供应链总利润,但相比于模式C,模式M对成员利润的提升作用更为明显。结合上节的稳态分析可知,模式M下,无论闭环供应链系统是否达到稳态,制造商、零售商以及闭环供应链总利润都始终高于其他模式,且在零售商主导的闭环供应链中,零售商的获利水平都高于制造商的获利水平。
5 结论
本文考虑了政府奖惩机制,研究了零售商主导、制造商回收的闭环供应链中成员的动态均衡策略,得出了三种模式下系统回收率、制造商回收努力投入和批发价格策略、零售商零售价格策略以及成员的最优利润,在此基础上对系统稳态和非稳态时的均衡解进行了比较分析,并揭示了回收责任分担主体的不同对供应链成员策略和利润的影响,得出了以下结论和管理启示:(1)政府实施奖惩机制对供应链成员进行引导是有效的,当政府实施奖惩机制时,有利于提高消费者剩余价值,提高制造商、零售商以及供应链整体的利润水平,且系统回收率高于目标回收率,因此,政府有必要对供应链成员进行奖惩以引导其作出最优决策。(2)政府只对制造商实施奖惩机制可实现最低的批发价格和零售价格,最大程度的降低因分散决策给闭环供应链带来的双重边际效应,有利于激励制造商投入更多的回收努力。长期看来,这种模式下系统回收率和闭环供应链总利润都是最高的。由此可见,该模式是最优选择,可以同时提高经济和环保双重效益。(3)当政府同时对制造商和零售商实施奖惩机制时,零售商分担回收责任的同时,也削减了政府对制造商回收的激励作用,导致系统回收率高于无奖惩机制时的回收率但低于政府只对制造商实施奖惩机制时的回收率,虽然这种模式不是最经济有效的,但是也能减缓双重边际效应,让利于消费者。(4)在同一种模式下,制造商回收努力投入随时间推移变化都不明显,说明回收努力投入应适量且持续,过高的投入并不能带来同等程度的回收率的提升,制造商需要合理分配资源,避免出现过高的回收努力投入所带来的非经济效应。
本文研究了信息对称时三种模式下政府奖惩机制对单一制造商和零售商组成的闭环供应链成员策略以及利润的影响,但现实中一条供应链由多个制造商和多个零售商构成且存在信息不对称的情况。因此,考虑多个制造商和零售商竞争情形以及信息的非对称性将是下一步的研究方向。