零售商回收与制造商处理过期食品模式下三方演化博弈

2019-03-11刘大维

商业研究 2019年2期

刘大维,费威，尹涛

(1.北京大学光华管理学院，北京 100871；2.东北财经大学经济学院，辽宁大连 116025)

内容提要：针对零售商回收与制造商处理过期食品模式，本文构建零售商、制造商与政府部门的三方演化博弈模型，得到不同参数取值条件下的稳定均衡策略组合，并利用数值仿真直观分析了三方博弈的不同稳定点。主要结论表明：零售商、制造商与政府部门相关过期食品回收处理和监管的“成本”和“收益”比较而导致零售商和政府部门四种不同的演化稳定策略组合，即(不回收，不监管)、(不回收，监管)、(回收，不监管)与(回收，监管)，制造商和政府部门三种不同的演化稳定策略组合，即(非正规处理，不监管)、(非正规处理，监管)、与(正规处理，监管)。据此，应增加零售商与制造商正规回收处理过期食品的综合收益等“机会收益”，减少其正规回收处理过期食品的各类“机会成本”，政府部门还需重视过期食品等废弃食品正规回收处理的管控，将其作为考核政府部门食品安全监管工作的主要内容之一。

一、引言

我国过期食品回收处理问题突出，如何有效回收处理过期食品，保障食品安全与促进资源充分利用、减少环境污染是亟待解决的难题。日本自2001年起就实施了“食品资源循环利用法”，2013年欧洲产业联盟也发起了一项名为“废弃食物二次利用”的活动。相对发达国家来说，食品逆向物流及其回收利用并未引起我国的广泛重视，大多数食品企业的逆向物流意识淡薄，只有极少数的食品企业有自己的产品回收体系。

关于食品废弃物的妥善处理和回收利用，李朝伟和陈青川(2000)[1]通过总结国外食品回收管理模式和经验，结合我国实际建立一套科学完善的管理体制[2-4]。对于一般废弃产品的回收处理问题，部分学者从循环经济角度分析提出建立利益机制，以实现生产者承担废弃产品的回收和循环利用责任，通过提高原生资源价格、给予负责废弃产品回收利用的生产者经济补贴或优惠措施等对策，更好地促进废弃产品有效回收[5-6]；研究认为生产者承担废弃产品的回收和循环利用责任能够弥补消费后产品在废弃回收处理阶段责任主体的空缺[7]。针对我国过期食品的处置方式，沈一平(2015)[8]研究发现过期食品多数是由第三方上门回收，回收隐蔽性高、安全性弱、处置不当、处理费用高，回收使用缺乏监管。食品经营者往往将临保食品、过期食品退给供应商，极大增加了食品安全风险，并且我国对过期食品安全标准认定缺乏依据，导致一些过期食品重新回流至食品生产和经营环节[9]。周海荣(2018)[10]通过对深圳的过期食品监管现状分析，认为应从立法源头上解决执法难和维权难的困境。在废弃食品回收处理环节的监管问题分析中，费威(2015，2018)[11-12]针对废弃食品回收处理安全现状进行了案例阐释，利用博弈模型分析了政府对回收处理进行补贴的影响因素，并且利用优化模型分析了不同模式的废弃产品回收率等相关决策。

综上，现有研究认识到废弃食品回收处理的重要性，并利用博弈模型分析废弃食品回收的相关主体决策。然而针对某一类废弃食品回收处理过程中，考虑到主体的有限理性[13]，零售商、制造商和政府部门的多方主体博弈关系分析有待深入，这三方主体的策略行为选择至关重要。因此，本文基于演化博弈理论，分析零售商回收与制造商处理过期食品模式下的零售商、制造商与政府部门之间的三方演化博弈关系，为有效回收处理过期食品提供参考。

二、问题描述

在零售商负责回收与制造商负责处理过期食品模式下，零售商、制造商与政府部门的行为特征如下。零售商作为食品销售终端，对食品上架销售时间格外敏感。由于大量过期食品的回收处理成本相对较高，零售商通常采取降价打折或者搭售等方式处理即将过期的食品。而对于已经过期的食品，零售商会将其下架，回收后退回给制造商(或供应商)①，或者集中丢弃。因此，本文将零售商的这两类行为策略分别简记为“回收”与“不回收”。由于我国过期食品的回收处理尚未形成规范有利的产业链条以及缺乏有效的约束，过期食品的处理利润微薄，过程繁琐，投入产出不成正比，大多数食品生产企业对过期食品不进行回收处理，仅有少数食品生产企业对过期食品进行回收处理。因此，本文将制造商的行为策略分为：“正规处理”与“非正规处理”。由于过期食品回收处理的规范流程尚未确立，政府部门在监管资源有限的条件下，相应的监管成本高，监管缺位与监管漏洞多。因此，本文将政府部门的行为策略分为：“监管”与“不监管”。由此可得零售商、制造商与政府部门的三方博弈策略组合如表1所示。

表1 零售商、制造商与政府部门的三方博弈策略组合

三、演化博弈模型假设及其参数设置

考虑到三方博弈决策环境的复杂性[14]，为便于分析且不失一般性，对模型做出如下假设：

(1)假设1三方博弈的参与者——零售商、制造商和政府部门都是有限理性的，更符合现实情况。

(2)假设2过期食品被回收处理后可以产生经济效益。本文分析的是某类过期食品的回收处理，因此该类过期食品的回收处理成本、经济效益在具体食品之间是无差异的。

(3)假设3零售商采取回收或不回收过期食品行为策略。“回收”是指零售商下架过期食品，正规回收给其制造商。本文假设过期食品回收后的处理工作均由制造商负责处理。政府部门的监管是指对零售商与制造商的过期食品回收处理行为进行监管。

(4)三方主体的行为策略比例：零售商采取“回收”过期食品的概率为x，采取“不回收”的概率为1-x；制造商采取“正规处理”过期食品的概率为y，采取“非正规处理”的概率为1-y；政府部门采取“监管”的概率为z，采取不监管的概率为1-z。其中0≤x≤1，0≤y≤1，0≤z≤1。

(5)其他参数符号及含义如表2所示。

根据我国目前过期食品回收处理现状，显然有制造商正规处理过期食品的综合收益低于其非正规处理过期食品的综合收益，即R2

四、三方演化博弈模型建立及求解

由问题描述及模型假设可知，零售商、制造商与政府部门的三方博弈收益矩阵如表3所示。

表2 主要参数符号及含义

表3 零售商、制造商与政府部门三方博弈的收益矩阵

(一)零售商回收过期食品的演化博弈模型构建及策略分析

由模型假设和三方博弈收益矩阵可得零售商采取回收策略的期望收益为：

ER=z[y(-C1+R1+T1)+(1-y)(-C1+R1+T1)]+(1-z)[y(-C1+R1)+(1-y)(-C1+R1)]=-C1+R1+zT1

(1)

易见，零售商采取不回收策略的期望收益为ERN=0。因此，零售商采取回收和不回收策略的期望收益均值为：

(2)

由演化博弈理论可知零售商回收策略的复制动态方程F(x)为：

(3)

对零售商回收策略的复制动态方程F(x)求导可得：

(4)

根据式(4)进行稳定性分析如下：

综上可得结论1：

(1)当零售商回收过期食品获得的预期收益(零售商回收过期食品的综合收益加上政府监管时对其的财政补贴，再减去零售商回收成本的差额)为零时，零售商采取回收策略的概率可能是0和1之间的任何值。

(2)当零售商回收过期食品的预期收益为正时，零售商会采取回收策略。

(3)当零售商回收过期食品的净收益(零售商回收过期食品的综合收益与其回收成本的差额)为负时，零售商采取回收策略与否是由政府部门采取监管策略的概率z大小所决定的。具体而言，若政府部门监管过期食品回收处理的概率较大时，即政府部门监管力度较强，那么零售商会采取回收策略；否则政府监管力度较弱，那么零售商会采取不回收策略。

(二)制造商处理过期食品的演化博弈模型构建及策略分析

由模型假设和三方博弈收益矩阵可得制造商采取正规处理策略的期望收益为：

EM=z[x(-C3+R2+T2)+(1-x)(-C2+R2+T2)]+(1-z)[x(-C3+R2)+(1-x)(-C2+R2)]=-C2+R2+x(C2-C3)+zT2

(5)

制造商采取非正规处理策略的期望收益为：

EMN=z[x(-C3+R3-F1)+(1-x)(-C2+R3-F1)]+(1-z)[x(-C3+R3)+(1-x)(-C2+R3)]=-C2+R3+x(C2-C3)-zF1

(6)

因此，制造商采取正规处理策略和非正规处理策略的期望收益均值为：

(7)

(8)

对制造商正规处理策略的复制动态方程F(y)求导可得：

(9)

根据式(9)进行稳定性分析如下：

综上可得结论2：

(1)当制造商非正规处理过期食品获取的净收益(制造商非正规处理过期食品的综合收益减去政府部门对其的行政罚款)等于制造商正规处理过期食品获得的总收益(制造商正规处理过期食品的综合收益与其获取的政府部门财政补贴总额)时，制造商采取正规处理策略的概率可能是0和1之间的任何值。

(2)由于目前制造商正规处理过期食品获得的综合收益低于其非正规处理过期食品获取的综合收益，所以制造商采取正规处理策略与否是由政府采取监管策略的概率z大小所决定的。具体而言，若政府部门监管过期食品回收处理的概率较大时，即政府部门监管力度较强，那么制造商会采取正规处理策略；否则若政府监管力度较弱，那么制造商会采取非正规处理策略。

(三)政府部门监管过期食品回收处理的演化博弈模型构建及策略分析

由模型假设和三方博弈收益矩阵可得政府部门采取监管策略的期望收益为：

EG=y[x(-C4-T1-T2+R4)+(1-x)(-C4-T2+R4)]+(1-y)[x(-C4-T1+F1-C5)+(1-x)(-C4+F1-C5)]

=y(R4-T2-F1+C5)-xT1-C4+F1-C5

(10)

政府部门采取不监管策略的期望收益为：

EGN=y[x·0+(1-x)·0]+(1-y)[x(-C5)+(1-x)(-C5)]=-(1-y)C5

(11)

因此，政府部门采取监管和不监管策略的期望收益均值为：

(12)

由演化博弈理论可知政府部门监管策略的复制动态方程F(z)为：

(13)

对政府部门监管策略的复制动态方程F(z)求导可得

(14)

根据式(14)进行稳定性分析如下：

综上可得结论3：

(1)当政府部门监管的期望成本等于政府部门监管的期望收益时，政府部门采取监管策略的概率可能是0和1之间的任何值。

(2)当政府部门监管过期食品回收处理获得的综合收益减去其对制造商正规处理过期食品的补贴净额低于其所获得的行政罚款时，政府部门会采取不监管策略。

(3)当政府部门监管过期食品回收处理获得的综合收益减去其对制造商正规处理过期食品的补贴净额高于其所获得的行政罚款时，政府部门采取监管策略与否是由制造商采取正规处理策略的概率y大小所决定的。具体而言，若制造商正规处理过期食品的概率较大时，那么政府部门会采取不监管策略；否则若制造商正规处理过期食品的概率较小，那么政府部门会采取监管策略。

(四)三方演化博弈模型稳定性均衡分析

零售商、制造商与政府部门的三方复制动态方程为

(15)

由单一主体的复制动态方程分析可见，零售商的策略选择只与政府部门的策略变化有关，制造商的策略选择只与政府部门的策略变化有关，而政府部门的策略选择与零售商和制造商两方的策略变化都相关。因此，本文运用分步分析法分别对零售商和政府部门、制造商和政府部门进行分析。当对零售商和政府部门进行演化稳定策略分析时，将制造商的策略y视为常量；当对制造商和政府部门进行演化稳定策略分析时，将零售商的策略x视为常量。

1.零售商和政府部门的稳定均衡分析

J1的行列式和迹分别为：

DetJ1=(1-2x)(-C1+R1+zT1)(1-2z)(-yT2-xT1-C4+F1-yF1+yR4)-xT1(1-x)zT1(z-1)

(16)

TrJ1=(1-2x)(-C1+R1+zT1)+(1-2z)(-yT2-xT1-C4+F1-yF1+yR4)

(17)

由雅克比矩阵J的局部稳定性可知：将均衡点代入矩阵使其同时满足DetJ>0以及TrJ<0两个条件时，该均衡点为演化稳定策略均衡点。因此，将5个均衡点代入J1的行列式和迹，并对上述5个均衡点进行稳定性分析，结果如表4所示。

表4 零售商和政府部门演化博弈稳定性结果分析

由上述分析可得结论4：

(1)当R1(1-y)F1+yR4时，即当零售商回收过期食品的综合收益低于其回收成本，并且政府部门不含对零售商补贴支出的监管机会成本(即政府部门监管成本与支付给制造商正规处理过期食品期望补贴的总额)高于其监管的期望收益(即制造商非正规回收处理过期食品的期望行政罚款与制造商正规处理过期食品下政府部门监管综合收益的总额)时，零售商和政府部门的演化稳定策略点为(0,0)，即两者的演化稳定策略组合为(不回收，不监管)。

(2)当R1+T1

(3)当R1>C1，C4+yT2>(1-y)F1+yR4时，即当零售商回收过期食品的综合收益高于其回收成本，并且政府部门不含对零售商补贴支出的监管机会成本高于其监管的期望收益时，零售商和政府部门的演化稳定策略点为(1,0)，即两者的演化稳定策略组合为(回收，不监管)。

(4)当R1+T1>C1，C4+yT2<(1-y)F1+yR4时，即当零售商回收过期食品获得的机会收益高于其回收成本，并且政府部门不含对零售商补贴支出的监管机会成本低于其监管的期望收益时，零售商和政府部门的演化稳定策略点为(1,1)，即两者的演化稳定策略组合为(回收，监管)。

2.制造商和政府部门的稳定均衡分析

J2的行列式和迹分别为：

DetJ2=(1-2y)(R2-R3+zT2+zF1)(1-2z)(-yT2-xT1-C4+F1-yF1+yR4)-y(1-y)(T2+F1)z(1-z)(-T2-F1+R4)

(18)

TrJ2=(1-2y)(R2-R3+zT2+zF1)+(1-2z)(-yT2-xT1-C4+F1-yF1+yR4)

(19)

由雅克比矩阵J的局部稳定性可知，将5个均衡点代入上述J2的行列式和迹，并对5个均衡点进行稳定性分析，结果如表5所示。

表5 制造商和政府部门演化博弈稳定性结果分析

由上述分析可得结论5：

(1)当R2

(2)当R2+T2C4+xT1时，即当制造商正规处理过期食品所获得的机会收益(即制造商正规处理过期食品获得的综合收益及其获得的政府财政补贴的总额)低于其非正规处理过期食品的净收益(即制造商非正规处理过期食品所获收益减去相应的行政罚款)，并且政府部门对制造商非正规处理过期食品的行政罚款高于政府部门不含对制造商补贴支出的监管机会成本时，制造商和政府部门的演化稳定策略点为(0,1)，即两者的演化稳定策略组合为(非正规处理，监管)。

(3)当R2+T2>R3-F1，R4>C4+xT1+T2时，即当制造商正规处理过期食品所获得的机会收益高于其非正规处理过期食品的净收益，并且政府部门监管获得的综合收益高于政府部门监管的部分机会成本(即政府部门监管成本与对零售商回收过期食品的期望补贴、对制造商正规处理过期食品的补贴总额)时，制造商和政府部门的演化稳定策略点为(1,1)，即两者的演化稳定策略组合为(正规处理，监管)。

3.三方博弈的数值仿真

通过对零售商、制造商与政府部门的三方博弈稳定性分析，根据演化博弈参数条件及其在均衡点取值条件可得如表6。

表6 零售商、制造商与政府部门的三方演化博弈稳定点参数条件

图1至图6是依据三方演化博弈的不同稳定点参数取值条件范围及其变化所得的数值仿真结果。由于零售商、制造商与政府部门的相关回收处理、监管过期食品的成本和收益取值条件不同，导致下列不同的稳定点结果。在不同稳定点情况下，无论零售商、制造商和政府部门的初始策略选择倾向于不回收、非正规处理和不监管，还是倾向于回收、正规处理和监管，都会在三方主体的相关过期食品回收处理、监管的不同成本和收益条件下而最终趋向于相应的稳定点。不同的是趋向于最终稳定点的速率和趋势有一定差别。

图1 不同初始值下稳定点(0,0,0)的演化仿真结果

由图1可见：随着时间推移，零售商、制造商和政府部门最终会分别逐渐趋向于采取不回收、非正规处理和不监管的均衡策略组合。

图2 不同初始值下稳定点(1,0,0)的演化仿真结果

由图2可见：随着时间推移，零售商、制造商和政府部门最终会分别逐渐趋向于采取回收、非正规处理和不监管的均衡策略组合。

图3 不同初始值下稳定点(0,0,1)的演化仿真结果

图4 不同初始值下稳定点(1,0,1)的演化仿真结果

由图3可见：随着时间推移，零售商、制造商和政府部门最终会分别逐渐趋向于采取不回收、非正规处理和监管的均衡策略组合。

由图4可见：随着时间推移，零售商会在短期内趋向于采取回收策略，政府部门也会在较短时期内趋向于采取监管策略，而制造商会以更快速度趋向于采取非正规处理策略。

图5 不同初始值下稳定点(0,1,1)的演化仿真结果

图6 不同初始值下稳定点(1,1,1)的演化仿真结果

由图5可见：随着时间推移，零售商会在短期内趋向于采取不回收策略，而制造商会在短期内趋向于采取正规处理策略，政府部门会逐渐趋向于采取监管策略。

由图6可见：随着时间推移，零售商和制造商都会在短期内趋向于分别采取回收和正规处理策略，政府部门会逐渐趋向于采取监管策略。

五、结论与启示

本文针对零售商回收与制造商处理过期食品的模式，构建了零售商、制造商与政府部门的三方演化博弈模型，分析在过期食品回收处理中的策略选择及利益关系，得到不同参数取值条件下的稳定均衡策略组合，利用数值仿真对三方博弈的不同稳定点进行了直观分析，得到以下主要结论：零售商、制造商与政府部门相关过期食品回收处理和监管的“成本”和“收益”比较，导致零售商和政府部门四种不同的演化稳定策略组合，即(不回收，不监管)、(不回收，监管)、(回收，不监管)与(回收，监管)；制造商和政府部门三种不同的演化稳定策略组合，即(非正规处理，不监管)、(非正规处理，监管)、与(正规处理，监管)。

根据上述结论，为促使零售商、制造商与政府部门选择(回收，正规处理，监管)的演化稳定策略组合，政府规制可以从以下方面入手。

1.对于零售商和制造商而言，增加其正规回收处理过期食品的综合收益等“机会收益”，减少其正规回收处理过期食品的各类“机会成本”，才能促进他们采取积极的正规回收处理行为。

(1)加强对回收过期食品的严格监控，要求零售商严格履行过期食品回收流程的备案登记制度，可以借助于零售商电子登记系统记录食品的购销台账信息，从而把控过期食品回收日期和流向等具体信息。定期公开公示严格履行过期食品回收制度的零售商信息，增强此类零售商的社会声誉。

(2)针对零售商回收过期食品环节，政府部门可以对我国食品的各类日期进行完善规范，在此基础上零售商可以效仿国外零售商的做法，提高食品消费利用率，尽可能减少过期食品数量。

(3)在过期食品等废弃食品有效回收处理再利用下游产业链尚未完善成熟时，政府部门除了通过严格监管处罚威慑零售商和制造商的相关回收处理行为，还可以通过给予认真履行回收处理过期食品制度的零售商和制造商税收优惠和财政补贴等扶持政策，鼓励零售商和制造商积极采取正规回收处理行为，同时还能通过此类方式向社会公众传递零售商和制造商的正规回收处理示范效应。

(4)政府部门还可以通过自建或者委托第三方回收处理机构，为零售商和制造商提供过期食品等废弃食品的回收处理服务，结合政府补贴、零售商和制造商支付相应费用等多种方式，为过期食品的正规回收处理提供多种便利途径，避免因回收处理过期食品成本过高或者设备条件不足等导致零售商和制造商的“机会主义行为”。

(5)加大对过期食品等废弃食品有效回收处理再利用的产业链条建设，从而通过经济利益正向引导零售商和制造商对过期食品的正规回收处理，避免因过期食品回收处理再利用不畅导致零售商或者制造商的非正规回收处理甚至非法处置行为。

(6)零售商与制造商回收处理行为之间的有效协调也是过期食品有效回收处理的必要保障。因此，政府部门对零售商与制造商相关回收处理行为的监管更要注重全过程监控，仅对单一环节的监管无法保障过期食品回收处理的安全有效性。各级政府部门可以通过对过期食品回收处理全程信息的追踪和监控，要求信息记录的完整性和可追溯性，以确保零售商和制造商在过期食品回收处理过程中的权责明晰和无空白漏洞。

2.对于政府部门而言，通过食品安全和食品资源节约利用等多方面宣传，增强社会大众对过期食品正规回收处理的相关知识了解，一方面有利于提升正规回收处理过期食品零售商和制造商主体的社会认可度，增强他们的社会声誉效应，另一方面有利于各级政府部门借助社会力量开展对过期食品回收处理的监管工作，同时提升政府部门公信力。此外，各级政府部门在开展食品安全监管的同时，要重视过期食品等废弃食品正规回收处理的管控，将其作为考核政府部门食品安全监管工作的主要内容之一。