新媒体参与下食品电子商务平台动态奖惩机制分析

2023-12-14李佩芸郭思培

华中师范大学学报（自然科学版） 2023年6期

李佩芸, 郭思培, 张鑫

(华中师范大学数学与统计学学院, 武汉 430072)

随着互联网的产生及发展,淘宝、美团、饿了么等一些电子商务交易平台逐渐占据大多数人的日常生活,食品行业开展电子商务交易是大势所趋.近年来,国内不少企业积极投身于食品行业交易电子化的发展中,特别在新冠肺炎疫情期间,根据中国饭店协会和饿了么联合发布的《2020-2021年中国外卖行业发展研究报告》显示,食品电商外卖行业的中国品牌迅速崛起,人们对这行业的需求量日渐增大,同时食品电商的发展也为疫情防控贡献了一份力量.但食品电商行业也出现了一些问题,比如食品的安全质量、平台和政府监管效率低下、消费者投诉等问题.据统计,2017年至2020年上半年,全国各级人民法院一审新收网络购物合同纠纷案件共计4.9万件,其中,食品类纠纷在网络购物合同纠纷案件中占比接近半数,为45.65%.这些问题的存在影响了消费者的食品安全信心,也影响了食品行业的健康发展.国家和政府部门更加重视食品安全工作,党的十九大报告明确提出“实施食品安全战略,让人民吃得放心”;习近平总书记强调,要把食品安全作为一项重大的政治任务来抓,坚持人民至上、生命至上,把保护人民生命安全摆在首位,要求提高食品药品等关系人民健康产品和服务的安全保障水平.食品电商行业的有序健康发展成为当今研究的热点问题.

目前国内外关于食品电子商务发展的研究逐渐增多,主要集中在食品电子商务平台的构建、发展现状以及安全监管方面的研究.一些学者基于复杂网络检测算法[1]、协同过滤推荐算法[2]等研究如何构建食品电商平台.随着我国食品电商平台技术迅速发展,有学者通过大数据分析食品电子商务面临的困境及成因,提出食品电子商务交易的合理方案[3].但由于平台作为市场中有限理性的经济主体[4],为了追求利益的最大化,在食品安全监管上会存在一定的监管漏洞,所以许多学者基于演化博弈理论来研究电商平台如何参与食品安全监管.而演化博弈理论是随着1973年Maynard和Price[5]提出的演化稳定均衡点的概念而产生的,可以用来分析博弈主体的平衡点及其稳定性.如文献[6]从食品供应链的发展模式来研究平台与食品制造商的演化博弈策略均衡;文献[7]采用演化博弈论方法构建政府和食品企业的博弈模型,对食品安全生产中相关者的策略选择进行分析;文献[8]通过构建平台、商家、消费者三方博弈模型与数值仿真结合来揭示不同监管制度对策略选择的影响.与此同时,随着当今社会新媒体的迅速崛起,信息共享和信息传递的速度加快,新媒体可以及时对信息进行反馈与揭露,在食品安全监管和平台监管问题上发挥着重要的作用.因此,有学者将新媒体作为第三方监管来研究,主要探究政府监管机构与食品企业[9]、食品供应链中的食品供应商和零售商[10]、电商平台和入驻商户[11]以及政府监管部门、食品生产企业和消费者三方[12]这些不同参与方的策略行为选择受到新媒体报道真实性准确率和影响力两大因素的影响.除此之外,还有部分学者致力于将演化博弈模型结合机制设计来研究如何提高食品电商平台的监管质量.如文献[13]通过结合消费者反馈机制的三方演化博弈模型,探讨如何提高食品电商平台的信息监管质量;文献[14]结合政府惩罚机制分析平台与外卖商家的演化动态的行为监管;文献[15]通过建立平台和政府的信息共享机制,研究平台不同监管力度下政府和商家策略的动态变化规律,充分发挥平台监管的作用;文献[16]引进静态和三种动态奖惩机制来分析演化博弈均衡;文献[17]主要探究固定惩罚机制和动态惩罚机制下策略的演化均衡.

以上文献鲜有学者结合新媒体参与的角度,分析食品电商行业平台的动态奖惩机制.因此本文基于食品供应商和电商平台有限理性的特性,运用演化博弈方法研究在新媒体参与下引入平台的四种静动态奖惩机制如何影响供应商的决策选择,并且通过运用Matlab工具对引入四种不同奖惩机制下平台和供应商的演化策略进行数值模拟仿真分析,对这四种不同奖惩机制的监管效率进行了比较,再进一步分析在静态奖惩机制下引入新媒体参与监督的演化稳定结果,从而得到平台更好的监管机制设计,对平台如何促进食品产业的健康有序发展提出了有效建议.

1 静态奖惩机制下食品供应商与电商平台的演化博弈模型

1.1 问题描述与模型假设

由于网络具有虚拟性和隐蔽性,信息不对称存在于电子商务平台进行交易食品时,供应商提供的食品的安全品质和真实信用状况难以判断.但是在优胜劣汰的市场中,平台电商和供应商在一些机制设计的引导下会采取适应性的学习行为,符合有限理性的群体行为特征.因此,本文基于演化博弈的方法分析在平台的静态奖惩机制下,电商平台和供应商之间的利益冲突和最优选择,提出以下假设.

1) 电子商务食品质量安全博弈过程的主要参与方为食品供应商和电子商务交易平台,假设博弈双方都是有限理性的.食品供应商有两种策略为:提供合格食品和提供不合格食品两种策略.而供应商提供不合格食品的行为将会影响食品流通市场中人民的健康安全和市场秩序.电子商务平台对食品供应商行使监管的职责,也有两种策略为:严格监管和宽松监管.

2) 假设食品供应商选择提供合格食品的概率为x(0≤x≤1),则提供不合格食品的概率为1-x;假设食品电商平台选择严格监管的概率为y(0≤y≤1),则选择宽松监管的概率为1-y.

3) 假设食品供应商通过电商平台销售食品获得的收益为H1,食品供应商提供合格食品时需要消耗的成本为C1,但是由于利益的驱使,供应商为了获得额外收入ΔH会选择提供不合格食品;假设食品电商平台参与监管的收益为L1,电商平台严格监管时由于大量的人力以及物力技术资源需要消耗的成本为C2,食品电商平台选择宽松监管时会节约监管成本,因此C2=0.

4) 假设提供不合格食品供应商的投机行为被平台严格监管发现时,将会面临被平台记录诚信档案,平台可能会通过对信誉差或者无证经营的供应商适当提高准入金或者下次不予准入等措施来处罚供应商的违法行为,此时供应商受到平台的处罚为F(F>0),其中F作为平台严格监管奖励给予平台;假设供应商提供合格食品,在平台的严格监管下,平台会给予供应商一定的优惠补贴T(0

5) 假设供应商的机会主义行为损害了消费者的利益,消费者会选择向平台投诉,但是如果消费者的举报行为得不到监管平台的反馈,则消费者会选择通过新媒体对食品质量问题进行曝光,从而维护自身的权益.假设新媒体的影响力为α(α>1),由于新媒体的报道有时会因消费者的举报信息有误或者为了吸引自身流量关注度出现报道失真现象,因此假设新媒体报道信息的准确率为β(0≤β≤1),假设新媒体报道会造成食品供应商经营利润的有形损失以及造成食品供应商名誉、口碑的无形损失为v1,造成平台的口碑损失为v2.

6)假设供应商提供合格食品,而新媒体报道失真,此时供应商受到媒体报道失真的影响造成的损失为(1-β)αv1,同时,平台也会受不实信息影响而使得消费者降低消费意愿,此时造成的损失为(1-β)αv2.当供应商提供不合格食品,新媒体正确报道时,供应商受到的损失为βαv1,平台的损失为βαv2.

根据上述假设,可以得到表1的得益矩阵情况.

1.2 供应商的复制动态方程

复制动态方程[4]一般是用来反映参与人学习速度和方向的,主要取决于博弈参与方之间策略占比概率和该策略得益与博弈参与方的平均得益之差.博弈参与方采取不同博弈策略时收益有所不同,收益低的参与方会在博弈过程中不断调整自身策略,学习并模仿收益高的参与方,这是复制动态方程的核心思想,反映系统向着稳定状态演化的动态收敛过程.基于此构建食品供应商与电商平台之间的复制动态方程.

Qm1=(H1-C1+T-(1-β)αv1)·y+

(H1-C1-(1-β)αv1)·(1-y),

(1)

Qm2=(H1+ΔH-C1-F-βαv1)·y+

(H1+ΔH-C1-βαv1)·(1-y),

(2)

(3)

x(1-x)[(T+F)·y-ΔH-(1-2β)αv1].

(4)

对F(x)关于x求导,则

命题1表明随着电商平台严格监管概率的提高,食品供应商的演化稳定策略将由提供不合格食品转变为提供合格食品.反之亦成立.

1.3 平台的复制动态方程

Qn1=(L1-C2-T-(1-β)αv2)·x+

(L1-C2+F-βαv2)·(1-x),

(5)

Qn2=[L1-(1-β)αv2]·x+(L1-βαv2)·

(1-x),

(6)

(7)

y(1-y)[(-T-F)·x-C2+F].

(8)

对F(y)关于y求导,则

命题2表明随着供应商提供合格食品概率的降低,电商平台的演化稳定策略将由宽松监管转变为严格监管.反之亦成立.

1.4 演化博弈系统稳定性分析

演化博弈分析的目的是以有限理性为框架,研究博弈双方在经过不断学习适应,追求利益最大化的过程中形成的动态平衡,并且系统的稳定策略受博弈初始状态和演化路径的影响.

借助Jacobian矩阵分析参数约束条件对系统局部均衡点的稳定性的影响,Jacobian矩阵如下:

(9)

表2 均衡点稳定性分析

根据以上分析,得到下面命题3．

2 动态奖惩机制下食品供应商与电商平台的演化博弈模型

2.1 动态奖励机制和静态惩罚机制

由于在静态奖惩机制下,信息不对称导致供应商的机会主义行为使得双方行为没有达到有效的监管状态.因此,为了使得结果更加符合实际情况,本文将从食品供应商的合法经营行为进行不同程度奖励,设置了线性动态奖励机制.假设电商平台采取“严格监管”策略时对合法经营的供应商的奖励T和供应商采取“提供合格食品”策略的概率成正比,则奖励由固定的常数T变为线性函数g(x)=xT,其中,T为供应商获得的最高程度的奖励金额.此时得到供应商和平台的复制动态方程分别为

ΔH-(1-2β)αv1],

(10)

(11)

Jacobian矩阵如下:

(12)

根据Jacobian矩阵对系统局部均衡点稳定性的影响,接下来将5个均衡点分别代入Jacobian矩阵,表3为演化博弈系统的均衡点稳定性分析.

表3 均衡点稳定性分析

根据以上分析,得到下面命题4.

命题4在平台动态奖励和静态惩罚机制下,该系统的演化博弈模型有4个鞍点和1个不稳定点,其中,不稳定点为

E′(x*,y*)=

这表明系统的演化过程没有稳定均衡的状态.

2.2 动态惩罚机制和静态奖励机制

从上述静态奖惩机制、动态奖励机制和静态惩罚机制角度来求解模型的稳定性可知,在上述两种机制下系统无法达到稳定均衡.为了使得结果能够趋向稳定均衡,将引入线性动态惩罚机制,对食品供应商的违法经营行为的不同程度的结果进行不同程度处罚,设置了线性动态惩罚机制.假设电商平台采取“严格监管”策略时对违法经营的供应商的惩罚F和供应商采取“提供不合格食品”策略的概率成正比,则惩罚由固定的常数F变为线性函数f(x)=(1-x)F,其中F为供应商受到的最高程度的惩罚金额.此时得到供应商和平台的复制动态方程分别为

x(1-x)[(T+(1-x)F)·y-ΔH-(1-2β)αv1],

(13)

y(1-y)[(-T-(1-x)F)·x-C2+(1-x)F].

(14)

Jacobian矩阵如下:

(15)

根据Jacobian矩阵对系统局部均衡点的稳定性的影响,接下来将5个均衡点分别代入Jacobian矩阵,表4为演化博弈系统的均衡点稳定性分析.

表4 均衡点稳定性分析

根据以上分析,得到下面命题5.

命题5在平台动态惩罚和静态奖励机制下,该系统的演化博弈模型有4个鞍点和1个焦点,其中,稳定点为

这表明系统具有稳定性.

2.3 动态奖励机制和动态惩罚机制

由上述从静态奖惩机制、动态奖励机制和静态惩罚机制以及动态惩罚机制和静态奖励机制角度来求解模型的稳定性,可知只有在动态惩罚机制和静态奖励机制下系统可以达到稳定均衡,从而实现有效监管.现将线性动态奖励机制和动态惩罚机制结合.假设奖励T和惩罚F与供应商采取“提供合格食品”策略的概率有关,将线性函数g(x)=xT,f(x)=(1-x)F代入上述式(4)和(8),基于动态奖励机制与动态惩罚机制下食品供应商和平台的演化博弈的复制动态方程分别为

x(1-x)[(xT+(1-x)F)·y-ΔH-(1-2β)αv1],

(16)

y(1-y)[(-xT-(1-x)F)·x-C2+(1-x)F].

(17)

Jacobian矩阵如下:

(18)

根据Jacobian矩阵对系统局部均衡点的稳定性的影响,接下来将5个均衡点分别代入Jacobian矩阵,得到如表4一样的演化博弈系统的均衡点稳定性分析结果.

根据以上分析,得到下面命题6.

3 数值仿真分析

3.1 静态奖惩机制

表5 仿真参数赋值

1) 图1是双方混合策略时整个系统的演化博弈曲线,分别在不同初始比例(x0,y0)=(0.5,0.5)、(x0,y0)=(0.2,0.8)和(x0,y0)=(0.8,0.2)时,静态奖惩机制下该系统的演化博弈轨迹是一个围绕稳定中心点进行周期运动无限循环的闭圆环,没有稳定均衡点,这表明食品供应商和电商平台的演化过程呈现周期性.

图1 混合策略的演化结果

2) 图2是不同初始比例下供应商和平台分别采取“提供合格食品”策略和“严格监管”策略的演化博弈曲线,图2a为固定平台采取“严格监管”策略的初始概率为y0=0.5,供应商采取“提供合格食品”策略的初始概率分别为x0=0.2,0.8时的演化博弈曲线.图2b为固定供应商采取“提供合格食品”策略的初始概率为x0=0.5,平台采取“严格监管”策略的初始概率分别为y0=0.2,0.8时的演化博弈曲线.

a. y0=0.5 x0=0.2,0.8 b. x0=0.5 y0=0.2,0.8

从仿真结果看,在给定供应商采取“提供合格食品”策略和电商平台采取“严格监管”策略的初始概率情况下,对于x0和y0的不同初始值,供应商采取“提供合格食品”策略和电商平台采取“严格监管”策略的概率随时间呈现上下波动状态,系统不会稳定到中心点 (x*,y*),不存在演化稳定策略.从波动幅度来看,x0和y0的初始值不同,博弈演化过程曲线的波动存在显著差异.图2a中固定y0,x0=0.8时的波动幅度大于x0=0.2的波动幅度.图2b中固定x0,y0=0.8的波动幅度大于y0=0.2的波动幅度,即供应商和平台概率x0和y0越大波动越大.以上结果表明,在电商平台采取“严格监管”策略,对供应商采取“提供合格食品”策略的奖惩为静止固定时,供应商和电商两个群体的博弈过程不能达到稳定的均衡状态,两个群体的行为呈现周期上下震荡模式,没有固定稳定的策略.并且供应商采取“提供合格食品”策略和电商平台采取“严格监管”策略的初始概率越大,波动的幅度越大,越难趋向于稳定.

3.2 对三种不同的动态奖惩机制仿真

1)图3是供应商采取“提供合格食品”策略的初始概率为x0=0.5和平台采取“严格监管”策略的初始概率为y0=0.5时的演化博弈曲线.由图3a可知,在动态奖励机制和静态惩罚机制下,供应商和电商平台两个主体的演化轨迹的演化过程是一个围绕起点的封闭轨道循环,没有收敛点,因此食品供应商与电商平台的演化过程没有稳定均衡点,无法实现有效监管.由图3b可知,在动态惩罚机制和静态奖励机制下,供应商和电商平台两个主体的演化轨迹呈螺旋收敛的态势,并最终收敛于一点,因此食品供应商与电商平台的演化过程有稳定均衡点,食品供应商的违法行为可以得到有效监管.由图3c可知,在动态惩罚机制和动态奖励机制下,供应商和电商平台两个主体的演化轨迹也是呈螺旋收敛的状态,并最终收敛于一点,因此食品供应商与电商平台的演化过程也有稳定均衡点.

图3 混合策略的演化结果

2) 图4是在初始概率为(x0,y0)=(0.5,0.5)时,两种不同机制下供应商和平台分别采取“提供合格食品”策略和“严格监管”策略的演化博弈曲线.

图4 不同机制的演化结果

从图4a、图4b可知,在动态奖励机制和静态惩罚机制下,供应商和平台分别采取“提供合格食品”策略和电商平台采取“严格监管”策略的概率随时间呈现上下震荡状态,系统不存在演化稳定策略.从波动幅度来看,系统在动态奖励机制与静态惩罚机制下,比静态奖惩机制下的上下波动幅度更大.以上结果表明,将静态奖惩机制变为动态奖励机制和静态惩罚机制时,供应商和电商两个群体的博弈过程依旧不能达到稳定的均衡状态,两个群体的行为呈现周期上下震荡模式,没有固定稳定的策略.

由图4c、图4d可知,对比静态奖励和静态惩罚机制,在动态惩罚机制和静态奖励机制下,食品供应商和平台的策略选择概率随时间最终会逐渐收敛趋于稳定.因此,平台合适的惩罚机制可以发挥监管供应商行为的作用,将供应商的信用纳入征信系统进行等级划分,实行有针对性地分级管理惩罚,促进平台的严格监管的效率,从而规范食品供应商的违法行为.

由图4e、图4f可知,对比动态惩罚机制和静态奖励机制,食品供应商和平台分别采取“提供合格食品”策略和“严格监管”策略的概率都是经历过短暂上下波动以后逐渐收敛趋于稳定,虽然两个机制下系统都经历过短暂的上下波动后趋于稳定,但动态奖励和动态惩罚机制下供应商和平台收敛概率更高,因此动态奖励和动态惩罚机制效果更好.

3) 图5a和图5b是在初始概率为(x0,y0)=(0.5,0.5)时,四种不同机制下供应商和平台分别采取“提供合格食品”策略和“严格监管”策略的演化博弈曲线.由仿真结果可知,在这四种机制下,系统在动态奖励静态惩罚机制下,上下波动的振幅最大,最不容易稳定;在动态奖励和动态惩罚机制下供应商和平台收敛概率更高,这表明平台对供应商的动态奖惩机制对群体最终的收敛状态效果最好.

图5 不同机制的演化结果

3.3 新媒体不同参数对静态奖惩机制稳定性的影响

为了更进一步探究在静态奖惩机制下新媒体的影响力α、新媒体报道信息的准确率β对供应商和平台最终演化路径稳定性的影响,可以保持在其他参数不变的情况下,改变α、β这两种参数变量,仿真如下.

1) 新媒体的影响力α对稳定性的影响

图6a、图6b分别为新媒体不同影响力下电子商务交易市场中供应商和平台的演化博弈曲线.当新媒体的影响力逐渐增大时,供应商和平台分别选择“提供合格食品”策略和“严格监管”策略的概率震荡幅度都在增加;对于供应商,随着新媒体报道对供应商造成的损失增大,供应商会因不敢承担风险而放弃赚取额外利润,从而最终收敛稳定到概率x=1;对于平台,由于新媒体介入监管,平台会选择“搭便车”,从而选择“宽松监管”,最终收敛稳定到概率y=0,即此时稳定策略为(提供合格食品,宽松监管).这表明新媒体的影响力增大对供应商和平台群体最终的收敛状态分别呈正向和反向关系,新媒体的影响力适当增大可以促进供应商规制行为和节约平台的监管成本.

2) 新媒体报道信息的准确率β对稳定性的影响

图7a、图7b分别为新媒体不同报道准确率下电子商务交易市场中供应商和平台的演化博弈曲线.随着新媒体报道准确率的增加,供应商和平台分别选择“提供合格食品”策略和“严格监管”策略的概率震荡幅度都在增加;对于供应商,即使没有稳定到x=1,但是向上波动明显比初始概率x0=0.5增加了;对于平台,随着新媒体报道准确率的增加,平台选择“严格监管”策略的概率降低.这表明新媒体的报道对供应商的违法行为进行了规制,产生比较强的威慑作用,从而推动食品供应商主动重视食品安全问题,从而平台会适当降低监管力度,节约监管成本,但是此时供应商和平台都没有达到稳定状态.

图7 新媒体准确率β与x、y的时间关系

4 结论

本文以演化博弈和机制设计为研究方法,探究在新媒体环境下引入不同静动态奖惩机制的演化稳定性,从仿真结果表明,平台的静态奖惩机制与动态奖励和静态惩罚机制下供应商和平台的演化博弈呈周期性上下波动变化,不能达到稳定均衡状态; 在平台的动态惩罚和静态奖励机制与动态奖励和动态惩罚机制下供应商与平台的演化博弈呈螺旋收敛,可以达到稳定状态,并且动态奖励和动态惩罚机制效果更明显,因此设置合理的动态惩罚和动态奖励机制可有效控制供应商的违法行为,促进食品电商行业的可持续发展.新媒体的参与监督对静态奖惩机制下供应商和平台的策略行为造成了不同的影响,一定程度上高效地促进了食品电商行业的有序发展.由于食品安全问题的隐蔽性,平台不能完全发现供应商的违法行为,并且平台作为一个有限理性经济体,为了实现自己利益最大化也会存在自身监管效率的局限性.本文对影响食品供应商和平台的行为因素未能全部纳入进行研究,未来可继续从政府奖惩机制和消费者监督机制的角度完善该模型,使其更符合实际情况.