直播带货产品质量的演化博弈分析
2023-02-01梁晓莹刘玉敏赵哲耘田光杰
梁晓莹, 刘玉敏, 赵哲耘, 田光杰
(1.郑州大学 商学院,河南 郑州 450001; 2.郑州大学 发展规划处,河南 郑州 450001; 3.郑州大学 马克思主义学院,河南 郑州 450001)
0 引言
为形成强大国内市场,培育完整内需体系,国家大力推行新兴消费方式。自2016年3月淘宝直播试运营,直播+电商的新型购物方式走入大众的视野。直播带货以其娱乐性、互动性和较强的沉浸体验赢得了许多消费者的青睐。但直播带货也存在以次充好、三无产品、售后无保障等问题引起许多消费者的投诉。因此,建立直播带货质量问题的治理机制对鼓励网络消费新业态发展、改善消费环境具有重要意义。
直播带货作为“电商+直播”的新型营销方式,根植于网络平台市场。现有关于网络平台市场的治理机制主要从市场治理[1]、平台治理[2]和政府治理[3,4]三方面展开[5]。但直播带货不同于一般网购行为,翻车事件频发也显露出其特有的问题[6]。因此,部分学者分别从法律、道德及监管手段上提出一系列治理措施[7-9],实现直播带货行业的有序发展。
现有学者分别多个角度对直播带货中的各种负面问题进行分析并提出一些切实可行的改进建议,但现有文献多为定性研究,缺乏多个利益主体之间行为互动的分析。对此,郭延禄等[10]从演化博弈视角出发研究了网红、平台和消费者在直播带货产品质量问题治理中的互动行为。但该研究主要从消费者视角出发,对平台行为和主播行为的分析仍有待深入,且已有研究未将商家的生产行为考虑在内。鉴于此, 本文采用演化博弈方法研究直播带货场景中主播、商家、平台和消费者的策略选择和互动机理,分析了平台监管行为、主播选品行为等主体行为对缓解质量问题的作用,并详细讨论了关键参数的变动如何影响主体行为的选择,为改善直播带货产品质量提出了相应的对策建议。本文的创新点在于:(1)将商家行为纳入到研究框架中,是对已有研究的补充。(2)针对直播带货场景中产品质量问题频出的现状,建立基于主播、商家、平台和消费者的四方演化博弈分析框架。(3)丰富了直播带货产品质量问题治理的相关研究。
1 演化博弈模型假设与构建
本文基于演化博弈理论对参与博弈的主播、商家、平台和消费者的策略选择做出如下分析与假设:
(1)博弈参与人1:主播
假设主播有两种策略{严格选品,宽松选品},主播选择“严格选品”策略的概率是x,且有0≤x≤1;选择“宽松选品”策略的概率为1-x。严格选品指主播在选择与商家合作时会对商家的产品质量进行严格地把控,积极对商家生产产品的质量进行检查。宽松选品是指无论商家是否自律生产,主播都将与商家进行合作。当主播严格选品时,其基本收益为Ra,并付出成本Ca。当主播宽松选品时,其基本收益为Rb。当商家自律生产时,商家给予主播的分成为θMh,当商家不自律生产时,分成为θMl。当出现产品质量问题时,积极监管的平台将会对主播收取罚金Fa,消费者对主播的不满和抵触,会对主播造成用户流失S。商家采取不自律生产的策略时,严格选品的主播与其合作的概率为q。
(2)博弈参与人2:生产商家
假设生产商家有两种策略{自律生产,不自律生产},商家选择“自律生产”策略的概率是y,且有0≤y≤1;选择“不自律生产”策略的概率为1-y。当商家自律生产时,商家的基本收益为Rh,并付出一定的质量成本Ce,商家需要给予主播及平台的抽成为Mh。当商家选择“不自律生产”策略时获得的基本收益为Rl,给予主播及平台的抽成为Ml,如果平台积极监管时,不自律商家会面临来自平台的惩罚Fe,消费者积极维权时还要给予消费者经济补偿B。
(3)博弈参与人3:平台
假设平台有两种策略{积极监管,消极监管},选择“积极监管”策略的概率是z,且有0≤z≤1;选择“消极监管”策略的概率为1-z。平台在直播带货中的收益主要包含基本收益Rp以及直播带货中的抽成(1-θ)Mh或(1-θ)Ml,其中平台抽成比例为1-θ。当平台进行积极监管时,会严格对消费者投诉的产品质量问题进行检查,付出监管成本Cp,发现产品质量问题时,会分别对主播和商家收取罚金Fa和Fe(F=Fa+Fe)。平台选择消极监管时,消费者反映的产品质量问题无法得到解决,一部分消费者会对平台的消极态度产生不满,给平台带来相应的流量和用户损失,记为βS。其中,β是平台受到的连带损失系数。
(4)博弈参与人4:消费者
假设消费者有两种策略{积极维权,消极维权},消费者选择“积极维权”策略的概率是w,且有0≤w≤1;选择“消极维权”策略的概率为1-w。消费者购买到合格产品时的基本收益为Rs,购买到不合格品时的损失为L。消费者积极维权得到情感收益E,需要付出维权成本Cs。平台积极监管时,消费者会收到经济补偿B。
2 四方策略演化稳定性分析
2.1 主播选品策略的稳定性分析
假设主播选择“严格选品”策略时的期望收益为U11,选择“宽松选品”策略时的期望收益为U12,其中:
U11=y(Ra-Ca+θMh)+(1-y)(Ra-Ca+qθMl)-(1-y)zqFa-(1-y)wqS
(1)
U12=y(Rb+θMh)+(1-y)(Rb+θMl)-(1-y)zFa-(1-y)wS
(2)
主播的复制动态方程及其一阶导数分别为:
F(x)=x(1-x)[Ra-Ca-Rb-(1-y)(1-q)θMl+(1-y)z(1-q)Fa+(1-y)w(1-q)S]
(3)
F′(x)=(1-2x)[Ra-Ca-Rb-(1-y)(1-q)θMl+(1-y)z(1-q)Fa+(1-y)w(1-q)S]
(4)
由式(3)及式(4)可知,主播是否选择严格选品取决于另外三方决策的概率、主播严格选品及宽松选品各自的成本及收益。根据微分方程稳定性原理,主播选品策略处于稳定状态时必须满足F(x)=0且F′(x)<0。
命题1主播严格选品的概率随着商家自律生产概率的减小而增大,随着平台积极监管概率的增大而增大,随着消费者积极维权概率的增大而增大。
根据命题1,主播策略选择的相位图如图1所示。
图1 x相位图
2.2 商家生产策略的稳定性分析
设商家选择“自律生产”策略时的期望收益为U21,选择“不自律生产”策略时的期望收益为U22,其中:
U21=Rh-Mh-Ce
(5)
U22=Rl-Ml+x(q-1)(Rl-Ml)-zFe-zwB+xz(1-q)Fe+xzw(1-q)B
(6)
商家的复制动态方程及其一阶导数分别为:
F(y)=y(1-y){[Rh-Mh-Ce-(Rl-Ml)]+x(1-q)(Rl-Ml)+z(Fe+wB)-xz(1-q)Fe-xzw(1-q)B}
(7)
F′(y)=(1-2y){[Rh-Mh-Ce-(Rl-Ml)]+x(1-q)(Rl-Ml)+z(Fe+wB)-xz(1-q)Fe-xzw(1-q)B}
(8)
由式(7)及式(8)可知,商家是否选择自律生产取决于另外三方决策的概率、商家自律生产及不自律生产时各自的成本及收益。根据微分方程稳定性原理,商家生产策略处于稳定状态时必须满足F(y)=0且F′(y)<0。
命题2商家自律生产的概率随着主播严格选品概率的增大而增大,随着平台积极监管概率的增大而增大,随着消费者积极维权概率的增大而增大。
根据命题2,商家策略选择的相位图如图2所示。
图2 y相位图
2.3 平台监管策略的稳定性分析
同理,设平台“积极监管”时的期望收益为U31,“消极监管”时的期望收益为U32,其中:
U31=xy[Rp-Cp+(1-θ)Mh]+x(1-y){Rp-Cp+q[(1-θ)Ml+F]}+(1-x)y[Rp-Cp+(1-θ)Mh]+(1-x)(1-y)[Rp-Cp+(1-θ)Ml+F]
(9)
U32=xy[Rp+(1-θ)Mh]+x(1-y){Rp+q[(1-θ)Ml]-wqβS}+(1-x)y[Rp+(1-θ)Mh]+(1-x)(1-y)[Rp+(1-θ)Ml-wβS]
(10)
平台的复制动态方程及其一阶导数分别为:
F(z)=z(1-z)[-Cp+F+wβS-y(F+wβS)-x(1-y)(1-q)(F+wβS)]
(11)
F′(z)=(1-2z)[-Cp+F+wβS-y(F+wβS)-x(1-y)(1-q)(F+wβS)]
(12)
由式(11)及式(12)可知,平台是否选择积极监管取决于另外三方决策的概率、平台积极监管及消极监管时各自的成本及收益。根据微分方程稳定性原理,平台监管策略处于稳定状态时必须满足F(z)=0且F′(z)<0。
命题3平台积极监管的概率随着主播严格选品概率的增大而减小,随着商家自律生产概率的增大而减小,随着消费者积极维权概率的增大而增大。
根据命题3,平台策略选择的相位图如图3所示。
图3 z相位图
2.4 消费者维权策略的稳定性分析
同理,设消费者“积极维权”时的期望收益为U41,“消极维权”时的期望收益为U42,其中:
U41=xy(Rs-Cs)+x(1-y)[q(E-L)-Cs]+x(1-y)zqB+(1-x)y(Rs-Cs)+(1-x)(1-y)(-L-Cs+E)+(1-x)(1-y)zB
(13)
U42=xyRs+x(1-y)q(-L)+(1-x)yRs+(1-x)(1-y)(-L)
(14)
消费者的复制动态方程及其一阶导数分别为:
F(w)=w(1-w)[-Cs+(1-y)(E+zB)-x(1-y)(1-q)(E+zB)]
(15)
F′(w)=(1-2w)[-Cs+(1-y)(E+zB)-x(1-y)(1-q)(E+zB)]
(16)
由式(15)及式(16)可知,消费者是否选择积极维权取决于另外三方决策的概率、消费者积极维权及消极维权时各自的成本及收益。根据微分方程稳定性原理,消费者维权策略处于稳定状态时必须满足F(w)=0且F′(w)<0。
命题4消费者积极维权的概率随着主播严格选品概率的增大而减小,随着商家自律生产概率的增大而减小,随着平台积极监管概率的增大而增大。
根据命题4,消费者策略选择的相位图如图4所示。
图4 w相位图
2.5 策略组合稳定性分析
根据微分方程稳定性原理,在四方演化博弈模型中只有纯策略均衡解是稳定解,因此对16个纯策略均衡点进行分析,对Jacobi矩阵的特征值进行求解。根据李雅普诺夫方法[11],当所有特征值均为负时,该均衡点为渐进稳定状态。从上述分析可知,系统内存在16个可能的演化稳定策略,将16个均衡点带入Jacobi矩阵中,分别得到均衡点所对应的雅克比矩阵的特征值与稳定性,结果如表1所示。
由表1可知,在直播带货四方博弈模型中存在E1(0,0,0,0),E2(1,0,0,0)等10个可能的稳定策略组合。
对于策略组合E1(0,0,0,0),E4(0,0,1,0),E9(0,0,0,1),E12(0,0,1,1),主播和商家的行为策略取决于自身感知收益的大小。而当平台积极监管或消费者积极维权时,还受到平台惩罚力度和维权带来的用户损失的影响。在这四种策略组合下,主播和商家受到超额利益的驱使将分别采取宽松选品和不自律生产的策略,用户损失及平台惩罚力度较小不足以促使主播和商家改变其违规行为,平台监管和消费者维权没有产生应有的威慑效果。直播带货市场上产品质量问题频发,消费者利益受到损害。
对于策略组合E2(1,0,0,0),E6(1,0,1,0),E10(1,0,0,1),E14(1,0,1,1),平台监管和消费者维权不足以改变商家的违规行为,但主播严格选品会减少与不自律商家合作的概率,减少了不合格产品流入市场的可能。对于策略组合E3(0,1,0,0),E5(1,1,0,0),虽然商家的生产行为缺乏平台监管和消费者维权的有效约束,但仍能严格按照质量管理规范进行自律生产,保护了消费者的合法权益。
3 数值仿真
为了分析博弈模型中关键参数的变动对主播、商家、平台和消费者四方策略选择的影响,采用数值仿真的方法对不同参数变动下的渐进稳定状态进行求解。
文中参数设置主要来源于相关文献和现实调研。根据《抖音电商规则中心》、《快手小店达人违规管理规则》及实际调研可知,主播在单次直播中的坑位费收益在1~10万元不等;商家给予的佣金一般为销售额的10%~30%,其中平台向主播收取佣金10%为技术服务费;发生质量问题时平台采取扣除保证金的处罚方式,保证金在0.4~10万元不等。其余参数设置参考赵哲耘等[12]、汪旭晖和任晓雪[13]的研究。假设Ra=5,Ca=1,Rb=3,q=0.5,Fa=1,S=10,θ=0.9;Rh=30,Mh=6,Ce=18,Rl=25,Ml=5,Fe=2,B=5;Cp=7,β=0.8;E=15,Cs=3满足上述条件。
3.1 q的变化对演化稳定均衡的影响
设q={0.8,0.5,0.2},四方博弈主体策略演化过程及结果如图5所示。
图5 q对策略演化均衡的影响
由图5可知,当q=0.8时,商家倾向于不自律生产,此时平台会进行积极监管。当q逐渐降低时,商家不自律生产的概率也逐渐降低,平台消极监管概率提高。当q减小到0.2时,四方策略组合最终稳定于{严格选品,自律生产,消极监管,消极维权}。q减小意味着主播对不自律商家的识别效率较高,商家意识到不自律生产被主播选择进入市场的可能越低,因此倾向于自律生产。但q的减小会降低平台监管的积极性,这是由于平台考虑到具有较强专业经验的带货主播能够识别出商家的不自律生产行为,从而降低了低质产品入市的可能,因此放松了对于直播带货产品质量的监管。q的大小反映了主播对不合格产品的识别效率,是主播选品能力的体现。主播的选品能力受到主播的身份以及带货产品种类的影响。因此,为提高直播带货市场上的产品质量,应当提高主播的选品能力从而提升对不自律商家的识别效率,进而督促商家进行自律生产。
3.2 S及β对演化稳定均衡的影响
设S={1,20},平台连带损失系数β={0.3,0.8}。四方博弈主体策略演化过程及结果如图6所示。
图6 S及β对策略演化均衡的影响
由图6可知,当产品质量问题给主播带来的用户损失较小时,其选择严格选品的概率较低。随着用户损失的增加,带货主播严格选品的概率会有所增加。并逐渐改变其宽松选品的策略,向严格选品收敛。用户损失的大小反映了消费者对直播带货产品质量问题的态度。在直播带货中,消费者和主播之间的关系并非单纯的导购和消费者,多数消费者兼具粉丝属性[14],对其关注的主播产生了情感投射,因此出现产品质量问题时,对主播的容忍度较高,用户损失较小。当消费者做出购买决策更注重产品本身和商品价格时,其与主播之间情感连接较少,两者的关系更接近于“线上导购—顾客[15]”,因此出现质量问题时,消费者会对主播选品的能力和态度产生怀疑,造成的用户损失较大。
用户损失的增加使得平台向消极监管策略的收敛速度逐渐放缓,但始终没有改变其策略选择。这是由于平台的行为还受到连带损失系数β的影响。在同等用户损失下随着β的增大,平台的行为由“消极监管”转变为“积极监管”或向“积极监管”策略的收敛速度加快。β的大小反映了用户对平台的依赖程度,β越小依赖程度越强,用户损失越小。
为了培育良好的直播购物环境,消费者应当对产品质量问题采取零容忍的态度,对相关主播进行积极维权和抵制以督促平台积极监管,提高主播严格选品的意愿。
3.3 惩罚力度对演化稳定均衡的影响
设惩罚力度Fa={0,5,10},Fe={0,10,20}。四方博弈主体策略演化过程及结果如图7所示。
图7 惩罚力度对策略演化均衡的影响
由图7可知,当平台对主播和商家的惩罚力度较小时,四方策略选择稳定于{严格选品,不自律生产,消极监管,积极维权}。随着惩罚力度的增强,主播向严格选品的收敛速度加快,商家和平台向不自律生产及消极监管收敛的速度也逐渐放缓,表明平台增加惩罚力度对主播和商家的行为都产生了正向的影响。继续增加惩罚力度,商家和平台的策略选择震荡幅度增大,但系统始终无法收敛到稳定状态。这表明仅靠增加惩罚力度,无法对商家行为形成长久有效的约束,平台应当考虑采用其他的监管手段与之相配合。
4 结论及政策建议
本文的研究表明:(1)主播严格选品并提高识别效率降低了与不自律商家的合作概率,可以督促商家进行自律生产,提高市场上的产品质量。(2)消费者维权会使主播和平台遭受用户损失,对主播和平台的行为产生积极的影响。除此之外,平台的行为还受到连带损失系数的影响,减少用户对平台的依赖程度,可以增加平台积极监管的意愿。(3)平台适当增加惩罚力度会促使主播和商家改变其消极行为,但仅靠增加惩罚不能对商家行为产生长效的影响。除了惩罚外,平台还应当考虑同时采取其他的方式治理直播中产品质量问题频出的现状。
根据本文研究结果给出如下建议:(1)带货主播应当清楚自身定位,在选择带货产品时,尽量选择自身熟悉领域的产品。在直播之前,应当不断提升自身品控能力,组建专业的选品团队,严格把控直播带货产品的质量。(2)商家应该重视自身的长远发展,严格按照工艺流程进行自律生产。当消费者认为产品存在质量问题时,应当积极与消费者沟通,避免引起消费者和主播的抵制以及受到平台的惩罚。(3)平台应当对参与直播带货的主播设置准入门槛,要求主播进行职业能力的培训,提高主播品控能力。当产品出现产品质量问题时,应当对商家和主播之间的责任进行清晰的划分和界定。(4)消费者在直播中购买产品时,要提高鉴别能力,避免冲动消费。当购买的产品出现质量问题后,要提高自身维权意识,通过积极维权,约束商家的生产行为和主播的选品行为,减少自身损失。(5)政府应该督促平台重视直播中的产品质量问题,同时为减少用户对平台的依赖,对平台的垄断行为进行规制,为直播带货行业的发展构建良好的营商环境。