考虑配送交通风险的新零售平台、骑手及消费者三方演化博弈分析

2024-02-05李秀晖雒兴刚

系统管理学报 2024年1期

汪翼,李秀晖,雒兴刚

(杭州电子科技大学管理学院,杭州 310018)

近年来,我国新零售行业随着电子商务、IT 技术、物流行业的发展而飞速增长。新零售行业的物流末端主要依赖于骑手的配送,其中,绿色生鲜电商、外卖等行业对于末端配送的及时性要求极高。与此同时,骑手配送过程中发生交通事故屡见报端。例如:2017 年上半年,上海平均每2.5 天就有约1名外卖骑手伤亡[1];广州仅2021年10月中的半个月就查获外卖车辆交通违法7 667 宗[2];上海市2020年1～9月份查处快递外卖骑手各类交通违法行为4.3万余起[3]。当消费者在平台下单后,平台会给出配送时间承诺,而骑手则需要在该时间范围内按订单送达。骑手一旦配送超时,就会被平台处以罚金,消费者也可能会投诉骑手;若消费者进行投诉,平台则会进一步惩罚骑手。骑手为减少配送超时可能产生的惩罚,要尽可能快的将外卖送达,往往会提高配送骑行的速度,甚至对交通规则视若无睹,因而导致交通事故的发生。这就是近年来公众广泛讨论的“骑手困境”的重要背景。一般情况下,服务提供方对服务失败和消费者投诉会采取一定的反应和行动,即服务补救措施[4]。针对订单配送超时和消费者投诉的情况,目前外卖平台的服务补救措施主要是建立补偿机制,即通过赠送礼物、小额红包或代金券等方式来消除消费者的不满。例如:福州“永辉生活”线上自营平台提供“慢必赔”服务,如果配送超时,系统将自动给用户发放现金券[5];美团平台也对部分商家的用户提供了类似服务协议,一旦订单实际送达时间超出协议中规定的范围,平台就会向用户支付一定金额的红包券作为补偿。骑手困境背景下,企业建立平台超时补偿机制引发了下列问题:平台从自身利益出发,建立补偿机制是否更加有利?补偿额度的多少对平台、骑手及消费者的决策又有哪些影响? 此外,补偿机制如果能够减少消费者的投诉,能否进一步降低骑手对于超时的担心,进而采取更安全的配送行为,最终帮助社会缓解“骑手困境”? 针对上述问题,本文通过构建演化博弈模型分析外卖平台、骑手及消费者3个参与主体在配送服务过程中的行为策略,分析演化博弈的稳定策略选择,并对演化过程与结果进行仿真分析。通过对各种系统演化结果的对比分析,发现促使平台推出超时补偿机制最主要的动因是其给企业带来的直接效用提升,其次才是消费者增长的投诉比率和骑手配送风险的增长。影响骑手配送策略最关键的因素是平台对其配送超时的直接惩罚。另外,平台、消费者对骑手的同理心也是影响骑手配送行为的重要因素。在一定条件下,三方演化策略均衡可以达到理想状态:平台建立主动补偿机制、骑手低风险配送、消费者对于订单超时选择不投诉。

1 文献综述

本文相关的参考文献可以分为外卖配送交通风险、平台型企业补偿机制以及演化博弈模型在运营管理中的运用相关研究3类。一系列文献通过实证方法对外卖配送交通事故的归因进行研究,发现其主要原因包括:骑手自身的交通违法行为[6]、平台派单系统的算法缺陷[7]、平台对骑手配送超时的奖惩及管理规定等[8]。这些实证研究结论也揭示了骑手困境背后存在复杂的机制。

在平台型企业补偿机制研究方面,余海燕等[9]从配送平台的角度出发,以配送员为激励对象,以最大化订单提前完成率为目标函数,对比分析不同的激励机制。还有部分实证研究分析补偿机制对用户的影响。Harris等[10]以餐饮服务平台为例,通过实验发现,服务补救水平对满意度和购后意愿有影响。Zhang等[11]也发现,在投诉数量较多的在线交易环境中,有效实施在线服务补救对于减少客户投诉和保持客户忠诚度至关重要。李宇昕[12]的研究表明,在整个服务补救流程中,商家恰当合理地实施服务补救能够产生积极有利的后续结果。上述研究都没有考虑配送员作为博弈主体的策略选择背后的影响机制,以及配送交通风险在各方决策中的影响机制,而这正是本文重点考虑的因素。经典博弈理论往往假设博弈主体为完全理性,在现实生活中,这种假设通常是很难实现的。演化博弈理论认为博弈中的主体并不能对外部环境立即做出完美判断,而是在一个动态的调整过程中逐渐达到均衡状态。基于这一原因,很多运营管理研究构建演化博弈模型分析博弈决策的动态调整过程。张国兴等[13]研究包含第三方监督下食品企业的食品安全生产与政府部门的监管决策如何相互影响、动态调整。汪旭晖等[14]研究了平台卖家、平台电商和政府对平台电商信用监管机制决策的演化过程,剖析平台电商信用“监管困局”的内在形成机理。张子鸣等[15]对包含决策者成本-收益感知偏差下共享制造多主体决策的演化过程进行分析。吕乐琳等[16]研究了数字建造情境下重大工程交易行为监管系统中,工程发包方、工程监理方和工程承包方3个主体的策略形成及行为演化过程。雷丽彩等[17]研究了政府监管下电商平台“杀熟”定价行为及用户消费渠道选择的演化博弈模型。针对外卖服务进行演化博弈分析的文献中,部分研究聚焦于平台监管,如互联网订餐监管[18]、外卖食品安全监管[19]、政府惩罚机制[20]等。此外,Liu等[21]和Zhang等[22]利用演化博弈分别对骑手物流模式以及外卖食品卫生等方面进行了分析。相比于本文,上述研究都没有考虑配送骑手决策及其对自身交通风险、平台和消费者效用的影响。考虑到新零售平台、骑手与消费者之间的博弈行为也是在不断地探索、调整各自的决策,本文沿用演化博弈模型分析三方决策的演化过程。

2 模型假设与构建

2.1 模型假设

考虑新零售平台(例如外卖平台)、配送骑手及消费者组成的三方演化博弈模型,且由于环境以及问题的复杂性、信息不完全性等因素的限制[13],博弈三方均为有限理性。首先,平台是规则的制定者,在给出配送时间的情况下,一方面设定了超时与投诉发生时对骑手的惩罚,另一方面决定着对消费者的补偿。骑手接单后会根据平台给出的配送时间以及自身可能承担的惩罚,以此来决定自己的配送行为。骑手的配送行为既决定了订单超时的概率,同时也对其交通风险大小产生影响。消费者一方面期待自己获得更优质的服务,希望骑手尽快送达;另一方面,消费者出于同理心[23]等因素,也不希望骑手发生交通事故。如果平台建立主动补偿机制,在订单延误时给予消费者一定的补偿,既可以抵消消费者的部分不满情绪,又可以帮助平台建立良好的企业社会形象。因此,假设在配送时间和成本因素给定的背景下,平台策略空间为{建立补偿机制,不建立补偿机制},并假定其选择建立补偿机制的概率为x(0≤x≤1),不建立补偿机制的概率为1-x;骑手的策略空间为{高风险配送,低风险配送},骑手选择高风险配送的概率为y(0≤y≤1),选择低风险配送的概率为1-y;在配送超时情况下,消费者选择是否进行投诉,因此,其策略空间是{投诉,不投诉},并假定其选择投诉的概率为z(0≤z≤1),选择不投诉的概率为1-z。

模型的其他相关假设及参数、符号设定如下:

(1) 当消费者支付订单且配送成功后,平台、骑手及消费者都会得到相应的收益或正效应,分别为pp、pq和U。若订单配送延误,消费者会产生负效用u2。由于消费者对平台的满意度影响其再次消费的意愿,故配送超时会使平台和骑手产生延误损失,而根据业界实践,此时平台会对骑手进行处罚。因此,本文假设配送超时对平台、骑手分别产生成本cp和cq。

(2) 若骑手在配送过程中发生交通事故等问题,不仅骑手自身利益受损,平台也会承担部分责任。此外,消费者的同情情绪会影响其亲社会行为,即当人们看到他人受难时会被困扰,故假设当骑手发生意外时,消费者也会对此产生负效用。本文假设发生交通事故时,平台、骑手及消费者分别产生成本(负效应)rp、rq和rc。

(3) 平台企业若建立超时补偿机制,不仅可以吸引更多消费者、扩大市场需求,而且可以提升企业承担社会责任的形象[24]。本文假设平台建立主动补偿机制,可以产生相应的固定正效益u1。

(4) 如果消费者在订单配送超时情况下坚持投诉,平台需要耗费资源来处理消费者投诉,则假设c s为平台处理消费者投诉的成本。根据对业界实践的调研,消费者投诉的情况下,平台也会对骑手进行追加罚款等措施以弥补投诉带来的损失。本文假设c t为消费者投诉后平台对骑手的罚款。

(5) 在补偿机制下,消费者若选择不投诉,将得到补偿c b,该补偿由平台与骑手共同承担,θ与1-θ分别为两者对补偿金的承担份额。此外,若消费者选择投诉,本文假设消费者依旧可以得到φ比例的超时补偿。显然,当φ=0时,意味着平台不愿意为选择投诉的消费者给予补偿;当φ=1时,表示即使消费者选择投诉也会得到全部的补偿金。

(6) 根据申跃等[25]的研究,消费者对服务感到不满意而向平台企业进行抱怨是一种很好的发泄方式,无论消费者的抱怨是否得到解决,不满情绪的直接表达可以使其得到一定程度的释放。因此,本文假设消费者投诉后自身可获得正效用u t。

(7) 假设α和β分别为低风险配送下订单超时的概率与骑手在配送过程中发生交通意外的概率,k1α和k2β为高风险配送下订单超时的概率与骑手在配送过程中发生交通意外的概率。由于高风险配送往往意味着更短的配送时间以及更高的事故率,故假设0＜k1＜1,k2＞1。

2.2 模型分析

根据上述假设及参数设置,可以得到在平台建立补偿机制和不建立补偿机制的情况下,平台、骑手和消费者三方的支付矩阵,如表1、2所示。

表1 平台建立补偿机制下的三方支付矩阵 (x)Tab.1 Tripartite payoff matrix under compensation mechanism(x)

表2 平台不建立补偿机制下的三方支付矩阵 (1-x)Tab.2 Tripartite payoff matrix without compensation mechanism(1-x)

支付矩阵中每一决策组合的第1～3行公式分别表示相应各方决策下平台、骑手和消费者的期望收益(效用)。平台不同决策的收益包括每单所得收益、超时成本、投诉成本、风险成本、超时补偿以及品牌形象提升效用,骑手不同的决策相关效用包括每单所得收益、超时成本、超时补偿、投诉成本和风险成本,消费者的相关效用包括每单所获效用、超时负效用、投诉所获效用、所获补偿以及骑手发生交通事故带来的负效用。以平台建立补偿机制、骑手高风险配送、消费者进行投诉的情况为例,其中,平台的利益为订单支付成功后的收益pp减去超时概率k1α下的各项成本以及风险成本k2βrp,骑手的利益为配送完成后的收益pq减去超时情况下的各成本及风险成本k2βrq,消费者效用则由获得服务的总效用U减去配送超时情况下选择投诉的各项效用以及骑手发生交通意外时的负效用k2βrc表示。

3 模型分析

3.1 平台的策略稳定性分析

通过前述支付矩阵,可以得到平台建立补偿机制的期望收益为

不建立补偿机制的期望收益为

平均期望收益为

通过构建平台策略的复制动态方程并分析其性质,可以得到平台的稳定策略。定理1对此进行了刻画。

定理1

(2) 当u1-αθc b[1-y(1-k1)][1-z(1-ϕ)]＜0时,平台的演化稳定策略为x=0,即不建立补偿机制。

(3) 当u1-αθc b[1-y(1-k1)][1-z(1-ϕ)]＞0时,平台的演化稳定策略为x=1,即建立补偿机制。

证明由平台两种决策(建立、不建立补偿机制)下的收益函数可得平台策略的复制动态方程为

一阶导数为

显然,若

则有F x(x)=0恒成立,因此,任意x取值均为稳定策略。若

则F x(x)≤0,且F'x(0)＜0,F'x(1)＞0,此时x=0为稳定策略;若

则F x(x)≥0,且F'x(0)＞0,F'x(1)＜0,此时x=1为稳定策略。证毕

根据定理1,当骑手与消费者策略满足某一特定的平衡条件时,平台不会改变其现有策略。当骑手与消费者策略满足条件

时,平台向建立补偿机制演化;反之,则平台向不建立补偿机制策略演化。显然,若建立补偿机制给企业的直接效用提升u1足够大,平台总是倾向于建立补偿机制。当u1并不是足够大时,平台的策略选择受到骑手和消费者两方策略(y,z取值)的影响。由于1-y(1-k1)＞0,1-z(1-ϕ)＞0,可以看到,u1-αθc b[1-y(1-k1)][1-z(1-ϕ)]为y、z增函数。这意味着当骑手偏向于高风险配送、消费者倾向于投诉时,平台可能向建立补偿机制演化。上述分析不仅符合企业的运作实践,也提供了重要的管理启示。首先,企业建立补偿机制的一个重要动因就是为了在营销上提升企业的形象,吸引更多消费者;其次,当骑手偏向于高风险配送、消费者倾向于投诉,即“骑手困境”的情况较为严重时,平台有更大动机去建立补偿机制。

3.2 骑手的策略稳定性分析

同样,骑手高风险配送的期望收益可表示为

低风险配送的期望收益为

骑手的平均收益为

通过构建骑手策略的复制动态方程并分析其性质,可以得到骑手的稳定策略。定理2对此进行了刻画。

定理2

(1) 当

所有y都为骑手的演化稳定策略。

(2) 当

y=0为骑手的演化稳定策略,即低风险配送。

(3) 当

y=1为骑手的演化稳定策略,即高风险配送。

证明由骑手两种决策(高、低风险配送)下的收益函数可得骑手的复制动态方程,即

一阶导数为

注意到α(k1-1)(1-θ)c b＜0,考虑以下3种情况:

(1) 当

时,显然,F y(y)=0。

(2) 当

(3) 当

在平台建立补偿机制的情况下,骑手需要权衡配送安全、超时补偿及投诉成本,以决定自己的配送策略。定理2(1)表明,当平台与消费者之间的策略满足某一特定关系时,骑手不会改变其配送策略。但由于平台和消费者的策略都在不断地演化,因而这一特殊条件随时都会改变。定理2(2)和2(3)表明,骑手调整其配送策略的方向取决于

的大小关系。可以看到,若骑手的超时直接惩罚成本cq足够大,无论平台、消费者的策略怎样,骑手都会倾向于高风险配送。而当消费者投诉给骑手带来的惩罚成本c t足够大时,只有平台进一步倾向于提供补偿机制、消费者倾向于不投诉,骑手才会向低风险配送策略演化。上述分析揭示了骑手策略选择的主要动因是平台对其超时的直接惩罚成本,当惩罚成本足够大时,平台、消费者的其他策略选择都难以改变“骑手困境”;当惩罚成本在一定水平下时,平台进一步向消费者提供补偿机制演化,而消费者向不投诉策略演化,才能让骑手选择向低风险配送策略演化。

3.3 消费者的策略稳定性分析

消费者投诉的期望收益为

不投诉的期望收益为

消费者的平均期望收益为

通过构建消费者策略的复制动态方程并分析其性质,可以得到消费者的稳定策略。定理3对此进行了刻画。

定理3

(1) 当x=u t/[c b(1-ϕ)]时,任意z取值都为消费者的演化稳定策略。

(2) 当x＜u t/[c b(1-ϕ)]时,消费者的演化稳定策略为z=1,即对配送超时投诉。

(3) 当x＞u t/[c b(1-ϕ)]时,消费者的演化稳定策略为z=0,即对配送超时不投诉。

证明根据消费者两种策略下的期望收益,可以得到其复制动态方程,即

一阶导数为

定理3表明,消费者的策略选择主要取决于平台的策略选择。如果平台倾向于不建立补偿机制(x较小时),则消费者倾向于对配送超时投诉;如果平台愿意建立补偿机制(x较大时),消费者选择不投诉可以获得一些收益,则消费者倾向于选择不投诉。骑手决策虽然不会直接影响消费者策略选择,但是由于其影响了平台的策略选择,所以也会在三方博弈演化过程中间接影响消费者的策略选择。

3.4 博弈三方演化稳定策略分析

根据前述章节博弈三方的复制动态方程,可以进一步得到三方演化博弈系统的雅可比矩阵,即

其中:

令F(x)=0,F(y)=0,F(z)=0,可以得到8个局部均衡点:E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(1,0,0),E5(1,1,0),E6(1,0,1),E7(0,1,1),E8(1,1,1),其中括号内元素分别对应该均衡点中平台、骑手及消费者三方应采取的策略(x,y,z)的取值。由Lyapunov[26]法则可知,当Jacobian 矩阵的特征值都为负数时,局部均衡点即为演化稳定策略(ESS)。计算每一个均衡点所对应的Jacobian矩阵的特征值,如表3所示。

表3 均衡点稳定性分析Tab.3 Stability analysis of equilibrium points

通过对表3的观察分析,可以得到6种情景下演化博弈的稳定策略组合(见定理4)。

定理4

(1) 当

时,复制动态系统存在稳定点E2(0,0,1)。

(2) 当

时,复制动态系统存在稳定点E4(1,0,0)。

(3) 当

时,复制动态系统存在稳定点E5(1,1,0)。

(4) 当

时,复制动态系统存在稳定点E6(1,0,1)。

(5) 当

时,复制动态系统存在稳定点E7(0,1,1)。

(6) 当

时,复制动态系统存在稳定点E8(1,1,1)。

证明由表3 可见,8 个潜在的均衡点中,E1(0,0,0)、E1(0,1,0)所对应Jacobian 矩阵的特征值λ3实部恒为正值,这两个点不可能为局部均衡点。对于剩余6种情况,分析相应特征值全部为负的条件,即可得到6 种稳定策略组合所需相应的条件。证毕

定理4 表明,演化博弈的稳定策略包含6 种情景:

定理4(1)对应的情景为平台不建立补偿机制,骑手低风险配送,消费者投诉(情景1)。当企业建立补偿机制获得的正效用小于超时投诉情况下给予消费者的补贴(u1＜αϕθc b),且骑手因加速所导致的风险成本的增加(下文均称为风险成本差额)大于因加速所得到的超时成本、投诉成本以及补偿支出之和的减少(下文均称为超时成本差额),即α(cq+c t)(1-k1)＜βrq(k2-1),企业若建立补偿机制需要支出的补偿较多,并且骑手高风险配送使得风险成本过高,因此,企业选择不建立补偿机制,骑手选择低风险配送。

定理4(2)对应的情景为平台建立补偿机制,骑手低风险配送,消费者不投诉(情景2)。当企业建立补偿机制获得的正效用高于超时投诉情况下给予消费者的补贴(u1＞αθc b),骑手的超时成本差额小于风险成本差额(α[cq+(1-θ)c b](1-k1)＜βrq(k2-1)),且消费者投诉效用低于补偿差额(不投诉时得到的补偿与投诉时得到的赔偿的差额),即u t＜c b(1-ϕ),平台建立补偿机制可以极大提升自身的社会形象,而骑手选择高风险配送会导致风险成本过高,同时,消费者选择不投诉可以获得更多利益。

定理4(3)对应的情景为平台建立补偿机制,骑手高风险配送,消费者不投诉(情景3)。其条件u1＞k1αθc b,u t＜c b(1-ϕ),意味着企业建立补偿机制获得的正效用高于超时投诉情况下给予消费者的补贴,消费者投诉效用低于补偿差额;而条件

α[cq+(1-θ)c b](1-k1)＞βrq(k2-1)

与定理4(2)的情景相反,骑手的超时成本差额大于风险成本差额。此时,由于平台建立补偿机制可以获得极高的正效用,骑手需要为超时付出极高的成本,而消费者投诉获得的效用较低,故复制动态系统存在稳定点E5(1,1,0)。通过与定理4(2)情景的比较可以看出,超时成本差额与风险成本差额的比较结果是骑手决策的关键因素。

定理4(4)对应的情景为平台建立补偿机制,骑手低风险配送,消费者投诉(情景4)。其条件

意味着骑手的超时成本差额小于风险成本差额,消费者投诉效用高于可获得的补贴差额(u t＞c b(1-ϕ)),且企业建立补偿机制获得的正效用高于企业给予消费者的补贴(u1＞αϕθc b)。此时,建立补偿机制可以极大提升平台社会形象。同时,骑手选择低风险配送可以获得更好的收益,消费者投诉的效用也较高。通过与定理4(1)条件的比较可得出,企业形象提升是平台建立补偿机制的重要动力。

定理4(5)对应的情景为平台不建立补偿机制,骑手高风险配送,消费者投诉(情景5)。这一稳定策略需要的条件u1＜k1αθϕc b为平台建立补偿机制获得的正效用低于企业给予消费者的补贴,而α(cq+c t)(1-k1)＞βrq(k2-1)意味着骑手的超时成本差额大于风险成本差额。此时,建立补偿机制无法给平台带来更好的效益,而骑手选择高风险配送的收益更高。

定理4(6)对应的情景为平台建立补偿机制,骑手高风险配送,消费者投诉(情景6)。该情况是稳定策略的条件为u1＞k1αθϕc b,意味着该企业建立补偿机制获得的正效用高于企业给予消费者的补贴,

意味着骑手的超时成本差额大于风险成本差额,u t＞c b(1-ϕ)意味着消费者投诉获得的效用高于补贴差额。此时,建立补偿机制可以很好地提升平台的正面形象,骑手选择低风险配送会使自己的收入降低,而消费者选择不投诉获得的补贴相对较少。

定理4对缓解“骑手困境”提供了相应的管理启示:

(1) 平台不建立补偿机制,当对骑手超时配送的惩罚较小时,即便更多的消费者会选择对超时投诉,但也可以让更多的骑手选择低风险配送策略。

(2) 若建立补偿机制可以给平台企业带来足够的直接效用,且对骑手超时配送的惩罚并不是充分大的情况下,消费者对骑手的同理心较强(即投诉效用不高)时,可以达到理想状态:平台通过建立补偿机制,促使消费者倾向于不投诉,进而使得骑手更广泛地选择低风险配送策略。显然,若平台企业、公众都对骑手抱有更高的同理心(更低的超时惩罚以及更低的投诉比率),骑手自然会更多地选择低风险配送策略。

(3) 即便是消费者普遍倾向于投诉,若平台建立补偿机制的直接效用足够大,且对骑手的超时惩罚足够小的情况下,也可以达到另一种缓解“骑手困境”的均衡:平台建立补偿机制、骑手选择低风险配送、消费者更多地选择投诉。

值得注意的是,在2020年“骑手困境”引发公众关注之时,美团、饿了么等外卖平台采取了一系列降低骑手超时配送的惩罚、唤起公众对骑手的同理心的做法,如对历史信用好的骑手部分订单超时将不再实施惩罚,在结算付款页面增加“我愿意多等5分钟/10分钟”的选项[27]。这与上述研究结论(2)、(3)相应证。

4 仿真分析

上述分析给出了平台、骑手、消费者三方演化博弈模型的最终稳定策略,但是无法展示演化博弈的演化过程。为了更直观地分析不同情景下系统演化的过程、参与者初始策略的选择以及不同参数变动对演化稳定策略的影响,本节用MATLAB 对三方演化博弈模型进行仿真分析。仿真实验基础标杆的参数设置为:α=0.5,k1=0.2,u1=1,c b=10,θ=0.5,c t=10,cq=8,rq=50,β=0.3,k2=2,u t=12,ϕ=0.1,x=0.6,y=0.7,z=0.4。初始状态设置为(0.6,0.7,0.4)。此外,由于参数设置决定了最终的稳定策略组合,为了分析不同情景的演化过程,后续的实验在标杆参数设置基础上调整某些参数。

4.1 不同情景的演化过程分析

4.1.1情景1与情景5(平台稳定策略为不建立补偿机制)的演化过程在标杆参数设置的基础上,调整u1=0.1(平台建立主动补偿机制可获得的正效应),c b=21(超时机制下的补偿总额),且令c t分别取值10和30,此时稳定策略组合分别为情景1与情景5,决策结果为E2(0,0,1)和E7(0,1,1),即(平台不建立补偿机制,骑手低风险配送,消费者投诉)与(平台不建立补偿机制,骑手高风险配送,消费者投诉)。图1(a)给出了两种情景下的演化过程。可以看出,两种情景下,骑手策略最初均向低风险配送策略演化。但是,在情景5中,当y即将接近于0时,骤然转向y=1,即高风险配送决策。这是因为在骑手投诉成本c t足够大的情况下,骑手可能考虑到配送安全,自身加速意愿并不强烈,选择高风险配送的概率不断降低。但是由于平台选择建立补偿机制,而一旦超时消费者更倾向于投诉,如果骑手不加速,自身将产生过高的损失,所以骑手被迫转向高风险配送决策。

图1 不同情景的演化过程Fig.1 Evolution process of different scenarios

4.1.2情景2与情景3(消费者稳定策略为不投诉)的演化过程在标杆参数设置的基础上,调整c t=16(消费者投诉对骑手的惩罚额),u t=5(消费者投诉效用),并令骑手交通风险成本rq分别取值为17.9和10,此时稳定策略组合分别对应情景2与情景3,三方决策结果为E2(1,0,0)和E5(1,1,0),即(平台建立补偿机制,骑手低风险配送,消费者不投诉)与(平台建立补偿机制,骑手高风险配送,消费者不投诉)。相应的演化过程见图1(b)。可以看出,骑手最初的决策都朝着高风险配送演化。然而,在情景2中,当y接近于1时,骑手又转向低风险配送策略。由于投诉成本c t较高,且平台选择建立补偿机制,骑手配送一旦超时需要负担的代价过多,所以骑手更倾向于选择高风险配送决策。但考虑到风险成本rq太大,且消费者投诉效应u t较少,消费者决策逐渐向不投诉策略演化,缓解了骑手对订单超时的紧张,因而又转向低风险配送。

4.1.3情景4与情景6(消费者稳定策略为投诉)的演化过程在标杆参数设置的基础上,令rq分别取值10和50,符合情景6与情景4的条件,对应的稳定策略组合为E8(1,1,1)和E6(1,0,1),即(平台建立补偿机制,骑手低风险配送,消费者投诉)与(平台建立补偿机制,骑手高风险配送,消费者投诉)。相应的演化过程见图1(c)。可以发现,当rq=50时,y加速向y=0的方向演化;同时,z也快速向z=1的方向演化,在z=0.8 处演化速度逐渐放缓,直至z=1。这意味着,当风险成本极高时,骑手倾向于选择低风险配送,从而导致配送超时的概率极大增加。此时,平台向建立补偿机制决策演化,消费者为了自身效用,又改为向投诉策略演化。

4.2 不同初始状态下情景2的系统演化路径

情景2(平台建立补偿机制,骑手低风险配送,消费者不投诉)是一个理想的均衡状况,也是本文所研究关键问题所在。本节重点考虑不同初始状态下情景2的系统演化路径,分别假设系统初始的策略选择状态为(0.8,0.7,0.4)、(0.6,0.5,0.4)和(0.6,0.7,0.2),进而与基础标杆(0.6,0.7,0.4)进行对比分析。

图2(a)呈现了平台初始意愿变化对系统内演化策略的影响以及各主体在两种初始状态下的演化路径。可以看出,当初始状态由(0.6,0.7,0.4)改为(0.8,0.7,0.4)时,系统演化策略仍稳定于(平台建立补偿机制,骑手低风险配送,消费者不投诉)。随着平台初始意愿x的增加,初始骑手决策向高风险配送策略演化的速度以及消费者向不投诉演化的速度均加快。当z=1时,即消费者完全选择不投诉的情况下,骑手开始关注交通风险,逐渐倾向于以更加安全的速度进行配送。当骑手策略演化至y=1,即低风险配送时,平台需要承担过多的超时赔偿,故平台立即由建立补偿机制策略转为不建立补偿机制。由于在订单超时情况下,消费者没有任何补偿,故逐渐向投诉策略演化,骑手也随之加速。骑手高风险配送且消费者必然投诉会导致平台承担的投诉成本与风险成本过高,所以平台又选择建立补偿机制,而骑手与消费者的策略也逐渐改变。随着不断地演化,最终稳定于(平台建立补偿机制,骑手低风险配送,消费者不投诉)的状态。

图2 不同初始状态对演化策略的影响Fig.2 Impact of different initial states on evolutionary strategies

图2(b)为骑手初始意愿变化对系统内演化策略的影响以及各主体在两种初始状态下的演化路径。显然,当初始状态由(0.6,0.7,0.4)改为(0.6,0.5,0.4)时,系统演化策略仍然不变。随着骑手初始意愿y的降低,即骑手越发不愿冒着高风险进行配送,平台向建立补偿机制策略演化的速度降低,同时,消费者选择不投诉的概率也略有减缓。与上述演化过程相似,最终三方策略稳定于(平台建立补偿机制,骑手低风险配送,消费者不投诉)。

消费者初始意愿对演化策略的影响见图2(c)。可以发现,当初始状态由(0.6,0.7,0.4)改为(0.6,0.7,0.2)时,系统演化策略仍为理想状态。随着消费者初始意愿的降低,在一定阶段内,平台向建立补偿机制策略演化的速度以及骑手向高风险配送演化的速度均减缓。可以发现,在演化前期,由于消费者初始意愿的降低,系统策略在一段时间内稳定于(平台建立补偿机制,骑手高风险配送,消费者不投诉)。当消费者选择投诉的初始意愿较低时,平台决策向不建立补偿机制演化,由于不再担忧消费者投诉,骑手也更倾向于低风险配送。然而,当平台不给予补贴,骑手也不加速配送,消费者的服务体验很可能会显著下降,转而选择投诉,进而促使平台建立补偿机制,骑手高风险配送。不过当平台和消费者的决策分别稳定于建立补偿机制与不投诉时,骑手便不愿再高风险配送,因而逐渐演化至低风险配送。骑手低风险配送导致超时情况过多,平台利益受损,从而取消对消费者的补偿。骑手开始提速,消费者在订单超时也选择投诉。当系统策略处于(平台建立补偿机制,骑手高风险配送)时,消费者的策略又开始变化,经过不断地演化,最终稳定于(平台建立补偿机制,骑手低风险配送,消费者不投诉)。

4.3 不同参数对演化策略的影响

平台对被消费者投诉的骑手惩罚过高,被认为是“骑手困境”的重要原因之一。此外,平台考虑建立补偿机制以及消费者是否接受补偿,很大程度上取决于补偿额度的大小。基于这些原因,本节重点分析骑手投诉成本、补偿额度对于三方策略演化的影响。

4.3.1骑手投诉成本对演化策略的影响图3(a)显示了骑手投诉成本c t对演化策略的影响。随着c t的增加,骑手逐渐倾向于高风险配送。在骑手投诉成本c t足够大的情况下,骑手可能考虑到配送安全,选择高风险配送的概率不断降低,说明骑手本身加速意愿并不强烈。但是由于平台选择了建立补偿机制,而一旦超时消费者必然选择投诉,如果骑手不加速,自身将产生过高的损失,所以骑手被迫转向高风险配送决策。同时,当骑手投诉成本c t不断增加,消费者决策向“投诉”策略演化的速度逐渐减缓,即当消费者知道骑手被投诉后的惩罚过高时,出于对骑手的关怀等原因,消费者投诉的概率逐渐降低。

图3 投诉成本、补偿额对演化策略的影响Fig.3 Impact of complaint costs and compensation value on evolutionary strategies

4.3.2补偿总额对演化策略的影响图3(b)显示了补偿总额c b对演化策略的影响。可以看出,随着c b的增加,消费者投诉的意愿和平台建立机制的意愿越来越弱,而骑手选择高风险配送的概率逐渐升高。当c b=5时,平台虽然建立了主动补偿机制,但是由于赔偿额度较低,消费者面对配送超时的情况,仍然有极大的可能选择投诉;当c b=30时,由于赔偿金额较大,消费者倾向于不投诉,但是平台不愿建立补偿机制,导致消费者的投诉意愿再次提升。因此,为了达到平台建立补偿机制、骑手低风险配送、消费者不投诉的理想状态,c b的取值应当在适当的范围之内。

5 结论

本文通过构建平台、骑手、消费者三方演化博弈模型,分析各方策略选择的稳定性以及一些因素对各方演化策略的影响,并对此进行数值仿真。得出以下结论及管理启示:

(1) 影响平台是否选择建立补偿机制的重要动因是通过建立补偿机制给企业带来的直接效用,如品牌竞争力的提升、市场份额的扩大。

(2) 一定条件下,当消费者向投诉策略演化、骑手向高风险配送策略演化时,平台企业向建立超时补偿机制策略演化。

(3) 影响骑手的策略最关键的影响因素是平台对于骑手超时的直接惩罚额度。当惩罚额度较大时,平台、消费者的任何策略选择都无法改变骑手普遍向高风险配送策略演化的“骑手困境”情况。

(4) 当建立补偿机制给企业带来的直接效用较大且对骑手超时的直接惩罚额度较小时,三方演化策略均衡可能达到理想状态:平台建立主动补偿机制、骑手低风险配送、消费者对于订单超时选择不投诉。

本文有几个潜在的拓展研究方向。首先,本文基于演化博弈模型分析,以揭示三方决策背后的机制与动因为主,未来可以通过问卷、访谈等实证研究方法进一步研究影响三方决策的其他因素;其次,本文主要从平台、骑手、消费者三方角度出发,没有考虑到政府这一政策制定者及监管者角色在配送服务供应链中的作用与责任,引入政府监管决策可以作为下一步的研究方向;最后,不同行业产品(例如食品、工业品、绿色农产品等)配送有各自不同的特点,未来进一步研究可以结合具体的行业特色。