网约车市场发展路径研究
——基于内部竞争和政府监管的双重视角
2021-10-09房立波钟晓敏
房立波,钟晓敏
(1.浙江财经大学中国政府管制研究院,浙江 杭州 310018;2.杭州市发展和改革委员会,浙江 杭州 310020;3.浙江财经大学财政税务学院,浙江 杭州 310018)
一、引 言
2016年《国务院办公厅关于深化改革推进出租汽车行业健康发展的指导意见》(国办发〔2016〕58号)发布后,客运出租市场由此迎来重要的发展机遇期。随着经济体制改革不断深化和人民生活水平日益提高,不断增长的出行需求与服务供给不平衡不充分之间的矛盾逐渐凸显出来。作为城市公共交通的重要补充,客运出租成为满足差异化出行需求的重要途径。然而,从监管实践看,虽然2016年7月中央七部委联合发布的《网络预约出租汽车经营服务管理暂行办法》结束了网约车市场混乱的局面,但网约车市场仍需进一步完善监管政策,优化政府监管机构与网约车平台之间的关系,调整网约车市场体制机制。从社会福利的视角出发,完善监管政策、理清市场内部竞争关系成为下一阶段推动网约车市场健康发展亟需解决的问题。
研究网约车市场发展路径问题需重点关注政府监管和内部竞争两个方面。对此,不同专业研究的重点有所差异。本文认为要想提升研究成果的理论水平,首先,遵循经济规律,把握正确的研究方向;其次,基于法理构建严谨、合理的制度体系框架;最后,基于技术层面提出高效率的实施路径。目前,运用技术方法提高网约车运营效率和科学设计客运出租政府监管法制框架两方面的研究比较充分,而依托管理学和经济学的研究大多集中在政策层面,缺乏对市场参与主体行为动机的客观分析,鲜见针对网约车市场参与主体相互作用的研究。本文运用博弈理论分析网约车市场参与主体之间的行为选择逻辑,重点探讨政府监管机构与网约车平台的监管博弈和网约车平台之间的竞争博弈。一是利用“小偷守卫”博弈模型,强调政府监管是交替选择策略的重复博弈,政府监管需统筹考虑具体监管措施的短期效果和长期影响,并重视监管对象针对具体监管措施采取向前展望和向后推理的效果。二是利用伯特兰德模型和古诺模型,分析网约车平台在不同市场阶段的帕累托最优策略并解释“价格战”的原因,预测未来竞争格局、指出提高经济效率的有效路径。
二、相关文献综述
网约车在促进客运出租行业发展的同时也对巡游出租车市场的稳定造成一定的冲击。为此,相关学者从不同的视角展开研究并取得丰硕的文献成果。(1)利用政府监管理论研究网约车的政府监管问题。王俊豪(2021)认为需根据监管实践需求构建监管有据、运行高效、精准有效、公开透明、激励约束的中国特色政府监管理论体系[1]。唐要家(2021)认为数字经济监管体制创新应坚持审慎包容原则,以促进开放共享和鼓励创新为目标,以维护市场竞争为主要任务[2]。刘长玉等(2019)基于政府、企业与消费者三方协同监管模式构建博弈模型,研究影响三方策略选择的相关因素,建议提高政府监管效率、保障企业产品质量、发挥消费者监督优势[3]。曲国华等(2020)利用三角模糊数构建博弈模型,分析策略选择的影响因素,强调政府引导消费者和惩罚企业的影响[4]。(2)在此基础上,学者从不同视角研究客运出租的政府监管问题。有文献对现行监管政策进行梳理和归纳总结。马亮和李延伟(2018)依据监管政策条款构建监管严格程度的评价指数,并以此评价地方政府的监管政策差异[5]。李金龙和乔建伟(2019)通过梳理规制政策,基于倡议联盟框架建议增强市场主导联盟竞争力,构建“前瞻性”的政府治理机制,以缓解联盟冲突[6]。也有文献重点研究监管路径和体系构建。蒋岩波和黄娟(2020)认为网约车行政规制存在信息不足、效率低下的问题,建议通过明确产权边界、完善规制体系等措施建立网约车司法规制框架[7]。此外,还有文献研究网约车的属性和特征。费威(2018)从质量问题、公共资源、信息、信任、社会福利等方面阐释网约车共享经济的两面性[8]。郝丽华和曹永胜(2018)在肯定网约车共享经济属性的积极作用的同时,着重分析资源浪费、成本增加、风险扩大等问题[9]。其中,运用博弈理论研究网约车的政府监管的文献对本文具有较高的借鉴价值。付淑换和石岿然(2020)分析网约车平台行为及监管策略选择的影响因素,建议引入第三方监督制度,以打破政府无效监管和平台消极管理的均衡,促进行业良性发展[10]。陈璟涛(2017)从博弈论视角分析百色市网络预约出租汽车行业监管问题,利用收益矩阵建立完全静态博弈模型,分析网约车平台与监管部门、监管部门相互之间的行动策略,提出制定实施细则、创新监管思维、完善监管机制等建议[11]。
网约车平台之间相互关系的研究主要集中在定价策略方面。康凯等(2021)构建两个网约车平台的Stackelberg博弈模型并分析平台定价策略,建议劣势平台低竞争强度时效仿占优平台采取中等定价,竞争强度适中时采取低价策略,高竞争强度时应着重提升服务质量[12]。倪玲霖和王泽(2020)利用变分不等式构建网约车市场竞争网络均衡模型,得出成本增加后价格提高且出行量下降、市场主体增加后竞争加剧且价格下降及出行量提升、准入管制导致司机减少且均衡价格增加的结论,验证了模型的有效性[13]。孙中苗和徐琪(2021)运用最优控制论方法构建网约车平台动态定价模型,并利用哈密顿函数及模型推导,得出最优价格可有效调控平台供应能力、乘车需求市场的竞争有助于拉低平台最优价格而乘运市场的竞争将推高价格等结论[14]。卢珂、周晶和林小围(2019)基于双边市场理论,从交叉网络外部性的视角研究网约车平台的市场定价问题,得出交叉网络外部性降低平台定价、时间敏感系数对平台的影响因归属属性不同而存在一定的差异等结论[15]。
学者们从不同角度分析网约车发展存在的问题,但基于经济学和管理学的分析尚不多见,对监管策略、内部竞争行为动机的分析也有待深化,缺少数量竞争的研究成果。本文在已有理论研究的基础上,以提高理论与实践的耦合性为研究目标:从行业的政府监管实践出发,利用博弈模型探讨网约车平台和政府监管机构的动态策略选择,讨论政府监管机构对网约车行业实施监管的制约因素,为网约车平台的政府监管实践提供理论指导;从行业发展的维度,梳理网约车市场竞争格局演变规律,在揭示市场竞争现象的同时分析影响网约车平台收益的因素,从增进社会福利的视角为政府干预市场竞争明确方向。
三、建立分析模型
(一)参数描述
1.建立“小偷守卫”博弈模型,分析政府监管机构与网约车平台之间的博弈策略[16]。设定政府监管机构的群体策略集为{G1(强监管),G2(弱监管)},网约车平台的群体策略集为{W1(守法),W2(违法)}。政府监管机构选择强监管的概率为p、弱监管的概率为(1-p),网约车平台选择守法的概率为q、违法的概率为(1-q)。其中,强监管是指政府监管机构监管成本较高、严格执法等积极监管,弱监管包括玩忽职守、以牺牲公共利益获取私利、大幅减少监管投入等。
2.建立完全信息静态博弈模型,分析网约车平台内部的博弈策略。设定在一个由两个网约车平台组成的市场中,服务价格P与供给量Q具有线性函数关系。在市场发展的第一阶段,网约车平台的价格策略集为A={0,Pmax},博弈策略为同时选择价格水平;在第二阶段,网约车平台的产量策略集为B={0,Qmax},博弈策略为同时选择产量水平。具体变量定义见表1。
表1 符号的意义及说明
(二)模型假设
假设1:政府监管机构的目标是监督管理网约车平台的行为,以确保价格、服务质量和安全保障等符合规定要求[17]。网约车平台的行为动机是根据政府监管策略权衡违法的成本和收益来选择最优策略,以实现收益最大化。不同网约车平台的服务差异很小,高度相互替代,价格-数量函数的参数相同且具有连续函数特征。博弈双方具有完全理性,均基于成本-收益和“以牙还牙”原则选择最优策略[18]。
假设2:网约车平台的固定成本和边际成本均为0,守法只能获得正常利润且净收益为0。违法行为如果不被查处,则能获得风险溢价V;一旦被查处,则需承担额外损失L。网约车市场属于寡头垄断市场,单个网约车平台调整价格或服务供给规模都对竞争对手的收益产生影响。
假设3:政府监管机构与网约车平台之间存在信息不对称,只能以一定的概率发现后者的违法行为。政府监管机构强监管可提高发现网约车平台违法行为的概率,保持较高水平的社会收益,承担较高成本且净收益为0;弱监管且网约车平台不违法,则可节约监管成本S;弱监管且网约车平台违法,则承担较大的损失D。
假设4:监管技术水平相对稳定,政府监管机构的监管力度是影响网约车平台成本的主要因素。随着监管投入不断增加,未被惩处的违法行为数量减少且更隐蔽,发现并惩处的成本更高,且不管投入多少资源都不可能完全消除违法行为。因此,政府监管机构强监管的概率p与监管投入C呈正相关,且增加C对提高p的边际效应递减[19](1)这里,忽略效率因素。。
假设5:外部环境相对稳定,增加违法的额外净收益能诱导守法意识薄弱的网约车平台违法。随着违法的额外净收益的增加,守法的网约车平台的平均守法意识水平也在提高。增加违法额外净收益对具有较强守法意识的网约车平台的效用较小。即使违法的额外净收益很高,强守法意识的网约车平台也能抵挡住诱惑,因此守法的概率始终大于0。网约车平台违法行为发生的概率与违法的额外净收益V呈正相关,则守法的概率q与V呈负相关,且增加V对降低q的边际效应递减[20]。
假设6:政府监管机构与网约车平台的博弈初始处于混合策略纳什均衡状态,V和S为外生变量,L和D为政府可调节和控制的自变量(2)V由违法行为的性质决定,S由监管行为的技术条件等外部环境决定,政府监管机构可调节L中的F1和D中的F2。。短期内,一方因自变量变化而偏离均衡水平,另一方的概率分布保持不变;长期内,一方变化导致另一方的概率分布联动调整,并最终实现新的均衡。
假设7:网约车市场遵循由粗放向集约发展的客观规律。在粗放竞争阶段,主要的竞争方式是降低价格、扩张规模,通过兼并减少市场主体数量;在集约竞争阶段,市场结构相对稳定,主要通过调整供给规模和降低生产成本来实现利润最大化。消费者对价格变化反应敏感,低价策略能使网约车平台迅速、完全占领市场。
(三)建立模型
1.建立“小偷守卫”博弈模型
基于以上假设,我们构建两人的非对称非零和博弈,其得益矩阵如图1所示。令V=R1+C1、D=S+F2、L=C1+F1,简化后的得益矩阵如图2所示。
政府监管机构弱监管强监管网约车平台违法守法(R1+C1,S+F2)(C1+F1,0)(0,S)(0,0)图1 完全信息静态“小偷守卫”博弈的得益矩阵
政府监管机构弱监管强监管网约车平台违法守法(V,D)(L,0)(0,S)(0,0) 图2 简化的完全信息静态“小偷守卫”博弈的得益矩阵
根据模型假设,令政府监管机构的强监管和弱监管策略的期望得益及平均期望得益分别为E(G1)、E(G2)和E(G),网约车平台守法和违法策略的期望得益及平均期望得益分别为E(W1)、E(W2)和E(W),其计算过程如下:
令E(G1)=E(G2),E(W1)=E(W2),我们得到混合策略纳什均衡条件为式(7)、(8)。引入行为策略的影响因素,扩展后的博弈模型为式(9)、(10)。基于假设,C是影响p的主要因素,二者的关系如图3所示;V是影响q的主要因素,二者的关系如图4所示。
图3 政府监管机构强监管的概率与监管成本的关系
图4 网约车平台守法的概率与违法额外净收益的关系
将式(9)、(10)分别代入式(7)、(8),可得:
2.建立价格博弈模型
接下来,我们构建伯特兰德双主体完全信息静态博弈模型,其价格-数量函数和博弈得益分别为:
对式(15)、(16)求偏导数,得到反应函数为式(17)、(18)(如图5所示)。联立反应函数,我们得到纳什均衡解和双方的得益分别为式(19)、(20)、(21):
图5 伯特兰德模型的反应函数
甲合作不合作乙合作不合作(UH,UH)(0,UB)(UB,0)(UL,UL) 图6 完全信息静态削价竞争博弈的得益矩阵
定义双方采用“以牙还牙”策略,合作均衡为串谋均衡,不合作均衡为纳什均衡。一方合作、另一方不合作时,不合作方独占市场获得的利润略低于串谋的双方利润之和(这里,以串谋的市场总利润简化表示,即UB=2UH)。因此,甲对乙触发策略的最佳反应策略的后半部分与触发策略的后半部分一样。问题的关键在于确定甲在第一阶段的最优选择。在第一阶段,如果乙合作、甲不合作,根据模型设定,其后双方均不合作,甲的得益现值为式(22);如果乙合作、甲合作,则第二阶段将重复第一阶段的选择。假定W为甲在该博弈中每阶段均采用最佳策略的总得益现值,重复博弈中总收益是否包含第一阶段不影响结果。第二阶段及以后的得益在第一阶段看来现值均为Wδ,总收益现值为式(23)。由于对称性,乙具有相同的收益。
(22)
(23)
3.建立产量博弈模型
根据假设,我们构建古诺双主体完全信息静态博弈模型,设定价格-数量函数为P=P(Q)=a-bQ(a为常数,b为系数,Q=Q1+Q2),博弈主体的得益为:
对式(24)、(25)求偏导数,可得反应函数为式(26)、(27)(如图7所示)。联立反应函数,我们得到博弈纳什均衡解为式(28)、(29)、(30):
图7 古诺模型的反应函数
从甲偏离合作策略的下一阶段开始,双方将保持古诺产量,不确定结束时点的有限次重复博弈的第一阶段偏离的总得益现值为:
(33)
四、博弈策略分析
(一)政府监管机构与网约车平台之间的博弈
上述博弈矩阵的四个策略组合都不稳定,该博弈没有纯策略纳什均衡。任意一个策略组合,博弈的任一方都有单方面改变策略的动机。当一方改变策略后,对方继而单方面改变策略,双方的交替行动导致博弈策略组合不断变化而没有稳定最优解。一方如果知道对方的策略或了解其策略选择规律,则能相应地调整自己的策略以增加收益(或减少损失)。因此,双方均努力确定对方的策略或策略选择规律,同时极力防止自己的策略或策略选择规律被对方发现。这一结论揭示了在打击犯罪、污染治理、防治腐败等实践中政府监管力度和监管效果此消彼长的原因[21]。政府监管机构加大监管投入导致网约车平台因违法风险增加而减少违法行为,同时少数违法行为得到惩处,相关工作取得显著成效。面对较好的工作成绩,政府监管机构倾向于逐渐减少监管投入,继而因违法风险降低诱导违法行为增多,行业发展再次陷入困境,直至政府监管机构重新增加监管投入。因此,建议政府监管机构保持监管投入力度的稳定,以促进市场的持续健康发展。
如果博弈双方均以一定的概率随机选择策略,则四种策略组合均有可能出现。如果双方的策略选择概率分布均不给对方可乘之机,那么在一方概率分布既定的前提下,对方以一定的概率选择两种策略的期望得益相同,从而没有改变策略概率分布的动机。也就是说,双方均在对方概率分布已知的条件下,通过调整自己的概率分布实现不同策略的相同期望得益,从而实现得益最大化。此时,博弈双方均没有动机单方面调整策略概率分布。p*、q*满足式(7)、(8)的条件时,政府监管机构与网约车平台的博弈实现混合策略纳什均衡,且具有自动向均衡水平回归的特性。如果q 0,根据式(6),网约车平台降低q能增加收益。如果网约车平台降低q,则E(G2)<0,根据式(3),政府监管机构提高p能减少损失。网约车平台守法的概率大于q*时,理性的最优策略是降低守法概率;小于q*时,理性的最优策略是提高守法概率;等于q*时,此时实现均衡,期望收益达到最大值0,政府监管机构的策略概率分布不影响其收益。q偏离q*后将自动向q*回归,最终使E(G2)、E(W2)趋向于0。政府监管机构强监管的概率大于p*时,理性的最优策略是降低强监管概率;小于p*时,理性的最优策略是提高强监管概率;等于p*时,此时实现均衡,期望收益达到最大值0,网约车平台的策略概率分布不影响其收益。p偏离p*后将自动向p*回归,最终使E(G2)、E(W2)趋向于0。该博弈的混合策略纳什均衡如图8所示。 图8 混合策略纳什均衡 政府监管机构以p*概率随机选择强监管,网约车平台以q*概率随机选择守法,双方的期望得益均为最大值0,均没有单方面调整策略概率分布的动力。因此,以p*×q*概率实现得益(0,0),以p*×(1-q*)概率实现得益(L,0),以(1-p*)×q*概率实现得益(0,S),以(1-p*)×(1-q*)概率实现得益(V,D)。此时,网约车市场实现整体均衡,违法未被惩处而获得额外净收益V,选择守法的则没有额外收益,违法被惩处时承担成本L。始终存在一定比例的违法行为,但整体平均收益为0。从时间维度来说,具体的网约车平台违法有时获得收益V、有时承担成本L,守法则没有额外收益,长期平均收益为0。政府监管机构从成本-收益角度综合考虑增加监管成本、提高监管强度的投入-产出效率。此时,政府监管机构实现整体均衡,低监管投入而未被惩处的节约成本S,低监管投入但被惩处的承担净损失D,恪尽职守的则没有额外收益。始终存在一定比例的弱监管,但整体平均收益为0。从时间维度来看,政府监管机构低监管投入有时节约成本S、有时承担净损失D,高监管投入则没有额外收益,长期平均收益为0。政府监管机构监督管理网约车平台的目的不是彻底消除违法行为,而是将违法水平控制在可承受的范围内。监管行为存在成本,需根据边际成本等于边际收益的原则实现收益最大化。 根据假设,政府调整处罚力度的长期和短期效果截然不同,存在激励悖论。根据假设6,提高F1可增加L,短期内政府监管机构强监管的概率仍为p*,根据式(5),E(W2)<0,根据式(6),网约车平台提高q有助于减少损失。提高F2可增加D,短期内网约车平台违法的概率分布仍为q*,根据式(2),E(G2)<0,根据式(3),政府监管机构提高p有助于减少损失。根据式(7),p*与V呈正相关、与L的绝对量呈负相关,与D无关,通过提高F1后增加L将导致p*下降。根据式(8),q*与D的绝对量呈正相关、与S呈负相关,与P无关,通过提高F2后增加D将导致q*上升。因此,短期内加大对违法行为的处罚有助于网约车平台守法,加大对失职渎职行为的处罚有助于政府监管机构加强监管;长期内加大对网约车平台违法行为的惩罚将诱导政府监管机构弱监管而并不能抑制违法行为,加大对政府监管机构的惩罚有助于网约车平台守法而并不能促使政府监管机构积极执法。在新的均衡点,双方得益恢复为0并根据新的均衡概率分布选择混合策略(如图9所示)。 图9 政府监管机构和网约车平台的混合策略 纳什均衡具有稳定性,串谋则面临“囚徒困境”。在两人博弈的基础上增加反应函数的数量并联立方程组求纳什均衡解,可将研究结论扩展到多主体博弈。由于UB>UH>UL,双方均清楚串谋是帕累托最优结果,但都无法信任对方,难以抵制利用对方信任单独降价而独占市场的诱惑。双方在价格博弈中面临“囚徒困境”,不管对方的具体策略如何,降价总是占优策略,最终博弈将稳定在(UL,UL)的策略组合。 进一步地,我们摆脱“囚徒困境”的严苛条件。如果W>U,则甲的最优策略为合作,反之则不合作。实现合作策略需满足的条件为: (34) 因为无限次重复博弈是否从第一阶段开始并不影响结果,剔除已发生的,则需做出选择的阶段均可视为第一阶段,所以δ满足式(34)能保障博弈维持合作均衡。由于博弈的对称性,保证乙维持合作的δ需满足相同的条件。 δ的实际值与市场利率、通货膨胀预期、博弈时长等因素呈负相关。当δ的实际值大于δ的阈值时,随机结束的有限次重复博弈有望走出“囚徒困境”,反之则深陷其中。δ的阈值越大,δ的实际值高于阈值的概率越小,走出“囚徒困境”越困难,反之则相对容易。δ的实际值越大,高于既定阈值的概率越大,合作的未来收益现值越大,现阶段自己合作而对方不合作给自己造成的损失与双方均保持合作而获得未来收益的现值相比越无足轻重,走出“囚徒困境”越容易,反之则相对困难。自己选择不合作虽能获得一次性收益UB,但与合作保留持续获得UH收益的潜在可能相比,δ越大,合作的吸引力越大。因此,走出“囚徒困境”的概率与δ的阈值呈负相关、与δ的实际值呈正相关。根据无限次重复博弈的民间定理,在双寡头削价竞争的重复博弈中,由(0,UB)、(UH,UH)、(UB,0)、(UL,UL)四点合围区域内的点表示所有可实现得益,其中斜线部分点的坐标对应的得益组合均可通过子博弈完美纳什均衡实现(如图10所示)。 图10 双寡头削价竞争无限次重复博弈的民意定理 此外,如果动摇博弈双方完全理性的基础条件(即博弈的信息不完美甚至不完全,至少博弈一方不再拥有追求个体利益最大化的“个体理性”或完美分析判断选择能力的“完全理性”),则“极大化极小策略”将影响纳什均衡的结果。当双方均意识到行动的风险并怀疑对方的理性时,为降低风险倾向于根据风险上策均衡做出选择,从而实现与帕累托上策均衡结果差异明显的其他均衡结果。由于风险上策均衡具有自我强化的反馈机制,最初只是怀疑对方可能采取风险上策均衡策略,最终将推动相对低效率的风险上策均衡成为现实。如果博弈为多主体博弈,随着博弈主体的数量增加,基于风险上策均衡达成合作的概率将以几何级速度降低。 与上述的价格博弈一样,在两人博弈的基础上增加反应函数的数量并联立方程组求纳什均衡解,也可将研究结论扩展到多主体博弈。同价格博弈类似,数量博弈也面临“囚徒困境”。双方均清楚串谋是帕累托最优结果,但都无法信任对方,难以抵制利用对方信任单独增产抢占市场份额而增加利润的诱惑。对双方而言,不管对方的具体策略如何,增产总是占优策略,最终博弈将稳定在古诺均衡水平。 同样地,我们摆脱“囚徒困境”的严苛条件。如果W>U,则甲的最优策略为合作,反之则不合作。联立式(32)、(33),可得ε>9/17。由于博弈的对称性,保证乙维持合作的ε亦需满足上式。当ε的实际值大于9/17时,博弈双方的串谋是最优策略;反之,古诺产量是最优策略。ε越大,合作的未来收益现值越大,现阶段自己合作而对方不合作造成的损失与双方均合作时获得未来收益的现值相比越无足轻重,合作的概率越大。自己选择不合作虽能获得一次性收益9a2/64b,但与合作保留持续获得a2/8b收益的潜在可能相比,ε越大,合作的吸引力越大。ε的阈值为常数,ε的实际值与市场利率、通货膨胀预期、博弈时长等因素呈负相关,因此合作的可能性与上述因素呈负相关。 与伯特兰德模型一样,双方虽然都清楚合作对双方最有利,但均有增加产量以获得额外利润的冲动,最终串谋限产协议因相互猜忌而破产。虽然理论上无法明确结束时点的有限次重复博弈有望在ε满足一定条件时可通过“以牙还牙”策略保持合作均衡,但实践中很难具备完全理性的条件。在信息不完美甚至不完全的条件下,质疑博弈双方的“个体理性”或“完全理性”,风险上策均衡策略有可能取代帕累托上策均衡策略。由于风险上策均衡具有自我强化的反馈机制,增加网约车平台数量将可大幅降低成功串谋的概率。 本文运用“小偷守卫”博弈模型研究政府监管机构与网约车平台的博弈过程,考察博弈双方策略选择的路径,分析博弈混合策略纳什均衡的稳定性及博弈策略长短期的效果差异。在此基础上,通过引入监管资源投入和违法净收益等变量扩展“小偷守卫”博弈模型,为政府根据实际监管需要通过调整相应变量来提高监管效果指明了路径。基于市场发展规律建立两阶段博弈模型,利用伯特兰德模型分析市场扩展阶段的价格竞争、古诺模型分析市场稳定阶段的产量调整,并将两个完全信息静态博弈扩展为不确定结束时点的重复博弈,阐述网约车平台价格战难以避免的原因及相应措施存在的局限性。 第一,与政府监管机构博弈的网约车平台不是具体企业,而是整个行业。网约车平台与政府监管机构的博弈是一个交替采取行动的过程。从发现对方的策略选择到调整己方的策略选择的时间周期较长,特别是政府监管机构调整监管强度需经过前期调研、内部研究、逐级上报、决策审批、资源筹集、组织实施、效果评估等阶段。但从短周期看,双方依然表现为纯策略博弈。 第二,存在混合策略纳什均衡的研究结论要求政府监管具有前瞻性,注意区分长短期效果,重视博弈参与主体对具体博弈策略向前展望和向后推理产生的持续影响。短期内具有较强针对性的政策措施在长期将因监管对象的适应性调整而失效。 第三,引入影响变量,从而明晰监管策略调整路径。虽然混合策略纳什均衡在实践中很难实现,但根据均衡概率分布可确定政府监管机构最优资源的投入规模。即使不知道均衡概率分布,但从可观测、可调整的监管资源投入入手,确定对网约车平台的惩罚力度。实际上,图3中强监管的概率与监管成本曲线上的任意点都可作为均衡概率分布,只是对应的监管成本和对网约车平台违法行为的惩罚力度存在差异。网约车平台的均衡守法概率因违法行为的额外净收益不同而存在差异,因而需根据违法性质实施分类监管。由违法净收益的大小确定守法概率,进而调整对政府监管机构的惩罚力度。将二者综合起来考虑,网约车平台高违法净收益的违法行为的守法概率较低,长期内需对政府监管机构配套实施较大力度的惩罚。因为违法净收益较大,如果受监管资源限制能达到的政府强监管均衡概率较小,则需大幅提高对网约车平台的惩罚力度才能保持平衡;如果能实现较高水平的强监管概率,则对网约车平台的惩罚力度可相应降低。反之亦然。 第五,在网约车市场发展初期,网约车平台存在为抢占市场展开补贴大战的行为动机。在滴滴与优步合并前的价格战中,政府干预这一不正当竞争后,竞争主体采取差异化竞争策略而暂时告一段落,意味着竞争格局趋于稳定,竞争将由价格转向数量和质量。为增进社会福利,政府仍需努力巩固数量博弈“囚徒困境”的稳定性:一是根据贴现系数的影响因素,通过延长博弈时长、增加未来的不确定性等方式降低贴现率:二是建立由政府主导的网约车平台并发挥其“鲶鱼效应”,促进市场主体之间的竞争:三是干扰市场信号的传递,塑造市场主体不具有“个体理性”和“完全理性”的形象,发挥“极大化极小策略”在数量决策中的作用。q*,则E(G2)>0,根据式(3),政府监管机构降低p能增加收益。如果政府监管机构降低p,则E(W2)>0,根据式(6),网约车平台降低q能增加收益。如果p>p*,则E(W2)<0,根据式(6),网约车平台提高q能减少损失。如果网约车平台提高q,则E(G2)>0,根据式(3),政府监管机构降低p能增加收益。如果p
(二)网约车平台之间的价格博弈
(三)网约车平台之间的数量博弈
五、结 语