基于随机反应均衡的供应链激励机制设计
2023-09-25江泽武赵晓波朱万山谢金星
江泽武, 赵晓波, 薛 超, 朱万山, 谢金星
(1.清华大学 工业工程系,北京 100084; 2.中国人民大学 商学院,北京 100872; 3.清华大学 数学科学系,北京 100084)
0 引言
近年来,机制设计在供应链管理中受到关注,其能有效地解决非对称信息导致供应链效率受损的问题。PLAMBECK和DENEND[1]指出大型零售商(如沃尔玛等)通过设计激励机制来确保供应商做出与其私有信息相符的决策。具体而言,零售商可能不知道供应商的确切成本构成,例如原材料成本、劳动力成本等,但供应商知晓自身的成本信息。此时,零售商为了最大化自己的期望利润,她可通过设计合同菜单,其包含多个合同,每个合同根据不同的供应商成本指定相应的批发价和订货量。面对合同菜单,供应商选择一个特定合同来最大化自身的期望利润。ÇAKANYILDIRIM等[2]考虑由零售商设计订货量和供应商利润占比的合同菜单时,发现该机制在特定条件下可实现供应链协调。类似地,当供应商不知晓买家的私有信息时,他也可通过激励机制的原理来指定批发价和订货量合同菜单,并将合同菜单提供给买家选择。LEE和YANG[3]研究两个同质的供应商,通过设计数量折扣和两部收费两种机制来分析具有私有需求信息的零售商竞争博弈。LI等[4]考虑两个异构供应商给拥有私有需求信息的零售商设计最优激励机制。
上述机制设计研究假设决策者是完全理性的。标准理论采用纳什均衡来预测博弈参与者的决策,其假设每个参与者的策略都是对其他参与者策略的最优反应。然而,行为经济学、行为运筹等领域进行大量的实验研究,揭示真实人的决策大多情况下是有限理性的,通常伴随着一些决策误差[8]。随机反应均衡(QuantalResponse Equilibrium, QRE)是行为经济学对纳什均衡的拓展而形成的均衡概念,由MCKELVEY和PALFREY[5]首先在博弈实验分析中使用。该理论认为,博弈各方在计算每个策略的期望效用时,由于人的有限认知能力,体现出有限理性的特征,从而导致在实际决策中并不以概率1选择纳什均衡解。
近年来,在供应链管理实证研究中,决策者的有限理性受到广泛关注[6,7]。CHEN等[6]、CHEN和ZHAO[7]研究完全信息下和不完全信息下的配货博弈,发现参与者在博弈过程中表现出显著的有限理性。KALKANCI等[8]研究人—人实验下各种不同复杂程度的供应链合同设计,发现由于有限理性和公平偏好等行为使得简单合同有时能取得更好的绩效。KATOK等[9]通过实验研究亦发现,基于批发价合同的供应商和零售商的博弈决策都存在显著的有限理性。关于非对称信息下机制设计的行为理论和实验研究相对较少。JOHNSEN等[10]通过设计人-机交互的行为实验,考察零售商拥有私有需求信息时供应商提供有限预付费和订货量合同菜单的情形,发现有限理性等决策行为能够有效地解释零售商的决策。
现有的研究工作,一方面,关于激励机制设计方面的研究,均未考虑人的有限理性行为;另一方面,关于有限理性方面的研究,均未考察在激励机制背景下的情形。若将随机反应均衡引入激励机制设计中,则会影响激励相容和激励参与约束的有效性,从而使得传统的机制设计理论并不总是成立。
本文的研究工作是将随机反应均衡引入到供应链激励机制设计中,建立依据反应函数的概率选择分析框架。模型中考虑由一个零售商(设计合同菜单)和一个供应商(拥有私有成本信息)组成的供应链,零售商设计包含批发价和订货量的最优机制。我们希望通过这一研究,将供应链管理中非对称信息下的标准激励机制设计拓展至最优反应均衡的激励机制设计,启发零售商在设计激励机制时考虑供应商的有限理性等行为,以改善供应链管理的效率。
1 问题描述
考虑由一个上游供应商(记作“他”)和一个下游零售商(记作“她”)组成的两级供应链系统。零售商售卖产品的市场价为p=a-q,其中q表示从供应商处采购并销售到市场的产品数量,a代表市场规模。我们考虑非对称信息:供应商的单件生产成本有低成本(cl)或高成本(ch)两种类型,供应商知道自身的成本类型;但零售商并不确切知晓供应商的生产成本,只知道其属于两种类型中的一种。假定a>ch>cl以避免无意义的解。
具体地,类型为t∈{l,h}的供应商拥有单件生产成本ct。在决策过程中,零售商无法观测到供应商的类型,只知道供应商是属于类型l的概率为v,属于类型h的概率为(1-v)。
图1表示双方交易过程中事件发生的顺序,类似传统机制设计中的事件流[2,3,11]。首先,零售商设计合同菜单(一个合同由批发价和订货量构成)并提供给供应商;然后,供应商选择其中一个合同或拒绝合同;最后,若某个合同被选择,供应商交付相应数量的产品,并获取收入;零售商销售产品到市场,并结算利润。若供应商拒绝合同,双方均不会获利。
图1 交易过程中事件发生的顺序
2 完全理性下的激励机制设计
假设零售商和供应商均为利润最大化的理性决策者。考虑供应商的私有成本信息,我们对零售商设计最优的激励机制进行建模分析。依据标准机制设计理论[11],零售商为两种类型的供应商设计激励机制M={(wt,qt)|t∈{l,h}},若供应商的成本类型为t,选择某个合同d∈{l,h},即(wd,qd),那么市场零售价为pd=a-qd,零售商单件产品的利润为pd-wd=a-qd-wd,则零售商和供应商的利润分别是
(ΠR(d|M)=(a-qd-wd)qd,∀d∈{l,h})
(1)
(2)
从零售商的角度进行分析,因其只知晓供应商以一定概率为不同的成本类型,故最大化自身的期望利润为:
(3)
标准机制设计理论表明,零售商在设计最优的激励机制时,需要确保满足激励相容(Incentive Compatibility)约束和激励参与(Individual Rationality)约束,如下所示:
(4)
(5)
公式(4)为激励相容约束(IC),表明类型为t的供应商选择类型为t合同而获得的利润比选择类型d≠t合同而获得的利润要高。因此,激励相容约束能够确保该激励机制分离供应商私有成本信息。公式(5)为激励参与约束(IR),标准模型假定参与约束的保留利润为零。激励参与约束使得各种类型t的供应商选择类型为t的合同时,均能获得大于或等于零的利润,从而确保供应商能达成交易。值得说明的是,供应商也可以选择拒绝合同,如图1流程所示,但拒绝合同导致双方利润均为零,显然对零售商也不利。
在分析非对称信息下的最优激励机制之前,首先考虑完全信息下的最优机制,作为参照基准。在完全信息下,其最优批发价和订货量如下所示。
引理1完全信息下的最优机制是wFB=c,qFB=(a-c)/2。
引理1中,上标FB代表“第一最优”。在该最优机制下,供应链渠道的利润实现最大化,且批发价等于供应商的生产成本c,易得最优订货量为(a-c)/2。此时,供应商的利润为零,零售商的利润等于供应链渠道的利润。该最优机制有助于研究非对称信息对最优机制设计和供应链绩效的影响。接下来分析供应商的成本信息不对称时零售商的激励机制设计问题。
命题1不完全信息下的最优激励机制是:
(6)
命题1发现非对称信息下的最优激励机制设计的表现形式会收到市场规模a的影响。当市场规模较小时,高成本类型的合同参数均为零,表明激励机制仅与低成本类型供应商进行交易而排除高成本类型供应商;当市场规模较大时,两个类型合同参数均大于零,表明既可与低成本供应商进行交易亦可与高成本供应商进行交易,从而使得激励机制能够有效分离供应商的私有成本类型信息。
3 随机反应均衡下的激励机制设计
标准机制设计以完全理性人为前提假设,认为博弈参与者总是能够完美地实现推理和最优测算。然而,行为经济学、行为运筹管理等领域的大量研究表明,人们的实际决策与标准理论存在很多差异。为了更实际地刻画决策者的博弈行为,本章构建相应的行为决策模型。
3.1 完全信息下随机反应均衡的机制设计
首先分析完全信息下的随机反应均衡的最优机制设计,为不完全信息下的随机反应均衡的最优机制设计提供参照。
当供应商的生产成本是完全信息时,零售商提供单合同机制M=(w,q),其中合同批发价不小于供应商的生产成本c。若供应商接受该合同,则零售商得到利润为(a-q-w)q。考虑到随机反应均衡,决策者并不是绝对选择纳什均衡解,其决策依赖于某个概率。假设供应商接受合同(w,q)的概率为P,零售商最大化其利润
(7)
若供应商拒绝合同,双方利润均为零。供应商收到零售商提供的机制M时,需要在可行域{接受合同,拒绝合同}做出决策。依据随机反应均衡模型[5],供应商接受合同的概率P为
(8)
其中ΠS(M)是供应商接受合同时的利润(w-c)q。当λ→+∞时,供应商总是选择利润最大的决策,则零售商的最优机制与完全理性下的情形一致,即引理1。当λ→0时,供应商以等概率在可行域{接受合同,拒绝合同}做出随机选择,零售商的最优机制为“第一最优”的纳什均衡解w*=c,q*=qFB。由于供应商以等概率随机选择接受合同或拒绝合同,导致零售商和供应链渠道的期望利润仅为λ→+∞情形下相应利润的一半。接下来考虑有限理性处于0<λ<∞的范围时随机反应均衡下最优机制设计。
命题2在完全信息下,随机反应均衡的最优机制的批发价和订货量满足:
(9)
从命题2可看出,随机反应均衡的最优机制的订货量q*为“第一最优”的纳什均衡解,与有限理性参数λ无关,表明该情形下供应商渠道利润并未明显受损。最优批发价是一个关于有限理性参数λ的隐函数,求解得到最优的批发价是分段函数:当有限理性参数处于0<λ≤8/(a-c)2时,最优批发价等于供应商的生产成本,即w*=c;当有限理性参数处于8/(a-c)2<λ≤∞时,最优批发价随着有限理性参数λ的增加先增加后减小,与完全理性下的最优批发价显著不相同。考虑到隐函数性质较为复杂且难以得到闭式解,接下来将通过数值算例来进一步分析有限理性λ对完全信息下最优机制设计和供应链渠道绩效的影响。
设置基础参数:供应商的生产成本为c=3,市场规模为a=27(满足a>c)。有限理性参数λ为0.01~1,参考供应链合同设计的相关行为实验和理论[7,10]得到。
最优机制的批发价和订货量随着有限理性λ的变化趋势如图2所示。可以发现,最优订货量保持不变,与“第一最优”的纳什均衡解一致。最优批发价随着有限理性λ的增加表现出三阶段的变化:先不变,然后增加,最后减少。与完全理性下最优批发价的性质明显不同。第一阶段:当理性程度极低时,最优批发价等于供应商的生产成本c;第二阶段:理性程度较低时,最优批发价随着理性参数λ的增加而增加;第三阶段:理性程度较高时,最优批发价随着理性参数λ的增加而减少。若理性参数λ趋近于正无穷,最优批发价与完全理性下的引理1一致。
图2 完全信息下最优机制的批发价和订货量随着有限理性λ的变化规律
上述最优机制的机理是受到最优反应均衡模型的影响。从零售商的目标函数可发现,其期望利润等于(a-q-w)q与接受合同概率P的乘积,最优订货量保持为常数q*=(a-c)/2,使得利润函数是随着批发价单调递减的线性函数,对w的导数为-q*;而概率P=eλ(w-c)q/(eλ(w-c)q+1)是随着批发价单调递增的函数,∂P/∂w>0且∂2P/∂w2<0。当有限理性参数λ极小时,无论批发价取多少,供应商均以随机等概率选择接受或拒绝合同,故最优批发价等于供应商的生产成本;当有限理性参数λ较小时,增加批发价带来合同被接受的概率P的增益,强于增加批发价带来的利润损益,故最优批发价随着λ的增加而增加;当有限理性参数λ较大时,供应商理性程度较高,接受合同概率很高,通过提高批发价从而提高接受合同概率P的效果不明显,弱于降低批发价带来的利润提升,故最优批发价随着λ的增加而降低。
进一步考察有限理性对供应链绩效产生的影响。图3揭示最优机制下供应链各方的期望利润随着有限理性λ的变化规律。左面板显示零售商的期望利润随着有限理性λ的增加,先不变后快速增加。其原因是当有限理性极小时,最优的批发价等于生产成本,而交易达成的概率也基本保持不变,故先保持不变;后续快速增加,是由于随着供应商理性程度的提高,其接受合同的概率快速上升,使得零售商的收益快速上升。图3右面板显示供应商的期望利润随着的增加,呈现先不变、然后增加、最后减少的变化趋势,与最优批发价关于有限理性的三阶段相关。右半图还展示供应链渠道的期望利润随着λ的增加先不变,然后快速增加。供应链渠道的期望利润与接受合同概率P呈现线性正相关,也说明随着λ的增加,接受合同概率P保持单调上升,从而使得供应链渠道绩效增加。若λ的趋近于正无穷时,零售商获取供应链渠道的全部利润,供应商的利润为零,与引理1中完全理性下的情形一致。
图3 完全信息下最优机制的供应商各方期望利润随着有限理性λ的变化规律
3.2 不完全信息下随机反应均衡的激励机制设计
考虑到供应商的生产成本是私有信息,零售商不知晓供应商具体的生产成本,仅知晓其可能的成本参数cl,ch和对应的概率v,(1-v)。零售商为供应商设计机制M={(wt,qt)|t∈{l,h} },若供应商选择某个合同(wd,qd),其利润为(a-qd-wd)qd。考虑到随机反应均衡模型,假设成本类型为t的供应商选择合同(wd,qd)的概率为Pt(d),零售商最大化其期望利润:
(10)
供应商收到零售商提供的激励机制M时,需要在可行域{合同l,合同h,拒绝合同}做出决策。传统机制设计理论假设代理人永远选择利润或效用最大化的决策,激励相容约束尤为重要。零售商设计的最优机制使得低(高)成本类型供应商选择低(高)成本类型合同获得的利润优于选择高(低)成本类型合同带来获得的利润,从而分离供应商的私有成本信息。考虑到决策者实际存在随机反应均衡的决策行为[5],即便某一成本类型供应商选择与其成本类型不相符的合同获得的利润较少,他依然会以一定的概率做出这样的决策,从而导致激励相容失效。类似地,激励参与约束也可能会失效,即供应商以一定的概率选择相应的合同,而不会完全排除拒绝合同的选项。
考虑随机反应均衡模型,重新定义供应商的决策行为,成本类型为t的供应商选择合同(wd,qd)的概率为
(11)
考虑到随机反应均衡模型的复杂性,难以得到闭式解,我们主要通过数值算例来探究有限理性λ对不完全信息下最优机制设计以及对供应链渠道绩效的影响。大量数值算例表明,当市场规模较低时,满足a≤(ch-vcl)/(1-v),有限理性下的最优机制以单合同的形式出现;当市场规模较高时,满足a>(ch-vcl)/(1-v),有限理性下的最优机制出现可能双合同结构。
数值算例参数如下:供应商的生产成本分别为低成本cl=3、高成本ch=9以及概率v=0.5、(1-v)=0.5,市场规模为a=12,15(满足a≤(ch-vcl)/(1-v))和a=21,27,42(满足a>(ch-vcl)/(1-v)),有限理性参数0.001~2的范围内,步长0.001。
若市场规模较小(满足a≤(ch-vcl)/(1-v))
图4 不完全信息下最优机制的批发价和订货量随着有限理性λ的变化规律(市场规模较小)
接下来探究最优机制形成的机理。当市场规模较小时,最优机制设计仅与低成本类型的供应商交易。该情形与命题1中传统的机制设计类似,仅与低成本类型供应商进行交易而获得的利润是高于与两种成本类型供应商均进行交易而获得的利润。此外,考虑随机反应均衡,不完全信息下的最优机制退化成单合同形态,其最优批发价随着有限理性λ的变化规律,与完全信息下的最优机制类似;最优订货量随着有限理性λ的先减少后增加,当有限理性λ较小时,高成本类型的供应商可能以一定的概率接受合同,从而使得最优订货量处于(a-ch)/2和(a-cl)/2之间进行波动,当有限理性λ较高时,高成本类型的供应商接受合同概率几乎可以忽略,故最优订货量收敛至低成本类型的“第一最优”的纳什均衡解。
上述分析表明,有限理性对不完全信息下的最优机制产生显著的影响。进一步探究有限理性对不完全信息下最优机制的供应链绩效产生的影响。图5左面板展示零售商的期望利润随着有限理性参数λ的增加呈现先降低后增加的趋势。图5右面板展示随着理性参数λ的增加,供应商的期望利润先增加而后逐步降低,供应链渠道的期望利润逐步增加。
图5 不完全信息下最优机制的供应商各方期望利润随着有限理性λ的变化规律(市场规模较小)
若市场规模较大(满足a>(ch-vcl)/(1-v))
图6 不完全信息下最优机制的批发价和订货量随着有限理性λ的变化规律(市场规模较大)
我们进一步讨论有限理性对不完全信息下最优机制对供应链绩效产生的影响,如图7所示,与市场规模较小的情形类似。零售商的期望利润随着有限理性参数λ的增加呈现先降低后增加的趋势。供应商的期望利润先增加而后逐步降低,供应链渠道的期望利润逐步增加。
图7 不完全信息下最优机制的供应商各方期望利润随着有限理性λ的变化规律(市场规模较大)
4 结论
本文研究零售商面对拥有私有成本信息供应商的最优激励机制设计。首先,分析完全理性下的最优策略,结果表明,当市场规模较小时,最优机制仅与低成本类型供应商交易;当市场规模较大时,可与两种类型供应商交易,且面对低成本类型供应商时总能实现渠道最优,而高成本类型时的最优订货量偏离渠道最优。然后,引入随机反应均衡模型,从而分析有限理性下的激励机制设计。结果表明,完全信息下最优订货量始终保持渠道最优,最优批发价随着供应商理性程度的上升先增加后减少,并收敛至完全理性下的最优策略。最后,研究不完全信息下随机反应均衡的激励机制设计,结果表明,当市场规模较小时,最优机制仅提供低成本类型供应商正收益的合同,最优批发价随着供应商理性程度的上升先增加后减少;当市场规模较大时,随着供应商理性程度的上升,最优机制逐步呈现三个状态:仅提供低成本类型供应商正收益的单合同,提供两种类型供应商正收益的单合同,提供两种类型供应商正收益的合同菜单。若供应商理性程度趋近于正无穷,最优机制收敛至完全理性下最优策略。
本文进一步考察了有限理性对最优机制下供应链绩效的影响。首先,有限理性下的供应链整体渠道利润小于完全理性下的供应链整体渠道利润,即有限理性会带来供应链渠道绩效受损。然后,完全信息下,零售商和渠道的期望利润随着有限理性的增加而单调增加;供应商的期望利润在其理性程度极低或极高时均较少。最后,不完全信息下,渠道的期望利润随着有限理性的增加而单调增加,零售商的期望利润在供应商理性程度极低或极高时较高,供应商的期望利润在其理性程度极低或极高时利润较少。上述结果主要源于供应商理性程度极低时,可能接受利润极小甚至负收益的合同,从而使得供应商期望利润较低;而供应商理性程度极高时,供应商接受利润极小的合同,使得零售商能获取更大的利润空间。
本研究主要考虑在有限理性下,上游供应商拥有私有成本信息而零售商设计激励机制(由批发价和订货量构成)。基于此,可能在诸多方面进一步拓展。例如,在有限理性下,考察不同类型的机制设计,包括常见的收入分享合同或回购合同;不同类型的非对称信息,下游零售商可能拥有私有市场需求信息等。本文关于激励机制设计的行为理论研究为其他考虑行为的机制设计研究提供了一个参考框架。