基于消费者惰性与企业需求学习的动态定价
2019-07-03毕文杰胡兵伟
毕文杰,胡兵伟
(中南大学 商学院,湖南 长沙 410083)
一、引言
在收益管理中,一方面,随着行为特征、心理因素等被引入到运营管理领域,根据这些特性来研究消费者购买决策过程和企业定价成为收益管理领域的研究热点[1],其中消费者惰性拖延普遍存在且尤为突出,然而,很多企业在对产品进行定价时都忽视了这一关键因素。随着大数据云服务的兴起,Palacios et al.[2]研究发现惰性行为和选择成本对使用云服务的直接与间接作用。另一方面,科学而灵活地运用动态定价是企业提高利润普遍使用的有效方法,而需求预测直接影响着动态定价的科学有效性。现有的大多数收益管理文献都侧重于优化步骤,并假定所有参数都是已知的,而需求的不确定性是非系统的,不可预测的[3]。近年来信息技术的快速发展使得一些公司开始学习根据需求的变化动态调整价格[4],因此现实中的收益管理优化受多种因素影响,不能统一而论。
在消费者惰性研究方面,Su[5]定义了消费者惰性,一种抑制消费者做出购买决策的内在倾向,即使立即购买对消费者更有利,一些消费者仍会延迟购买;并建立了一个求取消费者惰性的两阶段模型应用到动态定价领域。Zhao et al.[6]研究了寡头垄断企业销售易逝性产品的多期定价策略,证明了惰性强度与最优定价呈负相关。考虑到消费者可能退货,姜宏等[7]建立了基于顾客惰性行为的无理由退货策略的数学模型,发现最优退货价格为产品的清货价格与边际惰性效用贡献率之和。Pot et al.[8]将研究扩展到双寡头企业中来,发现了消费者惰性对双寡头企业定价和市场份额的影响。Zou[9]通过实证探索了企业发布新品定价对消费者学习与惰性的影响,结果表明低价更能激发消费者学习与惰性,而且惰性对定价影响程度更大。Radner et al.[10]考虑面向有限理性消费者时网络商品的动态定价,这与理性预期均衡价格形成了对比。Chen et al.[11]提到将消费者惰性和需求学习等行为因素结合到动态定价模型中是一个潜在的研究方向。Dillenberger et al.[12]重新定义了惰性行为并提出了捕捉惰性行为的公理以辅助决策。上述综述表明近年来消费者惰性行为表现突出,但学者们对其研究过于单一,很少考虑到企业的需求学习行为,而且对考虑消费者惰性情况下企业如何动态定价以最大化利润尚未深入探讨。
尽管多数收益管理文献往往假设需求不确定是非系统的进而无法预测。然而,一些学者已经开始了进一步研究。一方面,一些学者假设顾客到达率或其购买概率未知。Aviv et al.[13]假定在垄断环境下,顾客到达市场是一个马尔可夫过程,但到达率未知,通过建立贝叶斯需求学习模型,得到了最优价格策略。Levina et al.[3]则假设顾客到达市场服从伯努利随机过程,但销售概率未知,作者建立了贝叶斯需求学习模型,并提出了计算后验概率的聚合算法(aggregate algorithm)。Talebian et al.[14]在探索新产品投放市场时假设顾客到达服从Gamma分布,但消费者选择产品概率未知。另一方面,一些学者则进一步探讨了需求函数不确定的动态定价问题。当产品库存有限时,Den et al.[15]运用价格实验法,利用每个销售期的价格与销售数据,通过最大似然估计得到每一期需求函数的未知参数。基于Den et al.[15]的研究,Besbes et al.[16]研究了多期单产品动态定价问题,计算了使用简单参数的需求模型所带来的收益损失。当产品库存充足时,Chen et al.[17]研究表明信息充分性与最优价格正相关,进行贝叶斯学习企业相比非学习企业获取更多的利润。申成霖等[18]采用数理模型和数值分析研究了需求学习对于供应链的定价、订货决策的影响,发现需求学习可缓解顾客策略行为的负面影响。
综合上述研究,学者们对将惰性和需求学习结合到动态定价中的研究较少且无固定有效的方法体系。基于上述研究现状,本文同时纳入消费者惰性与企业需求学习,研究有限期内销售有限库存的企业如何进行动态定价才能效益最大化。本文主要贡献如下:(1)运用马尔科夫决策过程理论建立了有限期随机动态定价优化模型,并通过动态优化得出了最优定价策略;(2)通过数值仿真对比分析了是否存在企业需求学习情况下消费者惰性对价格和利润的影响,证明了需求学习的有效性;(3)探索了惰性对单位产品边际利润和单位产品未来边际利润损失的影响。
二、模型构建
(一)背景描述与符号说明
本文考虑的是垄断情况下T期动态定价问题,时期是离散的,由t表示。企业在T期内销售易逝性产品,t=T表示计划销售期的开始,t=0表示销售期结束。本文旨在研究消费者惰性和企业需求学习对企业定价策略和收益的影响,而惰性是非理性因素中常见的一种[5],为了凸显惰性的作用,假设其他非理性因素的影响很小且可忽略。基于Radner et al.[10]对考虑有限理性消费者情况下网络产品定价问题的研究,本文将市场中的消费者分为两类,即理性消费者和惰性消费者,当惰性强度为0时,消费者是理性的,当惰性强度大于0时,消费者是惰性的或称为有限理性的。对于理性消费者来说,如果立即购买对其更有利,则其会选择立即购买;然而,对于惰性消费者而言,由于惰性是一种抑制消费者做出购买决策的内在倾向,所以在很多情况下,即使立即购买对其更有利,其仍然可能选择延迟购买。假设消费者在第t期到来,并于第t期内任意时刻做出购买决策。消费者的效用主要来自于消费者对产品质量的认知、购买价格和惰性强度等。
本文使用符号说明与假设如下:
T:T={1,2,…,T}为整个销售期,t∈T 表示企业决策的任一周期,t=T表示计划销售期的开始,t=0表示销售期结束。
λ:顾客到达市场的概率。
kt:t期时企业产品库存数目。
pt:t期时企业产品的销售价格。
Qt(pt):t期时消费者购买企业产品的概率,在不影响理解的情况下简记为qt。
Vt(kt):表示从第t期开始到销售结束企业的期望收益。
Ut:消费者在第t期购买产品的效用。
U0:消费者未购买产品的效用。
η:消费者惰性强度。
γ:消费者惰性广度,即惰性消费者在全体消费者中所占的比重。
at:第t期产品质量水平,假设整个销售期产品质量水平一样,由a表示。
b:消费者对产品价格感知系数,即消费者个人的价格弹性系数。
为了更好地对应背景建立相应的模型,本文做出以下假设。
假设1:为便于分析,采用离散时间模型,这是收益管理动态定价研究中的一个基本假设。假设将时间区间[T,0]划分为长度为1的小周期,以至于每周期内最多只到达一个潜在的消费者。
假设2:由于λ的值是未知的,因此企业在每个销售期初对λ进行估计,以辅助定价决策,并且随着销售期的进行,根据市场销售信息的积累不断调整λ的值。
假设3:除了消费者到达率外,企业具有完全的市场信息。
综上,本文研究的问题可概述为:在垄断环境下,第t期企业库存为kt时,考虑到市场中同时存在惰性消费者与理性消费者,企业如何根据需求信息λ和库存信息kt确定价格pt,以使期望收益最大化。
(二)效用函数与需求函数
考虑一个消费者面临是否购买产品的情形,设其购买效用为Ut,不购买效用为U0。若消费者为理性决策者,只要U≥U0要,便会选择购买。然而,对于惰性消费者而言,如果U≥U0+η,将会选择购买。
本文使用MNL模型刻画消费者的选择过程。在每一期t,定义消费者购买产品的效用为Ut=at+bptη+ξ,不购买效用为 U0。
ξ是一个服从均值为0、规模参数为1的Gumbel分布的随机变量。不失一般性,本文假设不购买效用U0被归一化为零。
为刻画消费者特性,本文对多个消费者部分需求采用MNL模型。当第t期价格为pt时,一个消费者将会购买这件产品的概率为不购买产品的概率为qt=1-qt。因此,在t期,销售产品的概率为 λtqt,未销售产品的概率为λqt+(1-γ)。
(三)消费者到达市场概率γ的学习模型
由于γ的值不确定,企业只能根据以往的销售情况对γ估计。假设对γ的估计服从参数为α和β的Beta分布,其密度函数为:
其中,α和β表示先验信息,企业可以根据以往的销售经验确定,α和β的值越大说明以往的市场销售能提供的信息越多。Γ(·)为Gamma函数,在实数域上其函数形式为:
(四)模型构建
进一步地,本文将通过马尔科夫决策过程理论构建动态定价模型。为便于模型构建与求解,不失一般性,假设单位成本为0(单位成本扩展到其他合理数值依旧适用本文结论)。Vt(kt)表示第t期库存为kt情况下从第t期、t-1期、直到第1期的总期望利润。于是Vt(kt)的贝尔曼方程为:
三、模型求解与最优定价分析
接下来,本文将会对模型进行求解分析,刻画最优定价策略与利润函数的特性。由购买概率qt是价格pt的函数,因此有:
在公司剩余产品库存量为kt,时间为t时,由于公司可能将库存售空,因此,将企业价格策略空间定义为:
于是期望利润函数化为:
函数R(kt,qt)是qt上的凹函数,进一步地,Vt(kt)也是qt上的凹函数。于是,给定库存kt情况下,使得R(kt,qt)最大化的qt就是Vt(kt)的最优解。
定理2 第t期给定库存为kt情况下,最优策略设定的价格为:
最优收益为:
π(t,kt)是(9)式的解且唯一:
证明略(因篇幅所限,具体推导过程可向作者索取)。
定理2刻画了最优定价策略,使得卖一单位产品的边际收益应为 π(t,kt)。因此定义 π(t,kt)为单位产品即时销售的边际利润。而ΔVt-1(kt)表示的是缺乏单位产品造成的利润损失,这可以视为未来销售利润的一部分。因此,为了最大化总期望利润,企业应该设置最优价格以权衡单位产品即时利润和未来利润。
四、数值仿真
本文主要是通过数值仿真对比研究企业在有无需求学习情况下,消费者惰性对最优定价策略的影响。主要分为四个部分:(1)惰性强度随时间对最优定价的影响;(2)惰性广度随时间对最优定价的影响;(3)惰性强度随库存变化对最优定价的影响;(4)惰性广度随库存变化对最优定价的影响。每种情况又包括企业是否进行需求学习和库存是否充足。
本文解决的是有限库存下同时考虑消费者惰性与企业需求学习的多期动态定价问题(本文会仿真无需求学习情况下的动态定价问题进行对比)。不失一般性,仿真实验数值设置如下,T=15,非学习情况下 λt=λ=0.3,a=10,b=1,t=10,m=3,α=β=1。α=β=1称为Laplace先验,是一种“非确定先验信息”,主要在决策者没有销售数据或市场调研不充分时应用。
(一)库存充足时惰性强度η与惰性广度γ对最优期望利润Vt(kt)的影响
在企业有无学习情况下,分别探讨了消费者惰性强度η与惰性广度γ对期望利润的影响。在探讨η 对 Vt(kt) 的影响时,kt≥t,固定 γ=0.6,η 从{0,2,4,6}中取值。在探讨γ对Vt(kt)的影响时,kt≥t,固定 η=0.6,γ 从{0,0.25,0.5,0.75,1}中取值。通过matlab进行数值仿真结果如图1~图2(v表示期望利润),从图1可以看出,有无需求学习情况下期望利润Vt(kt)随惰性强度η的增加而下降,并逐渐趋于平稳,但企业在学习情况下期望利润更高。从图2可以看出,有无需求学习情况下期望利润Vt(kt)随惰性强度γ的增加而下降,尤其当γ接近1时期望利润下降幅度明显增加,但企业在学习情况下期望利润更高。
图1 kt≥t时,Vt(kt)随η的变化
图2 kt≥t时,Vt(kt)随γ的变化
(二)库存不足时惰性强度η随时间对最优定价pt(kt)的影响
本部分主要仿真库存不足时,企业的最优定价pt(kt)在不同的惰性强度η下随时间的变化情况。主要分为企业无需求学习和有需求学习两种情况下,惰性强度η随时间对最优定价pt(kt)的影响。本部分将数值仿真结果绘制到一幅图中进行对比分析。在数值仿真中,η与γ的取值同上,库存不充足时取值依次为1、2、3(图3~图12中nl表示企业无需求学习,l表示企业具有需求学习)。
首先,探索分析库存不足时惰性强度η对期望利润Vt(kt)的影响,结果如图3所示。从图3可以看出,同一库存前提下,Vt(kt)随η的增加而下降并逐渐趋于平稳;在任一库存水平下,进行学习时企业利润总是高于不学习时的利润,而且随着库存水平kt的增加,企业有无学习时获得利润差额随之增加。
图3 库存不足时η对期望利润Vt(kt)的影响
其次,通过数值仿真分析,探索库存不足时企业的最优定价pt(kt)在不同惰性强度η下随时间的变化情况,结果如图4~图6所示。结果表明库存不足时,(1)在消费者惰性强度η不同情况下,企业的最优定价pt(kt)随时期增加而增加,即随着销售期的结束pt(kt)不断下降;(2)随着η的增加,pt(kt)呈下降趋势,当η较大时,pt(kt)趋于不变;(3)进行需求学习时的企业初始定价一般高于无学习时的定价,然后逐步调整以最大化利润;(4)随着kt的增加,pt(kt)的变化幅度缩小。
图4 kt=1时不同η下pt(kt)随时间的变化
图5 kt=1时不同η下pt(kt)随时间的变化
图6 kt=3时不同η下pt(kt)随时间的变化
图7 kt=1时不同η下π(t,kt)随时间的变化
图8 kt=2时不同η下π(t,kt)随时间的变化
最后,通过数值分析分别探讨不同惰性强度下,销售单位产品边际利润π(t,kt)与库存能力边际成本ΔVt-1(kt)(即单位产品未来边际利润损失)随时间的变化,结果如图7~图12所示。
从图7~图9可以看出,当库存匮乏时,在不同惰性强度下,(1)单位产品边际利润随着销售期的逐渐结束而增加;(2)学习与非学习情况下 π(t,kt)随着η的增加都呈现下降趋势;(3)当kt>1时,无学习行为时企业的π(t,kt)往往高于具有学习行为时的企业。分析图10~图11可得,(1)ΔVt-1(kt)随着销售期的逐渐结束而减小;(2)学习与非学习情况下ΔVt-1(kt)随着η的增加也都呈现下降趋势;(3)当kt>1时,无需求学习时企业的ΔVt-1(kt)往往低于有需求学习时的企业。将图7~图9与图10~图12的第3条结论进行对比分析可以发现,无学习行为企业更注重短期利润,因此其单位产品边际利润往往高于具有学习行为的企业;而具有学习行为企业更注重长期利润,其会综合考虑单位产品边际利润与单位产品未来利润损失,以最大化长期利润。这恰好与图3对应,具有学习行为的企业利润往往高于无学习情况下的企业利润。
图9 kt=3时不同η下π(t,kt)随时间的变化
图10 kt=1时不同η下ΔVt-1(kt)随时间的变化
图11 kt=2时不同η下ΔVt-1(kt)随时间的变化
图12 kt=3时不同η下ΔVt-1(kt)随时间的变化
(三)库存不足时惰性广度γ随时间对最优定价pt(kt)的影响
本部分将通过数值仿真探讨库存不足时,惰性广度对期望利润Vt(kt)、最优定价pt(kt)的影响。在数值仿真中,η取固定值0.6,库存kt取值为1,惰性广度 γ 从{0,0.25,0.75,1.0}依次取值,数值分析结果如图13~图14所示。
图13 kt=1时,γ对期望利润Vt(kt)的影响
图14 kt=1时,不同γ下pt(kt)随t的变化
图13表明Vt(kt)随着γ的增加而减少,当γ接近于1时,快速减少。图14表明kt=1时,(1)有无学习两种情况下,pt(kt)随着销售期的结束逐渐减小;(2)随着γ的增加,pt(kt)不断减小,当γ<1时,pt(kt)减少幅度较小,当γ接近于1时,pt(kt)减少幅度突然增大。亦可将kt扩展到2、3…得到相似结论。为避免重复,在此省略了对kt的扩展,以及π(t,kt)和ΔVt-1(kt)随t的变化图。但是我们得到了类似四(二)的结论,概述为:(1)随着 γ 的增加,π(t,kt)和 ΔVt-1(kt)都随之减小;(2)随着销售期的结束,π(t,kt)不断增加,但随着库存的增加,π(t,kt)的变化愈加不明显;(3)随着销售期的结束,ΔVt-1(kt)不断减少,随着库存的增加其变化愈加不明显;(4)无学习时企业更注重短期利润,而有学习时正相反。
五、结论
本文在研究如何针对消费者惰性进行定价时引入了企业需求学习,运用马尔科夫决策过程理论建立了有限期随机动态定价优化模型,并通过动态优化得出了最优定价策略,然后通过数值分析得到如下结论。首先,企业是否进行需求学习对其定价和利润影响巨大,无论库存充足与否,企业进行需求学习时往往能获得较高的期望利润;当库存不足时,企业定价随销售期递减,在销售期初进行需求学习时企业定价往往高于非学习情况企业定价。其次,惰性强度η和惰性广度γ以相似的方式影响着企业期望利润和定价策略,即期望利润随着惰性强度或惰性广度的增加而下降,最优定价随着惰性强度或惰性广度的增加而下降。最后,单位产品边际利润与销售期成反比,单位产品未来边际利润损失与销售期成正比,而且无需求学习情况下单位产品边际利润往往高于有需求学习情况,无需求学习情况下单位产品未来边际利润损失往往低于有需求学习情况,这表明无需求学习企业更注重短期利润,而有需求学习企业更注重长期收益。这对企业是否利用、如何利用历史销售信息进行定价销售提供了很好的管理启示。此外,本文还可扩展到竞争环境中作进一步研究,探索进行需求学习的多个企业考虑到消费者惰性时如何进行定价博弈以最大化利润。