数据驱动下收货方质量偏好与电商配送服务质量优化
2019-07-02戢守峰
孙 琦,戢守峰,董 明
(1.东北大学工商管理学院,辽宁 沈阳 110169;2.上海交通大学安泰经济与管理学院,上海 200030)
1 引言
电商平台长期累积的数据资源蕴含丰富的需求信息与商业价值亟待挖掘。Dey和Kumar[1]指出最优策略应依赖于搜集到的数据,消费者反馈的信息影响策略的选择。因此,电商如何利用大数据优化配置配送资源,通过个性化方案提升配送服务质量,已成为国内外学术领域和企业界高度关注的热点问题与前沿课题。
收货方的配送服务质量满意度是衡量企业服务质量水平的重要依据,近年来的研究主要集中在配送服务质量提升的驱动力。内部驱动力指通过企业内部结构调整提升服务质量,如Yee等[2]通过LMX理论发现,服务密集型企业充分注重员工协调,则提升服务质量并不会受到服务人员工作满意度的影响;Dong等[3]通过改进Erlang-A模型分析质量-效率驱动机制,发现当系统负荷敏感度低时,系统达到质量量-效率驱动参数,反之系统参数在质量-效率驱动范围之间波动;Baron等[4]在复杂服务网络中通过设置预留闲置服务点减少客户在服务点等待的概率,进而提升服务质量的感知;Debo和Veeraraghavan[5]发现服务等待入队概率是单调递减的,等待时间越长的队列,消费者加入越少,最终使服务质量的差距减少;Debo等[6]同时认为:如果消费者对产品质量先验概率知情度低,高服务质量的企业为降低技术成本,可能选择比低质量服务企业更慢的服务速率;Xu等[7]探讨单服务器排队系统中的静态服务差异化策略,在注重服务质量的群体中,消费者更关注服务时间,提供差异化服务可以提升服务系统性能的5%。
另一方面,对于最后一公里配送服务质量优化的研究主要集中在配给和路径优化方面。Muoz-Villamizar等[8]以配送能力约束下车辆路径局部优化为切入点求解随机需求下城市系统中最后一英里配送问题,构建配送节点相互合作与非合作的规划模型,对比发现相同的服务水平下协同运输策略可以降低运输成本,提高资源配置效率;Rancourt等[9]通过数学规划的方法解决粮食援助背景下最后一公里分销点选址问题,得到总投入成本与运输食品区和仓库配送中心之间距离关系;Fatnassi等[10]针对智慧城市的个人快速交通(PRT)和货运快速运输(FRT),提出使用高质量城市内域交通,替代空车再分配,促进城市配送可持续发展;Starr和Wassenhove[11]指出嵌入最后一公里参数的HO决策模型中,鲁棒性是必须考虑的;Ghiani和Guerriero[12]从配送中心选址的角度,采用模糊多属性群决策技术,通过二元数组混合有序加权平均排序,评估城市潜在可替代配送中心,并通过实例验证该方法可减少主观因素对城市配送中心决策的影响;Noyan等[13]构建两阶段随机规划模型,结合不同的公平分配供应策略,采用分支-切割法解决最后一公里的分销网络设计问题;曹杰和朱莉[14]针对城市资源紧缺问题构建多层超级网络,考虑决策者对多种应急方式有选择偏好时的城市群协调理论模型,指出考虑模糊需求信息对资源调配决策的影响值得进一步深入研究。
电商配送服务质量的相关研究可以看出,优化方法上逐渐从各要素驱动表现为数据驱动,而数据驱动下电商配送服务质量的研究却鲜有见到,已有的相关研究,如Levi等[15]研究报童问题输入需求数据分布形式未知的情况,采用样本平均近似方法求解这种数据驱动报童模型,并且找到了对于该方法精确求解的边界;Lee[16]指出经济学领域的有限容量的规划问题注重生产函数的特征,而运营管理领域更关注从销售和库存的损失较少的角度取得利润最大,进而通过数据包络分析约束设置一种多目标算法实现有限容量的随机优化;Soyster和Murphy[17]研究数据驱动矩阵的不确定性鲁棒线性规划问题,即通过定义矩阵的行、列、系数将有限数量的矩阵嵌入到鲁棒线性规划,实现一个嵌套矩阵组原始线性程序预见不同的优化目标的价值量。此外,陈云翔等[18]提出一种基于信息熵的群组聚类组合赋权法,通过分析阀值变化率选取最优聚类阀值,对相似程度较高的排序向量给出合理的聚类。
综上所述,迄今为止的研究表明:配送服务质量影响运作方案制定;最后一公里的配送服务质量规划的有效执行对决策目标影响也非常显著。但其研究也存在三方面不足:首先,对于配送服务质量的研究大多设定在队列或者网络结构中研究,以消费者在结构中的等待时间作为服务质量衡量标准,忽略了消费者历史评价对于配送服务质量的优化意义及数据处理中多维度挖掘算法对决策方案的优化[2-7]。其次,对于配送服务质量研究通常从高质量和低质量两种角度考虑,而现实中的质量分类是较为复杂的,存在一定的模糊区间,忽略了配送服务过程中积累的历史数据蕴含更合理的分类,造成数据资源浪费[8-11]。最后,对于最后一公里配送问题的研究意义得到各方共识,但是已有研究尚未结合收货方的历史数据和配送服务质量偏好的分析,忽略个性化规划解决方案更有利于提升收货方体验[12-18]。
针对以上三点,本文提出一种电商配送服务质量优化模型,以收货方反馈历史数据解析为出发点,从收货方对配送服务质量偏好的角度进行聚类分析和模型优化。在收货方配送服务质量偏好约束下决策者以优化质量成本为目标,对可用配送资源进行非线性混合整数规划。根据统计学“记忆性”概念将聚类分析的结果按收货方偏好归纳为“无记忆”型收货方、“记忆”型收货方、“总体”收货方以及“不确定”型收货方四种逐级放松的特征类型,得到质量偏好约束下的收货方完备性分类。这些均是已有文献未涉及到的。
2 问题描述与符号说明
2.1 问题描述
考虑一个时间长度为T的规划周期,电商在这一周期内需要解决配送服务质量的资源规划问题,即何时采用何种配送服务资源更容易满足收货方的质量需求。考虑有N种不同的配送服务资源,每种资源为一种配送方式和一种服务方式的集成。本文受马尔可夫过程和指数分布中无记忆性含义的启发,根据质量敏感收货方完备性集合研究四种类型的质量需求约束:(1)“无记忆”型收货方(2)“记忆”型收货方(3) “不确定”型收货方(4)收货方的总体 (图1)。
图1描述了本文对历史数据处理框架:收货方与电商交互过程中产生大量历史数据,如运输工具、交付方式、交付时间和满意度等。按照质量偏好的记忆性特征进行聚类分析得到四种类型的数据集合A、B、A∩B和A∪B。值得注意的是,电商企业通过人力、物力资源的协调运作形成消费者服务质量评价的客观基础,直接影响其忠诚度水平,已有研究通过假设检验证明质量感知与忠诚度之间存在密切关系[19-21],据此,本文将收货方对配送资源的质量感知度融入到电商企业物流优化建模之中。忠诚度的高低在一定程度上可预知消费者再购物的概率,直接影响电商企业的市场占有率。然而,忠诚度作为概率描述方式对应到现实空间只表现为“买”或“不买”两种结果。基于这两种结果的界限,引入描述质量最低容忍程度的变量,即超过收货方的最低容忍度,则造成电商企业的收货方消费者流失。
图1 质量偏好与配送资源规划关系图
2.2 符号表示
参数变量:
Dt: 单位阶段t内的配送订单需求;
ht(x): 电商持有成本;
决策变量:
xt:单位阶段t内电商库存数量
3 质量敏感聚类过程与数据驱动过程刻画
电商企业为优化资源配置,高效满足收货方需求,最直接的方式是以收货方的需求进行服务配置。实际上,平台硬件升级以及网络覆盖率扩大,目前的电商企业已突破技术瓶颈,后台搜集到更多关于消费者购买习惯、行为偏好、敏感特征等方面的时间序列。为充分利用数据的价值,可将更新的数据进行动态聚类,提取到收货方的质量敏感特征,再与电商企业内部服务资源数据库进行个性匹配,达到精准高效服务的目标。
3.1 质量敏感聚类过程
由于配送服务质量受到配送市场价格,配送距离,配送物品属性等多因素影响,接受同等配送服务质量的不同的收货方对配送服务质量敏感程度是不同的。通过模拟投票结果形成过程得到数据的记忆性特征,即为每一个投票者选择合适的目标簇,而投票者心中可以有若干个不同目标簇,但是这些簇在投票者心中呈现不同目标强度的概率。根据文献[22]提出投票聚类融合算法:
算法1:“确定”簇
步骤1:随机选择一个分区Ui∈U分配到U0;
步骤3:Vi=UiWi;
步骤5:得到更新的集合U0。
算法2:“不确定”簇
步骤1:降序排列Ui分配到U0;
步骤3:Vi=UiWi;
步骤5:得到更新的集合U0。
“确定”簇算法确定“无记忆”型和“记忆”型两种类型收货方集合。为求解模型,首先要证明“无记忆”型收货方的质量约束下配送服务资源规划问题能够在多项式时间内求解。考虑传统配送服务资源规划问题的时间规模O(N2T),即标准的资源规划组合算法可以解决这一问题。
3.2 数据驱动过程
掌握消费者需求的驱动力能够让企业在竞争中处于绝对优势。随着互联网时代数据量的丰富,这种优势在电商竞争中逐渐显现。电商有能力搜集到消费者的年龄、性别、职业和收入等自然属性,以及消费者习惯、行为、情感和偏好等社会属性,进而能够通过技术分析判断特定消费群体的需求和行为特征。电商的配送服务质量通过外部驱动和内部驱动共同作用,即数据驱动力,满足个性化需求,调整内部组织结构与决策方案,达到服务质量升级的效果。
如图2所示,以固定时间窗宽度内数据作为分析观测窗口,抽取时间窗内消费者配送系统数据为历史数据;最新时间窗外的后续新增消费者数据形成增量数据。数据预处理过程主要分析数据规律以及确定异常值与缺失值:首先搜索数据属性(表1)列中的空值、最大值和最小值;清理数据为空或异常数据的记录;将数据转换为适合聚类算法的属性。抽取生鲜超市便民生鲜O2O平台2014年1月31日-2016年1月31日收货方8200条历史数据,包括收货方标签、收货时间、订单级别、配送地点和配送成本等35个属性。得到图3稳定性测度(S)=观测时间窗的结束时间-初次收货时间(单位:天),邻近测度(L)=最后一次收货时间至观测时间窗末端长度(单位:天),配送里程(K)=观测时间窗内总配送公里数(单位:公里),收货次数(G)=观测时间窗内收货次数(单位:次),平均折扣系数(C)=平均折扣率。提取目标属性,进行数据标准差标准化,降低数据量纲差异化影响。
图2 数据驱动过程
表1 数据清理结果
图3 标准化属性规约数据
4 模型构建
根据用户在线行为长效记忆性[23]以及行为数据聚类分析,将收货方通过电子商务平台留下多属性多周期的足迹数据从时序特征变化角度进行完备性分类。从现实角度看,四种特征分类方式具有合理性:并不是所有消费者在购物中都注重收货质量,而是更关注商品质量,那么这类收货方的服务质量表现出“无记忆”,电商企业有机会以最低的运营成本满足收货方的质量需求;面对配送服务质量要求很高的消费者,电商企业的服务质量直接影响到这类消费者整个购物体验,则这类收货方的质量敏感属性“记忆”性较强,需要电商企业根据该类收货方已有历史数据呈现的偏好,给予相对个性化的配送方式;有些消费者的质量感知特征刻画不明显,数据属性时序规律表现出“不确定”,对配送服务质量的关注程度呈波动趋势,为满足这类收货方配送服务的需求,电商企业可从数据总体呈现的特征进行配送资源规划,虽然失去一定的灵活性,但是基于总体收货方得到的决策效果不会出现损失过大的情况。据此,根据收货方的质量感知数据聚类特征分组,将质量感知嵌入到传统模型。
4.1 传统配送服务资源规划模型
传统配送服务资源规划主要从需求和配送过程的角度进行决策:
(1)
(2)
(3)
(4)
其中,式(1)表示T周期内N种配送资源的固定投入成本、使用成本以及持有成本最小化;式(2)表示电商供货的持续性;式(3)表示如果没有选择第n种配送资源则不会提供配送服务(<),若选择则配送(=);式(4)表示决策变量的正则性约束。
4.2 收货方的配送服务质量偏好类型
构建约束集(6)、(7)、(9)和(10)组成服务质量约束下的配送资源规划模型。依据收货方的反馈数据得到配送服务质量的聚类,通过下列集合关系表示收货方完备性质量需求的感知空间。
4.2.1 “无记忆”型收货方
“无记忆”型收货方(对应集合A):对配送服务质量无需求,t阶段配送服务的质量不影响该类型收货方在t+1阶段对产品的忠诚度,配送服务质量对收货方的影响呈现周期性,表现出收货方对质量的要求无记忆性的特点。得:
(5)
即每个周期内的配送服务质量需求大于收货方对质量需求的最低容忍度。形式可写成:
(6)
4.2.2 “记忆”型收货方
“记忆”型收货方(对应集合B):对配送服务质量有需求,t阶段配送服务的质量影响该类型收货方在t+1阶段对电商的忠诚度,并且持续影响下去,配送服务的质量在该类收货方心中呈现累积的效应(可正可负)。得:
(7)
在未来周期t′,收货方对电商的配送服务质量信任度:
(8)
4.2.3 收货方总体
收货方总体(对应集合A∪B)的约束是对式(7)扩展得到整个规划周期的情况,具有松弛性。得:
(9)
4.2.4 “不确定”型收货方
“不确定”型收货方(对应集合A∩B):对配送资源的服务质量表现出随机“记忆性”,在t阶段配送资源服务质量可能影响该类型收货方在t+1阶段对电商的忠诚度。
假设仅有M个规划周期,该类收货方具有配送服务质量记忆的不确定性,与T无关。有:
(10)
其中,式(6)为式(10)中M=1的情况;式(7)为式(10)中M=t的情况;式(9)为式(10)中M=T的情况;信任度式(8)依然成立。
5 具有不同偏好收货方的特征性
5.1 “无记忆”型收货方
5.1.1 特征分析
定理1在单位周期内至少使用两种配送资源得到规划最优解,即一种服务质量有效配送资源,或者增加一种服务质量失效配送资源。
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
(19)
(20)
由定理1的性质,“无记忆”型收货方的规划问题对于配送方来说相当于周期性约束,共计N2种配送资源。
定理2对“无记忆”型收货方的配送资源种类为N2,且规划的时间规模O(N2T)。
(21)
(22)
(23)
(24)
(25)
根据定理1,以上单周期规划问题转化为最优化问题:
(26)
5.1.2 “无记忆”型收货方求解
定理3“无记忆”型收货方的质量需求约束下配送资源规划问题等价于电商的零库存策略最优解问题。
根据已有性质和定理,用动态规划方法解决“无记忆”型收货方的问题,得到关系式如下:
(3)阶段t内的成本G(t),t=1,…,T为“无记忆”型收货方质量需求约束下电商配送资源问题的一个最优解,G(t+1)=0;
(4)H(t,t')记为单位阶段t内服务Dtt′的总成本函数(固定成本和可变成本)。根据定理1,在周期t至少使用两种配送资源满足需求Dtt′。
(5)目标函数重新形式化为
C(t)=
(27)
预处理过程可通过不等式Y≤al+blQ来确定二元多项式的极值点,确定每个时期t的断点和斜率,时间复杂度O(NlogN)。因此,对于每个单位周期t,都能在时间O(N2logN)内找到所有断点及t≤t′≤T时H(t,t′)的最优值,且计算时间复杂度O(TN2logN+T2) 最后分析动态规划的时间复杂性。上述证明H(t,t′)的值可计算,C(t)的值在每个周期t内求得,即时间复杂度为O(T),故能在时间O(T2)确定C(1)的值。动态规划的总时间复杂度小于O(TN2logN+T2)。 定理4“记忆”型收货方约束的配送资源规划问题在每个周期内至少使用两种最优配送资源:一种服务质量有效配送资源,或者一种服务质量失效配送资源。 明显地,在某些情形下“记忆”型收货方模型与“无记忆”型收货方模型是非常相似的。但是,“记忆”型收货方的问题比“无记忆”型收货方的问题更难解决。与定理3对比,发现零库存目标性质并不适用于“记忆”型收货方问题。对于“记忆”型收货方问题,最优零库存策略的成本可能远高于最优策略的成本。 基于以上结论得到“记忆”型收货方的问题是NP-hard。将该问题归纳为一种特殊情形子集和问题,即额外的对所选集合大小存在势约束:有n份订单的收货方对电商提供商品的质量 “记忆”,每份订单都有一个质量比重wi,其和为w。在一个周期内,对“记忆”型收货方进行k次配送服务,对每次购物的配送服务质量存在容忍度累积,每次配送提供的质量权重使总比重达刚好到w。换言之,有一个n维整数矢量(α1…αn),∑iwiαi=w且∑iαi=k。不存在k的基数约束,则这个问题为NP-hard完全背包问题。完全背包问题中物品是无限的,其求解复杂度可以转为0-1背包问题,此时k是确定的有限值。接下来证明0-1背包问题是一个非确定多项式(NP-complete)。 引理1:完全背包问题复杂度相当于0-1背包问题,是非确定性多项式问题[24](NP-complete)。 定理5“记忆”型收货方的问题是NP-hard。 证明:设k≥2,并假定所有配送订单的质量权重W>wi。不失一般性,假定所有配送订单质量权重wi≥1。根据引理将0-1背包问题转换为“记忆”型收货方的问题: (2)有T=k+1个阶段,每个阶段都有单位需求要满足。 (3)对所有资源来说,持有成本设定为h=kW。 (4)要求一个解的权重至多为2W+1。证毕。 相反地,假定所有质量需求都能够以至多2W+1的权重得到满足。首先,在t=1时,初始阶段有必要使用资源N去满足质量需求约束。由于总权重不能超过2W+1,有效的配送策略即正好使用一次资源N。其次,令持有成本的值为ε=∑tst且1/k<1,即有效配送策略必须在每个周期进行配送以满足单位需求。因此,只有资源N是有效时,在每个阶段恰好使用一个资源。令S为从阶段2到阶段T=k+1的所配送资源的集合,可以称S为完全背包问题的一个有效解。由此可得,S正好含有k个元素,其总权重等于从阶段2到阶段T的总配送资源准备成本,得PN+hε+w(s)≤2W+1,即w(s)≤W-hε=W(1-kε)。 (28) (29) 由ε=0,有W(S)≤W(1-ε),即有效的策略会在每个周期配送一单位产品。即W(S)=W。 收货方总体质量约束下电商配送资源规划问题比“记忆”型收货方的问题约束更松弛。收货方总体有(T-1)个约束经过转移,仅(9)起作用。收货方的总体仍然是一个NP-hard问题。证明同定理5。 表2 四种聚类方法对比结果 图4 聚类过程与效果 软聚类投票法(Vote-soft)与经典K-Medoids、K-Means和Clarans聚类法的效果进行对比实验,结果表明精度和运行时间显示出较好的优越性(表2)。主要原因是Vote-soft更符合本文模型构建的逻辑结构特征。 图4(a)表示经过3次迭代训练达到中止,中止过程均方误差的最佳性能参数为0.168;图4(b)显示三次迭代中止时,随着梯度下降,学习率降低,当梯度达到2.4825×10-8时,结束训练;变量mu确定学习过程是根据牛顿法还是梯度法来完成,mu随着迭代逐渐降低说明学习过程主要根据梯度下降法,当mu下降到1×10-6时学习过程停止;错误次数稳定在0附近;图4(c)图显示随着训练错误率的降低,各门店聚类回归过程,图中R值为相关系数,横坐标为训练的目标值(target),纵坐标为输出值(output),将数据划分成三份:训练(training)、验证(validation)、测试(test),其中training数据参加训练,validation和test数据不参加训练,仅用于检验;刚开始时validation和target之间的误差也会变小,可随着训练的增加,test的误差继续变小,validation的误差反而会有所上升;训练进行时,目标(target)和训练(test)数据目标之间的误差会越来越小;当validation的误差连续上升3次时训练就停止了,防止聚集过程的拟合过度。经过训练后得到的门店(表3)聚类结果为C、D、E、F、G样本属于“无记忆”型簇,即动态规划求解; A、H、I属于“记忆”型;B、J属于“不确定”型收货方,采用文献[25]MOPSO算法近似求解,实验结果如图5所示。 表3 10家门店服务需求情况 图5 实验对比结果 由图5知,传统整数规划方法从成本角度出发尽可能选择配送成本低的配送服务资源,这虽然表面减少成本,但是忽略了收货方的服务感知会影响收货方再次购买的需求量,故在t=3以前,传统规划方法是统一配送,成本一直处于上升趋势。而非线性混合整数规划得到的平均成本在最初阶段高于传统方法,因为配送资源的准备需要一定的成本投入,但是t=3以后,非线性混合整数规划成本出现下降,优于传统整数规划;在资源利用率方面,非线性混合整数规划使得配送资源也同样在t=5以后得到充分利用,资源利用率基本稳定在0.65,而传统规划方法由于缺乏一定的灵活性,资源利用率基本稳定在0.2。通过对比可以看出,对消费者进行聚类分析后,有利于成本节约和资源利用效率的提升。 本文利用“互联网+数据资源”优化电商配送服务质量,以收货方数据为驱动源,通过对收货方数据特征进行解析,构建电商配送服务质量的非线性混合整数规划模型,对收货方历史数据进行聚类分析,挖掘不同收货方的质量需求稳定性。电商决策者提出配送方案前,先对收货方的质量敏感性进行聚类分类,根据收货方不同质量敏感性提供相对个性化服务,更高效进行配送资源规划,提升最后一公里配送服务的质量,优化电商的配送服务质量的决策。本文对收货方的服务质量偏好程度进行完整分类: “无记忆”型收货方、“记忆”型收货方、“不确定”型收货方及收货方总体,进一步地,给出四种类型求解空间的复杂度推导;设计“无记忆”型收货方服务质量约束下电商企业配送资源的动态规划算法;证明其他三种特征类型为NP问题,并给出近似求解算法。 本文得到如下管理启示:第一、数据驱动力使得电商更容易通过收货方质量偏好提供相对精准的配送服务方案,使得不确定服务需求得到有效满足,质量投入成本的利用率更高。第二、收货方数据的日益丰富虽然为电商提供了更多维度的市场数据,但是增加了挖掘方法的难度。本文详细分析四种收货方分类模型的时间复杂度及NP属性,为大数据解决方案提供合理的模型描述和实施前提。第三、在具体的解决方案中,决策者通过优化设计数据处理流程,抽取收货方历史数据的质量敏感相关属性进行聚类分析,增强数据预处理环节的优化,能够提升企业资源规划过程的精准度;第四、求解过程发现,大规模NP问题通过模型分类后能够缩减NP规模,进而增加解决方案的灵活性,提升大规模问题的求解精确度。粒子群算法作为传统启发式算法,通过优化粒子参数能够在大规模数据求解中发挥作用。 在未来的研究中,利用数据驱动力深入挖掘数据预处理的方法,如聚类算法等,使得收货方的类型更加明确,设计更加精确的算法解决“记忆”型收货方、“不确定”型收货方和收货方整体的NP-hard问题,或者对于收货方行为偏好的特征进行精细划分,使得企业可以提供精准服务,都将是非常有前景和价值的研究方向。5.2 “记忆”型收货方
5.3 “不确定”型收货方与收货方总体
6 数值与算例分析
7 结语