基于logistic回归的L企业交货准时性研究
2016-10-21徐瑾,徐杰
徐 瑾,徐 杰
(北京交通大学 经济管理学院,北京 100044)
基于logistic回归的L企业交货准时性研究
徐瑾,徐杰
(北京交通大学经济管理学院,北京100044)
在分析L企业延迟交货率时发现其销售订单是否能按时交货和产品组、购买频次、一次购买数量、顾客初始请求交货期之间存在某种规律性。基于以上分析建立了一个简单可靠的logistic回归模型。模型的意义在于为L企业提供了一个简单易得的量化指标,来判断订单在常规状态下多大程度上会发生延迟交货的情况。
logistic回归;库存策略;顾客预期管理;交货准时性
1 绪言
按时交货率是体现订单生产型企业服务水平的一个重要指标,按时交货率高低能直接影响客户粘性和企业效益高低。目前国内关于按时交货率的研究多体现在对交货期的研究上,主要体现在两个方面,交货期的优化和交货期的预测。沈福金(2010)分析了影响交货期的影响因素,并从提高生产稳定性、快速反映计划偏差、完善IT技术应用三个方面提出了优化交货的建议[1];吕秀芬(2011)以供应链中MTO企业生产排序和承诺交货期模型为基础,建立了单一制造商模型,在单一制造商模型的基础上建立了工序外包的集中模型、简单分散模型、有信息交互的分散模型,并辅以实例分析,探讨了工序外包的MTO企业作业排序与交货期承诺的关系[2];刘文富(2006)在掌握生产与采购信息的基础上,通过订单的统计与汇总、订单优先级算法、询单物料准备等步骤建立了交货期的预测模型[3]。林勇(2008)在由供应链下游企业掌握交货期决策权且承担缩短交货期费用的交货期决策模型的基础上,研究了供应链上游企业首先公布交货期再由下游企业决定采购数量的订购过程,建立了供应商交货期模型,该模型建立在供应链上下游企业共同承担缩短交货期费用的基础之上[4]。Sorina Dumitrescu(2015)以延迟交货率以及成本最低为目标,建立了交货期承诺模型,并通过统一单位产品交货期设定费率把该N-P难题转化为一般易求的数学模型[5]。
这些文献在交货期优化及预测方面的研究多是从生产流程着手,分析公司从接受订单到产成品出库的整个流程,进而给出优化方法或者预测模型。这些研究的缺陷之一在于前提假设太多,过于理论化,实际操作空间很小。
为此,本文寄望于找出订单延迟交货率和和产品单价、采购数量、某产品订购次数、顾客初始请求交货期之间存在的某种规律性,并以此为依据建立判断一个新订单是否会按时交货或者说在多大程度上会出现延迟交货的Logistic回归模型,为公司运营提供依据。
2 L企业交货准时性和相关指标的关系
本文共收集了该企业某月份一共1 019份电脑产品销售订单,根据销售订单信息,统计按时发货与延迟发货的订单数量、金额,并计算相应百分比,见表1。
从表1可以看出,L企业该月一共收到1 019份电脑订单,延迟交货的订单有247份,延迟交货率为24.24%;订单总额为36 354.34千元,延迟交货订单金额为10 056.51千元,占比27.66%。这些信息基本上可以说明两方面问题,一方面24.24%的延迟交货率说明L企业在交货期控制方面还有待改进的地方;另一方面延迟交货金额百分比大于延迟交货次数百分比,说明延迟交货的订单偏向金额较高的订单。
为了更深入的分析L企业的交货准时性,本文更进一步分析了订单是否按时交货和产品组、产品单价、购买数量之间的关系。
表1 按时与延迟发货订单数量、金额及相应百分比
2.1产品组
L企业电脑类产品共4个品牌,本文根据产品品牌对销售订单分组,共分为4个产品组,统计各个产品组的延迟交货率及销售额能够得出,产品组1的延迟交货率最高为65.66%,其次为产品组4为40.14%以及产品组2为15.12%,延迟交货率最低的为产品组3为7.85%;从销售金额上看,产品2和产品3的销售额明显高于产品1和产品4的销售额。从这些信息可以得出三个结论,一是各个产品组单价区间具有明显的差异;二是L企业产品的延迟交货率和产品组有很大的关系;三是L企业的销售、排产等策略可能会优先考虑总销售额高的产品。
从公司整体利益的角度考虑,当公司的总体产能不足时,决策者必然会让有限的资源优先满足总销售额高的产品。但是根据本文拿到的订单,产品1和产品4在该月份的总销售额为10 147.57千元,占全部电脑类销售额的28%。销售额占到总销售额四分之一以上的两类产品的延迟交货率都达到了40%以上,说明该公司在市场预测、库存、生产、内部信息流动等环节中的一个或者多个环节上还存在很大的缺陷。
2.2产品单价、订单金额、一次购买数量及购买频次
根据订单数据,本文进一步分析了订单的延迟交货率和产品单价、订单金额、购买数量和购买次数之间的关系,发现随着单价升高、购买数量的增大,延迟交货率呈现出增大的趋势,说明L企业应对高价值或者采购数量较大的订单的能力可能存在不足;订单的延迟交货率在订单金额上没有表现出规律性,没表现出订单金额增大订单延迟交货率降低的趋势;对于购买次数,订单的延迟交货率在图上的规律也很明显,随着购买次数的增大,对应产品的延迟交货率会降低。
3 交货准时性的logistic预判模型
3.1logistic回归介绍
Logistic回归是分类算法的一种,其计算目标和线性回归类似,即通过样本数据寻找自变量和因变量之间的关系。和线性回归不同的是,logistic回归的因变量为分类变量,其最终表达式如式(1)。
式(1)中,βi为系数(其中 β0为常数项),xi为自变量,p表示概率值。
Logistic回归模型算法是统计学上一种很成熟的算法,本文不再陈述如何根据样本数据得到上述公式中的β值,只对模型的检验和应用作简要描述,并且根据本文需要,以因变量为二分类变量为例。
在二分类的情况下,因变量为0-1变量,一般把研究所关注的分类值定位1(正例),另外一个分类值定位0(负例)(比如,本文的研究关注点为延迟交货订单,则把延迟交货的订单定义为1,把按时交货订单的值定义为0)。Logistic回归的结果会得到式(1)中的β值和一个最佳阈值a,把自变量值带到式(1)中能计算出一个p值,如果p>=a则分到值为1的那一类,否则分到值为0那一类。
任何模型都需要有评价模型好坏的评价标准,评价logistic模型好坏的主要标准为ROC曲线和AUC值。ROC曲线为定性评价指标,表现在坐标中,曲线越往左上角偏离,模型的分类效果越好;AUC值较ROC曲线又更为精准,一般认为AUC>0.7,就可以认为模型具有良好的分类效果。除此之外,模型正确判断出正例和负例的概率也可以作为评价模型好坏的标准。
3.2模型的建立
本文在进行logistic回归时以订单是否按时交货为因变量,记作y,订单按时交货取值0,订完延迟交货取值1。自变量除了上文涉及的产品组、产品单价、订单金额、单一订单订购数量之外,本文还把某产品在一个月内的订购次数及顾客请求交货期考虑在内。据此进行logistic回归,剔除回归过程中不显著的变量,得最终结果见表2。
从表2回归结果可以看出,Pr列所有值都小于0.05,所有变量都通过了显著性检验,即以这些变量构成的模型成立。为了方便写出模型,各个变量用一个数序表示,即X1,X2,...,X6(产品组1作为对照组,不在模型中显示)。根据输出结果,得最终模型见式(2)。
表2 回归输出结果
3.3模型诊断
计算模型的AUC值,绘制出该模型的ROC曲线图,并在ROC曲线上标记出最佳阈值点及对应的正确判断正例和负例概率如图1所示。从图1可以看出,ROC曲线向左上方有较大幅度的偏移,AUC=0.833,模型具有良好的判断力。
图1 logistic回归模型ROC图
Logistic回归的核心功能在于分类,上文建立的logistic模型可通过阈值来判断一张新的订单是否能按时交货。进一步分析图1,图中数据点0.254(0.798,0.753)有两层含义:一方面本文分类模型的最佳阈值为0.254,即根据各个变量的值计算公式(1)中的p值,当p>0.254时则可判定该订单为延迟交货订单,否则为按时交货订单;另一方面,模型在该阈值下正确判断出按时交货订单的概率为79.8%,正确判断出延迟交货订单的概率为75.3%。
3.4模型分析与讨论
式(2)左边表示延迟发货率的优势比,即延迟发货的概率和按时发货概率的比值,值越大表示延迟发货率越高;公式右边表示给定特定的值可计算出相应的延迟发货概率优势比。为了便于说明,对式(2)中的系数值进行指数化,得各个系数指数化后的值,见表3。
表3 回归模型指数化后的系数值
从表3可以看到和产品组对应的变量X1、X2、X3的指数化后的系数值分别为0.105、0.062、0.468,表明其它变量不变的情况下,产品组2的订单延迟交货率优势比是产品组1的0.105倍,产品组3是产品组1的0.062倍,产品组4是产品组1的0.468倍。
另外,从X4、X5、X6指数化后的系数也能够看出,这些指标和订单按时交货率之间的关系。总之,按照产品组分,订单延迟交货率从高到低排序为:产品组1、产品组4、产品组2、产品组3;从其它指标上看,购买频次和初次请求交货期的增大将降低订单的延迟交货率,购买数量的增加将增大订单的延迟交货率。
4 基于模型的顾客预期管理
顾客预期管理[6]在服务类企业应用较多,有两层含义,一方面指企业要及时分析掌握顾客的各种预期,并使之满足,另一方面指企业要对顾客的预期进行合理的控制,最终达到提高客户满意度的效果。
Logistic回归模型是进行顾客预期管理的前提,但该模型只能判断订单是否能够按时交货,而不能计算出交货期为多少。为了使顾客的预期管理更为精确,有必要掌握企业MTO模式下订单交货期整体的分布,为此绘制L企业各个产品组交货期的箱线图如图2所示。
图2 L企业各个产品组实际交货期分布
从图2能清楚的看到各个产品组以往实际交货期分布,每个产品组都有异常值,即交货期非常长的订单,但整体分布都比较集中。
顾客的预期管理是提升顾客满意度的重要方法,特别是当判断出一个订单很可能不能按时交货而公司又不能采取其它措施时,根据以往订单实际交货期分布,适当的降低顾客期望值,能有效的降低顾客最终的不满度。
5 结论
本文在分析L企业交货准时性时发现该企业不同产品组的交货准时性有很大的区别,而且延迟交货率在产品单价、购买数量、某产品购买频次等指标上都表现出了显著的规律性。这些规律是L企业订单处理策略、排产策略、库存策略等内部机制的外在表现。当企业生产处于稳定状态时,内部机制的稳定所表现出来的规律性也是稳定的。基于这样的分析,本文建立了预判订单是否能够按时交货的logistic回归模型,并验证了模型良好的判断效果。
在订单分析和模型建立过程中本文发现,L企业订单延迟交货率偏高,并且在高价值和高采购数量的订单上不能提供令顾客满意的交货率。为了降低订单的延迟交货率,并解决因订单不能按时交付带来的顾客不满,本文从顾客预期管理角度给出了解决意见。根据L企业的现状分析,这些措施和意见能很好的降低订单的延迟交货率,增加顾客满意度。
[1]沈福金.提高按时交货履约率[J].世界制造技术与装备市场,2010,(4):26-28.
[2]吕秀芬.复杂环境下MTO企业交货期优化研究[D].广州:广东工业大学,2011.
[3]刘文富,祝勇,潘晓弘.快速响应客户需求的敏捷询单模型研究[J].轻工机械,2006,(3):163-166.
[4]林勇,张彬,闫阅.基于新增费用分担的交货期决策模型[J].物流技术,2008,(10):129-132.
[5]Elkadiri R,Sultan M.A Remote Sensing-Based Approach for Debris-Flow Susceptibility Assessment Using Artificial Neural Networks and Logistic Regression Modeling[J].IEEE Journal of Selected Topics In Applied Earth Observations And Remote Sensing,2014,(7):12.
[6]杜建刚,范秀成.服务失败情境下顾客损失、情绪对补救预期和顾客抱怨倾向的影响[J].南开管理评论,2007,(6):4-10,18.
Study on Delivery Accuracy of Enterprise L Based on Logistic Regression
Xu Jin, Xu Jie
(School of Economics Management, Beijing Jiaotong University, Beijing 100044, China)
In this paper, through analyzing the delivery delay ratio of the company L, we found that there existed certain pattern betweenthe timely delivery with the product category, buying frequency, single buying volume and initially requested delivery term of the customer,then on such basis, built a simple but reliable logistic regression model to judge to what extent an order would trigger delivery delay undernormal circumstances.
logistic regression; inventory strategy; customer expectation management; delivery accuracy
F252;F224
A
1005-152X(2016)01-0156-03
10.3969/j.issn.1005-152X.2016.01.041
2015-12-13
徐瑾(1992-),女,山东淄博人,硕士研究生,研究方向:供应链库存管理。