APP下载

基于用户画像的制造业供应链设计及仿真

2022-10-15刘亮祁思远

现代信息科技 2022年15期
关键词:基尼决策树画像

刘亮,祁思远

(天津工业大学,天津 300387)

0 引 言

为实现制造业企业的拉动式生产,制造商需要对产品的用户需求有一定的把握。传统供应链情况下,由经销商对使用定量订货法或者是定期订货法对制造商发起订单。由于需求的不确定性,制造商经常面临紧急插单等生产量激增的情况和产能过剩需要租用仓库来存储货物的情况。为了解决这一问题,使用用户画像的方法对潜在客户进行挖掘,然后用AnyLogic仿真软件对该地区的用户需求做出预测,建立面向需求的供应链模型并根据反馈情况对该模型进行调整,来拟合用户的实际需求,实现制造业企业的拉动式生产,为创造零库存、JIT的生产模式提供帮助。

影响用户的购买力及需求的因素有很多,本文为了通过引入客户画像的概念对购买行为数据进行特征构建,提取出能够描述用户购买行为的典型用户画像。

1 问题建模

1.1 问题描述

该研究是为了实现制造业企业的拉动式生产而对供应链的下游的用户使用用户画像的方法进行需求预测,从而使工厂可以按需生产来消除仓储的造成的不必要的空间浪费,同时也可以避免经销商所面临的缺货造成的时间问题。研究的需求拉动式供应链流程如图1所示。

图1 需求拉动式供应链流程图

1.2 用户标签

机器学习算法进行用户画像一般使用的算法有逻辑回归、神经网络、决策树、支持向量机。决策树作为常用的机器学习模型,主要基于树的结构进行决策。

由于Cart决策树模型具有选择更加科学且运行效率更高的优点,我们选择使用该模型进行定量分析,用以寻找有需求的潜在用户。

首先,对该地区人群的重要用户标签进行采集,该地区用户的需求与许多因素有着密切联系。主观因素有工作收入和消费观念两个方面,其中工作收入方面包括收入、存款、公司服务,消费观念包括恩格尔系数和贷款。恩格尔系数表示食物的消费所占家庭消费的比例,贫困家庭恩格尔系数达95%以上,温饱家庭50%到59%,小康家庭40%到50%,富裕家庭30%到40%,最富裕家庭低于30%。恩格尔系数的大小决定该用户的购买力的强弱。客观因素有经济条件和广告推销两个方面,经济条件指的是当地的经济条件,是否存在合理的工作时间,社会保险是否得到保障。广告推销对于消费者是否愿意购买该产品有着巨大的影响。基于以上因素绘制如图2所示的用户标签信息图。

图2 用户标签信息图

1.3 符号定义

根据上述问题描述,定义以下变量及参数,方便模型的理解。

(1)定义变量:假设给定数据集=(,),(,),…,(x,x),其中∈R为维特征向量,∈是连续型随机变量,这是一个标准的回归问题的数据集。若把每个属性视为坐标空间中的一个坐标轴,则个个属性就构成了一个维的特征空间,而每个维维特征向量就就对应了维维的特征空间中的一个数据点。

(2)定义参数:我们主要考虑到了主观因素,假设用户数据集

1.4 数学模型

该模型构建主要有两步。第一步,生成对用户标签进行分类的分类决策树,属性选择标准为基尼指数,目的是生成最大信息量的决策树;第二步,对生成的决策树进行剪枝操作,通过验证数据集中的数据从而选择出最优的子树。

CART决策树作为分类树时,特征属性可以是连续类型也可以是离散类型,但标签属性必须是离散类型。划分的目的是为了能够让数据变纯,使决策树输出的结果更接近真实值。

Step1:CART决策树使用“基尼指数”来选择划分属性,数据集的纯度可以用基尼值来度量:

直观来说,Gini()反映了从数据集中随机抽取两个样本,其类别标记不一致的概率。因此,Gini()越小,则数据的纯度越纯。

Step2:对每个属性的每个可能取值,将数据集分为=和≠两部分来计算基尼指数,即:

Step3:决策树分层主要通过基尼指数进行判断,选择基尼指数最小的属性及其对应取值作为最优划分属性和最优划分点;即:

Step4:重复以上步骤,直至满足停止条件。

Step5:对输出的决策树进行剪枝,选择交叉验证结果好的子树序列作为最优决策数。实现决策树的泛化。

Step6:输出最优决策树。

2 模型建立

2.1 基本假设

首先在模型建立之前对用户及供应链做出以下假设:

(1)通过用户画像的方法从人群中筛选潜在用户,潜在用户没有购买该产品。

(2)消费者的社交时间即非工作时间和消费者的广告观看率会影响购买欲。

(3)不考虑市场中同类型产品竞争的影响。

(4)零售商是消费者唯一购买产品的途径,零售商初始库存不为零。当零售商库存低于最小库存量时会向经销商发出订货申请。

(5)制造商每日所能生产的产品数量是固定值。

(6)制造商收到订货订单后会检查库存,当库存足够时,产品从制造商向零售商运输,该过程存在一定的延迟。

2.2 系统动力学模型

在AnyLogic仿真软件中建立基于系统动力学的产品供应链仿真模型。通过用户画像筛选出来的潜在用户会在一些客观因素的影响下转变为消费者,其中比较重要的两个因素是广告和非工作时间进行的社交活动。该产品的用户会在社交活动中影响潜在消费者,使其成为该产品的用户。同时用户在消耗完该产品后会继续购买该产品。假设该产品的潜在用户是5万人,建立系统动力学模型如图3所示。

图3 系统动力学模型

该系统动力学模型的参数设置如表1所示。

2.3 基于Agent的模型建立

在AnyLogic仿真软件中分别添加三个单个智能体分别为:零售商(Retailer)、经销商(Wholesaler)、制造商(Factory)。在该供应链仿真模型如图4所示。

由表1可知,处方3的基质种类配伍较为理想,即油相为油酸聚乙二醇甘油酯,乳化剂为聚氧乙烯氢化蓖麻油,助乳化剂为二乙二醇单乙基醚,此时所得的自微乳外观澄清、透明,滴入水相中呈现出微泛淡蓝色乳光。

首先,在零售商中设置最大最小的库存值,设置函数定期检查库存量,当库存低于最小库存值时,零售商会向上级经销商提出订单,经销商会在一定的期限内将产品送到零售商,当潜在消费者或使用者产生需求时,会从零售商处购买产品然后转为使用者。

图4 基于Agent供应链仿真模型

表1 系统动力 学模型参数设置

同理,在经销商中同样也设置了最大最小库存值,通过函数定期检查库存量,当库存低于最小库存量时,经销商会向制造商提出订单,制造商检查自己的库存后会在一定的期限内将产品送到经销商。制造商会每天定量生产产品,生产的产品会存入工厂的仓库中,当没有订单或者库存已满时会停止生产。

3 仿真结果分析

运行建立好的模型,仿真结果如图5所示。

由仿真结果分析可得:

(1)针对潜在消费者与使用者关系的分析。随着时间的变换,可以看到潜在消费者逐渐减少,使用者逐渐增加并达到一个顶峰。经过一段时间后,潜在消费者逐渐转变为用户,对该产品的需求从最初不稳定转变为了稳定的需求。表示该市场的用户需求已经饱和,没有继续增加需求的空间。

在以定量订货为订货方法的供应链中订货的时机存在一定的滞后性。该模型可以对供应链中的各级需求做出预测,尽可能地减小所需的库存量,为实现JIT生产提供帮助。

图5 仿真结果

4 结 论

本文建立Cart决策树模型对用户画像进行构建,决策树算法主要有ID3、CRT、C4.5以及C5.0。其中CRT算法是在ID3上进行优化。其优势主要在于最优属性选择更加科学且运行效率更高。然后,本文使用Python代码分别计算离散属性和连续属性的基尼指数,根据基尼指数选择最佳划分点,然后根据固定形式的字典生成决策树。使用AnyLogic仿真软件对供应链上下游进行仿真模拟,为建立面向用户需求的供应链提供参考。本文中的方法有一定的可行性,在该案例中有较好的表现。

本文目前仅考虑一种产品和用户之间的供需关系,该研究工作中还存在诸多不足之处,之后需要根据实际制造供应链系统中存在更为复杂的多对多供需关系来完善所构建的供应链优化模型。

猜你喜欢

基尼决策树画像
Wimbledon Tennis
简述一种基于C4.5的随机决策树集成分类算法设计
画像
卷入选战的布基尼
决策树学习的剪枝方法
画像
强制“脱衫”
莫尼卡的画像
画像背后藏着活人
决策树在施工项目管理中的应用